Clear Sky Science · es

Combinar graphlets y random walks para capturar la topología compleja de redes

2026-03-25 · Volver al índice

Por qué importa la forma de las conexiones

Desde amistades en redes sociales hasta rutas aéreas e interacciones proteicas en nuestras células, muchos sistemas pueden describirse como redes de nodos unidos por conexiones. Una forma popular de estudiar estas tramas es enviar "caminantes aleatorios" que saltan de nodo en nodo y ver qué nodos visitan conjuntamente. Este enfoque impulsa herramientas desde la búsqueda web hasta los sistemas de recomendación. Pero en muchas situaciones reales, el rol de un nodo depende no solo de con quién está conectado, sino también de los pequeños patrones formados por grupos de vecinos. Este estudio plantea una pregunta simple con grandes consecuencias: ¿los métodos de random walk actuales realmente captan el panorama completo de estos patrones, o solo una versión borrosa?

Figure 1. Comparar random walks y patrones locales para entender los roles de los nodos en redes complejas.

Dos lentes para mirar una red

Los autores comparan dos maneras de describir cómo se sitúan los nodos dentro de una red. La primera, la visión habitual, utiliza random walks. Imagínese dejar una ficha en un nodo y elegir repetidamente al azar un nodo vecino; contando con qué frecuencia aparecen pares de nodos a lo largo de estos paseos, se puede mapear qué nodos están cercanos en la red. La segunda, más reciente, se centra en cambio en pequeños bloques constructores de la red, llamados graphlets. Son minirredes de tres o cuatro nodos que pueden formar formas como cadenas, triángulos o cuadrados. Al anotar con qué frecuencia dos nodos comparten posiciones específicas en estas formas, los autores capturan no solo que los nodos están conectados, sino cómo participan conjuntamente en patrones locales.

Un mapa más fino de quién hace qué

Para convertir esta idea de graphlets en una herramienta práctica, el estudio introduce la "adyacencia de órbitas". En lugar de limitarse a contar si dos nodos aparecen juntos en un pequeño patrón, la adyacencia de órbitas registra los roles exactos que desempeñan en ese patrón: por ejemplo, si un nodo está en el centro de un triángulo mientras el otro ocupa una esquina de una cadena. El equipo también desarrolla un algoritmo rápido, GRADCO, que puede calcular todos estos recuentos en minutos incluso para redes con decenas de miles de nodos. Esto hace posible introducir la información de adyacencia de órbitas en métodos modernos de aprendizaje automático, tratando cada nodo como un punto en un espacio de baja dimensión que refleja su rol estructural en la red.

Lo que los random walks no ven

Con esta descripción más fina, los autores realizan una autopsia teórica sobre los random walks. Muestran que para paseos de una longitud dada, como dos o tres pasos, solo ciertos pequeños patrones de conexión influyen alguna vez en la frecuencia de coocurrencia de pares de nodos. Muchos otros patrones de graphlets simplemente nunca aparecen en las estadísticas de random walk. Incluso entre los patrones que sí emergen, los random walks siempre mezclan varios de ellos en una única señal combinada, con ponderaciones fijas establecidas por la longitud del paseo en lugar de por las necesidades de una tarea concreta. Esto significa que pistas estructurales potencialmente útiles pueden quedar ahogadas o mezcladas con otras menos relevantes, limitando la capacidad de los métodos basados en random walk para distinguir distintos roles de nodos.

Figure 2. Cómo los patrones detallados de conexiones a pequeña escala entre pares de nodos mejoran la comprensión de sus funciones en una red.

Pruebas en redes del mundo real

Los autores ponen entonces ambas aproximaciones a prueba en 40 redes procedentes de dominios sociales, tecnológicos y biológicos. En cada red, los nodos llevan etiquetas como intereses de usuarios, tipos de actividad aeroportuaria, campos científicos o funciones biológicas. El objetivo es predecir estas etiquetas solo a partir de la red. En la mayoría de los conjuntos de datos, las representaciones construidas a partir de la adyacencia de órbitas igualan o superan a las basadas en random walks, incluidos métodos populares como LINE y DeepWalk. Cabe destacar que la adyacencia de órbitas obtiene buenos resultados incluso cuando solo considera patrones muy pequeños de hasta cuatro nodos, mientras que los random walks pueden deambular mucho más por la red. Esto sugiere que capturar y separar cuidadosamente los patrones locales de conexión suele ser más valioso que limitarse a mirar más lejos.

Qué significa esto para las herramientas futuras de redes

En términos cotidianos, este trabajo muestra que las herramientas de random walk actuales ven las redes a grandes rasgos: saben qué nodos tienden a estar próximos, pero no exactamente cómo comparten estructuras locales. La adyacencia de órbitas actúa como una lente de mayor resolución, revelando qué pares de nodos ocupan roles similares dentro de triángulos, cadenas y otras formas básicas. Dado que muchos sistemas reales vinculan estructura y función, esta visión estructural más nítida conduce a mejores predicciones sobre qué hacen los nodos en la red. El estudio sostiene, por tanto, que los analistas deberían ir más allá de los random walks cuando les importe el cableado detallado de redes complejas, y que las descripciones basadas en órbitas ofrecen una forma potente e interpretable de hacerlo.

Cita: Windels, S.F.L., Malod-Dognin, N. & Pržulj, N. Combining graphlets and random walks for capturing complex network topology. Sci Rep 16, 14902 (2026). https://doi.org/10.1038/s41598-026-44410-x

Palabras clave: topología de redes, random walks, graphlets, embedding de redes, clasificación de nodos