Clear Sky Science · es

Un comienzo azul: un conjunto de datos a gran escala de redes sociales por pares y de orden superior

· Volver al índice

Por qué importa para la vida en línea cotidiana

Las redes sociales no son solo un amasijo de amistades y seguimientos individuales; también están formadas por grupos, paquetes y multitudes que moldean lo que vemos y cómo se difunden las ideas. Este artículo presenta un conjunto de datos masivo procedente de la plataforma Bluesky que captura tanto los vínculos «seguir» uno a uno como estructuras de grupo más ricas llamadas paquetes de inicio. Al publicar este tipo de información, los autores ofrecen a los investigadores una visión sin precedentes de cómo se forman, crecen y reaccionan las comunidades en línea ante eventos del mundo real —desde cambios de política en plataformas rivales hasta puntos de inflexión políticos—.

Figure 1
Figure 1.

De los seguimientos a los grupos

Los estudios tradicionales de redes sociales tratan las relaciones como pares: una persona sigue a otra, una cuenta responde a otra. Pero muchas de nuestras experiencias en línea están organizadas en torno a grupos: listas de personas a seguir, colecciones de cuentas recomendadas o paquetes curados de contenido. Los autores se centran en los «paquetes de inicio» de Bluesky, colecciones creadas por usuarios de cuentas y fuentes que ayudan a los recién llegados a construir su cronología rápidamente. A diferencia de los simples enlaces de seguimiento, cada paquete de inicio puede incluir docenas o incluso cientos de cuentas a la vez, lo que los convierte en una vía natural para estudiar el comportamiento a nivel de grupo en lugar de limitarse a las amistades individuales.

Construir un mapa de una plataforma nueva

Para ensamblar el conjunto de datos, el equipo aprovechó la infraestructura técnica abierta de Bluesky. Cada cuenta tiene un identificador a largo plazo almacenado en un directorio público, y la actividad de los usuarios reside en servidores de datos personales que pueden consultarse mediante una API abierta. Los autores recorrieron sistemáticamente esta infraestructura: primero exportaron todos los identificadores conocidos y sus tiempos de creación, luego solicitaron a cada servidor de datos personales la lista de cuentas que aloja y, finalmente, descargaron el historial completo de actividad de cada usuario accesible. A partir de esos registros brutos extrajeron dos ingredientes centrales: quién sigue a quién y qué cuentas aparecen juntas en los paquetes de inicio.

Proteger a los usuarios sin perder la estructura

Dado que este trabajo expone la estructura de las conexiones sociales de millones de personas, los autores tomaron medidas para reducir el riesgo de identificación individual. En lugar de publicar los identificadores originales de las cuentas, reemplazaron cada usuario y cada paquete de inicio por códigos enteros anónimos. También eliminaron textos descriptivos como los nombres de los paquetes de inicio y redondearon todas las marcas temporales al día más cercano. Incluso con estas salvaguardas, la topología básica de la red se conserva: el mismo código anónimo aparece de forma consistente en la lista de cuentas, la red de seguimientos y los datos de paquetes de inicio, lo que permite a los investigadores estudiar la estructura y la dinámica sin ver directamente la identidad de ninguna persona.

Figure 2
Figure 2.

Qué revelan los datos sobre Bluesky

La instantánea resultante es enorme: aproximadamente 39,7 millones de cuentas, 2,4 mil millones de relaciones de seguimiento y 365.842 paquetes de inicio que involucran a alrededor de 2 millones de usuarios y fuentes únicas. La mayoría de los usuarios nunca crea un paquete de inicio, pero quienes lo hacen suelen crear solo uno, y los tamaños de estos paquetes se concentran alrededor de las decisiones de diseño de Bluesky: tamaños mínimos y máximos permitidos, además de una función automática que precompleta un paquete con unas cincuenta cuentas. Los autores muestran que casi todos los usuarios están conectados en una gigantesca telaraña de seguimientos, mientras que la red de paquetes de inicio tiene un enorme núcleo superpuesto donde muchos paquetes comparten las mismas cuentas. Los picos de actividad en la creación de cuentas y en los seguimientos se alinean claramente con eventos clave, como cambios en la plataforma rival X/Twitter o fechas políticas importantes, lo que sugiere que las personas se mueven y se conectan en respuesta a noticias y cambios de política más amplios.

Por qué los grupos aportan algo nuevo

Uno de los hallazgos clave del artículo es que las cuentas «más importantes» se perciben de forma distinta según se mida la importancia por seguimientos o por pertenencia a paquetes de inicio. Una cuenta que aparece en un gran número de paquetes de inicio no siempre es la que tiene más seguidores, y viceversa. Comparaciones estadísticas confirman solo un acuerdo moderado entre ambos rankings, lo que significa que las perspectivas basadas en grupos y las basadas en pares ofrecen visiones complementarias. Esta doble perspectiva permite a los investigadores formular preguntas antes inalcanzables, como cómo los grupos curados ayudan a los recién llegados a integrarse en una plataforma, cómo los grupos superpuestos modelan los flujos de información o cómo las comunidades en línea se reorganizan en momentos de crisis.

Qué implica este trabajo de cara al futuro

Para quienes no son especialistas, el mensaje principal es que la vida social en línea no puede entenderse completamente contando solo seguidores. El conjunto de datos «Un comienzo azul» muestra cómo las estructuras de grupo como los paquetes de inicio ayudan a cohesionar una plataforma nueva y cómo responden a grandes eventos externos. Al hacer público este mapa gigante y cuidadosamente anoniminizado de Bluesky, los autores proporcionan una base para investigaciones futuras sobre todo, desde la desinformación y el discurso político hasta los algoritmos de recomendación y las plazas públicas digitales. En resumen, la conclusión del artículo es que capturar tanto los vínculos individuales como las agrupaciones es esencial si queremos entender —y, en última instancia, orientar— la salud de nuestros mundos sociales en línea.

Cita: Smith, A.H., Amburg, I., Kumar, S. et al. A Blue Start: A large-scale pairwise and higher-order social network dataset. Sci Data 13, 585 (2026). https://doi.org/10.1038/s41597-026-06920-1

Palabras clave: red social Bluesky, paquetes de inicio, redes de orden superior, comunidades en línea, conjuntos de datos de redes sociales