Clear Sky Science · pt

Um Começo Azul: um conjunto de dados em grande escala de redes sociais pareadas e de ordem superior

· Voltar ao índice

Por que isso importa para a vida online cotidiana

As mídias sociais não são apenas um amontoado de amizades e follows individuais; elas também são feitas de grupos, pacotes e multidões que moldam o que vemos e como as ideias se espalham. Este artigo apresenta um novo e enorme conjunto de dados da plataforma Bluesky que captura tanto os vínculos “seguir” um‑a‑um quanto estruturas de grupo mais ricas chamadas starter packs. Ao tornar esse tipo de informação disponível, os autores oferecem aos pesquisadores uma visão sem precedentes de como comunidades online se formam, crescem e reagem a eventos do mundo real — desde mudanças de política em plataformas concorrentes até marcos políticos.

Figure 1
Figure 1.

De follows a grupos

Estudos tradicionais de redes sociais tratam relacionamentos como pares: uma pessoa segue outra, uma conta responde a outra. Mas muitas de nossas experiências online reais são organizadas em torno de grupos — listas de pessoas para seguir, coleções de contas recomendadas ou pacotes curados de conteúdo. Os autores concentram‑se nos “starter packs” do Bluesky, coleções criadas por usuários de contas e feeds que ajudam novatos a montar rapidamente suas timelines. Diferentemente de simples links de follow, cada starter pack pode incluir dezenas ou até centenas de contas de uma vez, tornando‑os uma forma natural de estudar o comportamento em nível de grupo, em vez de apenas amizades individuais.

Construindo um mapa de uma nova plataforma

Para montar o conjunto de dados, a equipe aproveitou a infraestrutura técnica aberta do Bluesky. Cada conta tem um identificador de longo prazo armazenado em um diretório público, e a atividade dos usuários vive em servidores de dados pessoais que podem ser consultados por meio de uma API aberta. Os autores percorreram sistematicamente essa infraestrutura: primeiro exportando todos os identificadores conhecidos e seus tempos de criação, depois solicitando a cada servidor de dados pessoais a lista de contas que ele hospeda e, por fim, baixando o registro completo de atividade de cada usuário alcançável. A partir desses logs brutos, eles extraíram dois ingredientes centrais: quem segue quem e quais contas aparecem juntas em starter packs.

Protegendo usuários sem perder a estrutura

Como este trabalho expõe a configuração de conexões sociais de milhões de pessoas, os autores tomaram medidas para reduzir o risco de identificação de indivíduos. Em vez de publicar os identificadores originais das contas, eles substituíram cada usuário e cada starter pack por códigos inteiros anônimos. Também removeram textos descritivos, como nomes de starter packs, e arredondaram todos os carimbos de data/hora para o dia mais próximo. Mesmo com essas salvaguardas, a fiação básica da rede é preservada: o mesmo código anônimo aparece de forma consistente na lista de contas, na rede de follows e nos dados de starter packs, permitindo que pesquisadores estudem estrutura e dinâmica sem ver diretamente quem é cada pessoa.

Figure 2
Figure 2.

O que os dados revelam sobre o Bluesky

O instantâneo resultante é enorme: aproximadamente 39,7 milhões de contas, 2,4 bilhões de relacionamentos de follow e 365.842 starter packs envolvendo cerca de 2 milhões de usuários e feeds únicos. A maioria dos usuários nunca cria um starter pack, mas aqueles que criam tipicamente fazem apenas um, e os tamanhos desses pacotes se agrupam em torno das escolhas de design do Bluesky — tamanhos mínimos e máximos permitidos, além de um recurso automático que pré‑preenche um pacote com cerca de cinquenta contas. Os autores mostram que quase todos os usuários estão ligados entre si em uma gigantesca teia de follows, enquanto a rede de starter packs tem um grande núcleo sobreposto onde muitos pacotes compartilham as mesmas contas. Picos de atividade na criação de contas e em follows alinham‑se claramente com eventos-chave, como mudanças na plataforma concorrente X/Twitter ou datas políticas importantes, sugerindo que as pessoas se movem e se conectam em resposta a notícias e mudanças de política mais amplas.

Por que os grupos acrescentam algo novo

Uma das descobertas centrais do artigo é que as contas “mais importantes” parecem diferentes dependendo se você mede importância por follows ou por participação em starter packs. Uma conta que aparece em um grande número de starter packs nem sempre é a que tem mais seguidores, e vice‑versa. Comparações estatísticas confirmam apenas um acordo moderado entre os dois rankings, o que significa que visões baseadas em grupos e em pares oferecem percepções complementares. Essa perspectiva dupla permite que pesquisadores façam perguntas antes inalcançáveis, como como grupos curados ajudam novatos a se integrar a uma plataforma, como grupos sobrepostos moldam fluxos de informação ou como comunidades online se reorganizam em momentos de crise.

O que este trabalho significa para o futuro

Para não‑especialistas, a mensagem central é que a vida social online não pode ser totalmente compreendida apenas contando seguidores. O conjunto de dados “Um Começo Azul” mostra como estruturas de grupo como starter packs ajudam a unir uma nova plataforma e como elas respondem a grandes eventos externos. Ao tornar este mapa gigante e cuidadosamente anonimizado do Bluesky publicamente disponível, os autores fornecem uma base para pesquisas futuras sobre tudo, desde desinformação e discurso político até algoritmos de recomendação e praças públicas digitais. Em resumo, a conclusão do artigo é que capturar tanto vínculos individuais quanto agrupamentos é essencial se quisermos entender — e, em última instância, orientar — a saúde dos nossos mundos sociais online.

Citação: Smith, A.H., Amburg, I., Kumar, S. et al. A Blue Start: A large-scale pairwise and higher-order social network dataset. Sci Data 13, 585 (2026). https://doi.org/10.1038/s41597-026-06920-1

Palavras-chave: rede social Bluesky, starter packs, redes de ordem superior, comunidades online, conjuntos de dados de mídias sociais