Clear Sky Science · it

Un nuovo inizio blu: un ampio dataset sociale con legami binari e di ordine superiore

· Torna all'indice

Perché questo conta nella vita online quotidiana

I social media non sono solo un groviglio di amicizie e follow individuali; sono anche composti da gruppi, raccolte e folle che modellano ciò che vediamo e come le idee si diffondono. Questo articolo presenta un nuovo dataset massiccio dalla piattaforma Bluesky che cattura sia i legami uno‑a‑uno di «follow» sia strutture di gruppo più ricche chiamate starter pack. Rendendo accessibile questo tipo di informazione, gli autori offrono ai ricercatori uno sguardo senza precedenti su come le comunità online si formano, crescono e reagiscono a eventi del mondo reale — da cambiamenti di policy su piattaforme rivali a svolte politiche.

Figure 1
Figure 1.

Dai follow ai gruppi

Gli studi tradizionali sulle reti sociali trattano le relazioni come coppie: una persona segue un’altra, un account risponde a un altro. Ma molte delle nostre esperienze online sono organizzate attorno a gruppi — liste di persone da seguire, raccolte di account raccomandati o bundle curati di contenuti. Gli autori si concentrano sugli «starter pack» di Bluesky, collezioni create dagli utenti di account e feed che aiutano i nuovi arrivati a costruire rapidamente la loro timeline. A differenza dei semplici link di follow, ogni starter pack può includere decine o addirittura centinaia di account contemporaneamente, rendendoli un modo naturale per studiare il comportamento a livello di gruppo anziché solo le relazioni individuali.

Costruire una mappa di una nuova piattaforma

Per assemblare il dataset, il team ha sfruttato l’infrastruttura tecnica aperta di Bluesky. Ogni account ha un identificatore a lungo termine memorizzato in una directory pubblica, e l’attività degli utenti risiede su server di dati personali consultabili tramite un’API aperta. Gli autori hanno percorso sistematicamente questa infrastruttura: prima esportando tutti gli identificatori noti e i loro tempi di creazione, poi interrogando ciascun server di dati personali per la lista di account ospitati e infine scaricando il record completo di attività di ogni utente raggiungibile. Da quei log grezzi hanno estratto due ingredienti fondamentali: chi segue chi e quali account compaiono insieme negli starter pack.

Proteggere gli utenti mantenendo la struttura

Poiché questo lavoro espone la forma delle connessioni sociali di milioni di persone, gli autori hanno preso misure per ridurre il rischio di identificare individui. Invece di pubblicare gli identificatori originali degli account, hanno sostituito ogni utente e ogni starter pack con codici interi anonimi. Hanno anche rimosso testi descrittivi come i nomi degli starter pack e arrotondato tutti i timestamp al giorno più vicino. Anche con queste salvaguardie, il wiring di base della rete è preservato: lo stesso codice anonimo appare in modo coerente nella lista degli account, nella rete di follow e nei dati degli starter pack, permettendo ai ricercatori di studiare struttura e dinamiche senza vedere direttamente chi è ogni persona.

Figure 2
Figure 2.

Cosa rivelano i dati su Bluesky

Lo snapshot risultante è enorme: circa 39,7 milioni di account, 2,4 miliardi di relazioni di follow e 365.842 starter pack che coinvolgono circa 2 milioni di utenti e feed unici. La maggior parte degli utenti non crea mai uno starter pack, ma chi lo fa di solito ne crea uno solo, e le dimensioni di questi pack si raggruppano intorno alle scelte di design di Bluesky — dimensioni minime e massime consentite, oltre a una funzione automatica che precompila un pack con circa cinquanta account. Gli autori mostrano che quasi tutti gli utenti sono connessi in una gigantesca ragnatela di follow, mentre la rete degli starter pack presenta un enorme nucleo sovrapposto dove molti pack condividono gli stessi account. I picchi di attività sia nella creazione di account sia nei follow si allineano chiaramente con eventi chiave, come cambiamenti della piattaforma rivale X/Twitter o date politiche importanti, suggerendo che le persone si muovono e si riconnettono in risposta a notizie e cambiamenti di policy più ampi.

Perché i gruppi aggiungono qualcosa di nuovo

Una delle conclusioni principali dell’articolo è che gli account «più importanti» appaiono diversi a seconda che si misuri l’importanza tramite i follow o tramite l’appartenenza agli starter pack. Un account che compare in un gran numero di starter pack non è necessariamente quello con più follower, e viceversa. Confronti statistici confermano solo un accordo moderato tra le due classifiche, il che significa che le prospettive basate sui gruppi e quelle basate sulle coppie offrono intuizioni complementari. Questa doppia prospettiva permette ai ricercatori di porsi domande prima fuori portata, come in che modo i gruppi curati aiutano i nuovi utenti a integrarsi in una piattaforma, come i gruppi sovrapposti modellano i flussi informativi o come le comunità online si riorganizzano nei momenti di crisi.

Cosa significa questo lavoro per il futuro

Per i non specialisti, il messaggio centrale è che la vita sociale online non può essere compresa pienamente contando solo i follower. Il dataset «A Blue Start» mostra come strutture di gruppo come gli starter pack contribuiscano a tessere insieme una nuova piattaforma e come rispondano a grandi eventi esterni. Rendendo pubblica questa gigantesca mappa di Bluesky, attentamente anonimizzata, gli autori forniscono una base per ricerche future su tutto, dalla disinformazione e il discorso politico agli algoritmi di raccomandazione e alle piazze pubbliche digitali. In breve, la conclusione dell’articolo è che catturare sia i legami individuali sia le aggregazioni di gruppo è essenziale se vogliamo capire — e in ultima analisi orientare — la salute dei nostri mondi sociali online.

Citazione: Smith, A.H., Amburg, I., Kumar, S. et al. A Blue Start: A large-scale pairwise and higher-order social network dataset. Sci Data 13, 585 (2026). https://doi.org/10.1038/s41597-026-06920-1

Parole chiave: rete sociale Bluesky, starter pack, reti di ordine superiore, comunità online, dataset di social media