Clear Sky Science · sv
En blå start: En storskalig dataset över parvisa och högre‑ordnings sociala nätverk
Varför detta spelar roll för vardagligt onlineliv
Sociala medier är inte bara en samling individuella vänskaper och följningar; de består också av grupper, buntar och massor som formar vad vi ser och hur idéer sprids. Denna artikel presenterar en massiv ny dataset från plattformen Bluesky som fångar både en‑till‑en‑"följ"‑band och rikare gruppstrukturer kallade starterpaket. Genom att öppna den här typen av information ger författarna forskare en enastående inblick i hur online‑gemenskaper bildas, växer och reagerar på verkliga händelser — från policyändringar på konkurrentplattformar till politiska brytpunkter.

Från följningar till grupper
Traditionella studier av sociala nätverk behandlar relationer som par: en person följer en annan, ett konto svarar ett annat. Men många av våra verkliga online‑erfarenheter är organiserade kring grupper — listor över personer att följa, samlingar av rekommenderade konton eller kuraterade buntar med innehåll. Författarna fokuserar på Blueskys "starterpaket", användarskapade samlingar av konton och flöden som hjälper nykomlingar att snabbt bygga sina tidslinjer. Till skillnad från enkla följlänkar kan varje starterpaket innehålla dussintals eller till och med hundratals konton på en gång, vilket gör dem till ett naturligt sätt att studera gruppnivåbeteenden snarare än enbart individuella vänskaper.
Att bygga en karta över en ny plattform
För att sammanställa datasettet använde teamet Blueskys öppna tekniska infrastruktur. Varje konto har en långsiktig identifierare lagrad i en offentlig katalog, och användaraktivitet finns på personliga dataservrar som kan frågas via ett öppet API. Författarna gick systematiskt igenom denna infrastruktur: först exporterade de alla kända identifierare och deras skapandetider, sedan begärde de från varje personlig dataserver listan över konton den hostar, och slutligen laddade de ner varje nåbart användarkontos fullständiga aktivitetslogg. Från dessa råloggar extraherade de två kärningredienser: vem som följer vem, och vilka konton som förekommer tillsammans i starterpaket.
Skydda användare samtidigt som strukturen bevaras
Eftersom detta arbete blottlägger formen på miljontals människors sociala kopplingar vidtog författarna åtgärder för att minska risken att identifiera individer. Istället för att publicera de ursprungliga kontoidentifierarna ersatte de varje användare och starterpaket med anonyma heltalskoder. De tog också bort beskrivande text som namn på starterpaket och avrundade alla tidsstämplar till närmaste dag. Även med dessa skyddsåtgärder bevaras nätverkets grundläggande kopplingar: samma anonyma kod förekommer konsekvent i kontoförteckningen, följnätverket och starterpaketsdatan, vilket gör det möjligt för forskare att studera struktur och dynamik utan att direkt se vem någon person är.

Vad datan avslöjar om Bluesky
Den resulterande ögonblicksbilden är enorm: ungefär 39,7 miljoner konton, 2,4 miljarder följrelationer och 365 842 starterpaket som involverar omkring 2 miljoner unika användare och flöden. De flesta användare skapar aldrig ett starterpaket, men de som gör det skapar vanligtvis bara ett, och storlekarna på dessa paket klustrar sig kring Blueskys designval — minsta och största tillåtna storlekar, plus en automatisk funktion som förfyller ett paket med ungefär femtio konton. Författarna visar att nästan alla användare är förenade i ett gigantiskt nät av följningar, medan starterpaketsnätverket har en stor överlappande kärna där många paket delar samma konton. Aktivitetsökningar i både kontoskapande och följande sammanfaller tydligt med viktiga händelser, såsom förändringar på konkurrenten X/Twitter eller stora politiska datum, vilket tyder på att människor flyttar och kopplar samman som svar på bredare nyheter och policyförändringar.
Varför grupper tillför något nytt
Ett av artikelns centrala fynd är att de "viktigaste" kontona ser olika ut beroende på om man mäter betydelse via följare eller via medlemskap i starterpaket. Ett konto som förekommer i ett stort antal starterpaket är inte alltid det som har flest följare, och vice versa. Statistiska jämförelser bekräftar endast måttlig överensstämmelse mellan de två rankningarna, vilket betyder att gruppbaserade och parvisa vyer ger kompletterande insikter. Detta dubbla perspektiv låter forskare ställa frågor som tidigare låg utom räckhåll, såsom hur kuraterade grupper hjälper nykomlingar att integreras i en plattform, hur överlappande grupper formar informationsflöden, eller hur online‑gemenskaper omorganiserar sig under krismoment.
Vad detta arbete betyder framöver
För icke‑specialister är kärnbudskapet att online‑socialt liv inte kan förstås helt genom att bara räkna följare. "A Blue Start"‑datasettet visar hur gruppstrukturer som starterpaket hjälper till att knyta ihop en ny plattform och hur de svarar på stora yttre händelser. Genom att göra denna gigantiska, noggrant anonymiserade karta av Bluesky offentligt tillgänglig ger författarna en grund för framtida forskning om allt från desinformation och politiska samtal till rekommendationsalgoritmer och digitala offentliga torg. Kort sagt: artikeln slår fast att fånga både individuella band och grupptillhörigheter är nödvändigt om vi vill förstå — och i förlängningen påverka — hälsan i våra online‑sociala världar.
Citering: Smith, A.H., Amburg, I., Kumar, S. et al. A Blue Start: A large-scale pairwise and higher-order social network dataset. Sci Data 13, 585 (2026). https://doi.org/10.1038/s41597-026-06920-1
Nyckelord: Bluesky socialt nätverk, starterpaket, högre‑ordningens nätverk, online‑gemenskaper, datasätt från sociala medier