Clear Sky Science · ja

青い出発:大規模な二者関係および高次社会ネットワークデータセット

· 一覧に戻る

日常のオンライン生活にとってなぜ重要か

ソーシャルメディアは単なる個々の友人関係やフォローの寄せ集めではなく、私たちが目にするものや情報の広がり方を形成するグループや集合、群衆によっても構成されています。本論文はBlueskyプラットフォームから得られた巨大な新しいデータセットを提示し、個別の「フォロー」関係と、スターターパックと呼ばれるより豊かなグループ構造の両方を捉えています。こうした情報を公開することで、著者らは研究者に対して、オンラインコミュニティがどのように形成・成長し、競合プラットフォームの方針変更や政治的分岐点といった現実世界の出来事にどう反応するかを前例のない規模で観察する機会を提供します。

Figure 1
Figure 1.

フォローからグループへ

従来のソーシャルネットワーク研究は関係を対(ペア)として扱うことが多く、ある人が別の人をフォローする、あるアカウントが別のアカウントに返信する、といった具合です。しかし実際のオンライン体験の多くはグループを軸に組織されています—フォローする人のリスト、推奨アカウントの集合、キュレーションされたコンテンツのバンドルなどです。著者らはBlueskyの「スターターパック」に注目しました。これはユーザーが作成する、初心者がタイムラインを素早く構築するのを助けるアカウントやフィードのコレクションです。単純なフォローリンクとは異なり、各スターターパックは一度に何十、何百ものアカウントを含むことがあり、個々の友好関係だけでなくグループレベルの行動を研究する自然な手段となります。

新しいプラットフォームの地図を作る

データセットを組み上げるために、チームはBlueskyの公開された技術基盤を活用しました。すべてのアカウントには公開ディレクトリに保存された長期識別子があり、ユーザーの活動はオープンなAPIを通じて問合せ可能な個人のデータサーバー上に存在します。著者らはこの基盤を体系的に巡回しました:まず既知の識別子とその作成時刻をすべてエクスポートし、次に各個人データサーバーに対してそのサーバーがホストするアカウントの一覧を問い合わせ、最後に到達可能な各ユーザーの完全な活動記録をダウンロードしました。生ログから抽出した二つの主要要素は、誰が誰をフォローしているか、そしてどのアカウントがスターターパックに共に含まれているか、です。

構造を保ちながら利用者を保護する

本研究は何百万もの人々のソーシャル接続の形を明らかにするため、個人を特定するリスクを減らす措置が取られました。元のアカウント識別子を公開する代わりに、すべてのユーザーとスターターパックを匿名の整数コードに置き換えています。また、スターターパックの名称のような説明テキストを削除し、すべてのタイムスタンプを日単位に丸めました。こうした保護措置があっても、ネットワークの基本的な配線は保持されています:同じ匿名コードがアカウント一覧、フォローネットワーク、スターターパックデータに一貫して現れるため、研究者は誰がどの人物であるかを直接見ることなく構造とダイナミクスを調べることができます。

Figure 2
Figure 2.

データが明かすBlueskyの姿

得られたスナップショットは巨大です:およそ3970万アカウント、24億のフォロー関係、そして約36万5千のスターターパックがあり、これらには約200万のユニークなユーザーとフィードが関わっています。ほとんどのユーザーはスターターパックを作成しませんが、作成する人は通常1つだけ作り、そのサイズ分布はBlueskyの設計選択—最小・最大許容サイズや約50アカウントを自動で事前入力する機能—の周りに集まっています。著者らはほぼ全ユーザーが巨大なフォローの網でつながっている一方で、スターターパックのネットワークには多くのパックが同じアカウントを共有する重なり合う大きなコアが存在することを示しています。アカウント作成やフォロー活動の急増は、競合するX/Twitterプラットフォームの変化や主要な政治的日付などの重要な出来事と明確に一致しており、人々がニュースや政策の変化に反応して移動・接続していることを示唆しています。

グループがもたらす新たな視点

本論文の重要な発見の一つは、「最も重要な」アカウントは、フォロー数で測るかスターターパックの所属数で測るかによって異なる外観を示すという点です。多数のスターターパックに登場するアカウントが、必ずしも最も多くのフォロワーを持つアカウントとは限りませんし、その逆も同様です。統計的比較は両者のランキングが中程度の一致しか示さないことを確認しており、グループベースの視点と二者関係の視点は補完的な洞察を提供します。この二重の視点により、キュレーションされたグループが新規参加者のプラットフォームへの統合をどのように助けるか、重なり合うグループが情報の流れをどう形作るか、危機の瞬間にオンラインコミュニティがどのように再編成されるか、など従来は届かなかった問いが立てられるようになります。

今後この仕事が意味すること

専門外の読者への核心的なメッセージは、オンラインの社会生活はフォロワー数を数えるだけでは完全には理解できない、ということです。「A Blue Start」データセットは、スターターパックのようなグループ構造が新しいプラットフォームをどう結びつけるか、そして大きな外部イベントにどう反応するかを示しています。この巨大で慎重に匿名化されたBlueskyの地図を公開することで、著者らは誤情報や政治的議論、推薦アルゴリズムやデジタルな公共空間に至るまで、今後の研究の基盤を提供します。要するに、個別の結びつきとグループの両方をとらえることが、オンライン社会の健全性を理解し、最終的には導くために不可欠だという結論です。

引用: Smith, A.H., Amburg, I., Kumar, S. et al. A Blue Start: A large-scale pairwise and higher-order social network dataset. Sci Data 13, 585 (2026). https://doi.org/10.1038/s41597-026-06920-1

キーワード: Bluesky ソーシャルネットワーク, スターターパック, 高次ネットワーク, オンラインコミュニティ, ソーシャルメディアデータセット