Clear Sky Science · ru

Использование сетей производителей контента и восприятия пользователей для обнаружения онлайн-дискурсивных сообществ

· Назад к списку

Почему онлайн‑разговоры раскалываются на лагеря

Каждый, кто прокручивал ленту в соцсетях во время выборов, чувствовал, как быстро обсуждения разбиваются на противоборствующие лагеря. Однако лишь крошечная доля аккаунтов действительно инициирует эти разговоры; большинство из нас в основном ставит лайки, делится или ретвитит. В этой статье исследуется, как те немногие заметные голоса формируют общий дискурс, и показан способ картирования политических «эхо‑камер», который сначала смотрит на лидеров, а уже затем — на их аудиторию.

Figure 1
Figure 1.

Мало говорящих, много слушающих

На платформах вроде Twitter/X участие распределено крайне неравномерно. Относительно небольшая группа пользователей — политики, партии, медиабренды и другие публичные фигуры — генерирует большую часть постов, стимулирующих политические обсуждения. Большинство аккаунтов в основном потребляют и перераспределяют этот контент, например через ретвиты. Авторы утверждают, что эти лидеры, поскольку они часто выступают и несут за собой общественную репутацию, обычно занимают более ясные и стабильные позиции, чем обычные пользователи. Если надежно сгруппировать лидеров, то по тому, кого их аудитория усиливает, можно вывести позицию более широкой массы.

Два способа увидеть, кто стоит вместе

В исследовании предлагается рамочная модель, разделяющая всех пользователей на два множества: производители контента (лидеры) и все остальные (аудитория). Затем строится сеть связей между лидерами, и к этой более маленькой, чище представленной сети применяются стандартные алгоритмы поиска сообществ. Ключевой выбор — как определять связи между лидерами. В одной версии, называемой MonoDC, лидеры связаны, когда они часто ретвитят друг друга, что фиксирует прямую поддержку и сигналы внутри политических кругов. В другой версии, BiDC, лидеры объединяются, если их ретвитит схожая аудитория, так что два политика с пересекающейся аудиторией оказываются в одном лагере, даже если они никогда не взаимодействовали напрямую.

Figure 2
Figure 2.

Отфильтровывая шум в социальных данных

Сырые данные социальных сетей чрезвычайно шумны: некоторые люди твитят постоянно, другие — редко; некоторые посты становятся вирусными случайно. Чтобы не принять случайную активность за реальную структуру, авторы используют инструменты из теории информации для фильтрации своих сетей. Они сравнивают наблюдаемые взаимодействия с тем, что ожидалось бы в рандомизированном мире, где каждый пользователь сохраняет тот же общий уровень активности, но связи перемешаны. Сохраняются лишь те связи, которые значительно сильнее предсказанных этим «рандомным миром». Такая фильтрация легка для версии с прямыми ретвитами (MonoDC), но критически важна для версии с общей аудиторией (BiDC), где простая популярность в противном случае могла бы создать вводящие в заблуждение сходства.

Публичные фигуры как анкеры онлайн‑лагерей

Исследователи тестируют свой подход на трёх крупных итальянских политических дебатах в Twitter/X в 2022 году: президентских выборах, правительственном кризисе и парламентских выборах. Важно, что все данные получены до введения платной верификации на платформе, когда синий значок в основном означал публичное признание, а не подписку. Авторы рассматривают верифицированные аккаунты как лидеров и вручную классифицируют несколько сотен из них по партиям и электоральным коалициям. Они обнаруживают, что даже до какой‑либо фильтрации ретвит‑связи между этими верифицированными политиками уже распадаются на отдельные политические блоки. Применение их методов на основе лидеров с статистической фильтрацией даёт гораздо лучшее соответствие реальным партиям и коалициям, чем стандартные алгоритмы, запущенные на полной, нефильтрованной ретвит‑сети.

Что работает — и что работает хуже

MonoDC, опирающийся на прямые ретвиты между лидерами, особенно хорошо выявляет отдельные партии: политики в основном продвигают свою сторону. BiDC, который группирует лидеров по общей аудитории, лучше отражает более широкие электоральные коалиции, объединяющие несколько партий под одним зонтиком. Авторы также пробуют альтернативные способы выбора лидеров, например аккаунты с большим числом подписчиков или высокий «ретвит‑индекс». Эти варианты на основе активности показывают худшие результаты. Они, как правило, включают журналистов и комментаторов с аудиторией, перекрывающей идеологические линии, что размывает границы между лагерями. Напротив, политические фигуры, верифицированные до 2022 года и чьи офлайн‑роли связывают их с конкретными партиями, дают более стабильную основу для картирования онлайн‑дискурса.

Почему это важно для понимания цифрового дебата

Для непрофессионального читателя главный вывод в том, что политический разговор в сети — это не плоский рынок идей. Он структурирован вокруг относительно небольшой группы узнаваемых акторов, а остальные из нас проявляют свои симпатии по тому, чьи сообщения мы решаем распространять. Сначала определив этих лидеров, аккуратно отфильтровав их связи и только затем отнесши обычных пользователей к сообществам, авторы могут восстановить большую часть скрытой политической карты по ограниченным данным. Их подход, хотя и разработан на итальянском Twitter/X, в принципе применим к многим платформам, где несколько заметных аккаунтов формируют то, что видят многие, предлагая практический способ изучения эхо‑камер даже при ограничении доступа к данным или изменении правил верификации.

Цитирование: Guarino, S., Mounim, A., Caldarelli, G. et al. Leveraging content producer networks and user perception to detect online discursive communities. Sci Rep 16, 11911 (2026). https://doi.org/10.1038/s41598-026-39477-5

Ключевые слова: поляризация в социальных сетях, политические сообщества, дискурс в Twitter, сетевой анализ, онлайн-эхо-камеры