Clear Sky Science · ru

TRGCN: гибридная структура для обнаружения слухов в социальных сетях

2026-03-26 · Назад к списку

Почему онлайн‑слухи важны для всех

От паники вокруг вакцин до финансовых страхов — один ложный пост может распространиться по социальным сетям и повлиять на поведение миллионов людей. Люди‑фактчекеры работают изо всех сил, чтобы поспевать за событиями, но объём и скорость онлайн‑обмена делают ручную проверку всего невозможной. В этом исследовании предложен новый вычислительный подход, который автоматически выявляет подозрительные истории, анализируя не только содержание публикаций, но и то, как информация распространяется в сети пользователей.

Figure 1. Как ИИ «читает» беседы в социальных сетях, чтобы отделить слухи от проверенной информации.

Как слухи распространяются в социальных сетях

Авторы начинают с рассмотрения слухов как социального процесса. На платформах вроде Twitter один человек публикует утверждение, другие отвечают, ретвитят, поддерживают или опровергают его — и эти взаимодействия формируют ветвящуюся сеть сообщений. Некоторые пользователи действуют как узлы‑хабы, которые поддерживают слух далеко от первоначального источника. Шаблон того, кто кому отвечает и когда, содержит подсказки о том, насколько вероятно утверждение истинно, ложно, подтверждено или ещё не проверено. Традиционные компьютерные модели либо фокусировались только на тексте, либо только на форме сети, упуская полную картину взаимодействия содержания и связей.

Ограничения ранних методов обнаружения

Ранние подходы опирались на вручную создаваемые признаки, такие как число репостов, длина сообщений или простая статистика пользователей. Эти методы фиксировали простые паттерны, но испытывали трудности с комплексными, высокоразмерными сигналами, характерными для больших социальных сетей. Позже глубокие модели, такие как рекуррентные и сверточные нейронные сети, научились выявлять более богатые текстовые и краткосрочные временные закономерности, но не полностью учитывали ветвящуюся структуру распространения слухов. Подходы на основе графов улучшили ситуацию, рассматривая беседы как сети постов и пользователей, однако распространённые графовые модели испытывали трудности с отслеживанием длинных цепочек влияния через многие звенья.

Гибридная модель, учитывающая форму и содержание

Чтобы преодолеть эти пробелы, исследователи предлагают гибридную структуру под названием TRGCN. Она сочетает два мощных типа нейросетей: графовые сверточные сети (Graph Convolutional Networks), хорошо подходящие для анализа сетей, и трансформеры, которые превосходят в отслеживании дальних зависимостей в последовательностях. Сначала модель преобразует каждый пост в численное представление на основе значимости слов в общем наборе твитов. Одновременно кодируется схема ответов и репостов в виде графа. Эти два представления объединяются так, что каждая вершина в сети распространения несёт и смысл текста, и своё положение в беседе.

Figure 2. Как гибридная сетевая модель отслеживает паттерны распространения слухов и текст, чтобы отнести события к четырем уровням достоверности.

Прослеживание пути слуха шаг за шагом

Затем TRGCN обогащает эти представления узлов на нескольких уровнях. Графовый модуль рассматривает пост и его соседей, чтобы захватить локальные паттерны взаимодействия, например кластеры пользователей, которые либо повторяют, либо опровергают утверждение. Позиционная схема отмечает, насколько далеко каждый пост расположен от исходного источника, помогая модели понять глубину беседы. Данные затем проходят через модуль трансформера, механизм внимания которого сканирует всю структуру, улавливая дальние и тонкие связи, способные связать отдалённые части каскада слуха. Наконец, ещё один графовый слой уточняет эти комбинированные сигналы, а стадия классификации оценивает, является ли событие не‑слухом, подтверждённым слухом, ложным слухом или всё ещё неподтверждённым.

Насколько метод работает на практике

Авторы тестируют TRGCN на двух широко используемых наборах данных Twitter, включающих тысячи событий со слухами, помеченных экспертами‑фактчекерами. Они сравнивают свою структуру со множеством существующих методов — от классических моделей машинного обучения до современных графовых систем. На обоих наборах данных новая модель демонстрирует наибольшую точность, чаще правильно отличая правдивые, ложные и неопределённые истории от альтернатив. Дополнительные эксперименты, в которых по одному удаляли ключевые компоненты — такие как внимание, позиционная информация или остаточные связи, — показали снижение производительности в каждом случае. Это указывает на то, что сила модели заключается в тщательном сочетании структуры сети, текстового содержимого и дальнего контекста.

Что это значит для более безопасных онлайн‑бесед

Для обычных пользователей и модераторов платформ главный вывод — то, как история распространяется в сети, может быть столь же показательно, как и сами слова. Совместно обучаясь на содержимом сообщений и ветвящихся паттернах беседы вокруг них, TRGCN предлагает более точный способ помечать вводящие в заблуждение утверждения для дальнейшей проверки. Хотя эта технология не заменяет человеческую оценку, такие инструменты могут помочь фактчекерам и платформам быстрее реагировать на вредоносные слухи и поддерживать более здоровую информационную среду.

Цитирование: Yan, Y., Zhang, S., Yu, D. et al. TRGCN: a hybrid framework for social network rumor detection. Humanit Soc Sci Commun 13, 692 (2026). https://doi.org/10.1057/s41599-026-06946-1

Ключевые слова: слухи в социальных сетях, обнаружение слухов, графовые нейронные сети, модели Transformer, дезинформация