Clear Sky Science · pl

TRGCN: hybrydowe rozwiązanie do wykrywania plotek w sieciach społecznościowych

· Powrót do spisu

Dlaczego plotki w sieci dotyczą nas wszystkich

Od paniki wokół szczepionek po zawirowania finansowe — pojedynczy fałszywy wpis może rozlać się po mediach społecznościowych i wpłynąć na decyzje milionów ludzi. Ludzcy weryfikatorzy pracują ciężko, aby nadążyć, ale ogrom i tempo internetowych dyskusji uniemożliwiają ręczną weryfikację wszystkiego. W tym badaniu przedstawiono nowe podejście obliczeniowe, które automatycznie wykrywa podejrzane historie, analizując nie tylko to, co ludzie piszą, ale także jak ta informacja rozprzestrzenia się przez sieć użytkowników.

Figure 1. Jak sztuczna inteligencja czyta konwersacje w mediach społecznościowych, aby odróżnić plotki od rzetelnych informacji.
Figure 1. Jak sztuczna inteligencja czyta konwersacje w mediach społecznościowych, aby odróżnić plotki od rzetelnych informacji.

Jak plotki przepływają przez sieci społecznościowe

Autorzy zaczynają od potraktowania plotek jako procesu społecznego. Na platformach takich jak Twitter jedna osoba publikuje twierdzenie, inni odpowiadają, udostępniają, popierają lub kwestionują je, a te interakcje tworzą rozgałęzioną sieć wiadomości. Niektórzy użytkownicy pełnią rolę węzłów utrzymujących plotkę przy życiu wiele kroków od źródła. Schemat kto komu odpowiada i kiedy zawiera wskazówki, czy twierdzenie jest prawdopodobnie prawdziwe, fałszywe, potwierdzone czy nadal niezweryfikowane. Tradycyjne modele komputerowe koncentrowały się albo wyłącznie na tekście, albo tylko na kształcie sieci, tracąc pełny obraz wzajemnego oddziaływania treści i relacji.

Ograniczenia wcześniejszych metod wykrywania

Wcześniejsze podejścia opierały się na ręcznie konstruowanych cechach, takich jak liczba udostępnień posta, długość wiadomości czy podstawowe statystyki użytkowników. Choć metody te wychwytywały proste wzorce, miały trudności z wielowymiarowymi sygnałami występującymi w dużych sieciach społecznościowych. Później modele głębokiego uczenia, takie jak sieci rekurencyjne i konwolucyjne, uczyły się bogatszych wzorców tekstowych i krótkoterminowych zależności czasowych, ale nie odzwierciedlały w pełni rozgałęzionej struktury rozprzestrzeniania się plotek. Metody oparte na grafach poprawiły sytuację, traktując konwersacje jako sieci postów i użytkowników, lecz powszechne modele grafowe miały problem ze śledzeniem długich łańcuchów wpływu obejmujących wiele kroków.

Hybrydowy model uwzględniający kształt i treść

Aby przezwyciężyć te luki, badacze proponują hybrydowe ramy nazwane TRGCN. Łączy on dwa potężne typy sieci neuronowych: grafowe sieci konwolucyjne (Graph Convolutional Networks), które dobrze nadają się do analizowania sieci, oraz sieci Transformer, świetne w uchwyceniu długodystansowych zależności w sekwencjach. Najpierw model przekształca każdy post w reprezentację numeryczną opartą na znaczeniu poszczególnych słów w kontekście zbioru tweetów. Równocześnie koduje schemat odpowiedzi i udostępnień jako graf. Te dwa widoki są łączone tak, aby każdy węzeł w sieci propagacji niósł zarówno znaczenie tekstu, jak i swoją pozycję w rozmowie.

Figure 2. Jak hybrydowy model sieciowy śledzi wzorce rozprzestrzeniania się plotek i treść tekstu, aby zaklasyfikować zdarzenia do czterech poziomów wiarygodności.
Figure 2. Jak hybrydowy model sieciowy śledzi wzorce rozprzestrzeniania się plotek i treść tekstu, aby zaklasyfikować zdarzenia do czterech poziomów wiarygodności.

Śledzenie ścieżki plotki krok po kroku

TRGCN następnie wzbogaca te reprezentacje w kilku etapach. Moduł grafowy analizuje każdy post i jego sąsiadów, aby uchwycić lokalne wzorce interakcji, takie jak grupy użytkowników, które powtarzają lub obalają twierdzenie. Schemat pozycyjny oznacza, jak daleko każdy post znajduje się od źródła, co pomaga modelowi zrozumieć głębokość konwersacji. Dane trafiają następnie do modułu Transformer, którego mechanizm uwagi przeskanowuje całą strukturę, by wychwycić długodystansowe i subtelne relacje łączące odległe części kaskady plotki. Wreszcie kolejna warstwa grafowa dopracowuje te połączone sygnały, a etap klasyfikacji ocenia, czy zdarzenie jest bezplotkowe, potwierdzoną plotką, fałszywą plotką, czy nadal niezweryfikowane.

Jak metoda sprawdza się w praktyce

Autorzy testują TRGCN na dwóch powszechnie używanych zbiorach danych z Twittera, które zawierają tysiące zdarzeń plotkowych oznaczonych przez ekspertów-weryfikatorów. Porównują swoje ramy z szerokim zestawem istniejących metod, od klasycznych modeli uczenia maszynowego po zaawansowane systemy oparte na grafach. W obu zbiorach danych nowy model osiąga najwyższą dokładność, częściej poprawnie rozróżniając historie prawdziwe, fałszywe i niepewne niż alternatywy. Dodatkowe eksperymenty usuwające kluczowe komponenty, takie jak mechanizm uwagi, informacje pozycyjne czy łącza resztkowe, wykazują spadek wydajności w każdym z przypadków. Sugeruje to, że siła modelu wynika z przemyślanego połączenia struktury sieci, treści tekstu i kontekstu długodystansowego.

Co to oznacza dla bezpieczniejszych rozmów online

Dla zwykłych użytkowników i moderatorów platform kluczowa myśl jest taka, że sposób, w jaki historia podróżuje w sieci, może być równie ujmujący jak słowa, które zawiera. Poprzez jednoczesne uczenie się na podstawie treści wiadomości i rozgałęzionych wzorców konwersacji TRGCN oferuje precyzyjniejszy sposób oznaczania wprowadzających w błąd twierdzeń do dokładniejszej weryfikacji. Choć nie zastępuje ludzkiego osądu, takie narzędzia mogą pomóc weryfikatorom i platformom szybciej reagować na szkodliwe plotki i wspierać zdrowsze środowisko informacyjne.

Cytowanie: Yan, Y., Zhang, S., Yu, D. et al. TRGCN: a hybrid framework for social network rumor detection. Humanit Soc Sci Commun 13, 692 (2026). https://doi.org/10.1057/s41599-026-06946-1

Słowa kluczowe: plotki w mediach społecznościowych, wykrywanie plotek, grafowe sieci neuronowe, modele Transformer, dezinformacja