Clear Sky Science · pt
Aproveitando redes de produtores de conteúdo e percepção do usuário para detectar comunidades discursivas online
Por que as conversas online se dividem em campos
Quem já rolou o feed nas redes sociais durante uma eleição percebeu o quão rápido as conversas se partem em campos opostos. Ainda assim, apenas uma parcela pequena de contas inicia essas discussões; a maioria de nós tende a curtir, compartilhar ou retuitar. Este artigo pergunta como essas poucas vozes visíveis moldam o debate geral e mostra uma forma de mapear "câmaras de eco" políticas olhando primeiro para os líderes e só depois para suas audiências.

Poucos falam, muitos escutam
Em plataformas como Twitter/X, a participação é altamente desigual. Um grupo relativamente pequeno de usuários — políticos, partidos, marcas de mídia e outras figuras públicas — produz a maior parte das postagens que impulsionam a conversa política. A maioria das contas principalmente consome e redistribui esse conteúdo, por exemplo via retweet. Os autores argumentam que esses líderes, por falarem com frequência e levarem suas reputações públicas consigo, costumam adotar posições mais claras e estáveis do que usuários comuns. Se for possível agrupar os líderes de forma confiável, pode-se então inferir onde a multidão mais ampla se posiciona observando quem eles amplificam.
Duas maneiras de ver quem está junto
O estudo apresenta um quadro que divide todos os usuários em dois conjuntos: produtores de conteúdo (líderes) e todos os demais (a audiência). Em seguida, constrói uma rede de relações entre os líderes e aplica algoritmos padrão de detecção de comunidades nessa rede menor e mais limpa. A escolha chave é como definir os vínculos entre líderes. Numa versão, chamada MonoDC, líderes estão conectados quando se retuitam mutuamente com frequência, captando endosso direto e sinalização dentro de círculos políticos. Na outra versão, chamada BiDC, líderes são ligados quando são retuitados por audiências semelhantes, de modo que dois políticos com seguidores sobrepostos acabam no mesmo campo mesmo que nunca interajam diretamente.

Filtrando o ruído dos dados sociais
Dados brutos de redes sociais são extremamente ruidosos: algumas pessoas tuitam constantemente, outras raramente; algumas postagens viralizam por acaso. Para evitar confundir atividade aleatória com estrutura real, os autores usam ferramentas da teoria da informação para filtrar suas redes. Eles comparam as interações observadas com o que seria esperado em um mundo randomizado onde cada usuário mantinha o mesmo nível geral de atividade, mas as conexões eram embaralhadas. Apenas laços muito mais fortes do que os previstos por esse "mundo aleatório" são mantidos. Esse filtro é leve para a versão de retuit direto (MonoDC), mas crucial para a versão de audiência compartilhada (BiDC), onde a simples popularidade poderia criar similaridades enganosas.
Figuras públicas como âncoras dos campos online
Os pesquisadores testam sua abordagem em três grandes debates políticos italianos no Twitter/X em 2022: a eleição presidencial, uma crise de governo e as eleições gerais. Importante: todos os dados vêm de antes de a plataforma introduzir a verificação paga, quando o selo azul sinalizava principalmente reconhecimento público, não uma assinatura. Os autores tratam contas verificadas como líderes e classificam manualmente algumas centenas delas por partido e coalizão eleitoral. Verificam que, mesmo antes de qualquer filtragem, os vínculos por retweet entre esses políticos verificados já caem em blocos políticos distintos. Ao aplicar seus métodos baseados em líderes e estatisticamente filtrados, a correspondência com partidos e coalizões do mundo real fica muito mais forte do que com algoritmos padrão rodados sobre a rede completa de retweets sem filtro.
O que funciona — e o que funciona menos
MonoDC, que se baseia em retweets diretos entre líderes, é particularmente bom em identificar partidos individuais: políticos tendem a impulsionar seu próprio lado. BiDC, que agrupa líderes por audiências compartilhadas, reflete melhor as coalizões eleitorais mais amplas que reúnem vários partidos sob um mesmo guarda-chuva. Os autores também testam maneiras alternativas de escolher líderes, como contas com muitos seguidores ou com alto "índice de retweet". Essas seleções baseadas em atividade se saem pior. Tendem a incluir jornalistas e comentaristas cujas audiências atravessam linhas ideológicas, borrando as fronteiras entre campos. Em contraste, figuras políticas verificadas antes de 2022, cujos papéis offline os ligam a partidos específicos, fornecem uma espinha dorsal mais estável para mapear o discurso online.
Por que isso importa para entender o debate digital
Para um leitor leigo, a mensagem principal é que a conversa política online não é um mercado plano de ideias. Em vez disso, ela é estruturada em torno de um conjunto relativamente pequeno de atores reconhecíveis, e o restante de nós revela nossas inclinações por quem escolhemos retransmitir. Ao primeiro identificar esses líderes, filtrar cuidadosamente suas conexões e só então atribuir usuários comuns a comunidades, os autores conseguem recuperar boa parte do mapa político subjacente a partir de dados limitados. A abordagem deles, embora desenvolvida no Twitter/X italiano, pode em princípio ser aplicada a muitas plataformas onde algumas contas visíveis moldam o que a maioria vê, oferecendo uma forma prática de estudar câmaras de eco mesmo quando as plataformas restringem o acesso a dados ou mudam suas regras de verificação.
Citação: Guarino, S., Mounim, A., Caldarelli, G. et al. Leveraging content producer networks and user perception to detect online discursive communities. Sci Rep 16, 11911 (2026). https://doi.org/10.1038/s41598-026-39477-5
Palavras-chave: polarização em redes sociais, comunidades políticas, discurso no Twitter, análise de redes, bolhas online