Clear Sky Science · es
Un modelo global de análisis de sentimiento en Twitter sobre la vacunación frente a la COVID
Por qué importan los sentimientos sobre las vacunas en Twitter
Durante la pandemia de COVID-19, los gobiernos dependieron de las vacunas y de la cooperación pública para salvar vidas. Sin embargo, las reacciones a las campañas de vacunación variaron mucho en todo el mundo, con personas que a menudo expresaron sus esperanzas y temores en las redes sociales. Este estudio va más allá de etiquetas simples de “positivo” o “negativo” en los tuits y plantea una cuestión más profunda: ¿cómo se interpretan los comentarios sobre la vacunación frente a la COVID-19 una vez que tenemos en cuenta el grado en que el propio país de cada persona fue golpeado por el virus? Al combinar el texto de los tuits con datos reales de la pandemia, los autores buscan capturar lo que un mensaje significa verdaderamente en su contexto global más amplio.
De tuits en bruto a sentimientos de primera aproximación
Los investigadores empezaron recopilando más de cuarenta mil tuits en inglés sobre la vacunación contra la COVID-19 publicados en la primavera de 2021, un periodo crucial en el que muchos países alcanzaban hitos importantes de vacunación. Limpiaron los datos eliminando etiquetas de usuario y enlaces web que no ayudan a juzgar el tono. Para asignar un sentimiento inicial a cada tuit, usaron un modelo de lenguaje moderno entrenado específicamente con contenido de Twitter, conocido como Twitter-roBERTa. Este modelo clasifica los tuits en tres categorías básicas: positivo, negativo o neutro, basándose únicamente en el texto. Los autores llaman a esta primera capa de etiquetado el “sentimiento local” del tuit, porque ignora lo que ocurre en el resto del mundo.

Incorporando el estado real de la pandemia
A continuación, el equipo reunió estadísticas sobre la COVID-19 a nivel de país—casos, fallecimientos y población—para diez países repartidos por Norteamérica, Europa, Asia y Oceanía. Convirtieron estos números en un único “valor de severidad” por país, que muestra qué tan gravemente fue afectado en comparación con los demás durante el periodo de estudio. Un tuit procedente de un país con altas tasas de casos y muertes se interpreta de forma muy distinta a un tuit idéntico en un país con condiciones más leves. Los investigadores luego fusionaron cada tuit con el valor de severidad del país del que probablemente procedía, usando las ubicaciones autoindicadas por los usuarios y listas cuidadosamente curadas de ciudades y regiones para mapear ubicaciones a países.
Transformando sentimientos locales en matices globales de opinión
Con el texto del tuit y el contexto del país en la mano, los autores diseñaron tres métodos para refinar la etiqueta de cada tuit, pasando de una simple etiqueta positivo/negativo/neutro a un “sentimiento global” más rico. Los dos primeros métodos usan reglas de probabilidad (teorema de Bayes) para medir cuán común es cada tipo de sentimiento dentro de un país o dentro de dos grupos amplios de países: aquellos en condiciones pandémicas relativamente “buenas” frente a “malas”. Un tuit que vaya en contra del ánimo predominante en su entorno, como un comentario positivo raro en un país muy afectado, se trata como una expresión de “alta intensidad”, mientras que uno que refleje una opinión común se considera de “baja intensidad”. El método 2 también distingue etiquetas “débilmente” y “fuertemente” positivas o negativas, según si el tono del tuit encaja o contradice la situación del país.

Un modelo más inteligente para aprender la intensidad automáticamente
El tercer método utiliza un enfoque estadístico más avanzado llamado regresión ordinal multinivel bayesiana. En lugar de depender de puntos de corte fijos, este modelo aprende, a partir de los propios datos, cómo las puntuaciones de sentimiento a nivel de tuit (derivadas de las probabilidades de Twitter-roBERTa) interactúan con la severidad de la pandemia en cada país. Tiene en cuenta las diferencias entre países a la vez que agrupa información entre ellos. El modelo estima entonces, para cada tuit, no solo si es negativo, neutro o positivo, sino también con qué grado de confianza pertenece a esa categoría. Los tuits cuyas probabilidades basadas en el modelo son más altas de lo típico para su categoría se etiquetan como de “alta intensidad”; otros se marcan como de “baja intensidad”. Esto crea etiquetas de sentimiento global matizadas que reflejan tanto el lenguaje como el contexto de salud pública.
Qué significan los hallazgos para entender el ánimo público
Cuando los autores usaron estas nuevas etiquetas de sentimiento global para entrenar clasificadores habituales de aprendizaje automático, encontraron que las etiquetas matizadas—especialmente las producidas por el modelo avanzado—ayudaron a los clasificadores a aprender patrones más precisos que los métodos más toscos. En términos prácticos, esto significa que las agencias de salud pública, los investigadores y los analistas de redes sociales pueden obtener una imagen más nítida de cómo se sienten realmente las personas respecto a las vacunas si observan los tuits desde una perspectiva global, en lugar de leer las palabras de forma aislada. Dos personas pueden sonar igualmente frustradas con la vacunación, pero si una vive en un país que afronta un brote grave y la otra en un lugar donde la situación está bajo control, sus mensajes tienen distinto peso. Al capturar estas diferencias en intensidad, el estudio ofrece una forma más fundamentada de monitorear el sentimiento público y de diseñar respuestas que se ajusten mejor a las realidades que afrontan las personas.
Cita: Chakrabarty, D., Chatterjee, S. & Mukhopadhyay, A. A global twitter sentiment analysis model for COVID-vaccination. Sci Rep 16, 9005 (2026). https://doi.org/10.1038/s41598-026-38553-0
Palabras clave: Vacunación COVID-19, Sentimiento en Twitter, análisis de redes sociales, comunicación en salud pública, aprendizaje automático