Clear Sky Science · es

Una base de datos validada de audición emocional en mandarín chino de oraciones con pronombres personales del sujeto (MCAE-SPPS)

· Volver al índice

Por qué palabras sencillas como “yo” y “tú” importan

Frases cotidianas como “tengo un plan” o “lo hiciste bien” transmiten más que información: transmiten sentimiento. Cambios sutiles en quién habla sobre quién pueden moldear cómo percibimos y entendemos la emoción en una voz. Este estudio presenta una amplia biblioteca sonora cuidadosamente verificada de oraciones en mandarín chino que se centran en pronombres personales como “yo”, “tú” y “él”. Está diseñada para ayudar a científicos, clínicos e ingenieros a comprender mejor cómo la elección del pronombre colorea las emociones que percibimos y para construir herramientas más inteligentes para la salud mental y la comunicación humano–máquina.

Construir una biblioteca de voces emocionales

Para crear este recurso, los investigadores primero escribieron 40 oraciones cortas en mandarín, emocionalmente neutras, todas con un patrón simple como “tengo un plan”. Confirmaron con evaluadores independientes que estas oraciones se percibían como neutrales y no como felices o tristes. Luego intercambiaron la palabra de sujeto para crear seis versiones de cada oración: “yo”, “nosotros”, “tú” singular, “ustedes”/“vosotros” (tú plural), “él” y “ellos”, manteniendo el resto de la oración idéntico. Esto produjo 200 oraciones base neutrales, cada una diferenciada solo por el pronombre, de modo que cualquier cambio en cómo las personas percibían la emoción pudiera rastrearse hasta esa única palabra.

Convertir oraciones neutras en habla emocional

Seis actores altamente entrenados de habla mandarín —tres hombres y tres mujeres— grabaron cada oración en siete estilos emocionales: neutral, felicidad, tristeza, ira, miedo, asco y sorpresa. Eso significó que cada actor produjo 1.400 grabaciones, para un total de 8.400 fragmentos. Las grabaciones se realizaron en un estudio de sonido profesional y se editaron y normalizaron cuidadosamente para que la calidad del audio fuera consistente. Tras eliminar un pequeño número de fragmentos con errores técnicos o de pronunciación, quedaron 8.379 enunciados para ser evaluados por oyentes.

Figure 1
Figura 1.

Cómo juzgaron los oyentes las emociones en la voz

Para averiguar con qué claridad cada fragmento expresaba emoción, el equipo reclutó a 720 estudiantes universitarios chinos. Cada persona escuchó unos pocos cientos de fragmentos en línea y, por cada uno, eligió cuál de las siete emociones percibía y cuán intensa le parecía en una escala de nueve puntos. Cada fragmento fue valorado por 40 oyentes diferentes, lo que proporcionó una imagen rica de con qué consistencia la gente reconocía las emociones pretendidas. Los investigadores conservaron solo aquellas grabaciones que fueron identificadas correctamente al menos tres veces más a menudo que por azar y que no se confundían con frecuencia con otra emoción. Este filtro de calidad dejó 6.675 grabaciones “válidas”, que aún cubren todas las emociones y tipos de pronombre.

Qué revelan los datos sobre emoción y pronombres

La base de datos final muestra que algunas emociones son mucho más fáciles de percibir que otras: la neutralidad y la tristeza fueron las más reconocidas con precisión, mientras que el miedo y el asco se confundieron con mayor facilidad. En promedio, las mujeres fueron ligeramente mejores que los hombres para identificar las emociones en el habla. De manera crucial, el equipo encontró que los pronombres importan: las oraciones dirigidas a “tú” se distinguieron de las oraciones en tercera persona sobre “él” o “ellos” en todas las emociones, lo que sugiere que dirigirse directamente al oyente aumenta la claridad emocional. La elección del pronombre también cambió la percepción de intensidad del habla. Por ejemplo, las oraciones con “tú” tendieron a sentirse más intensas para la ira y el miedo, mientras que las oraciones con “yo” resultaron más intensas para la felicidad y el asco. Los análisis acústicos además vincularon características como el tono, la intensidad y la calidad de la voz con la precisión con la que se reconocía cada emoción.

Figure 2
Figura 2.

Por qué este recurso importa de cara al futuro

En términos sencillos, este trabajo demuestra que palabras diminutas como “yo” y “tú” pueden cambiar no solo lo que decimos, sino la fuerza con la que se perciben nuestros sentimientos. Al ofrecer miles de grabaciones cuidadosamente etiquetadas donde solo varían el pronombre y el tono emocional, la Base de Datos de Audición Emocional en Mandarín de Oraciones con Pronombres Personales del Sujeto proporciona a los investigadores una herramienta potente para estudiar cómo interactúan el lenguaje, la emoción y la perspectiva social. Puede apoyar avances en la investigación cerebral, en inteligencia artificial sensible a las emociones y en herramientas clínicas que detecten cambios de ánimo o de salud mental, todo ello anclado en la cuestión simple pero profunda de quién habla sobre quién.

Cita: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z

Palabras clave: habla emocional, mandarín, pronombres personales, reconocimiento de emociones, base de datos de voz