Clear Sky Science · es
Los humanos pueden usar correlaciones espectrotemporales positivas y negativas para detectar el ascenso y descenso del tono
Cómo nuestros cerebros escuchan notas que suben y bajan
Cuando reconoces una pregunta en la voz de alguien o sigues la melodía de tu canción favorita, tus oídos y tu cerebro rastrean cómo el tono sube y baja con el tiempo. Este estudio plantea una pregunta sorprendente: ¿hacen nuestros cerebros esto usando los mismos trucos de detección de movimiento que emplean nuestros ojos para ver el movimiento? Mediante el diseño cuidadoso de nuevos sonidos y pruebas de imagen cerebral, los autores muestran que las personas pueden percibir movimiento de tono incluso en sonidos sin notas musicales claras, revelando un nuevo tipo de ilusión auditiva y un algoritmo compartido entre la audición y la visión.

Escuchar movimiento sin notas claras
En los sonidos cotidianos, el ascenso y descenso del tono suele estar ligado a una "frecuencia fundamental" clara: la nota básica que cantaríamos o tocaríamos en un instrumento. Pero los autores crearon sonidos especiales que deliberadamente carecían de esta información tonal obvia. En lugar de tonos estables, usaron nubes densas de muchas frecuencias cuya sonoridad cambiaba de manera coordinada a lo largo del tiempo. Estos patrones generaron relaciones locales entre frecuencias vecinas y momentos en el tiempo, conocidas como correlaciones espectrotemporales. Los oyentes escucharon cada sonido durante dos segundos y simplemente informaron si, en conjunto, les parecía que el tono subía o bajaba.
Una nueva ilusión auditiva que invierte la dirección
Cuando las frecuencias vecinas tendían a aumentar o disminuir juntas a lo largo de una diagonal ascendente en la cuadrícula frecuencia–tiempo, las personas informaban de manera fiable que el tono estaba subiendo. Cuando la diagonal apuntaba hacia abajo, reportaban un descenso del tono. La sorpresa llegó cuando los investigadores invirtieron el patrón: hicieron que las frecuencias vecinas alternaran, de modo que cuando una aumentaba la otra disminuía —una correlación “negativa”. En este caso, un patrón inclinado hacia arriba se percibía como descenso del tono, y uno inclinado hacia abajo se percibía como ascenso. Esto es el equivalente sonoro de una conocida ilusión visual llamada “reverse-phi”, en la que un patrón en movimiento que sigue invirtiendo el contraste parece moverse en la dirección opuesta. La intensidad del movimiento tonal que la gente percibía dependía de forma continua de la fuerza de estas correlaciones, y el efecto funcionó incluso cuando la información se dividía entre los dos oídos, lo que demuestra que el cerebro combina señales de ambos lados.
Sintonizando cambios diminutos en frecuencia y tiempo
Para sondear los detalles de este mecanismo, el equipo pasó del ruido denso a sonidos “pip” esparsos: breves pitidos dispersos en frecuencia y tiempo. Crearon pares de pips separados por un pequeño salto en frecuencia y un breve retardo, y nuevamente controlaron si los dos eran fuertes juntos, débiles juntos, o opuestos en sonoridad. Al variar el retardo y el tamaño del salto de frecuencia, encontraron que las personas eran más sensibles a la dirección del tono cuando el segundo pip seguía aproximadamente 40 milisegundos después y cambiaba apenas alrededor de una quinceava parte de octava —un cambio muy pequeño. De manera crucial, los oyentes eran sensibles no solo a pares fuerte–fuerte, sino a las cuatro combinaciones de fuerte y débil. También percibieron movimiento en patrones más complejos de tres pips que no contienen regularidades pareadas simples, haciendo eco de hallazgos similares en la visión animal. Todo esto apunta a un sistema que lee patrones locales de cambio de alta resolución en lugar de rastrear tonos de larga duración.

Firmas cerebrales de detectores de tono opuestos
Los investigadores preguntaron a continuación cómo podría estar organizada esta computación en el cerebro. Usando resonancia magnética funcional, midieron la actividad en la corteza auditiva mientras las personas escuchaban tonos simples ascendentes, descendentes, o una mezcla de ambos reproducidos al mismo tiempo. Si el cerebro utilizara conjuntos separados de neuronas sintonizadas al movimiento tonal hacia arriba y hacia abajo que se oponen entre sí, entonces el estímulo combinado debería cancelar parcialmente su actividad. Esto es exactamente lo que observaron: varias regiones en ambos lados de la corteza auditiva respondieron con fuerza a tonos ascendentes y a tonos descendentes por separado, pero menos a la mezcla. Este patrón “oponente” coincide estrechamente con los circuitos de procesamiento del movimiento conocidos en el sistema visual y explica de forma natural por qué invertir la correlación en los sonidos invierte la dirección percibida.
De las ilusiones de laboratorio al habla y la música cotidiana
Finalmente, el equipo preguntó si estos patrones abstractos importan en la vida real. Analizando horas de habla en inglés y mandarín, convirtieron cada grabación en un mapa tiempo–frecuencia y midieron cómo se movían los tonos hacia arriba o abajo, usando un algoritmo similar a los empleados para el movimiento visual. Luego buscaron los mismos cuatro patrones locales de intensidad estudiados en el laboratorio. En ambos idiomas, los patrones en los que las frecuencias vecinas cambiaban juntas tendían a coincidir con tonos ascendentes o descendentes, mientras que los patrones alternantes predecían movimiento en la dirección opuesta. En otras palabras, tanto las correlaciones espectrotemporales positivas como las negativas en el habla natural señalan de forma fiable cómo está cambiando el tono. Los hallazgos sugieren que la sensibilidad del sistema auditivo a estos sutiles patrones locales —incluidos los que crean ilusiones en el laboratorio— no es una rareza, sino una forma eficiente de descifrar el significado y la melodía en los complejos paisajes sonoros de la vida cotidiana.
Cita: Vaziri, P.A., McDougle, S.D. & Clark, D.A. Humans can use positive and negative spectrotemporal correlations to detect rising and falling pitch. Nat Hum Behav 10, 417–433 (2026). https://doi.org/10.1038/s41562-025-02371-7
Palabras clave: percepción del tono, movimiento auditivo, intonación del habla, corteza auditiva, ilusiones sensoriales