Clear Sky Science · it

Gli esseri umani possono usare correlazioni spettrotemporali positive e negative per rilevare l’innalzamento e l’abbassamento del tono

· Torna all'indice

Come i nostri cervelli percepiscono note che salgono e scendono

Quando riconosci una domanda nella voce di qualcuno o segui la melodia della tua canzone preferita, orecchie e cervello tracciano come il tono sale e scende nel tempo. Questo studio pone una domanda sorprendente: il nostro cervello fa questo usando gli stessi trucchi di rilevamento del movimento che usa la vista per vedere il movimento? Progettando con cura nuovi suoni e test di neuroimaging, gli autori mostrano che le persone possono udire il moto di tono anche in suoni privi di note musicali chiare, rivelando un nuovo tipo di illusione uditiva e un algoritmo condiviso tra udito e visione.

Figure 1
Figura 1.

Percepire il movimento senza note evidenti

Nei suoni di tutti i giorni, il salire e scendere del tono è spesso legato a una chiara “frequenza fondamentale” — la nota base che canteremmo o suoneremmo su uno strumento. Ma gli autori hanno creato suoni speciali privi intenzionalmente di questa informazione ovvia sul tono. Invece di toni stabili, hanno usato fitte nuvole di molte frequenze la cui intensità cambiava in modi coordinati nel tempo. Questi schemi creavano relazioni locali tra frequenze vicine e momenti nel tempo, note come correlazioni spettrotemporali. Gli ascoltatori udivano ogni suono per due secondi e semplicemente segnalavano se, complessivamente, sembrava salire o scendere di tono.

Una nuova illusione uditiva che inverte la direzione

Quando le frequenze vicine tendevano ad aumentare o diminuire insieme lungo una diagonale verso l’alto nella griglia frequenza–tempo, le persone riportavano in modo affidabile che il tono stava salendo. Quando la diagonale puntava verso il basso, riportavano un tono in discesa. La sorpresa è arrivata quando i ricercatori invertirono lo schema: fecero in modo che le frequenze vicine alternassero, così che quando una diventava più forte l’altra diventava più debole — una correlazione “negativa”. In questo caso, un motivo inclinato verso l’alto veniva udito come un tono in discesa, e uno inclinato verso il basso come un tono in salita. Questo è l’equivalente sonoro di una nota illusione visiva ben nota chiamata “reverse-phi”, in cui un motivo in movimento che continua a invertire il contrasto appare muoversi nella direzione opposta. L’intensità del moto di tono percepito dipendeva in modo continuo da quanto forti fossero queste correlazioni, e l’effetto funzionava anche quando l’informazione era suddivisa tra i due orecchi, dimostrando che il cervello combina i segnali da entrambi i lati.

Sintonizzarsi su piccoli spostamenti di frequenza e tempo

Per sondare i dettagli di questo meccanismo, il team passò dal rumore denso a suoni “pip” sparsi: brevi segnali acustici disseminati in frequenza e tempo. Crearono coppie di pip separate da un piccolo salto di frequenza e da un breve ritardo, e controllarono di nuovo se i due erano forti insieme, deboli insieme o opposti nell’intensità. Variando il ritardo e la dimensione del salto di frequenza, trovarono che le persone erano più sensibili alla direzione del tono quando il secondo pip seguiva circa 40 millisecondi dopo e si spostava di solo circa un quindicesimo di ottava — un cambiamento molto piccolo. Crucialmente, gli ascoltatori erano sensibili non solo alle coppie forte–forte, ma a tutte e quattro le combinazioni di forte e debole. Udivano inoltre moto in schemi più complessi a tre pip che non contenevano semplici regolarità a coppie, riecheggiando risultati simili nella visione animale. Tutto ciò indica un sistema che legge schemi locali finemente dettagliati di cambiamento piuttosto che tracciare toni duraturi.

Figure 2
Figura 2.

Segnature cerebrali di rilevatori di tono opponenti

I ricercatori chiesero quindi come questa computazione potesse essere organizzata nel cervello. Usando la risonanza magnetica funzionale, misurarono l’attività nella corteccia uditiva mentre le persone ascoltavano toni semplici in salita, toni in discesa o una miscela dei due suonati contemporaneamente. Se il cervello utilizzasse insiemi separati di neuroni sintonizzati al moto del tono verso l’alto e verso il basso che si opponessero tra loro, allora lo stimolo combinato dovrebbe cancellare parzialmente la loro attività. Questo è esattamente ciò che osservarono: diverse aree su entrambi i lati della corteccia uditiva rispondevano fortemente ai toni ascendenti e discendenti singolarmente, ma meno alla miscela. Questo schema “opponente” corrisponde strettamente ai circuiti di elaborazione del moto noti nel sistema visivo e spiega naturalmente perché invertire la correlazione nei suoni inverte la direzione percepita.

Dalle illusioni di laboratorio al parlato e alla musica di tutti i giorni

Infine, il team si chiese se questi schemi astratti avessero davvero rilevanza nella vita reale. Analizzando ore di parlato in inglese e mandarino, convertirono ogni registrazione in una mappa tempo–frequenza e misurarono come i toni si muovevano verso l’alto o verso il basso, usando un algoritmo simile a quelli impiegati per il moto visivo. Cercarono quindi gli stessi quattro schemi locali di intensità studiati in laboratorio. In entrambe le lingue, gli schemi in cui le frequenze vicine cambiavano insieme tendevano a coincidere con toni ascendenti o discendenti, mentre gli schemi alternati prevedevano un moto nella direzione opposta. In altre parole, sia le correlazioni spettrotemporali positive sia quelle negative nel parlato naturale segnalano in modo affidabile come il tono sta cambiando. I risultati suggeriscono che la sensibilità del sistema uditivo a questi sottili schemi locali — inclusi quelli che generano illusioni in laboratorio — non è un vezzo, ma un modo efficiente per decodificare significato e melodia dai complessi paesaggi sonori della vita quotidiana.

Citazione: Vaziri, P.A., McDougle, S.D. & Clark, D.A. Humans can use positive and negative spectrotemporal correlations to detect rising and falling pitch. Nat Hum Behav 10, 417–433 (2026). https://doi.org/10.1038/s41562-025-02371-7

Parole chiave: percezione del tono, moto uditivo, intonazione del parlato, corteccia uditiva, illusioni sensoriali