Clear Sky Science · de
Menschen nutzen positive und negative spektral‑zeitliche Korrelationen, um steigende und fallende Tonhöhen zu erkennen
Wie unser Gehirn steigende und fallende Töne hört
Wenn Sie in jemandes Stimme eine Frage erkennen oder der Melodie Ihres Lieblingslieds folgen, verfolgen Ihr Ohr und Ihr Gehirn, wie die Tonhöhe im Laufe der Zeit steigt und fällt. Diese Studie stellt eine überraschende Frage: Nutzen unsere Gehirne dafür ähnliche Bewegungsdetektionstricks wie das Auge, um Bewegung zu sehen? Durch sorgfältig entworfene neue Klänge und Hirnbildgebungs‑Tests zeigen die Autorinnen und Autoren, dass Menschen Tonhöhenbewegung sogar in Geräuschen ohne klare musikalische Töne hören können. Das offenbart eine neue Art auditiver Illusion und einen gemeinsamen Algorithmus von Hören und Sehen.

Bewegung hören ohne klare Töne
Im alltäglichen Hören ist steigende oder fallende Tonhöhe oft an eine klare „Grundfrequenz“ gebunden – der Grundton, den wir singen oder auf einem Instrument spielen würden. Die Autorinnen und Autoren erzeugten jedoch spezielle Klänge, die diese offensichtliche Tonhöheninformation bewusst ausließen. Statt stabiler Töne verwendeten sie dichte Wolken vieler Frequenzen, deren Lautstärke sich über die Zeit koordiniert veränderte. Diese Muster schufen lokale Beziehungen zwischen benachbarten Frequenzen und Zeitpunkten, sogenannte spektral‑zeitliche Korrelationen. Die Versuchspersonen hörten jeden Klang zwei Sekunden lang und gaben einfach an, ob er insgesamt eher nach oben oder nach unten zu gehen schien.
Eine neue Hörillusion, die die Richtung umkehrt
Wenn benachbarte Frequenzen dazu neigten, gemeinsam lauter oder leiser zu werden entlang einer nach oben geneigten Diagonalen im Frequenz‑Zeit‑Raster, berichteten die Menschen zuverlässig, dass die Tonhöhe steige. Zeigte die Diagonale nach unten, berichteten sie einen fallenden Ton. Überraschend war das Ergebnis, als die Forschenden das Muster umkehrten: Sie ließen benachbarte Frequenzen altern, sodass eine lauter wurde, während die andere leiser wurde – eine „negative“ Korrelation. In diesem Fall wurde ein nach oben geneigtes Muster als fallende Tonhöhe wahrgenommen, und ein nach unten geneigtes als steigend. Das ist das akustische Gegenstück zu einer bekannten visuellen Illusion namens „Reverse‑Phi“, bei der ein sich bewegendes Muster, dessen Kontrast ständig umschlägt, in die entgegengesetzte Richtung zu gehen scheint. Die Stärke der wahrgenommenen Tonhöhenbewegung hing glatt davon ab, wie stark diese Korrelationen ausgeprägt waren, und der Effekt funktionierte sogar, wenn die Information auf beide Ohren verteilt war, was zeigt, dass das Gehirn Signale beider Seiten kombiniert.
Empfindlich für winzige Verschiebungen in Frequenz und Zeit
Um die Details dieses Mechanismus zu untersuchen, wechselte das Team von dichtem Rauschen zu spärlichen „Pip“-Klangschnipseln: kurzen Pieptönen, verteilt über Frequenz und Zeit. Sie erzeugten Paare von Pips, die durch einen kleinen Frequenzsprung und eine kurze Verzögerung getrennt waren, und steuerten wieder, ob die beiden gleichzeitig laut, gleichzeitig leise oder entgegengesetzt laut und leise waren. Durch Variation der Verzögerung und der Größe des Frequenzsprungs fanden sie heraus, dass Menschen am empfindlichsten für die Tonhöhenrichtung sind, wenn der zweite Pip etwa 40 Millisekunden später folgt und nur um etwa ein Fünfzehntel einer Oktave verschoben ist – eine sehr kleine Änderung. Entscheidend war, dass die Hörerinnen und Hörer nicht nur auf laut‑laut‑Paare sensibel waren, sondern auf alle vier Kombinationen von laut und leise. Sie hörten Bewegung auch in komplexeren Drei‑Pip‑Mustern, die keine einfachen paarweisen Regularitäten enthalten, was ähnliche Befunde aus der Tiersehsinn‑Forschung widerspiegelt. All das deutet auf ein System hin, das fein abgestufte lokale Muster von Veränderungen ausliest, statt langlebigen Tönen nachzuverfolgen.

Gehirnspuren gegensätzlicher Tonhöhendetektoren
Als Nächstes fragten die Forschenden, wie diese Berechnung im Gehirn organisiert sein könnte. Mit funktioneller MRT maßen sie die Aktivität im auditorischen Kortex, während Menschen einfache steigende Töne, fallende Töne oder eine Mischung aus beidem gleichzeitig hörten. Wenn das Gehirn separate Gruppen von Neuronen einsetzt, die auf aufsteigende bzw. absteigende Tonhöhenbewegung abgestimmt sind und sich gegenseitig opponieren, sollte der kombinierte Reiz deren Aktivität teilweise auslöschen. Genau das beobachteten sie: Mehrere Regionen auf beiden Seiten des auditorischen Kortex reagierten stark auf allein gespielte steigende und allein gespielte fallende Töne, aber weniger auf die Mischung. Dieses „opponentische“ Muster entspricht eng bekannten Bewegungsverarbeitungs‑Schaltkreisen aus dem visuellen System und erklärt auf natürliche Weise, warum das Umkehren der Korrelation in den Sounds die wahrgenommene Richtung umkehrt.
Von Laborillusionen zu Alltagssprache und Musik
Schließlich untersuchten die Autorinnen und Autoren, ob diese abstrakten Muster im wirklichen Leben relevant sind. Sie analysierten Stunden englischer und mandarinsprachiger Aufnahmen, wandelten jede Aufnahme in eine Zeit‑Frequenz‑Karte um und maßen, wie Töne nach oben oder unten bewegten, mithilfe eines Algorithmus ähnlich denen für visuelle Bewegung. Dann suchten sie in den Aufnahmen nach denselben vier lokalen Intensitätsmustern, die im Labor untersucht wurden. In beiden Sprachen fielen Muster, bei denen benachbarte Frequenzen gemeinsam änderten, tendenziell mit steigender oder fallender Tonhöhe zusammen, während alternierende Muster Bewegung in die entgegengesetzte Richtung vorhersagten. Mit anderen Worten: Sowohl positive als auch negative spektral‑zeitliche Korrelationen in natürlicher Sprache signalisieren zuverlässig, wie sich die Tonhöhe ändert. Die Ergebnisse legen nahe, dass die Empfindlichkeit des auditorischen Systems für diese subtilen lokalen Muster – einschließlich jener, die im Labor Illusionen erzeugen – kein Zufall ist, sondern eine effiziente Art, Bedeutung und Melodie aus den komplexen Klanglandschaften des Alltags zu dekodieren.
Zitation: Vaziri, P.A., McDougle, S.D. & Clark, D.A. Humans can use positive and negative spectrotemporal correlations to detect rising and falling pitch. Nat Hum Behav 10, 417–433 (2026). https://doi.org/10.1038/s41562-025-02371-7
Schlüsselwörter: Tonhöhenwahrnehmung, auditive Bewegung, Sprachintonation, auditorischer Kortex, sensorische Illusionen