Clear Sky Science · ru

Люди могут использовать положительные и отрицательные спектротемпоральные корреляции для обнаружения повышающегося и понижающегося тона

· Назад к списку

Как наш мозг слышит движение нот вверх и вниз

Когда вы узнаёте вопрос в чей‑то речи или следите за мелодией любимой песни, ваши уши и мозг отслеживают, как тон поднимается и опускается во времени. В этом исследовании задают неожиданный вопрос: делают ли наши мозги это, используя те же приёмы обнаружения движения, что и глаза при восприятии движения? С помощью тщательно спроектированных новых звуков и тестов с нейровизуализацией авторы показывают, что люди способны слышать «движение» тона даже в звуках без отчётливых музыкальных нот, что раскрывает новый тип слуховой иллюзии и общую алгоритмическую стратегию между слухом и зрением.

Figure 1
Figure 1.

Слышать движение без явных нот

В повседневных звуках повышение и понижение тона часто связано с явной «фундаментальной частотой» — базовой нотой, которую мы спели бы или сыграли на инструменте. Но авторы создали специальные звуки, которые намеренно лишены этой очевидной тональной информации. Вместо стабильных тонов они использовали плотные «тучи» из множества частот, громкость которых менялась координированно во времени. Эти шаблоны создавали локальные взаимосвязи между соседними частотами и моментами времени, известные как спектротемпоральные корреляции. Испытуемые слушали каждый звук в течение двух секунд и просто сообщали, казалось ли им в целом, что тон поднимается или опускается.

Новая слуховая иллюзия, которая меняет направление

Когда соседние частоты склонны одновременно становиться громче или тише вдоль наклонной вверх диагонали во временно‑частотной сетке, люди надёжно сообщали, что тон звука повышается. Когда диагональ была направлена вниз, они сообщали о понижении тона. Удивление случилось, когда исследователи обратили шаблон: они заставили соседние частоты чередоваться, так что когда одна становилась громче, другая — тише — «отрицательная» корреляция. В этом случае вверх‑наклонённый шаблон воспринимался как понижение тона, а вниз‑наклонённый — как повышение. Это звуковой эквивалент хорошо известной визуальной иллюзии «reverse‑phi», когда движущийся узор с постоянно меняющейся контрастностью кажется движущимся в противоположном направлении. Сила воспринимаемого тонального движения зависела плавно от того, насколько сильно присутствовали эти корреляции, и эффект сохранялся даже при разделении информации между обоими ушами, что показывает, что мозг объединяет сигналы с обеих сторон.

Чувствительность к крошечным сдвигам по частоте и времени

Чтобы исследовать детали механизма, команда перешла от плотного шума к разрежённым «пипам»: коротким сигналам, разбросанным по частоте и времени. Они создавали пары пипов, разделённых небольшим скачком по частоте и короткой задержкой, и снова контролировали, были ли обе пипы одновременно громкими, одновременно тихими или противоположными по громкости. Варьируя задержку и величину частотного сдвига, они обнаружили, что люди наиболее чувствительны к направлению тона, когда второй пип следует примерно через 40 миллисекунд и меняется всего примерно на одну пятнадцатую октавы — очень небольшое изменение. Важно, что слушатели реагировали не только на пары «громко–громко», но и на все четыре комбинации громко/тихо. Они также слышали движение в более сложных трёхпиповых шаблонах, которые не содержат простых попарных регулярностей, что перекликается с аналогичными находками в зрении животных. Всё это указывает на систему, которая считывает тонкие локальные шаблоны изменений, а не отслеживает длительно существующие тоны.

Figure 2
Figure 2.

Нейронные подписи противоположных детекторов тона

Затем исследователи спросили, как эта вычислительная схема может быть организована в мозге. С помощью функционального МРТ они измеряли активность в слуховой коре, пока люди слушали простые повышающиеся тоны, понижающиеся тоны или их смесь, воспроизводимую одновременно. Если мозг использует отдельные наборы нейронов, настроенных на восходящее и нисходящее тональное движение, которые противодействуют друг другу, то комбинированный стимул должен частично отменять их активность. Именно это они и наблюдали: несколько областей с обеих сторон слуховой коры сильно реагировали на повышающиеся и понижающиеся тоны по отдельности, но слабее — на смесь. Этот «оппонентный» узор тесно соответствует цепям обработки движения, известным из зрительной системы, и естественно объясняет, почему смена корреляции в звуках меняет воспринимаемое направление.

От лабораторных иллюзий к повседневной речи и музыке

Наконец, команда проверила, имеют ли эти абстрактные шаблоны значение в реальной жизни. Проанализировав часы английской и мандаринской речи, они преобразовали каждую запись в временно‑частотную карту и измеряли, как тоны двигались вверх или вниз, используя алгоритм, похожий на те, что применяются для визуального движения. Затем они искали те же четыре локальные шаблона интенсивности, которые изучались в лаборатории. В обоих языках шаблоны, в которых соседние частоты менялись синхронно, как правило, совпадали с повышением или понижением тона, тогда как чередующиеся шаблоны предсказывали движение в противоположном направлении. Иными словами, и положительные, и отрицательные спектротемпоральные корреляции в естественной речи надёжно сигнализируют о том, как изменяется тон. Полученные результаты говорят о том, что чувствительность слуховой системы к этим тонким локальным шаблонам — включая те, что создают лабораторные иллюзии — не случайна, а является эффективным способом декодирования смысла и мелодии в сложных звуковых ландшафтах повседневной жизни.

Цитирование: Vaziri, P.A., McDougle, S.D. & Clark, D.A. Humans can use positive and negative spectrotemporal correlations to detect rising and falling pitch. Nat Hum Behav 10, 417–433 (2026). https://doi.org/10.1038/s41562-025-02371-7

Ключевые слова: восприятие тона, слуховое движение, интонация речи, слуховая кора, сенсорные иллюзии