Clear Sky Science · pl

Nieliniowe zależności między odpowiedziami niedopasowania słuchowego a nieharmonicznością dźwięków złożonych

· Powrót do spisu

Dlaczego mózg przejmuje się „zabałaganionymi” dźwiękami

Codzienne słuchanie obfituje w bogate, wielowarstwowe dźwięki: rozmowy w tłumie, instrumenty w orkiestrze, ptaki w lesie. Wiele z tych dźwięków jest „harmonicznych”, co znaczy, że ich składowe układają się w uporządkowany sposób, który nasz słuch i mózg łatwo interpretują jako wysokość dźwięku. Rzeczywistość zawiera jednak także dźwięki bardziej chaotyczne i mniej uporządkowane. Badanie stawia pozornie proste pytanie: w miarę jak dźwięki stają się coraz bardziej nieuporządkowane, w którym momencie mózg przestaje niezawodnie zauważać zmianę w wzorcu?

Figure 1
Figure 1.

Uporządkowane tony kontra pomieszane tony

Gdy dźwięk złożony jest harmoniczny, jego składniki — czyste częstotliwości — są równo odstępne jako wielokrotności jednej częstotliwości bazowej, którą słyszymy jako wysokość dźwięku. W dźwiękach „nieharmonicznych” te składowe są losowo przesunięte, tworząc bardziej chaotyczne brzmienie. Dźwięki harmoniczne łatwiej wyodrębnić w hałasie i zapamiętać, podczas gdy silnie nieharmoniczne utrudniają rozróżnianie wysokości. Autorzy poszli o krok dalej, stopniowo dodając różne ilości losowego „jittera” do dźwięków syntetycznych, tworząc płynne przejście od doskonale harmonicznych do silnie nieharmonicznych, a następnie badali, jak system automatycznego wykrywania zmian w mózgu reaguje w całym tym zakresie.

Słuchanie w tle

Naukowcy rejestrowali aktywność mózgu za pomocą EEG, gdy 35 ochotników biernie słuchało sekwencji krótkich tonów. W projekcie „roving” wysokość tonów utrzymywała się przez pewien czas, a następnie nagle przeskakiwała na nową wartość. Pierwszy ton po każdej zmianie naruszał oczekiwania słuchacza i zwykle wywoływał sygnał mózgowy znany jako negatywność niedopasowania (MMN), po którym następował późniejszy sygnał zwany P3a, odzwierciedlający automatyczną zmianę uwagi. Co istotne, fizyczna głośność i ogólny skład tonów były dopasowane; jedynie regularność wewnętrznego wzoru częstotliwości — poziom nieharmoniczności — systematycznie różniła się między warunkami.

Gdzie alarm mózgu nagle przycicha

Jedna z przewidywań popularnych teorii „przetwarzania predykcyjnego” brzmi: w miarę jak dźwięki stają się trudniejsze do przewidzenia (bardziej nieharmoniczne), mózg stopniowo zmniejsza wagę sygnałów błędu, co prowadzi do gładkiego, mniej więcej liniowego spadku amplitudy MMN. Dane pokazały jednak inną historię. Amplitudy MMN były podobne dla dźwięków harmonicznych i lekko nieharmonicznych, i dopiero gwałtownie spadały po przekroczeniu pewnego progu nieharmoniczności. Modelowanie statystyczne wykazało, że krzywa sigmoidalna (kształt S) opisywała tę relację lepiej niż modele liniowe lub bardziej elastyczne wielomiany. Punkt załamania występował w warunkach średniego jittera, dokładnie tam, gdzie wewnętrzna struktura dźwięku stała się zbyt pocięta, by system słuchowy mógł niezawodnie wydobyć wyraźną wysokość dźwięku.

Słodki punkt automatycznej uwagi

Późniejsza odpowiedź P3a zachowywała się inaczej. Zamiast po prostu maleć wraz ze wzrostem nieharmoniczności, przyjmowała kształt odwróconego U: mała dla bardzo uporządkowanych dźwięków, osiągająca szczyt przy umiarkowanym poziomie nieharmoniczności, a następnie ponownie malejąca dla najbardziej nieuporządkowanych tonów. Sugeruje to, że system automatycznej uwagi mózgu najbardziej angażuje się wtedy, gdy zmiany wysokości są nadal ledwie wykrywalne, ale już wymagają większego wysiłku obliczeniowego. Osobne zadanie behawioralne, w którym ochotnicy aktywnie oceniali, czy drugi z dwóch tonów był wyższy czy niższy od pierwszego, wskazało podobny próg: rozróżnianie wysokości stało się zawodzne mniej więcej przy tym samym poziomie nieharmoniczności, przy którym MMN zaczął się załamywać.

Figure 2
Figure 2.

Co to znaczy dla naszego słyszenia

Podsumowując, wyniki wskazują, że wczesny system wykrywania zmian w mózgu traktuje dźwięki harmoniczne i lekko zniekształcone w zasadzie tak samo, ale gdy wewnętrzna struktura dźwięku staje się zbyt nieregularna, mózg nie jest już w stanie niezawodnie zbudować stabilnej reprezentacji wysokości — jego automatyczny „alarm” dla zmian wysokości skutecznie się wyłącza. Takie zachowanie progowe koresponduje z ideą, że nasz system słuchowy opiera się na wydobywaniu pojedynczej, leżącej u podstaw wysokości z dźwięków złożonych i ma trudności, gdy to zadanie staje się niemożliwe. Jednocześnie, ponieważ niektóre bardziej stopniowe modele także pasowały do danych lepiej niż model bez efektu, wyniki nie wykluczają subtelniejszych form ważenia precyzji w mechanizmach predykcyjnych mózgu. Zamiast tego badanie dostarcza czytelnej, opisowej mapy tego, jak rosnący spektalny nieporządek dźwięków znajduje odzwierciedlenie w gwałtownych zmianach odpowiedzi niedopasowania mózgu, pomagając wskazać, gdzie uporządkowane słyszenie ustępuje miejsca percepcyjnemu zamieszaniu.

Cytowanie: Brzezińska, A., Witkowski, B., Basińska, M. et al. Non-linear relationships between auditory mismatch responses and the inharmonicity of complex sounds. Sci Rep 16, 11836 (2026). https://doi.org/10.1038/s41598-026-41129-7

Słowa kluczowe: percepcja słuchowa, wysokość dźwięku, harmoniczność, negatywność niedopasowania (MMN), przetwarzanie predykcyjne