Clear Sky Science · ru

Порог восприятия количества гласных: перцептивное исследование синтезированных арабских гласных

· Назад к списку

Почему крошечные отрезки времени важны в речи

Когда мы слышим, как кто‑то говорит по‑арабски, мы редко замечаем, насколько долго звучит каждый гласный. Между тем небольшие различия во времени могут полностью менять смысл слова — как, например, разница между «bit» и «beat» в английском. В этой статье задаётся на первый взгляд простой вопрос: насколько долго должен длиться гласный, чтобы носители двух крупных арабских диалектов воспринимали его как «долгий», а не «короткий»? Ответ на этот вопрос показывает, как наш слух нарезает непрерывный звук на отдельные строительные блоки языка.

Figure 1
Figure 1.

Короткие и длинные звуки, меняющие смысл

В арабском языке длительность гласного является ключевой частью его звуковой системы: пары типа /a/ и более длинного /aː/ могут обозначать совершенно разные слова. Ранние исследования измеряли, какой длительности эти гласные обычно достигают в речи, показывая, что длинные гласные обычно в полтора‑три раза длиннее коротких. Но те работы сосредотачивались на производстве звуков, а не на их восприятии. Это исследование поворачивает вопрос: в какой момент при постепенном увеличении длительности слушатели переключаются с восприятия «короткий» на «длинный» — и совпадает ли этот порог у носителей разных арабских диалектов?

Два диалекта под микроскопом

Исследователь сравнил слушателей наджди-арабского, распространённого в центральной части Саудовской Аравии, и кайрского арабского, доминирующего диалекта Каира. Обе разновидности имеют тот же базовый набор трёх коротких гласных /a, i, u/ и трёх долгих /aː, iː, uː/. Чтобы сфокусироваться исключительно на времени, в исследовании использовали аккуратно отредактированные записи трёх минимальных пар слов (например, слово с коротким гласным «он написал» против слова с длинным гласным «он переписывался»). Начиная с естественно длинных гласных, автор постепенно сокращал их длительность малыми шагами, применяя программу, сохранявшую высоту звука и качество, пока гласный укорачивался. Так были получены плавные ряды гласных, которые переходили от явно длинных к явно коротким без введения неестественных артефактов.

Прослушивание и выбор между двумя словами

Сорок взрослых участников — двадцать носителей наджди и двадцать носителей кайрского диалекта — выполнили онлайн‑задание на прослушивание. После краткого знакомства с исходными, неизменёнными парами слов каждый участник поочерёдно слушал переработанные версии. Для каждого элемента им нужно было решить, какое слово они услышали: версию с длинным гласным или с коротким. Они могли повторно прослушать звук до ответа, но после выбора изменить его нельзя было. С помощью статистических моделей, учитывающих как конкретное слово, так и индивидуальные особенности слушателя, исследователь отследил, как вероятность ответа «длинный» повышалась по мере увеличения длительности гласного в миллисекундах.

Где слушатели проводят границу во времени

Результаты показывают, что длительность является сильным маркером для всех трёх гласных, однако точная граница между коротким и длинным зависит и от типа гласного, и от диалекта. Для верхнего переднего гласного [i] кайрские слушатели начинали воспринимать гласный как длинный при более коротких длительностях — примерно около 84 миллисекунд — в то время как наджди‑слушателям обычно требовалось около 96 миллисекунд, чтобы переключиться на «длинный». Кайрские слушатели также меняли свои суждения более резко по шкале времени, что указывает на более категоричную границу. Для низкого гласного [a] обе группы имели почти одинаковую границу, около 101 миллисекунды, хотя кайрские слушатели снова демонстрировали более крутой, решительный переход. Для заднего гласного [u] границы были очень близки — примерно 100 миллисекунд для наджди‑говорящих и 110 для кайрских — и небольшая разница не была статистически значимой.

Figure 2
Figure 2.

Что это говорит о восприятии речи

Для неспециалиста эти десятки миллисекунд могут показаться незначительными, но они демонстрируют, насколько тонко настроен наш слух на звуковые шаблоны собственного диалекта. Исследование показывает, что носители наджди и кайрского в целом соглашаются по необходимой длительности, чтобы пометить гласный как длинный, особенно для [a] и [u], однако они по‑разному калибруют этот порог для [i]. Также видно, что люди различаются: одни воспринимают переход от короткого к длинному как резкий скачок, другие — как более постепенное изменение. В совокупности эти данные подтверждают идею о том, что звуковые категории не являются жёсткими универсальными коробками. Вместо этого наш опыт с конкретным диалектом формирует точные временные пороги, которыми мозг пользуется, чтобы превращать текучий поток звука в значимые слова.

Цитирование: Alfaifi, A. Perceptual boundary of vowel quantity: a perceptual study of synthesized Arabic vowels. Humanit Soc Sci Commun 13, 271 (2026). https://doi.org/10.1057/s41599-025-06454-8

Ключевые слова: Арабские гласные, длительность гласных, восприятие речи, диалектные вариации, фонетика