Clear Sky Science · ru

Характеризация речи, затронутой инсультом, с помощью признаков на основе F0 и длительности

· Назад к списку

Почему инсульт меняет звучание голоса

Когда у человека случается инсульт, врачи в первую очередь стараются сохранить ткани мозга и восстановить двигательную активность. Но одна из самых личных потерь часто проявляется позже: это ясное, привычное звучание собственного голоса. В этом исследовании звучит простой, но важный вопрос — можно ли количественно измерить изменения в речи так, чтобы это помогло лучше обнаруживать, понимать и в дальнейшем контролировать повреждения, связанные с инсультом?

Слушая тон и ритм, а не только слова

Наши уши делают больше, чем просто распознают слова; они отслеживают «музыкальную» форму и ритм речи, известные как просодия. Два базовых компонента формируют эту звуковую картину: тон (насколько высокий или низкий голос) и временные характеристики (как долго длятся части звука и как быстро мы переходим от одного звука к другому). Исследователи сосредоточились на этих двух элементах, чтобы посмотреть, чем речь людей после инсульта отличается от речи здоровых говорящих. Для этого они создали специализированную речевую базу данных в больничной палате в Индии, записав пять протяжённых гласных и короткие трёхсловные фразы у 50 пациентов после инсульта и 50 здоровых добровольцев, для которых телугу был родным языком.

Figure 1
Figure 1.

Фиксируя «скрытую музыку» голоса

Чтобы отслеживать тон, команда использовала тонко детализированный метод, который идёт по циклам вибрации голосовых складок один за другим, а не усредняет по нескольким циклам. Это позволило построить подробный контур изменения тона во времени, даже в шумной обстановке переполненной больничной палаты. Из этих контуров они вычисляли простые статистики, такие как средний тон, медианный тон и степень флуктуации тона вокруг этого центра. При сравнении пациентов после инсульта и здоровых говорящих выявилась поразительная картина, зависящая от пола: у мужчин после инсульта типичный тон оказался немного выше, чем у здоровых мужчин, тогда как у женщин после инсульта типичный тон был заметно ниже, чем у здоровых женщин. Эти отличия были достаточно сильны, чтобы проявиться и в полном наборе данных, и в осторожно сопоставленной по возрасту подгруппе.

Измеряя скольжение между звуками

Речь — это не просто поток ровных нот. Наши органы речи скользят от одного звука к другому, проходя через короткие «переходные» области, где форма ротового тракта быстро меняется, и через «устойчивые» участки, где один звук удерживается более или менее стабильно. Исследователи разработали автоматические меры, которые выделяют эти два типа областей, отслеживая, насколько быстро акустический отпечаток голоса меняется от момента к моменту. У здоровых говорящих переходы и устойчивые сегменты относительно сбалансированы. У пациентов после инсульта картина изменилась: переходы между звуками в целом стали короче, но изменения в эти короткие моменты стали более резкими, а устойчивые участки между ними — заметно длиннее.

Что эти паттерны говорят о «невнятной» речи

Собирая эти результаты воедино, мы получаем представление о том, как инсульт меняет произношение. Многие пациенты живут с слабостью или частичным параличом одной стороны тела, что затрудняет плавный контроль мышц губ, языка и челюсти. Результаты исследования указывают на то, что артикуляторы могут вместо плавного скольжения между звуками оставаться в одном положении слишком долго, а затем смещаться более резко, создавая более короткие, но интенсивные переходы и удлинённые устойчивые промежутки. Эти более длинные устойчивые участки хорошо коррелируют с тем, что слушатели описывают как «невнятную» или затянутую речь.

Figure 2
Figure 2.

От внимательного прослушивания к клиническим инструментам

Для непрофессионала главный вывод таков: инсульт влияет не только на силу речи; он оставляет измеряемый отпечаток на тоне и ритме голоса. Мужчины и женщины показывают противоположные смещения типичного тона, а все пациенты после инсульта в исследовании склонны иметь более короткие, резкие переходы между звуками и более длинные удерживаемые части между ними. Поскольку эти паттерны можно захватить с помощью простых числовых признаков, они могут лечь в основу будущих компьютерных инструментов, помогающих клиницистам раньше обнаруживать речевые нарушения, связанные с инсультом, отслеживать восстановление со временем и, возможно, даже оценивать тяжесть инсульта по голосу. Проще говоря, превращая внимательное прослушивание в данные, это исследование делает шаг к тому, чтобы звучание голоса человека стало практическим окном в состояние его мозга.

Цитирование: Jyothi, M.V.S., Banerjee, O., Govind, D. et al. Characterizing stroke-affected speech using F0 and duration-based features. Sci Rep 16, 9146 (2026). https://doi.org/10.1038/s41598-026-40155-9

Ключевые слова: речь при инсульте, дизартрия, анализ голоса, просодия речи, клиническая база речевых данных