Clear Sky Science · ru
Валидация автоматического сегментирования звука проглатывания 5 мл тонкой жидкости для оценки времени фарингеального очищения по аудиоданным
Почему звуки глотания важны
Глотание — это то, чему большинство из нас не придаёт значения, но для миллионов людей, особенно пожилых и страдающих неврологическими заболеваниями, оно может быть затруднено и представлять опасность. Когда глотание нарушается, пища или жидкость могут попасть в лёгкие, что ведёт к недоеданию, удушью или тяжёлым инфекциям, таким как пневмония. Лучшие современные методы диагностики проблем с глотанием основаны на рентгеновских «кино» исследованиях, проводимых в стационаре. В этом исследовании рассматривается более простой подход: прослушивание звуков глотания с помощью небольшого электронного стетоскопа на шее и использование компьютерного алгоритма для оценки того, насколько эффективно глотка очищается после каждого глотка жидкости.
От рентгена в больнице к умным постельным инструментам
Текущий золотой стандарт исследования глотания — видеофлюороскопия, рентгеновская «кино»-съёмка, показывающая, как контрастная жидкость движется из рта по глотке. Она показывает, как быстро и безопасно жидкость проходит ключевые структуры и остаётся ли что‑то позади. Однако этот тест требует специального оборудования, обученного персонала и подвергает пациента радиации, что затрудняет его частое повторение или проведение у постели больного или на дому. Напротив, шейная аускультация — прослушивание звуков из области горла — может выполняться в любом месте, но традиционно носила субъективный характер, полагаясь на ухо клинициста. С развитием цифровых сенсоров и обработки сигналов авторы ставят цель превратить эти звуки в надёжную численную меру, отражающую то, что видно на рентгене.

Запись звука глотка
Команда исследовала 45 пациентов в японской больнице, которые уже проходили рентгеновское обследование по поводу подозрения на нарушения глотания и могли безопасно проглотить 5 мл тонкой жидкости. Во время каждого глотка пациенты носили электронный стетоскоп на шее, установленный на передней поверхности шеи. Та же видеокамера записывала экран рентгена и звуковой сигнал, что позволяло точно синхронизировать оба потока. Правилно-ориентированный компьютерный алгоритм отслеживал громкость звукового потока в небольших временных срезах, отмечая начало и конец всплеска активности. Время между этими двумя точками — так называемое время фарингеального очищения, полученное по аудио — рассматривалось как интервал, в течение которого глотка активно перемещала жидкость.
Сопоставление звуковых событий с реальными движениями глотки
Чтобы оценить, действительно ли временные метки на основе звука отражают физический акт глотания, опытный логопед (речевой патолог) просмотрел рентгеновские «кино» покадрово. Он отметил три ключевых момента: когда жидкость впервые коснулась надгортанника у основания языка, когда открылся верхний пищеводный сфинктер (ворота в пищевод) и когда он снова закрылся. Вместе эти ориентиры определяют, сколько времени жидкость проводит, проходя через глотку. Затем исследователи сравнили временные метки с рентгена с вычисленными компьютером начальной и конечной точками звука в 84 глотках. Алгоритм успешно обнаружил 80 из них, и в большинстве случаев звуковой интервал заметно перекрывался с периодом прохождения по глотке, определённым по рентгену.
Насколько хорошо совпали временные показатели?
Начало, определённое по звуку, происходило после того, как жидкость достигла надгортанника, в 96% глотков и обычно в пределах примерно половины секунды, что указывает на то, что алгоритм не срабатывает на ранние движения рта, а реагирует на события в глотке. Конец, определённый по звуку, как правило, происходил после того, как верхний пищеводный сфинктер закрылся, то есть захваченный звуковой интервал покрывал полную активную фазу транспортировки по глотке. В среднем аудиогенерированное время очищения составляло около 0,7 секунды, что очень близко к 0,79 секунды, измеренным по рентгеновским ориентирам. Важно, что эта звуковая мера оставалась стабильной даже у пациентов, у которых перед основным глотком происходило подтёкивание жидкости изо рта в глотку (проблема, известная как плохая оральная герметичность); в таких случаях мера по рентгену удлинялась. Это говорит о том, что звуковой метод фокусируется на ключевом действии глотки и не путается с ранним пассивным подтёкиванием.

Что это может означать для повседневной помощи
Для пациентов и клиницистов основная мысль такова: простой сенсор, установленный на шее, вместе с автоматическим алгоритмом сегментации может дать надёжную оценку того, насколько эффективно глотка очищает глоток тонкой жидкости. Хотя он не фиксирует все фазы глотания и может недооценивать общее время глотка у людей с выраженными проблемами контроля во рту, он точно отслеживает ту фазу глотки, которая имеет значение для безопасного очищения. Это открывает путь к скринингу у постели больного и на дому, который может часто повторяться без рентгена и специализированной интерпретации. При дальнейшем подтверждении такие аудио‑меры могут способствовать более раннему выявлению ухудшения глотания, направлять терапию и помогать предотвращать осложнения, например аспирационную пневмонию — всё это путём превращения скрытых звуков глотка в практическую медицинскую информацию.
Цитирование: Jayatilake, D., Teramoto, Y., Ueno, T. et al. Validation of automated 5 mL thin liquid swallowing sound segmentation for estimating audio-derived pharyngeal clearance time. Sci Rep 16, 11908 (2026). https://doi.org/10.1038/s41598-026-39699-7
Ключевые слова: дисфагия, звук глотания, носимые сенсоры, время фарингеального очищения, цифровое здоровье