Clear Sky Science · ru
Диагностическая точность мультимодальных крупных языковых моделей при дифференциации эпилептических и функциональных припадков по видео, записанным на смартфон
Почему видео с вашего телефона может помочь в диагностике припадка
Когда кто‑то внезапно падает или начинает судорожно дергаться, свидетели всё чаще достают смартфон и нажимают «запись». Такие видео могут стать спасательными уликами: они помогают врачам решить, было ли это эпилептическим припадком или похожим по проявлениям событием, называемым функциональным припадком. Однако экспертов‑неврологов не хватает, и ожидание, пока специалист просмотрит запись, может задержать лечение. В этом исследовании ставится вопрос: могут ли современные системы искусственного интеллекта, конкретно мультимодальные крупные языковые модели, самостоятельно просматривать такие видеоклипы с повседневных телефонов и различать эти состояния.

Два типа похожих чрезвычайных состояний
Эпилептические и функциональные припадки могут выглядеть похоже для неискушённого наблюдателя, но у них очень разные причины и подходы к лечению. Эпилептические припадки возникают из‑за аномальной электрической активности в мозге и обычно лечатся с помощью лекарств или хирургии. Функциональные припадки, напротив, не вызваны такими мозговыми разрядами; это реальные и болезненные события, связанные со сложными взаимодействиями между мозгом и психикой, и они требуют иного подхода к помощи, часто включающего психологическую поддержку. Поскольку события кратковременны и пугающи, родственникам трудно точно их описать. Записи, сделанные в момент события, дают более верное представление, но их просмотр по‑прежнему зависит от доступа к опытным специалистам по эпилепсии.
Испытание универсального ИИ
Исследователи из крупного центра по лечению эпилепсии собрали 24 видеоролика со смартфонов 15 взрослых пациентов, у которых события были тщательно диагностированы с помощью госпитального видеомониторинга с ЭЭГ — золотого стандарта, регистрирующего и мозговые волны, и поведение. Девятнадцать клипов показывали эпилептические припадки, пять — функциональные. Каждое видео, без какой‑либо фоновой медицинской информации, пропустили через четыре версии семейства универсальных ИИ‑систем (Gemini 1.5 Pro, 2.0 Flash, 2.5 Flash и 2.5 Pro). Каждой модели задали простой вопрос: было ли событие эпилептическим или функциональным? ИИ также должен был указать свою уверенность по шкале от 1 до 10. Команда сравнила ответы ИИ с диагнозами госпиталя и рассчитала стандартные показатели, такие как точность, чувствительность (как часто правильно распознавались эпилептические припадки) и специфичность (как часто правильно исключались функциональные припадки).
Что ИИ делал правильно — и что неправильно
Новые версии ИИ показали результаты лучше, чем старые, но ни одна из них не приблизилась к замене специалиста. Общая диагностическая точность выросла примерно от одной трети верных ответов в самой ранней модели до чуть более половины в двух последних версиях. Новейшая система, Gemini 2.5 Pro, оказалась наиболее сбалансированной: она выявила немного больше половины эпилептических припадков и правильно отвергла большинство, но не все, функциональные припадки. Ранние версии были крайне осторожны: они почти никогда не ошибочно маркировали функциональные припадки как эпилептические, но пропускали подавляющее большинство эпилептических. Важно отметить: наивная стратегия, при которой каждое событие помечается как «эпилептическое», дала бы более высокую сырую точность, чем любая модель, но полностью провалила бы различение двух состояний, подчёркивая сложность задачи.
Почему детали видео имеют такое значение
Исследование также показало, что качество и кадрирование видео существенно влияли на работу ИИ. Когда записи были чёткими, хорошо освещёнными и были сосредоточены на верхней части тела или лице, новейшие модели правильно оценивали примерно в 80–90% случаев в этой подгруппе. Когда же на видео показывалось всё тело со значительного расстояния или освещение было плохим, точность резко падала, иногда до практически нуля. Тип припадка тоже имел значение: ранние версии ИИ практически не справлялись с более тонкими, не судорожными событиями, в то время как поздние версии были несколько более сбалансированы между выраженными судорогами и менее драматичными эпизодами. Тем не менее во всех моделях уровни уверенности оставались высокими как при верных, так и при неверных ответах, то есть ИИ часто был «уверенно неправ» — тревожная черта, если клиницисты или пациенты будут полагаться на такие суждения.

Что это значит для пациентов и врачей
Нынешнее послание ясно: универсальные ИИ‑системы умеют замечать закономерности в видеозаписях припадков и постепенно улучшаются, но пока далеки от того, чтобы быть надёжным автономным диагностическим инструментом. Системы по‑прежнему пропускают многие эпилептические припадки, испытывают трудности с тонкими проявлениями и ещё не умеют адекватно сигнализировать о возможной ошибке. Авторы утверждают, что будущие версии должны обучаться на гораздо больших коллекциях высококачественных медицинских видео с экспертной разметкой, лучше выражать неопределённость и теснее интегрироваться с анамнезом пациентов и записями мозговых волн. Вместо замены неврологов эти инструменты, скорее всего, станут частью более широкой, ориентированной на человека стратегии, в которой смартфоны, специалисты и продуманные ИИ совместно работают над ускорением и улучшением диагностики припадков.
Цитирование: Patel, A., Vallamchetla, S.K., Safa, A. et al. Diagnostic accuracy of multimodal large language models in differentiating epileptic from functional seizures in smartphone recorded videos. Sci Rep 16, 11719 (2026). https://doi.org/10.1038/s41598-026-46333-z
Ключевые слова: эпилепсия, видео припадков, искусственный интеллект, крупные языковые модели, медицинская диагностика