Clear Sky Science · ru
Метод обнаружения усталости водителя на основе анализа позы и состояния лица
Почему усталые водители важны для всех
Многие из нас хотя бы раз ощущали тяжесть век в длительной поездке, но немногие представляют, как часто такое состояние сонливости перерастает в аварию. В этой работе описана система на основе камер, которая наблюдает за лицом, позой и руками водителя, чтобы выявлять ранние признаки усталости и вовремя выдавать предупреждения — без прикрепления датчиков к телу и без изменения привычек вождения.
Наблюдение за водителем, а не только за автомобилем
Дорожные службы оценивают, что усталость участвует в значительной доле серьёзных аварий во всём мире. Традиционные системы предупреждения ориентировались на сигналы от машины — например, корректировки руля или съезды с полосы — или использовали медицинские датчики для отслеживания активности мозга или сердца. Эти подходы могут быть дорогими, неудобными или ненадёжными при различных водителях и дорожных условиях. В исследовании вместо этого используют обычное видео с небольших камер внутри салона, чтобы напрямую распознавать поведение водителя с помощью современных методов искусственного интеллекта.

Чтение глаз, рта, головы и рук
Исследователи сначала разбивают признаки уставшего вождения на простые, повседневные проявления. Сигналы тревоги включают замедленные, удлинённые моргания, повторные зевки, поникшую или наклонённую голову и отскальзывание рук с руля. С помощью метода оценки позы AlphaPose система отслеживает 119 ключевых точек на теле водителя, особенно вокруг глаз, рта, головы и запястий. По этим точкам вычисляются простые меры — например, насколько широко открыты глаза и рот и насколько голова наклонена или опущена относительно шеи и глаз. Также проверяется, держится ли каждое запястье близко к рулю со временем или отдаляется, что указывает на ослабление контроля над управлением.
Наблюдение под разными углами во времени
Поскольку одиночный кадр может вводить в заблуждение, система анализирует короткие видеоклипы, а не отдельные фреймы. Например, одно нормальное моргание может напоминать сонное закрытие глаз, а быстрый взгляд на приборную панель — кивание головы, если смотреть только один кадр. Чтобы избежать таких ошибок, метод изучает изменения в как минимум 20 последовательных кадрах, проверяя, сохраняются ли признаки усталости. Также используются три ракурса из набора данных Driving Monitoring Dataset: фронтальный вид лица, боковой вид верхней части тела и крупный план рук. Вместе эти углы делают систему более устойчивой, когда лицо частично скрыто очками, ярким солнечным светом, смазыванием от движения или поворотами головы.

Более умное обнаружение «под капотом»
За кулисами система состоит из двух основных частей. Сначала быстрый детектор объектов под названием YOLOv11n* находит водителя в каждом кадре, чтобы AlphaPose мог точно отметить ключевые точки тела. Авторы улучшают этот детектор с помощью специального гибридного пула-блока, который помогает сети понимать как общий контекст, так и мелкие детали, такие как глаза и пальцы. Затем позиции и показатели уверенности всех отслеживаемых точек подаются в сеть Long Short-Term Memory (LSTM) — тип модели, хорошо работающий с последовательностями. LSTM учится тому, как сочетания изменений глаз, рта, головы и рук разворачиваются во времени при состоянии бодрствования, легкой усталости или сильной утомлённости, и выдаёт вероятности каждого уровня усталости для текущего временного окна.
Насколько хорошо система работает на практике
Команда тестировала подход на большом публичном наборе видеозаписей из автомобилей, обучая и оценивая модели на тысячах размеченных изображений и клипов. По сравнению с несколькими ведущими методами глубокого обучения, включая другие сочетания сверточных сетей, трансформеров и LSTM, предложенная схема AlphaPose*–LSTM показала наивысшие зарегистрированные точности, precision и F1-метрики при классификации уровней усталости. Она также работала достаточно быстро для близкого к реальному времени использования: после обработки первых 20 кадров новые оценки усталости можно обновлять примерно каждые 48 миллисекунд, что подходит для непрерывного мониторинга в движущихся автомобилях.
Что это значит для повседневного вождения
Проще говоря, исследование показывает, что автомобиль может использовать камеры и интеллектуальное ПО для обнаружения типичных признаков уставшего водителя, объединяя небольшие изменения в глазах, рте, голове и руках в надёжную картину бдительности. Хотя текущая система настроена на дневные условия и потребовала бы доработки для ночного времени или других окружений, результаты указывают на то, что бесконтактный мониторинг на основе видео может стать практичной функцией безопасности. Раннее распознавание усталости и побуждение водителя сделать перерыв могли бы помочь предотвратить многие аварии, происходящие из-за того, что человек слишком устал, чтобы оставаться полностью бодрствующим за рулём.
Цитирование: Hao, Y., Sun, X., Liu, H. et al. A fatigue driving detection method based on driver posture and facial state analysis. Sci Rep 16, 15159 (2026). https://doi.org/10.1038/s41598-026-44994-4
Ключевые слова: усталость водителя, вождение в сонном состоянии, мониторинг водителя, компьютерное зрение, безопасность на дороге