Clear Sky Science · ru

Модели MobileNetV2 с механизмом внимания для надёжного обнаружения и классификации лесных пожаров

· Назад к списку

Почему быстрые тревоги о пожаре имеют значение

Во всём мире лесные пожары становятся горячее, масштабнее и дороже в тушении. Минуты могут решить, превратится ли небольшой, локализуемый очаг в региональную катастрофу, наносящую урон экосистемам, заполняющую города дымом и обходящуюся в миллиарды долларов. В этом исследовании изучается, как компактные модели искусственного интеллекта (ИИ) могут обнаруживать самые ранние признаки лесных пожаров на обычных фотографиях и в видео достаточно быстро, чтобы работать на дронах, охранных камерах и маломощных датчиках, размещённых в уязвимых ландшафтах.

Figure 1
Figure 1.

Наблюдение за лесом с помощью «умных» камер

Традиционные пожарные вышки и операторы, просматривающие видеопотоки, с трудом справляются с мониторингом обширных лесных территорий, особенно ночью или в условиях дыма и тумана. Авторы решают эту проблему, сведя обнаружение лесных пожаров к простому вопросу «да или нет»: содержит ли это изображение огонь или нет? Они собрали сбалансированную коллекцию из 5 121 снимка с изображениями как с огнём, так и без него, взятыми из лесов, городов и промышленных зон, снятыми днём, ночью и через дым или туман. Тщательно сбалансировав набор данных и проверив метки вручную, авторы стремятся научить ИИ распознавать настоящие пламени в природных условиях, а не только идеализированные лабораторные примеры.

Компактный ИИ, созданный для поля

Многие мощные системы распознавания изображений слишком тяжёлы для работы на небольших компьютерах внутри дронов или недорогих камер видеонаблюдения. Чтобы обойти эту проблему, исследование опирается на MobileNetV2 — семейство нейронных сетей, разработанных для быстрой и экономной работы с памятью. Первая модель, названная Att-MobileNetV2, добавляет механизм «внимания», который помогает сети сосредоточиться на характерных цветах, текстурах и контурах пламени, игнорируя помехи вроде ярких облаков или освещённых зданий. Вторая модель, MobileNetV2-TL, использует перенос обучения: она повторно использует визуальные навыки, выученные на миллионах общих фотографий, и обучает лишь небольшую, специфичную для задачи голову для различения «огонь/не огонь», что сохраняет низкое время и энергопотребление при обработке.

Figure 2
Figure 2.

Обучение в жестких реальных условиях

Чтобы смоделировать запутанные условия реального мониторинга пожаров, исследователи сделали больше, чем просто собрали разнообразные изображения. Они также применяли управляемые искажения к каждому обучающему кадру — такие как небольшие повороты, отражения и изменения яркости или контраста — чтобы симулировать разные углы съёмки и освещение. Обе модели затем обучались и оценивались по одним и тем же правилам, с использованием стандартных метрик, таких как точность, precision и recall, а также контролируя, как часто они пропускают пожары или поднимают ложные тревоги. Att-MobileNetV2 достигает точности примерно 99,6%, тогда как MobileNetV2-TL — около 98,4%. Существенно то, что эти результаты достигнуты при наличии всего лишь нескольких миллионов параметров и долей миллиарда операций на изображение, что позволяет принимать решения всего за 10–12 миллисекунд на одном графическом процессоре.

Лучше больших систем с меньшими ресурсами

Обе компактные модели были сопоставлены с классическими методами машинного обучения и более сложными глубокими сетями. При одинаковых условиях обучения и тестирования Att-MobileNetV2 обеспечивает наилучший общий баланс между правильными обнаружениями огня и корректными решениями «всё в порядке», тогда как MobileNetV2-TL демонстрирует особенно высокий recall, то есть редко пропускает реальные пожары — важное качество для систем раннего оповещения. Ансамбль, объединяющий обе модели, показывает ещё небольшое улучшение, что указывает на комплементарность их способов «видеть» сцену. Тесты на независимом публичном наборе данных свидетельствуют о том, что модели сохраняют высокую производительность на новых изображениях, подтверждая способность обобщать за пределы обучающей выборки.

Что это значит для будущей безопасности от пожаров

Проще говоря, работа показывает, что небольшие эффективные модели ИИ могут ранним и надёжным образом обнаруживать лесные пожары, даже запущенные на скромном оборудовании, установленном на дронах, вышках или придорожных камерах. Используя внимание для фокусировки на нужных частях изображения и перенос обучения для повторного использования ранее выученных визуальных навыков, предложенные системы достигают точности, сопоставимой или превосходящей более тяжёлые модели. Несмотря на то что проблемы остаются в самых густых туманах, подход указывает путь к сети недорогих «умных» датчиков, которые могут поднимать тревогу раньше, помогая пожарным действовать быстрее и потенциально предотвращая превращение небольших искр в катастрофические лесные пожары.

Цитирование: Ul Haq, I., Husnain, G., Iqbal, A. et al. Attention-enhanced MobileNetV2 models for robust forest fire detection and classification. Sci Rep 16, 4805 (2026). https://doi.org/10.1038/s41598-026-35207-z

Ключевые слова: обнаружение лесных пожаров, мониторинг пожаров, глубокое обучение, edge AI, компьютерное зрение