Clear Sky Science · ru
Набор данных Forest Inspection: синтетический набор изображений с БПЛА для семантической сегментации лесных сред
Почему дроны и цифровые леса важны
Здоровые леса помогают регулировать климат, защищать биоразнообразие и поддерживать средства к существованию людей, но они находятся под давлением вырубки, пожаров, вредителей и штормов. Осмотр обширных лесных территорий с земли медленен и затратен, поэтому исследователи обращаются к беспилотным летательным аппаратам (БПЛА), или дронам, чтобы наблюдать леса сверху. В этой статье представлен набор данных Forest Inspection — подробная компьютерно сгенерированная коллекция изображений с дронов, созданная для обучения систем искусственного интеллекта (ИИ) распознавать ключевые элементы лесных сцен — такие как разные типы деревьев, покрытие почвы и поваленные стволы — быстро и точно.
Виртуальный лес для внимательного наблюдения
Набор данных Forest Inspection построен в высокореалистичном виртуальном лесу, созданном на современном игровом движке. Вместо того чтобы посылать физический дрон в лес, авторы управляют смоделированным дроном по этому цифровому ландшафту. Каждое изображение, снятое дроном, снабжено идеально выровненной «картой», которая относит каждый пиксель к одной из 11 категорий, включая лиственные деревья, хвойные деревья, поваленные деревья, наземную растительность, оголённую почву, камни, небо, здания, заборы и транспортные средства. Поскольку всё смоделировано, команда может генерировать тысячи изображений без ручной разметки людьми, избегая затрат времени, денег и несогласованностей, присущих реальной аннотации.

Как выполняются синтетические облёты
Чтобы имитировать реальные инспекционные полёты, виртуальный дрон следует классическому зигзагообразному («газонокосильному») шаблону над прямоугольным участком леса, похожему на то, как фермер пашет поле. Исследователи записывают изображения на трёх высотах полёта — 30, 50 и 80 метров — и при трёх углах наклона камеры: прямо вперёд, с наклоном вниз и строго вниз на землю. Они повторяют эти облёты в двух распространённых погодных условиях — солнечно и пасмурно — при фиксированных настройках камеры. В результате получается 18 последовательностей, содержащих более 26 000 цветных изображений и соответствующих карт меток, все сделанные в разрешении, подходящем как для научного анализа, так и для практического обучения ИИ.
Обучение компьютеров «читать» лес
Главная цель этого набора данных — обучать и тестировать системы ИИ, выполняющие «семантическую сегментацию», задачу, в которой каждый пиксель изображения классифицируется по значимой категории. Авторы запускают несколько передовых моделей сегментации на Forest Inspection, чтобы проверить, насколько метки надёжны и информативны. Современные нейросети достигают высокой точности по распространённым категориям, таким как небо, наземная растительность и два типа деревьев. Более сложные категории — особенно редкие, но важные, такие как поваленные деревья, тонкие заборы или маленькие машины — обнаруживать труднее, но продвинутые модели, учитывающие широкий контекст изображения, показывают заметно лучшие результаты. Это демонстрирует, что набор данных способен разделять сильные алгоритмы и слабые, что является ключевым свойством хорошего эталона.

Сравнение с другими наборами данных
Многие существующие аэроснимочные наборы данных включают леса, но большинство рассматривают все деревья и кустарники как единую, обобщённую категорию «растительность». Набор данных Forest Inspection идёт дальше, разделяя лиственные и хвойные деревья и явно помечая поваленные деревья, которые являются важными признаками урона от штормов, вырубки или угроз безопасности. Авторы сравнивают свою работу с известными наборами данных с дронов, охватывающими города, сельские местности или смешанные природные сцены. Те коллекции зачастую больше по объёму или сняты реальными камерами, но они либо объединяют типы леса, либо не содержат классов, связанных с повреждениями. Forest Inspection ориентирован прямо на инспекционные задачи: его контролируемые шаблоны полёта, средний масштаб, сбалансированный уровень детализации и метки, сфокусированные на лесах, делают его особенно пригодным для изучения того, как дроны могут мониторить лесные ландшафты.
От цифровых рощ к реальным лесам
Поскольку изображения синтетические, естественный вопрос — могут ли ИИ, обученные на них, помочь в реальном мире. Чтобы проверить это, авторы сначала обучают модель сегментации только на виртуальном лесу, а затем дообучают её на реальном наборе данных, собранном над настоящими лесами. Модель, начавшая обучение с синтетических данных, показывает лучшие результаты, чем модель, обученная только на реальных данных, особенно для покрова почвы, деревьев, голой земли и припаркованных автомобилей. Это позволяет предположить, что тщательно спроектированные цифровые леса могут служить мощным «вводным уроком» для ИИ, который затем можно уточнить с помощью меньших объёмов реальных изображений.
Что это значит для ухода за лесами
Для неспециалистов ключевой посыл в том, что эта работа предоставляет высококачественную, свободно доступную тренировочную площадку, где компьютеры могут научиться «читать» леса с воздуха с исключительной точностью. Отличая не только местоположение деревьев, но и их тип и состояние — стоят они или повалены — набор данных Forest Inspection поддерживает более умные инструменты для отслеживания здоровья лесов, выявления повреждений и планирования охраны. Хотя он полностью рожден в виртуальном мире, он призван помочь настоящим дронам и реальным людям лучше следить за лесами планеты.
Цитирование: Blaga, BCZ., Nedevschi, S. Forest Inspection Dataset: A Synthetic UAV Dataset for Semantic Segmentation of Forest Environments. Sci Data 13, 298 (2026). https://doi.org/10.1038/s41597-026-06665-x
Ключевые слова: мониторинг лесов, снимки с дронов, синтетический набор данных, семантическая сегментация, дистанционное зондирование