Clear Sky Science · ru

Набор данных звуков насекомых от 459 видов для биоакустического машинного обучения

2026-03-27 · Назад к списку

Слушая скрытый мир насекомых

Многие звуки «малого большинства» природы исходят не от птиц или лягушек, а от насекомых: стрекотание сверчков, скрип кузнечиков и жужжание цикад. Пока учёные спешат понять, сокращаются ли популяции насекомых во всём мире, эти звуки могут дать важные подсказки. Но превращение глобального хора щелчков и жужжаний в надёжные данные требует вычислительных систем, способных «узнавать» виды насекомых по звуку — и этому мешает нехватка подходящих обучающих данных. В этом исследовании представлен большой, тщательно подобранный сборник записей насекомых, призванный открыть такие возможности.

Почему песни насекомых важны

Насекомые незаменимы для экосистем, однако данные указывают на снижение многих видов. Традиционный мониторинг — отлов в ловушки или визуальные обследования — медленный, трудоёмкий и охватывает лишь малую часть мировой разнообразия. Звук предлагает альтернативу. Многие кузнечики, сверчки и цикады издают видоспецифические песни, которые распространяются далеко и могут быть записаны небольшими дешёвыми устройствами. Если компьютеры смогут надёжно сопоставлять эти песни с видами, учёные и даже гражданские исследователи смогут отслеживать разнообразие насекомых на континентах с минимальным вмешательством.

Создание глобальной звуковой библиотеки

Авторы собрали новый набор данных под названием InsectSet459, включающий 26 298 аудиофайлов — примерно 9,5 дней звука — от 459 видов насекомых. Большинство относятся к двум особенно вокальным группам: Orthoptera (кузнечики, сверчки и их родственники) и Cicadidae (цикады). Вместо собственных полевых записей команда использовала три крупные открытые платформы: xeno-canto, iNaturalist и BioAcoustica. На этих сайтах хостятся помеченные видами записи от экспертов и любителей со всего мира, что делает их богатыми источниками исходного материала. Исследователи скачивали только записи с подтверждённой идентификацией видов и открытыми лицензиями, затем стандартизировали и обрезали файлы, сохраняя по возможности максимальную акустическую вариативность.

Очистка от шума

Просто собрать тысячи записей недостаточно; набор данных для машинного обучения должен также избегать скрытых проблем. Команда провела тщательную «удалённую дубликацию», исключив повторные загрузки одного и того же аудиофайла, даже если они появлялись под разными именами пользователей или на разных платформах. Они ограничили записи для каждого вида записями из разных времён и мест, обрезали длинные файлы до двухминутных сегментов, конвертировали редкие форматы и обеспечили, чтобы у каждого вида было как минимум десять отдельных записей. В отличие от многих аудио-наборов данных, они решили не приводить все файлы к одной частоте дискретизации. Насекомые часто издают высокие или даже ультразвуковые сигналы, поэтому сохранение исходных частот записи — от 8 до 500 килогерц — сохраняет важные детали, которые в противном случае могли бы быть утеряны.

Проверка пригодности данных

Чтобы показать, что InsectSet459 действительно полезен для автоматического распознавания, авторы обучили две современные глубокие модели, изначально разработанные для звуковых и визуальных задач. Обе модели преобразовывали аудио в изображенноподобные представления звуковой энергии во времени и по частоте, затем научились связывать эти шаблоны с видами. Проверенные на невидимых записях, они правильно различали виды с умерённым общим успехом: примерно 57% по строгой метрике, балансирующей пропущенные обнаружения и ложные срабатывания, и более 70% по простой точности. Особенно высокие результаты — часто выше 80% — наблюдались для видов с большим числом записей. Производительность резко падала для видов, представленных лишь несколькими примерами, а также для тех, чьи призывы находятся за пределами частотного диапазона, выделяемого в признаках моделей.

Что это значит для будущего

Хотя эти ранние модели далеки от совершенства, особенно для редких видов и очень высокочастотных источников звука, результаты показывают, что единый, хорошо подобранный набор данных уже может обеспечивать полезное автоматическое распознавание сотен видов насекомых. InsectSet459 задуман как фундамент: реалистичная и сложная тестовая платформа для экспериментов с новыми способами представления звука, обработкой нескольких частот дискретизации и работой с естественно неравномерными данными. По мере того как исследователи будут совершенствовать алгоритмы — возможно, включая ультразвуковую информацию, улучшённые методы аугментации данных и региональную донастройку — этот набор данных может помочь превратить ночной хор стрекота и жужжания в чувствительную глобальную систему мониторинга биоразнообразия насекомых.

Цитирование: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Ключевые слова: биоакустика насекомых, мониторинг биоразнообразия, машинное обучение, акустические наборы данных, гражданская наука