Clear Sky Science · ja

バイオアコースティック機械学習のための459種の昆虫音データセット

· 一覧に戻る

昆虫の隠れた世界に耳を傾ける

自然界の「小さな多数派」の音の多くは鳥やカエルではなく、昆虫から発せられます:コオロギの鳴き声、バッタのこすれる音、セミの羽ばたきのような羽音。昆虫個体数が世界的に急減しているかどうかを解明しようとする科学者たちにとって、これらの音は重要な手がかりになり得ます。しかし、クリック音やブンブンという合唱を確かなデータに変えるには、耳で種を識別できるコンピュータが必要であり、そのための適切な学習データが不足していることが障害となってきました。本研究は、その可能性を解き放つことを目的として、慎重に精選された大規模な昆虫録音コレクションを紹介します。

Figure 1
Figure 1.

なぜ昆虫の鳴き声が重要なのか

昆虫は生態系に不可欠ですが、多くの種が減少しているという証拠が示されています。従来のモニタリング——トラップで捕獲する方法や目視での調査——は遅く、労力を要し、世界の多様性のごく一部しかカバーできません。音は別の道を提供します。多くのバッタ、コオロギ、セミは種に固有の鳴き声を出し、遠くまで伝わり、小型で安価な録音機で記録できます。もしコンピュータがこれらの鳴き声を信頼できる形で種に結びつけられれば、科学者や市民科学者が最小限の影響で大陸規模の昆虫多様性を監視できるようになります。

世界的な音声ライブラリの構築

著者らはInsectSet459と呼ばれる新しいデータセットを作成しました。これは459種からの26,298個の音声ファイル、約9.5日分の音を含みます。大半は発声が多い2つの群、直翅目(バッタ、コオロギなど)とセミ科に属します。研究チームは自分たちで録音するのではなく、xeno-canto、iNaturalist、BioAcousticaという3つの主要なオープンプラットフォームを活用しました。これらのウェブサイトには、世界中の専門家や市民科学者がラベル付きで投稿した録音が蓄積されており、豊富な原材料になります。研究者たちは、種の同定が確認され、オープンライセンスが付与された録音のみをダウンロードし、できる限り音響的多様性を保ちながらファイルを標準化し、トリミングしました。

ノイズの除去

数千の録音を集めるだけでは不十分で、機械学習用のデータセットは隠れた落とし穴を避ける必要があります。チームは徹底した「重複排除」を行い、異なるユーザー名や異なるプラットフォームに同じ音声が再投稿されている場合でも繰り返しを削除しました。各種について別の時間と場所の録音に制限し、長いファイルは2分の区間に切り、稀なフォーマットを変換し、すべての種が少なくとも10件の個別録音を持つようにしました。多くの音声データセットとは異なり、全ファイルを単一のサンプルレートに統一することはしませんでした。昆虫は高周波あるいは超音波に近い鳴き声を出すことがあり、元の録音レート(8キロヘルツから500キロヘルツまで)を保持することで、失われかねない重要な細部を保持しています。

Figure 2
Figure 2.

データを実際に試す

InsectSet459が自動認識に実際に役立つことを示すため、著者らは音響・画像タスク向けに開発された最先端の深層学習モデル2種を訓練しました。両モデルは音声を時間と周波数に沿った音エネルギーの画像類似表現に変換し、これらのパターンを種と結び付けることを学びました。未知の録音でテストしたところ、全体として中程度の成功率で種を識別しました:検出漏れと誤警報のバランスをとる厳格な指標で約57%、単純な正解率では70%以上でした。録音数が多い種では性能が特に高く、しばしば80%を超えました。対照的に、例数が数例しかない種や、モデルの特徴で強調される周波数帯の外に鳴き声がある種では性能が急落しました。

今後の意義

これらの初期モデルは、稀な種や非常に高周波の発信者に対してはまだ完璧とは程遠いものの、単一の良く整備されたデータセットが既に数百種の昆虫の有用な自動認識を可能にしていることを示しています。InsectSet459は基盤として意図されています:音の表現方法、複数サンプルレートの扱い、自然に不均一なデータへの対処法を実験するための現実的で挑戦的なテストベッドです。研究者がアルゴリズムを改良し——超音波情報の取り込み、より良いデータ拡張、地域特異のファインチューニングなどを含めれば——このデータセットは夜のコーラスを感度の高い世界的な昆虫多様性監視システムへと変える手助けになる可能性があります。

引用: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

キーワード: 昆虫バイオアコースティクス, 生物多様性モニタリング, 機械学習, 音響データセット, 市民科学