Clear Sky Science · pl

Zestaw danych dźwięków owadów z 459 gatunków do uczenia maszynowego w bioakustyce

· Powrót do spisu

Wsłuchiwanie się w ukryty świat owadów

Wiele dźwięków „małej większości” przyrody nie pochodzi od ptaków czy żab, lecz od owadów: ćwierkające świerszcze, tarczące koniki polne i brzęczące cykady. W miarę jak naukowcy ścigają się, by ustalić, czy populacje owadów masowo spadają, te dźwięki mogą dostarczyć kluczowych wskazówek. Jednak zamiana globalnego chóru kliknięć i brzęczeń w twarde dane wymaga komputerów potrafiących rozpoznawać gatunki po dźwięku — a hamuje to brak odpowiednich danych treningowych. To badanie przedstawia dużą, starannie wyselekcjonowaną kolekcję nagrań owadów, zaprojektowaną tak, by odblokować ten potencjał.

Figure 1
Rysunek 1.

Dlaczego pieśni owadów mają znaczenie

Owady są niezbędne dla ekosystemów, a jednak dane sugerują, że wiele gatunków ulega regresji. Tradycyjne metody monitoringu — łapanie owadów w pułapki lub obserwacje wzrokowe — są powolne, pracochłonne i obejmują jedynie ułamek światowej różnorodności. Dźwięk daje inną drogę. Wiele koników polnych, świerszczy i cykad wytwarza gatunkowo specyficzne pieśni, które rozchodzą się daleko i mogą być rejestrowane przez małe, tanie rejestratory. Gdyby komputery potrafiły niezawodnie dopasowywać te pieśni do gatunków, naukowcy, a nawet uczestnicy nauki obywatelskiej, mogliby monitorować różnorodność owadów na kontynentach przy minimalnym zakłóceniu.

Budowanie globalnej biblioteki dźwięków

Autorzy zebrali nowy zestaw danych nazwany InsectSet459, zawierający 26 298 plików audio — około 9,5 dnia dźwięku — pochodzących od 459 gatunków owadów. Większość reprezentuje dwie szczególnie wokalne grupy: Orthoptera (koniki polne, świerszcze i spokrewnione) oraz Cicadidae (cykady). Zamiast nagrywać te owady samodzielnie, zespół sięgnął do trzech głównych otwartych platform: xeno-canto, iNaturalist i BioAcoustica. Serwisy te gromadzą nagrania oznaczone gatunkami, tworzone zarówno przez ekspertów, jak i naukowców obywatelskich na całym świecie, co czyni je bogatym źródłem surowca. Badacze pobrali wyłącznie nagrania z potwierdzonymi identyfikacjami gatunków i otwartymi licencjami, a następnie zunifikowali i przycięli pliki, zachowując jak najwięcej akustycznej różnorodności.

Oczyszczanie od szumów

Same tysiące nagrań to za mało; zestaw danych do uczenia maszynowego musi także unikać ukrytych pułapek. Zespół przeprowadził obszerne „usuwanie duplikatów”, eliminując powtórzone przesłania tych samych plików audio, nawet jeśli pojawiały się pod różnymi nazwami użytkowników lub na różnych platformach. Ograniczyli liczbę nagrań danego gatunku do zapisów pochodzących z odrębnych czasów i miejsc, przycinali długie pliki do dwuminutowych segmentów, konwertowali nietypowe formaty i zapewnili, że każdy gatunek ma co najmniej dziesięć odrębnych nagrań. W przeciwieństwie do wielu zbiorów audio, nie wymusili ujednolicenia wszystkich plików do jednej częstotliwości próbkowania. Owady często wydają wysokie, a nawet ultradźwiękowe sygnały, więc zachowanie oryginalnych częstotliwości nagrań — od 8 do 500 kiloherców — pozwala utrzymać ważne szczegóły, które inaczej mogłyby zostać utracone.

Figure 2
Rysunek 2.

Sprawdzanie danych w praktyce

Aby pokazać, że InsectSet459 jest rzeczywiście użyteczny do automatycznego rozpoznawania, autorzy przeszkolili dwa nowoczesne modele głębokiego uczenia, pierwotnie opracowane dla zadań dźwiękowych i obrazowych. Oba modele konwertowały dźwięk na reprezentacje przypominające obrazy pokazujące energię dźwięku w czasie i częstotliwości, a następnie uczyły się kojarzyć te wzorce z gatunkami. Testowane na niewidzianych wcześniej nagraniach, poprawnie rozróżniały gatunki z umiarkowanym skutkiem ogólnie: około 57% w rygorystycznym mierniku równoważącym przeoczenia i fałszywe alarmy oraz ponad 70% prostej dokładności. Wyniki były szczególnie dobre — często powyżej 80% — dla gatunków mających wiele nagrań. Skuteczność spadała gwałtownie dla gatunków reprezentowanych przez zaledwie kilka przykładów oraz dla tych, których sygnały mieszczą się poza zakresem częstotliwości uwzględnianym w cechach modeli.

Co to oznacza na przyszłość

Chociaż te wczesne modele są dalekie od doskonałości, zwłaszcza dla rzadkich gatunków i bardzo wysokotonowych sygnałów, wyniki pokazują, że pojedynczy, dobrze skuratorowany zestaw danych może już zasilać użyteczne automatyczne rozpoznawanie setek gatunków owadów. InsectSet459 ma służyć jako podstawa: realistyczne, wymagające pole doświadczalne do eksperymentów z nowymi sposobami reprezentacji dźwięku, obsługi wielu częstotliwości próbkowania i radzenia sobie z naturalnie nierównymi danymi. W miarę jak badacze udoskonalą algorytmy — potencjalnie włączając informacje ultradźwiękowe, lepszą augmentację danych i dostrajanie regionowe — ten zestaw danych może pomóc przekształcić nocny chór ćwierknięć i brzęczeń w czuły, globalny system monitorowania bioróżnorodności owadów.

Cytowanie: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Słowa kluczowe: bioakustyka owadów, monitorowanie bioróżnorodności, uczenie maszynowe, zbiory danych akustycznych, nauka obywatelska