Clear Sky Science · de

Ein Datensatz von Insektenlauten aus 459 Arten für bioakustisches Maschinelles Lernen

· Zurück zur Übersicht

Dem verborgenen Reich der Insekten lauschen

Viele der Geräusche der natürlichen „kleinen Mehrheit“ stammen nicht von Vögeln oder Fröschen, sondern von Insekten: zirpende Grillen, schabende Heuschrecken und surrende Zikaden. Während Forschende versuchen herauszufinden, ob Insektenpopulationen weltweit zusammenbrechen, könnten diese Laute wichtige Hinweise liefern. Aus einem globalen Chor von Klicks und Summen jedoch harte Daten zu machen, erfordert Computer, die Insektenarten am Ohr erkennen können – etwas, das bislang durch das Fehlen geeigneter Trainingsdaten gebremst wurde. Diese Studie stellt eine große, sorgfältig kuratierte Sammlung von Insektenaufnahmen vor, die dieses Potenzial erschließen soll.

Figure 1
Figure 1.

Warum Insektengesänge wichtig sind

Insekten sind für Ökosysteme unverzichtbar, doch Hinweise deuten darauf hin, dass viele Arten zurückgehen. Traditionelle Überwachung – Insekten mit Fallen fangen oder per Sichtbestimmung erfassen – ist langsam, arbeitsintensiv und erfasst nur einen Bruchteil der weltweiten Vielfalt. Tonaufnahmen bieten einen anderen Weg. Viele Heuschrecken, Grillen und Zikaden produzieren artspezifische Gesänge, die weit tragen und von kleinen, preiswerten Aufnahmegeräten erfasst werden können. Könnten Computer diese Gesänge verlässlich Arten zuordnen, könnten Forschende und auch Citizen Scientists die Insektenvielfalt kontinental mit minimaler Störung überwachen.

Aufbau einer globalen Klangbibliothek

Die Autorinnen und Autoren stellten einen neuen Datensatz namens InsectSet459 zusammen, der 26.298 Audiodateien enthält – etwa 9,5 Tage Tonmaterial – aus 459 Insektenarten. Die meisten gehören zu zwei besonders vokalen Gruppen: Orthoptera (Heuschrecken, Grillen und Verwandte) und Cicadidae (Zikaden). Statt selbst zu filmen, griff das Team auf drei große offene Plattformen zurück: xeno-canto, iNaturalist und BioAcoustica. Diese Webseiten hosten artbeschriftete Aufnahmen sowohl von Expertinnen und Experten als auch von Citizen Scientists weltweit und sind daher reich an Rohmaterial. Die Forschenden luden nur Aufnahmen mit bestätigten Artenbestimmungen und offenen Lizenzen herunter, standardisierten und kürzten die Dateien und bewahrten dabei so viel akustische Vielfalt wie möglich.

Rauschen bereinigen

Allein Tausende von Aufnahmen zu sammeln reicht nicht; ein Datensatz für maschinelles Lernen muss auch versteckte Fallstricke vermeiden. Das Team führte eine umfassende „Duplikatbeseitigung“ durch und entfernte wiederholte Hochladungen derselben Audiodatei, selbst wenn sie unter verschiedenen Benutzernamen oder auf unterschiedlichen Plattformen erschienen. Sie begrenzten jede Art auf Aufnahmen aus unterschiedlichen Zeiten und Orten, schnitten lange Dateien auf zwei-Minuten-Segmente, konvertierten ungewöhnliche Formate und stellten sicher, dass jede Art mindestens zehn separate Aufnahmen hatte. Anders als viele Audiodatensätze entschieden sie sich dagegen, alle Dateien auf eine einheitliche Abtastrate zu zwingen. Insekten erzeugen oft hochfrequente oder sogar ultraschallartige Rufe, sodass die Beibehaltung der ursprünglichen Abtastraten – von 8 bis 500 Kilohertz – wichtige Details bewahrt, die sonst verloren gingen.

Figure 2
Figure 2.

Die Daten auf die Probe stellen

Um zu zeigen, dass InsectSet459 tatsächlich für automatische Erkennung nützlich ist, trainierten die Autorinnen und Autoren zwei hochmoderne Deep-Learning-Modelle, die ursprünglich für Audio- und Bildaufgaben entwickelt wurden. Beide Modelle wandelten den Ton in bildähnliche Darstellungen von Schallenergie über Zeit und Frequenz um und lernten dann, diese Muster mit Arten zu assoziieren. Getestet an nicht gesehenen Aufnahmen unterschieden sie Arten mit moderatem Erfolg: etwa 57 % auf einer strengen Kennzahl, die verpasste Erkennungen und Fehlalarme ausgleicht, und über 70 % einfache Genauigkeit. Die Leistung war besonders gut – oft über 80 % – bei Arten mit vielen Aufnahmen. Sie fiel stark ab bei Arten, die nur durch wenige Beispiele vertreten waren, und bei solchen, deren Rufe außerhalb des Frequenzbereichs lagen, der in den Modellmerkmalen betont wurde.

Was das für die Zukunft bedeutet

Obwohl diese frühen Modelle weit davon entfernt sind, perfekt zu sein, insbesondere für seltene Arten und sehr hochfrequente Rufende, zeigen die Ergebnisse, dass ein einzelner, gut kuratierter Datensatz bereits eine nützliche automatische Erkennung von Hunderten von Insektenarten ermöglichen kann. InsectSet459 ist als Fundament gedacht: ein realistisches, herausforderndes Testfeld, um neue Wege der Klangrepräsentation, den Umgang mit mehreren Abtastraten und den Umgang mit natürlich ungleich verteilten Daten zu erproben. Wenn Forschende Algorithmen verfeinern – potenziell unter Einbeziehung ultraschallreicher Informationen, besserer Datenaugmentierung und regionsspezifischem Fein-Tuning – könnte dieser Datensatz helfen, den nächtlichen Chor aus Zirpen und Summen in ein sensibles, globales Überwachungssystem für die Insektenbiodiversität zu verwandeln.

Zitation: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Schlüsselwörter: insekten-bioakustik, Monitoring der Biodiversität, maschinelles Lernen, akustische Datensätze, Citizen Science