Clear Sky Science · sv

En datamängd med insektljud från 459 arter för bioakustisk maskininlärning

· Tillbaka till index

Att lyssna på insekternas dolda värld

Många av ljuden från naturens ”lilla majoritet” kommer inte från fåglar eller grodor, utan från insekter: syrsor som kvittrar, gräshoppor som raspas och cikador som surrar. När forskare tävlar om att förstå om insektsbestånd kollapsar globalt kan dessa ljud ge viktiga ledtrådar. Men för att omvandla en global kör av klick och surr till hårda data krävs datorer som kan känna igen insektarter på hörseln — något som hindrats av brist på lämplig träningsdata. Denna studie presenterar en stor, noggrant kurerad samling insektinspelningar avsedd att låsa upp den potentialen.

Figure 1
Figure 1.

Varför insektsångar spelar roll

Insekter är avgörande för ekosystemen, ändå tyder bevis på att många arter minskar i antal. Traditionell övervakning — att fånga insekter i fällor eller inventera med ögon — är långsam, arbetsintensiv och täcker bara en bråkdel av världens artrikedom. Ljud erbjuder en annan väg. Många gräshoppor, syrsor och cikador producerar artspecifika sånger som färdas långt och kan fångas av små, billiga inspelare. Om datorer pålitligt kunde matcha dessa sånger till arter skulle forskare och även medborgarforskare kunna övervaka insektdiversitet över kontinenter med minimal störning.

Att bygga ett globalt ljudbibliotek

Författarna satte ihop en ny datamängd kallad InsectSet459, som innehåller 26 298 ljudfiler — ungefär 9,5 dagars ljud — från 459 insektarter. De flesta tillhör två högljudda grupper: Orthoptera (gräshoppor, syrsor och släktingar) och Cicadidae (cikador). I stället för att själva spela in insekterna utnyttjade teamet tre stora öppna plattformar: xeno-canto, iNaturalist och BioAcoustica. Dessa webbplatser värd för artmärkta inspelningar från både experter och medborgarforskare över hela världen, vilket gör dem till rika källor för råmaterial. Forskarna laddade endast ner inspelningar med bekräftade artidentifieringar och öppna licenser, standardiserade och kapade filerna och bevarade så mycket akustisk mångfald som möjligt.

Rensa bort bruset

Att helt enkelt samla tusentals inspelningar räcker inte; en maskininlärningsdatamängd måste också undvika dolda fallgropar. Teamet utförde omfattande ”deduplicering”, tog bort upprepade uppladdningar av samma ljudfil, även när de dök upp under olika användarnamn eller på olika plattformar. De begränsade varje art till inspelningar från skilda tider och platser, kapade långa filer till tvåminutssegment, konverterade ovanliga format och säkerställde att varje art hade minst tio separata inspelningar. Till skillnad från många ljuddatamängder valde de att inte tvinga alla filer till en enda samplingsfrekvens. Insekter producerar ofta högfrekventa eller till och med ultraljudsläten, så att bevara de ursprungliga inspelningshastigheterna — som varierar från 8 till 500 kilohertz — behåller viktiga detaljer som annars skulle gå förlorade.

Figure 2
Figure 2.

Sätta datan på prov

För att visa att InsectSet459 verkligen är användbar för automatisk igenkänning tränade författarna två toppmoderna djupa neurala nät som ursprungligen utvecklats för ljud- och bilduppgifter. Båda modellerna omvandlade ljudet till bildliknande representationer av ljudenergi över tid och frekvens, och lärde sig sedan att associera dessa mönster med arter. Testade på osett material skilde de art med måttlig framgång överlag: ungefär 57 % på ett strikt mått som balanserar missade träffar och falsklarm, och över 70 % enkel noggrannhet. Prestandan var särskilt stark — ofta över 80 % — för arter med många inspelningar. Den sjönk kraftigt för arter representerade av bara ett fåtal exempel, och för dem vars läten ligger utanför det frekvensområde som modellerna betonade i sina funktioner.

Vad detta betyder framöver

Även om dessa tidiga modeller är långt ifrån perfekta, särskilt för sällsynta arter och mycket högfrekventa läten, visar resultaten att en enda välkurerad datamängd redan kan driva användbar automatisk igenkänning av hundratals insektarter. InsectSet459 är tänkt som en grund: en realistisk, utmanande testbädd för att experimentera med nya sätt att representera ljud, hantera flera samplingsfrekvenser och hantera naturligt ojämn data. När forskare förfinar algoritmer — potentiellt genom att inkorporera ultraljudsinformation, bättre dataaugmentering och regionsspecifik finjustering — kan denna datamängd hjälpa till att omvandla nattens kör av kvitter och surr till ett känsligt, globalt övervakningssystem för insektsmångfald.

Citering: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Nyckelord: insektsbioakustik, övervakning av biologisk mångfald, maskininlärning, akustiska datamängder, medborgarforskning