Clear Sky Science · it

Un set di dati di suoni di insetti di 459 specie per il machine learning bioacustico

· Torna all'indice

Ascoltare il mondo nascosto degli insetti

Molti dei suoni della «piccola maggioranza» della natura non provengono da uccelli o rane, ma dagli insetti: grilli che trillano, cavallette che raschiano e cicale che ronzano. Mentre gli scienziati cercano di capire se le popolazioni di insetti stanno collassando a livello globale, questi suoni potrebbero fornire indizi vitali. Ma trasformare un coro mondiale di clic e ronzii in dati concreti richiede computer capaci di riconoscere le specie di insetti all’orecchio—un obiettivo frenato dalla mancanza di dati di addestramento adeguati. Questo studio presenta una grande raccolta di registrazioni di insetti, curata con attenzione, pensata per sbloccare quel potenziale.

Figure 1
Figure 1.

Perché le «canzoni» degli insetti contano

Gli insetti sono essenziali per gli ecosistemi, eppure le prove suggeriscono che molte specie sono in declino. Il monitoraggio tradizionale—catturare insetti nelle trappole o osservarli visivamente—è lento, richiede molto lavoro e copre solo una frazione della biodiversità mondiale. Il suono offre un’altra via. Molte cavallette, grilli e cicale producono canti specifici per specie che si propagano lontano e possono essere catturati con registratori piccoli ed economici. Se i computer potessero associare in modo affidabile questi canti alle specie, ricercatori e persino scienziati cittadini potrebbero monitorare la diversità degli insetti attraverso i continenti con disturbo minimo.

Costruire una libreria sonora globale

Gli autori hanno assemblato un nuovo set di dati chiamato InsectSet459, contenente 26.298 file audio—circa 9,5 giorni di suono—di 459 specie di insetti. La maggior parte appartiene a due gruppi molto vocali: Orthoptera (cavallette, grilli e affini) e Cicadidae (cicale). Piuttosto che registrare questi insetti direttamente, il team ha attingendo a tre grandi piattaforme aperte: xeno-canto, iNaturalist e BioAcoustica. Questi siti ospitano registrazioni etichettate per specie sia di esperti sia di scienziati cittadini in tutto il mondo, rendendoli fonti ricche di materiale grezzo. I ricercatori hanno scaricato solo registrazioni con identificazioni di specie confermate e licenze aperte, quindi hanno standardizzato e tagliato i file preservando quanto più possibile la diversità acustica.

Pulire il rumore

Raccogliere migliaia di registrazioni non basta; un set di dati per machine learning deve anche evitare insidie nascoste. Il team ha eseguito una estesa «deduplicazione», rimuovendo caricamenti ripetuti dello stesso file audio, anche quando apparivano sotto nomi utente diversi o su piattaforme differenti. Hanno limitato ogni specie a registrazioni provenienti da tempi e luoghi distinti, hanno tagliato i file lunghi in segmenti di due minuti, convertito formati poco comuni e garantito che ogni specie avesse almeno dieci registrazioni separate. A differenza di molti set audio, hanno scelto di non forzare tutti i file a una singola frequenza di campionamento. Gli insetti spesso producono richiami ad alta frequenza o persino ultrasonici, quindi preservare le frequenze di registrazione originali—che vanno da 8 a 500 kilohertz—mantiene dettagli importanti che altrimenti andrebbero persi.

Figure 2
Figure 2.

Mettere i dati alla prova

Per dimostrare che InsectSet459 è veramente utile per il riconoscimento automatico, gli autori hanno addestrato due modelli di deep learning allo stato dell’arte originariamente sviluppati per compiti sonori e visivi. Entrambi i modelli hanno convertito l’audio in rappresentazioni simili a immagini dell’energia sonora nel tempo e in frequenza, quindi hanno imparato ad associare questi schemi alle specie. Testati su registrazioni mai viste, hanno distinto correttamente le specie con un successo moderato complessivo: circa il 57% secondo una misura rigorosa che bilancia omissioni e falsi allarmi, e oltre il 70% di accuratezza semplice. Le prestazioni sono state particolarmente solide—spesso oltre l’80%—per le specie con molte registrazioni. Sono calate nettamente per le specie rappresentate da pochi esempi e per quelle i cui richiami si collocano al di fuori dell’intervallo di frequenze enfatizzato nelle caratteristiche dei modelli.

Cosa significa per il futuro

Sebbene questi primi modelli siano lontani dalla perfezione, specialmente per le specie rare e per i chiamanti ad altissima frequenza, i risultati mostrano che un unico set di dati ben curato può già alimentare un riconoscimento automatico utile per centinaia di specie di insetti. InsectSet459 è pensato come una base: un banco di prova realistico e sfidante per sperimentare nuovi modi di rappresentare il suono, gestire frequenze di campionamento multiple e trattare dati naturalmente dispari. Man mano che i ricercatori affineranno gli algoritmi—incorporando potenzialmente informazioni ultrasoniche, migliori tecniche di data augmentation e messa a punto specifica per regione—questo set di dati potrebbe aiutare a trasformare il coro notturno di trilli e ronzii in un sistema di monitoraggio sensibile e globale della biodiversità degli insetti.

Citazione: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Parole chiave: bioacustica degli insetti, monitoraggio della biodiversità, machine learning, set di dati acustici, scienza dei cittadini