Clear Sky Science · pt

Um conjunto de dados de sons de insetos de 459 espécies para aprendizado de máquina bioacústico

· Voltar ao índice

Ouvindo o Mundo Oculto dos Insetos

Muitos dos sons da “pequena maioria” da natureza não vêm de aves ou sapos, mas de insetos: grilos cantando, gafanhotos raspando e cigarras zumbindo. Enquanto cientistas se empenham para entender se as populações de insetos estão colapsando globalmente, esses sons podem fornecer pistas vitais. Mas transformar um coro mundial de cliques e zumbidos em dados sólidos requer computadores capazes de reconhecer espécies de insetos pelo som — algo que tem sido limitado pela falta de dados de treinamento adequados. Este estudo apresenta uma grande coleção cuidadosamente curada de gravações de insetos projetada para desbloquear esse potencial.

Figure 1
Figure 1.

Por que as Canções dos Insetos Importam

Insetos são essenciais para os ecossistemas, e evidências sugerem que muitas espécies estão em declínio. O monitoramento tradicional — capturar insetos em armadilhas ou amostragem visual — é lento, trabalhoso e cobre apenas uma fração da diversidade mundial. O som oferece outra via. Muitos gafanhotos, grilos e cigarras produzem cantos específicos de espécie que se propagam a distância e podem ser captados por gravadores pequenos e baratos. Se computadores pudessem associar esses cantos às espécies de forma confiável, cientistas e até cientistas cidadãos poderiam monitorar a diversidade de insetos em continentes com mínima perturbação.

Construindo uma Biblioteca Global de Sons

Os autores reuniram um novo conjunto de dados chamado InsectSet459, contendo 26.298 arquivos de áudio — cerca de 9,5 dias de som — de 459 espécies de insetos. A maioria pertence a dois grupos altamente vocais: Orthoptera (gafanhotos, grilos e parentes) e Cicadidae (cigarras). Em vez de gravar esses insetos por conta própria, a equipe utilizou três grandes plataformas abertas: xeno-canto, iNaturalist e BioAcoustica. Esses sites hospedam gravações rotuladas por espécie, feitas por especialistas e por cientistas cidadãos ao redor do mundo, tornando-os fontes ricas de material bruto. Os pesquisadores baixaram apenas gravações com identificação de espécie confirmada e licenças abertas, então padronizaram e apararam os arquivos preservando o máximo de diversidade acústica possível.

Eliminando o Ruído

Simplesmente coletar milhares de gravações não é suficiente; um conjunto de dados para aprendizado de máquina também deve evitar armadilhas ocultas. A equipe realizou extensa “deduplicação”, removendo uploads repetidos do mesmo arquivo de áudio, mesmo quando apareciam sob nomes de usuário diferentes ou em plataformas distintas. Limitaram cada espécie a gravações de tempos e locais distintos, cortaram arquivos longos em segmentos de dois minutos, converteram formatos incomuns e garantiram que cada espécie tivesse pelo menos dez gravações separadas. Ao contrário de muitos conjuntos de áudio, optaram por não forçar todos os arquivos a uma única taxa de amostragem. Insetos frequentemente produzem chamados de alta frequência ou mesmo ultrassônicos, então preservar as taxas originais de gravação — variando de 8 a 500 kilohertz — mantém detalhes importantes que poderiam ser perdidos.

Figure 2
Figure 2.

Colocando os Dados à Prova

Para demonstrar que o InsectSet459 é realmente útil para reconhecimento automático, os autores treinaram dois modelos de deep learning de ponta originalmente desenvolvidos para tarefas de som e imagem. Ambos os modelos convertiam o áudio em representações semelhantes a imagens da energia sonora ao longo do tempo e da frequência, e então aprenderam a associar esses padrões às espécies. Testados em gravações não vistas, distinguiram corretamente as espécies com sucesso moderado no geral: cerca de 57% em uma medida rigorosa que equilibra detecções perdidas e alarmes falsos, e mais de 70% de acurácia simples. O desempenho foi especialmente forte — frequentemente acima de 80% — para espécies com muitas gravações. Caiu acentuadamente para espécies representadas por apenas alguns exemplos e para aquelas cujos chamados se situam fora da faixa de frequência enfatizada nas características dos modelos.

O que Isso Significa Para o Futuro

Embora esses modelos iniciais ainda estejam longe da perfeição, especialmente para espécies raras e chamadores de pitch muito alto, os resultados mostram que um único conjunto de dados bem curado já pode alimentar reconhecimento automático útil de centenas de espécies de insetos. O InsectSet459 foi pensado como uma base: um campo de testes realista e desafiador para experimentar novas formas de representar som, lidar com múltiplas taxas de amostragem e tratar dados naturalmente desiguais. À medida que pesquisadores refinarem algoritmos — potencialmente incorporando informação ultrassônica, melhor aumento de dados e ajuste fino específico por região — esse conjunto de dados pode ajudar a transformar o coro noturno de piados e zumbidos em um sistema de monitoramento sensível e global da biodiversidade de insetos.

Citação: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Palavras-chave: bioacústica de insetos, monitoramento da biodiversidade, aprendizado de máquina, conjuntos de dados acústicos, ciência cidadã