Clear Sky Science · pt
Um conjunto de dados de sons de insetos de 459 espécies para aprendizado de máquina bioacústico
Ouvindo o Mundo Oculto dos Insetos
Muitos dos sons da “pequena maioria” da natureza não vêm de aves ou sapos, mas de insetos: grilos cantando, gafanhotos raspando e cigarras zumbindo. Enquanto cientistas se empenham para entender se as populações de insetos estão colapsando globalmente, esses sons podem fornecer pistas vitais. Mas transformar um coro mundial de cliques e zumbidos em dados sólidos requer computadores capazes de reconhecer espécies de insetos pelo som — algo que tem sido limitado pela falta de dados de treinamento adequados. Este estudo apresenta uma grande coleção cuidadosamente curada de gravações de insetos projetada para desbloquear esse potencial.

Por que as Canções dos Insetos Importam
Insetos são essenciais para os ecossistemas, e evidências sugerem que muitas espécies estão em declínio. O monitoramento tradicional — capturar insetos em armadilhas ou amostragem visual — é lento, trabalhoso e cobre apenas uma fração da diversidade mundial. O som oferece outra via. Muitos gafanhotos, grilos e cigarras produzem cantos específicos de espécie que se propagam a distância e podem ser captados por gravadores pequenos e baratos. Se computadores pudessem associar esses cantos às espécies de forma confiável, cientistas e até cientistas cidadãos poderiam monitorar a diversidade de insetos em continentes com mínima perturbação.
Construindo uma Biblioteca Global de Sons
Os autores reuniram um novo conjunto de dados chamado InsectSet459, contendo 26.298 arquivos de áudio — cerca de 9,5 dias de som — de 459 espécies de insetos. A maioria pertence a dois grupos altamente vocais: Orthoptera (gafanhotos, grilos e parentes) e Cicadidae (cigarras). Em vez de gravar esses insetos por conta própria, a equipe utilizou três grandes plataformas abertas: xeno-canto, iNaturalist e BioAcoustica. Esses sites hospedam gravações rotuladas por espécie, feitas por especialistas e por cientistas cidadãos ao redor do mundo, tornando-os fontes ricas de material bruto. Os pesquisadores baixaram apenas gravações com identificação de espécie confirmada e licenças abertas, então padronizaram e apararam os arquivos preservando o máximo de diversidade acústica possível.
Eliminando o Ruído
Simplesmente coletar milhares de gravações não é suficiente; um conjunto de dados para aprendizado de máquina também deve evitar armadilhas ocultas. A equipe realizou extensa “deduplicação”, removendo uploads repetidos do mesmo arquivo de áudio, mesmo quando apareciam sob nomes de usuário diferentes ou em plataformas distintas. Limitaram cada espécie a gravações de tempos e locais distintos, cortaram arquivos longos em segmentos de dois minutos, converteram formatos incomuns e garantiram que cada espécie tivesse pelo menos dez gravações separadas. Ao contrário de muitos conjuntos de áudio, optaram por não forçar todos os arquivos a uma única taxa de amostragem. Insetos frequentemente produzem chamados de alta frequência ou mesmo ultrassônicos, então preservar as taxas originais de gravação — variando de 8 a 500 kilohertz — mantém detalhes importantes que poderiam ser perdidos.

Colocando os Dados à Prova
Para demonstrar que o InsectSet459 é realmente útil para reconhecimento automático, os autores treinaram dois modelos de deep learning de ponta originalmente desenvolvidos para tarefas de som e imagem. Ambos os modelos convertiam o áudio em representações semelhantes a imagens da energia sonora ao longo do tempo e da frequência, e então aprenderam a associar esses padrões às espécies. Testados em gravações não vistas, distinguiram corretamente as espécies com sucesso moderado no geral: cerca de 57% em uma medida rigorosa que equilibra detecções perdidas e alarmes falsos, e mais de 70% de acurácia simples. O desempenho foi especialmente forte — frequentemente acima de 80% — para espécies com muitas gravações. Caiu acentuadamente para espécies representadas por apenas alguns exemplos e para aquelas cujos chamados se situam fora da faixa de frequência enfatizada nas características dos modelos.
O que Isso Significa Para o Futuro
Embora esses modelos iniciais ainda estejam longe da perfeição, especialmente para espécies raras e chamadores de pitch muito alto, os resultados mostram que um único conjunto de dados bem curado já pode alimentar reconhecimento automático útil de centenas de espécies de insetos. O InsectSet459 foi pensado como uma base: um campo de testes realista e desafiador para experimentar novas formas de representar som, lidar com múltiplas taxas de amostragem e tratar dados naturalmente desiguais. À medida que pesquisadores refinarem algoritmos — potencialmente incorporando informação ultrassônica, melhor aumento de dados e ajuste fino específico por região — esse conjunto de dados pode ajudar a transformar o coro noturno de piados e zumbidos em um sistema de monitoramento sensível e global da biodiversidade de insetos.
Citação: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4
Palavras-chave: bioacústica de insetos, monitoramento da biodiversidade, aprendizado de máquina, conjuntos de dados acústicos, ciência cidadã