Clear Sky Science · es

Un conjunto de datos de sonidos de insectos de 459 especies para el aprendizaje automático bioacústico

· Volver al índice

Escuchando el mundo oculto de los insectos

Muchos de los sonidos de la “pequeña mayoría” de la naturaleza no proceden de aves o ranas, sino de insectos: grillos que chirrían, saltamontes que raspan y cigarras que zumban. Mientras los científicos se apresuran por entender si las poblaciones de insectos están colapsando a nivel mundial, estos sonidos podrían ofrecer pistas vitales. Pero convertir un coro global de chasquidos y zumbidos en datos fiables requiere ordenadores capaces de reconocer especies de insectos por oído, algo que hasta ahora se ha visto limitado por la falta de datos de entrenamiento adecuados. Este estudio presenta una colección grande y cuidadosamente curada de grabaciones de insectos diseñada para desbloquear ese potencial.

Figure 1
Figure 1.

Por qué importan las canciones de los insectos

Los insectos son esenciales para los ecosistemas, sin embargo las evidencias sugieren que muchas especies están en declive. El monitoreo tradicional —capturar insectos con trampas o muestrear visualmente— es lento, laborioso y cubre solo una fracción de la diversidad mundial. El sonido ofrece otra vía. Muchos saltamontes, grillos y cigarras producen cantos específicos de especie que se propagan a distancia y pueden ser capturados por grabadores pequeños y baratos. Si los ordenadores pudieran emparejar de forma fiable esos cantos con especies, científicos e incluso ciudadanos podrían monitorizar la diversidad de insectos a través de continentes con una perturbación mínima.

Construyendo una biblioteca sonora global

Los autores reunieron un nuevo conjunto de datos llamado InsectSet459, que contiene 26.298 archivos de audio —unos 9,5 días de sonido— de 459 especies de insectos. La mayoría pertenecen a dos grupos muy vocales: Orthoptera (saltamontes, grillos y parientes) y Cicadidae (cigarras). En lugar de grabar ellos mismos estos insectos, el equipo recurrió a tres plataformas abiertas importantes: xeno-canto, iNaturalist y BioAcoustica. Estos sitios alojan grabaciones etiquetadas por especie tanto de expertos como de naturalistas ciudadanos de todo el mundo, lo que los convierte en fuentes ricas de material bruto. Los investigadores descargaron solo grabaciones con identificaciones de especie confirmadas y licencias abiertas, estandarizaron y recortaron los archivos preservando tanta diversidad acústica como fue posible.

Limpiando el ruido

Simplemente recopilar miles de grabaciones no basta; un conjunto de datos para aprendizaje automático debe también evitar trampas ocultas. El equipo realizó una extensa “desduplicación”, eliminando subidas repetidas del mismo archivo de audio, incluso cuando aparecían bajo diferentes nombres de usuario o en distintas plataformas. Limitaron cada especie a grabaciones de tiempos y lugares distintos, recortaron archivos largos en segmentos de dos minutos, convirtieron formatos poco comunes y aseguraron que cada especie tuviera al menos diez grabaciones separadas. A diferencia de muchos conjuntos de datos de audio, optaron por no forzar todos los archivos a una única tasa de muestreo. Los insectos a menudo producen llamadas de tono alto o incluso ultrasónicas, por lo que preservar las tasas de grabación originales —que van de 8 a 500 kilohertz— mantiene detalles importantes que de otro modo podrían perderse.

Figure 2
Figure 2.

Poniendo los datos a prueba

Para demostrar que InsectSet459 es realmente útil para el reconocimiento automático, los autores entrenaron dos modelos de aprendizaje profundo de última generación desarrollados originalmente para tareas de sonido e imagen. Ambos modelos convirtieron el audio en representaciones visuales de la energía sonora en el tiempo y la frecuencia, y luego aprendieron a asociar esos patrones con especies. Probados en grabaciones no vistas, distinguieron correctamente las especies con un éxito moderado en general: alrededor de un 57% en una medida estricta que equilibra detecciones fallidas y falsas alarmas, y más del 70% de precisión simple. El rendimiento fue especialmente alto —a menudo por encima del 80%— para especies con muchas grabaciones. Cayó bruscamente para especies representadas por solo unos pocos ejemplos, y para aquellas cuyas llamadas se encuentran fuera del rango de frecuencias enfatizado en las características de los modelos.

Qué significa esto de cara al futuro

Aunque estos primeros modelos están lejos de ser perfectos, especialmente para especies raras y emisores de tono muy alto, los resultados muestran que un único conjunto de datos bien curado ya puede impulsar un reconocimiento automático útil de cientos de especies de insectos. InsectSet459 está pensado como una base: un banco de pruebas realista y desafiante para experimentar con nuevas formas de representar el sonido, manejar múltiples tasas de muestreo y tratar con datos naturalmente desiguales. A medida que los investigadores refinen los algoritmos —potencialmente incorporando información ultrasónica, mejor aumento de datos y ajuste fino específico por región— este conjunto de datos podría ayudar a convertir el coro nocturno de chirridos y zumbidos en un sistema de monitoreo global y sensible de la biodiversidad de insectos.

Cita: Faiß, M., Ghani, B. & Stowell, D. A dataset of insect sounds from 459 species for bioacoustic machine learning. Sci Data 13, 499 (2026). https://doi.org/10.1038/s41597-026-07123-4

Palabras clave: bioacústica de insectos, monitoreo de la biodiversidad, aprendizaje automático, conjuntos de datos acústicos, ciencia ciudadana