Clear Sky Science · es

BarkVisionAI: Nuevo conjunto de datos para la identificación rápida de especies de árboles

· Volver al índice

Por qué importa la corteza de los árboles y las cámaras de los móviles

Cuando caminamos por un bosque, normalmente nos fijamos en las hojas, las flores o las copas elevadas de los árboles. Pero durante buena parte del año —o en bosques densos y sombríos— esas pistas faltan. Este estudio muestra que la piel rugosa y con patrón de los árboles —su corteza—, combinada con cámaras de móviles comunes y la inteligencia artificial moderna, puede convertirse en una herramienta potente para identificar rápidamente especies de árboles y vigilar la salud de los bosques en India y, potencialmente, en el resto del mundo.

Figure 1
Figure 1.

Una nueva forma de ver los bosques

Los investigadores detrás de BarkVisionAI se propusieron cubrir una importante laguna en cómo reconocemos los árboles. La mayoría de las colecciones fotográficas existentes para identificación de árboles se centran en las hojas u otras partes visibles, y los pocos conjuntos de imágenes de corteza tienden a ser pequeños, de regiones limitadas y tomados en condiciones casi idénticas. Eso dificulta que los modelos informáticos entrenados con ellos funcionen en bosques reales y desordenados. BarkVisionAI cambia eso reuniendo 156.001 fotos de corteza de 13 especies arbóreas relevantes en distintos tipos de bosque y regiones ecológicas de la India. Cada imagen es más que una foto: está vinculada a ubicación precisa, hora e información de la cámara, creando un recurso rico tanto para la ecología como para la inteligencia artificial.

Cómo se recopilaron las imágenes

Reunir tantas fotos útiles requirió una estrecha colaboración con el personal forestal y trabajo de campo adaptado en dos estados indios, Himachal Pradesh y Odisha, que juntos abarcan ocho tipos forestales principales y nueve regiones ecológicas. Guardabosques y funcionarios fueron formados para usar una plataforma digital de recogida de datos en sus teléfonos, aprendiendo a colocarse a una distancia fija del tronco, sostener la cámara perpendicular a la corteza y registrar ubicaciones con precisión. La recolección de datos se realizó de enero a diciembre de 2024, abarcando temporada seca, monzón e invierno. Las imágenes se tomaron por la mañana, tarde y noche, bajo distintas condiciones de luz y clima, y usando 315 modelos de cámara distintos de 20 fabricantes. Esta variación deliberada asegura que el conjunto de datos refleje los desafíos del mundo real al trabajar en bosques en lugar de las condiciones controladas de un laboratorio.

Convertir la realidad desordenada en una prueba justa

Los bosques reales introducen muchos sesgos sutiles: quizá una especie se fotografíe mayoritariamente con un teléfono concreto, a cierta hora del día o a una determinada altitud. Un modelo de IA ingenuo podría «hacer trampa» aprendiendo esos atajos en lugar de los verdaderos patrones de la corteza. Para evitar esa trampa, el equipo diseñó un proceso de selección cuidadoso. A partir de la colección completa, construyeron un subconjunto equilibrado de 36.400 imágenes, con exactamente 2.800 fotos por especie. Las imágenes de cada especie se distribuyeron entre niveles de altitud, estaciones, condiciones de follaje (si la copa estaba en pleno follaje o desnuda), horas del día y modelos de cámara. Estos factores se combinaron en una rejilla de gran detalle y se muestrearon las imágenes de modo que ninguna condición de iluminación, dispositivo o altitud dominara. El resultado no es solo un conjunto de datos grande, sino uno diseñado para obligar a los sistemas de IA a prestar atención a la propia corteza.

Figure 2
Figure 2.

Poner a prueba la inteligencia artificial

Con este conjunto de datos equilibrado en mano, los investigadores entrenaron varios modelos populares de reconocimiento de imágenes, incluidos conocidos redes neuronales convolucionales y un modelo moderno tipo «vision transformer». Todas las imágenes se redimensionaron a dimensiones estándar y luego se dividieron en conjuntos de entrenamiento, validación y prueba. Entre los modelos, una red conocida como ResNet50 fue la mejor, identificando correctamente las especies en aproximadamente el 87 % de las imágenes de prueba. Un examen más detallado mostró que la precisión aún caía en condiciones más difíciles —especialmente con poca luz al anochecer y en altitudes más elevadas donde los entornos son más complejos. Estos patrones confirmaron que la iluminación, la estación y la altitud son obstáculos reales para la IA, y que controlar estos factores en el conjunto de datos fue esencial para revelar dónde los modelos realmente tienen dificultades.

Qué significa esto para los bosques y las herramientas futuras

BarkVisionAI demuestra que herramientas cotidianas —un smartphone y una caminata por el bosque— pueden alimentar un sistema sofisticado para la identificación rápida de árboles. Para conservacionistas y gestores forestales, esto abre la puerta a mapeos de especies más rápidos, mejor seguimiento de la biodiversidad y una vigilancia más oportuna del cambio ambiental. Para los investigadores en IA, el conjunto de datos representa un punto de referencia exigente que captura texturas sutiles, estaciones cambiantes y dispositivos diversos, subrayando que el reconocimiento basado en la corteza está lejos de ser un problema resuelto. El mensaje principal del estudio para el público no especializado es claro: mediante el diseño cuidadoso de datos y algoritmos, podemos enseñar a las máquinas a leer las historias escritas en la corteza de los árboles, ayudándonos a entender y proteger los bosques con mayor eficacia.

Cita: Chhatre, A., Saini, N., Parmar, A.K. et al. BarkVisionAI: Novel dataset for rapid tree species identification. Sci Data 13, 343 (2026). https://doi.org/10.1038/s41597-026-06711-8

Palabras clave: identificación de árboles, monitoreo forestal, biodiversidad, visión por ordenador, bosques de India