Clear Sky Science · es

Detección de morfologías coralinas en imágenes subacuáticas usando YOLOv12 con fusión de CNN y codificador transformer

· Volver al índice

Por qué las formas del coral nos importan a todos

Los arrecifes de coral son más que un paisaje submarino atractivo; sus formas ayudan a determinar qué tan bien protegen las costas, refugian la vida marina y sostienen la pesca y el turismo. Vigilar cómo cambian estas formas coralinas a lo largo del tiempo es clave para entender la salud de los arrecifes en un océano que se calienta y contamina más. Este estudio presenta una nueva forma de detectar automáticamente diferentes formas de crecimiento del coral en fotografías subacuáticas, ayudando a los científicos a seguir la condición del arrecife de forma más rápida y fiable.

Desafíos para ver con claridad bajo el agua

El monitoreo de arrecifes ha dependido durante mucho tiempo de buceadores que etiquetan fotos manualmente, un proceso lento, costoso y sujeto al criterio individual. Las imágenes subacuáticas son difíciles de interpretar para los ordenadores porque la luz se absorbe y dispersa, los colores cambian y las partículas en suspensión ocultan detalles finos. Diferentes formas de crecimiento coralino, como ramificadas, masivas y en placas planas, pueden parecer confusamente similares en aguas turbias. Las herramientas de inteligencia artificial anteriores a menudo luchan en estas condiciones, pasando por alto colonias pequeñas, confundiendo formas parecidas o funcionando demasiado lento para uso en tiempo real en robots de muestreo.

Figure 1. Cómo la IA ayuda a distinguir distintas formas de coral en escenas subacuáticas turbias para acelerar el monitoreo de los arrecifes.
Figure 1. Cómo la IA ayuda a distinguir distintas formas de coral en escenas subacuáticas turbias para acelerar el monitoreo de los arrecifes.

Un ojo digital más inteligente para los arrecifes

Los investigadores parten de una familia popular de detectores de objetos rápidos conocida como YOLO, usando la versión más reciente, YOLOv12, como base. Añaden dos componentes complementarios: un tipo de red que sobresale en detectar texturas y bordes locales, y otra que destaca en captar la escena más amplia. El primer componente, una red neuronal convolucional, capta detalles visuales finos como diminutas ramas coralinas y patrones superficiales. El segundo, llamado codificador transformer, analiza la imagen en su conjunto para entender cómo se disponen las colonias y cómo se distinguen de rocas, arena o algas. Un módulo especial de fusión combina entonces estas señales locales y globales para que el sistema reconozca diferencias sutiles entre formas coralinas.

Cómo aprende el sistema las formas coralinas

Para entrenar y probar su modelo, el equipo emplea una colección pública de imágenes subacuáticas que incluye varias morfologías coralinas clave: ramificadas, masivas y tabulares. Las imágenes se redimensionan y mejoran, y se aplican diversos cambios de color y geométricos para que el modelo vea muchas versiones de la misma escena, emulando cambios reales en la profundidad, la iluminación y la claridad del agua. Dentro del detector, las características se procesan a múltiples escalas para que se puedan encontrar tanto puntas coralinas pequeñas como colonias grandes. La información fusionada fluye luego a una etapa de detección que genera cajas delimitadoras alrededor de las colonias y asigna a cada una una categoría de forma de crecimiento.

Qué muestran los resultados

El modelo fusionado, denominado YOLOv12-CT, se prueba frente a una variedad de sistemas de detección bien conocidos, incluidas versiones anteriores de YOLO, detectores clásicos de aprendizaje profundo y diseños más recientes basados en transformers. Según medidas estándar de rendimiento, como cuántas colonias se encuentran, con qué frecuencia las etiquetas son correctas y cuán precisas son sus delimitaciones, el nuevo método sale adelante. Logra una alta Precisión Promedio media en umbrales de evaluación habituales, superando a todos los modelos comparados y manteniendo tiempos de procesamiento adecuados para uso casi en tiempo real. El sistema resulta especialmente eficaz en reconocer corales planos en forma de placa, y mejora sustancialmente la detección de formas ramificadas más intrincadas, que suelen ser las más difíciles de distinguir en aguas turbias.

Figure 2. Cómo un modelo de IA combina detalles finos del coral y patrones generales de la escena para clasificar colonias según su forma de crecimiento.
Figure 2. Cómo un modelo de IA combina detalles finos del coral y patrones generales de la escena para clasificar colonias según su forma de crecimiento.

Qué significa esto para la protección de los arrecifes

Al identificar de forma más precisa y eficiente cómo crecen los corales, este enfoque facilita el seguimiento de la estructura del arrecife, la biodiversidad y la resiliencia a lo largo del tiempo. El método aún enfrenta limitaciones, como desequilibrios en los datos de entrenamiento y el coste computacional añadido de los módulos transformer, y su rendimiento puede variar en entornos subacuáticos muy extremos o poco familiares. Aun así, el estudio demuestra que combinar señales de textura detallada con una visión más amplia de la escena puede ofrecer a los científicos marinos una herramienta potente para el monitoreo automatizado a gran escala de corales, apoyando decisiones mejores sobre conservación y restauración.

Cita: Nandal, P., Siwach, M. & Upadhyay, G.M. Coral morphology detection in underwater imagery using YOLOv12 with CNN and transformer encoder fusion. Sci Rep 16, 15426 (2026). https://doi.org/10.1038/s41598-026-42591-z

Palabras clave: morfología coralina, imágenes subacuáticas, aprendizaje profundo, detección de objetos, monitoreo de arrecifes