Clear Sky Science · pt

Detecção da morfologia de corais em imagens subaquáticas usando YOLOv12 com fusão de CNN e codificador transformer

· Voltar ao índice

Por que as formas dos corais importam para todos nós

Recifes de coral são mais do que cenários subaquáticos bonitos; suas formas ajudam a determinar o quão bem protegem a costa, abrigam a vida marinha e sustentam a pesca e o turismo. Acompanhar como essas formas mudam ao longo do tempo é fundamental para entender a saúde dos recifes em um oceano que aquece e se polui. Este estudo apresenta uma nova maneira de identificar automaticamente diferentes formas de crescimento de corais em fotos subaquáticas, ajudando cientistas a monitorar a condição dos recifes de forma mais rápida e confiável.

Desafios para enxergar claramente debaixo d’água

O monitoramento de recifes há muito depende de mergulhadores que rotulam fotos manualmente, um processo lento, caro e sujeito a julgamentos pessoais. Imagens subaquáticas são difíceis para computadores interpretarem porque a luz é absorvida e espalhada, as cores mudam e partículas suspensas ocultam detalhes finos. Diferentes formas de crescimento de coral, como ramificadas, maciças e em placas, podem parecer confusas em água turva. Ferramentas anteriores de inteligência artificial frequentemente têm dificuldade nessas condições, deixando de detectar colônias pequenas, confundindo formas semelhantes ou rodando devagar demais para uso em tempo real por robôs de pesquisa.

Figure 1. Como a IA ajuda a identificar diferentes formas de corais em cenas subaquáticas turvas para acelerar o monitoramento de recifes.
Figure 1. Como a IA ajuda a identificar diferentes formas de corais em cenas subaquáticas turvas para acelerar o monitoramento de recifes.

Um olho digital mais inteligente para os recifes

Os pesquisadores partem de uma família popular de detectores rápidos de objetos conhecida como YOLO, usando a versão mais recente, YOLOv12, como base. Eles adicionam dois componentes complementares: um tipo de rede que se destaca ao captar texturas e bordas locais e outro que identifica o padrão mais amplo da cena. O primeiro componente, uma Rede Neural Convolucional, captura detalhes visuais finos, como pequenos ramos de coral e padrões de superfície. O segundo, chamado codificador transformer, analisa a imagem inteira para entender como as colônias se organizam e se destacam de rochas, areia ou algas. Um módulo de fusão especial então combina esses sinais locais e globais para que o sistema reconheça diferenças sutis entre as formas de coral.

Como o sistema aprende as formas dos corais

Para treinar e testar o modelo, a equipe usa uma coleção pública de imagens subaquáticas que inclui várias morfologias-chave de coral: ramificada, massiva e tabular. As imagens são redimensionadas e aprimoradas, e uma variedade de alterações de cor e geométricas é aplicada para que o modelo veja muitas versões da mesma cena, simulando mudanças reais em profundidade, iluminação e turbidez da água. Dentro do detector, recursos são processados em múltiplas escalas para que tanto pontas pequenas quanto colônias grandes possam ser encontradas. A informação fundida então segue para uma etapa de detecção que gera caixas delimitadoras ao redor das colônias e atribui a cada uma uma categoria de forma de crescimento.

O que os resultados mostram

O modelo fundido, chamado YOLOv12-CT, é testado contra uma gama de sistemas de detecção conhecidos, incluindo versões anteriores do YOLO, detectores clássicos de deep learning e projetos mais novos baseados em transformers. Em medidas padrão de desempenho — como quantas colônias são encontradas, com que frequência os rótulos estão corretos e quão precisamente seus contornos são posicionados — o novo método se destaca. Ele atinge alta média de Precisão (mAP) em limiares típicos de avaliação, superando todos os modelos de comparação enquanto mantém tempos de processamento adequados para uso quase em tempo real. O sistema mostra-se especialmente forte ao reconhecer corais planos e em placas, e melhora substancialmente a detecção de formas ramificadas mais intrincadas, que normalmente são as mais difíceis de distinguir em água turva.

Figure 2. Como um modelo de IA combina detalhes finos dos corais e padrões gerais da cena para classificar colônias segundo sua forma de crescimento.
Figure 2. Como um modelo de IA combina detalhes finos dos corais e padrões gerais da cena para classificar colônias segundo sua forma de crescimento.

O que isso significa para a proteção dos recifes

Ao identificar com mais precisão e eficiência como os corais estão crescendo, essa abordagem facilita o acompanhamento da estrutura dos recifes, da biodiversidade e da resiliência ao longo do tempo. O método ainda enfrenta limites, como desequilíbrios nos dados de treinamento e o custo computacional adicional dos módulos transformer, e o desempenho pode variar em ambientes subaquáticos muito adversos ou desconhecidos. Ainda assim, o estudo mostra que combinar pistas texturais detalhadas com uma visão mais ampla da cena pode oferecer aos cientistas marinhos uma ferramenta poderosa para monitoramento automatizado de corais em larga escala, apoiando decisões melhores sobre conservação e restauração.

Citação: Nandal, P., Siwach, M. & Upadhyay, G.M. Coral morphology detection in underwater imagery using YOLOv12 with CNN and transformer encoder fusion. Sci Rep 16, 15426 (2026). https://doi.org/10.1038/s41598-026-42591-z

Palavras-chave: morfologia de coral, imagens subaquáticas, aprendizado profundo, detecção de objetos, monitoramento de recifes