Clear Sky Science · pt
Um conjunto de imagens subaquáticas para segmentação de instância de peixes sensível à oclusão
Por que contar peixes debaixo d’água é difícil
Fazendas de peixes estão se transformando em operações de alta tecnologia, onde câmeras e algoritmos vigiam silenciosamente milhares de animais. Ainda assim, uma tarefa surpreendentemente básica — simplesmente distinguir um peixe do outro em um tanque lotado — mostra-se muito difícil. Peixes nadam por cima e por baixo uns dos outros, bloqueiam a visão da câmera e aparecem apenas em fragmentos na borda da imagem. Este artigo apresenta uma nova coleção de imagens subaquáticas, o Fish Occlusion Dataset (FOD), criada para ajudar computadores a reconhecer peixes individualmente mesmo quando estão parcialmente ocultos. Essa capacidade é essencial para automatizar a alimentação, verificações de saúde e avaliação de estoque na aquicultura moderna.
Uma nova biblioteca de imagens para tanques cheios
O núcleo deste trabalho é um grande e cuidadosamente curado conjunto de fotos subaquáticas de carpa-comum (crucian carp), uma espécie comum em cultivo. Os pesquisadores filmaram 66 peixes em um tanque usando uma câmera subaquática especializada montada acima da água e então extraíram quadros estáticos dos vídeos. Após remover imagens quase duplicadas, obtiveram mais de mil imagens com um único peixe e centenas de cenas com múltiplos peixes. Cada peixe visível foi contornado manualmente ao nível de pixels individuais, dando aos computadores acesso a formas precisas em vez de caixas aproximadas. No total, o FOD contém 14.376 imagens e 144.894 peixes rotulados meticulosamente, tornando-se um dos recursos públicos mais detalhados desse tipo. 
Ensinando computadores a enxergar através da sobreposição
Para realmente testar quão bem os algoritmos lidam com aglomerações, a equipe precisava de muitos exemplos em que os peixes se sobrepõem. Traçar contornos detalhados nessas cenas é extremamente demorado, então eles adotaram um atalho inteligente. Primeiro, geraram máscaras de alta qualidade para peixes individuais. Depois, recortaram esses peixes digitalmente e os colaram em imagens de fundo em novas disposições. Rotacionando, escalando e deslocando os peixes, e limitando quanto podem cobrir uns aos outros, eles criaram 13.000 imagens sintéticas com cardumes densos e realistas e sobreposição controlada. A fusão suave nas bordas mantém essas composições com aparência natural. O conjunto final mistura cenas originais e sintéticas, oferecendo tanto variedade quanto realismo.
Avaliar quão oculto cada peixe está
Nem toda oclusão é igual: um peixe totalmente visível é muito mais fácil de reconhecer do que aquele que aparece apenas como alguns fragmentos dispersos. Para capturar isso, os autores classificaram cada peixe em três grupos simples. Peixes “inteiros” são completamente visíveis, peixes “parciais” estão parcialmente bloqueados por outros, e peixes “fragmentos” aparecem apenas em pedaços separados. Essa camada adicional de rotulagem permite aos pesquisadores ver exatamente onde seus algoritmos encontram dificuldades. Ao analisar os números, eles descobriram que a maioria dos peixes no conjunto se enquadra no grupo “parcial”, refletindo o que realmente acontece em tanques lotados. Eles também mostraram que métricas resumidas tradicionais podem esconder falhas em fragmentos minúsculos, portanto relatar resultados por nível de oclusão oferece uma visão mais clara das forças e fraquezas dos modelos.
Como os algoritmos atuais se saem
Para demonstrar o que o FOD pode oferecer, a equipe testou oito métodos populares de segmentação de imagem, incluindo modelos tradicionais baseados em detecção e designs mais recentes “sem propostas” que trabalham de forma mais direta com regiões da imagem. Todos alcançaram alta precisão média no conjunto de dados, e um método, o Mask2Former, destacou-se por produzir contornos mais nítidos, especialmente quando os peixes se sobrepunham. Ainda assim, mesmo os melhores modelos falharam quando os peixes estavam fragmentados — o desempenho caiu notavelmente em comparação com peixes totalmente visíveis. Um experimento adicional mostrou por que a mistura de dados reais e sintéticos do FOD é importante: treinar apenas com cenas reais levou a um desempenho ruim na oclusão, enquanto treinar somente com sintéticos deixou passar alguns detalhes das imagens reais. Combinar ambos produziu os modelos mais robustos. 
O que isso significa para fazendas de peixes mais inteligentes
Em termos práticos, esse novo conjunto de dados oferece um campo de provas para sistemas de visão computacional que precisam operar em fazendas de peixes reais, onde uma visão clara é exceção e não a regra. Ao focalizar deliberadamente peixes sobrepostos e ao compartilhar tanto as imagens quanto o código usado para construí-las, os autores fornecem uma base para ferramentas de monitoramento mais confiáveis e sensíveis à oclusão. Embora a coleção atual cubra apenas uma espécie em um tanque controlado, a mesma abordagem pode ser estendida para outros peixes e ambientes mais desafiadores. À medida que essas técnicas se disseminarem, os produtores poderão obter informações contínuas e precisas sobre tamanho do estoque, comportamento e crescimento — ajudando a usar o alimento com mais eficiência, detectar problemas de saúde cedo e operar de forma mais sustentável.
Citação: Wang, X., Yu, H., Zhang, C. et al. An underwater image dataset for occlusion-aware fish instance segmentation. Sci Data 13, 526 (2026). https://doi.org/10.1038/s41597-026-06898-w
Palavras-chave: imagem subaquática, aquicultura, visão computacional, segmentação de instância, oclusão