Clear Sky Science · pt

Pesquisa sobre detecção de padrões em imagens de batik baseada no YOLOv11 aprimorado

· Voltar ao índice

Tecido antigo encontra código moderno

O tecido batik das comunidades Miao da China é mais do que decoração: suas borboletas, dragões, pássaros e flores registram silenciosamente história, crenças e vida cotidiana na ausência de um sistema escrito. Contudo, à medida que esses tecidos envelhecem e as gerações mais jovens se afastam dos ofícios tradicionais, informações culturais vitais correm o risco de se perder em pilhas de fotos sem rótulo e tecidos desbotados. Este estudo mostra como um software avançado de reconhecimento de imagens pode localizar e identificar automaticamente motivos pequenos e sobrepostos em imagens complexas de batik, oferecendo uma nova forma de preservar e explorar essa arte viva em larga escala.

Figure 1
Figure 1.

Por que esses padrões importam

O batik chinês é uma técnica de tingimento manual que floresceu por mais de dois milênios, especialmente entre o povo Miao na província de Guizhou. Como essa comunidade historicamente não possuía uma linguagem escrita, os motivos do batik tornaram-se um arquivo visual de mitos, rituais, estética e costumes sociais. Pesquisadores começaram a digitalizar e analisar esses padrões utilizando ferramentas da matemática, do design e da inteligência artificial. Trabalhos anteriores conseguiam classificar motivos isolados razoavelmente bem, mas normalmente exigiam recortar esses motivos do tecido original, rompendo os vínculos entre cada símbolo e a composição maior. Isso dificultava entender como os motivos interagem numa peça para transmitir significados em camadas.

De rótulos simples à detecção inteligente

Os autores defendem que o necessário não é apenas classificação, mas detecção completa de objetos: localizar cada motivo em uma fotografia inteira e nomear seu tipo. Esse é um problema difícil em imagens reais de batik, onde os desenhos ficam aglomerados, variam muito de tamanho e frequentemente estão desbotados, rachados ou parcialmente ocultos. Sistemas de detecção padrão, incluindo versões anteriores da popular família de algoritmos YOLO ("You Only Look Once"), tiveram dificuldades nessas condições. Tendiam a perder símbolos muito pequenos, confundir-se com fundos intrincados ou falhar quando a iluminação e a qualidade da imagem eram irregulares — exatamente o tipo de imagem que curadores e pesquisadores de campo costumam coletar.

Ensinando uma rede neural a ler o tecido

Para enfrentar esses desafios, a equipe primeiro criou o que hoje é o maior conjunto de dados de detecção de batik chinês: 861 imagens em alta resolução anotadas com 9.933 caixas delimitadoras em sete categorias de motivos (borboleta, peixe, dragão, pássaro, tambor, flor e fruto). Eles equilibraram cuidadosamente tamanho e qualidade das imagens e ampliaram os dados limitados aplicando desfoques controlados, alterações de cor, flips, mosaicos e outras transformações para que o modelo não memorizasse simplesmente as amostras de treinamento. Sobre esse conjunto, construíram uma versão aprimorada do YOLOv11, uma estrutura de detecção de objetos de ponta escolhida por sua velocidade e tamanho compacto — características importantes se a ferramenta for executada em computadores comuns de museus e centros culturais.

Olhando mais longe e vendo com mais clareza

O modelo melhorado adiciona duas ideias principais. Primeiro, um componente inspirado no mecanismo VOLO "vision outlooker" permite que a rede olhe simultaneamente por partes distantes da imagem, em vez de apenas em pequenas vizinhanças locais. Isso ajuda a reconhecer que duas formas minúsculas, distantes entre si, podem pertencer ao mesmo padrão significativo e que o papel de um motivo depende de seus vizinhos. Segundo, a equipe reestruturou a forma como a rede processa características da imagem usando uma estrutura chamada Fused-MBConv. Esse redesenho mantém os cálculos eficientes enquanto aguça a capacidade do modelo de extrair detalhes sutis de tecidos ruidosos e envelhecidos. Em testes e estudos de ablação cuidadosos, seu desenho final alcançou maior precisão média de detecção do que o YOLOv11 de referência e diversos outros detectores leves, mantendo ainda velocidade suficiente para uso em tempo real ou quase em tempo real.

Figure 2
Figure 2.

De etiquetas automáticas a histórias culturais

Além das métricas de detecção, os pesquisadores conectaram seu modelo a um grafo de conhecimento sobre batik que associa cada tipo de motivo a histórias sobre suas origens, significados simbólicos e exemplos relacionados. Em um sistema de software protótipo, o usuário pode fazer upload de uma foto de um tecido, ver os motivos detectados destacados e, em seguida, clicar para explorar seu contexto cultural. Para arquivistas, isso significa catalogação mais rápida e consistente de grandes coleções. Para educadores e visitantes, transforma o reconhecimento de padrões em um ponto de entrada para aprender sobre crenças, rituais e estética Miao. Embora o sistema atual seja treinado apenas em batik chinês, os autores o veem como um modelo para ferramentas interculturais que, um dia, possam ajudar a proteger tradições têxteis da Indonésia à Índia, garantindo que os desenhos nos tecidos continuem a falar, mesmo quando os próprios tecidos envelhecem e desbotam.

Citação: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y

Palavras-chave: detecção de padrões de batik, patrimônio cultural imaterial, visão computacional, detecção de objetos YOLO, arte têxtil Miao