Clear Sky Science · pt

InSwAV: agrupamento de características aprimorado por involução e atribuições trocadas para classificação de imagens microscópicas de relíquias de porcelana

· Voltar ao índice

Por que a porcelana quebrada importa para o presente

Em toda a China e além, escavações arqueológicas revelam montes de porcelana estilhaçada. Cada fragmento carrega pistas sobre como as pessoas viviam, comerciavam e dominavam a queima em alta temperatura séculos atrás. Ainda assim, separar e combinar esses inúmeros cacos é um trabalho lento e especializado. Este estudo apresenta uma nova abordagem de inteligência artificial, chamada InSwAV, que aprende a partir de imagens microscópicas das superfícies da porcelana para agrupar automaticamente os fragmentos por tipo. Uma classificação mais rápida e confiável pode acelerar dramaticamente o trabalho de restauração e aprofundar nossa compreensão do patrimônio cultural.

Figure 1
Figure 1.

Vendo a história em pequenas bolhas

A olho nu, muitas peças de porcelana parecem confusamente semelhantes: esmaltes brancos ou verde‑pálido, padrões gastos e bordas danificadas. Sob um microscópio, no entanto, surge outro mundo. Minúsculas bolhas aprisionadas no esmalte registram detalhes da argila, da receita do esmalte, da temperatura de queima e até dos hábitos de fornos ou oficinas individuais. Trabalhos anteriores mostraram que o tamanho, forma e distribuição dessas bolhas variam entre centros de produção e períodos, tornando‑as impressões digitais poderosas para identificação e datação. Mas extrair e interpretar esses padrões sutis manualmente ou com ferramentas tradicionais de processamento de imagem é trabalhoso e sensível a ruídos.

Deixar o computador se ensinar

Um grande obstáculo nessa área é a falta de dados rotulados: especialistas só conseguem anotar um número limitado de imagens microscópicas, e alguns tipos de fragmentos são raros. Em vez de depender de milhares de exemplos rotulados por especialista, os autores recorrem ao aprendizado auto‑supervisionado, no qual uma rede neural é treinada para descobrir estrutura nos dados por conta própria. Eles compilam o conjunto de dados Porcelain Relic Microscopic Image (PRMI), contendo 7.425 imagens de alta ampliação de cinco categorias de porcelana. Para cada micrografia original, o sistema cria múltiplas versões alteradas por recorte, espelhamento, pequenas alterações de cor e desfoque. Essas “visões” mostram o mesmo material de modos diferentes, incentivando o computador a focar em características estáveis e significativas em vez de detalhes superficiais.

Figure 2
Figure 2.

Uma maneira mais inteligente de identificar padrões

O cerne do método é o InSwAV, uma rede construída em torno de um extrator de características customizado chamado ResInv. Redes de imagem padrão usam filtros convolucionais fixos que deslizam pela imagem. O ResInv, por sua vez, mistura esses filtros com operações de “involução” que ajustam seu comportamento dependendo da posição, capturando melhor as formas irregulares e multiescala das bolhas e trincas do esmalte. Depois que o ResInv transforma cada imagem em uma assinatura compacta, o InSwAV não compara imagens individuais diretamente. Em vez disso, atribui‑as a um conjunto de “protótipos” aprendidos, ou centros de cluster, e então verifica se diferentes visualizações aumentadas do mesmo fragmento caem em clusters compatíveis. Um passo matemático de balanceamento impede que o modelo entregue tudo preguiçosamente em apenas alguns grupos, forçando‑o a descobrir estruturas reais e mais finas.

Precisão, velocidade e o que revelam

No conjunto PRMI, o InSwAV distingue corretamente as cinco categorias de porcelana 96,2% das vezes, superando claramente vários métodos auto‑supervisionados de ponta e até uma forte linha de base supervisionada que teve acesso aos rótulos. Também treina muito mais rápido, atingindo alta precisão após apenas algumas horas em hardware gráfico moderno. Visualizações da atividade interna da rede mostram que o ResInv se concentra nas bolhas e em detalhes microestruturais-chave, enquanto uma arquitetura padrão tende a se distrair com regiões de fundo. A abordagem também é robusta a diferentes escolhas do número de clusters que o modelo usa, sugerindo que pode se adaptar bem a novos conjuntos de dados.

O que isso significa para potes quebrados e além

Em termos simples, o estudo mostra que um computador pode aprender a distinguir diferentes relíquias de porcelana ao estudar suas “paisagens de bolhas” microscópicas, mesmo quando os especialistas fornecem poucos rótulos. Essa capacidade pode ajudar museus e arqueólogos a organizar grandes coleções mais rapidamente, combinar fragmentos para reassemblagem virtual e apoiar estudos sobre tecnologia de fornos e redes de comércio. Os autores planejam expandir seu conjunto de dados, testar o método em coleções de imagens mais amplas e simplificar ainda mais o modelo para uso de campo. À medida que essas ferramentas amadurecem, prometem transformar cacos frágeis de puzzles demorados em registros ricos e rapidamente acessíveis do passado.

Citação: Liu, Y., Liu, J., Liu, X. et al. InSwAV: involution enhanced feature clustering and swapped assignments for porcelain relic microscopic image classification. npj Herit. Sci. 14, 117 (2026). https://doi.org/10.1038/s40494-026-02391-0

Palavras-chave: relíquias de porcelana, imagem microscópica, aprendizado auto-supervisionado, restauração do patrimônio cultural, classificação de imagens