Clear Sky Science · pt

Classificação explicável por aprendizado de máquina de cerâmica tradicional coreana usando dados de composição química por XRF

· Voltar ao índice

Tesouros cerâmicos encontram algoritmos modernos

Por séculos, especialistas têm classificado as melhores cerâmicas da Coreia — o celadon esverdeado e suave, o buncheong de decoração arrojada e a porcelana branca serena — a olho e pela experiência. Mas o que acontece quando um fragmento está danificado, descolorido ou não se encaixa exatamente no padrão de um manual? Este estudo mostra como o aprendizado de máquina moderno pode ler as “impressões digitais” químicas dessas peças para classificá-las de forma objetiva e até explicar quais ingredientes conferem a cada exemplar sua beleza distintiva.

Das cores dos esmaltes aos ingredientes ocultos

Celadon, buncheong e porcelana branca são mais que rótulos de museu; eles registram mudanças de gosto e tecnologia das dinastias Goryeo à Joseon. O celadon é famoso pelo esmalte verde-jade e pelo intricado incrustado, o buncheong pelas decorações vivas com barbotina branca sobre um corpo mais escuro, e a porcelana branca pela elegância pura e contida. Ainda assim, a classificação baseada na aparência tem limites: peças antigas ou experimentais podem apresentar aspecto diferente, e a ação do tempo ou fraturas pode mascarar características-chave. Os autores recorreram então à fluorescência de raios X (XRF), uma técnica que revela quanto de cada óxido majoritário — como sílica, alumina, ferro e titânio — está presente no corpo cerâmico. Como essas receitas químicas refletem matérias-primas e condições de queima, elas fornecem uma base mais estável para identificar que tipo de peça um fragmento já foi.

Figure 1
Figure 1.

Ensinando computadores a reconhecer argila antiga

A equipe compilou dados de XRF de 624 amostras cerâmicas de estudos científicos anteriores, cobrindo de forma equilibrada celadon, buncheong e porcelana branca. Em seguida, treinaram seis modelos diferentes de aprendizado de máquina para reconhecer os três tipos usando apenas dez óxidos medidos. Alguns modelos, como árvores de decisão e florestas aleatórias, dividem os dados em ramos com base em regras simples. Outros, como máquinas de vetor de suporte, traçam fronteiras mais flexíveis em um espaço matemático. Para evitar ajustar os modelos excessivamente a esse conjunto de dados específico, os autores reservaram parte dos dados para teste e avaliaram o desempenho em um conjunto totalmente separado de 59 amostras obtidas de pesquisas independentes.

Como os computadores se saíram

Dois métodos baseados em árvores — floresta aleatória (random forest) e extreme gradient boosting — se destacaram, classificando corretamente cerca de 96% das amostras de teste. Uma máquina de vetor de suporte ficou logo atrás, enquanto métodos mais simples e rígidos ficaram para trás. Uma análise mais detalhada dos erros revelou um padrão revelador: a porcelana branca foi quase sempre identificada corretamente, mas celadon e buncheong frequentemente se confundiam. Isso reflete a história e a tecnologia: tanto o celadon quanto o buncheong compartilham argilas semelhantes e temperaturas de queima elevadas, e o buncheong inicial frequentemente incorporou técnicas do celadon, de modo que suas assinaturas químicas se sobrepõem naturalmente. A porcelana branca, feita de argila excepcionalmente pura com muito pouco material que cause cor, destaca-se como um agrupamento distinto nos dados.

Figure 2
Figure 2.

Explicando as decisões: por que ferro e titânio importam

Modelos poderosos não ajudam muito os historiadores se se comportarem como caixas‑pretas. Para abrir a tampa, os pesquisadores usaram SHAP, um método que atribui a cada composto químico uma pontuação que indica o quanto ele empurra uma amostra em direção a um tipo cerâmico ou a outro. Nos melhores modelos, dois óxidos dominaram a explicação: óxido de ferro (Fe2O3) e dióxido de titânio (TiO2). Já se sabe que esses componentes influenciam a cor na argila queimada, deslocando tons do amarelado ao verde-azulado conforme sua quantidade e a atmosfera do forno. A análise por aprendizado de máquina confirmou que níveis baixos de ferro e titânio favorecem fortemente a porcelana branca; níveis intermediários tendem a indicar celadon; e ferro mais alto, combinado com titânio moderado, é característico dos corpos mais escuros e terrosos do buncheong. Outros óxidos, como os contendo fósforo e sódio, tiveram papéis de suporte para distinguir celadon e buncheong quando seus principais ingredientes colorantes se sobrepunham.

O que isso significa para ler o passado

Essencialmente, o estudo demonstra que computadores podem classificar cerâmicas tradicionais coreanas com precisão semelhante à de especialistas, ao mesmo tempo em que deixam claro quais ingredientes mais importam. Em vez de substituir curadores e arqueólogos, essa abordagem oferece um acompanhante quantitativo: uma forma de verificar julgamentos visuais, resolver casos limite e entender melhor como mudanças sutis na argila e na queima ajudaram a impulsionar a evolução do celadon verde para o buncheong arrojado e para a porcelana branca pura. À medida que mais dados químicos forem coletados de diferentes fornos e períodos, essas ferramentas explicáveis de aprendizado de máquina podem se tornar auxiliares padrão para reconstruir as escolhas tecnológicas e os valores culturais incorporados até no menor fragmento de cerâmica.

Citação: Cho, Y.E., Sim, S., Choi, J. et al. Explainable machine learning-based classification of traditional Korean ceramics using XRF chemical composition data. npj Herit. Sci. 14, 28 (2026). https://doi.org/10.1038/s40494-026-02301-4

Palavras-chave: cerâmica coreana, aprendizado de máquina, análise XRF, patrimônio cultural, classificação de porcelana