Clear Sky Science · pt
Estrutura progressiva em três estágios para inpainting de textos antigos Dongba
Por que salvar a escrita pictográfica antiga importa
Para o povo Naxi do sudoeste da China, os livros Dongba são uma porta de entrada para mil anos de histórias, rituais e cotidiano. Esses livros são escritos em uma rara escrita pictórica que mistura imagens e palavras. O tempo, a umidade e o manuseio danificaram muitas páginas, deixando buracos e traços faltantes que dificultam a leitura ou até o reconhecimento dos símbolos. Este estudo apresenta um novo método digital para “preencher as lacunas” desses textos frágeis, com o objetivo de restaurar tanto a aparência da escrita quanto seu significado, oferecendo uma nova ferramenta poderosa para a preservação cultural.
De páginas quebradas à restauração digital
Conservadores há muito tentam reparar fisicamente manuscritos danificados, mas hoje a restauração digital oferece um caminho adicional: em vez de tocar o original, computadores podem reconstruir partes ausentes em uma imagem digitalizada. Para texto impresso comum, algoritmos modernos já fazem um trabalho razoável ao adivinhar letras perdidas a partir das formas e padrões ao redor. Os livros Dongba apresentam um desafio mais difícil. Cada símbolo é um pequeno desenho cujas linhas carregam tanto estilo visual quanto significado. Se o software simplesmente completar linhas para que fiquem suaves, pode transformar acidentalmente o símbolo em algo que nunca existiu, distorcendo o registro cultural. Os autores argumentam que qualquer restauração séria deve respeitar tanto a aparência artística quanto as regras estritas do sistema de escrita.

Uma jornada em três etapas do contorno ao significado
A equipe de pesquisa propõe uma estrutura progressiva em três estágios, chamada TsP, projetada especificamente para páginas Dongba muito danificadas. No primeiro estágio, o sistema concentra-se apenas nos contornos. Ele recebe a imagem danificada, detecta onde os traços existiam e usa um híbrido de duas técnicas poderosas — redes convolucionais, boas para detalhes locais, e redes Transformer, eficazes na estrutura global — para reconstruir aproximadamente as bordas faltantes. O resultado é um mapa de contorno aproximado, como um esboço que sugere a forma geral do caractere mesmo onde partes estão ausentes.
Deixando um dicionário digital orientar o reparo
No segundo estágio, o sistema incorpora conhecimento sobre o próprio Dongba. Os pesquisadores construíram um dicionário digital de símbolos Dongba comumente usados, incluindo muitos estilos de caligrafia para cada um. O algoritmo compara o contorno reparado do estágio um com todas as entradas desse dicionário e encontra o caractere completo mais semelhante. Ele faz isso não lendo rótulos de texto, mas medindo quão próximas as formas coincidem em um sentido estatístico. O símbolo escolhido serve como um “prior de conteúdo” — uma melhor hipótese do que o caractere ausente deveria ser, fornecendo tanto pistas semânticas quanto detalhes finos de traço que um método puramente visual deixaria escapar.
Polindo a imagem final
No terceiro e último estágio, o TsP combina duas correntes de informação: o contorno estrutural do primeiro passo e o caractere completo do dicionário. Uma rede neural de dois ramos especialmente desenhada extrai características de ambas as fontes, um ramo focado na disposição dos traços e outro nos padrões de conteúdo mais ricos. Essas características então orientam um módulo de restauração que atua não apenas no domínio da imagem, mas também no domínio da frequência, onde padrões como suavidade geral e ritmo dos traços podem ser ajustados de forma mais eficaz. Essa passagem final limpa artefatos, acrescenta partes faltantes dos traços e suaviza transições entre regiões antigas e recém-geradas para que o caractere reparado se integre naturalmente à página original.

Quão bem isso funciona?
Para testar a abordagem, os autores usaram o DB1404, o único grande conjunto de dados público de caracteres Dongba, que inclui milhares de símbolos capturados em muitos estilos. Eles criaram “danos” digitais de severidade variada, mascarando desde uma pequena porção de cada imagem até metade dela, usando buracos e arranhões irregulares que imitam a deterioração real. O TsP foi comparado com métodos líderes de reparo de imagem, incluindo ferramentas clássicas, sistemas modernos baseados em Transformer e modelos de difusão. Em todos os níveis de dano, o TsP produziu imagens visualmente mais convincentes e estruturalmente mais próximas dos caracteres originais, especialmente quando grandes porções estavam ausentes — exatamente a situação mais crítica para manuscritos raros e frágeis.
O que isso significa para a escrita antiga
Em termos simples, este trabalho mostra que computadores podem aprender não apenas a suavizar fissuras em uma imagem, mas a respeitar as regras e os significados de um sistema de escrita antigo ao fazê-lo. Ao primeiro estimar o esqueleto de um caractere danificado, depois compará-lo com um símbolo conhecido e, por fim, usar ambos como guia para um inpainting cuidadoso, o TsP preserva melhor a forma original e o sentido da escrita Dongba. Além de um feito técnico, essa abordagem pode ajudar bibliotecários, historiadores e comunidades locais a recuperar o conteúdo de manuscritos que de outra forma permaneceriam ilegíveis, e oferece um modelo para restaurar outros alfabetos ameaçados ao redor do mundo.
Citação: Bi, X., Shi, Q. & Chen, Z. Three-stage progressive framework for Dongba ancient texts inpainting. npj Herit. Sci. 14, 240 (2026). https://doi.org/10.1038/s40494-026-02524-5
Palavras-chave: manuscritos Dongba, restauro de escrita antiga, reconstrução de imagem, digitalização do patrimônio cultural, deep learning