Clear Sky Science · pt
Restauração de caracteres dos fechos de Liye Qin usando rede adversarial generativa com restrição eficaz de componentes conectados
Palavras antigas trazidas de volta à vida
Muito antes do papel, oficiais chineses escreviam em tiras finas de bambu e madeira. Milhares desses registros frágeis, conhecidos como Fechos de Liye da dinastia Qin, foram retirados de um poço abandonado após mais de dois mil anos enterrados. Eles preservam ordens cotidianas, contas e relatórios do primeiro império chinês unificado. Mas água, lama e micróbios deixaram grande parte da tinta borrada ou ausente, tornando as tiras dolorosamente lentas de ler manualmente. Este estudo mostra como um sistema moderno de inteligência artificial pode digitalmente “limpar” esses caracteres danificados, ajudando historiadores a recuperar vozes do passado distante.
Por que esses registros enterrados importam
Os Fechos de Liye não são decretos reais nem grandes inscrições; são a papelada de um governo em funcionamento. Mais de 30.000 tiras registram impostos, trabalho e administração rotineira em um condado na borda do império Qin. Ao contrário de fechos semelhantes encontrados em tumbas secas, os fragmentos de Liye jazeram em sedimento úmido no fundo de um poço. Muitos estão empenados, rachados e manchados; os traços do pincel estão borrados ou consumidos. Decifrar um único lote pode levar especialistas anos, e o número crescente de achados superou o que olhos humanos sozinhos conseguem lidar. Automatizar parte do processo de restauração poderia acelerar dramaticamente a pesquisa, preservando ao mesmo tempo as formas sutis que tornam cada caractere legível.

Ensinando um computador a ver através dos danos
Os autores tratam a restauração como uma espécie de tradução de imagem: o computador recebe uma pequena imagem ruidosa de um caractere e é solicitado a produzir como esse caractere pareceria se estivesse limpo e nítido. Para isso, eles se baseiam em um tipo de IA chamado rede adversarial generativa, ou GAN. Uma rede (o “gerador”) tenta transformar uma imagem danificada em uma clara, enquanto outra (o “discriminador”) julga se o resultado parece um caractere genuíno, bem escrito. Através desse jogo de vai-e-vem, o gerador gradualmente aprende a produzir restaurações mais convincentes que iludem o crítico.
Atenção mais apurada aos traços finos do pincel
Ferramentas de imagem padrão frequentemente perdem os detalhes mais finos da tinta no bambu, especialmente quando o fundo é manchado e a tinta é fraca. A equipe melhora o núcleo do GAN usando um desenho em forma de U conhecido como U-Net, que equilibra contexto amplo com detalhe ao nível do pixel. Eles substituem os blocos de construção usuais nessa rede por Blocos Densos Residuais Locais especialmente projetados. Esses blocos incentivam o sistema a reutilizar padrões úteis ao mesmo tempo em que evitam a suavização excessiva que pode fazer traços próximos se fundirem. Uma seção de “gargalo” reforçada no meio da rede refina ainda mais as características mais importantes, ajudando o modelo a distinguir traços verdadeiros de ruído mesmo quando o original está fortemente degradado.
Preservando o esqueleto de cada caractere
Uma inovação chave é o que os autores chamam de restrição de Domínio Conectado Efetivo. Em vez de julgar cada pixel isoladamente, essa regra observa as principais regiões de tinta em um caractere: quão grandes elas são e onde seus centros estão localizados. O modelo compara essas “ilhas” grosseiras de tinta em sua saída com as presentes em imagens de referência cuidadosamente restauradas, prestando atenção especial apenas às poucas maiores que formam o esqueleto central do caractere. Se um traço importante estiver ausente, fundido com outro ou deslocado, o sistema é penalizado e forçado a ajustar. Essa verificação geométrica simples mostra-se notavelmente estável mesmo quando os traços estão quebrados, as bordas são irregulares ou a tinta sangrou para o fundo.

Quão bem funcionam os reparos digitais
Como não existiam dados adequados, a equipe criou seu próprio conjunto pareado de 600 imagens de caracteres dos fechos de Liye, cada uma combinada com uma restauração meticulosa feita por especialistas. Nesse conjunto de referência, seu método supera várias abordagens de ponta, incluindo outros GANs, um modelo baseado em Transformer e um modelo de difusão, segundo três medidas padrão de qualidade de imagem. Comparações visuais lado a lado mostram menos traços quebrados, separação mais limpa entre linhas de pincel próximas e menos ruído de fundo. Instrutores de caligrafia que revisaram os resultados em um teste cego deram boas notas para continuidade dos traços, precisão estrutural e legibilidade geral, e testes separados sugerem que o modelo não simplesmente memoriza os dados de treinamento.
Trazendo a escrita enterrada de volta ao foco
Para não especialistas, a mensagem é clara: ao combinar conhecimento especializado em scripts antigos com projetos de IA sob medida, agora é possível recuperar escrita legível de tiras de bambu que antes pareciam demasiado danificadas para uso. O modelo preserva não apenas a presença de um caractere, mas como seus traços se relacionam no espaço, tornando a saída significativa para historiadores e estudiosos da linguagem. Embora a abordagem ainda dependa de dados de treinamento limitados e precise ser adaptada a outros materiais como seda ou pedra, ela aponta para um futuro em que muitos textos frágeis e de difícil leitura podem ser restaurados digitalmente e estudados em escala, abrindo novas janelas sobre a vida cotidiana em impérios antigos.
Citação: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6
Palavras-chave: restauração de fechos de bambu, manuscritos chineses antigos, redes adversariais generativas, preservação digital do patrimônio, recuperação de caracteres manuscritos