Clear Sky Science · nl

Driefasig progressief kader voor het inpainten van Dongba oudteksten

· Terug naar het overzicht

Waarom het bewaren van beeldschrift uit het verleden ertoe doet

Voor het Naxi-volk in het zuidwesten van China vormen Dongba-boeken een toegangspoort tot duizend jaar aan verhalen, rituelen en dagelijks leven. Deze boeken zijn geschreven in een zeldzaam, beeldachtig schrift dat beelden en woorden vermengt. Tijd, vocht en hantering hebben veel pagina’s beschadigd, waardoor er gaten en ontbrekende streekjes zijn ontstaan die de symbolen lastig leesbaar of zelfs onherkenbaar maken. Deze studie introduceert een nieuwe digitale methode om die ‘leemtes’ in deze kwetsbare teksten op te vullen, met als doel zowel het uiterlijk van het schrift als de betekenis te herstellen, en zo een krachtig nieuw hulpmiddel voor behoud van cultuurgoed te bieden.

Van beschadigde pagina’s naar digitale restauratie

Conservatoren hebben lange tijd geprobeerd beschadigde manuscripten fysiek te repareren, maar digitale restauratie biedt tegenwoordig een aanvullend pad: in plaats van het origineel aan te raken, kunnen computers ontbrekende delen in een gescande afbeelding reconstrueren. Voor gewone gedrukte teksten doen moderne algoritmen al redelijk goed in het raden van verdwenen letters aan de hand van omringende vormen en patronen. Dongba-boeken vormen een grotere uitdaging. Elk symbool is een kleine tekening waarvan de lijnen zowel visuele stijl als betekenis dragen. Als de software louter lijnen voltooit om ze er vloeiend uit te laten zien, kan dat per ongeluk het symbool veranderen in iets dat nooit bestond, en zo het culturele spoor vervormen. De auteurs stellen dat serieuze restauratie zowel het kunstachtige voorkomen als de strikte regels van het schriftsysteem moet respecteren.

Figure 1
Figure 1.

Een driedelige reis van contour naar betekenis

Het onderzoeksteam stelt een driefasig progressief kader voor, TsP genoemd, speciaal ontworpen voor zwaar beschadigde Dongba-pagina’s. In de eerste fase richt het systeem zich alleen op contouren. Het neemt de beschadigde afbeelding, detecteert waar ooit streken waren en gebruikt een hybride van twee krachtige technieken—convolutionele netwerken, die goed zijn in lokale details, en Transformer-netwerken, die sterk zijn in globale structuur—om grofweg de ontbrekende randen te reconstrueren. Het resultaat is een benaderende contuurlijn, als een schets die de algemene vorm van het teken suggereert, zelfs waar delen ontbreken.

Een digitale woordenschat als gids voor herstel

In de tweede fase betrekt het systeem kennis over Dongba zelf. De onderzoekers bouwden een digitale woordenlijst van veelgebruikte Dongba-symbolen, inclusief vele handschriften voor elk symbool. Het algoritme vergelijkt de herstelde contour uit fase één met alle items in deze woordenlijst en vindt het meest vergelijkbare volledige teken. Het doet dit niet door tekstlabels te lezen, maar door statistisch te meten hoe nauw de vormen overeenkomen. Het gekozen symbool fungeert als een "inhoudsprior" — een beste gok van wat het ontbrekende teken zou moeten zijn, die zowel semantische aanwijzingen als fijne streekdetails levert die een puur visuele methode zou missen.

Het uiteindelijke beeld verfijnen

In de derde en laatste fase combineert TsP twee informatiestromen: de structurele contour uit de eerste stap en het volledige teken uit het woordenboek. Een speciaal ontworpen dual-branch neuraal netwerk extraheert kenmerken uit beide bronnen, waarbij de ene tak zich richt op streekindeling en de andere op rijkere inhoudspatronen. Deze kenmerken sturen vervolgens een restauratiemodule die niet alleen in afbeeldingsruimte werkt maar ook in het frequentiedomein, waar patronen zoals algemene gladheid en het ritme van streken effectiever kunnen worden aangepast. Deze laatste fase ruimt artefacten op, voegt ontbrekende gedeelten van streken toe en verzacht overgangen tussen oude en nieuwgegenereerde gebieden, zodat het herstelde teken natuurlijk in de originele pagina opgaat.

Figure 2
Figure 2.

Hoe goed werkt het?

Om hun aanpak te testen gebruikten de auteurs DB1404, de enige grote publieke dataset van Dongba-tekens, die duizenden symbolen in veel stijlen omvat. Ze creëerden digitale "beschadiging" met verschillende ernstniveaus, waarbij ze maskerden van slechts een klein deel van elke afbeelding tot de helft ervan, met onregelmatige gaten en krassen die echte achteruitgang nabootsen. TsP werd vergeleken met toonaangevende beeldherstelmethoden, inclusief klassieke tools, moderne Transformer-gebaseerde systemen en diffusie-modellen. Over alle schadelevels heen produceerde TsP beelden die zowel visueel overtuigender waren als structureel dichter bij de originele tekens, vooral wanneer grote delen ontbraken—precies de situatie die het meest kritisch is voor zeldzame en kwetsbare manuscripten.

Wat dit betekent voor oud schrift

Eenvoudig gezegd toont dit werk aan dat computers niet alleen kunnen leren scheuren in een beeld glad te strijken, maar ook de regels en betekenissen van een oud schriftsysteem kunnen respecteren tijdens dat proces. Door eerst het skelet van een beschadigd teken te raden, het vervolgens te matchen met een bekend symbool en ten slotte beide te gebruiken als leidraad voor zorgvuldig inpainten, behoudt TsP beter de oorspronkelijke vorm en betekenis van het Dongba-schrift. Buiten een technische prestatie kan deze aanpak bibliothecarissen, historici en lokale gemeenschappen helpen de inhoud van manuscripten terug te winnen die anders onleesbaar zouden blijven, en biedt het een sjabloon voor het herstellen van andere bedreigde schriften wereldwijd.

Bronvermelding: Bi, X., Shi, Q. & Chen, Z. Three-stage progressive framework for Dongba ancient texts inpainting. npj Herit. Sci. 14, 240 (2026). https://doi.org/10.1038/s40494-026-02524-5

Trefwoorden: Dongba-manuscripten, herstel van oude schriftvormen, beeldinpainting, digitalisering van cultureel erfgoed, deep learning