Clear Sky Science · sv

En JianDu-figuråterställningsmetod baserad på tvärdomänsdebiased fourier-fusion och parametriserad koordinatfråga

· Tillbaka till index

Att återuppliva uttunnade bambutexter

I mer än tvåtusen år skrev kinesiska ämbetsmän, soldater och lärda på tunna remsor av bambu och trä. Idag innehåller dessa ömtåliga "jiandu"-remsor ovärderliga ledtrådar om politik, handel och vardagsliv i det forntida Kina—men skriften är ofta uppäten av tid, mögel och skador. Denna artikel presenterar en ny artificiell intelligens (AI)-teknik som digitalt kan återställa enskilda tecken på dessa remsor, vilket hjälper historiker att läsa texter som annars är nära oläsliga.

Figure 1
Figure 1.

Varför gamla bamburemsor är så svåra att läsa

Till skillnad från moderna tryckta sidor har bambu- och träremsor kraftigt mönstrade ytor korsade av fibrer och fläckar. Bläckstrecken vi är intresserade av är tunna och svaga, medan bakgrundstexturen är kraftig och oregelbunden. För en dator kan bakgrunden framstå som starkare än själva skriften. Mögelfläckar mörkar delar av ytan jämnt, och sprickor eller saknade fragment raderar delar av tecken helt. Standardprogram för bildreparation, som fungerar bra på vanliga foton, tenderar att sudda ut dessa känsliga streck, hitta på falska texturer eller sprida bakgrundsbrus in i de områden där tecknen borde vara.

En fokuserad metod för att återskapa saknade streck

Många återställningsmetoder försöker återskapa varje pixel i en bild, även i regioner som är helt intakta. Författarna designar istället ett system som koncentrerar sina insatser på de skadade zonerna och deras omedelbara omgivning. Först skannar ett "parametergenererande" nätverk en nedskalad version av den skadade remsan tillsammans med en mask som visar var information saknas. Det producerar sedan en kompakt uppsättning instruktioner—i praktiken ett recept—som är anpassat till hålen och närliggande kontext. Ett andra "pixelfråge"-nätverk använder detta recept tillsammans med de exakta koordinaterna för varje pixel inne i de skadade regionerna för att rekonstruera dem en efter en. Eftersom nätverket alltid vet exakt var i bilden det arbetar, kan det bättre bevara fina detaljer som streckkanter och sammanfogningar, även i hög upplösning.

Att blanda rymd och vågor utan förvrängning

För att förstå och reparera komplexa mönster förlitar sig metoden inte enbart på former i bildplanet. Den analyserar också hur ljusa och mörka variationer fördelar sig över olika skalor, med hjälp av Fourier-transformen—ett matematiskt verktyg som representerar bilden som en blandning av vågor. I jiandu-bilder beskriver lågfrekventa vågor främst bambubakgrunden, medan högfrekvenser fångar tecknens skarpa kanter. Dock kan naiv användning av vanliga neuralnätstricks i detta vågspektrum röra till spektrat, vilket leder till märkliga färgblock och att bakgrundsmönster blöder in i strecken. Författarna introducerar därför en "debiased" Fourier-modul som omorganiserar och återcentrerar spektrat, märker varje frekvensband med en lärbar position och varsamt normaliserar extrema värden. Samtidigt låter ett rymd–frekvens-fusionsblock rumsliga funktioner (lokala former och texturer) och frekvensfunktioner (globala mönster och brusstatistik) vägleda varandra via en kors-uppmärksamhetsmekanism, vilket skapar en rikare och mer stabil beskrivning av den skadade bilden.

Figure 2
Figure 2.

Metodens prövning

Teamet sammanställde en stor datamängd med över 60 000 enskilda teckensbilder från bambu- och träremsor som spänner över flera kinesiska dynastier, noggrant filtrerade för kvalitet och uppdelade i tränings- och testset. De använde också etablerade samlingar av artificiella skademasker för att efterlikna olika typer av förlust—små glapp, stora saknade områden och slumpmässiga sprickliknande former—samt en gatubildsdatabas för att se hur väl metoden generaliserar bortom kulturarvsmaterial. I en mängd tester rekonstruerade det nya tillvägagångssättet de saknade regionerna mer exakt än sju ledande inpaintningstekniker, med högre poäng på mått för pixelnoggrannhet, upplevd skärpa och strukturell likhet. Visuella jämförelser visar renare teckenstreck, färre mosaikliknande artefakter och mindre förorening från bakgrundstexturer, även när mögel- eller fibrmönster är kraftiga.

Vad detta betyder för att läsa det förflutna

I slutändan erbjuder detta arbete en specialiserad digital "konservator" för forntida bambu- och träte xter. Genom att lära sig skilja ömtåliga bläckstreck från brusiga, förfallna bakgrunder—och genom att omsorgsfullt hantera hur rumsliga former och vågliknande mönster interagerar—kan metoden fylla i saknade delar av tecken på ett sätt som ser plausibelt ut för mänskliga experter och som stödjer automatisk teckenuppfattning. Även om den fortfarande har svårigheter med mycket stora glapp och vissa komplexa skrivstilar, markerar tillvägagångssättet ett betydande steg mot att förvandla svaga, brutna spår på forntida remsor till läsbar, analyserbar text för historiker, lingvister och allmänheten.

Citering: Lu, Z., Wang, T., Hu, X. et al. A JianDu character restoration method based on cross-domain debiased fourier fusion and parameterized coordinate query. npj Herit. Sci. 14, 159 (2026). https://doi.org/10.1038/s40494-026-02414-w

Nyckelord: återställning av bambuslips, fornkinesiska tecken, bildinpaintning, Fourier-baserad djupinlärning, digitalt kulturarv