Clear Sky Science · nl

Beeldclassificatie van oude architectuur met progressief gestapelde pseudoinverse‑leer

· Terug naar het overzicht

Waarom oude gebouwen moderne algoritmen tegenkomen

Door heel China worden tempels en paleizen met vloeiende daken en ingewikkelde houten steunen in groten getale gefotografeerd. Archivisten en conserveringsspecialisten moeten deze beelden snel ordenen, maar handmatig sorteren is traag en subjectief. Dit artikel presenteert een nieuwe manier om computers te leren foto’s van oude gebouwen nauwkeuriger en efficiënter te herkennen en te classificeren, wat helpt het cultureel erfgoed in het digitale tijdperk te beschermen.

Figure 1
Figure 1.

Wat het moeilijk maakt om deze gebouwen uit elkaar te houden

Oude Chinese architectuur zit vol herhalende patronen: gebogen daklijnen, gelaagde steunconstructies onder de dakrand, gebeeldhouwde balken en kleurrijke oppervlakteversiering. Veel gebouwen hebben vergelijkbare indelingen en verschillen alleen in subtiele variaties van dakcurve of steunvorm. Standaard beeldherkenningssystemen, die leren door interne gewichten geleidelijk aan te passen, kunnen door deze fijnmazige verschillen en door afleidende aanwijzingen zoals muurkleur of verlichting in de war worden gebracht. Ze hebben ook de neiging te overfitten op één regio of stijl wanneer ze in één keer op een grote batch beelden worden getraind, waardoor hun vermogen om te generaliseren naar gebouwen van andere locaties afneemt.

Een slimmere manier om op sleutelkenmerken te letten

De auteurs introduceren een raamwerk genaamd ancient architecture image classification with progressive stacking pseudoinverse learning (AAPSP). Centraal staat een module die key features stacking pseudoinverse learning (KFSP) wordt genoemd. In plaats van te beginnen met volledig willekeurige instellingen bouwt KFSP meerdere parallelle “basis‑leerlingen” op, elk geïnitieerd met gewichtspatronen die zijn ontworpen om specifieke visuele trekken te matchen. Twee takken worden zodanig afgestemd dat ze bijzonder gevoelig zijn voor vloeiende, continue structuren zoals dakcontouren, terwijl een derde is afgestemd op meer verspreide texturen zoals decoratieve motieven. Een wiskundige verkorting, pseudoinverse‑leren genoemd, maakt het mogelijk deze takken nagenoeg in één opname te trainen, en omzeilt zo de langzame, stap‑voor‑stap gewichtsupdates van traditioneel deep learning.

Het model laten letten waar het ertoe doet

Meerdere takken hebben is op zichzelf niet genoeg; het systeem moet ook beslissen welke tak voor elke beslissing het meest behulpzaam is. Hiervoor gebruikt KFSP een aandachtmechanisme dat meet hoe nauwgezet de output van elke tak overeenkomt met de echte gebouwlabels. Takken die treffende elementen beter vastleggen — zoals de vorm van een emmerboog of de omtrek van een nokversiering — krijgen automatisch meer invloed wanneer hun outputs worden gecombineerd. Deze gelaagde representatie vormt een feature‑ruimte die nauwer aansluit bij de onderliggende “logica van vorm” in oude architectuur, waardoor gebouwen met vergelijkbare structurele componenten samenclusteren en stijlen zich duidelijker van elkaar scheiden.

Figure 2
Figure 2.

Leren van de meest informatieve foto’s

De tweede kernmodule, progressive optimization learning (POL), pakt een ander probleem aan: redundante trainingsbeelden. Veel foto’s in de dataset tonen vrijwel identieke aanzichten van dezelfde gevel en voegen weinig nieuwe informatie toe. POL begint met het splitsen van de data in een initiële trainingsset en een grotere kandidatenpool. Met ideeën uit actief leren analyseert het hoe zeker het huidige model elke kandidaat afbeeldt en hoe ongewoon zijn kenmerken zijn. Foto’s die zowel onzeker als onderscheidend zijn — zoals zeldzame steunarrangementen of ongebruikelijke dakcombinaties — worden geleidelijk aan de trainingsset toegevoegd. Deze cyclus herhaalt zich en verrijkt de trainingsdata gestaag met uitdagende en diverse voorbeelden zonder het totale aantal gebruikte beelden te vergroten.

Hoe goed werkt het in de praktijk

De auteurs testten hun benadering op een publieke verzameling van 2.269 beelden van zes beroemde tempels en paleizen. Na toepassing van alleen KFSP presteerde het systeem al beter dan een vergelijkbare methode die op volledig willekeurige projecties vertrouwde. Toen de progressieve steekproefselectie van POL werd toegevoegd, verbeterde de classificatie‑nauwkeurigheid verder en stegen de maatstaven voor precisie, recall en F1‑score. Met andere woorden: het model werd zowel betrouwbaarder in zijn juiste voorspellingen als beter in het vinden van minder voorkomende categorieën. De studie benadrukte ook een blijvende moeilijkheid: klassen met zeer weinig beelden blijven een uitdaging, omdat zelfs een slimme leerder worstelt wanneer er te weinig variatie is om van te leren.

Waarom dit belangrijk is voor het cultureel erfgoed

Door nauwgezet zowel te sturen waar het model op let als welke beelden het leert, biedt AAPSP een preciezer instrument om foto’s van historische gebouwen te sorteren en te bestuderen. Voor erfgoedprofessionals betekent dit snellere opbouw van digitale archieven, betere ondersteuning bij het dateren en vergelijken van architectuurstijlen en robuustere monitoring van sites verspreid over verschillende regio’s. Hoewel de methode is toegesneden op Chinese oude architectuur, zouden de kernideeën — het benadrukken van sleutelstructuurdetails en het progressief focussen op zeldzame maar informatieve voorbeelden — aangepast kunnen worden aan andere soorten cultureel erfgoed, van beeldhouwwerken tot historische stadsgezichten.

Bronvermelding: Cai, Z., Sun, X., Zhang, S. et al. Ancient architecture image classification with progressive stacking pseudoinverse learning. Sci Rep 16, 14626 (2026). https://doi.org/10.1038/s41598-026-44876-9

Trefwoorden: oude architectuur, beeldclassificatie, cultureel erfgoed, machine learning, actief leren