Clear Sky Science · nl

Invloed van data-ruimteaugmentatiestrategie op modelnauwkeurigheid en generalisatie bij classificatie van dunne doorsneden van gesteente

2026-03-17 · Terug naar het overzicht

Waarom slimere gesteentefoto’s ertoe doen

Diep ondergronds bepaalt de opbouw van gesteente waar water, olie, gas en zelfs kooldioxide kunnen stromen of opgeslagen worden. Geologen bestuderen ultradunne gesteentelagen onder de microscoop om deze verborgen architectuur te ontcijferen. Steeds vaker worden computers getraind om gesteentetypen te herkennen aan de hand van zulke beelden. Deze studie stelt een schijnbaar eenvoudige vraag met grote praktische gevolgen: wanneer we deze beeldverzamelingen kunstmatig vergroten met "data-augmentatie", maken we de computer dan daadwerkelijk slimmer — of kunnen we hem soms juist slechter maken?

Computers leren met beperkte gesteentefoto’s

Het trainen van een beeldherkenningssysteem vereist doorgaans duizenden voorbeelden. In de geologie is het verzamelen van zo veel microscoopbeelden traag en duur: monsters moeten geboord, gesneden, gepolijst en gefotografeerd worden, en veel datasets zijn vertrouwelijk bij bedrijven. De auteurs werkten met een reële verzameling van 34.775 microscoopbeelden van dunne gesteentelagen, verdeeld over 36 gesteentecategorieën zoals zandsteen, kalksteen en basalt. Ze definieerden ook een kleinere "beperkte data"-versie met slechts 100 trainingsbeelden en 50 validatiebeelden per klasse om de veelvoorkomende situatie van schaarse data na te bootsen.

De data uitrekken zonder de gesteenten te breken

Om het gebrek aan beelden te compenseren, maken onderzoekers vaak gewijzigde kopieën van de originele beelden—spiegelen, verschuiven, draaien, zoomen of afbeeldingen mengen—om het model te helpen irrelevante verschillen te negeren. Deze studie vergeleek twee algemene manieren om dit te doen. Bij statische augmentatie worden extra beelden aangemaakt en opgeslagen vóór de training, waarmee de dataset permanent vergroot wordt. Bij dynamische augmentatie genereert de computer tijdens de training willekeurige transformaties on the fly, zodat elke passage een iets andere versie van hetzelfde gesteente kan zien. Het team onderzocht 133 gedetailleerde transformatie-instellingen—variërend van milde spiegelingen tot extreme zooms en rotaties, evenals meer geavanceerde "beeldmenging" waarbij twee gesteenten wiskundig worden gecombineerd of samengevoegd.

Vijf neurale netwerken aan de tand voelen

De onderzoekers trainden vijf verschillende convolutionele neurale netwerken: drie bekende architecturen die vooraf getraind waren op alledaagse foto’s, en twee eenvoudigere modellen die vanaf nul waren opgebouwd. In totaal voerden ze 691 afzonderlijke experimenten uit en maten hoe vaak elk model validatiebeelden correct classificeerde na gebruik van verschillende augmentatiestrategieën. Zonder enige augmentatie en met ruime data bereikte het beste vooraf getrainde netwerk al ongeveer 98–99% nauwkeurigheid. Met de kleinere trainingsset daalde de nauwkeurigheid, waardoor augmentatie potentieel waardevol leek—maar de resultaten lieten zien dat niet alle extra data nuttig zijn.

Wanneer meer variatie schaadt in plaats van helpt

De meest opvallende bevinding is dat augmentatie een tweesnijdend zwaard is. Veelgebruikte geometrische trucs, vooral sterke zooms en grote rotaties, verminderden de nauwkeurigheid juist, soms dramatisch, wanneer ze dynamisch tijdens de training werden toegepast. Deze bewerkingen kunnen de kleine mineraalkorrels en texturen die essentiële geologische informatie dragen uitrekken of vervagen, waardoor het model leert te letten op patronen die in echte monsters niet bestaan. Statische augmentatie, waarbij de getransformeerde beelden vastliggen en consequent opnieuw worden gebruikt, leidde over het algemeen tot stabielere en soms betere resultaten. Eenvoudige spiegels en kleine verschuivingen bleken meestal veilig, maar agressieve transformaties waren riskant tenzij zorgvuldig beheerd.

Afbeelden mengen om generalisatie te verbeteren

De meest veelbelovende methoden waren lineaire en niet-lineaire beeldmengtechnieken, die twee gesteentebeelden combineren om een nieuw trainingsvoorbeeld te creëren. Varianten die beelden gemiddelden, tegelden of pixel-voor-pixel samenvoegden behielden of verbeterden consequent de nauwkeurigheid, vooral voor de kleinere dataset. Een model getraind met zulke statisch gemengde beelden generaliseerde beter naar eerder ongeziene data, inclusief synthetische gesteentebeelden gegenereerd door een ander AI-systeem en echte gesteenten die op onbekende manieren waren verwerkt, bijvoorbeeld met de achtergrond verwijderd of met complexe vervormingen. Opmerkelijk genoeg overtrof dit geaugmenteerde model, getraind op veel minder oorspronkelijke beelden, soms een veel groter model dat was getraind op de volledige, niet-geaugmenteerde dataset.

Wat dit betekent voor toekomstige geologische AI

Voor niet-specialisten is de kernboodschap dat "meer data" gecreëerd door eenvoudige beeldtrucs een AI-systeem niet automatisch betrouwbaarder maakt. In de verfijnde texturen van microscopische gesteenten kunnen bepaalde vervormingen precies de kenmerken uitwissen waar geologen om geven. Deze studie toont aan dat zorgvuldig gekozen statische augmentatie en doordacht beeldmengen deels kunnen compenseren voor beperkte data en kunnen verbeteren hoe goed modellen omgaan met nieuwe, onbekende beelden. Tegelijkertijd kan kritiekloze toepassing van agressieve, dynamische transformaties de nauwkeurigheid ongemerkt aantasten. Met andere woorden: voor geautomatiseerde gesteenteclassificatie—en waarschijnlijk voor veel wetenschappelijke beeldtaken—doet de manier waarop we nieuwe trainingsbeelden verzinnen er evenveel toe als hoeveel we er hebben.

Bronvermelding: Habrat, M., Młynarczuk, M. Impact of data space augmentation strategy on model accuracy and generalization in thin-section rock classification. Sci Rep 16, 13927 (2026). https://doi.org/10.1038/s41598-026-44320-y

Trefwoorden: gesteentemicrofotografie, data-augmentatie, geologie AI, beeldclassificatie, dunne doorsneden