Clear Sky Science · de

Ein Datensatz und Benchmark von Dünnschliffbildern karbonatischer Gesteine für Deep Learning

· Zurück zur Übersicht

Warum das Betrachten winziger Gesteine wichtig ist

Öl- und Gasunternehmen, Klimaforscher und Geologen sind sehr daran interessiert, welche Geschichten Gesteine verbergen. Indem man Gesteine papierdünn schneidet und unter dem Mikroskop betrachtet, können Expertinnen und Experten Hinweise auf uralte Meere, vergrabene Riffe und die Wege lesen, über die Öl, Gas und Wasser sich unterirdisch bewegen. Dieses Papier stellt DeepCarbonate vor, eine große, sorgfältig geprüfte Bildsammlung solcher Dünnschliffe. Sie ist so konzipiert, dass moderne Systeme der künstlichen Intelligenz automatisch Gesteinstypen erkennen können, wodurch dieses traditionelle Handwerk schneller, konsistenter und leichter weltweit teilbar wird.

Figure 1
Figure 1.

Vom Handstück zur digitalen Gesteinsgalerie

Das Projekt beginnt mit echten Gesteinen, die aus wichtigen ölführenden Formationen im Sichuan-Becken in China und in den Vereinigten Arabischen Emiraten entnommen wurden. Geologen prüfen jede Gesteinsprobe zunächst mit bloßem Auge, um sicherzustellen, dass der untersuchte Abschnitt repräsentativ für das Ganze ist. Um sich nicht von lokalen Auffälligkeiten in die Irre führen zu lassen, betrachten sie mindestens acht verschiedene Ansichten bei zwei Vergrößerungen, überprüfen Texturen und Körner, bis der allgemeine Gesteinstyp mit Zuversicht benannt werden kann. Erst dann fixieren sie die Mikroskopeinstellungen und erfassen hochauflösende Bilder, die auf die feinen Details fokussiert sind, die für das Verständnis der Gesteinsbildung und der Fluidbewegung relevant sind.

Gesteine in unterschiedlichem Licht einfangen

DeepCarbonate macht mehr, als nur ein einzelnes Foto von jeder Stelle aufzunehmen. Derselbe Dünnschliff wird auf verschiedene Weise abgebildet: mit normalem durchfallendem Licht, mit gekreuzten Polarisationsfiltern, mit reflektiertem Licht und manchmal nach einer Färbung, die bestimmte Minerale farbig hervortreten lässt, während andere matt bleiben. Jeder Beleuchtungsmodus hebt andere Merkmale hervor — Kristallformen, Porenräume oder organische Rückstände, die auf Kohlenwasserstoffe hindeuten können. Zusammen liefern sie ein reichhaltigeres Bild als ein einzelnes Foto. Alle Bilder werden bei einer konstanten Vergrößerung aufgenommen, die Detailreichtum und Sichtfeld ausgleicht, und durchlaufen anschließend eine strenge Qualitätskontrolle, sodass unscharfe, zu dunkle oder beschädigte Bilder entfernt werden.

Ein Expertengremium hinzuziehen

Weil subtile Gesteinsmerkmale schwer zu interpretieren sein können, verlässt sich das Team nicht auf eine einzelne Meinung. Zehn Spezialisten für karbonatische Gesteine begutachten unabhängig voneinander die Bilder und die vorgeschlagenen Labels. Stimmen zu viele nicht mit der Erstbewertung überein, werden diese Bilder verworfen, statt Computer mit zweifelhaften Beispielen zu trainieren. Die verbleibenden Bilder werden in 22 verschiedene Gesteinskategorien eingeteilt, von feinen Mudstones und fossilreichen Kalksteinen bis hin zu bruchgefüllten Gesteinen, schaumigen Porennetzen und mikrobiellen Strukturen wie Stromatolithen und Thrombolithen. Diese breite Abdeckung spiegelt Jahrzehnte klassischer Klassifikationssysteme wider, bereitet sie aber für das Zeitalter der datengetriebenen Geologie auf.

Ein faires Prüfgebiet für KI aufbauen

Nach der Kennzeichnung werden die Bilder in eine Struktur überführt, die Forschende im Maschinenlernen bereits von wegweisenden Visionsdatensätzen kennen. Die Sammlung — insgesamt über 55.000 Bilder — wird in Trainings-, Validierungs- und Testuntergruppen unterteilt, jeweils für jeden Beleuchtungsmodus. Die Autorinnen und Autoren testen dann eine Reihe bekannter Bild­erkennungsnetzwerke, von ResNet und VGG bis zu MobileNet und EfficientNet, auf diesem neuen Prüfstand. Sie messen nicht nur, wie oft jedes Modell den Gesteinstyp exakt richtig trifft, sondern auch, wie gut es die korrekte Antwort unter seinen Top-Vorhersagen einordnet und wie fair es mit häufigen und seltenen Gesteinsklassen umgeht.

Figure 2
Figure 2.

Was die Maschinen über Gesteine gelernt haben

Die Ergebnisse zeigen, dass DeepCarbonate herausfordernd, aber erlernbar ist: Moderne Netzwerke können die meisten Bilder korrekt klassifizieren, wobei leichtere, effizientere Modelle oft besonders gut abschneiden. Die Studie zeigt auch, wie ungleich große Klassen — die Tatsache, dass einige Gesteinsarten im Datensatz deutlich häufiger sind als andere — die Algorithmen zugunsten der „häufigen“ Gesteine verzerren können. Indem die Autorinnen und Autoren eine ausgewogenere Untermenge nur mit den neun am besten vertretenen Klassen erstellen, zeigen sie, dass die Leistung steigt und die Modelle sich klarer auf die wirklich diagnostischen Merkmale in den Bildern konzentrieren. Die Kombination aller verschiedenen Beleuchtungsmodi erhöht ebenfalls die Leistung und bestätigt, dass die zusätzlichen visuellen Hinweise für die Maschinen genauso wertvoll sind wie für menschliche Petrographen.

Was das für Energie- und Erdwissenschaften bedeutet

Für Laien ist DeepCarbonate im Wesentlichen ein gemeinsames, qualitativ hochwertiges Bilderbuch mikroskopischer Gesteine, kombiniert mit einem klaren Regelwerk zum Testen, wie gut Computer es „lesen“ können. Indem die Autorinnen und Autoren sowohl die Bilder als auch den Code offen zugänglich machen, liefern sie eine gemeinsame Messlatte, so dass künftige KI-Tools zur Gesteinsanalyse fair verglichen werden können. Langfristig kann ein solcher standardisierter, von Expertinnen und Experten geprüfter Datensatz helfen, ein langsames, handwerkliches Verfahren in eine schnellere, objektivere digitale Wissenschaft zu überführen — und damit bessere Entscheidungen in der Energieexploration, beim Kohlenstoffspeicher und unserem umfassenderen Verständnis, wie die geologischen Archive der Erde die Geschichte des Planeten dokumentieren.

Zitation: Li, K., Song, J., Zhang, Z. et al. A dataset and benchmark of carbonate thin-section images for deep learning. Sci Data 13, 340 (2026). https://doi.org/10.1038/s41597-026-06633-5

Schlüsselwörter: karbonatische Gesteine, Dünnschliffbilder, Deep Learning, Petrographie, geologische Datensätze