Clear Sky Science · de

Erklärbare künstliche Intelligenz für die Segmentierung sedimentärer Fazies

· Zurück zur Übersicht

Die Erdgeschichte aus Gesteinszylindern lesen

Um zu verstehen, wie sich Flüsse, Deltas und Küsten entwickelt haben — und wie stabil der Boden unter unseren Städten wirklich ist — untersuchen Geologen lange Zylinder aus Sediment, die aus dem Untergrund gebohrt wurden. Die Interpretation dieser Kerne ist langsame, fachkundige Arbeit. Diese Studie zeigt, wie künstliche Intelligenz (KI) in Verbindung mit Werkzeugen, die ihre innere Logik offenlegen, dabei helfen kann, diese Aufgabe zu automatisieren und gleichzeitig Wissenschaftlern zu ermöglichen, nachzuvollziehen, warum der Computer zu einer bestimmten Schlussfolgerung gelangt ist.

Figure 1
Figure 1.

Warum Bohrkerne wichtig sind

Subsurface‑Sedimente zeichnen vergangene Überschwemmungen, Meeresspiegeländerungen, Erdbeben und Klimaverschiebungen auf. Fachleute unterteilen jeden Kern in „Fazies“, Schichten, die unterschiedliche Umgebungen widerspiegeln, wie Flusskanäle, gut- und schlecht entwässerte Auen, Küstensümpfe oder Offshore‑Schlämme. Diese Unterscheidungen leiten alles von Rekonstruktionen der Paläoklimate bis hin zu Bewertungen von Erdbebenrisiken und Bodenstabilität. Aber sorgfältige Fazieskartierungen erfordern jahrelange sedimentologische Ausbildung, und selbst Expertinnen und Experten sehen sich mit Unsicherheiten konfrontiert, wenn Schichten ähnlich aussehen oder Kerne beschädigt sind. Diese Arbeit zugänglicher und konsistenter zu machen, ist ein zentrales Motiv für den Einsatz von KI.

Ein neuronales Netz antrainieren, die Schichten zu erkennen

Die Autorinnen und Autoren verwendeten einen öffentlichen Datensatz hochaufgelöster Kernfotografien aus holozänen (letzte ~11.700 Jahre) Ablagerungen in Norditalien. Jede Aufnahme wurde mühsam in sechs Hauptfazies gelabelt — fluviales Sand, gut‑ und schlecht entwässerte Auen‑Tone, Sumpfabsatz, Torfschichten und Offshore‑(Prodelta)‑Tone — sowie eine Hintergrundklasse. Sie trainierten mehrere Varianten einer populären Segmentierungsarchitektur, U‑Net, jeweils mit einem anderen „Backbone“, der visuelle Merkmale lernt. Durch den Vergleich von Genauigkeit und verwandten Metriken sowohl auf einem Validierungsset als auch auf einem bislang ungesehenen Testset stellten sie fest, dass ein Modell mit dem EfficientNet‑B7‑Backbone das beste Verhältnis von hoher Leistung und verlässlicher Generalisierung auf neue Kerne bot.

Gestein mit weiterem Blick betrachten

Menschliche Geologen entscheiden eine Fazies selten anhand eines winzigen Punktes; sie lesen Trends entlang des Kerns, etwa allmähliches Verfeinern oder Verdicken von Schichten. Um dies nachzuahmen, untersuchte das Team, wie viel vertikalen Kontext die KI gleichzeitig sehen sollte, indem sie die beste Architektur mit verschieden großen Bildausschnitten (Patches) trainierten. Wenn das Modell nur kleine 128×128‑Pixel‑Patches betrachtete, waren seine Vorhersagen verrauscht und Faziesbänder wirkten gebrochen. Mit zunehmender Patch‑Größe über 256 und 384 Pixel bis hin zu 512×512 Pixeln wurde die Segmentierung glatter und näher an der Experteninterpretation, wobei Fazieskörper als zusammenhängende Einheiten erhalten blieben. Die Leistungssteigerungen flachten zwischen 384 und 512 Pixeln ab, was nahelegt, dass ungefähr dieser Maßstab den Großteil des nützlichen Kontexts für die Aufgabe erfasst.

Figure 2
Figure 2.

Die Black Box mit Heat‑ und Unsicherheitskarten öffnen

Hohe Punktzahlen allein reichen nicht aus, wenn KI Entscheidungen über Gefahren oder Ressourcen beeinflusst; Nutzerinnen und Nutzer müssen sehen, wie und wo das Modell „hinblickt“. Die Autorinnen und Autoren wandten daher zwei Familien von Erklärbarkeitswerkzeugen an. Zunächst nutzten sie Grad‑CAM, um Salienz‑Maps zu erzeugen — Heatmaps, die Bildbereiche hervorheben, die für jede Faziesentscheidung am einflussreichsten sind. Diese Karten stimmten gut mit den gelabelten Fazies überein und betonten beispielsweise organisch reiche Zonen bei Torf und Sumpf und trennten Sediment klar vom Hintergrund. Wichtig ist, dass gewisse Überlappungen, etwa Torf‑Aktivierungen innerhalb von Sumpfbereichen, der Art entsprechen, wie Sedimentologen diese Umgebungen konzeptionell gruppieren. Zweitens schätzten sie die prädiktive Entropie, indem sie das Modell mehrfach mit zufälligem Dropout laufen ließen und zusammenfassten, wie stabil seine Vorhersagen an jedem Pixel waren. Zonen hoher Entropie traten oft nahe Grenzen zwischen Fazies, in dünnen eingelagerten Sanden innerhalb von Tonen oder in Teilen der Kerne auf, die beim Bohren gestört wurden — genau dort, wo Expertinnen und Experten selbst zögern würden. Doch viele Bereiche mit hoher Unsicherheit wurden trotzdem korrekt klassifiziert und markieren Intervalle, die eine genauere Prüfung verdienen, statt die Ergebnisse pauschal zurückzuweisen.

Vom Fallbeispiel zum praktischen Werkzeug

Insgesamt liefert diese Arbeit mehr als ein genaues Modell: Sie bietet eine vollständige, transparente Pipeline für die Analyse von Sedimentkernen. Durch die sorgfältige Auswahl der Netzwerkarchitektur, die Anpassung des Sichtfelds an menschliche Denkweisen und das Verknüpfen jeder Vorhersage mit visuellen Erklärungen sowie Unsicherheitsabschätzungen zeigen die Autorinnen und Autoren, wie KI Expertenurteil unterstützen statt ersetzen kann. Derselbe Ansatz lässt sich auf andere geowissenschaftliche Bilder anpassen — von Hangrutschungen bis zu Reservoirdolomit‑ oder -gesteinen — wo Vertrauen, Interpretierbarkeit und offene Daten ebenso wichtig sind wie rohe Genauigkeit.

Zitation: Di Martino, A., Carlini, G. & Amorosi, A. Explainable artificial intelligence for sedimentary facies segmentation. Sci Rep 16, 5984 (2026). https://doi.org/10.1038/s41598-026-36765-y

Schlüsselwörter: erklärbare KI, sedimentäre Fazies, geowissenschaftliche Bildgebung, Bohrkernanalyse, Modellunsicherheit