Clear Sky Science · de

Hochaufgelöstes annotiertes Datenset von Girvanella-Boundstone‑Microfacies aus der Xiannüdong‑Formation, China

· Zurück zur Übersicht

Uralte Riffe treffen auf moderne Algorithmen

Lange bevor Korallen die heutigen tropischen Riffe aufgebaut haben, formten winzige Mikroben bereits komplexe Unterwasserstrukturen auf dem Meeresboden. Diese versteinerten „mikrobiellen Riffe“ dokumentieren, wie frühes Leben die Ozeane vor mehr als 500 Millionen Jahren gestaltete. Die hier beschriebene Studie stellt keinen einzelnen Fossilienfund vor, sondern veröffentlicht ein sorgfältig erstelltes, offenes Datenset von Mikroskopbildern solcher uralten Riffe in China – speziell formatiert, damit moderne Systeme der künstlichen Intelligenz (KI) lernen können, das Gesteinsarchiv eigenständig zu lesen.

Figure 1
Figure 1.

Gesteine aus einem sehr alten Flachmeer

Die Forschung konzentriert sich auf Gesteine der Xiannüdong‑Formation in Südchina, abgelagert im frühen Kambrium, einer Zeit, in der sich das Tierleben rasch diversifizierte und marine Ökosysteme komplexer wurden. Diese Gesteine bewahren eine riffartige Struktur namens Girvanella‑Boundstone, die hauptsächlich von fadenförmigen Cyanobakterien aufgebaut wurde, die kalzifizierte Röhren und Krusten hinterließen. Vermischt mit diesen mikrobiellen Strukturen finden sich Sedimentkörner, Skelettfragmente und Mineralkitt, der die Zwischenräume ausfüllte. Zusammengenommen bilden diese Komponenten eine detaillierte Momentaufnahme eines uralten flachen, wellengerührten Meeresbodens, in dem Biologie und Meereschemie Hand in Hand feste Karbonatplattformen aufbauten.

Gesteinsschnitte in digitale Kacheln verwandeln

Um diese uralte Geschichte für Computer nutzbar zu machen, begann das Team mit Dünnschliffen von Riffgestein, die auf Glasscheiben montiert und unter einem Polarisationsmikroskop hochauflösend abgebildet wurden. Aus 28 ursprünglichen Platten wurden sieben für die detaillierte Verarbeitung ausgewählt. Jedes Ganzplattenbild wurde mit einem regelmäßigen Raster überlagert und dann in viele kleine quadratische Kacheln zerschnitten, jeweils 114 × 114 Pixel groß. Diese Kacheln sind groß genug, um Schlüsseltexturen zu erfassen – wie verwobene mikrobielle Röhren, feinen Schlamm oder grobe Körner – und zugleich klein genug, um als standardisierte „Pixel“ für maschinelles Lernen zu dienen. Dieser Prozess erzeugte zigtausende Bildausschnitte, die zusammen die gesamte Bandbreite der im Gestein vorkommenden Mikrotexturen abdecken.

Figure 2
Figure 2.

Sorgfältige menschliche Labels für maschinelles Lernen

Digitale Bilder allein genügen nicht; KI benötigt auch Beispiele dafür, was jedes Muster bedeutet. Die Forschenden haben daher die verschiedenen Komponenten im Gestein manuell beschriftet: Girvanella‑Krusten, verschiedene Korngrößen, Schlamm, Kitt und andere Merkmale. Sie erzeugten spezielle „Masken“‑Bilder, in denen jedes Pixel heimlich eine numerische Klassenkennung in einem Farbkanal trägt. Ein Python‑Skript nutzte diese Masken, um jede Kachel einer von zehn Microfacies‑Klassen zuzuordnen – etwa Skelett‑Grainstone, geschichteter Microbialit oder dolomitischer Mudstone – basierend auf einer Punktzählregel, die Pixelwerte aufsummiert. Kacheln mit unklaren oder fehlenden Labels wurden automatisch ausgeschlossen. Das finale Datenset wurde in ausgewogenen Anteilen in Trainings‑, Validierungs‑ und Testsets aufgeteilt, und es wurde eine Übereinstimmung von mehr als 95 % zwischen automatisierten und manuell geprüften Labels bestätigt.

Eine FAIR‑Ressource für Geologie und KI

Das fertige Produkt ist ein gut strukturiertes, öffentliches Datenset, das auf Figshare gehostet wird und den FAIR‑Prinzipien (Findable, Accessible, Interoperable, Reusable) folgt. Alle Kachelbilder sind als standardisierte PNG‑Dateien gespeichert, und ihre Labels sowie die Dataset‑Aufteilung sind in einer einzelnen CSV‑Datei dokumentiert. Parallel dazu stellen die Autorinnen und Autoren Open‑Source‑Python‑Code auf GitHub bereit, der die gesamte Pipeline reproduziert: das Zerschneiden der Dünnschnittbilder in Kacheln, Auslesen der verborgenen Labels, Qualitätsprüfung und Organisation der Daten. Das bedeutet, andere Forschende können das Datenset direkt in Deep‑Learning‑Frameworks einspeisen, konkurrierende Modelle an einem gemeinsamen Benchmark vergleichen oder den Workflow an ihre eigenen Gesteinssammlungen anpassen.

Warum das über ein einzelnes Riff hinaus wichtig ist

Indem eine komplexe uralte Riffstruktur in eine organisierte Bibliothek beschrifteter Bildkacheln überführt wird, baut die Studie eine Brücke zwischen frühen Ökosystemen der Erde und modernen KI‑Werkzeugen. Für Nicht‑Spezialisten lautet die Botschaft, dass das Interpretieren von Gesteinstexturen – einst Domäne von Expertpetrographen am Mikroskop – zunehmend mit Algorithmen geteilt werden kann, die auf offen verfügbaren Daten trainiert sind. Dieses Datenset wird Wissenschaftlern helfen, die Klassifikation von Karbonatgesteinen zu automatisieren, Rekonstruktionen längst verschwundener Meere zu verfeinern und Transferlernen auf andere geologische Umgebungen anzuwenden. Einfach ausgedrückt: Es verwandelt einen Schnitt des kambriumzeitlichen Meeresbodens in ein wiederverwendbares Lehrset für Computer und beschleunigt unsere Fähigkeit, die tiefere Geschichte des Planeten, die im Gestein eingeschlossen ist, zu lesen.

Zitation: Choi, S., Kim, D., Hong, J. et al. High-resolution Annotated Dataset of Girvanella Boundstone Microfacies from the Xiannüdong Formation, China. Sci Data 13, 611 (2026). https://doi.org/10.1038/s41597-026-06958-1

Schlüsselwörter: Kambrium‑Riffe, Karbonat‑Microfacies, Geologie‑Datensätze, Deep Learning in den Geowissenschaften, mikrobielle Karbonate