Clear Sky Science · pl
Wyjaśnialna sztuczna inteligencja do segmentacji facji osadowych
Odczytywanie historii Ziemi z cylindrów skalnych
Aby zrozumieć, jak ewoluowały rzeki, delty i wybrzeża — oraz jak stabilne jest podłoże pod naszymi miastami — geolodzy badają długie cylindry osadów wydrążone z podpowierzchni. Interpretacja tych rdzeni to powolna, ekspercka praca. Badanie to pokazuje, jak sztuczna inteligencja (SI), połączona z narzędziami ujawniającymi jej wewnętrzne rozumowanie, może pomóc zautomatyzować to zadanie, jednocześnie pozwalając naukowcom zobaczyć, dlaczego komputer doszedł do określonego wniosku.

Dlaczego rdzenie osadowe są ważne
Osady podpowierzchni rejestrują minione powodzie, zmiany poziomu morza, trzęsienia ziemi i przemieszczenia klimatyczne. Specjaliści dzielą każdy rdzeń na „facje”, warstwy odzwierciedlające odrębne środowiska, takie jak koryta rzeczne, równiny zalewowe o dobrym i słabym drenażu, bagna czy morskie muły. Te rozróżnienia kierują wszystkimi działaniami od rekonstrukcji paleoklimatu po oceny zagrożeń sejsmicznych i stabilności gruntu. Jednak dokładne mapowanie facji wymaga lat szkolenia w sedymentologii, a nawet eksperci napotykają niejednoznaczności, gdy warstwy wyglądają podobnie lub rdzenie są uszkodzone. Uczynienie tej pracy bardziej dostępną i spójną to kluczowa motywacja do zastosowania SI.
Nauczanie sieci neuronowej rozpoznawania warstw
Autorzy użyli publicznego zestawu zdjęć rdzeni o wysokiej rozdzielczości z osadów holoceńskich (ostatnie ~11 700 lat) z północnych Włoch. Każde zdjęcie zostało drobiazgowo oznaczone sześcioma głównymi facjami — piaski rzeczne, dobrze i słabo drenujące muły równin zalewowych, osady bagienne, warstwy torfu oraz muły prodelta — plus klasą tła. Szkolili kilka wersji popularnej architektury do segmentacji obrazów, U‑Net, każdą z innym „kręgosłupem” (backbone) uczącym się cech wizualnych. Porównując dokładność i powiązane metryki na zbiorze walidacyjnym i niewidzianym wcześniej zbiorze testowym, stwierdzili, że model oparty na backbone EfficientNet‑B7 oferował najlepsze kompromis pomiędzy wysoką wydajnością a niezawodną generalizacją na nowe rdzenie.
Patrząc na skałę szerzej
Ludzcy geolodzy rzadko decydują o facji na podstawie malutkiego punktu; czytają trendy w górę i w dół rdzenia, takie jak stopniowe wyfinienie ziarn czy pogrubianie warstw. Aby to naśladować, zespół przetestował, ile pionowego kontekstu SI powinna widzieć naraz, trenując najlepszą architekturę na różnych rozmiarach wycinków wycinanych ze zdjęć. Gdy model oglądał tylko małe fragmenty 128×128 pikseli, jego przewidywania były szumne, a pasma facji wydawały się przerwane. W miarę zwiększania rozmiaru wycinków do 256 i 384 pikseli, aż do 512×512 pikseli, segmentacja stawała się gładsza i bliższa interpretacji eksperckiej, zachowując ciała facji jako ciągłe jednostki. Zyski wydajności ustabilizowały się między 384 a 512 pikselami, co sugeruje, że w przybliżeniu ta skala obejmuje większość użytecznego kontekstu dla zadania.

Otwieranie czarnej skrzynki za pomocą map ciepła i niepewności
Samo wysokie wyniki nie wystarczą, gdy SI informuje decyzje o zagrożeniach lub zasobach; użytkownicy muszą widzieć, jak i gdzie model „patrzy”. Autorzy zastosowali zatem dwie rodziny narzędzi wyjaśniających. Najpierw użyli Grad‑CAM do wygenerowania map saliencyjnych — map cieplnych, które uwidaczniają obszary obrazu najbardziej wpływające na każdą decyzję o facji. Mapy te dobrze korelowały z oznaczonymi facjami, uwydatniając na przykład strefy bogate w materię organiczną dla torfu i bagna oraz wyraźnie oddzielając osady od tła. Co ważne, pewne nakładania, takie jak aktywacje torfu w obrębie obszarów bagiennych, odpowiadały sposobowi, w jaki sedymentolodzy konceptualnie grupują te środowiska. Po drugie, oszacowali entropię predykcyjną, uruchamiając model wielokrotnie z losowym dropoutem i podsumowując, jak stabilne były jego przewidywania dla każdego piksela. Strefy o wysokiej entropii często pojawiały się w pobliżu granic facji, w cienkich przewarstwieniach piasków w mułach lub w fragmentach rdzeni zaburzonych podczas wiercenia — dokładnie tam, gdzie eksperci sami by się wstrzymali. Jednak wiele obszarów o wysokiej niepewności było nadal sklasyfikowanych prawidłowo, wskazując interwały, które zasługują na ponowną analizę, zamiast na całkowite odrzucenie wyników.
Od studium przypadku do praktycznego narzędzia
W sumie praca dostarcza więcej niż dokładny model: oferuje kompletny, przejrzysty przepływ pracy do analizy rdzeni osadowych. Poprzez staranny wybór architektury sieci, dopasowanie jej pola widzenia do ludzkiego rozumowania oraz sparowanie każdego przewidywania z wizualnymi wyjaśnieniami i oszacowaniami niepewności, autorzy pokazują, jak SI może wspierać, a nie zastępować ocenę ekspertów. To samo podejście można zaadaptować do innych obrazów geonaukowych — od osuwisk po skały zbiornikowe — gdzie zaufanie, interpretowalność i otwarte dane są równie istotne jak surowa dokładność.
Cytowanie: Di Martino, A., Carlini, G. & Amorosi, A. Explainable artificial intelligence for sedimentary facies segmentation. Sci Rep 16, 5984 (2026). https://doi.org/10.1038/s41598-026-36765-y
Słowa kluczowe: wyjaśnialna SI, facje osadowe, obrazowanie geonaukowe, analiza rdzeni, niepewność modelu