Clear Sky Science · pl

Badanie, jak głębokie uczenie odszyfrowuje anomalną dyfuzję za pomocą Grad-CAM

2026-03-29 · Powrót do spisu

Obserwowanie błąkających się cząstek za pomocą inteligentnych narzędzi

Od buzujących cząsteczek w komórce po wahania ceny akcji — wiele zjawisk w przyrodzie porusza się w sposób, który wymyka się prostym, przewidywalnym regułom zwykłej dyfuzji. Naukowcy wiedzą, że różne ukryte mechanizmy mogą generować takie nietypowe ścieżki, lecz rozpoznanie, który z nich działa, na podstawie krótkiego, zaszumionego zapisu jest trudne. W tym badaniu pokazano, jak współczesna sztuczna inteligencja potrafi nie tylko przyporządkować te błąkające się trajektorie do typów, lecz także ujawnić, które fragmenty każdej ścieżki mają największe znaczenie dla jej decyzji.

Dziwny ruch wokół nas

W podręcznikach ruch losowy często przedstawiany jest jako spacer pijanego, gdzie średnie rozproszenie pozycji rośnie jednostajnie w czasie. Ruch w rzeczywistości rzadko jest tak dobrze uformowany. W żywych komórkach, systemach społecznych i rynkach finansowych rozproszenie pozycji może rosnąć szybciej lub wolniej niż oczekiwano — zachowanie to nazywa się anomalią dyfuzji. Fizykowie opracowali wiele modeli matematycznych, aby to wytłumaczyć, od spacerów z długimi oczekiwaniami po trajektorie z długą pamięcią. Jednak patrząc na pojedynczą zarejestrowaną trajektorię, trudno rozróżnić te modele, zwłaszcza gdy dostępne jest tylko krótkie okno czasowe, a dane są zaszumione.

Nauczanie sieci neuronowej odczytywania ścieżek

W oparciu o niedawne prace w ramach wyzwania Anomalous Diffusion (AnDi) autorzy zaprojektowali narzędzie głębokiego uczenia nazwane ResAnDi do klasyfikacji trajektorii ruchu. ResAnDi opiera się na popularnej architekturze rozpoznawania obrazów znanej jako sieć rezydualna (residual network), zaadaptowanej do obsługi szeregów czasowych dwuwymiarowych pozycji zamiast kolorowych pikseli. Jest trenowana na symulowanych trajektoriach pochodzących z ośmiu różnych mechanizmów ruchu, w tym standardowego ruchu Browna oraz kilku wariantów subdyfuzyjnych i superdyfuzyjnych. Po przepuszczeniu trajektorii przez 18 ułożonych warstw przetwarzających, sieć zwraca prawdopodobieństwa, że ścieżka pochodziła z każdego z mechanizmów, osiągając dokładność porównywalną z czołowymi zgłoszeniami w wyzwaniu AnDi, mimo że musi rozróżnić większą liczbę klas.

Skierowanie reflektora na kluczowe momenty
Figure 1. Jak SI odczytuje błąkające się ścieżki cząstek, by rozróżnić różne rodzaje dziwnego ruchu

Systemy głębokiego uczenia często są krytykowane jako czarne skrzynki, ponieważ mogą podać prawidłową odpowiedź, nie ujawniając, jak do niej doszły. Aby otworzyć tę skrzynkę, autorzy zastosowali technikę z wyjaśnialnej SI znaną jako Grad-CAM, która przypisuje „wynik relewancji” różnym fragmentom wejścia. Zaadaptowany tutaj Grad-CAM uwypukla odcinki trajektorii, które najbardziej wpływają na ostateczny wybór ResAnDi. Zespół testuje, czy te oceny odzwierciedlają rzeczywistą informację, selektywnie wymazując fragmenty trajektorii. Gdy spłaszczają segmenty o najwyższych ocenach Grad-CAM, dokładność klasyfikacji spada znacznie bardziej niż przy wymazywaniu losowych segmentów tej samej wielkości. Pokazuje to, że sieć nauczyła się polegać na specyficznych, informacyjnych odcinkach ruchu, które często odpowiadają rzadkim, lecz wymownym fluktuacjom.

Wykorzystanie wyjaśnień do walki z szumem i znajdowania wzorców
Figure 2. Jak mapa cieplna SI (Grad-CAM) uwypukla najbardziej informacyjne odcinki zaszumionej trajektorii

Oceny Grad-CAM sugerują także inteligentniejszy sposób rozszerzania danych treningowych. Zamiast losowo augmentować trajektorie, autorzy koncentrują się na tych, których segmenty mają tendencję do wysokich ocen relewancji, obracają je i dodają do zbioru treningowego. Kiedy następnie testują sieć na zaszumionych trajektoriach, taka ukierunkowana augmentacja sprawia, że klasyfikator jest konsekwentnie bardziej odporny niż przy standardowej, losowej augmentacji, szczególnie gdy szum pomiarowy jest silny. Aby zrozumieć, czego naprawdę nauczyła się sieć, zespół bada jej wewnętrzne warstwy i wiąże oceny Grad-CAM z prostymi statystykami ruchu, takimi jak korelacje kolejnych kroków, zmiany kierunku, odchylenie rozmiarów kroków od rozkładu normalnego oraz zmiany skutecznej "szybkości rozprzestrzeniania" w czasie. Różne mechanizmy pozostawiają odrębne odciski w tym, jak silnie te statystyki pokrywają się z wysokimi ocenami Grad-CAM.

Zaglądanie w myślenie SI

Łącząc testy wydajności, wizualizacje i staranne kontrole statystyczne, badanie przedstawia spójny obraz tego, jak głęboka sieć odszyfrowuje złożony ruch. Wczesne warstwy koncentrują się na bardzo lokalnych cechach, takich jak skłonność kroków do odwracania się lub kontynuacji, podczas gdy głębsze warstwy wychwytują wolniejsze trendy, np. stopniowe zmiany w skali, na jaką cząstka się przemieszcza. Grad-CAM działa jako pomost między tymi ukrytymi obliczeniami a ludzką intuicją, wskazując, które fragmenty trajektorii i jakie typy wzorców są najbardziej informacyjne. Dla osób nietechnicznych najważniejszy wniosek jest taki, że SI można nauczyć nie tylko etykietować trudne ruchy cząstek z wysoką dokładnością, lecz także wskazywać konkretne części danych, które uzasadniają jej werdykt, torując drogę do bardziej przejrzystej i odporniejszej na szum analizy złożonego ruchu w fizyce, biologii i poza nimi.

Cytowanie: Bae, J., Baek, Y. & Jeong, H. Exploring how deep learning decodes anomalous diffusion via Grad-CAM. Nat Commun 17, 4575 (2026). https://doi.org/10.1038/s41467-026-71229-x

Słowa kluczowe: anomalna dyfuzja, głębokie uczenie, Grad-CAM, trajektorie cząstek, wyjaśnialna SI