Clear Sky Science · pl
Zapewnienie integralności modeli AI: podejście oparte na łańcuchu bloków do ochrony danych treningowych obrazowania medycznego
Dlaczego ochrona skanów medycznych ma znaczenie
Gdy lekarze wykorzystują sztuczną inteligencję do wykrywania guzów mózgu na obrazach MRI, pokładają ogromne zaufanie w danych i oprogramowaniu. Co jednak, jeśli ktoś potajemnie zmodyfikuje te skany, aby AI wyciągała błędne wnioski — albo uznała guz za niegroźny? Ten artykuł opisuje, jak połączenie technologii łańcucha bloków i rozproszonej pamięci plików może zabezpieczyć obrazy medyczne od momentu ich powstania, pomagając zapewnić, że decyzje ratujące życie nie będą oparte na sfałszowanych danych.

Ukryte zagrożenie w obrazach medycznych
Nowoczesne systemy AI, a zwłaszcza modele głębokiego uczenia, potrafią wychwycić subtelne wzorce na obrazach MRI mózgu, które mogą umykać ludzkiemu oku, co zwiększa dokładność i odciąża lekarzy. Jednak wiarygodność tych modeli zależy od wiarygodności obrazów, na których się uczą. Przeciwnicy mogą przeprowadzać ataki „zatrucia danych”, wprowadzając do zbiorów treningowych nieznacznie zmienione skany MRI. Zmiany są tak drobne, że trudno je zauważyć, a mimo to mogą nakierować model AI na niebezpieczne błędy, na przykład systematyczne błędne klasyfikowanie typu guza. Podobne modyfikacje można zastosować na etapie testowania, gdy atakujący subtelnie zmienia pojedynczy skan, aby oszukać wdrożony model i wywołać błędną diagnozę. Ponieważ dzisiejsze przepływy pracy w obrazowaniu medycznym często nie dają silnych gwarancji co do pochodzenia danych i ich nienaruszalności, takie ataki są trudne do wykrycia i mogą mieć druzgocące konsekwencje dla pacjentów.
Dlaczego istniejące zabezpieczenia są niewystarczające
Naukowcy próbowali różnych strategii obrony modeli AI, ale większość z nich leczy objawy, a nie przyczyny. Trening adwersarialny wystawia modele na wiele zmanipulowanych przykładów, dzięki czemu uczą się odporności na konkretne ataki, ale jest to kosztowne obliczeniowo i zwykle chroni tylko przed znanymi sztuczkami. Metody „czyszczenia” obrazu, takie jak kompresja czy usuwanie szumów, mogą usunąć niektóre perturbacje, ale zawodzą wobec bardziej wyrafinowanych ataków i nie dowodzą, skąd pochodziły dane. Inne podejścia, jak cyfrowe znakowanie wodne czy specjalny bezpieczny sprzęt, oferują funkcje wykrywania manipulacji lub chronionej obróbki, lecz zakładają, że obrazy wchodzące do systemu są już wiarygodne. Żadna z tych metod nie zapewnia kompleksowego zapisu całego cyklu życia obrazu medycznego — od chwili wykonania skanu w aparacie, przez przechowywanie i udostępnianie, aż po użycie w treningu AI.
Nowy pipeline danych oparty na wspólnym zaufaniu
Autorzy proponują architekturę, która zaczyna chronić obrazy w chwili ich powstania w ośrodku diagnostycznym. W proponowanym rozwiązaniu współpracują trzy role: DataOwner (np. oddział obrazowania w szpitalu), DataCustodian, który zarządza bezpiecznym przechowywaniem i uprawnieniami, oraz ResearchCenter, które szkoli modele AI. Zamiast umieszczać obrazy bezpośrednio w łańcuchu bloków — co byłoby powolne i ciężkie — surowe pliki MRI są przechowywane w prywatnej, odizolowanej sieci rozproszonych węzłów pamięci, zwanej Prywatnym IPFS. Każdy obraz otrzymuje unikalny kryptograficzny odcisk (identyfikator zawartości), który zmienia się nawet po modyfikacji pojedynczego piksela. Ten odcisk, wraz z informacją o tym, kto przesłał obraz i kiedy, jest następnie zapisywany w uprawnionym łańcuchu bloków zbudowanym na Hyperledger Fabric, dostępnym tylko dla zatwierdzonych organizacji.

Jak system powstrzymuje manipulacje
Kiedy badacz chce użyć obrazów, wysyła cyfrowo podpisane żądanie, które zostaje zarejestrowane na łańcuchu bloków. Tylko uprawnione podmioty mogą zatwierdzić takie żądanie, a sama zgoda staje się częścią trwałego zapisu. Następnie badacz pobiera obraz z prywatnej sieci pamięci i ponownie oblicza jego odcisk. Jeśli nowy odcisk nie zgadza się z tym zapisanym na łańcuchu bloków, obraz zostaje oznaczony jako zmanipulowany i zablokowany przed wejściem do procesu treningu AI. Tworzy to odporny na manipulacje, w pełni audytowalny ślad: każde przesłanie, żądanie dostępu, zatwierdzenie i pobranie jest logowane na wielu niezależnych komputerach, co znacznie utrudnia ciche modyfikacje. Autorzy zaimplementowali ten projekt z użyciem rzeczywistych obrazów MRI guzów mózgu, zmierzyli jego wydajność narzędziem Hyperledger Caliper i wykazali, że system może obsługiwać bezpieczne, niemal w czasie rzeczywistym przesyłanie plików przy niskim wskaźniku błędów i akceptowalnych opóźnieniach.
Co to oznacza dla bezpieczniejszej AI w szpitalach
Mówiąc prosto, proponowany system działa jak zamknięte, przejrzyste sejf dla obrazów medycznych. Każdy może zobaczyć, kiedy skan wchodzi lub opuszcza sejf, a każda próba zmiany skanu zostawia wyraźne ślady. Łącząc uprawniony łańcuch bloków z prywatnym rozproszonym przechowywaniem i ścisłą kontrolą dostępu, ramy te atakują problem u źródła: uniemożliwiają dotarcie zatrutych lub sfałszowanych obrazów do modelu AI. Choć pozostają wyzwania praktyczne — jak integracja tego rozwiązania z istniejącym oprogramowaniem szpitalnym i poruszanie się w złożonych przepisach o prywatności — podejście to otwiera obiecującą drogę do narzędzi AI, którym klinicyści i pacjenci mogą ufać, zwłaszcza w obszarach o wysokich stawkach, takich jak diagnoza guzów mózgu.
Cytowanie: Shinde, R., Patil, S., Kotecha, K. et al. Ensuring the integrity of AI models: a blockchain-based approach for protecting medical imaging training data. Sci Rep 16, 13989 (2026). https://doi.org/10.1038/s41598-026-44040-3
Słowa kluczowe: bezpieczeństwo obrazowania medycznego, blockchain w ochronie zdrowia, ataków adwersarialnych, MRI guza mózgu, godna zaufania sztuczna inteligencja