Clear Sky Science · pl
Utworzenie encyklopedii dermatopatologii DermpathNet z przepływem pracy opartym na sztucznej inteligencji
Dlaczego nowa biblioteka obrazów skóry ma znaczenie
Raki skóry i inne zmiany często rozpoznaje się, badając cienkie skrawki tkanki pod mikroskopem — dziedzina znana jako dermatopatologia. Jednak obrazy używane do szkolenia lekarzy i testowania narzędzi opartych na sztucznej inteligencji są zwykle ukryte za paywallami lub przepisami o ochronie prywatności. W artykule przedstawiono DermpathNet, bezpłatny, starannie przeglądany zbiór tysięcy obrazów biopsji skóry utworzony przy wsparciu AI. Został zaprojektowany, by ułatwić naukę, weryfikację rozpoznań i rozwój nowych narzędzi komputerowych, czyniąc te czynności bardziej wiarygodnymi dla klinicystów i badaczy na całym świecie. 
Problem ukrytych preparatów dydaktycznych
Większość uczących się medyków korzysta ze szkiełek mikroskopowych lub plików cyfrowych kontrolowanych przez pojedynczy szpital. Materiały te mogą zawierać identyfikatory pacjentów lub być objęte licencjami uniemożliwiającymi udostępnianie. Istniejące zasoby online albo wymagają subskrypcji, albo oferują tylko garść przykładów, albo nie są konsekwentnie weryfikowane przez ekspertów. W efekcie studenci i klinicyści nie mają szerokiego, zaufanego i otwartego zbioru mikroskopowych obrazów skóry obejmującego zarówno powszechne, jak i rzadkie nowotwory. Bez takiego zasobu trudno porównywać przypadki, standaryzować nauczanie czy rzetelnie oceniać rzeczywistą skuteczność systemów widzenia komputerowego.
Jak znaleźć wartościowe obrazy w morzu artykułów
Autorzy zwrócili się do kolekcji Open Access PubMed Central, obszernej biblioteki artykułów biomedycznych, które można legalnie ponownie wykorzystać. Rozpoczęli od uporządkowanego słownika (leksonu) obejmującego 12 grup łagodnych i złośliwych guzów skóry oraz prawie 200 konkretnych rozpoznań, zbudowanego na podstawie wiedzy ekspertów i znormalizowanych słowników medycznych. Przy użyciu tego leksykonu przeszukali PubMed Central pod kątem artykułów, których tytuły lub streszczenia wymieniały te choroby, pobrali pełne teksty i wyodrębnili wszystkie rysunki oraz ich podpisy. Pierwsze przejście dało ponad 200 000 rysunków z ponad 43 000 artykułów — zdecydowanie za dużo, a większość nie stanowiła mikroskopowych obrazów skóry.
Jak AI i słowa kluczowe współpracowały
Aby odróżnić użyteczne obrazy od nieistotnych, zespół stworzył hybrydowy system filtrowania. Jedna część to model głębokiego uczenia wytrenowany na odrębnym zbiorze obrazów medycznych, który ocenia, czy dany obraz przypomina preparat patologiczny. Druga część analizowała podpisy rysunków w poszukiwaniu charakterystycznych fraz, takich jak poziomy powiększenia czy terminy barwień, które zwykle towarzyszą zdjęciom mikroskopowym. Dla bardzo częstych rozpoznań przyjmowano tylko obrazy, które przeszły oba testy, co poprawiło czystość zbioru; dla rzadkich rozpoznań akceptowano obrazy spełniające przynajmniej jedno kryterium, aby nie przegapić nielicznych przykładów. Gdy tę hybrydową metodę porównano ze „złotym standardem” — 651 ręcznie opisanymi obrazami — jej wyniki były silne, z F-score powyżej 90%, lepsze niż stosowanie samej AI czy samych słów kluczowych. 
Co zawiera DermpathNet i jak go używać
Po przetworzeniu przepływ pracy wygenerował 7 772 obrazy obejmujące 166 różnych rozpoznań guzów skóry. Każdy obraz został przejrzany przez dermatopatologów z certyfikatem specjalisty, a każdy plik powiązano z bogatymi metadanymi opisującymi artykuł źródłowy, typ choroby i znormalizowane kody medyczne. Zbiór jest zorganizowany tak, by użytkownicy mogli przeglądać go według kategorii chorób, konkretnego rozpoznania lub pierwotnej publikacji, śledząc jednocześnie informacje licencyjne. Poza zastosowaniami edukacyjnymi autorzy użyli DermpathNet do zbadania granic współczesnego modelu wizji i języka: GPT-4v. Na zadania polegające na identyfikacji konkretnych guzów skóry w tych trudnych obrazach — w formatach prawda/fałsz, otwartych odpowiedzi i wielokrotnego wyboru — model radził sobie słabo, często nie rozpoznając prawidłowego rozpoznania nawet przy krótkiej liście opcji.
Co to oznacza dla lekarzy i maszyn
Dla osób spoza specjalizacji DermpathNet można uznać za wysokiej jakości, otwartą atlas mikroskopowych guzów skóry, zbudowany przy użyciu inteligentnego systemu sortowania, który pozwala ekspertom skupić się na ostatecznej weryfikacji zamiast żmudnego przeglądania. Niższe są bariery szkoleniowe i porównawcze między instytucjami, a zasób uwidacznia trudność zadania wizualnego: nawet najnowocześniejszy system AI miał z tym problem. Autorzy wnioskują, że chociaż AI może pomóc w składaniu takich zasobów, ogólnego przeznaczenia modele nie są jeszcze gotowe, by zastąpić ocenę specjalisty w dermatopatologii. Zamiast tego DermpathNet daje solidną podstawę do nauczania i do budowy kolejnej generacji dedykowanych narzędzi medycznej AI, które rzeczywiście mogą wspomagać diagnozowanie chorób skóry.
Cytowanie: Xu, Z., Lin, M., Zhou, Y. et al. Establishing dermatopathology encyclopedia DermpathNet with Artificial Intelligence-Based Workflow. Sci Data 13, 368 (2026). https://doi.org/10.1038/s41597-026-06715-4
Słowa kluczowe: dermatopatologia, zbiór obrazów medycznych, sztuczna inteligencja, rak skóry, patologia cyfrowa