Clear Sky Science · pl
Sztuczna inteligencja w diagnozowaniu i stratyfikacji gruczolaków pęcherzykowych tarczycy w badaniu wieloośrodkowym
Dlaczego to ma znaczenie dla osób z guzkami tarczycy
Wiele osób wykrywa guzki tarczycy podczas rutynowych badań i przeżywa nerwowe tygodnie oczekiwania na wiadomość, czy zmiana jest niegroźna, czy złośliwa. Badanie to sprawdza, czy sztuczna inteligencja (SI) potrafi odczytywać obrazy ultrasonograficzne konkretnej grupy zmian — zwanych guzami pęcherzykowymi — dokładniej niż eksperci, pomagając pacjentom uniknąć niepotrzebnej operacji przy jednoczesnym zagwarantowaniu, że nie przeoczy się groźnych nowotworów.
Kiedy to, co niegroźne i groźne, wygląda tak samo
Guzy pęcherzykowe tarczycy występują w dwóch głównych postaciach: gruczolakach (adenomach), które są łagodne, oraz rakach (carcinoma), które mogą naciekać naczynia krwionośne i dawać przerzuty. Zarówno w badaniu mikroskopowym, jak i w badaniach ultrasonograficznych, te zmiany często wyglądają bardzo podobnie. Nawet doświadczeni radiolodzy i patolodzy mają trudności, by je rozróżnić przed operacją, co skutkuje tym, że wielu pacjentów przechodzi usunięcie połowy lub całej tarczycy jedynie po to, by uzyskać rozstrzygającą diagnozę. Stawka jest wysoka: niektóre raki są tylko słabo inwazyjne i mają dobry rokowania, podczas gdy inne są bardziej agresywne, dlatego poznanie dokładnego typu wpływa na zakres operacji i dalszej opieki.

Nauka komputera czytania ultradźwięków tarczycy
Naukowcy zgromadzili jeden z największych zbiorów obrazów ultrasonograficznych guzów pęcherzykowych tarczycy do tej pory, korzystając z danych 2 567 pacjentów z 31 szpitali w całych Chinach. Dla każdego guzka radiolodzy obrysowali istotny obszar na standardowych czarno-białych obrazach USG. Nowoczesny system uczenia głębokiego, oparty na architekturze wizualnej znanej jako ConvNeXt, był następnie trenowany etapami. Najpierw nauczył się odróżniać łagodne gruczolaki od raków. Następnie, wśród raków, nauczył się je klasyfikować na mniej inwazyjne i bardziej inwazyjne podtypy, co w przybliżeniu odpowiada chorobie o niskim, pośrednim i wysokim ryzyku. Zespół testował różne rodzaje informacji ultrasonograficznej i stwierdził, że proste obrazy w trybie B — standardowe skany w skali szarości — były dla SI bardziej wiarygodne niż kolorowe obrazy przepływu krwi, które zbyt mocno się różniły jakością.
Jak dobrze SI sprawdziła się w rzeczywistości
Aby sprawdzić, czy system utrzyma skuteczność poza laboratoriami, w których go zbudowano, autorzy przetestowali go na trzech niezależnych grupach pacjentów z innych szpitali, każdej z innym udziałem zmian łagodnych i złośliwych. W tych ośrodkach SI wykazała konsekwentnie wysoką skuteczność w rozróżnianiu gruczolaków od raków, z miarami dokładności (wartości AUC) w przybliżeniu 0,82–0,85. Dobrze poradziła sobie również z trudniejszym zadaniem: przyporządkowywaniem nowotworów do trzech grup — łagodnych, słabo inwazyjnych i bardziej agresywnych nowotworów inwazyjnych — utrzymując wysoką wydajność we wszystkich szpitalach. Co ważne, model działał podobnie dobrze u mężczyzn i kobiet, przy różnych podejściach chirurgicznych i w większości regionów geograficznych, co sugeruje, że mógłby być użyteczny w szerokim spektrum warunków klinicznych.
Współpraca z radiologami, nie zastępowanie ich
Badanie postawiło także praktyczne pytanie: czy ta SI rzeczywiście pomaga lekarzom podejmować lepsze decyzje? Gdy radiolodzy opierali się tylko na ustalonych skalach oceny ultrasonografii tarczycy, ich skuteczność w identyfikowaniu raków była wyraźnie słabsza niż SI. Po pokazaniu wyniku wygenerowanego przez SI oraz jej podświetlonych „map uwagi” na tych samych obrazach, ich dokładność wzrosła i w niektórych przypadkach niemal zrównała się z wynikami komputera. Najwięcej skorzystali młodsi lekarze, ale nawet doświadczeni specjaliści zyskali przewagę. Analiza przypadków, które SI sklasyfikowała błędnie, ujawniła kluczową słabość: w tych obrazach system miał tendencję do koncentrowania się na obszarach poza prawdziwym guzem zamiast na podejrzanych cechach wewnętrznych, wskazując obszary wymagające dalszych usprawnień.

Co to może oznaczać dla pacjentów
Mówiąc wprost, praca ta sugeruje, że dobrze wyszkolona SI może pełnić rolę drugiego, wyjątkowo spójnego zestawu oczu podczas analizy ultrasonografii tarczycy. Dla pacjentów z guzami pęcherzykowymi takie narzędzie mogłoby zwiększyć prawdopodobieństwo rozpoznania groźnego raka przed operacją, jednocześnie zmniejszając ryzyko, że niegroźny gruczolak doprowadzi do nadmiernie agresywnego leczenia. Model nie jest gotowy, by zastąpić ekspertyzę lekarzy i wymaga dalszych testów w innych krajach i na bardziej zróżnicowanych grupach pacjentów. Jednak jako element stanowiska do ultrasonografii lub samego aparatu mógłby wkrótce pomagać w dopasowaniu zakresu operacji i obserwacji do rzeczywistego poziomu ryzyka pacjenta, zmieniając wcześniej mętną sferę diagnostyki tarczycy w jaśniejszą ścieżkę postępowania.
Cytowanie: Li, J., Zhang, H., Zheng, H. et al. Artificial intelligence-enabled ultrasound diagnosis and stratification of follicular thyroid neoplasms: a multi-center study. npj Digit. Med. 9, 313 (2026). https://doi.org/10.1038/s41746-026-02489-6
Słowa kluczowe: USG tarczycy, guz pęcherzykowy, sztuczna inteligencja, stratyfikacja ryzyka nowotworowego, obrazowanie medyczne