Clear Sky Science · pl
Mieszany mechanizm uwagi w uczeniu wielozadaniowym do rozpoznawania standardowych płaszczyzn płodu w obrębie brzucha i wykrywania kluczowych struktur anatomicznych
Pomoc lekarzom w obserwacji przed narodzinami
Badanie ultrasonograficzne w okresie prenatalnym to jedno z pierwszych okien, przez które rodzice i lekarze mogą zobaczyć stan zdrowia dziecka. Odczytywanie tych ziarnistych czarno‑białych obrazów to jednak umiejętność wymagająca lat praktyki, a drobne szczegóły mogą decydować o wykryciu problemu na wczesnym etapie lub jego przeoczeniu. W tym badaniu przedstawiono system komputerowy mający wspomagać pracę: narzędzie sztucznej inteligencji, które szybko rozpoznaje standardowe widoki brzucha płodu i zaznacza kluczowe narządy, na które zwracają uwagę lekarze podczas rutynowych badań w ciąży.

Dlaczego standardowe widoki są ważne
Podczas badania USG w połowie ciąży klinicysta nie „ogląda tylko na oko”. Świadomie poszukuje zestawu standardowych płaszczyzn płodu. Dla brzucha obejmują one przekroje wykorzystywane do pomiaru obwodu, ujęcia skupione na pęcherzu i pępowinie oraz kilka kątów widzenia nerek i kręgosłupa. Razem te płaszczyzny pozwalają lekarzom oszacować wzrost, sprawdzić wady strukturalne i ocenić ryzyko związane z porodem. Uzyskanie każdej standardowej płaszczyzny wymaga precyzyjnych ruchów ręki i dobrej znajomości anatomii, a podobnie wyglądające przekroje łatwo pomylić — szczególnie przez mniej doświadczony personel lub gdy obrazy są zaszumione.
Przekształcanie obrazów USG w dane
Aby wytrenować komputer do wspierania tego zadania, badacze najpierw zgromadzili dużą kolekcję obrazów ze środowiska klinicznego. W ciągu czterech lat zebrali ponad 6700 zdjęć jamy brzusznej płodu od ponad 3100 ciężarnych w kilku szpitalach, korzystając z różnych aparatów. Doświadczeni lekarze ultrasonolodzy starannie opisali 14 kluczowych struktur anatomicznych na każdym obrazie — takich jak żołądek, pęcherz, nerki, główne naczynia krwionośne, kręgosłup, żebra i pępowina — oraz oznaczyli, do której z siedmiu standardowych płaszczyzn należy dany obraz. Ten pracochłonny proces oznaczania stworzył bogatą „mapę” łączącą wzorce pikseli z klinicznie istotnymi strukturami.
Dwufunkcyjna sztuczna inteligencja z ukierunkowaną uwagą
W oparciu o ten zbiór danych zespół opracował model uczenia głębokiego nazwany FAUSP‑NET. W odróżnieniu od systemów wykonujących tylko jedno zadanie, FAUSP‑NET jest siecią wielozadaniową: w jednym przebiegu jednocześnie wyznacza ramki wokół kluczowych narządów i decyduje, do której standardowej płaszczyzny należy obraz. W rdzeniu modelu znajduje się nowoczesny trzon do wykrywania obiektów, wzbogacony kilkoma komponentami „uwagi”, które pomagają mu koncentrować się na najbardziej informatywnych obszarach i skalach. Niektóre bloki uwagi podkreślają subtelne różnice między podobnymi strukturami (na przykład lewa versus prawa nerka, lub pępowina kontra pobliskie naczynia), podczas gdy inne dostosowują się do narządów o bardzo różnych rozmiarach. Specjalnie zaprojektowana funkcja straty pomaga systemowi uczyć się na podstawie rzadkich lub trudnych do zobaczenia struktur, poprawiając precyzję ich wyznaczania.

Jak dobrze działa system
Po wytrenowaniu FAUSP‑NET przetestowano na obrazach wydzielonych wcześniej do walidacji i porównano z 24 istniejącymi modelami widzenia komputerowego, w tym popularnymi detektorami obiektów i klasyfikatorami obrazów. Okazał się bardziej dokładny od wszystkich nich zarówno w wykrywaniu narządów, jak i w rozpoznawaniu standardowych widoków. W przypadku wykrywania narządów w większości przypadków poprawnie odpowiadał oznaczeniom lekarzy i obsługiwał większość struktur z niemal idealną niezawodnością; jedynie najsłabsze, najmniejsze cechy, takie jak niektóre naczynia i przepona, wciąż stanowiły wyzwanie. W rozpoznawaniu płaszczyzn system prawidłowo klasyfikował obrazy do jednej z siedmiu płaszczyzn brzucha w ponad 97% przypadków. Na standardowym sprzęcie przetwarzał każdy obraz w około 24 milisekundy — na tyle szybko, by nadawać się do użycia w czasie rzeczywistym podczas badania.
Porównanie AI z ekspertami ludzkimi
Aby sprawdzić, jak narzędzie wypada wobec rzeczywistych klinicystów, badacze ocenili je na zupełnie odrębnym zbiorze obrazów z innego szpitala i porównali jego wyniki z juniorami, lekarzami średniego szczebla oraz doświadczonymi ultrasonologami. Dokładność FAUSP‑NET w wykrywaniu struktur i identyfikowaniu standardowych widoków zbliżała się do wyników doświadczonych lekarzy seniorskich, a w wielu przypadkach je dorównywała, przy czym wyraźnie przewyższała mniej doświadczonych diagnostów. Co ważne, system ukończył analizę w czasie krótszym niż jedna setna czasu potrzebnego seniorowi na przeglądanie tych samych przypadków. Techniki wizualizacji pokazały, że model ma tendencję do skupiania się na tych samych obszarach, na których opierają się eksperci, co wspiera jego interpretowalność i potencjalne przyjęcie w praktyce klinicznej.
Co to oznacza dla oczekujących rodzin
W praktycznym ujęciu praca ta pokazuje, że starannie wytrenowany system AI może działać jako druga para oczu podczas prenatalnych badań ultrasonograficznych brzucha płodu. FAUSP‑NET może szybko wskazać, czy uchwycono właściwą płaszczyznę brzucha i czy kluczowe narządy są wyraźnie widoczne, pomagając mniej doświadczonym sonografistom unikać błędów i uwalniając specjalistów, by mogli skupić się na złożonych przypadkach. Chociaż potrzebne są dalsze testy w większej liczbie szpitali i na różnych aparatach, technologia ta wskazuje na przyszłość, w której rutynowe USG w ciąży będzie bardziej spójne, szybsze i mniej zależne od tego, kto trzyma sondę — co może poprawić opiekę nad matkami i dziećmi.
Cytowanie: Li, Y., Huang, Y., Liu, Z. et al. Mixed attention mechanism multi-task learning for fetal abdominal standard plane recognition and key anatomical structure detection. Sci Rep 16, 12324 (2026). https://doi.org/10.1038/s41598-026-40590-8
Słowa kluczowe: badanie prenatalne ultrasonograficzne, brzuch płodu, uczenie głębokie, wykrywanie standardowych płaszczyzn, analiza obrazów medycznych