Clear Sky Science · pl
Kompletny zestaw zdjęć wnętrza jamy ustnej zrobionych smartfonem, z adnotacjami, dla lepszej diagnostyki chorób jamy ustnej
Dlaczego twój telefon może pomóc wykryć raka jamy ustnej
Większość z nas nosi w kieszeni potężny aparat, a jednak rzadko używa go do poszukiwania wczesnych oznak choroby wewnątrz jamy ustnej. Rak jamy ustnej i jego zwiastuny często pozostają niezauważone, dopóki nie osiągną zaawansowanego stadium, zwłaszcza w społecznościach z ograniczonym dostępem do specjalistów. W badaniu opisano projekt SMART‑OM — starannie wyselekcjonowany zbiór fotografii wnętrza jamy ustnej, wszystkie wykonane zwykłymi smartfonami i szczegółowo oznaczone przez ekspertów stomatologicznych. Celem jest dostarczenie badaczom surowego materiału niezbędnego do tworzenia narzędzi sztucznej inteligencji, które potrafią wskazać niepokojące zmiany na długo przed tym, jak staną się śmiertelne.

Globalny problem wewnątrz jamy ustnej
Raki warg i jamy ustnej zabijają niemal dwieście tysięcy osób rocznie na świecie, przy setkach tysięcy nowych przypadków, a ciężar choroby jest szczególnie duży w krajach o niskich i średnich dochodach. Główne czynniki ryzyka to tytoń, alkohol oraz żucie orzecha areca; szczególnie narażeni są mężczyźni i osoby starsze. Wczesne rozpoznanie znacząco poprawia przeżywalność, lecz w wielu regionach trudno uzyskać dostęp do specjalisty, a rutynowe badania jamy ustnej opierają się na oku i doświadczeniu dentysty. Oznacza to, że subtelne plamy czy szorstkie obszary mogą zostać przeoczone, a różni lekarze mogą inaczej interpretować to, co widzą. Niedrogi i powszechnie dostępny sposób rejestrowania i przeglądania wnętrza jamy ustnej mógłby wnieść realną różnicę.
Przekształcanie smartfonów w narzędzia przesiewowe
Projekt SMART‑OM miał na celu uchwycenie wysokiej jakości zdjęć jamy ustnej w realnych warunkach środowiskowych przy użyciu tylko dwóch popularnych smartfonów — jednego z Androidem i jednego iPhone’a. Pracownicy służby zdrowia w społeczności i dentyści w południowych Indiach odwiedzali domy i obozy stomatologiczne, rekrutując dorosłych, którzy zgodzili się na badanie. Dla każdego uczestnika wykonano osiem standardowych ujęć obejmujących język, policzki, wargi oraz górne i dolne łuki zębowe. Zadbano o użycie głównie naturalnego światła, ustawienie aparatu zaledwie kilka centymetrów od obszaru obrazowanego oraz prostych narzędzi, takich jak lusterka dentystyczne czy drewniane patyczki, aby delikatnie odciągnąć policzki i wargi. Rozmazane lub źle oświetlone zdjęcia powtarzano, a cały proces zbierania danych prowadzono zgodnie ze ścisłymi zasadami etycznymi — twarze pozostawały poza kadrem, a dane osobowe były w pełni anonimizowane.
Z surowych zdjęć do bogatych, oznaczonych danych
Łącznie zespół zebrał 2 469 zdjęć od 331 osób. Każde zdjęcie sklasyfikowano do jednej z czterech grup: tkanka całkowicie zdrowa; niegroźne warianty wyglądu; zaburzenia potencjalnie przednowotworowe, które mogą przekształcić się w raka; oraz potwierdzony rak jamy ustnej. Następnie eksperci‑chirurdzy stomatologiczni poszli dalej niż proste etykiety i odrysowali szczegółowe obrysy na obrazach przy użyciu narzędzia do adnotacji open‑source. Niektóre wersje oznaczają tylko główny obszar zainteresowania, inne mapują każdą widoczną strukturę, a specjalne wersje skupione na zmianach patologicznych obrysowują podejrzane plamy i guzki. Oprócz zdjęć zbiór danych zawiera pliki arkuszy kalkulacyjnych określające, co reprezentuje każdy narysowany obszar, oraz oddzielne tabele opisujące wiek i płeć uczestników, nawyki takie jak palenie czy żucie betelu oraz wyniki kliniczne. To połączenie obrazów i kontekstu ma wspierać zarówno systemy oparte wyłącznie na obrazie, jak i modele multimodalne.

Testowanie modeli SI
Aby pokazać użyteczność SMART‑OM, badacze wytrenowali kilka popularnych modeli głębokiego uczenia pierwotnie opracowanych do ogólnego rozpoznawania obrazów, aby wykonały dwa zadania: rozróżnienie obrazów prawidłowych od nieprawidłowych oraz rozróżnienie między czterema grupami diagnostycznymi. Podzielili zbiór danych na części treningowe i testowe i dopracowali modele takie jak ResNet, VGG, EfficientNet oraz Vision Transformer. Mimo że dane były zdominowane przez obrazy zdrowe i zawierały stosunkowo mało przypadków raka i wysokiego ryzyka, najlepszy model — stosunkowo kompaktna odmiana ResNet — poprawnie sklasyfikował blisko dziewięć na dziesięć obrazów testowych ogółem. Model był szczególnie niezawodny w rozpoznawaniu zdrowych jam ustnych i stosunkowo dobry — choć mniej konsekwentny — w wykrywaniu nieprawidłowości, co odzwierciedla naturalną nierównowagę danych i subtelne różnice wizualne między kategoriami.
Co to oznacza dla codziennej opieki
Dla osób niebędących specjalistami kluczowe przesłanie jest takie, że SMART‑OM tworzy podstawy do przekształcenia zwykłego smartfona w pomoc do wczesnego przesiewu raka jamy ustnej. Udostępniając ten duży, starannie adnotowany i w pełni zanonimizowany zbiór publicznie, autorzy dają badaczom na całym świecie wspólne źródło do trenowania i porównywania narzędzi SI, które mogą wskazywać podejrzane obszary, łączyć wskazówki obrazowe z danymi o stylu życia oraz pomagać w decyzji, kto wymaga bliższej oceny przez dentystę lub patologa. Chociaż obecny zbiór nadal zawiera stosunkowo niewiele prawdziwych przypadków nowotworowych, wiernie odzwierciedla to, co obserwuje się w społecznościach i będzie się z czasem powiększać. W miarę jego rozwoju SMART‑OM ma szansę wspierać dokładniejsze, bardziej dostępne i tańsze badania w kierunku groźnych zmian w jamie ustnej, potencjalnie ratując życie przez wcześniejsze wykrycie.
Cytowanie: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5
Słowa kluczowe: rak jamy ustnej, fotografia smartfonem, medyczne SI, zmiany w jamie ustnej, zbiór danych przesiewowych