Clear Sky Science · ru
Комплексный набор аннотированных изображений полости рта, снятых на смартфон, для улучшения диагностики заболеваний ротовой полости
Почему ваш телефон может помочь обнаружить рак рта
Большинство из нас носит в кармане мощную камеру, но редко используют её для поиска ранних признаков заболеваний внутри полости рта. Рак ротовой полости и его предвестники часто остаются незамеченными до поздних стадий, особенно в сообществах с нехваткой специалистов. В этом исследовании представлен SMART‑OM — тщательно отобранная коллекция фотографий внутренней поверхности рта, все сделанные обычными смартфонами и скрупулёзно размеченные стоматологами‑экспертами. Цель — предоставить исследователям материал для создания инструментов искусственного интеллекта, которые смогут отмечать настораживающие изменения задолго до того, как они станут смертельно опасными.

Глобальная проблема внутри рта
Рак губ и полости рта ежегодно уносит почти двести тысяч жизней во всём мире, при сотнях тысяч новых случаев, и бремя заболевания особенно тяжело в странах с низким и средним уровнем дохода. Табак, алкоголь и пережёвывание ореха бетеля существенно повышают риск, а мужчины и люди старшего возраста пострадали больше всего. Ранний диагноз значительно улучшает выживаемость, но во многих регионах добраться до специалиста сложно, а рутинный осмотр полости рта опирается на глаз и опыт стоматолога. Это означает, что тонкие пятна или шероховатые участки могут быть пропущены, или разные клиницисты могут по‑разному интерпретировать увиденное. Доступный и недорогой способ зарегистрировать и пересмотреть состояние полости рта может реально изменить ситуацию.
Превращая смартфоны в скрининговые инструменты
Проект SMART‑OM поставил задачу зафиксировать качественные изображения полости рта в реальных условиях сообщества, используя всего два распространённых смартфона — Android и iPhone. Работники общественного здравоохранения и стоматологи в Южной Индии посещали дома и стоматологические лагеря, набирая взрослых добровольцев на обследование. Для каждого участника были сделаны восемь стандартных видов, охватывающих язык, щеки, губы и верхнюю и нижнюю зубные дуги. Особое внимание уделялось использованию преимущественно естественного освещения, расположению камеры в нескольких сантиметрах от ткани и применению простых инструментов — зеркал для рта или деревянных палочек — чтобы аккуратно отвести щеки и губы. Размытые или плохо освещённые снимки повторяли, а весь сбор данных проводился в строгом соответствии с этическими правилами: лица оставались вне кадра, а личные данные полностью анонимизировались.
От сырых снимков к богатым, размеченным данным
В общей сложности команда собрала 2469 изображений от 331 человека. Каждое фото было отнесено к одной из четырёх групп: полностью здоровая ткань; безвредные варианты внешнего вида; потенциально злокачественные нарушения, которые могут переродиться в рак; и подтверждённый рак полости рта. Экспертные челюстно‑лицевые хирурги затем пошли дальше простых меток и обвели на изображениях подробные контуры с помощью открытого инструмента аннотации. Некоторые версии отмечают только основную область интереса, другие картируют каждую видимую структуру, а специальные версии, ориентированные на поражения, обводят подозрительные пятна и разрастания. Помимо изображений, набор данных включает таблицы, в которых перечислено, что представляет каждая отмеченная область, и отдельные таблицы с информацией о возрасте, поле, привычках (курение или жевание бетеля) и клинических находках каждого человека. Такое сочетание визуального материала и контекста предназначено для поддержки как моделей, работающих только с изображениями, так и многомодальных ИИ‑систем.

Проверка моделей ИИ
Чтобы показать полезность SMART‑OM, исследователи обучили несколько популярных моделей глубинного обучения, изначально разработанных для общего распознавания изображений, решать две задачи: простую классификацию нормальных и аномальных снимков и различение четырёх диагностических групп. Они разделили набор данных на обучающую и тестовую части и дообучили модели, такие как ResNet, VGG, EfficientNet и Vision Transformer. Несмотря на доминирование в наборе здоровых изображений и сравнительно небольшое число случаев рака и высокорисковых поражений, лучшая модель — относительно компактный вариант ResNet — правильно классифицировала около девяти из десяти тестовых изображений в целом. Она оказалась особенно надёжной в распознавании здоровых ртов и достаточно эффективной — хотя и менее последовательной — в пометке аномалий, что отражает естественный дисбаланс данных и тонкие визуальные различия между категориями.
Что это значит для повседневной помощи
Для неспециалистов главный посыл в том, что SMART‑OM закладывает основу для превращения обычного смартфона в помощь при раннем скрининге рака полости рта. Сделав этот большой, тщательно аннотированный и полностью анонимизированный набор данных общедоступным, авторы дают исследователям по всему миру общий ресурс для обучения и сравнения ИИ‑инструментов, которые могут выделять подозрительные области, сочетать визуальные признаки с данными о факторах риска и помогать решать, кому требуется более тщательное обследование у стоматолога или патолога. Хотя в нынешней коллекции по‑прежнему относительно мало подтверждённых случаев рака, она близко отражает картину, наблюдаемую в сообществах, и будет расти со временем. По мере расширения SMART‑OM способен поддерживать более точные, доступные и недорогие проверки опасных изменений в ротовой полости, что потенциально может спасать жизни за счёт более ранней диагностики.
Цитирование: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5
Ключевые слова: рак полости рта, съемка на смартфон, медицинский ИИ, поражения полости рта, набор данных для скрининга