Clear Sky Science · ru
Melan-Dx: платформа зрительно-языкового интеллекта с медицинскими знаниями улучшает дифференциальную диагностику меланоцитарных новообразований
Почему важно улучшать диагностику меланомы
Меланома — опасная форма рака кожи, которую часто можно вылечить при раннем выявлении, но только если врачи, рассматривающие ткани под микроскопом, верно её распознают. К сожалению, даже опытные специалисты порой расходятся во мнениях, особенно в случае пограничных образований, которые выглядят почти, но не полностью злокачественными. В этой статье описывается Melan‑Dx, новая система искусственного интеллекта, призванная поддерживать специалистов по раку кожи путём сочетания тысяч экспертно размеченных микроскопических изображений со структурированными медицинскими знаниями — для более быстрой, согласованной и прозрачной диагностики.
Создание подробного атласа изображений опухолей кожи
Первым шагом стало формирование высококачественного «атласа» меланоцитарных опухолей — широкой группы новообразований, включающей безобидные родинки и опасные меланомы. Дерматопатологи из Университета Пенсильвании тщательно отобрали и размечали 2 893 микроскопических изображения, охватывающих 44 различных типа меланоцитарных поражений — от распространённых доброкачественных невусов до редких агрессивных меланом. Каждое изображение сосредоточено на области интереса и сопоставлено с трёхуровневой иерархией на основе классификаций опухолей ВОЗ: сначала по широкой категории, затем по подтипу и, наконец, по конкретному диагнозу. Такая структурированная организация отражает способ, которым специалисты мыслят о этих поражениях в повседневной практике.

Обучение ИИ медицинскими знаниями, а не только пикселями
Melan‑Dx выходит за рамки обычных систем, работающих только с изображениями: он сопоставляет снимки с текстовыми описаниями из авторитетных медицинских источников. Для каждого типа заболевания команда собрала короткие структурированные записи, описывающие то, на что обращают внимание патологи — форму клеток, модель роста, результаты специальных окрашиваний и то, как эти признаки отличают одно образование от другого. Большая языковая модель помогла упорядочить эту информацию, но люди‑эксперты проверили её на точность. Затем изображения и тексты преобразуются в числовые «встраивания» и сохраняются в поисковой базе. Это позволяет ИИ не только распознавать визуальные паттерны, но и связывать их с явными диагностическими критериями, подобно врачу, обращающемуся к хорошо индексированному иллюстрированному учебнику.
Как Melan‑Dx рассуждает о новом случае
Когда Melan‑Dx получает новое изображение биопсии, оно обрабатывается двумя скоординированными ветвями. В визуальной ветви модель кодирует картинку и извлекает наиболее похожие примеры из атласа, уделяя больше внимания наиболее близким совпадениям и комбинируя их в усиленное представление. В ветви знаний то же изображение используется для поиска наиболее релевантных текстовых фрагментов, описывающих возможные диагнозы. Специальные «экспертные» модули для каждого типа заболевания взвешивают, какие эталонные изображения и записи знаний имеют наибольшее значение, а блоки слияния объединяют эти подсказки. Система обучается так, чтобы при правильном диагнозе усиленные представления изображения и текста находились близко друг к другу, тогда как несоответствующие пары отдалялись. Такое контрастивное обучение помогает ИИ разделять десятки тонко отличающихся типов опухолей, оставаясь при этом привязанным к медицинским знаниям.

Оценка точности, безопасности и эффективности
Исследователи затем сравнили Melan‑Dx с несколькими ведущими моделями ИИ в патологии по разным задачам. На базовом вопросе «меланома или нет?» Melan‑Dx достигал до 87% точности, превосходя как модели с лёгкой адаптацией, так и полностью переобученные. В более сложной 40‑классовой задаче, охватывающей множество подтипов меланомы и невусов, он добился почти 70% точности для первого предположения и более 87% при учёте трёх предположений, снова опередив конкурентов. Система также соблюдала иерархию заболеваний: при ошибках она чаще путала близкородственные состояния, чем смешивала доброкачественные и злокачественные категории, что лучше отражает клинические риски в реальной практике. На целых слайдах — больших цифровых сканах участков ткани — Melan‑Dx улучшал обнаружение рака как при дефиците обучающих данных, так и при их избытке, причём делал это, сокращая время обучения почти на 90–97%, поскольку базовую визуальную модель не нужно переобучать.
Что это значит для пациентов и врачей
Для пациентов обещание Melan‑Dx — не всеведущий робот‑врач, а более умное второе мнение, которое может помочь снизить число пропущенных меланом и уменьшить ненужное беспокойство от пере диагноза. Для клиницистов система предлагает не просто метку, но и доказательства: она показывает похожие прошлые случаи и ключевые письменные критерии, подтверждающие её предложение, что облегчает проверку её рассуждений. Хотя текущая работа сосредоточена на меланоцитарных опухолях и опирается на тщательно кураторский набор данных из одного центра, та же стратегия — связывание изображений со структурированными медицинскими знаниями и использование поиска для управления ИИ — может быть расширена на многие другие заболевания. Как лёгкий, объяснимый инструмент, предназначенный для сотрудничества человека и ИИ, Melan‑Dx указывает на будущее, в котором патологи остаются ответственными за решения, но получают лучшие инструменты для постановки точных и своевременных диагнозов рака кожи.
Цитирование: Yao, J., Li, S., Liang, P. et al. Melan-Dx: a knowledge-enhanced vision-language framework improves differential diagnosis of melanocytic neoplasm pathology. npj Digit. Med. 9, 171 (2026). https://doi.org/10.1038/s41746-026-02357-3
Ключевые слова: диагностика меланомы, вычислительная патология, медицинский ИИ, визуально-языковые модели, обнаружение рака кожи