Clear Sky Science · ru

Обнаружение MCI по тестам на рисование с использованием остаточного vision-transformer

2026-02-24 · Назад к списку

Почему простые рисунки могут раскрыть скрытые проблемы с памятью

Представьте, что врач смог бы заметить ранние признаки деменции, просто посмотрев на то, как вы рисуете часы, куб или линию связанных кружков. Эти быстрые наброски уже применяются в клиниках, но их оценивают вручную, и оценки сильно зависят от мнения врача. В этой статье показано, как система искусственного интеллекта (ИИ) под названием ResViT может автоматически «читать» такие рисунки, превращая штрихи ручки в раннее предупреждение о легких когнитивных нарушениях (MCI) — стадии между нормальным старением и деменцией, когда лечение и планирование все еще могут существенно помочь.

От бумажных тестов к умному скринингу

Легкие когнитивные нарушения часто проявляются прежде всего в повседневных задачах, требующих планирования, внимания и пространственного мышления — именно то, что проверяют тесты на рисование. Врач обычно просит пациента нарисовать часы, показывающие определенное время, скопировать трехмерный куб или соединить разбросанные числа и буквы в последовательность. Раньше каждый рисунок оценивали визуально, что было медленно и могло сильно отличаться у разных клиницистов. Авторы поставили цель создать более объективную систему, которая смотрит на все три рисунка вместе, используя компьютер для выявления закономерностей, которые могут ускользать от человеческого глаза. Их задача — не заменить врачей, а дать им быстрый и согласованный второй взгляд.

Сочетание двух способов «видеть»: детали и общая картина

Ядро исследования — гибридная модель ИИ ResViT, разработанная для объединения двух дополняющих друг друга подходов к анализу изображений. Одна часть, основанная на технике ResNet, особенно хорошо выявляет тонкие детали — края, углы и небольшие искажения линий на рисунке. Другая часть, Vision Transformer, превосходна в понимании общей компоновки — того, как элементы часов, куба или пути располагаются на странице. Вместо последовательной подачи изображений через эти компоненты система запускает их параллельно и затем объединяет два потока информации в единое, более полное представление о когнитивном состоянии человека.

Как система учится на реальных рисунках пациентов

Чтобы проверить идею, исследователи использовали открытую коллекцию рисунков 918 человек, каждый из которых выполнил задания на рисование часов, куба и тропинки (trail‑making). Когнитивный статус каждого участника уже был оценен по стандартному клиническому тесту, что давало эталонные метки «здоров» или «MCI». Команда преобразовала рисунки в изображения в градациях серого, изменила их размер и применила простые преобразования — повороты и изменение яркости — чтобы сделать модель более устойчивой. Во время обучения ResViT многократно сравнивал свои предсказания с известными метками и корректировал внутренние параметры, применяя такие меры предосторожности, как ранняя остановка и dropout, чтобы не заучивать тренировочные примеры в ущерб общему обучению.

Насколько это хорошо работает и что это показывает

При оценке на людях, которых модель ранее не видела, ResViT правильно разделял здоровых и пациентов с MCI примерно в трех из четырех случаев: точность составила 74,09%, а взвешенная F1‑оценка — около 0,67. Это превзошло несколько сильных альтернатив, включая варианты, использующие только ResNet, только Vision Transformer или другую популярную сеть EfficientNet. Гибридный подход, с примерно третью параметров по сравнению с большим автономным трансформером, особенно хорошо сбалансировал чувствительность к болезни и снижение числа ложных тревог. С помощью визуализации тепловых карт авторы также показали, что модель, как правило, фокусируется на клинически значимых областях — например, цифрах на часах, гранях куба и разветвлениях на тропинке — что указывает на то, что она обращает внимание на те же подсказки, что и человеческие эксперты.

Ограничения сегодня и возможности завтра

Авторы подчеркивают, что их система еще не готова стать универсальным скрининговым инструментом. Набор данных невелик по размеру, смещен в сторону пожилых людей и лишен важной фоновой информации, такой как уровень образования и культурные различия, которые могут влиять на стиль рисования. Модель также может требовать значительных вычислительных ресурсов для устройств с низкой мощностью. Тем не менее, поскольку ResViT можно адаптировать с относительно небольшим количеством новых примеров, его можно расширить для других когнитивных расстройств или новых заданий на рисование по мере появления дополнительных данных. Важными шагами на пути к повседневному применению будут интеграция больших и более разнообразных наборов данных и создание более легких версий модели.

Что это означает для пациентов и их семей

Проще говоря, работа показывает, что тщательно продуманный ИИ может превратить простые бумажные наброски в практичный инструмент для обнаружения ранних признаков проблем с памятью и мышлением. Хотя точность 74% далека от идеала, это обнадеживающий результат для первой линии защиты: дешевой, быстрой и легко повторяемой проверки с течением времени. В будущем отсканированный рисунок из клиники или даже изображение с планшета дома может тихо указывать на тонкие изменения задолго до того, как они станут очевидны в повседневной жизни, давая врачам и родственникам больше времени на реагирование. Вместо замены человеческого суждения системы вроде ResViT могут сделать это суждение более последовательным и своевременным, обеспечивая более раннюю помощь людям с риском развития деменции.

Цитирование: Sirshar, M., Matloob, I., Tayyabah, A. et al. MCI detection from handwritten drawing test using residual vision transformer. Sci Rep 16, 10334 (2026). https://doi.org/10.1038/s41598-026-40716-y

Ключевые слова: легкие когнитивные нарушения, тесты на рисование, глубокое обучение, vision transformer, раннее выявление деменции