Clear Sky Science · ru

Влияние дезинформации от ИИ на точность диагностики и калибровку уверенности у начинающих медицинских студентов

· Назад к списку

Почему умные машины всё ещё могут вводить новичков в заблуждение

Искусственный интеллект быстро проникает в аудитории и клиники, обещая более быстрое обучение и более умные решения. Но что происходит, когда студенты полагаются на ИИ при разборе сложных медицинских задач и объяснение звучит убедительно, но неверно? Это исследование проверяет эту реальную дилемму на младших курсах медицинских факультетов и дает тревожный ответ: вводящие в заблуждение объяснения от ИИ активно вредят обучению, тогда как идеально верные объяснения часто помогают намного меньше, чем можно было бы надеяться.

Figure 1
Figure 1.

Проверка трёх типов помощи от ИИ

Исследователи в Китае провели рандомизированное исследование с участием 111 младших медицинских студентов, имевших базовую подготовку по наукам, но мало клинического опыта. Все студенты ответили на 25 сложных вопросов в формате множественного выбора, имитирующих реальные лицензионные экзамены. Одна группа видела только вопросы. Вторая группа получала тщательно проверенные, одобренные экспертами объяснения от ИИ, указывающие на правильный ответ. Третья группа видела объяснения в стиле ИИ, отшлифованные и правдоподобные, но намеренно подводящие к конкретному неправильному выбору. После каждого вопроса студенты выбирали ответ и оценивали степень своей уверенности.

Когда неверное руководство хуже, чем отсутствие помощи

Результаты показали резкий дисбаланс между выгодой и вредом. Студенты, получившие вводящие в заблуждение объяснения, показали значительно худшие результаты по сравнению с теми, кто не получал объяснений: их точность упала примерно с одного правильного ответа из пяти до менее чем одного из десяти. В то же время студенты, получившие правильные объяснения от ИИ, выступили лишь немного лучше контрольной группы, и разница не была статистически значимой. Иными словами, отшлифованные, но неверные указания решительно толкали студентов в неверном направлении, тогда как отшлифованные и правильные объяснения не обеспечивали надежного повышения результатов по сравнению с работой в одиночку.

Figure 2
Figure 2.

Уверенные ошибки и «ловушка правдоподобия»

Картина стала ещё более тревожной, когда исследователи проанализировали уверенность. Любое объяснение от ИИ — верное или ложное — заставляло студентов чувствовать себя более уверенно по сравнению с теми, кто работал без помощи. Однако только группа с правильными объяснениями показала здоровую «калибровку»: уверенность была выше для правильных ответов, чем для неправильных. В группе с вводящими в заблуждение объяснениями уверенность оставалась высокой как при правильных, так и при неправильных ответах, то есть студенты не могли полагаться на собственное чувство уверенности, чтобы отличить корректное рассуждение от ошибочного. Детальные анализы показали, что обманчивые объяснения часто направляли студентов к конкретному неправильному варианту: в группе с дезинформацией более 70% неверных ответов приходились на ту самую опцию, которую ИИ ненавязчиво поддерживал. Некоторые объяснения работали как «полуправды», используя точные детали для обоснования ошибочного вывода, с которым новички не могли успешно спорить.

Почему это важно для медицинской подготовки

Эти выводы резонируют с опасениями по поводу «смещения автоматизации», когда люди слишком сильно полагаются на компьютерные результаты вместо того, чтобы тщательно проверять информацию. В области, насыщенной знаниями, как медицина, опасность заключается не только в неверном ответе — а в неверном ответе, который кажется полностью обоснованным. Исследование указывает, что простое внедрение разговорного ИИ в учебные привычки студентов в роли дружелюбного наставника рискованно, особенно когда учащиеся слишком неопытны, чтобы заметить тонкие ошибки. Авторы предлагают, чтобы медицинские вузы перестали рассматривать ИИ как всеведущего учителя и использовали его как материал для структурированных упражнений по «аудиту ИИ». В этих упражнениях студенты практиковались бы в разборе объяснений ИИ, проверяли бы утверждения по надёжным источникам и учились распознавать разницу между гладким, но поверхностным рассуждением и действительно обоснованным.

Что это значит для будущих врачей и их инструментов

Проще говоря, вывод исследования суров: для начинающих медицинских студентов плохие объяснения от ИИ наносят больше вреда, чем хорошее объяснение приносит пользы. Вводящие в заблуждение указания не только снижают вероятность правильного ответа, но и оставляют студентов ошибочно уверенными в своих ошибках. Чтобы защитить будущих пациентов, преподавателям и разработчикам ИИ предстоит создать системы и учебные программы, которые заставят студентов замедлиться, покажут типичные паттерны ошибок ИИ и поощрят критическую проверку вместо слепого доверия. Цель не в том, чтобы отвергнуть ИИ, а в том, чтобы научить новое поколение врачей вдумчиво его ставить под сомнение, чтобы умные инструменты стали партнёрами в безопасной помощи, а не источниками убедительной дезинформации.

Цитирование: Teng, D., Tan, L., Cao, Q. et al. Impact of AI misinformation on diagnostic accuracy and confidence calibration in novice medical students. npj Digit. Med. 9, 356 (2026). https://doi.org/10.1038/s41746-026-02547-z

Ключевые слова: ИИ в медицинском образовании, дезинформация, диагностическое мышление, уверенность студентов, смещение автоматизации