Clear Sky Science · ru

Повышенная устойчивость к отравлению данных и возможность отучения в квантовом машинном обучении

2026-03-09 · Назад к списку

Почему важно очищать плохие данные для ИИ

Современные системы искусственного интеллекта обучаются на огромных наборах примеров, но эти примеры часто несовершенны. Часть размечена неверно по ошибке, другие могут быть умышленно искажены. Как только такие «отравленные» данные попадают в тренировку, они могут незаметно исказить поведение модели в вредоносных направлениях. Эта статья задаёт неожиданный вопрос: если строить обучающие системы на квантовых компьютерах вместо классических, будут ли они по‑другому реагировать на плохие данные — и смогут ли они легче от них «отучиться», когда это потребуется?

Два подхода к обучению на шумной информации

Авторы сравнивают два типа нейросетей, обучаемых на одних и тех же задачах. Одна — привычная классическая сеть, стек взвешенных связей, работающий на обычном компьютере. Другая — квантовая нейросеть, использующая кубиты и квантовые логические элементы для обработки информации в суперпозиции. Обе сети решают две задачи классификации: различение рукописных цифр в наборе MNIST и распознавание двух фаз вещества в квантовой физической модели. В каждом случае исследователи намеренно загрязняют часть обучающих данных — либо переворачивая метки на некоторых примерах, либо заменяя входные признаки случайным шумом — и наблюдают, как каждая модель справляется с этим.

Когда метки лгут, квантовые модели держатся лучше

Наиболее заметное различие проявляется при перевёрнутых метках. Классическая сеть пытается удовлетворить каждое тренировочное наблюдение, включая противоречивые, и постепенно искажает своё внутреннее разделяющее правило, чтобы подстроиться под них. Её качество на новых, невидимых данных стабильно снижается по мере увеличения доли испорченных меток. Напротив, квантовая сеть демонстрирует устойчивую «плато»: в широком диапазоне уровней шума она продолжает хорошо классифицировать чистую валидационную выборку, фактически игнорируя единичные ошибочно размеченные выбросы. Только когда испорченные метки становятся доминирующими — примерно в точке, где половина меток неверна — её производительность внезапно рушится, в виде резкого изменения, похожего на фазовый переход. Такое поведение указывает на то, что квантовый обучающийся предпочитает наибольшую, наиболее согласованную закономерность в данных и рассматривает разрозненные противоречия как несущественные помехи до тех пор, пока они не перекроют истинный сигнал.

Отучить от плохой тренировки квантовой модели легче

Помимо устойчивости к порче данных, авторы изучают «машинное отучение»: насколько эффективно обученную модель можно заставить забыть влияние плохих данных без полной переработки. Они исследуют несколько стратегий: дообучение только на чистой части данных, точечная донастройка исходя из отравленной модели, целенаправленное отталкивание предсказаний модели от того, что она усвоила на плохой подсети, и шаги градиента, отменяющие эффект этих примеров. Для классической сети все эффективные приближённые методы отстают от полной переобучки, что указывает на то, что её внутреннее представление затвердело вокруг отравленных образцов. Квантовая сеть ведёт себя иначе. Даже начиная с отравленного состояния, её можно направить приближенными методами отучения так, чтобы она достигла или превзошла качество дорогой переобучки в тех же временных рамках. Это показывает, что её выученное представление более пластично — достаточно структурировано, чтобы быть полезным, и в то же время гибко, чтобы его можно было исправить.

Скрытый ландшафт устойчивости и пластичности

Чтобы объяснить эти контрастные поведения, авторы изучают «ландшафт функции потерь» — высокоразмерную поверхность, измеряющую, насколько хорошо модель соответствует данным при каждом наборе параметров. Хорошая обобщающая способность связана с широкими, плоскими долинами в этом ландшафте, тогда как хрупкое переобучение часто соответствует острым, узким минимумам. Анализируя, как меняется кривизна этого ландшафта при отравлении данных, они обнаруживают, что классические сети претерпевают драматическое шероховатение: ранее плоская область около решения становится чрезвычайно острой по мере того, как модель запоминает ошибочно размеченные точки. Вырваться из этой крутой впадины во время отучения сложно, что объясняет упорство классической памяти. Квантовые сети, напротив, сохраняют почти ту же мягкую кривизну даже после отравления. Их ландшафты структурно стабильны — это ограничено математикой квантовых преобразований, которая препятствует образованию крайне острых минимумов и естественным образом направляет обучение к гладким, обобщающим решениям.

Что это значит для будущего надёжного ИИ

Для неспециалиста вывод таков: квантовое машинное обучение — это не только скорость или экзотическое оборудование. В этих экспериментах квантовые модели ведут себя скорее как внимательные редакторы, а не как одержимые писцы: они выделяют главную сюжетную линию в шумных данных, сопротивляются влиянию нескольких плохих примеров и их можно уговорить забыть вредное воздействие без полной перестройки. Такое сочетание устойчивости к отравлению и готовности к отучению предполагает новый вид квантового преимущества — основанный на надёжности и безопасности, а не только на вычислительной мощности — намекая, что будущие системы ИИ с квантовым усилением могут стать лучшими партнёрами в шумном и постоянно меняющемся информационном ландшафте.

Цитирование: Chen, YQ., Zhang, SX. Superior resilience to poisoning and amenability to unlearning in quantum machine learning. Nat Commun 17, 3716 (2026). https://doi.org/10.1038/s41467-026-70420-4

Ключевые слова: квантовое машинное обучение, отравление данных, машинное отучение, надёжный ИИ, ландшафт функции потерь