Clear Sky Science · ru

Преодоление ограничений факторизации по измерениям в дискретных диффузионных моделях через квантовое обучение совместного распределения

· Назад к списку

Почему этот новый поворот в ИИ и квантовой сфере важен

Современные системы ИИ прекрасно справляются с генерацией текста, изображений и других данных, но по‑прежнему испытывают трудности, когда множество частей данных сильно связаны между собой. В этой статье показано, что важный класс генеративных моделей — дискретные диффузионные модели — имеет внутреннее ограничение: по мере роста размерности данных и усиления корреляций их ошибки могут быстро увеличиваться. Авторы предлагают новый подход с использованием квантовых компьютеров для более точного изучения этих сложных взаимосвязей, что теоретически может привести к более быстрым и гибким генеративным моделям по сравнению с современными классическими методами.

Figure 1
Figure 1.

Когда разбиение на части разрушает существенное

Классические дискретные диффузионные модели работают путем постепенного искажения данных шумом и последующего обучения обратного процесса шаг за шагом, чтобы генерировать новые образцы. Чтобы расчеты оставались управляемыми, они рассматривают каждое измерение — например, каждый пиксель изображения или каждый символ в последовательности — как изменяющееся независимо. Такая «факторизация» предотвращает экспоненциальный взрыв сложности, но при этом игнорирует корреляции между измерениями. Авторы анализируют наихудший сценарий, в котором каждая часть данных сильно связана с каждой другой. Они доказывают, что для таких данных несоответствие между истинным распределением и тем, что может выучить факторизованная модель, может расти примерно пропорционально числу измерений. Иными словами, по мере роста размера и структурированности данных классические дискретные диффузионные модели в корне могут не улавливать взаимозависимости частей информации.

Использование квантовых состояний для сохранения корреляций

Предложенная квантовая дискретная модель моделирования денойзинга и диффузии (QD3PM) решает эту проблему, представляя данные не как отдельные классические переменные, а как квантовые состояния. В квантовой системе набор кубитов естественным образом существует в очень большом совместном пространстве, где совместные конфигурации и корреляции хранятся вместе. QD3PM кодирует дискретные данные в этом пространстве, применяет управляемый «диффузионный» процесс, который добавляет шум через квантовые каналы, а затем обучается обращать этот процесс с помощью настраиваемой квантовой схемы. Существенно то, что модель оперирует полным совместным состоянием, поэтому взаимозависимости между измерениями сохраняются на протяжении всего процесса диффузии и денойзинга. Используя версию правила Байеса, адаптированную к квантовой теории, авторы выводят, как вычислить точное «апостериорное» квантовое состояние, которое должно руководить обучением, и проектируют схемы, физически реализующие это обновление.

От многих медленных шагов к единому квантовому скачку

Стандартным диффузионным моделям обычно требуется много шагов постепенного денойзинга, чтобы превратить шум в реалистичный образец, что делает их вычислительно затратными. QD3PM сначала описывается в этом привычном итеративном виде, но затем авторы показывают, как обучить ту же квантовую схему, чтобы она могла прыгнуть непосредственно от шума к чистым данным за один шаг. Они достигают этого, заставляя квантовую схему изучать распределение исходных данных, обусловленное зашумлённым входом, а затем аккуратно комбинируя это выученное отображение с квантовыми правилами диффузии и обновления. Благодаря свойствам квантовых операций и измерений итоговая выборка зависит только от определённых диагональных элементов квантового состояния, что позволяет упростить процедуру без изменения наблюдаемых результатов. Это даёт генератор «в один шаг», который в принципе может быть значительно быстрее классических многошаговых диффузий, при этом моделируя полное совместное распределение.

Figure 2
Figure 2.

Заполняя пробелы без перезапуска

Практическое преимущество QD3PM заключается в том, как естественно она справляется с условными задачами, такими как инпейтинг — заполнение пропущенных частей изображения при наличии видимой области. Поскольку модель описывает полное совместное распределение по всем измерениям, авторы могут условиться на известных значениях просто повторно сбрасывая эти части данных во время шагов денойзинга, позволяя неизвестным частям изменяться. Это мягко направляет процесс выборки к правильному условному распределению без изменения схемы или дообучения. В симуляциях на синтетических наборах данных со слабо структурированными шаблонами типа «пологие полосы и бруски» QD3PM не только точнее подгоняет общее распределение по сравнению с классическими диффузионными моделями и квантовыми моделями, опирающимися на факторизацию, но и демонстрирует устойчивость при реалистичных уровнях шума квантового оборудования и хорошо справляется с условной генерацией.

Что означают эти результаты для будущего

В сумме аналитика и эксперименты показывают, что независимая обработка измерений является серьёзным узким местом для дискретных диффузионных моделей, когда данные сильно коррелированы. Используя вместо этого квантовые состояния для прямого изучения совместных распределений, QD3PM избегает этого ограничения и теоретически может точно соответствовать сложным целевым распределениям в случаях, когда классические факторизованные подходы не справляются. Работа также демонстрирует, что квантовые генеративные модели могут предложить не только высокую выразительную мощь, но и практические преимущества, такие как более быстрая выборка в один шаг и гибкий условный вывод без дообучения. Хотя текущие демонстрации ограничены относительно небольшими системами, которые можно смоделировать на классических компьютерах, предложенная структура даёт конкретную дорожную карту того, как возникающее квантовое оборудование однажды может усилить ключевые механизмы генеративного ИИ.

Цитирование: Chen, C., Zhao, Q., Zhou, M. et al. Overcoming Dimensional Factorization Limits in Discrete Diffusion Models through Quantum Joint Distribution Learning. npj Quantum Inf 12, 49 (2026). https://doi.org/10.1038/s41534-026-01188-0

Ключевые слова: квантовые генеративные модели, диффузионные модели, обучение совместного распределения, высокоразмерные корреляции, условная генерация