Dlaczego to ma znaczenie dla przyszłych komputerów
Wiele nadziei związanych z komputerami kwantowymi opiera się na przekonaniu, że będą one uczyć się z danych w sposób niedostępny zwykłym maszynom. Wraz z rozwojem klasycznych algorytmów jednak część proponowanych przewag kwantowych zanika. Ten artykuł stawia celne pytanie: gdy model uczący się kwantowy i jego najlepsza klasyczna kopia się nie zgadzają, czy ta rozbieżność sygnalizuje rzeczywisty zysk, czy jest jedynie mirażem?
Dwa typy uczniów ścigające ten sam wzorzec
Autorzy badają popularną rodzinę modeli kwantowego uczenia maszynowego opartych na wariacyjnych obwodach kwantowych. Obwody te pobierają dane, kodują je w stanach kwantowych, a następnie dokonują pomiaru, który pełni rolę predykcji. Matematycznie zarówno model kwantowy, jak i odpowiednio dobrany model klasyczny można sprowadzić do prostych formuł liniowych działających na tym samym zbiorze cech. Ta wspólna struktura kusi, by zastąpić model kwantowy „substytutem” klasycznym, który stara się naśladować jego zachowanie, co budzi wątpliwości, czy sprzęt kwantowy jest naprawdę potrzebny.
Gdzie klasyczne skróty zaczynają zawodzić Figure 1. Jak modele uczące się kwantowe i klasyczne rozchodzą się, gdy istnieje wiele różnych dopasowań tych samych danych
W ustawieniach wysokowymiarowych istnieje wiele różnych formuł idealnie dopasowujących te same dane treningowe. Klasyczne metody uczenia, takie jak spadek gradientu, mają tendencję do uprzywilejowywania jednego szczególnego rozwiązania: tego o najmniejszej łącznej wadze, znanego jako wybór najmniejszych norm dla metody najmniejszych kwadratów. Potężne klasyczne sztuczki nazywane metodami losowych cech potrafią przybliżyć to preferowane rozwiązanie, używając znacznie mniejszej liczby cech niż pełny model, co często usuwa wszelką przewagę prędkości lub dokładności, jaką mógłby mieć układ kwantowy. Autorzy pokazują, że jeśli model kwantowy faktycznie trafia na to samo rozwiązanie o małej normie wag, metody dekwantyzacji prawdopodobnie zadziałają dobrze.
Przepis na prawdziwe rozdzielenie kwantowe
Główna propozycja polega na przyjrzeniu się rozmiarowi wektora wag modelu kwantowego. Jeśli po udanym treningu wagi kwantowe będą znacznie większe niż w przypadku klasycznego rozwiązania o najmniejszej normie, oba modele muszą leżeć daleko od siebie w przestrzeni możliwych predyktorów. W takim wypadku klasyczny substytut oparty na losowych cechach nie będzie w stanie łatwo śledzić modelu kwantowego, zachowując jednocześnie dobrą uogólnialność. Artykuł rozwija tę ideę dla powszechnych map cech kwantowych zbudowanych z komponentów podobnych do transformaty Fouriera oraz z tzw. obwodów re-uploading, i łączy ją z istniejącymi przykładami z kryptografii, w których uczące się kwantowe już przewyższają klasyczne.
Równoważenie mocy wyrażeniowej i praktycznej zdatności do trenowania Figure 2. Krok po kroku obraz obwodu kwantowego znajdującego inne wysokowymiarowe rozwiązanie niż uczeń klasyczny
Skłanianie modeli kwantowych ku dużym wektorom wag ma jednak haczyk. Wysoce ekspresyjne losowe obwody często cierpią na „koncentrację”, gdzie wyjścia i sygnały treningowe stają się niemal płaskie, co czyni uczenie praktycznie bardzo powolnym. Autorzy analizują to napięcie i konstruują rodziny funkcji matematycznych, które są zarówno dalekie od klasycznego rozwiązania o najmniejszej normie, jak i wystarczająco zróżnicowane, by być użyteczne. Dają też praktyczny sposób oszacowania rozmiaru wektora wag kwantowych bezpośrednio z ewaluacji obwodu, dostarczając eksperymentatorom narzędzie do sprawdzenia, czy wytrenowany obwód prawdopodobnie ucieknie przed klasyczną imitacją.
Co to oznacza dla przewagi kwantowej
Praca nie twierdzi, że modele kwantowe automatycznie przewyższają klasyczne. Zamiast tego przedstawia jasne warunki pokazujące, kiedy model uczący się kwantowy nie może być tanio zastąpiony klasycznym przybliżeniem używającym tych samych cech. Poprzez powiązanie potencjalnej przewagi z tym, jak daleko rozwiązanie kwantowe leży od klasycznego wyboru najmniejszej normy, oraz uwypuklenie roli rozmiaru przestrzeni cech i efektów koncentracji, artykuł szkicuje mapę drogową projektowania przyszłych obwodów kwantowych, które są nie tylko różne od modeli klasycznych, lecz również potencjalnie bardziej użyteczne.
Cytowanie: Thabet, S., Monbroussou, L., Mamon, E.Z. et al. When quantum and classical models disagree: learning beyond minimum norm least square.
npj Quantum Inf12, 81 (2026). https://doi.org/10.1038/s41534-026-01217-y