Clear Sky Science · de

QKAN: Quanten-Kolmogorov-Arnold-Netzwerke mit Anwendungen in maschinellem Lernen und multivariater Zustandsvorbereitung

· Zurück zur Übersicht

Quantenhirne für komplexe Muster

Viele der heute schwierigsten Probleme – vom Verständnis exotischer Materialien bis zur Analyse hochdimensionaler Daten – betreffen Muster, die sich mit herkömmlichen Computern und neuronalen Netzen nur schwer erfassen lassen. Dieses Papier stellt eine neue Art von „Quantenhirn“ vor, genannt Quantum Kolmogorov‑Arnold Network (QKAN), das für zukünftige fehlertolerante Quantencomputer konzipiert ist. QKAN zielt darauf ab, umfangreiche Quanten‑Datensätze zu verarbeiten und sogar komplexe Quantenzustände effizienter aufzubauen als klassische Verfahren, womit sich potenziell neue Wege für Quantum Machine Learning und Quanten‑Simulation eröffnen.

Figure 1
Figure 1.

Von einer klassischen Mathematikidee zur Quantenarchitektur

Die Arbeit baut auf einer mathematischen Einsicht auf, die als Kolmogorov‑Arnold‑Darstellung bekannt ist: Im Prinzip lässt sich jede glatte Funktion vieler Variablen aus einfachen eindimensionalen Teilen und Summen zusammensetzen. Jüngere „Kolmogorov‑Arnold‑Netzwerke“ (KANs) übertragen diese Idee in ein klassisches neuronales Netzwerkdesign, das viele einfache eindimensionale Aktivierungsfunktionen zusammenführt, anstatt sich hauptsächlich auf Matrixmultiplikationen zu stützen. KANs haben sich in wissenschaftlichen Problemen vielversprechend gezeigt, bei denen zugrundeliegende Formeln strukturiert und interpretierbar sind. Die Autoren nehmen diese konzeptuelle Blaupause und fragen: Können wir eine rein quantenmechanische Version konstruieren, die nativ in der Sprache von Quanten­schaltkreisen lebt?

Quantenmatrizen in Neuronen verwandeln

In QKAN sind die grundlegenden Informations­träger keine gewöhnlichen Zahlen, sondern die Eigenwerte spezieller Quantenmatrizen. Diese Matrizen werden mittels eines standardmäßigen Tricks, der Block‑Codierung, in größere unitäre Operationen eingebettet. Eine mächtige Technik, bekannt als Quantum Singular Value Transformation, erlaubt es dem Schaltkreis, maßgeschneiderte Polynomfunktionen auf diese Eigenwerte anzuwenden und somit die Rolle von Aktivierungsfunktionen in einem neuronalen Netz zu übernehmen. Durch die Anordnung dieser Operationen in einer einzigen oder wenigen „Schichten“ kann QKAN gleichzeitig auf einem exponentiell großen Raum von Eingaben wirken – etwas, das klassische Netze bei vergleichbaren Ressourcen nicht leisten können, wenn die Eingaben selbst quantenmechanisch sind.

Ein breit‑aber‑flaches Quanten‑Netzwerk

Die Autoren zeigen, dass QKAN natürlicherweise eine „breite und flache“ Architektur realisiert. Wenn ein Quanten­gerät eine N‑dimensionale Eingabe effizient block‑codieren kann – etwa einen von einem anderen Algorithmus vorbereiteten Quantenzustand oder einen Hamiltonoperator, der ein physikalisches System beschreibt – dann kann eine QKAN‑Schicht extrem breite Transformationen mit nur polylogarithmischem Overhead in N implementieren. Das Stapeln vieler solcher Schichten ist dagegen teuer, weil die Schaltkreistiefe mit der Anzahl der Schichten ungefähr exponentiell wächst und sich kleine Fehler akkumulieren. Folglich eignet sich QKAN am besten für wenige Schichten und tauscht Tiefe gegen extreme Parallelität in der Breite ein. Das Papier analysiert, wie sich diese Netzwerke mit Quanten­schaltkreisen parameterisieren lassen, wie man sie mit gradientenbasierten Strategien trainiert und wie man niedrigdimensionale Ausgaben effizient ausliest.

Figure 2
Figure 2.

Zustandsvorbereitung als Anwendungsfall

Über Lernaufgaben hinaus dient die gleiche Konstruktion auch als Werkzeug zur Vorbereitung komplizierter Quantenzustände. Die Autoren konzentrieren sich auf eine wichtige Beispielklasse: multivariate Gaußsche Verteilungen, verteilt über ein regelmäßiges Gitter von Punkten. Sie entwerfen ein zweischichtiges QKAN, das zunächst die quadratische Distanz jedes Gitterpunkts vom Ursprung mittels einfacher Polynomtransformationen berechnet und anschließend eine sorgfältig gewählte polynomiale Approximation anwendet, um den exponentiellen Abfall einer Gaußfunktion nachzuahmen. Wenn diese block‑codierte Transformation auf eine uniforme Superposition angewendet und verstärkt wird, ergibt sich ein Quantenzustand, dessen Amplituden einem hochdimensionalen Gaußprofil eng folgen. Die Analyse liefert explizite Schranken für die Anzahl benötigter Quanten­gatter und zusätzlicher Qubits.

Chancen und Grenzen fürs Quantenlernen

Für Nicht‑Spezialisten lautet die zentrale Erkenntnis, dass QKAN eine neue strukturierte Sprache für Quantenalgorithmen bietet, die Ideen aus interpretierbaren neuronalen Netzen mit fortgeschrittenen quantenlinearen Algebra‑Werkzeugen verbindet. Es kann grundsätzlich komplizierte Funktionen von Quantendaten berechnen und multivariate Wahrscheinlichkeitslandschaften mit weniger Schritten als bekannte klassische Methoden zusammenstellen, sofern geeignete polynomiale Approximationen verfügbar sind und effiziente Block‑Codierungen existieren. Gleichzeitig ist QKAN keine sofort einsetzbare Universal­lösung: Die Tiefe muss gering bleiben, die Leistung hängt von guten polynomialen Basen ab, und es bleiben offene Fragen aus den klassischen KANs darüber, wann diese Architektur wirklich überlegen ist. Dennoch erweitert QKAN das Werkzeug­angebot für Quantum Machine Learning und Zustandsvorbereitung und weist auf Quantenmodelle hin, die sowohl leistungsfähig als auch strukturell transparent sind.

Zitation: Ivashkov, P., Huang, PW., Koor, K. et al. QKAN: quantum Kolmogorov-Arnold networks with applications in machine learning and multivariate state preparation. npj Quantum Inf 12, 73 (2026). https://doi.org/10.1038/s41534-026-01202-5

Schlüsselwörter: quantum machine learning, Kolmogorov-Arnold-Netzwerke, Quanten‑Neuronale Netze, Quanten‑Zustandsvorbereitung, Quantum Singular Value Transformation