Clear Sky Science · es

Aprendizaje de circuitos cuánticos parametrizados con gradiente cuántico

2026-02-25 · Volver al índice

Por qué los circuitos cuánticos necesitan mejores trucos de “aprendizaje”

A medida que los ordenadores cuánticos ganan potencia, los científicos esperan utilizarlos para resolver problemas difíciles en química, optimización y aprendizaje automático. Una herramienta clave para esta visión es el circuito cuántico parametrizado: una receta cuántica programable cuyos mandos se ajustan para lograr una tarea deseada. Pero en la práctica, entrenar estos circuitos suele fallar porque el paisaje de configuraciones está lleno de mesetas planas y trampas engañosas, donde los algoritmos convencionales se atascan. Este artículo presenta una forma nueva de aprender tales circuitos dejando que el propio ordenador cuántico indique la dirección de descenso, ayudando a escapar de esas zonas muertas y haciendo el aprendizaje cuántico más fiable.

Dónde se atasca el aprendizaje cuántico

La mayoría de los métodos actuales de aprendizaje cuántico confían en un ordenador clásico para ajustar los parámetros del circuito usando gradientes: pequeños empujones en la dirección que reduce un coste elegido, como energía o error. Sin embargo, en sistemas cuánticos grandes, estos gradientes tienden a volverse extremadamente pequeños casi en todas partes. Aparecen dos problemas relacionados. Primero, existen puntos estacionarios locales desfavorables: lugares donde el gradiente se anula aunque la solución esté aún lejos del óptimo, incluidos mínimos malos y puntos silla. Segundo, hay mesetas estériles: regiones enormes y casi planas donde el gradiente es esencialmente cero en muchas direcciones. En ambos casos, el optimizador clásico no ve una señal útil y el entrenamiento se paraliza, especialmente cuando el número de parámetros ajustables es mucho menor que el tamaño del espacio de estados cuánticos.

Permitir que el dispositivo cuántico proporcione la dirección

Los autores proponen un modelo de optimización anidado que mezcla pasos cuánticos y clásicos en bucle. En lugar de calcular gradientes solo respecto a los parámetros del circuito, el método usa un algoritmo de gradiente cuántico para encontrar la verdadera dirección de máximo descenso directamente en el espacio de estados cuánticos. En cada iteración exterior, el dispositivo cuántico genera un nuevo “estado gradiente” que indica cómo debe cambiar el estado actual para reducir una función de coste polinómica general. Este estado no está ligado a ninguna estructura de circuito fija. A continuación, una rutina clásica intenta aprender una nueva capa de circuito que reproduzca este estado gradiente lo más fielmente posible, orientando efectivamente el circuito en la dirección que recomienda el dispositivo cuántico.

Un circuito adaptativo que sabe cuándo está atascado

Un ingrediente central del método es un indicador que comprueba si el entrenamiento está realmente en un buen mínimo o simplemente atascado con gradientes de parámetro nulos. Al comienzo de cada iteración, el algoritmo mide cuán cerca está la salida actual del circuito del estado gradiente derivado cuánticamente. Si ya coinciden bien, el indicador es casi cero, lo que señala que tanto los gradientes en el espacio de estados como en el espacio de parámetros se han anulado efectivamente y es probable que se haya alcanzado un óptimo verdadero. Si no es así, el método añade automáticamente una nueva capa poco profunda al circuito y la entrena para aproximar mejor el estado gradiente. Este crecimiento por capas, con inicio cálido, hace que cada nueva capa explore solo una región pequeña y relevante en lugar de vagar al azar, lo que ayuda a evitar mesetas estériles causadas por circuitos demasiado profundos inicializados aleatoriamente.

Pruebas en tareas de optimización difíciles

Para ver el método en acción, los autores lo simulan en dos familias de problemas. Una es el problema Max-Cut en grafos pequeños, un banco de pruebas estándar para optimización cuántica. La otra es la minimización de funciones polinómicas de orden superior con múltiples mínimos locales. Tanto en simulaciones ideales como en otras más realistas, donde el estado gradiente solo se reproduce de forma aproximada usando una herramienta de síntesis de circuitos basada en aprendizaje por refuerzo, el método anidado converge de forma consistente a soluciones de alta calidad. El indicador disminuye de forma constante a lo largo de las iteraciones, mostrando que el algoritmo se acerca a mínimos verdaderos en lugar de quedarse en trampas superficiales o mesetas.

Superar a las estrategias existentes en su propio terreno

El nuevo enfoque también se compara con métodos adaptativos populares que crecen puerta por puerta, especialmente ADAPT-VQE, y con el entrenamiento de profundidad fija estándar. En un problema de energía molecular y en varios observables de referencia, el esquema anidado logra costes finales más bajos en escenarios donde los otros métodos se atascan. Parece mucho menos sensible tanto a mesetas estériles como a puntos locales desfavorables, aunque requiere trabajo adicional: cada iteración implica un paso de gradiente cuántico y un pequeño problema de síntesis de circuitos. Los autores sugieren usar su método como una herramienta dirigida—por ejemplo, para escapar de regiones problemáticas al inicio del entrenamiento y luego devolver el control a una optimización clásica más barata una vez que el circuito se encuentre en un paisaje más favorable.

Qué significa esto para el futuro del aprendizaje cuántico

En términos cotidianos, este trabajo da a los ordenadores cuánticos un papel más activo en aprender a programarse a sí mismos. En lugar de depender únicamente de conjeturas clásicas sobre cómo girar los mandos del circuito, el dispositivo cuántico ayuda a trazar la ruta de descenso en su propio espacio de estados de alta dimensión. Esta estrategia facilita evitar regiones planas y confusas que han complicado enfoques anteriores, al menos para una amplia clase de funciones de coste de estilo polinómico. Si bien el método no es gratuito—añade sobrecarga computacional—ofrece una vía práctica para hacer los circuitos cuánticos parametrizados más entrenables, un paso importante hacia aplicaciones útiles de optimización cuántica y aprendizaje automático cuántico tanto en las máquinas ruidosas de hoy como en los dispositivos tolerantes a fallos del futuro.

Cita: Li, K., Wang, Y., Gao, P. et al. Learning parameterized quantum circuits with quantum gradient. npj Quantum Inf 12, 59 (2026). https://doi.org/10.1038/s41534-025-01179-7

Palabras clave: circuitos cuánticos parametrizados, optimización cuántica, mesetas estériles, gradientes cuánticos, algoritmos cuánticos variacionales