Logo Studenta

tesis_n7307_Larocca

¡Este material tiene más páginas!

Vista previa del material en texto

UNIVERSIDAD DE BUENOS AIRES
Facultad de Ciencias Exactas y Naturales
Departamento de Física
Optimización en mecánica cuántica
Tesis presentada para optar al título de Doctor de la
Universidad de Buenos Aires en el área de Ciencias Físicas
Lic. Martín Larocca
Director de Tesis: Diego Wisniacki
Consejero de Estudios: Pablo Tamborenea
Lugar de trabajo: Departamento de Física “Juan José
Giambiagi” - FCEyN - UBA.
Ciudad Autónoma de Buenos Aires
Fecha de defensa: 23 de diciembre de 2021
Resumen
Las ultimas décadas han evidenciado una rotunda transformación entorno a la
mecánica cuántica, pasando de ser una mera descripción de la naturaleza a liderar
una nueva revolución tecnológica. Análogamente a lo ocurrido durante la primera ola
de tecnologías cuánticas, donde surgieron algunos de los principales hitos tecnológicos
del mundo moderno, como el transistor, el láser o la resonancia magnética nuclear, la
presente segunda ola, basada en el aprovechamiento de fenómenos puramente cuánti-
cos como superposición y entrelazamiento, promete dar lugar a nuevos avances en las
áreas de computación, simulación, comunicación y metrología, generando un impacto
fundamentalmente disruptivo en la sociedad del presente y futuro próximo.
Uno de los motores de dicha segunda ola de tecnologías cuánticas es, sin lugar
a duda, el control óptimo cuántico. La teoría de control óptimo cuántico nació en
la década de los 80, cuando se comenzaron a aplicar técnicas de control óptimo en
el marco de la química, por ejemplo, para tratar de inducir reacciones mediante el
diseño de pulsos electromagnéticos óptimos, o bien para maximizar la resolución de
imágenes obtenidas mediante resonancia magnética nuclear. Uno de los hallazgos sor-
prendentes de dichos primeros intentos por controlar sistemas dinámicos cuánticos
fue una increíble facilidad para llevar a cabo el control. Con el objetivo de explicar
este fenómeno, surgió la teoría de paisajes de control cuántico. Uno de los resultados
fundamentales de dicha teoría es que, en situación de abundancia de recursos para
el control, dichos paisajes son extremadamente simples y en consecuencia la opti-
mización lo es. Sin embargo, al ir limitando los controles, los paisajes experimentan
una transición de fase en complejidad y el problema se vuelve extremadamente com-
plicado. En este contexto, resulta imprescindible poder determinar precisamente la
cantidad de recursos necesarios para cada problema de control.
Dentro de las oportunidades que ofrece la nueva revolución cuántica, se destaca la
posibilidad de construir computadoras cuánticas. Este nuevo paradigma informático
representa una especie de santo grial para la ciencia e industria modernas, ya que
promete ventajas fundamentales en la capacidad de resolver determinados problemas
2
computacionales (por ejemplo, en la factorización de números enteros). Uno de los
paradigmas de computación cuántica mas prometedores al día de hoy son los algorit-
mos cuánticos variacionales. Este esquema de computación híbrida cuántico-clásica,
basado en añadir parámetros sintonizables en las compuertas de los circuitos cuán-
ticos, ha mostrado una sorprendente capacidad para funcionar efectivamente en las
computadoras pequeñas y ruidosas del presente. Si bien dichos algoritmos han genera-
do enormes expectativas, en parte gracias a la gran robustez a ruidos que proporciona
el loop de optimización clásica, lo cierto es que aún falta recorrer un buen camino
para llegar a concretar ventajas cuánticas en problemas realmente relevantes.
Uno de los principales obstáculos que enfrentan los algoritmos variacionales es la
presencia de barren plateaus, un fenómeno por el cual los paisajes de optimización
se vuelven exponencialmente planos, en promedio, en el tamaño del sistema. Si bien
las barren plateaus son un fenómeno preocupante para los algoritmos variacionales,
cuya presencia limita su aplicación a gran escala, se sabe muy poco del mecanismo
fundamental que las origina. Finalmente, destaquemos que la construcción de circuitos
cuánticos parametrizados presenta un marco ideal para llevar al mundo cuántico uno
de los campos científico-tecnológicos que signan el presente: el de las redes neuronales
y el machine learning.
En esta Tesis estudiamos distintos aspectos esenciales de una clase de problemas de
optimización que surgen en el marco de la mecánica cuántica. Esta clase de problemas
está constituida por tres áreas de investigación independientes: el control óptimo
cuántico, los algoritmos cuánticos variacionales y el quantum machine learning. Uno
de nuestros primero aportes es el establecimiento de un marco teórico común para
dichos problemas. Dicho esquema unificado, como veremos, es muy valioso ya que
permite la migración de ideas, conceptos y herramientas de un área a otra, y faculta
la posibilidad de elaborar nuevos resultados con aplicación e impacto instantáneo en
todas las áreas.
En este contexto, aplicando herramientas de control cuántico damos un paso clave
hacia el entendimiento del mecanismo fundamental que da lugar a la existencia de
barren plateaus en los paisajes de optimización cuántica. Con una serie de proposicio-
3
nes, teoremas y corolarios establecemos un marco riguroso que vincula la presencia o
ausencia de barren plateaus con la dimensión del álgebra de Lie asociada a los gene-
radores del sistema. En particular, mostramos que sistemas con álgebras polinomiales
en el número de cuerpos podrían estar desprovistos de barren plateaus. Nuestros re-
sultados constituyen instrumentos imprescindibles para el diseño y construcción de
sistemas cuánticos robustos que puedan evitar la presencia de barren plateaus en sus
paisajes de optimización.
Finalmente, analizamos el fenómeno de sobreparametrización en los paisajes de
optimización de redes neuronales cuánticas. Aquí, nuestro aporte es vincular el nú-
mero de parámetros que necesita un dado problema con, nuevamente, la dimensión
de álgebra de Lie del sistema. Nuestros resultados tienen impacto inmediato en el
diseño de arquitecturas para redes neuronales cuánticas y, en particular, destacan la
importancia de los sistemas con álgebras polinomiales pues estos serían capaces de
manifestar sobreparametrizacion con un número polinomial (eficiente) de parámetros.
Nuestros resultados constituyen aportes fundamentales para la nueva ola de tecno-
logías cuánticas, y en particular, pasos importantes en el camino hacia la ventaja
cuántica.
4
Optimization in Quantum Mechanics
The last decades have demonstrated a profound transformation regarding quan-
tum mechanics, transitioning from being a mere description of nature to leading a
new technological revolution. Analogously to what occurred during the first wave of
quantum technologies, where some of the main technological milestones of the modern
world emerged, such as the transistor, the laser, or nuclear magnetic resonance, the
present second wave, based on the exploitation of purely quantum phenomena such
as superposition and entanglement, promises to lead to new advances in the areas of
computing, simulation, communication, and metrology, generating a fundamentally
disruptive impact on the present and near future society.
One of the drivers of this second wave of quantum technologies is, undoubtedly,
optimal quantum control. The theory of optimal quantum control was born in the
1980s when optimal control techniques began to be applied in the field of chemistry,
for example, to try to induce reactions through the design of optimal electromagnetic
pulses, or to maximize the resolution of images obtained through nuclear magnetic
resonance. One of the surprising findings of these early attempts to control quantum
dynamic systems was an incredible ease in carrying out control. To explain this phe-
nomenon, the theory of quantum control landscapes emerged. One of the fundamental
results of this theory is that, in a situation of abundant resourcesfor control, these
landscapes are extremely simple and consequently optimization is easy. However, as
controls are limited, the landscapes undergo a phase transition in complexity and the
problem becomes extremely complicated. In this context, it is essential to be able to
precisely determine the amount of resources necessary for each control problem.
Among the opportunities offered by the new quantum revolution, the possibility
of building quantum computers stands out. This new computing paradigm represents
a kind of holy grail for modern science and industry, as it promises fundamental
advantages in the ability to solve certain computational problems (for example, in the
factorization of integers). One of the most promising quantum computing paradigms
today are variational quantum algorithms. This scheme of hybrid quantum-classical
5
computing, based on adding tunable parameters to the gates of quantum circuits, has
shown a surprising ability to function effectively in the small and noisy computers
of the present. While these algorithms have generated enormous expectations, partly
thanks to the great noise robustness provided by the classical optimization loop, the
truth is that there is still a long way to go to realize quantum advantages in really
relevant problems.
One of the main obstacles faced by variational algorithms is the presence of barren
plateaus, a phenomenon by which the optimization landscapes become exponentially
flat, on average, with the size of the system. Although barren plateaus are a worrying
phenomenon for variational algorithms, whose presence limits their large-scale appli-
cation, very little is known about the fundamental mechanism that originates them.
Finally, let us highlight that the construction of parameterized quantum circuits pro-
vides an ideal framework to bring one of the scientific-technological fields that mark
the present to the quantum world: that of neural networks and machine learning.
In this Thesis, we study different essential aspects of a class of optimization pro-
blems that arise in the context of quantum mechanics. This class of problems consists
of three independent research areas: optimal quantum control, variational quantum
algorithms, and quantum machine learning. One of our first contributions is the esta-
blishment of a common theoretical framework for these problems. This unified scheme,
as we will see, is very valuable as it allows the migration of ideas, concepts, and tools
from one area to another, and enables the possibility of developing new results with
immediate application and impact in all areas.
In this context, applying quantum control tools we take a key step towards un-
derstanding the fundamental mechanism that gives rise to the existence of barren
plateaus in quantum optimization landscapes. With a series of propositions, theo-
rems, and corollaries, we establish a rigorous framework that links the presence or
absence of barren plateaus with the dimension of the Lie algebra associated with
the system generators. In particular, we show that systems with polynomial algebras
in the number of bodies could be devoid of barren plateaus. Our results constitute
essential tools for the design and construction of robust quantum systems that can
6
avoid the presence of barren plateaus in their optimization landscapes.
Finally, we analyze the phenomenon of overparametrization in the optimization
landscapes of quantum neural networks. Here, our contribution is to link the num-
ber of parameters a given problem needs with, again, the dimension of the system’s
Lie algebra. Our results have an immediate impact on the design of architectures
for quantum neural networks and, in particular, highlight the importance of systems
with polynomial algebras as these would be capable of manifesting overparametri-
zation with a polynomial (efficient) number of parameters. Our results constitute
fundamental contributions to the new wave of quantum technologies, and in particu-
lar, important steps on the path towards quantum advantage.
7
8
Índice general
1. Introducción 13
2. Control óptimo cuántico 23
2.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.1. Fuentes de no controlabilidad . . . . . . . . . . . . . . . . . . 27
2.2. Búsqueda de protocolos: control óptimo cuántico . . . . . . . . . . . . 30
2.2.1. GRAPE y Krylov-GRAPE . . . . . . . . . . . . . . . . . . . . 32
2.3. Paisajes de control cuántico . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.1. Protocolos constantes a tramos . . . . . . . . . . . . . . . . . 33
2.4. Control cuántico y computación cuántica en la era NISQ: un marco
común . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3. Paisajes de control cuántico 39
3.1. Topología del paisaje de control: ausencia de mínimos locales y presen-
cia de trampas falsas . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.1.1. Paisajes cinemáticos . . . . . . . . . . . . . . . . . . . . . . . 40
3.1.2. Paisajes dinámicos . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.3. Ejemplo: trampas falsas en el Landau-Zener . . . . . . . . . . 43
3.2. Geometría del Paisaje: estructura trivial y existencia de subvariedades
óptimas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.1. Subvariedades óptimas . . . . . . . . . . . . . . . . . . . . . . 48
3.2.2. Ejemplo: continuos de soluciones en el Landau-Zener . . . . . 50
9
ÍNDICE GENERAL
4. Barren plateaus 55
4.1. Nociones preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.2. Resultados Teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.2.1. Resumen de los resultados . . . . . . . . . . . . . . . . . . . . 58
4.2.2. Caso 1: Sistemas Controlables . . . . . . . . . . . . . . . . . . 59
4.2.3. Caso 2: Sistemas Reducibles . . . . . . . . . . . . . . . . . . . 62
4.2.4. Caso 3: General, no controlable : conexión con la dimensión del
álgebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3. Resultados Numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.3.1. Cadena XXZ . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.2. Cadena Ising . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.3.3. Modelo de Erdös–Rényi . . . . . . . . . . . . . . . . . . . . . 74
5. Sobreparametrización 77
5.0.1. Midiendo distancias entre estados parametrizados: introducción
a la matriz cuántica de Fisher . . . . . . . . . . . . . . . . . . 79
5.1. Resultados Teóricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.1.1. Sobreparametrización y la matriz de información de Fisher cuán-
tica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.1.2. Capacidad de la QNN . . . . . . . . . . . . . . . . . . . . . . 85
5.1.3. Cotas al rango del Hessiano en soluciones . . . . . . . . . . . . 87
5.2. Resultados Numéricos . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.2.1. Variational Quantum Eigensolver . . . . . . . . . . . . . . . . 89
5.2.2. Compilación de unitarias . . . . . . . . . . . . . . . . . . . . . 91
5.2.3. Autoencoding cuántico . . . . . . . . . . . . . . . . . . . . . . 94
6. Conclusiones 97
A. Nociones Preliminares 121
B. Demostración del Teorema 1: Convergencia de sistemas controlables
a 2-designs 125
10
ÍNDICE GENERAL
C. Demostración del Corolario 1: Velocidad de convergencia de sistemas
controlables a 2-designs 131
D. Demostración de la Proposición 1: Controlabilidad implica barren
plateaus 133
E. Demostracion de la Proposicion 2: Controlabilidad del HEA y del
vidrio de spin 135
F. Demostración del Teorema 2: Varianza en subespacios controlables141
G. Demostración del Corolario 2: Subespacios exponenciales controla-
bles 145
H. Simetrías en los modelos XXZ y TFIM 149
H.0.1. modelo XXZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
H.0.2. modelos TFIM y LTFIM. . . . . . . . . . . . . . . . . . . . . 150
I. Demostracion del Teorema 3: cota al rango de la QFIM 153
J. Demostración del Teorema 4: cota a la capacidad de una red neuronal
cuántica 159
K. Demostración del Teorema 5: cota al rango del Hessiano para opti-
mización de observables y quantum machine learning. 163
L. Demostración del Teorema 6: cota al rango del Hessiano para com-
pilación de unitarias. 169
11
ÍNDICE GENERAL
12
Capítulo 1
Introducción
Las ultimas décadas han evidenciado una rotunda transformación entorno a la
mecánica cuántica, pasando de ser una mera descripción de la naturaleza a liderar
una nueva revolución tecnológica. Análogamente a lo ocurrido durante la primera ola
de tecnologías cuánticas, donde surgieron algunos de los principales hitos tecnológi-
cos del mundo moderno, como el transistor y el láser (los componentes básicos de
la computadora) o la resonancia magnética nuclear, la presente segunda ola, basada
en el aprovechamiento de las extrañas propiedades del mundo nanoscópico, como la
superposición y entrelazamiento, promete dar lugar a nuevos avances en las áreas de
computación, simulación, comunicación y metrología, generando un impacto funda-
mentalmente disruptivo en la sociedad del presente y futuro próximo. Algunas de las
áreas en las cuales se espera que dichas nuevas tecnologías cuánticas tengan conse-
cuencia son la medicina, la comunicación y la criptografía, los sistemas de navegación,
la producción, almacenamiento y transmisión de energía (en particular se esperan
avances en la eficiencia de la energía solar), la química, la farmacia y la ciencia de
materiales, el procesado de información, el aprendizaje automático y la inteligencia
artificial, por nombrar algunos.
Según la Referencia [1],
It is control that turns scientific knowledge into useful technology.
En efecto, ha sido nuestra sorprendente capacidad de generar avances en el control
13
Capítulo 1. Introducción
del mundo micro y nanoscópico, donde la coherencia cuántica juega un papel funda-
mental, lo cual ha impulsado dicha revolución. Es decir, nuestra capacidad de realizar
control cuántico. El control cuántico, como área científica, esta basado en una serie
de avances, por un lado teóricos (en el campo de las matemáticas), en particular
relacionados con la teoría de control óptimo y la optimización numérica, y por otro
tecnológicos, principalmente en la electrónica, como la invención de generadores de
onda con resolución temporal en los nanosegundos, o bien el desarrollo de campos
magnéticos súper-potentes.
La teoría de control óptimo [2, 3, 4, 5] es una extensión del calculo de variaciones
que se ocupa de hallar maneras de controlar un sistema dinámico, principalmente a
partir de la aplicación de técnicas de optimización matemática. El calculo de variacio-
nes nació en el siglo 17 con el principio de Fermat y el problema de la braquistócrona
de Galileo, y hasta la fecha estuvo caracterizado por las contribuciones de figuras
como Euler, Lagrange y los hermanos Bernoulli en el siglo 18, las de Legendre, Jaco-
bi, Hamilton y Weirstrass en el siglo 19, y las de Bolza y Bliss a principios del siglo
20. En la década de los 50s, Richard Bellman reformuló la teoría de Hamilton-Jacobi
en lo que llamó programación dinámica, y Lev Pontryagin, basado en el trabajo de
Edward McShane, extendió el calculo de variaciones para incorporar constraints di-
námicos [2, 6]. Sin embargo, el elemento realmente crucial en la explosión de la teoría
de control óptimo fue la aparición de la computadora digital a fines de dicha década.
Entre los primeros hitos de dicha teoría se encuentran, por ejemplo, haber ayudado
a poner al hombre en la luna [7].
A finales de los 80s, Rabitz, Tannor y Rice, entre otros [8, 9], comenzaron a aplicar
las técnicas de control óptimo sobre sistemas cuánticos, principalmente para inducir
reacciones químicas rompiendo enlaces selectivamente [9] o bien para maximizar la
resolución de imágenes obtenidas con resonancia magnética nuclear [10]. De esta ma-
nera, nació el control óptimo cuántico (QOC) [1, 11, 12, 13]. En los últimos años, las
aplicaciones de QOC han ido desde la manipulación individual de iones para el pro-
cesado de información cuántica [14], al acoplamiento selectivo de electrones y fotones
en quantum dots de silicio [15], o a la realización de estados robustos en circuitos
14
Capítulo 1. Introducción
superconductores, capaces de mantener la coherencia cuántica durante tiempos del
orden de los 300 microsegundos [16].
En 1981, Feynman propuso aprovechar las leyes de la mecánica cuántica en pos
de construir un nuevo tipo de computadora [17]. Dicha computadora cuántica sería
capaz de simular sistemas cuánticos eficientemente:
Nature isn’t classical, dammit, and if you want to make a simulation of
Nature, you’d better make it quantum mechanical, and by golly it’s a won-
derful problem because it doesn’t look so easy.
A 40 años de la visión de Feynman, el problema sigue sin parecer tan simple. Sin
embargo, no podemos decir que la idea no haya crecido. En 1985, David Deutsch for-
malizó la noción de una computadora cuántica [18], y hasta sugirió que podrían tener
ventajas sobre las computadoras clásicas en aplicaciones mas allá de la física. Casi
una década mas tarde, el mismo Deutsch introdujo el primer algoritmo cuántico en
obtener ventajas sobre la computación clásica, en un problema bastante artificial [19].
Rápidamente, Bernstein y Vazirani generalizaron dicho problema y probaron venta-
jas súper-polinomiales [20]. Poco después, Simon halló un algoritmo que podría tener
ventajas exponenciales [21]. A pesar de no tener aplicaciones obvias, el algoritmo de
Simon inspiró a Shor, que en 1994 presentó su famoso algoritmo para factorizar núme-
ros enteros exponencialmente. Si bien el algoritmo de Shor, y sus implicaciones obvias
en la seguridad criptográfica, causaron un estallido en el interés por la computación
cuántica, varios grandes físicos de la época, entre ellos Landauer [22], Unruh [23] y
Haroche [24] se manifestaron con fuerte escepticismo frente a la posibilidad de hacer
andar realmente una computadora cuántica, principalmente argumentando que inclu-
so los mejores intentos por suprimir acoplamientos con un entorno y ruido cuántico
tendrían efectos incompensables. Notablemente, fue Shor nuevamente el que lide-
ró los siguientes avances, descubriendo en 1995 los llamados códigos de corrección
de errores [25]. Casi simultáneamente, Cirac y Zoller propusieron un prototipo de
computadora cuántica basada en iones fríos atrapados en una trampa lineal, donde
mostraron la posibilidad de crear compuertas entrelazantes aprovechando la interac-
15
Capítulo 1. Introducción
ción de los iones con láseres [26]. Finalmente, en 1996 Seth Lloyd concretó la idea de
Feynman proponiendo un algoritmo capaz de simular sistemas cuánticos con Hamil-
tonianos locales arbitrarios en tiempo polinomial [27]. Dicho resultado esta basado
en la famosa Trotterización [28], la aproximación de la exponencial de una suma de
operadores usando el producto de las exponenciales. .
Hoy en día, hay un esfuerzo industrial inmenso en el área de la computación
cuántica, liderado principalmente por las compañías americanas IBM y Google, y
por China [29]. En cualquier caso, se apuesta por dispositivos basados en qubits
superconductores, y la aplicación de técnicas de control óptimo cuántico juega un
papel fundamental [30, 31]. A pesar de las recientes demostraciones de supremacía [29,
32], en el caso de Google, por ejemplo, a través de su procesador Sycamore (un array
bidimensional de 53 qubits con conexiones a primeros vecinos), aún estamos lejos de
poder implementar códigos de corrección de errores, y por lo tanto, de los célebres
algoritmos que ofrecen ventajas en problemas de interés practico. Aclaremos que
la imposibilidad de implementar dicha corrección de errores esta debida al tamaño
pequeño delas computadoras del presente, ya que por cada qubit lógico en dichos
esquemas uno necesita varios qubits auxiliares (por ejemplo, el algoritmo de corrección
propuesto por Shor [25] usa 9 qubits auxiliares por cada qubit lógico).
En dicho contexto, a mediados de la década pasada, surgieron un par de propuestas
seminales que inaugurarían el campo de los algoritmos cuánticos variacionales (VQA,
por sus siglas en inglés): por un lado el llamado Quantum Approximate Optimization
Algorithm (QAOA), orientado a resolver problemas de optimización combinatoria, y
el Variational Quantum Eigensolver (VQE), orientado a hallar energías moleculares
fundamentales en el marco de problemas de la química cuántica. Lo fundamentalmen-
te nuevo de estas propuestas fue la incorporación de parámetros sintonizables en las
compuertas del circuito. Esencialmente, uno introduce una función de costo, la cual
puede estimar eficientemente usando el circuito cuántico, y cuyo mínimo codifica la
solución al problema deseado. Luego, va actualizando los parámetros para minimizar
dicha función y preparar la solución. Lo notable de este tipo de algoritmos es que
pueden correr en cualquier dispositivo, independientemente de las particularidades
16
Capítulo 1. Introducción
del hardware (e.g. conectividad, niveles de ruido), sin la necesidad implementar có-
digos de corrección de errores. Quizás una de las mas interesantes características que
presentan es su capacidad de suprimir o absorber errores con su esquema de opti-
mización clásica, lo cual los convierte, de alguna manera, en el análogo cuántico al
machine learning [33]. En los últimos años el campo de los algoritmos variacionales
ha vivido un verdadero boom, originando una multitud de propuestas de esquemas
cubriendo, esencialmente, todos el espectro de aplicaciones alguna vez imaginado para
la computación cuántica (ver Fig 1.1).
Figura 1.1: Mapa de aplicaciones propuestas para los algoritmos variacionales.
Alguna de las aplicaciones en el espectro de propuestas para los algoritmos variacionales. La
figura fue tomada de la Ref. [33].
A pesar del gran entusiasmo de la comunidad en torno a dichos algoritmos varia-
cionales, aún quedan varios desafíos y obstáculos por enfrentar en la ruta a la ventaja
cuántica. Una de las principales amenazas a la posibilidad de usar dichos algoritmos a
gran escala es la posible presencia de barren plateaus (BP) [34, 35, 36, 37, 38, 39, 40,
17
Capítulo 1. Introducción
41, 42, 43, 44, 45], es decir, de gradientes exponencialmente suprimidos (en promedio)
en los paisajes de optimización. Como en un VQA, la función de costo y sus gradiente
se estiman realizando mediciones sobre el estado a la salida del circuito parametri-
zado, en presencia de una BP, uno necesitaría un número exponencial de mediciones
para estimar correctamente la dirección de descenso y poder entrenar efectivamente
los parámetros.
Sin lugar a dudas, otro de los principales logros científicos de las ultimas décadas
es el desarrollo de redes neuronales artificiales (NNs, por sus siglas en inglés) y del
campo de Machine Leaning (ML). Tradicionalmente, las computadoras eran progra-
madas explícitamente para resolver una tarea específica. Así, por ejemplo, uno escribía
manualmente un programa diseñado para que devuelva determinado output deseado
por cada input. En ML, sin embargo, uno sigue un camino diametralmente distinto.
Aquí, primero se entrena la computadora con datos, y luego se espera que dé respues-
tas correctas sobre datos nuevos [46]. Actualmente, ML está presente en virtualmente
todas las áreas de la ciencia, con aplicaciones diversas desde el descubrimiento de
nuevas drogas [47], materiales [48], y hasta autos autónomos [49].
A pesar del tremendo éxito que han tenido las NN, entrenarlas es una tarea no-
trivial. De hecho, se ha mostrado que el entrenamiento de redes pertenece a la clase
de complejidad computacional NP-hard [50, 51, 52]. De tal manera, la búsqueda de
maneras heurísticas de mejorar el entrenamiento y la capacidad de generalización de
dichas redes ha sido siempre un objetivo codiciado. En esta línea, uno de los fenóme-
nos mas sorprendentes en ML es el de la sobreparametrización. La idea aquí es que
uno entrena una red con una capacidad substancialmente mayor a la estrictamente
necesaria para representar la distribución de los datos de entrenamiento [53]. General-
mente, esto implica tener un número de parámetros mucho mayor que el número de
datos [54]. Ingenuamente, uno podría esperar que el modelo con más capacidad sea
mas difícil de entrenar, y que además sufra de overfitting (es decir, que sobre ajuste
los puntos). Sin embargo, se ha mostrado que sobreparametrizar una red puede mejo-
rar su funcionamiento, reducir el esfuerzo de entrenamiento y mejorar los errores de
generalización [54, 55, 56, 57, 58, 59, 60].
18
Capítulo 1. Introducción
Desde su aparición, las computadoras cuánticas [61, 62] han generado mucho in-
terés en la comunidad de data science. En dicho contexto, en los últimos años se ha
logrado incorporar determinados problemas de ML dentro del marco de la mecánica
cuántica, dando lugar a una nueva teoría generalizada llamada Quantum Machine
Learning (QML) [63, 64, 65]. En QML, el objetivo es aprovechar los recursos propios
y exclusivos de la mecánica cuántica, como superposición y entrelazamiento, para
conseguir ventajas fundamentales frente a ML clásico, lo que comúnmente se conoce
como quantum advantage [66, 67, 68, 69].
Naturalmente, al ser una teoría generalizada, QML tiene el potencial de alojar
muchos de los fenómenos, problemas, y características existentes en ML clásico. Por
ejemplo, al igual que en el caso clásico, se ha mostrado que entrenar modelos de
QML es NP-hard [70]. Más aún, como mencionamos previamente se ha observado
que los paisajes cuánticos pueden alojar barren plateaus. A pesar de que dichas ba-
rren plateaus son consideradas uno de los mayores problemas a superar para lograr
arquitecturas escalables que puedan ofrecer ventaja cuántica, al día de hoy se sabe
poco sobre el mecanismo fundamental que las origina. Finalmente, notamos que tam-
bién se ha evidenciado sobreparametrización en QNNs [71, 71, 72, 73, 74, 75, 76, 77].
Si bien estos resultados muestran, heurísticamente, que al incrementar el número de
parámetros de la QNN uno mejora la convergencia del optimizador, aquí nuevamente
falta un marco teórico riguroso.
En este contexto, el aporte de esta Tesis es múltiple. Por un lado, introducimos un
marco común para tres importantes áreas de investigación: el control óptimo cuántico,
los algoritmos cuánticos variacionales y el machine learning cuántico. Como veremos,
dicho marco posibilita la migración de ideas, conceptos y herramientas de un área
a otra. En particular, aplicando conceptos fundamentales de control cuántico en el
campo de los algoritmos variacionales, logramos dar un paso hacia la caracterización
del mecanismo fundamental que origina las barren plateau. Similarmente, usando
dichos conceptos de control cuántico, logramos establecer precisamente el número de
parámetros necesarios para sobreparametrizar una red neuronal cuántica.
Esta Tesis esta organizada de la siguiente manera. En el Capítulo 2 repasamos
19
Capítulo 1. Introducción
algunas nociones fundamentales del control óptimo cuántico. Comenzamos sumer-
giéndonos en el concepto de controlabilidad, y con él el de álgebra de Lie dinámica,
los cuales caracterizan el set de transformaciones accesibles por el sistema de control.
Luego, tratamos otra de las grandes preguntas en control cuántico, ¿de qué manera
hallo protocolos óptimos? Finalmente, introducimos una clase de algoritmos cuánti-
cos variacionales y redes neuronales cuánticas que pueden ser planteados en el marco
formal del control óptimo cuántico.
En el Capítulo 3 nos concentramos en la teoría de paisajes de control cuántico, con-
centrándonos en los resultados estructurales principales.En este contexto, notamos
que, en presencia de abundantes recursos para el control, los paisajes de optimización
cuántica suelen tener una topología extremadamente simple, convexa. Más aún, en
dicho caso la estructura geométrica del paisaje es extremadamente favorable: las so-
luciones forman subvariedades multidimensionales y las trayectorias de optimización
son casi rectas en el espacio de parámetros. Estas cualidades benignas que caracte-
rizan a los paisajes de control cuántico, que resultan, en general, en problemas de
optimización simples, se deben, en principio, a que las leyes que dictaminan la di-
námica cuántica son bastante más simples que las que uno encuentra en dinámicas
clásicas. En cambio, cuando los recursos del control empiezan a limitarse, los paisajes
se pueblan de mínimos locales espurios y el problema de control se complica. En este
contexto, resulta esencial poder determinar cuál es la cantidad de recursos suficiente
para un dado problema de control. Volveremos sobre esto en el Capítulo 5.
En el Capítulo 4, estudiamos los problemas de optimización que emergen en el
marco de los recientemente propuestos algoritmos cuánticos variacionales. En este
contexto, nos concentramos en el fenómeno de las barren plateaus. Aprovechando el
marco común establecido en el Capítulo 2, evidenciamos la existencia de una conexión
entre la dimensión del álgebra de Lie del sistema y la presencia de barren plateaus en
los paisajes de optimización. Nuestros resultados constituyen un paso fundamental
hacia la caracterización del fenómeno, ofreciendo herramientas invaluables para el
diseño activo de circuitos y sistemas de control que puedan evitar existencia de barren
plateaus.
20
Capítulo 1. Introducción
En el Capítulo 5 nos concentramos en el problema de sobreparametrización en
modelos de QML. En definitiva, un modelo de QML es una secuencia de embedding
de datos seguida por un circuito cuántico parametrizado, generalmente llamado red
neuronal cuántica (QNN, por su siglas en inglés), en analogía con las redes clásicas.
De tal modo, entrenar un modelo de QML es básicamente optimizar los parámetros
de la QNN para que minimicen alguna función de costo [65, 78, 79, 80, 81]. Uno de los
factores que caracterizan la sobreparametrización de una red es un la manifestación
de una transición de fase computacional por parte de sus paisajes de optimización.
En este contexto, presentamos un marco teórico riguroso que vincula el número de
parámetros necesarios para sobreparametrizar una red con la dimensión del álgebra
de Lie asociada. Nuestros resultados muestran que redes con álgebras polinomiales
son capaces de exhibir sobreparametrización con tan solo un número polinomial de
parámetros. En conjunto con los resultados del Capítulo 4, estos resultados son de
gran importancia para las tecnologías cuánticas del presente, ya que allanan el ca-
mino hacia la construcción de sistemas con condiciones óptimas para ser escalados
industrialmente.
Finalmente, notamos que en los Capítulos 4 y 5 nos limitamos a enunciar los
resultados teóricos hallados. Las demostraciones, junto con todo tipo material suple-
mentario al cuerpo de la Tesis, es provisto en una serie de apéndices. Notamos que,
adicionalmente, ambos Capítulos 4 y 5 contienen abundante evidencia numérica que
respalda el análisis teórico.
Lista de Publicaciones.
i M. Larocca, N. Ju, D. García-Martín, P. J. Coles, and M. Cerezo, “Theory of overpara-
metrization in quantum neural networks,” arXiv preprint arXiv:2109.11676, 2021.
ii J. Ruffinelli, E. Fortes, M. Larocca, and D. A. Wisniacki, “Loschmidt echo approach
to krylov-subspace approximation error estimation,” arXiv preprint arXiv:2107.09805,
2021.
21
Capítulo 1. Introducción
iii M. Larocca, P. Czarnik, K. Sharma, G. Muraleedharan, P. J. Coles, and M. Cerezo,
“Diagnosing barren plateaus with tools from quantum optimal control,” arXiv preprint
arXiv:2105.14377, 2021.
iv M. Larocca and D. Wisniacki, “Krylov-subspace approach for the efficient control of
quantum many-body dynamics,” Physical Review A, vol. 103, no. 2, p. 023107, 2021.
v M. Larocca, E. Calzetta, and D. Wisniacki, “Fourier compression: A customization
method for quantum control protocols,” Phys. Rev. A, vol. 102, p. 033108, Sep 2020.
vi M. Larocca, E. Calzetta, and D. A. Wisniacki, “Exploiting landscape geometry to en-
hance quantum optimal control,” Phys. Rev. A, vol. 101, p. 023410, Feb 2020.
vii M. Larocca, P. M. Poggi, and D. A. Wisniacki, “Quantum control landscape for a two-
level system near the quantum speed limit,” Journal of Physics A: Mathematical and
Theoretical, vol. 51, p. 385305, aug 2018.
22
Capítulo 2
Control óptimo cuántico
En este capítulo resumiremos algunas de las nociones y resultados básicos de la
teoría de control óptimo cuántico que son fundamentales en esta Tesis. La disciplina
de control cuántico es un marco teórico que provee herramientas para la manipulación
sistemática de sistemas dinámicos cuánticos. En el escenario estándar, uno considera
un estado inicial |𝜓⟩ 1 en un espacio de Hilbert 𝑑-dimensional, ℋ = C𝑑, que evoluciona
sujeto a un Hamiltoniano funcional
𝐻({𝜃𝑘(𝑡)}) = 𝐻0 +
𝐾∑︁
𝑘=1
𝜃𝑘(𝑡)𝐻𝑘, (2.1)
donde las funciones 𝜃𝑘 : [0, 𝑇 ] → R que lo definen, usualmente conocidas como campos
de control, protocolos, o simplemente controles, pueden ser moldeadas a gusto. Aquí 𝑇
denota la duración del protocolo 𝜃𝐾(𝑡). Cabe destacar que en la Ec. (2.1) se incluye un
término no sintonizable, 𝐻0, para representar la evolución natural o libre del sistema.
En cambio, los Hamiltonianos {𝐻𝑖}𝐾𝑖=1 están asociados con interacciones con grados
de libertad externos (por ejemplo, radiación electromagnética; de ahí el nombre de
campos).
El estado inicial |𝜓⟩ describe una trayectoria |𝜓(𝑡)⟩ = 𝑈(𝑡) |𝜓⟩ ∈ ℋ que depende
1Si bien aquí presentamos el escenario con un estado inicial puro |𝜓⟩ nada de lo que digamos en
este Capítulo asume esa condición. De esta forma, más adelante utilizaremos intercambiadamente
kets |𝜓⟩ y matrices densidad 𝜌 para referirnos al estado inicial del sistema de control.
23
Capítulo 2. Control óptimo cuántico
de la elección de controles a través del propagador 𝑈(𝑡), que satisface
𝑑𝑈(𝑡)
𝑑𝑡
= −𝑖𝐻(𝑡, {𝜃𝑘(𝑡)})𝑈(𝑡), donde 𝑈(0) = I . (2.2)
Fundamentalmente, el control cuántico se pregunta dos cosas: (i) en relación al con-
cepto de controlabilidad, ¿qué tipo de evoluciones son posibles? (ii) en relación al
diseño de protocolos, ¿de qué manera puedo implementar dichas evoluciones desea-
das? o bien ¿cómo encuentro los protocolos óptimos que las realizan? Para contestar
a la primera pregunta, en la Sec. 2.1 introduciremos algunos elementos básicos de la
teoría de grupos y álgebras de Lie. En relación a la segunda, en la Sec. 2.2 sección
veremos que una manera sistemática de hallar campos óptimos es mediante rutinas
de optimización numérica. Finalmente, en la Sec. 2.4 introduciremos brevemente una
clase de circuitos cuánticos parametrizados y redes neuronales cuánticas que serán
fundamentales para las aplicaciones estudiadas en los Capítulos 4 y 5, haciendo espe-
cial énfasis en los aspectos en comunes con el ansatz de control.
2.1. Controlabilidad
En esta sección analizamos el abanico de evoluciones que puede experimentar
un sistema de control bajo controles {𝜃𝑘(𝑡)} arbitrarios en la Ec. (2.2). Para este
propósito, repasaremos algunas definiciones básicas de teoría de grupos. Como el
Hamiltoniano en la Ec. (2.1) es Hermítico y de traza nula, el propagador 𝑈(𝑡) =
𝑈(𝑡, {𝜃𝑘}) (haciendo explícita la dependencia en los controles) es un elemento del
grupo unitario 𝒮𝒰(𝑑) de matrices complejas de tamaño 𝑑× 𝑑 y determinante uno.
Evidentemente, al variar 𝜃𝑘(𝑡) uno obtiene distintas unitarias. Sorprendentemente,
el set de todas las unitarias que pueden ser generadas por un sistema de control forma
un grupo, conocido como el grupo dinámico G ⊆ 𝒮𝒰(𝑑). Siconocemos dicho grupo,
conocemos el set de dinámicas posibles. De esta manera, surge la pregunta ¿como
determinamos G?
Primero, definamos el set de generadores 𝒢 del sistema de control.
24
Capítulo 2. Control óptimo cuántico
Definición 1 (Set de generadores). Dado un sistema de control de la forma Ec. (2.1)
definimos el set de generadores 𝒢 = {𝐻𝑘}𝐾𝑘=0 como el set (de tamaño |𝒢| = 𝐾 +
1) de operadores Hermíticos de traza nula que definen el Hamiltoniano funcional
𝐻(𝑡, {𝜃𝑘(𝑡)}) que a su vez determina la dinámica del sistema, a través de la Ec. (2.2).
Naturalmente, el grupo G que contiene las posibles dinámicas del sistema tiene que
depender de dicho set 𝒢. Sin embargo, resulta que no es suficiente con considerar a los
elementos de 𝒢, sino que uno tiene que considerar el espacio vectorial (de operadores)
abarcado por los sucesivos conmutadores anidados de los elementos del set. Es decir,
uno tiene que contemplar el álgebra de Lie g generada por dicho set [82, 83].
Definición 2 (Álgebra de Lie dinámica). El álgebra de Lie Dinámica (o DLA por sus
siglas en inglés) es el álgebra de Lie abarcada por los sucesivos conmutadores anidados
de los elementos del set de generadores 𝒢 del sistema de control (ver Definición 1).
Es decir
g = span ⟨𝑖𝐻0, . . . , 𝑖𝐻𝐾⟩Lie , (2.3)
donde ⟨𝑆⟩Lie denota la llamada clausura de Lie, el set de infinitos conmutadores ani-
dados de los elementos del set 𝑆.
Notar que como los elementos de 𝒢 son asumidos Hermíticos y de traza nula, g es
siempre subálgebra de su(d), el álgebra de matrices antihermíticas de grado 𝑑. Nota-
mos que, si bien existen algoritmos numéricos para determinar el DLA de un set de
generadores dado [83], estos escalean de manera bastante desfavorable (la compleji-
dad va como 𝒪(𝑑8)) y por lo tanto se vuelven rápidamente imprácticos al considerar
sistemas no demasiado pequeños. En este contexto, es importante buscar maneras
de determinar eficientemente el DLA de un sistema de control dado, o al menos su
dimensión, ya que como veremos en los Capítulos 4 y 5 esto tendría consecuencias
prácticas muy importantes. Por este motivo, las álgebras de Lie dinámica son tema
de estudio al día de hoy.
Una vez determinado el DLA, podemos hallar el grupo dinámico G conformado
por el set de unitarias accesibles al sistema.
25
Capítulo 2. Control óptimo cuántico
Definición 3 (Grupo de Lie dinámico). El set de unitarias G a las cuales puede
acceder un sistema de control de la forma Ec. (2.1) está determinado por el álgebra
de Lie G asociada con los generadores 𝒢 (ver Definición 2), a través de
G = 𝑒g := {𝑒𝑉1𝑒𝑉2 · · · 𝑒𝑉𝑚 , 𝑉1, 𝑉2, . . . , 𝑉𝑚 ∈ g, 𝑚 ∈ N} . (2.4)
A su vez, el grupo dinámico determina el set de estados |𝜓(𝑡)⟩ = 𝑈(𝑡) |𝜓⟩ accesibles
a partir de un estado inicial |𝜓⟩, también conocido como la órbita del estado bajo el
DLA [82].
Definición 4 (órbita de bajo el DLA). Dado un estado 𝜌 y un sistema con un set de
generadores 𝒢 que dan lugar a un álgebra g, definimos la órbita de 𝜌 bajo g como
𝒪g(𝜌) = {𝑈𝜌𝑈 † |𝑈 ∈ 𝑒g}. (2.5)
Habiendo hecho estas definiciones, estamos en condiciones de introducir el con-
cepto de controlabilidad.
Definición 5 (Controlabilidad). Un sistema es llamado controlable si solo si su DLA
(ver Definición 2) es de rango completo
g = su(𝑑) , (2.6)
i.e., es el álgebra de matrices antihermíticas de 𝑑× 𝑑.
En dicho caso, G = 𝒮𝒰(𝑑) y consecuentemente toda unitaria (a menos de una fase
global) es realizable bajo alguna elección apropiada de controles. Equivalentemente,
dados dos estados puros |𝜓⟩ y |𝜑⟩, siempre existe alguna unitaria accesible 𝑈(𝜃) ∈ G
tal que | ⟨𝜑|𝑈(𝜃) |𝜓⟩ |2 = 1.
En el caso que el DLA no sea de rango completo, el sistema se dice no controlable.
En dicho caso, g es subálgebra propia2 de su(𝑑) y por lo tanto solo un subgrupo
2estrictamente incluida
26
Capítulo 2. Control óptimo cuántico
Figura 2.1: Clasificación de los sistemas de control. El álgebra de Lie dinámica carac-
teriza el grado de control que admite un sistema. En la figura mostramos esquemáticamente
los diferentes escenarios posibles. La no-controlabilidad se debe o bien a simetrías lineales
no triviales, o bien a simetrías cuadráticas no triviales.
propio de unitarias es accesible G ⊂ 𝒮𝒰(𝑑). En dicho caso, claramente, la órbita de
cualquier estado inicial 𝒪g(𝜌) constituye una subvariedad del espacio de estados.
2.1.1. Fuentes de no controlabilidad
En la Fig. 2.1 presentamos esquemáticamente las dos posibles fuentes de no-
controlabilidad [84].
Fuente 1: Simetrías lineales no triviales
Antes de continuar, necesitamos introducir la siguiente definición.
Definición 6 (Simetrías lineales de 𝒮). Las simetrías lineales de un set de operadores
antihérmiticos 𝒮 = {𝑖𝐻1, · · · , 𝑖𝐻𝐾} están capturadas por 𝒮 ′, el set de operadores
antihermíticos que conmutan simultáneamente con todos los elementos de 𝒮
𝒮 ′ = {𝑠 ∈ su(𝑑) | [𝑠, 𝑖𝐻𝑘] = 0 ∀𝑘 ∈ [1, . . . , 𝐾]} (2.7)
Es interesante notar que el set 𝒮 ′, al cual llamaremos el centralizador de 𝒮, es
27
Capítulo 2. Control óptimo cuántico
cerrado ante conmutación, es decir, forma un álgebra de Lie. Vía la identidad de
Jacobi, [[𝑎, 𝑏], 𝑐] + [[𝑏, 𝑐], 𝑎] + [[𝑐, 𝑎], 𝑏] = 0, es fácil ver que cualquier elemento que
conmute con el set de generadores 𝒢 necesariamente conmuta con sus conmutadores
anidados. Es decir, el centralizador de 𝒢 y el de su generado g, coinciden. Diremos
que un sistema tiene una simetría si solo si el centralizador de g es no trivial, es decir,
dim(g′) > 2. Notar que absolutamente siempre se cumple que 1 ∈ g′.
Si el sistema tiene una simetría, en correspondencia con la Definición 6, el espacio
de estados ℋ se parte en subespacios invariantes.
Definición 7 (Subespacio Invariante (bajo g)). Sea un sistema con DLA g y espacio
de estados ℋ. Supongamos que dim(g′) > 2, es decir, el centralizador de g es no
trivial y el sistema tiene una simetría. Diremos que el subespacio
ℋ𝑗 ⊆ ℋ es invariante bajo g ⇐⇒ 𝑈 |𝜓⟩ ∈ ℋ𝑗, ∀ |𝜓⟩ ∈ ℋ𝑗 y 𝑈 ∈ 𝑒g (2.8)
Dicho de otra manera, estados iniciales en algún espacio invariante pertenecen
en dicho espacio invariante bajo la acción de cualquier dinámica accesible al siste-
ma de control. En consecuencia, las simetrías son fuentes de no controlabilidad ya
que, evidentemente, si hay subespacios invariantes necesariamente el nivel de con-
trol es limitado: no puedo conectar estados que pertenecen a distintos subespacios
invariantes.
Supongamos que todos los elementos del set 𝒢 comparten una única simetría,
caracterizada por el operador Σ, y asumamos que Σ tiene 𝑁 autovalores distintos.
En consecuencia, el DLA se dice reducible, es decir, es suma directa de ideales g =⨁︀𝑁
𝑚=1 g𝑚. Un ideal es una subálgebra
3, que además es cerrado frente a corchetes
con el resto del álgebra4. La imagen intuitiva de un álgebra g reducible es que todo
elemento 𝑥 ∈ g admite una representación matricial diagonal en bloques (con más de
3subálgebra: subespacio 𝒜 de algún álgebra ℬ tal que [𝑥, 𝑦] ∈ 𝒜, ∀𝑥, 𝑦 ∈ 𝒜 ⊆ ℬ.
4ideal: subespacio 𝒜 de algún álgebra ℬ tal que [𝑥, 𝑦] ∈ 𝒜, ∀𝑥 ∈ 𝒜 ⊆ ℬ, 𝑦 ∈ ℬ.
28
Capítulo 2. Control óptimo cuántico
un bloque; caso contrario no hay simetrías y g se dice irreducible)
𝑥 =
⎛⎜⎜⎜⎝
𝑥1 0 0
0
. . . 0
0 0 𝑥𝑁
⎞⎟⎟⎟⎠ (2.9)
donde 𝑥𝑗 es un operador lineal sobre ℋ𝑚, es decir, una matriz de 𝑑𝑚 = dim(ℋ𝑚) filas
y columnas. Es decir, el espacio de estados se parte en ℋ =
⨁︀𝑁
𝑚=1 ℋ𝑚, donde cada
subespacio ℋ𝑚 es invariante bajo g. En la base de autoestados de nuestra simetría,
toda unitaria posible 𝑈 es diagonal por bloques. Mover los controles cambia los ele-
mentos de matriz dentro de cada bloque pero nunca genera elementos no nulos fuera
de ellos. Por este motivo 𝑈(𝑡) se puede escribir como
𝑈(𝑡) =
𝑁∑︁
𝑚=1
P𝑚𝑈P𝑚 (2.10)
donde P𝑚 es el proyector sobre el subespacio ℋ𝑚.
Remarcamos que aún cuando un sistema tiene simetrías y por lo tanto es no-controlable en ℋ, aun puede ser controlable en algunos (o bien todos) de sus subespa-
cios invariantes (ver Fig. 2.1). Un subespacio ℋ𝑗 es controlable si el ideal del álgebra
correspondiente a dicho subespacio es de rango completo, es decir, si g𝑗 = u(𝑑𝑗).
Fuente 2: Simetrías cuadráticas no triviales
Incluso en el caso irreducible, un sistema puede ser no controlable. Esta segunda
fuente de no controlabilidad está relacionada con la existencia de simetrías cuadráticas
no triviales en el sistema.
Definición 8 (Simetrías cuadráticas de 𝒮). Dado un set 𝒮 = {𝑖𝐻1, · · · , 𝑖𝐻𝐾} defi-
nimos el set
𝒮⊗2 = {𝑖𝐻𝑘 ⊗ 1𝑑 + 𝑖1𝑑 ⊗𝐻𝑘, ∀𝑘 = 1, 2, . . . , 𝐾} . (2.11)
Entonces, las simetrías cuadráticas de 𝒮 son los elementos del centralizador de 𝒮⊗2.
Notar que todo set 𝒮 tiene como simetrías cuadráticas a la identidad en el espacio
29
Capítulo 2. Control óptimo cuántico
producto ℋ⊗2, 1𝑑2 , y a la matriz SWAP de subsistemas 𝐾𝑑,𝑑, i.e. 𝐾𝑑,𝑑 (𝐴⊗𝐵) =
(𝐵 ⊗ 𝐴)𝐾𝑑,𝑑. Cualitativamente, a mayores simetrías cuadráticas, menos controlabil-
dad. En particular, simetrías cuadráticas triviales implica controlabilidad [85, 86].
El caso prototípico de falta de controlabilidad por simetrías cuadráticas se da en
las representaciones irreducibles de su(2). Consideremos un sistema de dimensión 𝑑
con un set de generadores dado por
𝒢su(2) = {𝑆𝑥, 𝑆𝑦} (2.12)
donde 𝑆𝑖 es el operador proyección de spin en la dirección 𝑖 (aquí el spin es 𝑆 =
(𝑑−1)/2, i.e. 𝑆𝑧 tiene 𝑑 autoestados distintos). Evidentemente, tenemos que [𝑆𝑗, 𝑆𝑘] =
2𝑖𝜖𝑗𝑘𝑙𝑆𝑙, con 𝜖𝑗𝑘𝑙 el tensor de Levi-Civita, y por lo tanto el álgebra, para todo 𝑑, es
g = su(2) = span{𝑆𝑥, 𝑆𝑦, 𝑆𝑧}. Por lo tanto, notemos que, para todo 𝑑 > 3, (i) la
dimensión del álgebra es dim(g) = 3 << dim(su(𝑑)) = 𝑑2 − 1, y (ii) la dimensión
del centralizador del álgebra es dim g′ = 1, es decir, no hay simetrías no triviales.
En consecuencia, la falta de controlabilidad es debida pura y exclusivamente a la
presencia de simetrías lineales y cuadráticas no triviales en el sistema [86].
2.2. Búsqueda de protocolos: control óptimo cuánti-
co
Hay muchas maneras de buscar protocolos óptimos, es decir, aquellos que efectiva-
mente realizan la tarea deseada. Básicamente, estas se dividen en dos grandes grupos:
por un lado los enfoques analíticos, encuadrados en lo que se llama comúnmente geo-
metric optimal control [3, 87], o los llamados shortcuts-to-adiabaticity [88], y por otro
los numéricos, que básicamente aplican teoría de control óptimo a sistemas dinámicos
cuánticos.
En esta sección, nos centraremos en los enfoques numéricos. Estos se agrupan en
la disciplina llamada control óptimo cuántico (QOC) [1, 13, 89, 90, 91, 92, 93, 94,
95, 96, 97, 98]. En QOC, uno primero parametriza los campos de control 𝜃𝑘(𝑡), es
30
Capítulo 2. Control óptimo cuántico
decir, elige alguna base de funciones {𝜑𝑙(𝑡)}𝐿𝑙=1 (en principio L es finito, sino además
de impráctico, seria solo un cambio de base) y descompone los controles en ella
𝜃𝑘(𝑡) =
𝐿∑︁
𝑙=1
𝜃𝑘𝑙𝜑𝑙(𝑡) . (2.13)
De esta manera, uno pasa de un espacio de parámetros 𝒫 de dimensión infinita (el
espacio de funciones) a otro de dimensión 𝑀 = 𝐾 · 𝐿, i.e.
{𝜃𝑘(𝑡)} −→ {𝜃𝑘} = 𝜃 . (2.14)
Aquí, hemos definido 𝜃𝑘 = (𝜃𝑘1, . . . , 𝜃𝑘𝐿)⊤ y recompilado todos los parámetros en un
único vector 𝜃, que determina la dinámica.
El siguiente paso es seleccionar la evolución deseada. En términos matemáticos,
necesitamos definir una función de costo, es decir, un mapa del espacio de estados ℋ
a la recta real
ℒ : ℋ → R, (2.15)
donde el (o los) estados que satisfagan nuestro criterio de optimalidad |𝜓*⟩ cumplan
ℒ(|𝜓*⟩) = 0. En definitiva, uno termina con una composición de mapas (ver Fig. 2.2)
𝜃 −→ 𝑈(𝑡,𝜃) −→ |𝜓(𝑡,𝜃)⟩ → ℒ(𝜃). (2.16)
En el último mapa, hemos eliminado la dependencia en 𝑡 para hacer evidente que, a
pesar de que uno podría considerar funciones de costo que dependan de la trayecto-
ria instantánea entera |𝜓(𝑡,𝜃)⟩, en general se suele pedir condiciones de opimalidad
únicamente sobre el estado a tiempo 𝑡 = 𝑇 final |𝜓(𝑇,𝜃)⟩ = |𝜓(𝜃)⟩.
Finalmente, para hallar los controles óptimos, es decir, aquellos 𝜃* tales que
ℒ(𝜃*) = 0, solo resta minimizar
𝜃* = arg min
𝜃
ℒ(𝜃). (2.17)
31
Capítulo 2. Control óptimo cuántico
Aquí hay una plétora de opciones que van desde los llamados algoritmos gradient-free,
como el Simplex (tambien conocido como Nelder-Mead) [99], a otros métodos más
complejos y efectivos que utilizan información de las derivadas primeras y segundas
de la función de costo. Sin entrar en detalles, mencionemos que los segundos suelen
tener rates de convergencia mucho mejores que los primeros [100].
2.2.1. GRAPE y Krylov-GRAPE
Uno de los algoritmos más relevantes en QOC es el llamado Gradient-Ascent Pulse
Engeneering Algorithm (GRAPE). GRAPE supone una parametrización particular
para el control, del tipo constante a tramos (que introducimos a continuación, en la
Sección 2.3.1), lo cual permite evaluar de manera barata y exacta la función de costo
y sus derivadas. Aquí, acentuamos el adjetivo barato ya que, si bien el costo numérico
es mayor al de otros algoritmos, dicho cálculo exacto requiere la diagonalización del
Hamiltoniano en cada intervalo temporal. A pesar de que la diagonalización como
rutina numérica no tiene un scaling demasiado malo, su complejidad computacional va
como 𝒪(𝑑3), es evidente que, si uno considera sistemas del tipo many-body (i.e. muchos
cuerpos), donde 𝑑 es exponencial en el numero de cuerpos, el GRAPE rápidamente
colapsa. Es importante mencionar que una buena parte del esfuerzo invertido en
diagonalizar y hacer un tratamiento exacto se recupera en termino de numero de
iteraciones: suele tener una de las convergencia más veloces dentro del espectro de
algoritmos.
En este contexto, en la Ref. [96] propusimos una pequeña modificación al GRA-
PE para mejorar su capacidad de abordar problemas en el régimen que podriamos
denominar near many-body5. Aquí, donde reemplazamos la diagonalización por un
esquema de basado en el método de Krylov [101]. En dicho trabajo, mostramos como
el algoritmo modificado, el Krylov-GRAPE, logra controlar efectivamente sistemas de
tamaños hasta uno o dos ordenes mayores a los que puede manejar el GRAPE origi-
nal. Finalmente, en la Ref. [102] propusimos una nueva manera de estimar las cotas
5aquí ubicamos sistemas de tamaño mediano, con dimensiones mayores a los cientos y menores a
los cientos de miles
32
Capítulo 2. Control óptimo cuántico
de error en el método de Krylov para la simulación de dinámica cuántica, más barata
y efectiva que las cotas existentes en la literatura. Esperamos que dicha cota nueva
tenga impacto en el desempeño del algoritmo Krylov-GRAPE, y mas generalmente,
en las rutinas numéricas de simulación cuántica basadas en el método de Krylov.
2.3. Paisajes de control cuántico
La función de costo, como función de los parámetros ℒ(𝜃), define el llamado pai-
saje de control cuántico (Quantum Control Landscape, o QCL) [103]. Dicho costo
representa una sábana sobre el espacio de parámetros, donde cada protocolo repre-
senta un punto 𝜃 en el hiper-plano 𝒫 = R𝑀 (el espacio de parámetros) y la altura de
dicho punto esta dada por el mapa ℒ(𝜃). Desde luego que la elección de un algoritmo
u otro juega un papel importante en el éxito o fracaso del proceso de optimización,
pero el rol fundamental lo desempeña la estructura geométrica y topológica del QCL.
En este contexto, a finales del siglo pasado, surgió la teoría QCL. La idea fun-
damental era entender los paisajes de optimización que emergen en los sistemas de
control cuántico. Específicamente, se apuntó a dar un marco teórico que pudiera ex-
plicar la impresionante efectividad y facilidad con la cual se encontraban soluciones
para dichos problemas de optimización, tanto en experimentos [104, 105] como en
simulaciones [106,107, 108]. En los siguientes capítulos estudiaremos dichos paisajes
de optimización en detalle.
2.3.1. Protocolos constantes a tramos
Una de las elecciones más frecuentes de parametrización es la llamada piecewise-
constant controls (PWC, o constante a tramos). En dicho caso la duración del pro-
tocolo 𝑇 se divide en 𝐿 intervalos ∆𝑡𝑗 = 𝑡𝑗 − 𝑡𝑗−1 sobre los cuales el campo toma un
33
Capítulo 2. Control óptimo cuántico
Figura 2.2: Espacios matemáticos relevantes. Un sistema de control emplea un set de 𝑀
parámetros entrenables, 𝜃 ∈ R𝑀 , que conforman el espacio de parámetros. Cada elección de
𝜃 determina una unitaria final 𝑈(𝑇,𝜃) ∈ G a través de la ecuación de movimiento, Ec. (2.2),
y la elección de parametrización, Ec. (2.13) . A su vez, dicha unitaria final determina un
estado final 𝜓(𝑇,𝜃) = 𝑈(𝑇,𝜃) |𝜓⟩ ∈ 𝒪g(|𝜓⟩). Aquí, 𝒪g(|𝜓⟩) se conoce como la órbita de |𝜓⟩
bajo g, y constituye el set de estados accesible mediante elecciones arbitrarias de parámetros
(ver Ec (2.5)). Finalmente, una función de costo ℒ, codificando algún criterio de optimalidad,
mapea los estados finales a la recta real (ver Ec. (2.15)).
valor constante, es decir (supongamos un único control 𝜃(𝑡) para aliviar la notación)
𝜃(𝑡) =
⎧⎪⎪⎪⎪⎪⎨⎪⎪⎪⎪⎪⎩
𝜃1 if 𝑡 ∈ 𝛿𝑡1
...
𝜃𝐿 if 𝑡 ∈ 𝛿𝑡𝐿.
(2.18)
En este caso, la base de funciones seleccionada es la de funciones escalón
𝜑𝑙(𝑡) = ⊓𝑙(𝑡) =
⎧⎪⎨⎪⎩1 if 𝑡 ∈ ∆𝑡𝑙0 else (2.19)
es decir, tal que 𝜃(𝑡) =
∑︀𝐿
𝑙=1 𝜃𝑙 ⊓𝑙 (𝑡). La principal motivación para elegir este ansatz
es que el propagador solución a la ecuación de movimiento, Ec. (2.2), toma la forma
factorizada
𝑈(𝑡) = 𝑈𝐿 · · ·𝑈1, donde 𝑈𝑙 = 𝑒−𝑖(𝐻0+𝜃𝑙𝐻1)Δ𝑡𝑙 (2.20)
es el propagador de dicho intervalo temporal. Lo interesante a notar es que, para
parametrizaciónes arbitrarias {𝜑𝑙(𝑡)} la solución de la Ec.2.2 puede ser bastante com-
plicada, si no impracticable. En cambio, al elegir una secuencia de Hamiltonianos
34
Capítulo 2. Control óptimo cuántico
independientes el esquema PWC admite una expresión explícita para el propagador
𝑈(𝑡). De hecho, no solo los propagadores son simples sino también sus derivadas
𝜕𝑈
𝜕𝜃𝑙
= 𝑈𝑀 · · ·𝑈𝑙+1
𝜕𝑈𝑗
𝜕𝜃𝑙
𝑈𝑙−1 · · ·𝑈1 (2.21)
donde (asumiendo intervalos equiespaciados ∆𝑡𝑙 = ∆𝑡, ∀𝑙 ∈ 1, 2, . . . , 𝐿)
𝜕𝑈𝑙
𝜕𝜃𝑙
= −𝑖∆𝑡�̄�1𝑈𝑙, y �̄�1 =
1
∆𝑡
∫︁ Δ𝑡
0
𝑈𝑙(−𝜏)𝐻1𝑈𝑙(𝜏)𝑑𝜏 . (2.22)
2.4. Control cuántico y computación cuántica en la
era NISQ: un marco común
Las últimas décadas han estado caracterizadas por un crecimiento notable en
el campo de las tecnologías cuánticas. A pesar de que aún estamos a varios años
(quizás décadas) de poder construir computadoras cuánticas a prueba de falla (o
fault-tolerant), en el presente abundan los dispositivos NISQ (por sus siglas en inglés,
noisy intermediate-scale quantum) que si bien son pequeños y ruidosos, se cree que
podrían ofrecer algún tipo de ventaja frente a la computación clásica en el corto plazo.
Esta esperanza ha impulsado el desarrollo de los llamados algoritmos cuánticos
variacionales (VQAs, por sus siglas en inglés). En un VQA, la idea es codificar la
solución a algún problema de interés en una función de costo parametrizada que
puede ser evaluada eficientemente en una computadora cuántica. De esta manera,
uno optimiza sobre los parámetros para minimizar la función de costo y preparar
la solución. En la Fig. 2.3 presentamos esquemáticamente el funcionamiento de un
VQA. Esencialmente, uno aplica una serie de compuertas parametrizadas sobre un
estado inicial, realiza mediciones para reconstruir el estado final y evaluar la función
de costo, y finalmente actualiza los parámetros intentando minimizarla.
Notablemente, el funcionamiento de los VQAs es, en definitiva, muy similar al de
los algoritmos de control cuántico, y de hecho, ambos esquemas se pueden poner en
un marco general [95, 110]. La diferencia fundamental es que, en el caso de control,
35
Capítulo 2. Control óptimo cuántico
Figura 2.3: Esquema unificado para circuitos variacionales y control cuántico. Los
circuitos variacionales, o circuitos cuánticos parametrizados (PQC) son el bloque funda-
mental de las redes neuronales cuánticas (QNNs) y los algoritmos cuánticos variacionales
(VQAs) pueden ser considerados en un esquema unificado donde uno manipula la evolución
de un estado cuántico a través del sintonizado de determinados parámetros [109, 110]. En
un PQC, uno envía el estado inicial a través de una serie de compuertas parametrizadas,
mientras que en QOC uno aplica campos parametrizados sobre el. En ambos casos, al final
de la secuencia de control, se hacen mediciones y se reconstruye el valor de la función de
costo. Se repite este proceso un número 𝑁𝑠ℎ𝑜𝑡𝑠 de veces, obteniendo una precisión de 1√𝑁𝑠ℎ𝑜𝑡𝑠 .
Finalmente se actualizan los parámetros y se empieza de nuevo.
el propagador 𝑈(𝑡,𝜃) satisface la Ec. (2.2), mientras que en el caso de los VQAs
el propagador es un producto de propagadores correspondiente a una secuencia de
compuertas. Últimamente, dichas compuertas corresponden a pulsos de control pre-
fabricados que viven en lo que podríamos denominar el bajo nivel (por ejemplo el
de los fabricantes de la computadora), mientras que el usuario de un VQA vive en
un nivel más alto: elige alguna secuencia de compuertas y luego optimiza sobre los
parámetros.
En particular, en esta tesis consideraremos circuitos cuánticos periódicos (con una
36
Capítulo 2. Control óptimo cuántico
misma estructura de capa que se repite), de la forma
𝑈(𝜃) =
𝐿∏︁
𝑙=1
𝑈𝑙(𝜃𝑙) , 𝑈𝑙(𝜃𝑙) =
𝐾∏︁
𝑘=1
𝑒−𝑖𝜃𝑙𝑘𝐻𝑘 , (2.23)
donde el índice 𝑙 indica la capa (o layer) y el índice 𝑘 corre sobre un set de Ha-
miltonianos Hermíticos 𝐻𝑘 que generan las unitarias de cada capa. Al igual que en
QOC, llamaremos al set de los 𝐻𝑘 el set de generadores 𝒢. Más aun, 𝜃𝑙 = (𝜃𝑙1, . . . 𝜃𝑙𝐾)
agrupa los parámetros entrenables de la capa 𝑙, y 𝜃 = {𝜃1, . . . ,𝜃𝐿} denota el set de
𝑀 = 𝐾 ·𝐿 parámetros en el circuito. El motivo detrás de la elección de circuitos de la
forma (2.23) es que, como veremos en el Capítulo 4, el set de unitarias accesibles 𝑈(𝜃)
a partir de elecciones arbitrarias de 𝜃 se puede caracterizar, al igual que en el caso de
QOC, pura y exclusivamente a través del álgebra asociada con el set de generadores
𝒢 [110].
Finalmente, notamos que los circuitos cuánticos parametrizados, como el de la
Ec. (2.23), han encontrado aplicación en el área del machine learning cuántico (QML).
En dicho campo, el objetivo es evidente: usar computadoras cuánticas para analizar o
procesar datos y encontrar patrones en ellos. La idea subyacente es que, así como una
pequeña computadora cuántica puede generar patrones estadísticos que son difíciles
de producir clásicamente, quizás también pueden reconocer patrones que son difíciles
de reconocer clásicamente [64].
En QML, uno embebe datos clásicos en estados cuánticos [111, 112] y los envía a
través de un circuito cuántico parametrizado, como por ejemplo el de la Ec. (2.23). En
este contexto, dichos circuitos son denominados redes neuronales cuánticas (QNNs)
por su analogía con las redes neuronales artificiales. En definitiva, tal como en un
VQA, uno realiza mediciones y entrena los parámetros de la QNN para minimizar
una función de costo. La diferencia crucial con un VQA es que la función de costo
depende no de un estado inicial |𝜓⟩ sino de un set de ellos, 𝒮, conocido como el set de
entrenamiento. Entre alguna de las tareas arquetípicas de ML que se han explorado
en QML, podríamos destacar el aprendizaje supervisado [38, 43, 113], el autoenco-
ding [114], y principal component analysis (PCA) [33, 115, 116]. En el Capítulo 5
37
Capítulo 2. Control óptimo cuántico
exploramos algunos de estos ejemplos en el marco del estudio de sobreparametriza-
ción en redes neuronales cuánticas.
38
Capítulo 3
Paisajes de control cuántico
En principio, la idea de controlarsistemas cuánticos puede parecer inherentemente
problemática en diversos aspectos. Por un lado, sería lógico pensar que la extrema sen-
sibilidad que tienen dichos sistemas a interacciones con el entorno, de alguna manera,
debería establecer límites a las fidelidades de control realizables. Por otro lado, desde
una perspectiva numérica, y dado el alto costo implicado en propagar la ecuación de
Schrödinger, hallar controles óptimos en sistemas más allá de los extremadamente
pequeños y simples podría resultar, en principio, una tarea casi imposible.
Sin embargo, a medida que se comenzaron a aplicar técnicas de control óptimo a
sistemas moleculares, lo cual fue permitido por determinados breakthroughs en el cam-
po de la tecnología de láseres, se puso en evidencia que controlar sistemas cuánticos
podía resultar más simple de lo esperado. Esta atractiva circunstancia esta relaciona-
da al hecho de que las bases matemáticas de la mecánica cuántica son esencialmente
simples, e.g. linealidad y unitariedad de las transformaciones. A pesar de ser extrema-
damente sensibles a perturbaciones ambientales, las reglas que gobiernan la dinámica
cuántica son, en determinado sentido, bastante más simples que las que uno encuentra
en dinámicas clásicas. En este marco, y de la voluntad de explorar los mecanismos
responsables de dicha sorprendente facilidad al controlar sistemas dinámicos cuánti-
cos, surgió la teoría de paisajes de control cuántico (Quantum Control Landscapes, o
QCL) [103, 117].
En este Capítulo introducimos los aspectos básicos de dicha teoría, separando
39
Capítulo 3. Paisajes de control cuántico
entre aspectos topológicos y geométricos, en las Secciones 3.1 y 3.2, respectivamente.
3.1. Topología del paisaje de control: ausencia de mí-
nimos locales y presencia de trampas falsas
En esta sección nos centramos en los aspectos topológicos de los paisajes de control
cuántico. Como veremos en la Sec. 3.1.1, en condiciones de abundancia de recursos
(e.g. suficiente tiempo, parámetros, bandwidth, etc.), los paisajes de control cuántico
tienen topologías extremadamente simples (por ejemplo, son convexos). En cambio,
como veremos en la Sec 3.1.2, cuando los recursos son limitados los paisajes se compli-
can, e.g. observamos la emergencia sistemática de mínimos locales que son falsos, en
el sentido de que no son mínimos de la función de costo sino una artimaña de la falta
de recursos. Finalmente, en la Sec. 3.1.3 introducimos un modelo simple que permite
la visualización explícita de los paisajes, y por lo tanto, nos ayuda a familiarizarnos
con los conceptos introducidos.
3.1.1. Paisajes cinemáticos
Consideremos una función de costo para la síntesis (o compilación) de una unitaria
objetivo 𝑉 ,
ℒ(𝜃) = 2𝑑− 2ReTr[𝑉 †𝑈(𝜃)]. (3.1)
En la Ref. [118] se estudió la topología crítica de dicha función de costo como función
del espacio de unitarias, ℒ(𝑈), el llamado paisaje cinemático, y no del usual paisaje
dinámico, ℒ(𝑈(𝜃)) que involucra una composición de mapas, (ver Fig. 2.2). El resul-
tado hallado fue que dicho paisaje, 𝐶 : 𝒰(𝑑) → [0, 4𝑑], tiene exactamente 𝑑 puntos
críticos, dados por
ℒ = 0, 4, · · · , 4𝑑 . (3.2)
Más aún, al evaluar el Hessiano en dichos puntos críticos se encontró que: i) en el
mínimo global, ℒ = 0, el Hessiano es definido positivo, ii) en el máximo global,
40
Capítulo 3. Paisajes de control cuántico
ℒ = 4𝑑, el Hessiano es definido negativo, y (iii) en el resto de los puntos críticos,
ℒ = 4, · · · , 4𝑑 − 4, el Hessiano es indefinido. En definitiva, dicho análisis revela que
los paisajes cinemáticos del costo (3.1) no presentan mínimo locales (solo un mínimo
global, un máximo global, y puntos silla) y por lo tanto son convexos.
De manera similar, uno puede considerar la otra tarea de control arquetípica: la
minimización del valor de expectación de algún observable 𝑂
ℒ(𝜃) = Tr[𝑈(𝜃)𝜌𝑈(𝜃)†𝑂]. (3.3)
Aquí, nuevamente, un estudio del paisaje cinemático indica que los únicos puntos
críticos posibles son: (i) mínimos globales, (ii) máximos globales, y (iii) puntos silla.
La única diferencia con respecto al caso anterior es que aquí los mínimos y máximos
globales pueden estar degenerados.
En definitiva, ambos casos presentan paisajes cinemáticos convexos. A pesar de
que dichos resultados en ningún momento asumen un Hamiltoniano específico, de-
bemos mencionar que operan bajo una asunción importante: los sistema de control
considerados son controlables. Notamos que la caracterización topológica de los pai-
sajes de control cinemáticos, en el caso de álgebras g generales, es al día de hoy un
problema abierto y de gran interés práctico.
Ahora bien, en un escenario realista uno no optimiza sobre el set de unitarias sino
sobre el set de parámetros. Estos últimos entran de manera no lineal en las unitarias,
vía el mapa exponencial, y por lo tanto el paisaje ℒ(𝜃) es, en principio, no convexo,
i.e. puede presentar mínimos locales.
3.1.2. Paisajes dinámicos
Como mencionamos previamente, el paisaje que nos interesa es, esencialmente, la
composición de varios mapas (ver Fig. 2.2). Sin pérdida de generalidad, podemos pen-
sar ℒ(𝜃) como la composición de un primer mapa de parámetros a estados cuánticos
𝜓 : R𝑀 → ℋ, es decir, 𝜃 𝜓−→ 𝜓(𝜃) = |𝜓(𝜃)⟩, y un segundo mapa de estados al valor
de costo ℒ : ℋ → R, es decir, |𝜓(𝜃)⟩ ℒ−→ ℒ(𝜓(𝜃)).
41
Capítulo 3. Paisajes de control cuántico
Ahora bien, consideremos la variación infinitesimal en la función de costo ℒ(𝜃) →
ℒ(𝜃) + 𝛿ℒ(𝜃) generada por una variación infinitesimal de los parámetros 𝜃 → 𝜃+ 𝛿𝜃.
Dicha perturbación del costo se puede escribir, usando la regla de la cadena para las
derivadas, como
𝛿ℒ(𝜃) = 𝛿ℒ(𝜃)
𝛿𝜃
· 𝛿𝜃
=
𝛿ℒ(𝜃)
𝛿𝜓
· 𝛿𝜓(𝜃)
𝛿𝜃
· 𝛿𝜃⏟ ⏞ 
|𝛿𝜓(𝜃)⟩
= ⟨𝛿𝜓ℒ(𝜃)|𝛿𝜓(𝜃)⟩
(3.4)
donde en la última línea vemos que la perturbación en el costo 𝛿ℒ(𝜃) se puede escribir
como un producto interno entre |𝛿𝜓(𝜃)⟩ ∈ ℋ, el vector resultante de la acción del
Jacobiano 𝛿𝜓
𝛿𝜃
(matriz de 𝑑×𝑀) sobre el vector perturbación 𝛿𝜃, y 𝛿𝐿
𝛿𝜓
, el Jacobiano
del segundo mapa, una matriz de 1 × 𝑑 (o bien un vector del espacio dual a ℋ que
representa el gradiente de dicho segundo mapa).
Por definición un punto crítico es un punto del paisaje donde toda posible pertur-
bación de parámetros 𝛿𝜃 genera cambio nulo a primer orden
𝛿ℒ(𝜃) = ⟨𝛿𝜓𝐿(𝜃)|𝛿𝜓(𝜃)⟩ = 0, ∀ 𝛿𝜃. (3.5)
Ahora bien, asumiendo que el primer mapa es localmente surjectivo, es decir, que toda
posible dirección en el espacio de estados |𝛿𝜓(𝜃)⟩ es generada por alguna perturbación
en alguna dirección del espacio de parámetros 𝛿𝜃, podemos cambiar el ∀ 𝛿𝜃 en la
Ec. (3.5) por un ∀ |𝛿𝜓(𝜃)⟩
𝛿ℒ(𝜃) = ⟨𝛿𝜓𝐿(𝜃)|𝛿𝜓(𝜃)⟩ = 0, ∀ |𝛿𝜓(𝜃)⟩ ⇐⇒ |𝛿𝜓ℒ(𝜃)⟩ = 0. (3.6)
Del último si solo si vemos que, si uno asume surjectividad del primer mapa, todo
punto crítico del paisaje es un punto crítico del segundo mapa. Dichos puntos crí-
ticos son llamados regulares. Como vimos en la sección anterior, los puntos críticos
42
Capítulo 3. Paisajes de control cuántico
regulares1 solo pueden ser máximos o mínimos locales, o puntos silla. En esta línea,
hubo un fuerte esfuerzo por parte de una parte de la comunidad por asegurar que
el problema de control, con suficientes recursos, esta desprovisto de mínimos locales
[119]. En esencia dichos trabajos intentan relacionar la abundancia de recursos en
los controles (suficientes parámetros, suficiente tiempo, etc) con la satisfacción de la
asunción de surjectividad.
En constaste, si relajamos la asunción de surjectividad podemos notar que, en
general, los paisajes admiten otro tipo de puntos críticos: los llamados singulares [120,
121, 122], donde el gradiente del paisaje es cero porque el overlap en la Ec. (3.5)
se anula, no por un gradiente del segundo mapa nulo, sino porque las direcciones
accesibles |𝛿𝜓⟩ mediante variación arbitraria de controles (como el mapa ya no es
surjectivo,dichas direcciones no son todas) es ortogonal al gradiente cinemático
𝛿ℒ(𝜃) = 0 porque |𝛿𝜓(𝜃)⟩ ⊥ |𝛿𝜓ℒ(𝜃)⟩ . (3.7)
Estos puntos críticos singulares son también llamados trampas falsas para enfatizar
el hecho de que no son puntos críticos de la función de costo en sí, sino problemas de
la parametrización. Como tales, se pueden resolver, por ejemplo, introduciendo más
parámetros o cambiando la parametrización [122].
En este contexto, uno de los primeros aportes nuestros a la literatura de control
cuántico fue estudiar la emergencia de dichas trampas falsas al ir restringiendo los
recursos del control. Como veremos en la siguiente sección, la idea fue considerar un
modelo extremadamente simple, casi de juguete, que a pesar de su simpleza es capaz
de manifestar varios de los fenómenos más interesantes que ofrecen los paisajes de
optimización cuántica, en este caso, el de las trampas falsas.
3.1.3. Ejemplo: trampas falsas en el Landau-Zener
Consideremos entonces nuestro modelo de juguete, el modelo de Landau-Zener,
donde un único qubit evoluciona bajo un Hamiltoniano dependiente del tiempo dado
1que no son otra cosa que los puntos críticos del paisaje cinemático
43
Capítulo 3. Paisajes de control cuántico
Figura 3.1: Paisajes de control para el Landau-Zener. Paisajes de control para el
problema de control definido en la Ec. (3.8), usando un protocolo del tipo PWC de 𝑀 = 2
parámetros (ver Ec. (3.11)). Los distintos paneles corresponden a distintos valores para la
duración del protocolo: (a) 𝑇/𝑇𝑚𝑖𝑛 = 0,7, (b)𝑇/𝑇𝑚𝑖𝑛 = 1,0, (c)𝑇/𝑇𝑚𝑖𝑛 = 1,2 y (d)𝑇/𝑇𝑚𝑖𝑛 =
10. El gap es, en todos los casos, elegido Δ = 1.
por
𝐻(𝜃(𝑡)) = ∆𝜎𝑥 + 𝜃(𝑡)𝜎𝑧 (3.8)
donde ∆ es el gap de energía, y 𝜎𝑥 y 𝜎𝑧 son matrices de Pauli, i.e. [𝜎𝑗, 𝜎𝑘] = 𝑖𝜖𝑗𝑘𝑙𝜎𝑙.
Notamos que este Hamiltoniano tiene la forma general introducida en la Ec. (2.1),
con 𝐻0 = 𝜎𝑥 generando la evolución libre y 𝐻1 = 𝜎𝑧 el único control.
La tarea de control elegida será una transferencia entre estados puros, un caso
particular de la tarea de minimización de observables introducida en la Ec. (3.3),
dada por
ℒ(𝜃) = 1 − | ⟨1|𝑈(𝜃) |0⟩ |2 . (3.9)
Comenzaremos en el estado |0⟩, autoestado de 𝐻(𝜃) para 𝜃 → −∞, e intentaremos
hallar un control 𝜃(𝑡) que al tiempo 𝑇 prepare exactamente el autoestado opuesto,
el |1⟩. Este problema fue propuesto, de manera casi simultánea, por Lev Landau y
Clarence Zener [123, 124], en el marco del estudio de límites al teorema adiabático. En
resumidas cuentas, el teorema adiabático indica que si uno evoluciona con un Hamil-
toniano cuya dependencia temporal es infinitamente lenta, adiabatica, y asumiendo
que en ningún momento se cruzan los niveles de energía, las poblaciones del estado
en la base de autoestados instantáneos del Hamiltoniano se mantienen. Es decir, si
comienzo con el estado fundamental de algún Hamiltoniano inicial 𝐻(𝑡 = 0), perma-
nezco en el estado fundamental del Hamiltoniano instantáneo 𝐻(𝑡) a todo tiempo.
44
Capítulo 3. Paisajes de control cuántico
Figura 3.2: Disolución de trampas falsas. Probabilidad de trampa (fracción de opti-
mizaciónes que resultaron en mínimos locales, i.e. ℒ > 0,01) en función del número de
parámetros 𝑀 para distintas duraciones del protocolo 𝑇 . En todas las curvas (a 𝑇 fijo) se
evidencia una transición abrupta en la probabilidad de trampa, de valores ∼ 1 a valores ∼ 0.
Se inicializaron 500 protocolos aleatorios con 𝜃𝑖 ∈ [−50, 50].
Así, en principio, uno podría hacer transferencia entre estados mediante la interpola-
ción de Hamiltonianos correspondientes (si uno tuviera todo el tiempo del mundo).
Sin embargo, lo que se preguntaron Landau y Zener fue, ¿cuanto se desvía mi estado
si hago la transición en tiempo finito? La respuesta hallada fue que la desviación
depende de la separación mínima entre los niveles de energía, ∆. Específicamente,
hallaron que la probabilidad de éxito en la tarea, es decir, de poblar el estado |1⟩,
cuando uno hace una interpolación lineal entre 𝐻(−∞) y 𝐻(∞), es
𝑃1 = 1 − 𝑒−
𝑣𝑐
𝑣 , con 𝑣𝑐 =
𝜋∆2
4|𝛼|
(3.10)
una velocidad crítica tal que, si 𝑣 << 𝑣𝑐, la probabilidad de exito es esencialmente
uno. Es decir, en este caso uno tiene un protocolo analítico para dicha tarea de control.
Sin embargo, la pregunta que surge es, sobre todo en el marco de la implementación
práctica de dicha tarea donde uno trata de minimizar los tiempos de los protocolos
para que sean menores al tiempo de coherencia de los dispositivos físicos... ¿no se
45
Capítulo 3. Paisajes de control cuántico
puede hacer más rápido?
Esta pregunta se enmarca en el contexto de la rama de control denominada time-
optimal control (o bien, control en tiempo óptimo). En general, los problemas para los
cuales se conocen protocolos time-optimal son pocos. El presente caso del Landau-
Zener es uno de ellos [125], donde el protocolo en tiempo mínimo es simplemente
𝜃(𝑡) = 0, es decir, apagar el control, durante un tiempo
𝑇 = 𝑇𝑚𝑖𝑛 =
𝜋
∆
. (3.11)
Notamos que para tiempos menores no existen controles que implementen la tarea de
manera perfecta.
En este contexto, en la Ref. [126], nos propusimos estudiar el paisaje de control
alrededor de dicho tiempo 𝑇 = 𝑇𝑚𝑖𝑛, con la esperanza de observar algun efecto in-
teresante en el paisaje relacionado con el constraining de los recursos de control. Para
esto, tomamos un control del tipo constante a tramos (o PWC, ver la Ec. (2.18)), con
solo dos intervalos. Es decir,
𝜃(𝑡) =
⎧⎪⎨⎪⎩𝜃1 if 𝑡 6 𝑇/2𝜃2 if 𝑡 > 𝑇/2. (3.12)
En la Fig. 3.1 dibujamos el paisaje para distintos valores de duración del protocolo
𝑇 , de un lado y del otro del tiempo mínimo 𝑇𝑚𝑖𝑛. En dicha figura se puede ver, a
simple vista, la existencia de trampas en el paisaje de optimización. A continuación,
nos propusimos observar la desaparición de dichas trampas al relajar las limitaciones
en el control. Para eso realizamos un experimento numérico consistente en tomar
controles al azar, optimizar, y calcular la fracción de inicializaciones que terminaron
en trampas falsas (ℒ > 0,01). En la Fig. 3.2 estudiamos el comportamiento de dicha
probabilidad de trampa, 𝑝𝑡𝑟𝑎𝑝, en función del número de parámetros 𝑀 y el tiempo 𝑇 .
El resultado obtenido es una transición de fase en la probabilidad de trampa (y por lo
tanto en la complejidad del paisaje), donde existe un numero critico de parámetros 𝑀𝑐
tal que uno pasa de 𝑝𝑡𝑟𝑎𝑝(𝑀 << 𝑀𝑐) ∼ 1 a 𝑝𝑡𝑟𝑎𝑝(𝑀 >> 𝑀𝑐) ∼ 0 al variar el número
46
Capítulo 3. Paisajes de control cuántico
de parámetros de control. Similarmente, notamos que el comienzo de dicha transición
se va postergando a medida que uno se acerca al tiempo mínimo. Esto evidencia una
progresiva complexificación del problema de optimización, que cada vez requiere más
y más parámetros.
3.2. Geometría del Paisaje: estructura trivial y exis-
tencia de subvariedades óptimas
Los paisajes de optimización cuántico presentan una serie de propiedades geomé-
tricas notables. Como vimos en el Capítulo anterior, en el caso de abundantes recursos,
las propiedades topológicas de los paisajes son extremadamente simples. Incluso en
presencia de topologías simples, la optimización podría ser difícil, por ejemplo, si la
estructura geométrica del paisaje fuera compleja y obligara al optimizador a tomar
rutas retorcidas en su camino a las soluciones. Si bien no entraremos en detalles, una
serie de estudios experimentales [127] y numéricos (propios [126] y ajenos [128]) ha
mostrado que las trayectorias de optimización tienden a rectas en el espacio de pará-
metros, a medida que uno relaja los constraints del control (e.g. tiempo y número de
parámetros). Evidentemente, esto indica que la estructura geométrica de los paisajes
parecería volverse trivial en el límite de muchos recursos. En una línea similar, en el
siguiente Capítulo 4 estudiaremos las llamadas barren plateaus, otro fenómeno rela-
cionado a una simpleza geométrica

Continuar navegando