Logo Studenta

Sistemas Neurom´orficos

¡Este material tiene más páginas!

Vista previa del material en texto

Sistemas Neuromórficos
Alumno: Claudia Arribas Fernández
TUTOR: Maŕıa Vélez Fraga
TRABAJO FIN DE GRADO
2019–2020
Índice
Página
1. Motivaciones del trabajo 3
2. Introducción 5
2.1. Computación neuromórfica a partir de dispositivos con arquitectura von Neumann. . 6
2.2. Funcionamiento y partes del sistema nervioso. . . . . . . . . . . . . . . . . . . . . . . 7
2.3. Elementos necesarios para componer un sistema de computación neuromórfica . . . . 10
3. Transición metal-aislante en V O2. 12
3.0. Estructura y propiedades de V O2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.1. Modelo de Sommerfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.1.1. Propiedades térmicas en el modelo de Sommerfeld . . . . . . . . . . . . . . . 19
3.1.2. Propiedades eléctricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.2. Modelo de Electrones Fuertemente Ligados o Tight Binding . . . . . . . . . . . . . . 24
3.2.1. Densidad de estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2.2. Propiedades térmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.2.3. Propiedades eléctricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3. Metal, Aislante y Semiconductor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4. Modelos de la transición metal-aislante . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1
3.4.1. Modelos microscópicos de la transición metal-aislante del V O2 . . . . . . . . 40
3.4.2. Modelo fenomenológico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4. Implementación de un sistema de computación neuromórfica 51
4.1. Neuristores basado en cambio de resistencia volátil por efecto Joule. . . . . . . . . . 51
4.2. Sinaptores basados en mecanismos de cambio de resistividad no volátiles. . . . . . . 58
4.3. Arquitectura de red de sinaptores con conexiones cruzadas . . . . . . . . . . . . . . . 64
5. Conclusiones 67
2
1. Motivaciones del trabajo
La motivación principal del trabajo es comprender el funcionamiento de nuevos sistemas de
computación que actualmente se están desarrollando, que permiten que el procesamiento de infor-
mación sea más efectivo y rápido.
Puesto que vivimos en un mundo en el que la densidad de información aumenta exponencial-
mente con el tiempo, la mejora de las tecnoloǵıas que nos ayudan a procesarla es necesaria y,
los sistemas que actualmente se comercializan comienzan a ser insuficientes para el procesamiento
de toda la información que nos rodea. En concreto, este trabajo va a mostrar una introducción
a los principios de funcionamiento de dispositivos neuromórficos. Estos pueden ser útiles para el
tratamiento de datos de todo tipo de campos; a saber, banca, industria, medicina, bioloǵıa, ciber-
seguridad, tratamiento de datos en laboratorio... permitiendo que el tratamiento de datos no sea
una de las tareas más complejas a las que se enfrentan en cada uno de los campos mencionados.
Con ello, la posibilidad de tener un sistema que se asemeje al funcionamiento del cerebro, en cuanto
a tratamiento de datos se refiere, implica un gran avance en el mundo de la tecnoloǵıa, ya que el
cerebro es el sistema más rápido y eficaz que conoce el ser humano en tratar toda la información
que nos rodea.
Asimismo, este trabajo ha permitido aplicar conocimientos de distintos campos de la f́ısica
adquiridos en el grado. Unos de los principales campos en los que se basa el estudio de los sistemas
neuromórficos son el campo de la f́ısica del estado sólido y la electrónica y además, ha permitido
aplicar conocimientos de termodinámica y óptica.
Comenzaremos con una breve explicación de los sistemas de computación neuromófica a partir
de software utilizando la arquitectura tradicional de Von Neumann, ya que a d́ıa de hoy es el
método más utilizado para emular un sistema neuronal biológico. A continuación, continuaremos
con la descripción del funcionamiento básico del cerebro con la finalidad de describir cada uno de los
elementos necesarios para emularlo a nivel computacional, aśı como las funciones que desempeñan
cada uno de ellos en un sistema de redes neuronales.
Seguidamente, se describirá la transición metal-aislante en el óxido de vanadio (V O2), que es uno
de los materiales más utilizados para el desarrollo de dispositivos neuromórficos. A continuación, se
explicarán las distintas teoŕıas que nos permiten describir el comportamiento de estos materiales.
3
Empezaremos introduciendo los mecanismos básicos que permiten explicar el comportamiento de
los metales como son la teoŕıa de Sommerfeld y la teoŕıa de electrones fuertemente ligados o Tight
Binding. A continuación, se describirán los distintos modelos microscópicos que pretenden describir
el comportamiento de los materiales utilizados, aśı como un modelo fenomenológico.
Por último, se describirán los distintos métodos que existen, actualmente, para componer dos
de los elementos principales para componer un sistema de computación neuromórfica: neuristores,
basados en mecanismos de cambio de resistencia volátil y sinaptores, basados en mecanismos de
cambio de resistencia no volátil.
4
2. Introducción
En este trabajo se estudiarán nuevos sistemas de organización de computación que actualmente
se desarrollan con la finalidad de progresar en las capacidades de los mismos. Para ellos se realizará
un estudio de los sistemas de computación neuromórfica. En primer lugar, se definirá en qué se basa
la computación neuromófica brevemente y qué ventajas tiene sobre los sistemas de computación
actuales.
El desarrollo de este tipo de computación viene motivado por la necesidad de desarrollar orde-
nadores con mejores capacidades en cuanto a consumo de enerǵıa y eficiencia del equipo se refiere.
La Ley de Moore postula que el número de transistores en los procesadores de los ordenadores
actuales se duplica cada dos años, pero esta ley comienza a sufrir una saturación ya que, dichos
transistores cada d́ıa tienen menor tamaño con la finalidad de mantener la escala de los ordenadores
y han llegado a alcanzar las decenas de nanómetros [1]. Por ello, se busca una tecnoloǵıa alternati-
va que permita mejorar la eficiencia de los equipos de computación sin la necesidad de desarrollar
transistores con tan pequeño tamaño.
La computación neuromórfica consiste en un nuevo sistema de desarrollo de computación en
el que se pretende simular el funcionamiento del sistema nervioso central, en concreto, el fun-
cionamiento del cerebro. Puesto que el cerebro humano tiene la capacidad de procesar con gran
eficiencia una gran cantidad de est́ımulos en un tiempo muy corto y con un bajo consumo de
enerǵıa, la computación neuromórfica pretende emular los distintos elementos que componen al
cerebro. Esta tecnoloǵıa fue impulsada por Carver Mead a finales de la década de los años 80 con
el objetivo de mejorar la tecnoloǵıa VLSI (siglas en inglés de Very Large Scale Integration), que
consiste en incluir millones de transistores MOS en una única pieza, un chip. C. Mead se inspiró en
la capacidad de organización y facilidad de computación del sistema nervioso, por lo que tuvo como
objetivo simular una red neuronal a partir de crear un chip que emule cada una de las neuronas
que componen dicha red. [2]
En la actualidad, existen distintos métodos para implementar esta tecnoloǵıa:
Desarrollo a partir de la creación de un software que emule el funcionamiento del sistema
neuronal, utilizando la arquitectura de los ordenadores actuales.
5
Desarrollo de un nuevo hardware que imite, de la manera más próxima a una red neuronal. [1]
2.1. Computación neuromórfica a partir de dispositivos con arquitectura von
Neumann.
A continuación, se discutirán las ventajas e inconvenientes que tienen cada una delas dos
alternativas que se proponen.
La arquitectura von Neumann es la arquitectura que conforma los ordenadores hasta el d́ıa
de hoy. Ésta tiene la disposición mostrada en la figura siguiente y consta de una unidad de pro-
cesamiento central, (CPU, Central Processing Unit), una memoria donde se almacenan tanto los
datos como los programas utilizados por el terminal y un bus de datos o bottleneck que permite la
comunicación entre los dos módulos anteriores.
Figura 1: Esquema de un ordenador basado en la arquitectura von Neumann. [1]
Al tener la memoria y la CPU en regiones separadas por el bus de datos se presenta un problema
en la rapidez del tráfico de datos, cuando estos últimos son muy numerosos. Para resolver este
problema, basándonos en la emulación de un sistema neuronal, se plantean dos soluciones posibles.
La primera consiste en incluir en el caché de la CPU una serie de estructuras de memoria
jerarquizadas. Este tipo de memorias daŕıan prioridad de ejecución a aquellas operaciones con
menor tiempo de procesamiento. Pero el principal inconveniente de aumentar el tamaño del caché
es que el consumo de enerǵıa de éste, depende linealmente con su tamaño, por tanto, implicaŕıa un
aumento en el consumo de enerǵıa del dispositivo. [3], [4]
6
La otra alternativa consiste en una estrategia de computación que permita pasar de un procesa-
miento en serie a un procesamiento en paralelo. Para ello se implementaŕıan diversos procesadores
que permitiŕıan la computación de distintas operaciones en paralelo.
Una de las primeras estrategias seguidas para llevar esto a cabo es simular la señal discreta
que emite y propaga una red neuronal en un unidad de procesamiento gráfico (GPU, Graphics
Processing Unit) en la que se implementan numerosos procesadores en paralelo, ya que los proce-
sadores necesarios en una GPU son mucho más sencillos que los de una CPU o clúster. Para llevar
esto a cabo es necesario además, un programa capaz de simular la señal discreta que emite una
neurona. [5] Esta técnica presenta dos inconvenientes principales:
A nivel algoŕıtmico, el acceso a la memoria a partir de la GPU es más lento, por lo que se
produce una ralentización de la propagación de la señal emulada.
A nivel de programación se tiene que los modelos de programación establecidos por el usuario
tienen dif́ıcil codificación por la GPU.
La estrategia alternativa que se plantea es la creación de un nuevo hardware donde se emule
la red neuronal a partir basada en una nueva arquitectura, es decir, dispositivos individuales que
emulan neuronas y sinapsis
2.2. Funcionamiento y partes del sistema nervioso.
Para emular las neuronas y sinapsis de un sistema neuromórfico biológico se realizará una
descripción de la estructura y funcionamiento del sistema nervioso, que proporcionará una idea de
los elementos y funciones que tiene cada uno de sus componentes.
El sistema nervioso se compone de numerosas neuronas conectadas entre śı que transmiten la
información a través de la sinapsis. [2]
La neurona es la célula principal del sistema nervioso, la cual se compone de los siguientes
elementos [2]:
Las dendritas permiten la recepción de la información a través de la sinapsis, transmitiéndola
7
al cuerpo celular de la neurona para que ésta la codifique.
El cuerpo celular recibe y procesa la información recibida y genera una respuesta.
El axón permite propagar la respuesta generada a otras neuronas del sistema.
Por otro lado, las funciones principales de la neurona son las siguientes:
Las dendritas poseen cierta resistencia en la punta, representada por un potencial que implica
el acoplamiento parcial de ellas.
La información se transmite a través de una señal eléctrica, la cual es integrada de distintas
formas. La integración se produce a tiempos cortos mediante el almacenamiento de carga
en la membrana celular, mientras que la integración a tiempos largos se produce mediante
procesos bioqúımicos en zonas más internas de las terminaciones de la neurona.
La sinapsis es el mecanismo a partir del cual se establece la conexión entre las distintas neuronas
del sistema, permitiendo aśı la propagación del impulso por el sistema nervioso. En un sistema
neuronal biológico, la sinapsis comienza con una descarga qúımica, generando una corriente eléctrica
en la neurona en torno al final del axón. Una vez la corriente eléctrica alcanza el final del axón,
se produce la segregación de ciertos compuestos qúımicos a la neurona receptiva que la excitan
y generan una corriente, aśı se produce la transmisión del impulso entre las neuronas implicadas.
Debido a esto, la sinapsis es un componente indispensable de un sistema neuronal, ya que permite
la transmisión de la información recibida y generada por cada una de las neuronas a lo largo del
sistema nervioso. Por otra parte, una de las propiedades más interesantes del sistema nervioso es
la plasticidad neuronal, que consiste en la capacidad que posee el sistema nervioso en modificarse
con la finalidad de adaptarse a los distintos est́ımulos del medio. Gracias a la plasticidad neuronal,
el sistema nervioso tiene la capacidad de aprender posibilitando la aceleración de la respuesta a
est́ımulos a los que el sistema ha sido previamente expuesto. [2]
A continuación se enumerarán los distintos aspectos que ha de cumplir el nuevo sistema de
computación para que emule el comportamiento neuronal. [6]
En primer lugar, mediante esta nueva arquitectura se pretende emular la propagación de una
señal de forma efectiva a través de la ramificación de numerosas neuronas. Para ello se utiliza una
8
arquitectura formada por distintas capas apiladas de material, lo cual permite una propagación
más rápida de la señal.
Seguidamente, se busca emular la individualidad de una neurona, lo cual permite que, en caso
de la existencia de un fallo en una de ellas, el sistema general no se vea afectado por ello.
Se busca emular, además, la transmisión de la señal de forma no lineal, como se puede observar
en la figura 2 (a), donde varios axones están conectados a las dendritas de una única neurona.
Esto permite que la señal se emita únicamente habiendo alcanzado un voltaje umbral [7]. Y, tras
la transmisión del impulso a otra neurona, recuperar la situación inicial previa al impulso.
Por último, emular el comportamiento LIF (Leaky Integrate and Fire) que sufre una neurona
al propagar una señal. El comportamiento LIF consiste en la integración de la señal aplicada, acu-
mulando parte de la carga de ésta, hasta alcanzar un cierto voltaje umbral, cuando se produce una
respuesta (“fire”) [7]. Como se esquematiza en la figura 2 (a), la neurona integra la carga procedente
distintas terminaciones nerviosas hasta que el potencial en la membrana neuronal alcanza un valor
umbral. Una vez alcanzado ese potencial umbral, la neurona genera una respuesta que se transmite
a través del axón de la neurona.
Aplicando el esquema de un sistema neuronal a sistemas de computación neuromórfica frente
a una computación basada en la arquitectura de von Neumann se espera obtener un sistema más
eficiente, estable y flexible. [8]
La eficiencia se obtiene gracias a que, al tener un mar de axones en los clúster, se puede dar lugar
la colocalización de la memoria y el procesamiento de la información proporcionada, obteniendo aśı
un sistema más rápido, pues se suprime el problema que prensentado en la arquitectura anterior.
Además, sólo se transmitirán a largas distancias aquellos eventos que estén separados en el tiempo.
[8]
Los núcleos (o neuronas) pueden ser apilados en columnas, permitiendo aśı que la comunicación
no tenga que viajar a grandes distancias, lo que proporciona una rapidez en la propagación del
evento. Asimismo, los defectos en los núcleos no provocan un fallo del sistema completo, lo que
favorece su estabilidad. [8]
9
Figura2: (a) Representación esquemática de una neurona biológica. Se muestra cómo la neuro-
na genera una respuesta a impulsos eléctricos como señal de entrada mediante la acumulación de
potencial en la membrana, cuando el potencial en esta alcanza un valor umbral. (b) Esquema del
comportamiento LIF mediante dos métodos distintos. El primero de ellos (esquema de la izquier-
da), la acumulación de carga por la aplicación de descargas eléctricas. El esquema de la derecha
representa la emulación del comportamiento LIF a partir de la generación de sitios metálicos corre-
lacionados en un aislante Mott. (c) Representación del comportamiento LIF a partir de la creación
de sitios metálicos relacionados en un aislante Mott. Se muestra cómo, a medida que se aplican
impulsos al sistema, el aislante genera sitios metálicos, hasta alcanzar un valor umbral para el cual
se produce el disparo de la respuesta, que se corresponde con la conexión de los electrodos a partir
de un camino de sitios metálicos. [7]
La flexibilidad viene dada por la capacidad que posee cada neurona y sinapsis de ser configuradas
de forma individual, es decir, se pueden activar o inhibir de forma individual en función de la
necesidad del uso de cada una de ellas. La sinapsis entre neuronas puede ser individual, es decir,
entre dos neuronas, o conjunto en función del caso dado, posibilitando aśı, una mayor eficacia de
la propagación del evento. [8]
2.3. Elementos necesarios para componer un sistema de computación neu-
romórfica
Para emular los comportamientos anteriores se utiliza, principalmente, computación neuromórfi-
ca basada en memristores como se esquematiza en la figura 2 (b). Los memristores son dispositivos
10
de memoria que utilizan la conmutación de la resistividad del material que lo componen. Permiten
la relación no lineal de la corriente y el voltaje que recorren el material y se basan en la transición
de fase aislante-metal de aislantes Mott. [7]
En concreto, para emular un sistema biológico neuronal son necesarios dos elementos principales:
Neuristores: Elementos activos que emulan el comportamiento de las neuronas con respecto
a la computación de los est́ımulos recibidos [1]. Una de las caracteŕısticas principales de la
computación generada por las neuronas es su carácter no lineal como respuesta a un est́ımulo
o pulso. Para poder emular este comportamiento se utilizan materiales con un cambio de
resistividad volátil, es decir, que cuando el material alcanza un cierto voltaje umbral éste
cambia de resistividad, pasando de una fase de resistividad alta (aislante) a una fase de
resistividad baja (metal). Una vez el pulso aplicado finaliza, el material recupera la resistividad
inicial, es decir, el estado aislante.
En la figura 2 (b) se muestra cómo la generación de sitios metálicos en un aislante Mott puede
producir un comportamiento equivalente a la integración de pulsos en la neurona. [7]
Un neuristor debe imitar el comportamiento LIF (Leaky, Integrate and Fire) de una neurona.
Para ello, el neuristor debe tener cierta memoria a corto plazo, sumando aśı todas las entradas
en un intervalo de tiempo próximo. Dicha memoria puede venir generada por el tiempo de
relajación de la transición aislante-metal. En la figura 2 (c) se representa la emulación del
comportamiento LIF en un sistema de computación neuromórfica basado en aislantes Mott.
En ella se observa cómo es necesaria la integración de varios impulsos para generar una
respuesta. Tras la aplicación del primer pulso, se produce la transición a estado metálico de
diversos puntos dentro del material aislante, de forma deslocalizada, y tras la finalización
del primer pulso, estos disminuyen sin llegar a desaparecer el número de sitios metálicos en
el sistema (comportamiento Leaky). Antes de que el sistema se relaje y todos los puntos
del material vuelvan a sufrir la transición a su estado inicial (aislante), se aplica un segundo
pulso que permite la generación de un mayor número de sitios metálicos contiguos. Aśı, tras la
aplicación de diversos pulsos, el dispositivo alcanza un cierto valor umbral de sitios metálicos
permitiendo la circulación de corriente por los mismos y generando una respuesta. Cabe
destacar que dicha respuesta no se produce nada más aplicar el pulso que permite alcanzar
el potencial umbral, sino que se genera con cierto retraso o delay.
11
Por otro lado, las conexiones entre los distintos neuristores se forman a partir de elementos
metálicos, como pueden ser electrodos en los confines del neuristor, que haŕıan la función de
las dendritas y axón de una neurona. Sin embargo, haciendo uso de otros elementos como
conectores entre neuristores se pueden obtener otras funciones útiles de los mismos. Por
ejemplo, el uso de elementos que permitan aumentar la ganancia de la señal que recibe el
neuristor, aśı no seŕıa necesario un amplificador de la señal respuesta que emite el neuristor. [1]
Sinaptores: Elementos que permiten el control de la conectividad entre los neuristores. Para
emular el comportamiento de la sinapsis de una neurona se utilizan materiales que permitan
realizar un cambio de resistividad no volátil, es decir, al contrario que en el caso anterior, la
resistividad tras finalizar el pulso aplicado no vuelve a su estado inicial sino que precisa de
la aplicación de otro pulso de voltaje para volver al estado aislante del material. Al utilizar
elementos de cambio de resistividad no volátil se puede emular la memoria sináptica de un
sistema neuronal aśı como la plasticidad de las neuronas, es decir, la capacidad de aprendizaje.
[1]
3. Transición metal-aislante en V O2.
3.0. Estructura y propiedades de V O2
La transición de un estado metálico a un estado aislante, y viceversa, en materiales compuestos
por metales de transición implica un comportamiento interesante para la implementación de la
computación neuromórfica. En concreto, el dióxido de vanadio (V O2) será el material estudiado,
ya que es uno de los materiales más utilizados en el desarrollo de sistemas de computación neu-
romórfica. Esta transición da lugar a un comportamiento muy distinto del material en función de
la temperatura del mismo. Además, el V O2 es un material de interés puesto que la transición de
aislante a metal se produce a temperaturas cercanas a la temperatura ambiente. [9]
Como se puede observar en la figura 3 [9], la variación de la resistividad es abrupta, ya que
se produce un descenso de ésta de 5 órdenes de magnitud, obteniendo aśı la transición entre un
aislante (alta resistividad) y un metal (baja resistividad) en un intervalo corto de temperaturas
(en torno a 10K). Dicha transición lleva acompañado un cambio en la simetŕıa de la estructura
12
Figura 3: Resistividad del V O2 en función de la temperatura mostrando un comportamiento de
histéresis en función de la temperatura del material. Además, se pueden observar a la derecha cómo
vaŕıa la estructura cristalina del material pasando de monocĺınica en el estado de aislante, a una
estructura cristalina tetragonal tipo rutilo en el estado metálico. También, se muestra en la parte
superior de la imagen distintos métodos a partir de los cuales se obtiene la transición metal-aislante
en el V O2 como son: la excitación por láser, la aplicación de un dopaje en la estructura del cristal
o la aplicación de una tensión o voltaje externo. [9]
cristalina, ya que la simetŕıa que presenta el V O2 en el estado de aislante es monocĺınica, mientras
que en el estado metálico presenta una estructura cristalina tetragonal tipo rutilo.
En la parte derecha de la figura 3 se esquematizan distintos métodos con los que modular y
controlar la transición, lo cual permitirá que la transición no dependa únicamente de la temperatura
aplicada, sino que se pueda obtener con cierto control de la misma, lo que resulta de gran utilidad
para el diseñode dispositivos como los memristores que se emplean en computación neuromórfica.
Uno de los métodos es la introducción de un dopante en el material, donde los dopantes más
utilizados son metales de transición como el wolframio o átomos ligeros como el hidrógeno. En
el primero de los casos, la introducción de wolframio como dopante conlleva la reducción de la
temperatura cŕıtica a la que se produce la transición. Además, se produce también cambio en la
estructura cristalina, aumentando el espaciado entre los cationes. En el caso de utilizar hidrógeno
13
como dopante provoca un menor espaciado entre los cationes puesto que el radio de los átomos de
hidrógeno es menor, lo que implica una fuerte unión entre los electrones aportados por el hidrógeno
y los iones del V O2 y produce un aumento en la distancia entre las bandas que favorece la transición
al estado aislante. [9]
Sin embargo, las desventajas de este método para modular la transición aislante metal son
las siguientes. La concentración de dopantes no es homogénea en todo el cristal por lo que la
modulación de la transición no se produce de forma continua por todo el cristal. En función de la
concentración de dopantes en el sólido y el elemento que se tome como dopante, la transición puede
ser irreversible, lo que no es adecuado para la fabricación de dispositivos neuromórficos.
El segundo método de modulación de la transición consiste en la aplicación de un láser sobre
el V O2 para producir la transición del estado aislante al estado metálico y está basado en la
modulación de la ocupación de los orbitales. Este método fue desarrollado por A. Cavarelli et al.
en 2001 [10], donde aplicaron pulsos de un láser de luz visible. Observaron que al aplicar dichos
pulsos de láser sobre el material en su estado aislante, se produćıa la excitación de los electrones
de valencia, pasando estos a ocupar estados de la banda de conducción. Como consecuencia resulta
una redistribución de las fuerzas que actúan sobre los iones de vanadio y produce el cambio de
enerǵıa de ambas bandas, obteniendo aśı, el estado metálico. Tras un tiempo dado, los electrones
se desexcitan y vuelven a pasar a la banda de valencia, obteniendo, una vez más el estado aislante
del V O2. [9]
El tercer método está basado en las deformaciones elásticas que aparecen al crecer una lámina
de V O2 sobre un sustrato con un desajuste de red. Al colocar una lámina de V O2 sobre un sustrato,
como por ejemplo TiO2, se obtiene una zona tensionada en la intercara a causa de la diferencia
del coeficiente de dilatación de cada uno de los materiales para una temperatura cercana a la
temperatura cŕıtica a la que se produce la transición aislante-metal del V O2, esto produce una
variación en la temperatura a la cual se produce la transición. Cabe destacar que, seleccionando el
material que compone el sustrato y el grosor de la lámina de V O2 se puede controlar la variación
en la temperatura de transición. Aunque este método de modulación de la transición puede ser
efectivo, tiene un inconveniente ya que la modulación no es continua y, en función de la rigidez del
sustrato, puede ser irreversible. [9]
Por último, otro de los métodos utilizados es la aplicación de un campo eléctrico al V O2.
14
Figura 4: Esquema de la variación de estructura de bandas del V O2 al aplicar sobre él un láser.
En el paso 1, se excitan los electrones de valencia, pasando estos a la banda de conducción. El
paso dos esquematiza cómo se reorganizan las fuerzas ejercidas sobre los iones de vanadio como
consecuencia del paso anterior, obteniendo un aumento de enerǵıa en la banda de valencia y de
conducción, entorno al nivel de enerǵıa de Fermi. El paso 3 consiste en la relajación de los electrones
en la banda de conducción, volviendo estos a la banda de valencia. Figura basada el esquema de [9].
Existen dos formas de modular la transición a partir de la aplicación de un campo eléctrico: el
calentamiento del material por la aplicación de una corriente eléctrica y la inclusión de V O2 en
un transistor de efecto campo, como puede verse en el esquema situado en la figura 3. El primer
tipo de modulación está basado en el efecto Joule que se produce en el interior del cristal al aplicar
una corriente eléctrica pulsada, produciendo la variación de la concentración de portadores en el
cristal. A causa de esta corriente eléctrica, el material sufre efecto Joule y se calienta y se produce
la transición del estado aislante al estado metálico. Uno de los inconvenientes de este método,
observado por Wang et al. [11], es el control del paso del estado metálico al estado aislante, ya
que existe cierta dificultad para enfriar el material. El segundo método, se basa en la aplicación
de una cierta corriente a un transistor de efecto campo que incluye una lámina de V O2, variando
aśı, la distribución de los portadores de carga y permitiendo la modulación de la transición. Un
inconveniente de este segundo método de modulación es que, en algunos casos, la corriente inducida
por el transistor al V O2 no es suficiente para que de lugar la transición. [9]
3.1. Modelo de Sommerfeld
Para poder explicar mejor la transición metal-aislante en el V O2 se realizará un repaso sobre
qué caracteriza a un metal y a un aislante. Algunas de las propiedades f́ısicas que caracterizan un
15
metal son una alta conductividad eléctrica (baja resistividad) y buena conductividad térmica.
Comenzaremos explicando estas propiedades a partir del modelo de Sommerfeld. [12]
El modelo de Sommerfeld describe el comportamiento de los electrones en un metal tomando
como premisa la aproximación de electrones independientes, es decir, no considera la interacción
electrostática entre electrones y, la aproximación de electrones libres, implicando que éstos no
interaccionan con los iones que componen el cristal.
En contraposición a Drude, Sommerfeld considera los electrones del cristal como un gas de
electrones con un comportamiento cuántico. Debido a que los electrones son part́ıculas fermiónicas,
seguirán la distribución de velocidades de Fermi-Dirac:
f(v) =
(m/~)3
4π3
1
e(
1
2
mv2−kBT0)/kBT + 1
(1)
Donde T0 se corresponde con la temperatura determinada por la condición de normalización
n =
∫
f(v)dv.
Puesto que se considera a los electrones del cristal como un gas de electrones, se les asocia a
cada uno de ellos una función de onda tal que, el estado fundamental de un sistema con N electrones
en un volumen dado V viene dado por la siguiente expresión:
− ~
2
2m
∇2ψ(r) = εψ(r) (2)
Dado un sólido tridimensional, la condición de contorno Born-von Karman implica que el final
de la cadena esté unido al punto incial de la cadena. Esto se traduce en que la función de onda
asociada a un electrón tiene el mismo comportamiento para un punto L de la cadena que para el
inicio de la cadena.
16
ψ(x+ L, y, z) = ψ(x, y, z) (3)
ψ(x, y + L, z) = ψ(x, y, z) (4)
ψ(x, y, z + L) = ψ(x, y, z) (5)
(6)
Si la aplicamos a la expresión (2) obtenemos que la solución al Hamiltoniano es de la forma
ψk =
1√
V
ei
~k~r, donde ~k es el vector de onda asociado a un estado y ~r es la posición del electrón
en el sólido. La enerǵıa asociada a dicha función de onda es ε(k) = ~
2k2
2m . Además, la condición de
contorno también implica una condición sobre el módulo del vector de onda:
ψ(x+ L, y, z) = ψ(x, y, z)
eikxL = eikyL = eikzL = 1
2πni = kiL i � 1, 2, 3 ni �Z
ki =
2πni
L
(7)
Donde L se corresponde con la longitud de la cadena.
Además, se asocia un momento al vector de onda referente a cada uno de los k-estados tal que
p = ~k.
La forma en la que los electrones se posicionan en cada uno de los k-estados es tal que comienzan
llenándose de k-estados con menor enerǵıa hasta los k-estados de mayor enerǵıa y, teniendo en
cuenta el Principio de exclusión de Pauli, que considerael esṕın del electrón, en cada uno de los
k-estados se pueden encontrar dos electrones con valores de esṕın distintos.
Dado un sistema con N electrones, el último estado en ser ocupado por los electrones se denomina
nivel de Fermi, kF . Todos los estados ocupados se encuentran dentro de una esfera con radio kF
17
donde la densidad de electrones dentro de la esfera es la siguiente:
n =
k3F
3π2
(8)
Donde n es la densidad de electrones del sólido. A partir de la expresión (8) se obtiene que el vector
de onda de Fermi viene dado por kF =
(
3nπ2
) 1
3 . Asociado al vector de onda de Fermi, existen otras
cantidades relacionadas con el último estado ocupado por los electrones del cristal como son:
Momento de Fermi: pF = ~kF .
Enerǵıa de Fermi: εF =
p2F
2m =
~2k2F
2m .
Velocidad de Fermi: vF =
pF
m =
~kF
m .
Temperatura de Fermi: TF = εF /kB.
A continuación, definiremos la densidad de estados de un cristal en el modelo de Sommerfeld.
Sea una propiedad a(~k) de un electrón, la misma propiedad en todo el sistema es de la forma:
A = 2
∑
|~k|<kF
a(~k) ' 2V
(2π)3
∫
|~k|<kF
a(~k)d~k (9)
Si expresamos dicha propiedad en función de la enerǵıa asociada al vector de onda ~k obtenemos
la siguiente igualdad:
A =
2V
(2π)3
∫
|~k|<kF
a(~k)d~k = V
∫ EF
0
g(ε)a(ε)dε (10)
Donde g(ε) es la densidad de estados del sistema. Por tanto, se obtiene que:
2V
(2π)3
∫
|~k|<kF
d~k = V
∫ EF
0
g(ε)dε (11)
A continuación, realizamos el siguiente cambio de variable que nos permita expresar la parte iz-
quierda de la expresión (11) en función de la enerǵıa.
18
k =
√
2mε/~ (12)
dk
dε
=
m
~2k
(13)
Por consiguiente, se obtiene aplicando el cambio de variable que la expresión (11) tiene la
siguiente forma:
2V
(2π)3
∫ EF
0
d~k = V
∫ EF
0
(2m)3/2ε1/2
2π2~3
dε = V
∫ EF
0
g(ε)dε (14)
Por tanto, la densidad de estados g(ε) de un cristal en función de la enerǵıa del sistema y la enerǵıa
de Fermi se define como:
g(ε) =
1
2
3n
EF
(
ε
EF
)1/2
(15)
Donde n es la densidad de electrones del sólido, EF es la enerǵıa del nivel de Fermi y ε es la enerǵıa
de un nivel dado.
3.1.1. Propiedades térmicas en el modelo de Sommerfeld
El efecto de la temperatura en un gas de electrones libres implica la excitación de los electrones
del mismo produciendo una variación de la distribución de las velocidades de los electrones. En
consecuencia, también se produce una excitación del estado fundamental. [12]
A partir de esto, tenemos que, dada la función de partición definida por la distribución de
Fermi-Dirac para un sistema de N electrones:
PN =
e−E/kBT∑
α e
−Eα/kBT
(16)
Donde α son todos los estados estacionarios del sistema, es decir, todos aquellos en los que existe
equilibrio termodinámico.
Teniendo en cuenta el principio de exclusión de Pauli, para describir el llenado de cada uno de
los estados del sistema por electrones se tiene que la probabilidad de que un electrón se encuentre
19
en el estado i-ésimo es tal que:
fNi =
N∑
α
PN (E
N
α ) (17)
Donde el sub́ındice i hace referencia a cada uno de los estados del sistema. Puesto que la probabi-
lidad que un electrón ocupe el estado i-ésimo es menor que la probabilidad de que no se encuentre
en él, podemos definir fNi de modo que:
fNi = 1−
N∑
γ
PN (E
N
γ ) (18)
Además, se tiene que la enerǵıa de un sistema de N electrones con el estado i-ésimo no ocupado es
igual a la enerǵıa de un sistema de N+1 electrones con el estado i-ésimo ocupado, donde la diferencia
entre ambas enerǵıas se corresponde con εi. Dado esto, la probabilidad de que un electrón ocupe el
estado i-ésimo, a una temperatura dada, es la misma para un sistema de N electrones que para un
sistema con N+1 electrones. También, cabe tener en cuenta que la diferencia de enerǵıa libre entre
los dos sistemas viene dada por el potencial qúımico µ = FN+1 − FN .
Como consecuencia, se tiene que, para una temperatura dada del sistema, el factor de ocupación
de cada uno de los estados viene dada por la siguiente expresión:
fNi =
1
e(εi−µ)/kBT + 1
(19)
Cuando la temperatura del sistema es T = 0K tenemos que sólo están ocupados aquellos estados
con ε < εF , por tanto, el factor de ocupación se corresponde con una función escalón (figura 5).
Cabe destacar que, cuando la temperatura T tiende a 0K el valor de µ es equiparable al valor de
la enerǵıa de Fermi.
Dada una temperatura T, se aplica el factor de ocupación (19) a la densidad de estados y
se obtiene una variación de la misma en función de ε como se puede observar en la figura 6. Se
observa que el área bajo la curva punteada g(ε) es distinta que el área bajo la curva continua
g(ε)f(ε) con enerǵıa mayor que µ. Esto implica que la excitación de estados con enerǵıas menor
a la enerǵıa de Fermi (o potencial qúımico) no están compensados con los estados excitados con
enerǵıas superiores a la enerǵıa de Fermi, por tanto, de esto se concluye que el potencial qúımico
vaŕıa con la temperatura y, por tanto, la enerǵıa del sistema vaŕıa en función de la temperatura del
20
Figura 5: Representación del factor de ocupación de los estados del sistema para el estado funda-
mental, donde sólo se encuentran ocupados aquellos estados para los que la enerǵıa sea menor o
igual a la enerǵıa de Fermi, que en esta figura viene representada en función del vector de onda de
Fermi.
mismo.
Figura 6: Variación de la función densidad de estados ocupados al aplicar una temperatura mayor
a 0K al sistema. La curva roja representa la densidad de estados ocupados para una temperatura
dada, mientras que la ĺınea punteada representa la densidad de estados sin la aplicación de dicho
factor de ocupación.
La enerǵıa del sistema dada una cierta temperatura T viene dada por:
E(T ) = E(T = 0) +
γ̃
2
· [número de e− excitables]︸ ︷︷ ︸
V g(EF )kBT
· [Enerǵıa de cada uno de ellos]︸ ︷︷ ︸
∼kBT
(20)
Donde γ̃ = π
2
3 . La capacidad caloŕıfica viene dada por la derivada de la enerǵıa del sistema en
21
función de la temperatura a un volumen constante, por lo que:
Cv = γ̃V g(EF )k
2
BT (21)
La conductividad térmica κ de un cristal viene dada por la expresión:
κ =
1
3
Cvv
2τ (22)
Siendo τ el tiempo de relajación entre colisiones de los electrones en el interior del sólido y Cv la
capacidad caloŕıfica del sólido. Aplicando la expresión (21) a la expresión anterior se obtiene que:
κ =
1
3
γ̃V g(EF )k
2
BTv
2
F τ (23)
3.1.2. Propiedades eléctricas
En esta sección se exponen las distintas propiedades eléctricas de un cristal descrito por el
modelo de Sommerfeld. [12]
Sea ~ψ(r) la función de onda asociada a un electrón, la probabilidad de que el electrón se
encuentre en dicho estado de enerǵıa es tal que ρP = |ψ(r)|2.
Definiendo el flujo de corriente en el cristal a partir de la densidad de probabilidad se obtiene
la expresión (24) tomando la función de onda como una onda plana ψ(r) = 1√
V
ei
~k~r.
~jP =
δ(~∇ψ(r)
δr
) =
~vk
V
(24)
En consecuencia, la corriente aportada por cada uno de los electrones es ~ji = −e ~jP , de lo que
se deriva que la corriente aportada por todos los electrones del sólido es:
~j = −en < ~vk > (25)
22
Donde < ~vk > se corresponde con el valor esperado de la velocidad asociada al estado k-
ésimo. En el modelo de Sommerfeld, v = ~km y, en ausencia de campos externos, la distribución de
velocidades es simétrica por lo que vk = 0.
Si el sólido se encuentra en el seno de un campo eléctrico constante ~E, se produce un estado
estacionario. Donde la fuerza que sufre el electrón viene dada por la siguiente expresión:
F = m
dv
dt
= ~
dk
dt
= qE − ~k
τ
(26)
Donde el primer término es la fuerza de Coulomb y el segundo corresponde a las colisiones de
los electrones al moverse por el sólido. Al aplicar dicho campo se produce una traslación de los
electrones en sentido contrario al mismo en la misma banda de enerǵıa, ocupando aśı nuevos
estados y desocupando otros tal y comose muestra en la figura 7.
Figura 7: En esta figura se muestra como, al aplicar el campo eléctrico constante ~E se produce un
desplazamiento de los estados ocupados hacia la derecha. La ĺınea azul hace referencia a los estados
ocupados una vez aplicado el campo ~E, mientras que la ĺınea roja representa los estados ocupados
en la situación en la que el cristal no se ve afectado por ningún campo externo.
A partir de la figura 7 podemos observar que existe una cierta relación entre el campo eléctrico
aplicado y la variación en el vector de onda ∆k, que se calcula a continuación. Partiendo de que es
un estado estacionario:
23
−e ~E − < ~p >
τ
= 0 < ~p >= ~ < ~k > (27)
< ~k > = ∆k = −−eτ
~
E (28)
Por lo tanto, la corriente neta es j = ne~ km =
ne2τ
m E. Esto permite calcular la conductividad
eléctrica en función de la densidad de electrones y su tiempo de vida medio entre colisiones.
El modelo de Sommerfeld describe adecuadamente los metales más sencillos como los alcalinos
y los metales nobles. Sin embargo, debido a la aproximación realizada de electrones libres hay
bastantes aspectos de las propiedades de metales que no se pueden explicar, por ejemplo:
El modelo de Sommerfeld sólo tiene en cuenta los electrones de valencia y no todos los
electrones que componen el sólido. Por ello, el modelo de Sommerfeld no es útil para la
descripción de los cristales aislantes y metales de transición. Sólo describe de forma adecuada
los metales alcalinos.
No puede justificar por qué el recorrido libre medio de un electrón en el estado fundamental
es de 100 m, cuando debeŕıa ser un valor de menor orden puesto que existen otras part́ıculas
formando el sólido.
3.2. Modelo de Electrones Fuertemente Ligados o Tight Binding
A continuación se expondrá el modelo Tight-Binding que parte de la aproximación de electrones
independientes pero no libres. El modelo Tight-Binding nos permitirá describir, además de los
metales alcalinos, los metales de transición, los materiales semiconductores y aislantes. Además,
permitirá describir la estructura de bandas de un cristal, que será útil posteriormente, para explicar
mejor la transición metal-aislante. [13]
Como se mencionó anteriormente, el modelo Tight-Binding parte de la premisa de suponer
los electrones como part́ıculas independientes pero no libres, es decir, están bajo el efecto de un
potencial periódico resultado del efecto de los iones que componen la red cristalina. Por ello, el
24
Hamiltoniano que describe el comportamiento de los electrones en el cristal se define como:
H =
p2
2m
+ Vred (29)
Considerando una cadena monoatómica, se obteiene que existen distintos tipos de estados dis-
ponibles como se puede observar en la figura 8.
Figura 8: Representación del potencial de una cadena monoatómica donde los ćıruclos azules re-
presentan cada uno de los iones que conforman la cadena monoatómica. Se pueden observar 4 tipos
de estados. La ĺınea verde representa los estados libres, es decir, no sufren el efecto de un potencial
periódico (representado por las curvas rojas). Las ĺıneas rojas representan los estados ligados. Las
ĺıneas negras que se encuentran en los confines del potencial periódico representan los estados que
se propagan en presencia del potencial periódico. Por último, las ĺıneas naranjas representan los
estados “casi”libres, es decir, sufren el efecto del potencial periódico levemente.
En primer lugar, los estados libres son aquellos que no sufren el efecto del potencial periódico
que implica la presencia de los iones de la red. Por ello, estos estados seguirán la descripción del
modelo de Sommerfeld, ya que se hace uso de la aproximación de electrones independientes y libres,
como se comentó en la sección anterior. Debido a esto, la función de onda asociada a estos estados
es una función de onda plana tal que ψ(r) ∼ ei
~k~r
√
V
.
25
Por otro lado, los estados ligados serán aquellos que se encuentran ligados al átomo y siguen la
descripción de orbitales atómicos donde Vred(x) es el potencial asociado a un orbital atómico. Estos
estados son estados localizados y el potencial asociado a cada uno de los orbitales es el siguiente:
Vl =
−Ze
|x− xl|
, ϕµ(x− xl) (30)
Donde Vl es el potencial de interacción coulombiana entre el electrón situado en x respecto de los
núcleos situados en las posiciones xl, ϕµ es la función de onda asociada a los electrones situados
en x respecto de los núcleos, µ es el conjunto de números cuánticos y l recorre cada uno de los
valores de µ posibles. Por último, los estados que se propagan en el sólido, fuertemente ligados, son
aquellos en los que, si un electrón se encuentra en ellos, tiene la posibilidad de saltar de un ion a
otro con cierta probabilidad.
Para poder describir los estados que se propagan en el sólido, el modelo Tight-Binding hace
uso de una combinación lineal de los formalismos utilizados para los estados libres y los estados
ligados, con la finalidad de obtener una base de estados común a ambas. Para englobar ambas
nomenclaturas en una sola, se aplica, en primer lugar el principio variacional.
Sean φln y ε
l
n soluciones exactas del Hamiltoniano atómico,
ϕln(x) =
∑
µ=1,...,µ0
∑
l=1,...,µ
Cµlnφµ(x− xl) (31)
Donde µ0 son los números cuánticos del estado fundamental y C
µ
ln son las constantes asociadas a
la combinación lineal de ambas nomenclaruras para cada uno de los estados. Asimismo, los estados
ϕln se definen como
∣∣ϕln〉 = |ϕn〉+ |δϕ〉. Dado esto la enerǵıa correspondiente es la siguiente:
εn =
〈
ϕln
∣∣H∣∣ϕln〉
〈ϕln|ϕln〉
= εln + o(δϕ)
2 (32)
Si se minimiza la enerǵıa en función de Cµln, se obtiene que εn ≥ ε
l
n Si partimos del caso de la
cadena monoatómica, tenemos que µ = 1 y por tanto l |ϕn〉 =
∑M
l=1Cln |l〉, con M igual al número
total de átomos que componen la cadena y |l〉 el estado correspondiente. Teniendo esto en cuenta,
26
se obtiene que la enerǵıa para el nivel de enerǵıa n-ésimo es:
εn =
∑M
l,l′=1C
∗
l′nCln 〈l′|H |l〉∑M
l,l′=1C
∗
l′nCln 〈l′|l〉
(33)
Donde 〈l′|l〉 = δl′,l adquiere el valor 0 cuando l′ 6= l y el valor 1 cuando cuando l′ = l ya que el
solape entre ambos estados es despreciable.
Si se tiene en cuenta el Hamiltoniano que describe la cadena monoatómica actuando sobre un
estado |l〉:
H |l〉 = ( p
2
2m
+ Vl︸ ︷︷ ︸
εatómico
) |l〉+
∑
j 6=l
Vj |l〉 (34)
Donde Vj es el potencial debido a la presencia del resto de átomos que componen el cristal.
Dada la expresión (34) se tiene que 〈l′|Vj |l〉 tendrá distintos valores:
Si l′ = l, 〈l′|Vj |l〉 = ∆E, lo cual implica un cierto desplazamiento del estado l-ésimo en
consecuencia a la presencia del resto de átomos que componen el sólido.
Si l′ = l ± 1, 〈l′|Vj |l〉 = −t, donde t se denomina enerǵıa de salto y se corresponde con la
probabilidad que posee un electrón de saltar al estado contiguo.
En cualquier otro caso, 〈l′|Vj |l〉 = 0.
Suponiendo que Cln =
1√
M
eiknla, con a el parámetro de red de la red cristalina y k el vector de onda,
se obtiene que la forma de la función de onda asociada a los electrones del sólido es la siguiente:
ϕk(x) =
1√
M
M∑
l=1
eiklaφ(x− la) (35)
A continuación, se comprobará que las funciones de onda descritas por la expresión (35) cumplen
el teorema de Bloch.
En primer lugar, el teorema de Bloch describe que si el hamiltoniano asociado a un electrón
H = −~
2∇2
2m + U(r), con U(r) = U(r + R) para todo vector R perteneciente a la red de Bravais
27
del cristal, se puede definir el autoestado como una función con dos partes diferenciadas, una de
ellas asociada a la periodicidad de la red y otra asociada a una onda plana (solución del modelo
de Sommerfeld). Por lo tanto, se define la función de Bloch a partir de la expresión que se define a
continuación:
ψnk(r) = e
ikrunk(r) (36)
Donde unk(r) es una función periódica con la periodicidad de la red. Si aplicamos la periodicidad
de la red a toda la función de Bloch se puedeobservar que no se cumple, ya que solo es la parte
expresada por unk(r) la parte de la función que śı cumple la periodicidad de la red, es decir,
unk(r+R) = unk(r), a pesar de esto, las densidades de probabilidad śı cumplen la periodicidad de
la red, por tanto, |ψnk(r+R)|2 = |ψnk(r)|2, lo cual implica que ψnk(r+R) y ψnk(r) se diferencian
en una fase θ = kR.
Aplicando la condición de contorno Born-von Karman a la función de Bloch (36) se tiene como
resultado una condición sobre el vector de onda suponiendo que la enerǵıa asociada al vector de
onda k sea periódico en ka = 2πm con m�Z.
Cabe destacar otro aspecto con respecto a la función de Bloch, mientras ukn(r) representa la
periodicidad microscópica de la red, φkn representa la periodicidad macroscópica de la red, debido
a las condiciones de contorno Born-von Karman, puesto que éstas implican una condición sobre el
vector de onda de la función de Bloch. Asimismo, la función de Bloch es periódica para todo vector
perteneciente a la red rećıproca cristalina.
A continuación, comprobamos que la expresión (35) se corresponde con una función de Bloch.
Para ello partimos de la expresión (35) y multiplicamos por eikx e e−ikx.
ϕk(x) = e
ikxe−ikx
1√
M
M∑
l=1
eiklaφ(x− la) (37)
Como eikx y e−ikx no dependen de la posición del ión, pueden mantenerse tanto dentro y fuera del
sumatorio, por lo que:
ϕk(x) = e
ikx 1√
M
M∑
l=1
e−ikxeiklaφ(x− la) (38)
Comparando las expresiones (38) y (36) se obtiene que la función (35) se corresponde con una
28
función de Bloch, ya que, en el interior del sumatorio se obtiene una función periódica en la red
cristalina.
A continuación, se aplicará este modelo a una cadena monoatómica.
Sea la cadena monoatómica representada por la figura 9
Figura 9: Cadena monoatómica con parámetro de red a, enerǵıa de salto −t y enerǵıa “on-site.o
enerǵıa atómica ε0
Teniendo en cuenta la expresión (35), se aplica esta a la expresión (34), donde cada estado |l〉
se corresponde con cada una de las funciones de onda representadas por (35). Puesto que en la
expresión (35) existe una parte periódica (φ(x− la), sólo se tendrá en cuenta la parte exponencial.
Para una cadena monoatómica compuesta por M átomos (figura 9), se tiene que el hamiltoniano
viene dado por la siguiente matriz:
Hl′l =

ε0 −t 0 0 · · · · · · · · · 0
−t ε0 −t 0 · · · · · · · · · 0
0 −t ε0 −t 0 · · · · · · 0
...
. . .
. . .
. . .
. . .
. . .
...
...
. . .
. . .
. . .
. . .
. . .
...
0 · · · · · · 0 −t ε0 −t 0
0 · · · · · · · · · 0 −t ε0 −t
0 · · · · · · · · · · · · 0 −t ε0

(39)
Aplicando la condición de contorno Born-von Karman y aplicando la expresión (35), se obtiene
29

ε0 −t 0 0 · · · · · · · · · −t
−t ε0 −t 0 · · · · · · · · · 0
0 −t ε0 −t 0 · · · · · · 0
...
. . .
. . .
. . .
. . .
. . .
...
...
. . .
. . .
. . .
. . .
. . .
...
0 · · · · · · 0 −t ε0 −t 0
0 · · · · · · · · · 0 −t ε0 −t
−t · · · · · · · · · · · · 0 −t ε0


eika
ei2ka
...
...
...
...
eiMka

= εk

eika
ei2ka
...
...
...
...
eiMka

(40)
Dado esto, puesto que es análogo aplicar cualquier ĺınea de la matriz a la columna, si aplicamos
la primera ĺınea de la matriz al vector se obtiene que:
ε0e
ika − tei2ka − teiMka = εkeika (41)
Donde, gracias a la condición de Born-von Karman eiMka = eiLk = 1, por tanto, se obtiene que
la banda de enerǵıa representada por εk tiene la siguiente expresión:
εk = ε0 − teika − te−ika (42)
O lo que es lo mismo:
εk = ε0 − 2tcos(ka) (43)
Puesto que para la cadena monoatómica se ha obtenido una única banda de enerǵıa (expresión
(43)), cada uno de los niveles atómicos pierde la degeneración asociada a los mismos, obteniendo
una banda con un ancho proporcional a t. Cada estado k de la banda se puede completar con dos
electrones con valor de esṕın opuestos.
En la figura 10 se puede observar cómo para un espaciado entre átomos grande no existe un en-
sachamiento notable entre los niveles de enerǵıa, lo que implica la existencia de cierta degeneración.
Sin embargo, cuando los átomos se encuentran más próximos, los niveles de enerǵıa se ensanchan
generando bandas de enerǵıa y produciéndose un solapamiento entre las mismas. Esto se debe a
30
Figura 10: (a) Esquema de los niveles electrónicos no degenerados bajo la acción de un potencial
atómico. (b) Esquema de las bandas de enerǵıa generadas para dichos niveles de enerǵıa en función
del inverso del espaciado entre los átomos. En este esquema, se puede observar cómo, a medida
que el espaciado entre los átomos es menor las bandas correspondientes a los niveles atómicos se
ensanchan formando bandas de enerǵıa. [12]
que, en el primer caso, se pueden considerar los átomos como átomos aislados bajo un potencial
atómico, por lo que śı presentan degeneración atómica, mientras que cuando los átomos se encuen-
tran más próximos, se considera el modelo de electrones fuertemente ligados, donde desaparece la
degeneración atómica, obteniendo una banda de enerǵıa ya que la posición del nivel de cada uno
de los estados k-ésimos que depende de la enerǵıa de salto, del vector de onda asociado a cada uno
de los electrones y del parámetro de red (expresión (43)).
3.2.1. Densidad de estados
Al igual que en el modelo de Sommerfeld, para un intervalo de enerǵıas del sistema entre ε y
ε + dε existe un número dado de estados por unidad de volumen del cristal (figura 11) y vienen
representados por la expresión (44). [12]
gn(ε)dε =
∫
Sn(ε)
dS
4π3
δkk (44)
31
Figura 11: Esquema de la expresión (44)) donde se representan los estados disponibles para un
dado valor de k en la superficie de Fermi encerrada entre ε y dε. [12]
Para obtener la expresión de la densidad de estados aislada, se sustituirá el valor de δk en función
de valores de enerǵıa. Para ello, hay que tener en cuenta que, δk en términos de la enerǵıa viene
dado por un vector gradiente de enerǵıa perpendicular a la superficie Sn(ε) tal que:
ε+ dε = ε+ |∇εn(k)|δk (45)
Por tanto, se puede expresar δk tal que:
δk =
dε
|∇εn(k)|
(46)
Aplicando la expresión (46) a la expresión (44) se obtiene la expresión de la densidad de estados
expĺıcita (expresión (47)).
gn(ε) =
∫
Sn(ε)
dS
4π3
1
|∇εn(k)|
(47)
32
3.2.2. Propiedades térmicas
Supongamos la situación de una banda de enerǵıa que no se encuentre completa, la enerǵıa del
sistema asociada es tal que [12]:
E(T ) = E(T = 0) +
γ̃
2
V g(EF )(kBT )
2 (48)
La capacidad caloŕıfica, al igual que en el caso del modelo de Sommerfeld, depende de la densidad
de estados en el nivel de Fermi, por lo tanto depende de la estructura de banda (es decir del
solapamiento t) y del nivel de llenado de la misma (en número de electrones por átomo).
La capacidad caloŕıfica se define como la derivada de la enerǵıa del sólido respecto de la tem-
peratura a volumen constante, teniendo en cuenta la expresión (48), la capacidad caloŕıfica es tal
que:
Cv =
(
δE
δT
)
V
= γ̃V g(EF )k
2
BT (49)
Cv depende directamente de la densidad de estados en el nivel de Fermi. Para el caso de los
metales, puesto que śı que existen estados en torno a la región de la enerǵıa de Fermi, existirá una
densidad de estados no nula para ellos. Sin embargo, para el caso de los materiales aislantes, puesto
que las bandas de enerǵıas no se encuentran en la región del nivel de Fermi, la densidad de estados
en este nivel es nula, por lo que CV también será nula.
La conductividad térmica, como vimos en el modelo de Sommerfeld, viene dada por la expresión
(22). Si se combina con la expresión de la capacidad caloŕıfica a la expresión (49) se obtiene la
expresión de la conductividad térmica en el nivel de enerǵıa de Fermi.
κ =
1
3
Cvv
2
F τ =
1
3
γ̃V g(EF )k
2
BTv
2
F (50)A partir de la expresión (50) se obtiene que, para el caso de los metales existe una conductividad
térmica del gas de electrones no nula, puesto que depende de la capacidad caloŕıfica y, como se
explicó anteriormente, no es nula para los materiales metálicos. En el caso de materiales aislantes,
33
puesto que la capacidad es nula, la conductividad térmica asociada a los electrones, en su defecto,
también es nula.
3.2.3. Propiedades eléctricas
Para poder explicar las propiedades eléctricas de un material aislante, es necesario utilizar el
modelo semiclásico. [12]
El modelo semiclásico predice cómo, en ausencia de colisiones, la posición r y vector de onda
k asociados a un electrón vaŕıan en presencia de campos eléctricos y magnéticos E(r, t) y H(r, t)
externos. Su finalidad principal es relacionar la estructura de bandas de un cristal con las propie-
dades de transporte de los electrones. Además, el modelo semiclásico considera los electrones como
electrones independientes pero no libres, es decir, bajo el efecto de un potencial causado por la
presencia de los demás iones del sólido, al igual que considera el modelo Tight binding.
Dado un electrón situado en la banda de enerǵıa εn(k) en presencia de los campos E(r, t) y
H(r, t) se proponen las siguientes hipótesis:
El ı́ndice n asociado a la banda de enerǵıa en la que se encuentra el electrón, es constante en el
movimiento, por tanto, no vaŕıa en presencia de campos externos. Ésto tiene como conclusión
que no existe transición de un electrón entre distintas bandas.
La evolución de la posición y el vector de onda asociados a un electrón en presencia de campos
externos viene dada por las siguientes expresiones:
ṙ = vn(k) =
1
~
δεn(k)
δk
(51)
~k̇ = −e
[
E(r, t) +
1
c
vn(k)×H(r, t)
]
(52)
Dado un electrón descrito por n, k y r, se puede describir el mismo electrón para un vector
de onda tal que k +K donde K es un vector perteneciente a la red rećıproca del cristal. Por
tanto, todos los vectores de ondza asociados a una banda de enerǵıa n se encuentran en la
misma celda primitiva de la red rećıproca. Además, todo electrón perteneciente a dicha banda
34
de enerǵıa siguen la siguiente distribución (distribución de velocidades de Fermi):
f(εn(k))
dk
4π3
=
dk/4π3
e
εn(k)−µ
kBT + 1
(53)
A continuación, se exponen las diferencias entre el modelo de Sommerfeld y el modelo Semiclási-
co y, posteriormente, se utilizarán las expresiones (51) y (52) para argumentar por qué las bandas
llenas que caracterizan a un material aislante no tienen aportación a la corriente.
Las diferencias principales entre ambos modelos son las siguientes:
En el modelo de Sommerfeld es sólo necesario un vector de onda k para describir un electrón
del sólido, mientras que en el modelo Semiclásico se precisan dicho vector de onda y n, que
definirá el ı́ndice de la banda de enerǵıa en la que se encuentra el electrón.
La enerǵıa asociada a un electrón en el modelo de Sommerfeld, depende únicamente del vector
de onda, ya que se define como ε(k) = p
2
2m , donde el momento asociado al electrón viene dado
por ~k. Sin embargo, en el modelo Semiclásico, la enerǵıa depende de la estructura cristalina
del sólido, por tanto, no se puede obtener una expresión general para la enerǵıa de cada una
de las bandas pero se tiene que la enerǵıa con un vector de onda k será la misma que la
enerǵıa con un vector de onda k +K siendo K un vector de la red rećıproca.
La velocidad media de un electrón en el sólido para ambos modelos viene dada por v(k)1~
δε(k)
δk ,
pero al haber diferencias en la expresión de la enerǵıa asociada a cada vector de onda, la
velocidad media será distinta para cada uno de los modelos.
Por último, puesto que las consideraciones para cada uno de los modelos son distintas, las
funciones de onda asociadas a un electrón del sólido serán distintas. Mientas en el modelo
de Sommerfeld la función de onda asociada a un electrón dado viene definida por una onda
plana tal que:
φk(r) =
ei
~k~r
V 1/2
(54)
Sin embargo, para el modelo Semiclásico, al igual que en el modelo Tight binding, la función
de onda asociada a un electrón con vector de onda k situado en la banda de enerǵıa εn(k) es:
φkn(r) = e
i~k~runk(r) (55)
35
Donde φnk es una función de Bloch y unk(r) es periódica en la red cristalina, es decir, unk(r+
R) = unk(r)
Las bandas llenas son las bandas cuya enerǵıa es inferior a la enerǵıa del nivel de Fermi εF . Los
electrones situados en estas bandas, dado un volumen dk, contribuyen a la densidad electrónica dk
4π3
,
por lo tanto, el número de electrones dado un volumen dr y un volumen en el espacio de las k dk
es drdk
4π3
. Dada una estructura de bandas de un material aislante, en el seno de campos externos, el
transporte de sus electrones en las bandas llenas es nulo, ya que por las expresiones (51) y (52), las
bandas siguen estando completas, por concluyente, las bandas llenas son invariantes en el tiempo.
La corriente asociada a estas bandas completas viene dada por las expresiones siguientes:
j = (−e)
∫
dk
4π3
1
~
δεn(k)
δk
(56)
jε =
∫
dk
4π3
1
~
εn(k)
δεn(k)
δk
=
∫
dk
4π3
1
~
δ(εn(k))
2
δk
(57)
Las expresiones anteriores se anulan para una banda llena en cualquier celda primitiva del cristal
bajo el efecto de un potencial periódico, ya que la integral del gradiente de una función periódica en
todo su periodo es nula. En definitiva, sólo tendrán aportación a la corriente neta aquellas bandas
que se encuentren parcialmente completas. Por ello, a continuación, se explicará la aportación a la
corriente neta de los electrones que se encuentran en las bandas parcialmente llenas, es decir, las
asociadas a materiales metálicos.
Dado un cristal de 1D en el seno de un campo E, existe un desplazamiento en los k-estados, el
cual viene dado por el modelo de Sommerfeld por la expresión ∆k = − eτE~ . Teniendo en cuenta
que la densidad de corriente para un estado dado k es jk =
−e
V v
g
k y v
g
k =
1
~
δεk
δk la corriente total del
sólido vendrá dada por:
jtotal = 2
∑
k
jkf(k) = 2
V
(2π)3
∫ kF+∆k
−kF+∆k
jkf(k) = 2
V
(2π)3
∫ kF+∆k
−kF+∆k
−e
V
1
~
δεk
δk
f(k)dk (58)
Teniendo en cuenta que la enerǵıa del estado k-ésimo, como ya se mencionó anteriormente,
depende de la cristalograf́ıa del sistema, esto implica que la resistividad del material se ve afectada
por la estructura del cristal también. Cuando el nivel de Fermi está próximo al fondo de la banda,
εk se puede aproximar como una relación parabólica, semejante al gas de electrones libres y se
36
define una masa efectiva con la curvatura de la banda. Para niveles de enerǵıa con k cercano a kF
se tiene que la banda viene dada por:
ε(k) = ε(kF ) +A(k − kF ) (59)
Donde A es positivo y viene dado por A = ~
2
2m∗e
. Por tanto, en este caso la conductividad puede
escribirse como:
σ =
ne2τ
m∗e
(60)
Asimismo, el factor que se diferencia la resistividad obtenida a través del método de Sommerfeld
es 1m∗e
, siendo m∗e la masa efectiva, puesto que dicha cantidad no se corresponde con la masa del
electrón y depende de la forma de la banda. En concreto, teniendo en cuenta (43), si la enerǵıa de
salto t es mucho menor que la unidad, se obtiene que existe baja probabilidad de que el electrón
salte a otro estado, la banda de enerǵıa es muy estrecha y su curvatura grande, lo que se asocia a
una masa efectiva alta. Sin embargo, si la enerǵıa de salto es notablemente mayor que la unidad,
la probabilidad de que el electrón salte al estado contiguo es alta, lo que conlleva una banda de
enerǵıa ancha con poca curvatura y se asocia a una masa efectiva considerablemente baja.
Debido a que un cristal no se compone únicamente de iones, en configuración periódica, existe
interacción de los electrones con otras part́ıculas que componen el sólido, como son: otros electrones,
fonones y defectos del sólido. La probabilidadde que un electrón interaccione con las part́ıculas
mencionadas viene dada por:
dt
τ
=
dt
τf
+
dt
τd
(61)
Donde cada uno de los tiempos de relajación de cada uno de los procesos de scattering posibles de
un electrón con las part́ıculas mencionadas está relacionado de la siguiente manera:
τd ∝
1
nd
τf ∝
1
nf
∝ 1
fB(T )
(62)
Donde nd es la densidad de defectos en el cristal, fB es el factor de ocupación según la distri-
bución de Bose-Einstein, ya que los fonones son bosones.
37
3.3. Metal, Aislante y Semiconductor
En esta sección, se mostrarán las diferencias entre cristales metálicos, aislantes y semiconduc-
tores, lo cual está directamente relacionado con la estructura de bandas del cristal que proporciona
el modelo Tight-Binding.
Los electrones que conforman el sólido están organizados en bandas de enerǵıa, donde, en función
de la estructura cristalográfica del cristal, existen o no zonas de enerǵıa prohibidas, a estas regiones
de enerǵıa prohibidas se les denomina band gap o gaps de enerǵıa. Los band gaps son el resultado de
la interacción entre los electrones del sólido con los iones que lo conforman. Por tanto, en función
de cómo de llenas o vaćıas se encuentren dichas bandas, el nivel de Fermi se encontrará dentro
de una banda o en un intervalo de enerǵıa prohibido y el cristal será un metal, un aislante o un
semiconductor. A temperatura T = 0K, si la banda se encuentra parcialmente llena es un metal;
si ésta está completa es un cristal aislante ya que ninguna de las bandas completamente llenas ni
completamente vaćıas pueden llevar una corriente neta, como vimos en la sección anterior. [13]
Figura 12: Estructura de bandas en la primera zona de Brillouin de un aislante que posee dos
electrones por celda unidad. La banda punteada es la banda de conducción, mientras que la banda
sólida, la cual está por debajo del nivel de enerǵıa de Fermi, es la banda de valencia. [14]
Como se puede observar en la figura 12, para un metal 1D con dos electrones por celda uni-
dad, la primera banda está completamente llena y la segunda completamente vaćıa, por lo que el
nivel de Fermi se sitúa en el intervalo de enerǵıa prohibido. La diferencia de enerǵıa entre las dos
bandas representadas, ∆E determina si se tendrá un material aislante (∆E ≥ 4 eV ) o un material
semiconductor (∆E < 4 eV ) [14]. Esto es debido a que a temperatura finita, algunos electrones de
la banda de valencia pueden pasar a la banda de conducción por excitación térmica. Esto genera
38
una concentración de portadores dada por:
nc(T ) = Nc(T )e
− εc−µ
kBT (63)
pv(T ) = Pv(T )e
− εv−µ
kBT (64)
Donde nc se corresponde con la densidad de electrones de la banda de conducción, pv es la densidad
de huecos de la banda de valencia, εc y εv son las enerǵıas de la banda de conducción y la banda de
valencia respectivamente. Además, la enerǵıa del gap se corresponde con la diferencia entre ambas,
es decir, ∆E = εc − εv. Esta densidad de portadores depende fuertemente de la temperatura y es
varios órdenes de magnitud menor que la densidad de electrones en un metal, lo que se traduce
directamente en una conductividad eléctrica muy inferior. [12]
En resumen, podemos concluir que la principal diferencia entre un aislante y un metal es la
existencia o no de un intervalo de enerǵıa prohibido en las proximidades del nivel de Fermi, lo cual
va a afectar de forma directa a la conductividad eléctrica, térmica y a las propiedades ópticas del
material. Por lo tanto, el estudio de la transición metal-aislante en el V O2 se centra en determinar los
mecanismos microscópicos que pueden dar lugar a la aparición de un intervalo de enerǵıa prohibido
en torno al nivel de Fermi.
3.4. Modelos de la transición metal-aislante
A continuación, se explicarán los distintos modelos que pretenden describir la transición metal-
aislante que, en concreto, el material V O2 sufre.
La transición metal-aislante da lugar a un comportamiento muy distinto del material en fun-
ción de la temperatura del mismo. Dada una temperatura inferior a una temperatura cŕıtica TC , el
cristal se comporta como un aislante, dando lugar a una alta resistividad, sin embargo, para tem-
peraturas superiores a TC , el material pasa al estado metálico, obteniendo aśı una baja resistividad
y permitiendo la conducción de corriente eléctrica.
A continuación se describirán brevemente los distintos modelos microscópicos que buscan la des-
cripción de esta transición para el V O2. Además, también se presentará el modelo fenomenológico
que describe el comportamiento de la transición metal-aislante del V O2.
39
3.4.1. Modelos microscópicos de la transición metal-aislante del V O2
El primero en estudiar este tipo de transiciones fue R. Peierls en los años 30. En primer lugar,
asumió una cadena monoatómica de un elemento conductor (metal) y demostró que esta cadena
monoatómica de un metal para temperaturas bajas, no es estable y que sufre una distorsión,
formando d́ımeros en el caso más extremo (ilustrado en la figura 13) [9]. Dado esto, el parámetro
de red aumenta al doble de su valor, y la zona de Brillouin se reduce a la mitad provocando la
aparición de un salto en la banda de enerǵıas en la nueva frontera de zona. Esto implica que, si no
cambia el número de electrones por átomo, la banda de enerǵıa inferior pasa de estar semillena a
estar completamente llena. Es decir, se produce una transición de un comportamiento metálico para
la cadena de parámetro a a un comportamiento aislante para la cadena de d́ımeros de parámetro
2a. [9]
Figura 13: Ilustración de la dispersión de una cadena monoatómica al pasar de un estado metálico
a un estado de aislante. a) A alta temperatura los átomos de vanadio se pueden representar por una
cadena monoatómica de parámetro a. b) Representación de la distorsión que sufren los átomos de
vanadio a temperaturas inferiores a una dada temperatura cŕıtica, formando d́ımeros o una cadena
dimerizada de parámetro de red 2a, donde −tBA y −tAB representan las distintas enerǵıas de salto
entre los átomos A y B.
Para explicar mejor la estructura de bandas de la cadena dimerizada obtenida, se explicará a
partir de la estructura de bandas obtenida a partir del modelo Tight binding.
Sea la cadena dimerizada representada en la figura 13 b), se tiene que las enerǵıas de salto se
pueden expresar a partir de:
tAB = t(1 + αu) (65)
tBA = t(1− αu) (66)
40
Donde u es el desplazamiento que sufren cada uno de los átomos al formar la cadena dimerizada
respecto de la cadena monoatómica (13a)). Aplicando el modelo Tight binding, se obtiene que el
Hamiltoniano que representa la interacción entre los átomos viene dado por:
H =
 ε0 −tAB − tBAe−ik2a
−tAB − tBAe+ik2a ε0
 (67)
Aplicando (67) a Hφk = εkφk se obtiene que la enerǵıa para un estado k-ésimo, viene dada por la
siguiente expresión.
(ε0 − εk)2 = (tAB)2 + (tBA)2 + 2tABtBAcos(2ka) (68)
A partir de la expresión anterior se puede expresar la enerǵıa de una banda con vector de onda k
tal que:
εk = ε0 ± 2t
[
(αu)2 +
(
1− (αu)2
)
cos2(ka)
]
(69)
-1.5 -1 -0.5 0 0.5 1 1.5
k 10
10
-2
-1
0
1
2
E
k
 -
 E
0
Cadena dimerizada
-1.5 -1 -0.5 0 0.5 1 1.5
k 10
10
-2
-1
0
1
2
E
k
 -
 E
0
Cadena monoatómica
Figura 14: Representación de la estructura de bandas para la cadena monoatómica (43) y para
la cadena dimerizada (69). La imagen superior hace referencia a la cadena dimerizada donde, al
aumentar el parámetro de red al doble del valor, el valor del vector de onda se reduce a la mitad.
Además, se puede observar cómo se abre un gap en torno a εk−ε0 = 0, es decir, en torno al nivel de
enerǵıa de Fermi. Sin embargo, en la figura inferior, que hace referencia a la cadena monoatómica,
sólo se obtiene una banda de enerǵıa que cruza al nivel de enerǵıa de Fermi. [9]
41
En la figura 14 se representa la diferencia entre la estructurade bandas de una cadena dimerizada
y una cadena monoatómica [9]. La figura anterior nos permite entender en parte la apertura del
gap en torno al nivel de Fermi cuando el V O2 se encuentra en la fase aislante en la que los átomos
de vanadio se agrupan formando d́ımeros. Mientras que este gap no se genera para la fase metálica,
ya que los átomos de vanadio no forman d́ımeros.
Figura 15: a) Estructura cristalográfica del V O2 en el estado de aislante, donde los átomos de
vanadio forman d́ımeros para una temperatura menor que una temperatura cŕıtica (Tc). En la
parte inferior, se muestra la estructura de bandas del V O2, donde se puede observar cómo el orbital
3d forma dos bandas estrechas d entre el nivel de la enerǵıa de Fermi. b) Estructura cristalográfica
del V O2 en el estado de metal para una temperatura superior a la temperatura cŕıtica, donde los
átomos de vanadio no forman d́ımeros. En la parte inferior se muestra la estructura de bandas del
estado metálico del V O2 donde existe un solapamiento de la banda d(referentes a los átomos de
vanadio) y la banda π (referente a los átomos de ox́ıgeno), en torno al nivel de enerǵıa de Fermi,
lo cual evidencia que el V O2 se encuentra en estado metálico.
En la figura 15 se esquematiza cómo se produce una división de la banda correspondiente al
orbital 3d de los átomos de vanadio debido a la creación de d́ımeros [9]. Esto genera la aparición
de una zona prohibida entorno al nivel de Fermi, lo que corresponde a la estructura de bandas de
un aislante. El band gap formado entre la banda de valencia y la banda de conducción, según la
teoŕıa de Peierls tendŕıa un valor de 0.7eV .
En cuanto a la resistividad, en cada una de las dos fases vaŕıa 5 órdenes de magnitud en la
temperatura cŕıtica. La variación de la resistividad en función de la temperatura viene dada porque
la densidad de estados vaŕıa en función de la estructura cristalina, por tanto, al producirse el cambio
de estructura cristalina en función de la temperatura, se produce un cambio en la estructura de las
42
bandas de enerǵıa. La variación de la densidad de estados del V O2 en función de la temperatura
que se presenta en la figura 16 muestra la densidad de estados calculada por T. Yao et al. [15]
con un modelo teórico del funcional de densidad. Para temperaturas inferiores a la temperatura
cŕıtica a la que se da lugar la transición, la densidad de estados en función de la enerǵıa es nula
en un cierto rango de enerǵıas en torno a la enerǵıa del nivel de Fermi, evidenciando el estado
aislante; sin embargo, para temperaturas superiores a la temperatura cŕıtica (en torno a 340 K) la
densidad de estados no es nula en esa región, por tanto, existen estados ocupados para ese rango
de enerǵıas, situación caracteŕıstica de un estado metálico. Además, debido a la variación de la
densidad de estados en función de la temperatura, el factor de ocupación de cada una de las bandas
se ve afectado en función de la situación del V O2 y, por tanto, se produce ese cambio tan abrupto
en la resistividad del V O2 en función de la temperatura.
Puesto que la resistividad del material es inversamente proporcional a la conductividad eléctrica
del mismo, en un estado metálico donde la resistividad es baja, la conductividad eléctrica será alta,
e inversamente sucede con el estado aislante del V O2.
Además de la resistividad y la conducción eléctrica, existen otras propiedades f́ısicas que se ven
afectadas por el cambio que sufre el V O2 en función de la temperatura.
Se observa también, un aumento de la conductividad térmica cuando el material se comporta
como un metal, debido a la contribución de la conductividad electrónica. En la figura 17 se puede
observar cómo la variación en la conductividad térmica debida a los electrones del sólido es abrupta,
en la temperatura cŕıtica, TC , mientras que la conductividad térmica total del sólido sufre una
variación más leve al producirse al transición del estado aislante al estado metálico [9]. Este cambio
en la conductividad térmica es debido a la variación de Cv, como vimos en la sección 3.2.2. La
variación en Cv es debido a la variación de la densidad de estados en cada uno de los estados de
V O2, ya que la capacidad caloŕıfica es directamente proporcional a la densidad de estados en el
nivel de enerǵıa de Fermi y, como se puede observar en la figura 15, en el nivel de enerǵıa de Fermi
para el estado metálico śı existe banda de enerǵıa y, por tanto, una densidad de estados en ella,
mientras que en el estado aislante, la densidad de estados en el nivel de Fermi es nula.
En cuanto a propiedades ópticas, en el estado aislante, el material se mantiene transparente y
permite la transmisión de señal en el rango del infrarrojo. Este fenómeno se produce porque, en
la fase aislante, existe un band gap del orden del la señal infrarroja, por lo tanto, las ondas con
43
Figura 16: Representación de la densidad de estados del V O2, calculada por Yao et al. mediante
el método téorico del funcional de densidad, en función de la enerǵıa y de la temperatura a la
que se encuentra el cristal. Se puede observar que, para temperaturas bajas, existe un corte en la
enerǵıa, entorno a la ĺınea punteada en azul, que hace referencia al nivel de Fermi; este corte en
la enerǵıa representa la diferencia de enerǵıa entre las bandas que caracteriza a un cristal aislante.
Sin embargo, a medida que aumenta la temperatura, dicha separación disminuye en tamaño y, para
una temperatura entorno a 340 K se obtiene la transición del estado aislante al estado metálico,
donde la densidad de estados en este último presenta una enerǵıa continua. [9]
dicha enerǵıa no son absorbidas por la estructura del V O2. Sin embargo, en el estado metálico, al
no existir band gap en esa región, el material se comporta como un material opaco, reflejando la
señal en la región infrarroja. Estas propiedades se obtuvieron a partir de la aplicación de un rayo
infrarrojo a un capacitor multicapa en 2010 por un grupo de investigación de Harvard. [9]
Sin embargo, el modelo de Peierls no puede explicar completamente los siguientes aspectos
observados. En primer lugar, las evidencias experimentales revelaron que el gap que existe entre la
44
Figura 17: Representación de la conductividad térmica el V O2 en función de la temperatura del
cristal. Con una ĺınea roja se representa la conductividad térmica de los electrones, la cual sufre
un aumento abrupto entorno TC , pasando del estado aislante al estado metálico. No obstante, con
una ĺınea negra se representa la conductividad térmica total del sólido, la cual sufre un aumento
leve en la misma región de temperaturas. [9]
banda de valencia y la banda de conducción en el estado aislante es de 0.6 eV y, según los cálculos
con el modelo de Peierls este valor es de 0.7 eV . En segundo lugar, existen evidencias de la existencia
de fases metaestables metálicas intermedias entre la fase aislante y la fase metálica en en el rango
de temperaturas cercanas a la TC que presentan una estructura monocĺınica al igual que la fase
aislante; las cuales no se pueden describir a partir del modelo simplificado descrito por Peierls.
Modelo de Mott
Puesto que el valor del gap obtenido a partir del modelo de Peierls no se corresponde con
los valores experimentales obtenidos, a continuación se expone otro modelo que puede completar
la descripción de la transición aislante-metal que sufre el V O2, en concreto el modelo de Mott-
Hubbard. Este modelo teórico se plantea en términos de la Teoŕıa Cuántica de Campos, con un
nivel más avanzado que las competencias del grado, por lo que presentaré un resumen de los
45
conceptos básicos más significativos. [16]
El modelo de Mott describe los aislantes como el V O2 como materiales compuestos por un
número impar de electrones por celda unidad, lo que, según la teoŕıa

Continuar navegando