Logo Studenta

Valuación de Opciones Europeas con Restricciones

¡Este material tiene más páginas!

Vista previa del material en texto

VALUACIÓN DE OPCIONES EUROPEAS CON RESTRICCIONES 
por 
José Antonio Núñez Mora 
TESIS DOCTORAL 
\ ,J.-.. 
~ 
~ ; , 
-~ 
· ITESM 
CAMPus'cruo . .w DE J\.fEXICO 
BIBLIOTECA 
Presentada al Instituto Tecnológico y de Estudios Superiores de Monterrey 
Campus Ciudad de México 
Para obtener el grado de Doctor en Filosofía 
Septiembre 27, 2000 
RESUMEN 
Valuación de Opciones Europeas con Restricciones 
por 
José Antonio N úñez Mora. 
La técnica de Karatzas-Kou (1996) para la valuación de las opciones Euro-
peas con restricciones convexas, parte de un grupo de ecuaciones diferenciales 
estocásticas, las cuales explican la dinámica de los precios de las acciones en el 
mercado. Es necesario conocer los coeficientes de las ecuaciones diferenciales para 
realizar los cálculos correspondiente a cada restricción. La contribución de la tesis 
parte de la propuesta realizada por Zane (1994), que propone estimadores de los 
coeficientes de las ecuaciones diferenciales estocásticas. Se realiza una correción 
a los estimadores para corregir el sesgo y así resulten consistentes en el sentido 
fuerte. 
ÍNDICE 
O. Introducción ............................................................................................................ 1 
l. Análisis Convexo. 
l. Conjuntos y Conos Convexos ...................... ... ..... ...................... ................................... .4 
2. Operaciones con Conjuntos Convexos ............................................................................ 7 
3.Funciones Convexas ....................................................................................................... 8 
4.Propiedades Topológicas ................................................................................................ 12 
5.Teoremas de Separación ................................... .................. .................... ..... ................... 18 
6.Funciones de Soporte ...................................................................................................... 27 
11.Cálculo Estocástico. 
l.Filtraciones y Tiempos de Paro ....................................................................................... 29 
2.Martingalas ....................................................... ..... ..... ......................... .......................... 33 
3.Integrabilidad Uniforme y Teoremas Límites .................................................................. 35 
4.Integrales Estocásticas .................................................................................................. .46 
5.El Cálculo de Ito ............................................................................................................. 61 
6.La fórmula de Feynman-Kac ...................................................................... ..................... 71 
111.Valuación. 
1.El Modelo del Mercado Finaciero ................................................................................... 74 
2. Conjuntos Convexos ...................................................................................................... 77 
3.Funciones de Utilidad .................................................................................................... 78 
4.Problemas de Optimización sin Restriccioncs ................................................................. 79 
5.El Problema de Optimización Restringida ...................................................................... 81 
6.El caso logarítmico .......................................... ..... ... ................................. ...................... 87 
7.El problema dual. ...................................................................................... ... .................. 89 
8.Precios de arbitraje superior e inferior. ....... .. ..................................................... ............. 90 
9.Representación de restricciones convexas ...................................................... ................. 96 
10.El precio justo del ECC .............................. ... ....................................... ..... ........ ......... 104 
11.Ejemplos ................................................................................................... ................. 106 
12.Calculo de los intervalos de no arbitraje con coeficientes constantes ............................ 109 
13.El precio justo ............................................................................................................ 111 
IV .Identificación de Parámetros. 
1. Los estimadores ................................................ ............................................ ... ... ........ 116 
2.El pseudocódigo .......................................................................................................... 120 
3.Ejemplo ........................................................................................................ .............. 127 
Conclusiones ................................................................................................ ....... ....... 133 
Bibliografía ................................................................................................................. 135 
INTRODUCCIÓN. 
En las sociedades contemporáneas, la importancia de los mercados financieros 
ha aumentado con el paso de los años. El crecimiento y la especialización de 
los mercados financieros responden a la necesidad de contar con mejores condi-
ciones y oportunidades de financiamiento para los agentes individuales (inversion-
istas, banqueros, consumidores,etc.) 
El movimiento mundial de los recursos financieros se encuentra vinculado in-
exorablemente al proceso de globalización de las economías. 
Los mercados financieros están conformados por los mercados de dinero, mer-
cados de capital y productos deriados. Hoy más que mmca estos mercados se 
encuentran en expansión. En particular, el mercado de derivados disfruta de un 
crecimiento explosivo. El valor de mercado de derivados en todo el mundo se es-
timó en $50,000,000 de dólares en 1995. Esta cifra es impresionante considerando 
que el Producto Nacional Bruto anual de los Estados Unidos fué en ese mismo 
año, siete veces menor. Además, el valor de los productos derivados crnció a una 
tasa de 44% promedio anual entre 1986 y 1998. 
En este trabajo de tesis nos interesa el estudio de los derivados, y en particular 
el análisis de las Opciones Europeas. La teoría implícita en la valuación de instru-
mentos financieros derivados ha crecido mucho, y con ello, la técnica matemática 
se ha diversificado y profundizado enormemente. 
Una opción es un contrato en el que se estipula el derecho del comprador a 
vender o comprar un activo a un precio predeterminado. Las opciones, por tanto, 
establecen derechos de compra (call) o derechos de venta (put). 
El activo sobre el que se firma el contrato (opción), es llamado activo suby-
acente. El precio pactado para la compra o venta del activo subyacente en una 
fecha predeterminada, se llama precio de ejercicio, (striking price). 
El tipo de opciones que se estudian en el presente trabajo son las llamadas 
Europeas, que pueden ser ejercidas hasta el momento de terminación o madurez 
del contrato. 
En 1973, Black y Scholes dan a conocer su ahora famosa fórmula para la 
valuación de las opciones Europeas en el contexto de ausencia de arbitraje. La 
idea de valuar una opción de compra ( call) Europea que tiene a una acción como 
subyacente, es construír un portafolio de cobertura, es decir, una combinación 
de acciones y bonos, de tal manera que este portafolio replique la opción. Di-
cho de otra manera, que en cada momento en el tiempo, el valor del portafolio 
tenga el mismo valor que la opción. De no cumplirse esta condición existiría una 
oportunidad de arbitraje. 
En la deducción de la fórmula de Black y Scholes, no sólo tenemos ausencia de 
arbitraje, sino también mercados completos y sin restricciones. En este trabajo se 
prp.,senta la valuación de opciones Europeas con restricciones convexas en elestilo 
presentado por I. Karatzas y S.G. Kou (1996). Estos autores demuestran que en el 
contexto de ausencia de arbitraje con restricciones, no existe un único precio libre 
de arbitraje, sino un intervalo de precios libres de arbitraje. La determinación 
de los extremos del intervalo es por medio de problemas de control estocástico y 
la selección de un único precio es por medio del criterio de maximización de la 
función de utilidad, llamado en esta literatura "el precio justo". 
La aportación fundamental de la tesis consiste en el desarrollo del método 
numérico para la estimación de los parámetros de ecuaciones diferenciales es-
tocásticas, que sirven para valuar la.."! opciones Europeas con restricciones. En 
particular, se propone una modificación a un método ya previamente desarrollado 
por Zane (1994). El problema con éste método consiste en que ciertos estimadores 
de algunos parámetros de un sistema de ecuaciones diferenciales estocásticas no 
son fuertemente consistentes. Con la propuesta que se lleva a cabo en este trabajo, 
se logra obtener la consistencia fuerte de tales estimadores. 
El trabajo está dividido en cuatro capítulos. Además, al final del trabajo se 
proporcionan las conclusiones de la investigación. 
En el primer capítulo, se presentan las herramientas básicas de análisis covexo 
para el desarrollo de los conceptos de conjuntos y conos convexos, así como la 
definición de función de soporte de un conjunto convexo y sus propiedades. Éstos 
conjuntos y ésta función permiten el desarrollo del enfoque Karatzas-Kou para 
la valuación de las opciones Europeas. El capítulo está basado en la monografía 
clásica de Rockafellar, ( 1990). 
En el capítulo dos, se proporcionan los principios elementales de cálculo es-
tocástico. Se presenta la construcción de la integral estocástica con respecto a 
la martingala más importante en finanzas: el movimiento Browniano. Ésta con-
strucción está basada en el estilo de Elliot y Kopp (1999). Se discute a detalle la 
demostración del importante lema de Girsanov en el cual se usa el cambio de me-
dida, con el uso de la martingala exponencial. También se presenta la herramienta 
indispensable en el desarrollo de las matemáticas financieras modernas: el lema de 
Ito. Su aplicación resulta ineludible en la valuación de todo tipo de instrumentos. 
2 
Finahnente se proporciona la discusión de la representación de Feynman-Kac. 
En el capítulo tres, se muestra el desarrollo de los elementos de control nece-
sarios, en el sentido de J.Cvitanic y I. Karatzas (1992), para la valuación de las op-
ciones Europeas. El proceso de valuación con restricciones ("super-replicación"), 
es el siguiente: 
1) El problema de optimización con restriciones se introduce en una familia de 
problemas sin restricción, para los cuales ya tenemos la forma de resolverlos: la 
fórmula misma de Black y Scholes. Sin embargo, la estructura de los problemas 
sin restricción es más complicada, pues los parámetros ya no son los mismos del 
problema original, y de otro parámetro que caracteriza a cada elemento de la 
familia sin restricciones. 
2) De la familia de problemas sin restricciones, se tiene que escoger un mien-
bro, de tal manera que al resolver éste problema particular sin restricciones, la 
solución coincida con la del problema restringido original. (Dualidad convexa y 
caracterización de los problemas sin restricción). Esto también depende del tipo 
de función de utilidad que se selecciona. 
Para proceder con la valuación de las opciones Europeas, necesitamos los 
parámetros del sistema de ecuaciones diferenciales estocásticas. Éstas ecuaciones 
describen la dinámica de los precios, y entonces es necesario tener e..stimadores de 
los parámetros. 
En el capítulo cuatro, se proporciona la descripción del método numérico para 
encontrar los parámetros de las ecuaciones diferenciales estocásticas a partir de 
los datos reales. Esto se hace mediante el desarrollo de Zane (1994). Sin embargo, 
debo especificar que en el artículo de Zane, existe un error en su propuesta de esti-
madores consistentes en el sentido fuerte. Propongo la corrección correspondiente 
de los estimadores Aij, que dependen de las desviaciones estándar que aparecen 
en las ecuaciones diferenciales. 
Con la corrección anterior se procedió a progamar el algoritmo en Visual-Basic, 
el cual calcula los parámetros de las ecuaciones con datos reales que se proporci<>-
nen en excel. Y finalmente, otra parte del programa valúa las opciones Europeas 
con restricciones, una vez que se le proporciona como entrada los parámetros 
calculados de las ecuaciones y las restricciones. 
3 
CAPÍTULO! 
ANÁLISIS CONVEXO 
A continuación se proporcionan las definiciones de conjuntos convexos, funciones convexas 
y su relación. Se discuten también las principales propiedades topológicas de los conjuntos 
convexos: interior, cerradura y continuidad. La anterior herramienta es importante debido 
a que diversas restricciones con las que vamos a trabajar resultan ser conos convexos, cuyas 
propiedades son muy importantes pra la valuación de las opciones Europeas. 
1. Conjuntos y Conos Convexos 
Un conjunto C ~ R!" se dice ser convexo si dados dos puntos x, y E C,el conjunto ( 1 - >.) x + 
>.y E C, para toda O< >. < l.Es decir, el segmento que une los puntos x y y está completamente 
contenido en C, incluyendo los extremos que desde el principio ya pedimos que estén en C. 
Teorema 1.1.1 La intersección de una colección arbitraria de conjuntos convexos, es un 
conjunto convexo. 
Demostración. 
Sea { Ca} nEl , una familia de conjuntos convexos, I es el índice de la familia. Denotemos 
con D la intersección de los conjuntos de esta familia, es decir, D = íl Ca, a E J. Sean x, y E D, 
entonces por definición de conjunto convexo, (1 - >.) x + >.y E Ca para toda a E J. Por tanto, 
(1 - >.) x + >.y E D, y se tiene lo afirmado por el teorema. q.e.d. 
Corolario 1.1.2 Sea bi E R 11 y f3i E R 11 para i E J, donde I es un índice de una familia de 
conjuntos.Entonces el conjunto 
C = { x E R11 1 (x, bi) ~ /3i, Vi E J} 
es convexo. 
Demostración. 
Tomemos el conjunto Ci = { x E R 11 1 < x, bi > ~ f,i}. Este subconjunto tiene tres posibili-
dades: ser un semiespacio cerrado, o bien Jfl ,o bien el conjunto vacío. Cualquiera de los tres 
conjuntos es convexo, por tanto, C = íliEJ Ci,eS Un conjunto convexo por el teorema l. q.e.d. 
Dados m vectores x1, x2, ... ,xm, y m números reales no negativos >.1,>.2, ... ,>.m,tales que >.1 + 
>.2 + ... + Am = 1,definimos el vector A1X1 + .X2x2 + ... + AmXm como la combinación convexa de 
4 
•••. ···~ ,p 
_;, 1? .A,'L., ••• ,"·V'fn• 
Teorema 1.1.3 Un subconjunto de nn es convexo si y sólo si contiene todas las combina-
cicmes convexas de sus elementos. 
Demostración. 
De la definición de conjunto convexo, sabemos que la propiedad requerida se cumple para 
m=2, es decir, un conjunto convexo es cerrado bajo combinaciones convexas de dos elementos en 
el conjunto. Ahora probemos que la propiedad es válida para m > 2.Sea m > 2, y procedamos 
por inducción suponiendo que la propiedad es válida para cualquier número natural menor que 
rn. Ahora formemos la combinación convexa con rn elementos: 
.Construímos entonces y = f32x2 + ... + f3mxm donde f3i = Ai/(1 - A1) ( el denominador está 
bien definido, pues A¡ < 1 es una implicación de la hipótesis ), y f3i 2': O con la propiedad 
/h + ... + f3m = l. Lo anterior significa que y es una combinación convexa de m - 1 elementos 
del conjunto convexo. Por tanto, y es un elemento del conjunto convexo. Pero ademcís nótese 
que el z = (1 - A1)Y + A1X1 = (1 - A1)Y + A1X1 = (1 - A1){f32x2 + ... + f3mxm} + A1X1 = 
A2:r2 + ... + AmXm + A1:r1 = x. Entonces x es elemento del conjunto convexo, pues fué posible 
escribirlo como combinación convexa de dos elementos en el conjunto convexo.Por tanto, un 
conjunto convexo es cerrado bajo combinaciones convexas de sus elementos. 
q.e.d. 
Un subconjunto K de Ir" es un cono si escerrado bajo multiplicación escalar positiva, es 
decir, si A > O, y y E K, entonces AY E K. Un cono convexo es un cono que es convexo. Vamos 
a un importante teorema de cernos convexos. 
Teorema 1.1.4 La intersección de una colección arbitraria de conos covexos, es un cono 
convexo. 
Demostración. 
Sea {Ko}oEI una colección arbitraria de conos convexos. Sea w E ílKa, a E J,un elemento 
5 
de la intersección. Por tanto, w E Ka , Va E I, y de esta manera ).w E Ka, Va E/, pues cada 
conjunto es un cono convexo.Así que >.w E íl Ka, y la intersección es un cono convexo. q.e.d. 
Corolario 1.1.5 Sea bi E Rn para i E I, donde I es el conjunto que indexa la familia. 
Entonces, K = {x E~ I< x, bi >:SO, í E I} es un cono convexo. 
Demostración. 
Del corolario 1.1.2 sabemos que se trata de un conjunto convexo. Más aún, sólo tiene tres 
posibilidades: el conjunto vacío, o bien ~, o bien un semiespacio cerrado. Pero cualquiera de 
estos tres conjunto es un cono. q.e.d. 
Teorema 1.1.6 Un subconjunto de~ es un cono convexo{::} es cerrado bajo la adición y 
multiplicación escalar positiva. 
Demostración. 
=>) 
Sea K un cono. Entonces si x E K, >.x E K para toda >. > O, por definición de cono. Para 
demostrar que es cerrado bajo la adición, sean x, y E K y definamos z = (1/2)(x + y) que 
pertenece a K, otra vez porque el conjunto es cerrado bajo el producto con escalares positivos. 
Por la misma razón, 2z E K. Pero precisamente 2z = x + y E K. 
~) 
Si K es cerrado bajo el producto escalar positivo, entonces para O < ). < 1,y x, y E K, 
tenemos que >.x, (1 - >.)y E K. Por tanto, por la cerradura de la adición tenemos que >.x + (I -
>.)y E K. Es decir K es un conjunto convexo. Es un cono porque por hipótesis es cerrado bajo 
producto escalar positivo. q.e.d. 
Corolario 1.1. 7 Un subconjunto de Rn es un cono covexo {::} contiene todas las combina-
ciones lineales positivas de sus elementos ( es decir, las combinaciones lineales >.1x1 + >.2x2 + 
... + AmXm, en las cuales los coeficientes son positivos ). 
Demostración. 
=>) 
Si K es un cono convexo, entonces, por el Teorema! .1.6, es cerrado bajo la adición y 
multiplicación escalar positiva. Por tanto, contiene a los elementos de la forma >.1x1 + >.2x2 + 
... + AmXm con los coeficientes Ai , i = 1, 2, ... , n positivos. 
~) 
6 
Sabemos que un conjunto es convexo si contiene todas las combinaciones convexas de sus 
elementos. También, dada la hipótesis, contiene a los elementos de la forma >.x, con >. > O y 
x E K. q.e.d. 
Corolario 1.1.8 Sea S un conjunto arbitrario de lF, y sea K el conjunto de todas las 
combinaciones lineales positivas de S. Entonces K es el cono convexo más pequeño que incluye 
a S. 
Demostración. 
Por construcción, el conjunto K es cerrado bajo las operaciones de adición y multiplicación 
escalar positiva. De esta manera, S ~ K. Ahora bien, cualquier cono convexo que contenga a 
S, debe contener a K, puesto que por definición de cono convexo, K mismo es un cono convexo. 
Por tanto, es el más pequeño,-en el sentido de la contención-,de los conos convexos que contienen 
a S. q.e.d. 
Corolario 1.1.9 Sea C un conjunto convexo, y sea K = {>.x 1 >.>O, x E C}. Entonces K 
es el cono convexo más pequeño que incluye a C. 
Demostración. 
Precisamente por ser C un conjunto convexo, K es un cono convexo, por ser el conjunto 
de los productos de escalares positivos con los vectores de C. Pero también por construcción 
cualquier cono convexo conteniendo C,debe contener a K. q.e.d 
Notación. Dado un cono convexo culaquiera, podemos agregarle el origen. El nuevo cono 
convexo obtenido será llamado el cono convexo generado por S,( del corolario 1.1.9). Será 
denotado ccme(S). 
2.0peraciones con conjuntos convexos. 
Teorema 1.2.1 Si C1 y C2, son conjuntos convexos de Hfl, entonces la suma de ellos, C1+ 
C2, también es un conjunto convexo. 
Demostración. 
Recordemos que C1+ C2 = {x1 + x2 1 x1 E C1,x2 E C2}, sean x,y E C1+ C2. Por tanto, 
existen vectores x1, Yl E C1 y x2, Y2 E C2,tales que x = X1 + x2, Y= Y1 + Y2· Si O<>.< 1, se 
tiene que (1 - >.)x + >.y 
= [(1 - >.)x1 + >.y1] + [(1 - >.)x2 + >.y2]. Por convexidad de los conjuntos C1 y C2, sabemos 
que (1- >.)xi+ >.y1 E C1 y que (1- >.)x2 + >.y2 E C2. Por tanto, (1- >.)x + >..y E C1 + C2. q.e.d. 
7 
Dados los conjuntos convexos C1, C2, ... , Cm, podemos formar el conjunto C = AI C1 + 
A2C2 + ... + >.mCm,el cual llamamos una combinación convexa de C1, C2, ... , Cm,cuando )q ~ 
O, >..2 ~ O, ... , Am ~ O y >..1 + >..2 + ... + Am = l. Del teorema 1.2.1, Ces un conjunto convexo. 
El cumplimienro de la propiedad distributiva es equivalente a la convexidad del c.onjunto en 
cuestión. Es decir: 
Teorema 1.2.2. Si C es un conjunto convexo y AJ ~ O, A2 ~ O, entonces (A 1 + A2)C = 
A1C + A2C. 
Demostración. 
e) 
Esta inclusión siempre es cierta, ya que si x E (A1 + A2)C,entonces x = (A1 + A2)Y, para 
algún y E C,y .-\1 ~ O, -\2 ~ O, y como A1Y + >..2y E A1 C + A2C, se tiene lo pedido. 
:) ) 
Note que si >..1 + A2 > O, entonces /31 = >..¡/(.-\1 + >..2) y /h = A2/().1 + A2) son tales que /31 + 
/h = l,con /31, /32 ~O.Por la convexidad de C,se tiene que /31C+ fhC e C .Así, multiplicando 
por .-\1 + A2,se tiene lo pedido.q.e.d. 
3.Funciones Convexas 
Para una función f : S -------t [-oo, +oo) , donde el dominio Ses un subconjunto de R!",se 
define su epígrafe como 
{(x,µ) 1 x ES,µ E R,µ ~ f(x)}. 
Este conjunto se denota como e¡nf. 
Definición 1.3.1. Una función f : S - [-oo, +oo] se dice ser convexa sobre S si epi,f es 
un subconjunto convexo de ff1+ 1. Una función es cóncava si su negativo es una función convf'..xa. 
Una función afín sobre Ses una función la cual es finita, convexa y cóncava. 
Definición 1.3.2. El dominio efectivo de una función convexa f sobre S, el cual denotamos 
como domf, es la proyección sobre Rn del epígrafe de f, es decir, 
damf = {x l 3µ,(x,µ) E e¡nf} = {x I f(x) < oo}. 
Este es un conjunto c.onvexo en R!' ,puesto que es la imagen de el conjunto convexo epi,f bajo 
8 
una tranformación lineal. Su dimensión es llamada la dimensión de f. Nótese de la definición 
de función convexa y de dominio efectivo de una función convexa que la convexidad de f 
es equivalente a la convexidad de f restringida a su dominio efectivo. Nuestra operacionf'.s 
numéricas involucrarán los elementos -oo y +oo. Por tanto, se definen las siguientes operaciones 
entre estos elementos y los números reales: 
a + oo = oo + a = oo donde - oo < a ~ +oo 
a - oo = -oo + a = -oo donde -oo ~ a < oo 
aoo = ooa = oo, a( -oo) = ( -oo )a = -oo para O < a ~ oo 
aoo = ooa = -oo, a(-oo) = (-oo)a = oo para -oo ~a< O 
Ooo = ooO =O= 0(-oo) = (-oo)O, -(-oo) = oo 
inf 0 = +oo, sup 0 = -oo 
Definición 1.3.3 Una función convexa f se dice propi,a si su epígrafe es no vacío y si 
f(x) < +oo para al menos un x y f(x) > -oo para toda x. De esta manera, f es propia {:::} el 
conjunto covexo domf es diferente del vacío y la restricción de f al conjunto C es finita. 
Definición 1.3.4 Una función convexa que no es propi,a se dice impropia. 
Observación 1.3.5 Una función fes convexa sobre S ~ Rn {:::} (1 - >..)(x, µ)+>..(y, v) = 
((1 -A)x + Ay, (1 - A)µ+ Av) pertenece a epi,f, siempre que (x, µ) y (y, v) pertenecen a epi,f y 
O~>..~ l. Es decir, si (1 - >..)x + >..y ES, entonces f((l - A)x + >..y) ~ (1 - A)µ+ >.v, siempre 
que x E S,y E S,f(x) ~µE R ,f(y) ~ v E R y O~>..~ l. 
Teorema 1.3.6 Sea f una función de Ca (-oo, +oo], donde C es un conjunto convexo. 
Entonces f es convexa sobre C {:::} 
f((l - ,\)x + >..y) < (1- >.)f(x) + ,\f(y), 
O < ,\ < 1,para todo x y y en C. 
Demostración. 
=}) 
De la observación 1.3.5, si Ces convexo entonces (1 - ,\)x + >.y E C, para x, y E O.Además, 
9 
(1 - >.)(x, µ)+>.(y, v) ((1- >.)x + >.y, (1 - >.)µ. + >.v) E e¡nf 
si x,y E:: C y f(x) ::::; µ E R,f(y) ::::; v E R y O ,::::; >. ::::; l. En paricular, podemos usar 
f(x) = µ, f(y) = v,de tal manera que tenemos 
(1- ..\)(x, J(x)) + ..\(y, f(y)) ((1- ..\)x+ >.y, (1- ..\)f(x) + ..\f(y)) E e¡Yif 
es decir, concluímos finalmente que 
J{{l - ..\)x + ,\y) ,::::; (1 - ..\)f(x) + ..\f(y). 
En lo anterior consideramos que f(x), f(y) E R. Si no fuera así, note que la desigualdad del 
teorema se cumple también, pues al menos uno de los términos es +oo. 
<===) 
Sean (x, µ), (y, v) E epif, es decir, f(x) ::::; µ E R,f(y) ~ v E R. Ahora bien, el elemento 
).(x, µ) + (1 - ).)(y, v) = ((1 - ).)x + ).y, (1 - ).)µ + ..\v) es una combinación convexa de dos 
elementos del epígrafe. Para ver que este nuevo elemento también está en el epígrafe, note que 
por hipótesis, 
J((l - >.)x +..\y)::::; (1- ..\)f(x) + ..\f(y) ~ (1- ..\)µ + >.v,O < ,\ < 1, 
para todo x y y en C. Por tanto, el epígrafe de la función es un conjunto convexo. q.e.d. 
Teorema 1.3.7 (Desigualdad de Jensen). Sea f una función de Rn a (-oo, +oo]. 
Entonces f es convexa {::} 
f().1x1 + A2X2 + ... + AnXn) ::::; >.if(x1) + ... + Anf(xn) siempre que >.1 ~ O, ... , An ~ O, Al + 
... + ).n = l. 
10 
Demostración. 
De la observación sabemos f es convexa# {1 - >.)x + >.yE!l" y f{(l - >.)x + >..y) s (1 -
>..)J(x) + >..J(y) con OS >. S l. De donde se puede extender a más de dos sumandos.q.e.d. La 
función de saporte ó*(x / C) de un conjunto convexo C en R" está definido como 
ó*(x / C) = sup{ (x, y) / 1J€C}. 
donde (x, y) = X1Y1 + x2y2 + ... + XnYn es el producto interno usual de Rn. 
Teorema 1.3.8 Para cualquier función convexa f y cualquier aE[-oo, +oo],los conjuntos 
de nivel { x / f(x) <a} y { x I f(x) s a} son convexos. 
Demostración. 
A partir del teorema 12, el caso con desigualdad estricta se tiene claramente. Para demostrar 
la convexidad del conjunto { x / f ( x) S a} note que este conjunto es la intersección de todos 
los conjuntos de la forma {x / f(x) < ,8},con /3 > a. Pero la sabemos que la intersección de 
una familia arbitraria de conjuntos convexos es un conjunto convexo, y entonces se tiene el 
resultado. q.e.d. 
Corolario 1.3.9 Sea Íi una función convexa sobre R" y ai un número real para cada 
id,donde I es el conjunto de indexización. Entonces C = {x / fi(x) s ai, Vid} es un conjunto 
convexo. 
Demostración. 
Sea Ci = {x / Íi(x) s ai} el cual es un conjunto convexo. Como la intersección de una 
cantidad arbitraria de conjuntos convexos es un conjunto convexo y nCi = C, se tiene lo pedido. 
q.e.d. 
Definición 1.3.10 Una función f sobre Rn se dice ser positivamente homogénea,( o de 
grado 1) si para cada x uno tiene que J(>..x) = >.J(x), O<>..< oo. 
Observación 1.3.11 Note que la homegeneidad positiva es equivalente a que el epígrafe 
11 
sea un cono de Rn+l. 
Teorema 1.3.12 Una función positivamente homogénea f: Rn - (-oo, +oo] es convexa 
si y sólo si 
para toda X€~, Y€~. 
Demostración. 
f(x + y) < f(x) + f(y) 
Recuérdese que un subconjunto de H:" es un cono convexo {:::} es cerrado bajo adición y 
multiplicación escalar. Esto aplicado a f dá la conclusión del teorema puesto que la condición 
de subaditividad de fes equivalente a que epif sea cerrado bajo la adición. 
q.e.d. 
Corolario 1.3.13. Si fes una función positivamente homogénea propia convexa, entonces 
siempre que A1 > O, A2 > O, ... , Am > O. 
Corolario 1.3.14. Si f es una función convexa propia positivamente homogénea, entonces 
J(-x) ~ -f(-x) para cada x. 
Demostración. 
Note que f(x) + f(-x) ~ f(x - x) = f(O) ~ O. q.e.d. 
4.Propiedades Topológicas 
En el estudio de las funciones convexas se encuentran muchos ejemplos de conjuntos convexos 
abiertos y cerrados. Dada una función continua real-valuada f definida sobre IF podemos 
formar la familia de los conjuntos abiertos de nivel {x I f(x) < a} y la familia de los conjuntos 
12 
cerrados de nivel {x I J(x)::::; a}, y sabemos del teorema 1.3.8,que si f 
es convexa, entonces estos conjuntos son convexos.Denotamos como B la bola unitaria 
Euclideana en R'1'como el conjunto: 
B - {x l lxl::::; 1} = {x I d(x,O)::::; 1} 
donde d( x, y) es la distancia Euclideana en Rn. 
También, para cualquier aER!', la bola con radio f. > O y centro en aER'1' está definida como 
{x I d(x,a):::;E}={a+yllyj$E}=a+EB 
Para cualquier conjunto C ~ R'1' ,el c,0njunto de puntos x cuya distancia desde C no excede 
E es 
{x 1 3yEC, d(x, y) ::::; E}= U{y + EB I yEC} =e+ EB. 
La cerradura clC y el interior íntC de C se pueden expresar con las fórmulas: 
clC = n{C+EB I f.> o} 
intC {x l 3E > 0,x + EB e C} 
El interiar relativo de un conjunto convexo C en R!' , el cual es denotado como riC, está 
definido como el interior que resulta cuando Ces considerado como un subconjunto de su casco 
13 
afín, aj f C. Recordemos la definición de casco afín. Dado un conjunto arbitrario S e R"' existe 
un único conjunto afín más pequeño ( en el sentido de la contención) tal que contiene a S. Un 
conjunto M de Rn es llamado un conjunto afín si (1 - .X)x + )..yEM para cada xEM, yEM, y 
AER.El interior relativo consiste de los puntos xrnf f C para los cuales existe un E > O, tal que 
yEC siempre que yrnffC y d(x,y) ~E.En otras palabras, 
riC {xrnffC 1 :3E > O, (x + EB) n (af JC) e C} 
Teorema 1.4.1 Sea C un conjunto conw.xo en Rn. Sea xEriC y yEclC. Entonces (1-)..)x+ 
>.yEriC ( y por tanto en particular pertenece a C) para O ~ .A < 1. 
Demostración. 
Podemos limitarnos a trabajar cuando C es de dimensión n, de tal manera que riC = intC. 
Para O~)..< 1, debemos mostrat que (1 - >.)x +..\y+ eB e C para algún e> O.Debido a que 
yEclC, sabemos que yEC + cB para cada e > O. 
Es decir para todo e> O, (1 - ..X)x +..\y+ t:B e (1 - ..X)x + ..X(C + eB) + eB = 
(1->..) [x + e(l + .>.)(1 - .>.)-1 B] +..XC e (1-.X)C +.>.C = C,cuando e es escogido adecuada-
mente, pues xEintC. 
q.e.d. 
Algunas propiedades topológicas adicionales oo un conjunto Ce R"' son: 
cl(clC) clC, ri(riC) = riC 
Además si el conjunto C es convexo se tiene el siguiente teorema: 
Teorema 1.4.2 Para cualquier conjunto convexo C en R"' ,cl(riC) = clC y ri(clC) = riC. 
Demostración. 
Como sabemos que para cualquier conjunto C de R"' se tiene riC e C, entonces aplicando 
cerradura en cada lado de la contención anterior tenemos que cl(riC) C clC. Ahora vamos 
14 
a ia contención en sentido contrario: sean yEclC y xETiC, el segmento de línea que une los 
puntos x y y está contenido en riC, excepto posiblemente y. Pero lo que si se tiene se que 
está en la cerradura del conjunto anterior, es decir, yEcl(riC). De esta manera conluúnos que 
cl(riC) :J clC. Por tanto, concluímos que cl(riC) = clC . Vamos a la otra igualdad. Para 
cualquier conjunto C de Rn( convexo o no ) se tiene que C e clC. Por tanto, si aplicamos 
interior relativo a ambos lados de la contención (lo cual es válido puesto que los cascos afines 
de clC y C coinciden), y sabiendo que cl(clC) = clC, tenemos que ri(clC) :J riC . Ahora 
sea uri(dC). Queremos concluír que zETi(clC). Sea x cualquier punto de riC. Considerando 
la línea que pasa através de x y z,y si µ > 1 tal que µ - les suficientemente pequeño, el punto 
definido como 
y = ( 1 - µ )x + µz = z - (µ - 1 )( x - z) 
(que está en la línea), pertenece a ri(clC) e clC. Para ese y, podemos expresar a z en la 
forma (1 - >.)x + >.y con O<.>. < l. Por tanto del teorema 1.4.1, zETiC. q.e.d. 
Corolario 1.4.3 Sean C1 y C2 conjuntos convexos en Rn .Entonces clC1 = clC2 si y sólo 
si riC1 = riC2. 
Demostración. 
::::} ) 
Suponga que clC1 = dC2, entonces aplicando relativo interior a cada lado tenemos, ri(clC1) = 
ri(clC2).Puesto que ri(clCi) = riCí se tiene que ri(Ci) = ri(C2). 
<=) 
Igual que en el caso anterior, si ri(Ci) = ri(C2), entonces aplicamos cerradura en ambos 
lados de la igualdad se tiene que cl(ri(C1)) = cl(ri(C2)), y otra vez por él Teorema 1.4.2, 
sabemos que d(ri(Ci)) = clCi. Por tanto tenemos que 
clC1 = clC2, q.e.d. 
Una función f valuada sobre los reales extendidos definida sobre un conjunto S C Rn se 
dice ser semicontinua inferior en el punto x de S, si f(x) ~ limi--+oo f(xi) para cada sucesión 
xi, x2, ... , en S tal quex1 converge ax y el límite de f(x1), f(x2), ... ,existe en [-oo, +oo]. Esta 
condición podría ser expresada como: 
15 
f(x) lim inf f(y) = lim(inf{f(y) I IY - xi Se}) 
y-+x el O 
Similarmente, una función f se dice ser semicantinua superior en x si 
f(x) lim sup f(y) = lim(sup{f (y) I IY - xi S t:}) 
y-+x e¡o 
Si una fondón es semicontinua superior y semicontinua inferior, entonces es continua. 
Teorema 1.4.4 Sea f una función arbitraria de H:i a [-oo, +oo]. Entonces las condiciones 
siguientes son equivalentes: 
(a) fes semicontinua inferior en R'1 
(b ){ x I f ( x) S o:} es cerrado para cada o:ER 
(e) El epígrafe de f es un conjunto cerrado en Jl'1+ 1. 
Demostración. 
Si fes seicontinua inferior en x ,entoncesµ~ f(x) siempre queµ= lim µ,;, y x = limxi para 
sucesiones µ1, µ2, .. , y x1, x2, ... tales queµ¡, ~ f(xi) para toda i. Es decir tenemos la condición 
( c). También se tiene (b) al tomar 
a = µ = µ1 = µ2 = . Ahora suponga que (b) se cumple. Si {xi} converge a x y f(xi) 
converge a µ, para cualquier número o: tal que o: > µ, f(xi) deberá ser menor que o:,y por 
tanto, 
XEcl{y I f(y) So:}= {y I f(y) So:} 
De esta manera f(x) s µ.Por tanto (b) implica (a).q.e.d. 
Definición 1.4.5 Dada cualquier función f sobre R'1, existe la mayor de las funciones 
16 
semi continuas inferiores ( no necesariamente finita) mayorizada por f , a decir, la función cuyo 
epígrafe es la cerradura en Rn+ 1,del epígrafe de f. En general, esta función es llamada el casco 
semicontinuo inferiorde f. 
Definición 1.4.6 La cerradura de una función convexa f es el casco semicontinuo inferior 
si f no toma el valor -oo en ningún punto. Si la función convexa es impropia y toma el valor 
-oo en algún punto, entonces la cerradura de f está definida como la fnnción constante -oo. 
Observación 1.4. 7 Note que la cerradura de una función convexa es otra función covexa. 
Notación 1.4.8 La cerradura de una función f será denotada como clf. 
Definición 1.4.9 Una función convexa se dice ser cerrada si cl/ = f. 
Observación 1.4.10 Para una función convexa propia, cerradura es lo mismo que semi-
continuidad inferior. 
Observación 1.4.11 Las únicas funciones cerradas convexas impropias son las funciones 
constantes +oo y -oo. Los siguientes teoremas y corolarios están completamente demostrados 
en {Rocka] 
Teorema 1.4.12 Si fes una función impropia convexa, entonces f(x) = -oo para cada 
xEri(domf).Por tanto una función convexa impropia es necesariamente infinita excepto quizá, 
en puntos de la frontera relativa de su domirúo efectivo. 
Corolario 1.4.13 Una función convexa impropia semicontinua inferior no puede tener 
valores finitos. 
Corolario 1.4.14 Sea f una función convexa impropia. Entonces df es una función convexa 
cerrada impropia la cual es igual a f sobre ri(domf). 
Corolario 1.4.15 Si f es una función convexa cuyo dominio efectivo es relativamente 
abierto ( por ejemplo si domf = Jr1'),entonces existen dos posibilidades: f(x) > -oo para toda 
x,o bien J(x) es infinita para cada x. 
Teorema 1.4.16 Para cualquier función convexa f,ri(epif) consiste de las parejas orde-
nadas (x, µ) tales que xEri(darnf) y f(x) < µ < oo. 
Corolario 1.4.17. Sea a un número real, y sea J una función convexa tal que para alguna 
x ,J(x) < a.Entonces J(x) <apara alguna XEri(domf). 
Corolario 1.4.18 Sea f una función convexa, y sea C un conjunto convexo tal que riC C 
dmnf. Sea a un número real tal que f(x) <apara algún xEclC. Entonces f(x) <apara algún 
17 
XETiC. 
Corolario 1.4.19 Sea f una función convexa sobre H!', y sea C un conjunto convexo en el 
cual fes finita.Si J(x) 2: a para todo xEC ,entonces también J(x) 2: a para toda xEclC. 
Corolario 1.4.20 Sean f y g funciones convexas sobre R'1', tales que 
ri(domf) ri(domg), 
y J y g son iguales en el último conjunto, entonces clf = clg. 
Teorema 1.4.21 Sea J una función convexa propia sobre Rn .Entonces d,f es una función 
convexa propia cerrada. 
Teorema 1.4.22 Sea J una función convexa propia, y sea aER ,a > inf f. Entonces los 
conjuntos de nivel covexos {x I f(x) ~ a} y {x I f(x) < a} tienen la misma cerradura y el 
mismo interior relativo, a decir, 
{x 1 (clf)(x) ~ a}, {xEri(domf) 1 J(x) < a}, 
respectivamente. 
5.Teoremas de separación. 
Sean C1 y C2 dos conjuntos no vacíos de R:1' . Un hiperplano H se dice que separa C1 y 
C2 si C1 está contenido en uno de los semiespacios cerrados asociados con H y C2 está en el 
semiespacio cerrado contrario. También se dice que H separa propiamente C1 y C2 si estos dos 
conjuntos no están contenidos los dos en H mismo. Se dice que el hiperplano H separa C1 y 
C2 fuertemente si existe algún € > O tal que C1 + EB está contenido en uno de los semiespacios 
abiertos asociados con H y C2 + EB está contenido en el semiespacioabierto opuesto, donde B 
es la bola unitaria Euclídea na { x I lx 1 ~ 1}. (Recordemos que Ci + EB consiste de los puntos x 
tales que lx - YI ~ E para al menos un YiECi ). 
Teorema 1.5.1 Sean C1 y C2 dos conjuntos no vacíos en R'1'. Existe un hiperplano que 
separa C1 y C2 propiamente si y sólo si existe un vector b tal que 
(a) inf {(x, b) 1 XéCi} 2: sup{ (x, b) 1 xéC2} 
18 
(b) sup{ (x, b) 1 xeCt} > inf{ (x, b) 1 xeC2} 
Existe un hiperplano que separa C1 y C2 fuertemente si y sólo si existe un vector tal que 
(c) inf{(x,b) 1 xeCt} > sup{(x,b) 1 xeC2} 
Demostración. 
~) 
Suponga que b satisface las condiciones (a) y (b), y seleccionemos cualquier f3eR que se 
encuentre entre el ínfimo sobre C1 y el supremo de C2 . Nótese que las dos condicones (a) y 
(b) implican que b i= O, pues en caso contrario tendríamos que se contradice (b). Ahora bien, 
si b ::/= O y /3eR, entonces el conjunto 
H { x 1 (x, b) = /3} 
es un hiperplano. Este hiperplano define dos semiespacios, a decir, {x 1 (x, b) 2'.: /3}, el 
cual contiene a C1, mientras que {x 1 (x, b) :S /3} contiene a C2.(Podemos suponer, sin pérdida 
de generalidad, que el primero contiene a C1, y por tanto que el segundo contiene a C2). La 
condición (b) implica que C1 y C2 no están ambos contenidos en H puesto que si sup{ (x, b) 1 
XeCi} > inf{ (x, b) 1 xeC2} ,entonces estamos diciendo que /3 > /3, lo cual es una contradicción. 
Por tanto 
H separa C1 y C2 propiamente. 
::::} ) 
Inversamente, cuando C1 y C2 pueden ser separados propia.mente existen b y /3 tales que 
(x, b) 2:'.: f3 para toda xeC1 y (x, b) :S /3 para toda xeC, pero debemos tener desigualdad estricta 
para al menos un xeC1 ó xeC2 .Por tanto b satisface las condiciones (a) y (b). Vamos a la 
otra desigualdad. Si b satisface la condición fuerte (c), podemos escoger /3eR y 6 > O tales que 
(x, b) 2'.: f3 + ti para toda xeC1, y (x, b) :S /3- 6 para toda xeC2.Puesto que la bola unitaria está 
acotada, podemos escoger e > O suficientemente pequeña de tal manera que 1 (y, b) 1 < 6 para 
toda ye(eB) . 
Entonces, 
19 
asi que 
C1 + eB e { x 1 (x, b) > ,B} 
C2 + eB e { x 1 (x, b) < ,B} 
H { x 1 (x, b) = ,B} 
separa C1 y C2 fuertemente. Inversamente, si C1 y C2 pueden ser separados fuertemente, 
la inclusión que acabamos de describir se tiene para cierto b, ,8 y e > O. 
Entonces, 
y por tanto se tiene ( c). 
,8 < inf { (x, b) + e (y, b) 1 xeC, yeB} 
< inf{ (x, b) 1 xeC1} 
,8 > sup{ (x, b) + e (y, b) 1 xeC2, yeB} 
> sup{ (x, b) 1 xeC2} 
Teorema 1.5.2 Sea C un conjunto convexo relativamente abierto en Rn, y sea M un 
conjunto afín no vacío en~ que no intersecta e.Entonces existe un hiperplano H que contiene 
M,tal que uno de los semiespacios abiertos asociados con H contiene a C. 
Demostración. 
Recuerde que dado cualquier S CH!" existe un único más pequeño conjunto afín que contiene 
S ( a decir, la intersección de la colección de conjuntos afines M tales que S C M). Este es 
20 
liamado el casco afín de S y es denotado como aj j S. aj f S consiste de todos los vectores de la 
forma 
..\1 +...\2+ ... +...\m = l.Un subconjunto M de KL es llamado afín si (1-...\)x+...\yeM, Vx, yeM, 
...\eR.Si Mes un hiperplano,uno de los semiespacios abiertos asociados deberá contener C, pues 
de otra manera M intersectaría C, lo que contradice la hipótesis (Si C contiene puntos x y y en 
los dos semiespacios abiertos opuestos, algún punto del segmento de línea entre x y y estaría 
en la frontera M mutua de los semiespacios). Suponga que M no es un hiperplano. Mostramos 
a continuación cómo construír un conjunto afín M" de una dimensión más alta que M el 
cual no intersecte C. Aplicando una tralación,si es necesario, podemos suponer que OeM , de tal 
manera que Mes un subespacio. El conjunto convexo C- M incluye C pero no O. Puesto que M 
no es un hiperplano, el subespacio M-1,contiene un subespacio de dos dimensiones. Llamemos a 
este subespacio P. Sea C" = Pn(C-M). Este es un conjunto covexo relativamente abierto y no 
contiene al O, (riC" = riPnri(C-M) = Pnri(C-M) = Pn(riC-riM) = Pn(C-M) = C"). 
Todo lo que tenemos que hacer es encontrar una línea que pase por O en P que no intersecte 
a C" ,para que M" = M + L sea un subespacio de una dimensión más alta que M y que no 
intersecte C,(si (M + L) n C 1- 0 entonces L n (C - M) 1- 0 y L n C = 0).Podemos identificar 
P con R2 . La existencia de la línea L es trivial si C" es vacío o de dimensión cero. Si af f C" 
es una línea que no contiene al O, podemos tomar L como la paralela a la línea que pasa por el 
O. Si af f C" es una línea que contiene al O,podemos tomar L como la perpendicular que pasa 
por el cero. Por 11ltimo, si la dimensión de C" es 2,entonces C'' es abierto y abierto relativo, 
es decir, intC" = C" y riC" = C''. Esto es debido a que la dimensión de Pes dos, y por tanto 
estamos en el caso donde affC" = R2• 
Formemos el conjunto K = U{...\C" 1 ...\>O}. Este es un cono convexo y es el menor de los 
conjuntos convexos que contienen C" ,además de que es abierto put>.,sto que la unión arbitaria 
de conjuntos abiertos es un conjunto abierto. Más aún, K no contiene al O. De esta manera, 
si pensamos en R 2, K es un sector de R2 cuyo ángulo no es mayor que 1r,puesto que si lo 
21 
contuviera, contendría al cero por medio de una combinación de elementos del sector. Se puede 
pensar a L como 
un rayo que coincide con uno de los rayos que son la frontera del sector. 
q.e.d. 
Teorema 1.5.3 Sean C1 y C2 dos conjuntos convexos no vacíos en H!". 
Para que exista un hiperplano que separe propiamente a C1 y C2, es necesario y suficiente 
que riC1 n riC2 = 0. 
Demostración. 
{::=) 
Consideremos el conjunto C = C1 -C2. Su interior relativo es riC1 -riC2 de tal manera que 
O (J. riC si y sólo si riC1 nriC2 = 0. Si O (Í. riC, por el teorema anterior, existe un hiperplano que 
contiene a M = {O} tal que riC está contenido en uno de los semiespacios abiertos asociados, 
como 
riC e { semiespacw aáierto} 
y 
C e el ( riC) e el { semiespacio aáierto} 
entonces C está contenido en la cerradura del semiespacio abierto. 
Por tanto, si O rj. riC, tenemos que M = {O} y riC están separados propiamente por H. 
Más aún, M = {O} y C están separados propiamente. Si están separados propiamente, 
inf { (x, b} 1 xt:C} ~ sup{ (x, b) 1 xt:M = {O}} = O 
es decir, 
inf { (x, b) 1 xt:C} ~ O 
22 
Por otro lado, 
inf { {x, b) xeC} = inf { {x, b) 1 xeC1 - C2} 
inf{ (x1 - x2, b) 1 x = (x1 - x2)e(C1 - C2)} 
inf{ {xi, b) - (x2, b) 1 x = (x1 - x2)e(C1 - C2)} 
Como no hay restricción sobre la elección de x = x1 - x2, (por supuesto se debe tener que 
x1eC1 y x2eC2) entonces podemos escribir que 
inf{(x,b) 1 xeC} = inf{(x1,b) 1 x1eC1}-sup{(x2,b) 1 x2eC2} 
Para el caso del supremo tenemos lo siguiente: 
sup{(x,b) 1 xeC} > inf{{x,b) 1 xeM ={O}}= O 
Por razones análogas a lo anterior tenemos, en conclusión, 
Ebi;o significa que 01 y 02 pueden ser separados propiamente. 
==?) 
23 
Ahora supongamos que C1 y C2 pueden ser separados propiamente. Entonces existe un 
vector b tal que 
(a) inf { (xi, b) 1 X1éCI} 2: sup{ (x2, b) 1 x2eC2} 
(b) sup{ (x2, b) 1 X1éC1} > inf { (x2, b) 1 X2éC2} 
Es decir, 
(a") inf{(x1,b) 1 X1éCi} - sup{(x2,b) 1 X2éC2} = 
inf { (x, b) 1 x = (x1 - x2)é(C1 - C2) = C} 2: O 
(b")sup{ (x2, b) 1 X1éCI} - inf { (x2, b) 1 x2éC2} = 
sup{ (x, b) 1 x = (x1 - x2)é(C1 - C2) = C} > O 
Sea D = {x 1 (x, b) 2: O}. Por (a") y (b"), Ce D. También, como riD = {x 1 (x, b) > O}, 
entonces riD n C =/=- 0 
(recuérdese que si sup = 6 > O y si seleccionamos é1 y é2 tales que 6 > él > é2 > O 
entonces existe XéC tal que (x, b) 2: é1 y por tanto (x, b) > é2), De esta manera, tenemos que 
riC e riD,es decir,O ~ riC. q.e.d. 
Teorema 1.5.3 Sean C1 y C2 conjuntos convexos no vacíos en R'1'. Para que exista un 
hiperplano que separe C1 y C2 fuertemente, es necesario y suficiente que 
en otras palabras, que O~ cl(C1 - C2). 
Demostración. 
Si C1 y C2 pueden ser separados fuertemente,entonces, para algún é > O, C1 + éB no 
intersecta C2 + éB.Por otro lado, si lo anterior se cumple, los conjuntos convexos C1 + éB 
y C2 + éB pueden ser separados propiamente. Puesto que éB = OB + 71B,donde O= é/2 y 
17 = é /2, los conjuntos ( C 1 + O B) + O B y ( C2 + r¡B) + r¡B entonces pertenecen a semiespacios 
cerrados opuestos, así que C1 +OB y C2 +r¡B pertenecen a semiespacios abiertos opuestos. Por 
tanto, C1 y C2 se pueden separar fuertemente {::} para algún é > O,el O no está en el conjunto 
24 
Off:. (C1 + E:B) - (C2 + E:B) = C1 - E:2 - 2E:B 
es decir, 
para algún E: > O,así que 
es decir, 
Si inf{lx1 -x2l l x1 E C1,x2 E C2} > O entonces existe E:> O tal que 2E:Bn{C1 -C2) = 0,y 
O(/. cl(C1 - C2). 
q.e.d. 
Teorema 1.6.4 Un conjunto convexo cerrado C es la intersección de los semiespacios 
cerrados los cuales lo contienen. 
Demostración. 
Podemos suponer C =/:- 0 y C =/:- n:i. Dado a</. C, los conjuntos C1 = {a} y C2 = C pueden 
25 
tier separados fuertemente 
(C2 = ce = abierto y a (J. clC = C ). Es decir, existe un hiperplano que separa {a} y C 
fuertemente. Uno de los semiespacios cerrados asociados con este hiperplano contiene C pero 
no a a. Lo anterior lo podemos hacer para toda a 't. C. Entonces la intersección de todos los 
semiespacios cerrados que contienen C es precisamente C. 
q.e.d 
Corolario 1.5.5 Sea S cualquier subconjunto de Rn. Entonces cl(convS) es la intersección 
de todos los semiespacios cerrados que contienen S. 
Demostración. 
C = cl(convS) es un conjunto convexo cerrado. Un semiespacio cerrado contiene C = 
cl(convS) si y solo si contiene S (un semiespacio cerrado es convexo y cerrado). Entonces la C 
es la intersección de todos los subespacios cerrados que contienen S. 
q.e.d. 
Si C es un conjunto convexo en El"'. Un semiespacio de soporte para C es un semiespacio 
cerrado que contiene C y tiene un punto de C en su frontera.· Un hiperplano de soporte para 
C, es un hiperplano el cual es la frontera de un semiespacio de soporte para C. Los hiperplanos 
de soporte para C,en otras palabras,son los hiperplanos los cuales pueden ser representados en 
la forma H = {x 1 (x, b) = ,8}, b f. O, donde (x, b) ~ f3 para toda x (J. C y (x, b) = f3 para al 
menos un x E C. Por tanto, un hiperplano de soporte para C está asociado con una función 
lineal la cual alcanza su máximo en C. Los hiperplanos de soporte que pasan através de un 
punto a E C dado corresponden a vectores b normales a C en a. Si C no es de dimensión n, es 
decir, af JC f. El"', podemos siempre extender affC a un hiperplano conteniendo todo C. 
Usualmente se trabaja con hiperplanos de soporte para G no triviales,es decir, aquellos los 
cuales no contienen C mismo. 
Teorema 1.5.6 Sea C un conjunto convexo, y sea D un subconjunto convexo no vacío de 
C (por ejemplo, un suconjunto consistente de un solo punto). Para que exista un hiperplano 
de soporte no trivial para C que contenga D ,es necesario y suficiente que D nriC = 0. 
Demostración. 
Puesto que D e C, los hiperplanos de soporte no triviales para C que contienen a D son 
los mismos hiperplanos que separan D y C propiamente. Tal hiperplano existe si y solo si 
26 
riD n riC= 0. Esta condición es equivalente a que D n riC = 0 . q.e.d. 
Corolario l.ó. 7 Sea C un conjunto covexo. Un x E C es un punto de la frontera relativa 
de C si y sólo si existe una función lineal h no constante sobre C tal que h alcanza su máximo 
sobre C en X. 
Demostración. 
Recuerde que clC\ riC es la frontera relativa de C. Tenemos dos casos: 
i) x E e, x E ctc 
ii)x E C, x (/_ dC 
Y usarnos la función (), con lo cual se tiene lo pedido. q.e.d. 
6.Funciones de soporte. 
Un problema común de optimización es aquel de maximizar una función lineal (., x*) sobre 
un conjunto convexo C en R". 
Una forma de estudiar el anterior problema es observar lo que sucede con esta función 
cuando x* varía. Esto nos lleva 
a estudiar la llamada función de soporte 6*(. j C) de C: 
6*(x* 1 C) = sup{ (x, x*) 1 xt:C} 
La función de soporte de C describe todos los semiespacios cerrados que contienen a C, ya 
que uno tiene que 
e e {xl(x,x*)~.B} 
si y sólo si 
/J > 6*(x* 1 C) 
27 
El dominio efectivo de 6*(. 1 C) es el cono de barrido de C. Claramente, para cualquier 
conjunto convexo C uno tiene que 
t5*(x* 1 C) = 6*(x* 1 clC) = 6*(x* 1 riC), Vx* 
Teorema 1.6.1 Sea C un conjunto convexo. Entonces x€ClC si y sólo si (x, x"'} ~ 6"'(x* 1 C) 
para todo vector x"'. Por otro lado, Xf.riC si y sólo si la misma condición se cumple, pero con 
desigualdad estricta para cada x* tal que -6*(-x* 1 C) =j:: t5*(x"' 1 C). Uno tiene que xf.intC si 
y sólo si 
para todo x* =j:: O. 
Demostración. 
(x, x*} < 6*(x* 1 C) 
Las caracterizaciones de clC y riC son inmediatas de los corolarios 1.5.5 y 1.5.7. 
28 
CAPÍTULO 11 
REVISIÓN DE CÁLCULO ESTOCÁSTICO 
!.Filtraciones y Tiempos de Paro. 
~upuuea que (!1, F, P) es un espacio de probabilidad. (fl, F, P) modela la adqusición de 
información conforme el tiempo pasa. 
Definición 2.1.1 Una filtración F = {Ft, t E 1r} es una familia creciente de subsigmas álgebras 
Fs C Ft. Suponemos que la filtración: 
a) Es completa, es decir, cualquier conjunto nulo en F1,pertenece a Fo, y así, para cada Ft. 
b) Continua por la derecha; es decir, 
Observación. 2.1.2 
n 
F.s s > t . 
Ft representa la historia de algún proceso o procesos hasta el tiempo t. Si un evento A E F 
es Ft medible entonces sólo depende de lo que pasó el tiempo t. 
Definición 2.1.3. Suponga que el parámetro tiempo 1r es [O, oo], ( o [O, oo], o [O, T]). Una 
variable aleatoria que toma valores en 1r es un tiempo de paro (stopping time) si para cada 
t 2: o. 
{T:St}EFt 
esto es, 
{w : T(w) :S t} E Ft 
Observación 2.1.4 El evento {T :S t} sólo depende de la historia hasta el tiempo t. La primera 
29 
vez que ei precio de una acción aicanza un cierto nivel despues de haber caído en una cantidad 
específica, es un tiempo de paro. Sin embargo, el último momento, antes de alguna fecha, en 
el cual el precio de la acción alcanza cierto nivel no es un tiempo de detención debido a que 
"el último momento" requiere información acerca del futuro. Una variable aleatoria constante, 
T(w) = t para toda w En, es un tiempo de paro. Si Tes un tiempo de paro, entonces T + s 
es un tiempo de paro para s ~ O. 
Proposición 6.1.5. Si S y T son tiempos de paro, entonces S A T y S V T son tiempos de 
paro. Consecuentemente, si {Tn}, n EN, es una sucesión de tiempos de paro, entonces: 
~Tn = infTn y ~Tn = supTn son tiempos en paro. 
Demostración. 
Como 
(i) {S /\T:::; t} {S:::; t} U {T:::; t} E Ft 
(ii) {SVT < t} = {S:::; t} u {T:::; t} E Ft 
Veamos (i).Si w E {S AT:::; t} entonces w E {S:::; t} U {T:::; t}::::} 
w E {S::;t} 
y/o 
w E {T:::; t} 
30 
Si w 1:::: { S :-;, t} y min { S, T} = T, o si w E { S ~ t} y min { S, T} = S, se tiene lo pedido, 
puesto que al intersectar o unir elementos de una O' álgebra obtenenemos elementos de la misma 
a álgebra. q.e.d. 
Def. 2.1.6 Suponga que Tes un tiempo de paro con respecto a la filtración {Ft}. Entonces la 
CT álgebra Fr de eventos que ocurren hasta el tiempo T son aquellos eventos A€F que satisfacen 
A n {T ~ t} E Ft 
Teorema 2.1.7. Suponga que S, T son tiempos de paro. 
a) Si S ~ T, entonces Fs e Fr. 
b) Si A E Fs, entonces An {S ~ T} E Fr 
Demostración. 
a) Supongamos que BE Fs. Entonces, como 
B n {T ~ t} = B n {S ~ t}* n {T ~ t} E Ft 
donde 
*(Bn{S~t} EFt) 
se tiene lo afirmado por el teorema. 
b) Suponga que A E Fs. Entonces aplicando la deficinición, 
An {S ~ T}n{T ~ t} ...._,,_.. 
(A n {S ~ t}) n {T ~ t} n {S (\ t ~ T (\ t} 
31 
queremos ver si {5 :S T} 1-1 A E Fr. 
Carla nno ,fo los iíltimos 3 conjuntos está en Ft, el primero debido a que A E Fs,el segundo 
porque T es un tiempo de paro, y el tercero porque S /\ t y T /\ t son V'driables aleatorias Ft 
medibles. q.c.d. 
Definición 2.1.8.Un proceso estocástico de tiempo continuo X que toma valores en un espa-
cio medible (E, E) ,es una familia de variables aleatorias {Xt} definidos en (n, F, P), indizada 
con t, cuyos valores estan en (E, E). Es decir, para cada t tenemos una v.a Xt(-) con valores 
en E. Alternativamente, para cada wdl, ( i.e., fijando w y dejando que t varíe),tenemos una 
trayectoria X.(w) del proceso. 
Observación 2.1.9 X. podría representar el precio de una acción. Para algún tiempo futuro, 
Xt (w) es una cantidad aleatoria, o variable aleatoria. Cada w representa un "estado del mundo", 
para el cual existe un "precio" Xt(w). 
Equivalencia de procesos. 
Una pregunta natural es: ¿Cuándo dos procesos estocásticos modelan el mismo fenómeno? 
Consideremos los procesos estocásticos definidos en un espacio de probabilidades (n, F, P) y 
que toma valores en un espacio medible (E, t:) .La noción más débil de equivalencia de procesos 
refleja el hecho de que en la práctica uno puede sólo observar un proceso estocástico en un 
número finito de veces. Supongamos por simplicidad que E = R y E es la sigma álgebra de 
Borel (3 sobre R . Entonces podemos formar la familia de distribuciones de dimensión finita de 
los procesos X = (Xt) t ::::: O, al considerar la probabilidad de que para n E N, t1,t2, ... , tn E 1r 
y un conjunto de Borel A E Rn ,el vector (Xt 1 ,Xt2 , ... ,XtJtome valores en A. 
Pongamos: 
0t, .. , tn (A)= P [{w E Q: (Xt 1 (w), Xt2 (w), ... , X," (w)) E A}] 
Para cada familia (ti, ... , tn) esto define a 0fi, .. ,,,ncomo una medida sobre Rn .Decidimos que 
los procesos X y Y son equivalentes ( o tienen la misma "ley")si sus familias de distribuciones 
de dimensión finita coinciden, y escribimos X "' Y. 
Definición 2.1.10 
Suponga que {Xt}, {Yt}, t ::::: O son dos procesos definidos sobre el mismo espacio de prob-
abilidad (n, F, P) y que toman valores en (E, E). El proceso {Yt} se dice ser una modificación 
de { X,,} si para cada t, 
32 
Xt = Yt a.s. 
Definición 2.1.11 Los procesos {Xt} y {Yi} se dice ser indistinguibles si pasa casi toda w En, 
Xt(w) Yi(w) para toda t. 
Def. 2.1.12 Suponga que A C [O, oo] xn y que IA (t, w) = IA es la función indicadora de A; 
es decir; l-4(t, w) = 1.Si (t, w) E A y J-4(t, w) = O si (t, w) (/. A.Entonces A es evanescente si J-4 
es indistinguible del proceso cero. 
2.Martingalas 
Definición 2.2.1 Suponga que {Ft}, t ~ O es una filtración del espacio medible (n, F) y {Xt} 
es un proceso estocástico definido en (n, F) con valores en (E, E). Entonces X se dice adaptado 
a { Ft} si Xt es Ft medible para cada t. 
Definición 2.2.2. Suponga que (n, F, P) es un espacio de probabilidad con filtraciones 
{Ft}, t E [O,oo]. Un proceso estocástico con valores en R, {Mt}, se dice ser una super-
martingala ( respectivamente submartingala) con respecto a la filtración { Ft} si 
(a) E[l1'1tl] < oo 
(b) E[M1 IFs] ::; 1'1.~ s::; t (resp. , E [Mt / Fs] ~ M 8 si 8 ::; t) 
Si E [Mt I Fs] = M8 para s ::; t,entonces { Mt} se dice ser martingala. 
Observación 2.2.3. 
E [Mt] = E [Mo] para toda t 
E [Mt I P~] = M.~ ,s ::; t 
E [E [Mt I FslJ = E [Ms] 
E [Mt] = E [Ms] = E [Nlo] . 
El ejemplo más importante de una martingala en tiempo continuo es el Movimiento Brow-
uiano. 
Def.2.2.4. Un movimiento Browniano estándar { Bt}, t ~ O es un proceso estocástico con 
33 
vaiores en ios reales que tiene trayectorias continuas e incrementos Gausianos, estacionarios e 
independientes. 
Es decir: 
a) Bo = O a.s. 
b) el mapeo t---+ Bt(w) es continuo para casi todo w En 
e) para s :S t, Bt - B 8 es una v.a. normal con media O y varianza t - s, y es independiente 
de F,5 = a { Bu : u :S s} . 
(E [(Bt - B.~) 1 Fs] = E [Bt - Bs]) 
Teorema 2.2.5. Suponga que { Bt} es un movimiento Browniano estándar con respecto a la 
filtración { Ft} , t ;:::: O. 
Entonces 
(a) { Bt} es una Ft martingala 
(b) { B¡ - t} es una Ft martingala y 
(e) { exp (r Bt - (r2 /2) t)} es una Ft martingala. 
Demostración 
E [Bt - Bs] = O debido a que (Bt - Bs) es independiente de Ft, 
Consecuentemente, 
E [Bt - Bs I F\] = O y O = E [Bt I F.5] - E [Bs I Fs] = E [Bt I Fs] - Bs ,así 
E[Bt I Fs] = Bs. 
(b) E [B¡ - B.~ 1 Fs] = E [(Bt - Bs) 2 + 2Bs (Bt - Bs) 1 Fs] = E [(Bt - Bs)2 1 Fs] + 
2BsE [(Bt - Bs) 1 Fs] 
y 2BsE[Bt - Bs I Fs] = O 
La independencia implica que 
[ 2 2 J [2 J [21-J-E Bt - B8 1 Fs = E Bt I Fs - E B8 Fs - t - s. 
Por tanto, E [B¡ 1 F.~] = B; - s 
34 
cj Si Z , es una variable aleatoria con distribución normal estándar, Z ,...., N(O, 1) con 
densidad ( 1;vz;;:) e-x2 / 2 y>.. E R, entonces 
( 1/..Jz;) j e>.xe-x212dx = e>..2 / 2 = (*) 
-oo 
Ahora, para s < t , E [erBt-rZt/2 / Fs] = E [ erBt-rBs+rBs-rzt/2 1 Fs] = 
erBs-r
2
t/2 E [ er(Bt-Bs) 1 F.~ J 
Por independencia, 
= erBs-r2t/2 E [er(Bt-8.9)] = erB-R2t/2 E [ erBt-s] . Por estacionariedad. Ahora, Bt-s ,...., 
N(O,r2(t,s)),esto es, si Z,...., N(0,1) como rBt-s tiene la misma ley como r~ Z y 
E [erBt-s] = E [ervl=sZ] = er2 (t-s)/2. 
Por lo tanto, E [erHt-r
2
t/2 1 F.9] = erBs-r
2 
·'
12
. Por(*) se tiene la afirmado. q.e.d. 
3.Integrabilidad Uniforme y Teoremas Límite. 
Def. 2.3.1 Un conjunto K de variables aleatorias contenidas en L (O, F, P) se dice ser 
uniformemente integrables si: 
Í{ixl?C} j X j dP 
converge a cero uniformemente en X E K cuando e --+ oo. 
Por ejemplo, definamos una sucesión estocástica corno sigue: para n = 1, 2, 3 ... , sea Xn = O 
con probabilidad 1 - 1/n, y Xn = n con probabildad 1/n. Note que 
E[j lXn I] = (1-1/n) (O)+ ~(n) = n/n = 1 
para toda n, y por tanto la sucesión está uniformemente L1 acotada. Pero, para tener 
35 
hm [ ] e ---+ 00 E I Xn l 1{1Xnl2:C} o 
uniformemente en n se requiere que para cada E> O, existe CE tal que 
E [1 Xn l 1{1Xnl2:C}] < E para toda e> CE, uniformemente en n. 
Pero esta condición falla si E< 1, pues 
lim [ ] 
n ---+ 
00 
E i Xn i 1{1Xnl2:C} 1 
ueiinición 2.J.2 .Una martigala {A'it}, i E [O, oo), (o [O, T]) se dice uniformemente integrable 
si el conjunto de variables aleatorias {Mt} es uniformemente integrable. Ahora, con lo anterior, 
podemos definir otro elemento más. Si { Mt} es una martingala uniformemente integrable en 
[O, oo] ,entonces 
lim 
Mt = M00 existe a.s.(Elliott, 1982) 
t---+ 00 
Observación. 2.3.3. Como consecuencia del anterior resultado se tiene M 00 = t~~Mt en 
la norma L (O, F, P) ,es decir: 
t 
lim IIMt - Mooll1 O 
---+ 00 
36 
Eu este caso {Aft} es una martingala en [O, ooj y Mt = E [A:f00 1 FtJ a.s. para toda t. 
Notación. Escribamos M para el conjunto de martingalas uniformemente integrables. Un 
concepto importante es el de "localización". Si C es una clase de procesos, entonces C1oc es el 
conjunto de procesos definidos como sigue: X ECzoc si existe una sucesión creciente df'. tiempos 
de paro ( o tiempos de detención) {Tn} 
tal que t~oo Tn = +oo a.s. y Xtl\Tn E C. 
Notación. J\;fzoc denota el conjunto de martingalas locales. La relación para martingalas, 
E [M,.\Fs] = Ms, puede ser extendida a tiempos de paro. Este resultado, es conocido como el 
teorema de Detención Óptima de Doob y dice que la igualdad anterior se mantiene aún si se 
usan tiempos de paro. 
Teorema 2.:3.4_ Suponga que { Mt}, tE [O, oo], es una supermartingala continua por la derecha 
(resp. submartingala) con respecto a la filtración {Ft}. Si S y T son dos Ft tiempos de paro 
tal que S :'.S T a.s, entonces 
E [Mr J Fs] < Ms a.s. 
(resp., E [Mr I Fs] > Ms a.s.) 
Corolario 2.:J.5 En particular, si {Mt}, t E [O, oo] es una martingala continua por la derecha 
y S, T son Ft tiempos de paro con S :'.S T, entonces 
E [Mr J Fs] = Ms a.s. 
Observación 2.3.6. Note que si T es cualquier Ft tiempo de paro, entonces 
[ 
E[E[Mr J Fs]] = EMs l 
E [Mr] = E [Ms] = EMo a.s 
E[Mr] =EMs 
Otra consecuencia del teorema de Óptimo es el siguiente, nombrando, x+ = max { x, O} , 
37 
x- =max{-x,O}. 
Teorema 2.3.7 Suponga que Xt, t E [O, oo], es una supermartingala.Entonces, para cada 
a~ O, 
aP{(inf Xt) ~-a}~ supE(X¡) 
t t 
Demostración. 
Escribamos 
S(w) = inf {t: Xt(w) ~ -a} 
y 
Usando el teorema de detención óptima 2.3.4., 
Por tanto, 
E[Xt] = 
{
inf 
B:',t 
J 
Xs>o} 
(St ~ t) 
( 
E[XtJFs1]~Xst l 
E [E [Xt J Fstl] ~ E [Xsc] 
E[Xt] ~ E[Xs1 ] 
Xt dP + f 
{ !~~Xs~-o} 
J Xt dP+ (-a)P{(inf X 8 ) ~ -a} 
ü~~Xs>-o} 
38 
es decir: 
aP {inf Xs :'.S -a} :'.SE [-Xt] + J:{. r x >- } XtdP 
~t ~t 8 Q 
E[Xt] :'.S-aP{(infXs) :'.S-a}+ Í{inf Xs>-a}XtdP 
sst s~t 
a.P{.(inf Xs) :'.S -a.} :'.S E[-Xt] + Í{inf Xs>-a} XtdP 
sst •St 
= E [-Xt] - J -XtdP 
{ !~t; X s>-a} 
J -XtdP+ I -XtdP- I -XtdP 
{ inf X,>-a} s~t ü~rtx.s-a} ü~~X,>-a} 
39 
::; E(X¡):::; sup(EX¡) 
t 
Ieorema 2.3.8. Suponga que {Xt}, t E [O, ooj, es una martingala. Entonces, para cada 
a 2: O, 
aP{sup I Xt l:S a} :S sup IIXtll1 
t t 
Demostración. 
De la desigualdad de Jensen, si X es martingala y f (x) =I x I es convexa entonces I Xt I es 
submartingala, y Yi = - 1 Xt I es supermartingala (negativa). Además (Yi :::; O), 
IIYill1 = IIXtll1 = E [Yi] 
También, 
{inf}í :$-a}= {sup IXtl 2: a}= {- sup(-Yi) :::; -a}= {sup(-Yi) 2: a}= {sup IXtl 2: a} 
t t t t t 
del teorema 2.3.7, 
aP{(sup IXtl) 2: a}= aP{(inf Xt):::; -a}:$ supE(X¡) 
t t t 
con 
40 
aP{(sup IXtl) ~a}~ sup 11 Xt 111 
t t 
q.e.d 
AuLe:s de probar la desigualdad de Doob en [}' establecemos el siguiente resultado. 
Teorema 2.3.9 Suponga que X y Y son dos v.a positivas definidas en el espacio de proba-
bilidad (11, F, P) tal que X E LP para algún p, 1 <p < oo, y para todo a> O, 
Entonces 
donde 
Demostración. 
aP({Y ~a})~ J XdP 
{Y~a} 
11 Y 11 P ~ q 11 X 11 P 
1 1 
-+-=1 
p q 
Sea F().) = P ( {Y > >.}) la función de distribución de Y. Entonces, usando inte-
gración por partes, 
E[YP] = -f0 xpdF(>.) = fo F(>.)- h~oo [xPF(>.)] 18~ fo (>.- 1 f sdP) d(>.P) 
{Y~,\} 
Por el teorema de Fubini se puede intercambiar el orden de la integración. 
41 
Es decir, llegamos a 
= pE [x yP-i] = _:p_E [XYP- 1] 
p-1 p-1 
:'.S; q 11 X IIPII yP-l llq (Desigualdad de Holder) 
E (yP) :s; q 11 X IIPII yp-l llq 
1 
E [YP] < q 11 X IIP ([EYpq-q]) ;¡ 
1 1 - +- 1 
p q 
'P'l + pq = 'P'l 
p q 
(p- l)q = p pq-q=p 
42 
l 
= ( E [ yCP-1 )q] ) q 
Si E [YPJ es finita y i= O 
1 
[E [YP]l ¡; :S q 11 X llr 
Si 11 Y llr es infinito, considere 
Yn = Y /\ R, R E N 
Entonces Yn E LP. 
Por tanto, 
43 
Haciendo R ----t oo, Yn ----t Y y 
q.e.d 
Teorema 2.3.10. Supongamos que {Xt}, t E [O, oo], es una submartingala positiva continua 
por la derecha. Escribamos X*(w) = supXt(w). Entonces, para 1 :::;; p:::;; oo, X E IJ' si y sólo si 
t 
sup IIXtllP < oo 
t 
También, para 1 < p < oo y q- 1 = 1 - p- 1, IIX*IIP S qsup IIXtllP· 
t 
Demostración. 
Cuando p = oo la primera parte del teorema es inmediata pues si sup IIXtlloo = B < oo 
t 
entonces O:::;; Xt :::;; B a.s. para toda 
t E [O, oo] . (La continuidad por la derecha es requerida para asegurar que existe un conjunto 
de medidad cero fuera del cual esta desigualdad es satisfecha para toda t). También, para 
1 < p < oo,si X* E LP 
es decir, sup IIXtllP < oo. Las variables aleatorias {Xt} son uniformemente integrables, así que 
t 
de los corolarios (3.18) y (3.19) de Elliot (1982) 
44 
lim Xt(w) 
t---+ 00 
X 00 (w) existe a.s. 
Usandoel lema de Fatou, O::; E [Iimtxr] ::; liminftE [xf]::; suptE [xf] < oo 
Por tanto, X 00 E L 1' y IIXcx>f/p::; supt /[Xt[[p 
Escribamos Xt(w) = sup8 ::;p X8 (w). Entonces {-Xt} es una supermartingala así que de la 
desigualdad del teorema 2.3.7, para a > O, 
aP{ u~rt (-Xs))::; -a}= aP({Xt 2: a}) 
11 
aP{ - inf8 9 (-X8 )} 2: a = aP{ SUP8 ::;t X 8 2: a} 
= aP{Xt 2: a} 
aP ( {infs~t (-X.9) ::; -a}) ::; Í{infs<i(-X.)~-o} XtdP = J{ } XtdP 
- - inf(-X.)2n 
•St 
f XtdP = f XtdP ::; f XtdP 
{
supX.2a} {x;2a} {x;2a} 
s:St 
Haciendo que t---+ oo, tenemos para toda a > O, 
aP ( {X* 2: a}) ::; .! X 00dP 
{X•2a} 
Por lo tanto, del teorema 2.3.9 con Y= X* y X= X 00 obtenemos: 
JIX*Jlp::; qJIXoolJ P 
q.e.d. 
Si p = q = 2 y el intervalo de tiempo es [O, T], tenemos Corolario 2.3.11 (Desigualdad de 
Doob). Supongamos que { Mt} , t 2: O es una martingala continua. Entonces 
45 
- -
E l. sup I Mt 12J. ~ 4E [1 Mr 12] 
O'.::,t~T 
iiecuerde, de lo anterior, 
E [ sup I M 12J 
O~t~T t 
q.e.d 
4.Integrales Estocásticas. 
Trabajaremos en el intervalo [O, TJ. Supongamos que {Wt} es un movimiento Browniano 
{ Ft} medible definido en (D., F, P) para t E [O, T]; es decir, W es adaptado a la filtración { Ft} . 
Definición 2.4.1.Un proceso simple (real valuado) en el intervalo [O, T] es una función H 
para la cual 
(a) Existe una participación O= to < t¡ < ... < tn = T 
(b) H(to) = Ho(w) y H(t) = Hi(w) para t E]t1, ti+ 1], donde Hi(-) 
es Fti medible. 
Es decir, 
n-l 
Ht = Ho(w) + E Hi(w)l¡ ti,ti+IJ 
46 
~==u 
D<:>finición 2.4.2. Si H es un proceso simple, la integral estocástica de H con respecto al 
movimiento Browniano {Wt} es el proceso definido para t E]tR,tn11 ] como 
lo anterior puede ser escrito como una transformación martingala 
Notación: fó H dW = fó HsdWs 
Observación. Debido a que Wo = O, no existe contribución a la integral en t = O. 
Teorema 2.4.3. Suponga que H es un proceso simple. Entonces, 
a) ( [ H8 dW~) es una Ft - martingala continua. 
b) E [ (JJ H,9dW9) 2] = E [JJ H,;ds] 
e) E [o~~~T I fóHsdWs 12] S 4E [JJ' H;ds] 
Demostración 
a) Para t E]tR, tR---'-ll 
¡t I: . Jo H.9dW~ = OS i SR_ l H1, (Wti - Wti) + HR(Wt - WtR) 
Como Wt(,) es continua a.s en t, antonces, ¡t H sdW s es continua a.s en t. 
lo
t I: 
Supongamos que OS s S t S T. Recuerde que HsdWs = 
0 
< . < Hi(Wti+l/\t - l-ViiM) o _ i _ n 
donde Hi es Fti medí ble. 
Ahora, si s S ti, 
E [Hi (Wti+lVt - wti/\t) 1 Fs] 
= E [E [Hi (Wti+l/\t - Wti/\t) \ Fti] \ Fs] 
= E [HiE [Wt.it. 1/\tWi.i/\t \ Fr,J I Fs] 
= E [HiE [Wti+I - Wt; 1 Fs]] = O 
= E[HiE[Wt - Wti I Ft.J I Fs] = O 
También, Hi es Ft; medible y Wt;.¡¡/\t - Wt;/\t es independiente de Fti 
Propiedad ( C) 
47 
• u 
• u 
1:¡, ... ... 
ir;::;,. 
U) 
LLI 
1--....... 
li ~ ti+l, lVii+ 1 - Wt; es independiente de {FtJ 
Si t ~ ti+1 ==} t ~ ti 
Si ti+l ~ t y t ~ ti, pues Wt - Wt; es Ft; medible 
Si ti+l ~ t y ti ~ t,entonces 
E[Wti+1 /\ t - Wt /\ t] = O 
y por otro lado Hi (Wt;+iAs - Wt;As) = O 
Sis~ ti 
Consecuentemente, para s :S: t 
= E [Mt I Fs] = Ms 
E [ (fot HsdWs) 1 Fs] = (los H dW t 
y por lo tanto (fot H dW) t es una martingala continua. 
(b) Ahora suponga i < j, de tal manera que 1 + i :S: j. 
Entonces, 
E [ HiHJ (TVti+ 1At - WtiAt) ( WtJ +-1At - Wti At)] 
= E [E [HiHj (Wt;+1At - Wt;At) (Wtj+1At - WtjAt) 1 Ftj]] 
= E [HiHjE [(Wt;+1At - WtiAt) (Wtj+1At - WtjAt) 1 Ftj]] 
a lo más Fti-t--l :S: Fj medible 
= E [HiHj (Wt;+1At - WtiAt) E [(Wt;+1At - WtjAt) 1 Ftj]] 
independiente 
= E [HiHj (Wt;+1At - Wt;At) E [Wtj+1At - WtjAtl] 
=0 
También 
E [Hl (Wt;+1/\t - WtiAt)
2
] = 
E [ H¡ E [ (Wti+¡At - WtiAt) 
2 
1 Ft;]] 
11 
o 
48 
= .B [H/ (ti+l 1, t - ti 1, t)] 
Cons0r_·1.1entemente, 
E [ (fot HdW) t2] = E 0-::o~nE [H¡ (ti+1 I\ t - ti/\ t)] 
= E [fot H;ds] = fot E [H;] ds 
(e) Aplicamos la desigualdad Máxima! de Dobb a la martingala. 
q.e.d 
Notación 2.4.4.Escribimos L 2 (D x [O, TI) como H, para el espacio de procesos adaptados a 
{F,) que satisfacen E [hT Hs2ds] < oo. 
Lema 2.4.5. Supongamos que {Hs} C H. Entonces existe una sucesión {E:} de procesos 
simples tales que 
lim E [J I H 8 - H.~ 12 ds] = O 
n -----, oo O 
Demostración. 
Sea JE H, y definamos una sucesión de funciones simples que convergen a f poniendo 
fn(t, w) = n 1R/n J(s, w)ds si 
(R-1)/n 
R R+l 
tE[-,---
n n 
Si la integral diverge, reemplicese por cero. Por el teorema de Fubini, esto solamente sucede en 
un conjunto nulo en n, puesto que f es integrable en T x D. Note que como variable aleatoria, 
la integral es Fú¡n - medible, así que f n es un proceso simple. 
T 
A continuación se muestra que siempre que y fo I fn (t, w)- f (t, w) 12 dt converge a cero 
siempre que f (·, w) E L 2 [O, T] y también que pra toda tal w En, 
49 
/,TI fn(t,w)l 2 dt:c; {Tlf(t,w)l 2 dt 
.o lo 
Por tanto, por el teorema de convergencia dominada se concluye que 
E [{TI fn - J 12 dtl ------, O cuando n------, oo 
.fo J 
[Teorema de convergencia dominada. Si f n ------, f a.e. [¡t] y existe g tal que \ f n \:.:; g 
a.e.[µ] para toda n y f gdµ < oo, entonces f fndµ------, f fdµJ. 
Por tanto, la pnrnha se rncl11ce a un prohli~ma en T,2 [O, T] , q11e es mostrar qne si f E J} [O, T] 
!
Rh 
esta foja, entonces cuando h l O, Íh definida como (O< h < 1) : fh(t) = (1/h) f(s)ds 
J(R-l)h 
si t E [Rh, (r + 1) h /\ h- 1] y como J1i(t) = O si t ~ [h, h-1 ), permanece dominada en L 2 por f 
y converge a f en la norma L 2 . 
Para probar esto, primero considere el siguiente estimador ( el cual es exacto si (T / h i E 
N o T=oo) 
([T / h] = el entero mayor no superior a T /h.) 
(a) Si [T/h] = T 
T/h ;;Rh T ÍRh L I f(s)ds 12= L I 
R:l (R-I)h R=I (R-I)h l
h 
f(s)ds 12=1 f(s)ds 12 -1 
o 1
2h 
( 
\ ¡2 
h f s1ds I 
Th 
+ ... + 1 r f(s)ds 12 y se tiene (*) 
lcr-1)1i 
(b) Si [T / h] > T, T / h > T se tiene (*) , pues tenccmos más sumandos que antc'S. 
Ahora aplicanos la desigualdad de Schwarz, aplicada a 1 · f 
I J/f-l)h f(s) · lds 1 :.:; J/Jt-I)h I f(s) · 1 1 ds 
50 
~ ( J(i~l)h lf(s)l 2 ds ) ,¡.,; 
( ) 
1/2 
= \ Ici~1)h lf(s)/ 2 ds / 
J/l-l)h !J(s)j < 
rRh -r( )d < 
J(H-l)h J 8 s 
Í(i~l)h f(s)ds 1
2 
< 
1 
Entonces cada término de 
( J(i~l)h 111 2 ds ) l/
2 
r 1
1/2 
" Rh - (R - l)h J 
1/2 
( J(!~1)1t !J(s)!2 ) h1/2 
( )
1~ 
J(i~l)h JJ(s)J2 ds hl/2 
IT/hj 2 
n"i:,
1 
jJ(i~l)h J(s)dsj está acotado por por arriba con h fci~l)h f 2(s)ds; 
Por tanto, la suma total está acotada por 
T/h: fT/h1 T/h] 
' '1 Rh ¡2 ' ' Rh I Rh 2 [T/h]·h 2 
,~ fcR-l)h J(s)ds ~ ,~, h fcR-l)h f(s)ds ~ h ¿ fcR-l)h f (s)ds = h fo f (s)ds 
n-1 n- , R----1 
h ¡{/h]-tT J2(s)ds 
Si O< h ~ 1, lo anterior es ~ J:[ J2 (s)ds. De f'..ata manera, 
T T 
fo Jfn(s)l2 ds = fo 11' {T 2 fn 2(s)ds ~ h J2(s)ds = In jJ2 (t, w)j dt O vO 
y esto prueba dominación. 
Pata probar convérgénda, consideré E> O y noté que si f es una función escalón, J1i ----+ J 
cuando h tiende a cero ( por la derecha). Como las funciones escalonadas son densas en L2 [O, TI, 
existe una función escalonada JE cuya distancia a fes menor que E. Es decir, 
[Jl lf(s) - JE(s)J2 ds] 112 = 11 f - JEIJ <E 
Ahora bien, Íh es también una función escalonada, por la forma en que se definió, y también 
exi::;te uua función e::;caluuada f~ tal qur ::;u di::;tancia a fn es menor que E. A<lemá::;, 
1 ¡Rh 1 [Rh 
Íh - f¡ = -
1 
_ f(s)ds - -
1 
JE(s)ds 
1 (R-l)h l .• (R-l)h 
51 
< 
es decir, 
además, 
Por tanto, 
llfh - ffll = 11 (!- jE)h 11 = [! [(!- fEhJ2] l/2 
:::; [J (!- JE)2 ds] 112 = 11/- JEII 
Pero IIJ: - JEII ~O y 211/- J:11 < 2 E. Así que 
Íh -¡;;¡ 
q.e.d. 
Teorema 2.4.6. Suponga que {Wt}, t 2: O es un movimiento Browmiano sobre la filtración 
{ Ft} .Entonces existe un único 
mapeo lineal de H al espacio de martingalas Ft- continuas sobre [O, T] tal que 
a) Si Hes un proceso simple en H, entonces 
52 
b) Si t -:5:_ T, 
La identidad ( b) es llamada la propiedad de isometría de la integral. 
Demostración. 
Para H simple, uno define I(H)t = Ji H.~dW8 • 
Supongamos que H E H y { Hn} es una sucesiónde procesos simples que convergen a H. 
1 (w+p - W)t = fot (w+p - W)dWt 
y de la desigualdad de Doob, Corolario 2.3.11 
E [o~~~T II(Hn-fp - Hn)i] 
-:5:. 4E [Ji IHsn+p - Hsnl 2 ds] 
Consecuentemente, existe una subsucesión HRn tal que 
a.s., la sucesión de funciones continuas I ( HRn) , O -:5:_ t -:5:_ T ,es uniformemente convergente en 
[O, T] y converge a una función I (H)t· Si p --+ oo vemos que E [t~; II (H)t - I (Hn)ti2] -:5:. 
4E [JJ IHs - Hsnl 2 ds] .Esto implica que I (H) es independiente de la sucesión que trabajemos 
(Hn), (unicidad). 
Ahora, 
(Por ser martingala con las simples). 
Las variables aleatorias 
53 
{ I ( Hn) , I ( H)} pertenecen a L:t(n, F, P) 
y- entonces 
!!E (I (H)t I Fs) - I(H)sll2 
:::; IIE [J(H)t I Fs] - E [J (Hn)t I Fs] IJ2 
IIE [J (Hn)t I Fs] - I (Hn)8 112 
+JJI (Hn)s - I(H)8ll2 
El lado derecho se puede hacer arbitrariamente pequeño, así que 1 (Ht) es una Ft -martingala. 
b) Por la densidad en H de los procesos simples y su continuidad. 
Notación 2.4.7. Escribimos 
for HEH 
Teorema 2.4.8. Para H E H 
a) E [ o~~~T [JJ HsdWs¡2] :::; 4E [JJ 1Hsl2] ds 
b) Si T es un Ft tiempo de detención tal que T :::; T, 
Demostración. 
a) Sabemos que 
Tomando límites 
54 
También 
Tornando límites, se tiene lo pedido. 
(b) Supongamos que T es un tiempo de definición de la forma T 
Ai n A1 = 0 para i =I- j y A E Fi. Entonces 
JJ I{s > r}HsdWs = J;[ (i::;~nIAJs>ti) HsdWs 
L lA; ti,donde 
l'.Si:Sn 
Ahora, para cada i el proceso I 8 > ti· IA 1 • H 8 es adaptado y en H; es cero si s S ti e igual 
a IAiHs en otro caso. Por tanto, 
T( L ·) - L T - T fo l'.Si'.Sn lAJs>ti HsdWs - l'.Si:Sn IAi Íti HsdWs - Ír HsdWs 
Consecuentemente, para T de la forma T = ¿ IA; ti, 
1'.Si'.Sn 
Ahora, un tiempo de detención cualquiera puede ser aproximado por una sucesión decreciente 
de tiempos de paro Tn donde 
así que lim Tn = T a.s. 
n---+oo 
Consecuentemente, debido a que (H.W)t es a.s continua en t,(teorema 2.3.6), 
a.s 
También 
55 
E [lf I {s $ r) H,dW, - f I {s $ Tn) H,dW,n 
E [lf {I {s $ r} -I {s $ rn))H,dW,I'] 
y esto converge a cero por el teorema de convergencia dominada. Por tanto, 
converge a.s y en L2 (0); el resultado se sigue: 
q.e.d. 
[Teorema de convergencia dominada: 
If fn - f a.e. [M] ,Y existe g tal que lfnl ::; g 
entonces J f ndµ - J f dµ.] 
a.e. [M] para toda n y J gdµ. < oo, 
lim f7 Hs2ds - O a.c. 
n- 00 }Tn 
56 
•F 
< Í Htids 
.fo 
~ '1' 
Notación 2.4.9. Escribamos H = { { Hs} : Hes Ft adaptada y fo H s2ds < oo a.s} 
delinición anterior y resultados por la integral estocástica puede ser extendidos de H a H. 
Teorema 2.4.10. Existe un único mapeo lineal f de H en el espacio de procesos continuos 
definidos en [O.T] tal que 
a) Si {Ht}, O~ t ~ T, esta en H, entonces para toda t E [O, T] el proceso Í(H)t y I(H)t 
son indistinguibles. 
b) Si { Hn} , n ~ O, es una sucesión en H tal que JJ' ( Hn s) ds converge a cero en probabilidad, 
entonces 
converge a cero en probabilidad. 
Notación 2.4.11 I(H)t = J¿ H.~dWs 
Demostración. 
a) Sabemos que para HE H, I (H) está definida. Supongamos que HE H. Definamos 
(Tn =T si este conjunto es vacío) 
Debido a que H 8 es adaptado, J¿ Hs2ds es adaptado (la información hasta ten la integral) 
y Tn es un Ft tiempo de detención. Escribamos 
Ir;'= I {s < Tn} H.~ 
Los procesos Hn están , por tanto, en H 
57 
H;• = 1 { s < Tn} Hs 
E [JJ (Hsn)2 ds] = E [JJ I {s < Tn} Hs2ds] 
Dado n fijo, 
f8 2 E JO H s d8 ::; n 
Los procesos Hn, están, por tanto, en H y 
T1 ::; T2 ::; T3 ::; . . . ::; T 
JJ HsndWs = JJ I {s < Tn} HsdWs = 
I { s < Tn+1} • I { s :S: Tn} = I { s :S: Tn} 
= JJ I {s :S: Tn} HsdWs 
= J¿ l {s::; Tn} l {s < Tn+i} HsdWs 
i 
Teorema 2.4.8 
Por tanto en el conjunto {J[ H~du < n} para toda t ::; T, 
Ahora, 
U { J{ Hu2du < n } = { J{ Hu2du < oo } 
n 2: O 
58 
Por tanto, uno puede definir i ( H)t como 
I(H)t = I(Ir)t soáre { J[ H82ds < n } 
Entonces se tiene que 
I (H)t = I(H)t y es 
continua a.8 
{ Sólo hay que ir escogiendo { J[ Hs2ds < n} para cada n } 
( b) Escribamos 
Entonces 
Sea 
I = J[ Hu2du, 
B={12t} 
A = { w : o~;~T I J(H)tj 2 E } 
P(A) = P(A n B) + P(A n Be) 
::; P(B) + P(A n Be). Por tanto para todo E> O, 
P ( 0~;~T li(H)tl 2 E) :S: P (I[ Hu2du 211) 
Tn = inf { s::; T: Jt Hu2du 2 11 } 
(Tn = T si este conjunto es vacío) 
Sobre el conjunto { J[ Hu2du < 11 } 
59 
Ji HsdWs = Ji I (s ~ TN) HsdWs --...-
u:S 
Gs = H8 I { s :S TN} , 
Gs = H 8 en ne y de la desigualdad de Doob., 
E [ 0~~
1
~r JJ; GsdWsJ2] 
:S 4E [J[(Gs}2ds] :Si 
Usando la desigualdad de Chebyschev 
P(AnBc) =P({Bc}n{ 0~~~rli(H)tl ~E}) 
:S P ( 0~~~T IY (G)tl ~ E) 
~ E [ 0~~~T IJ[ GsdWsJ2] /E2 
:S 4/ (NE2 ) 
Consecuentemente, 
+4/NE2 
Podemos, por tanto, ver que se { Hn} es una sucesión en fi tal que J[ ( Hn)du converge a cero 
en probabilidad (*) entonces 0~~~T II (H)tl converge a cero en probabilidad. La continuidad 
del operador I es establecida entonces: 
O < li(H)tl :S sup li(H)tl 
Esto implica que !(H)t ----+ O 
~ T 2 
si H E H entonces, con H;, = I { s < Tn} Hs vemos que fo ( H 8 - H sn) ds converge a cero a 
60 
probabilidad. Usando la propiedad de contimido i está definida de manera única. Análogicamente, 
si H, K, E fi, suponga que tenemos las sucesiones que aproxima Hn, Kn E H. Ahora 
y 
mnverge a cero a probabilidad cuando n -----too. Más aún: I (a.Hn+/3Kn)t = al(H11 )t+ 
(31 (Kn)t ,sin-----+ oo, par tanto J es lineal. 
5.El Cálculo de Ita. 
Si J (t) es una función real valuada, diferenciable para t ~ O y J(O) = O, entonces 
f(t) 2 = 2 fot f(s)f(s)ds 
= 2 foT f(s)df(s) 
Sin embargo, si W es un movimiento Browmiano, sabemos que E [lV{l] = t. Consecuente--
mente, W? no puede ser igual a 2 J¿' W 8 dW'I debido a que esta integral es una martingala local 
y E [ 2 fc'{ W'ldWs] = O. El cálculo de Ito esta hecho para la clase de procesos conocidos de Ito, 
el cual definimos a continuación. 
Definición 2.5.l.Suponga que (O, F, P) es un espacio de probabilidad con una filtración 
{Ft}, t ~ O, y {Wt} es un Ft movimiento Browmiano estándar. Un proceso real de !to {Xt}, t ~ 
O, es un proceso de la forma 
donde 
(a) Xo es Fo-medible 
(h) K y H son adaptados a Ft, y 
(c) J[ IKsl ds < oo a.s y J:[ 1Hs21 ds < oo a.s 
61 
.uefinición 2.5.2.Suponga que tenemos un espacio de probabilidad (f!, F, P) con una filtración 
{ Ft} , t ~ O. Un movimiento Browmiano m- dimensional es un proceso, Wt = (W ti, lV t2 , ... , lV tm) 
cuyos componentes Wti son estándar, independientes. 
Definición 2.5.3.{Xt}, O :S t :S T, es un proceso de Ito si 
. T 
donde K y Ir son adaptadas a {Ft}, fo IKsl ds < oo a.s. y para toda 
i, 1 :Si :S m, 
{T 2 
Jo IH!I ds < oo a.s. 
Un proceso de Ito de dimensión n es entonces un proceso Xt 
componente es un proceso de I to. 
(Xt1, ... , X'["), donde cada 
Teorema 2.5.4. Suponga que Xt = (X{, ... , X'[") es un proceso n- dimensional de Ito con 
y suponga que f : [O, T] x Rn ~ R está en ci,2 ( una vez continuamente diferenciales en t y 2 
en x E Rn). Entonces, 
f (t, Xf, ... , Xf) = f (O, XJ, ... , X{j) + J¿ * (s, X.!, ... , x:;) ds 
~ rt !!l. ( xi xn) dXi i ~ rt ___.ff!__L ( xi xn) d Xi XJ > + _L., JO &xi s, s, · · · • s s+2 _L., JO 8x;8xj s, s' · · ·' s < ' s 
z=i z=i 
i=l 
Aquí, 
. . m . 
dX1 = K 1 ds + " HJ,r ds 8 8 L., S 
j=i 
y 
62 
• • 'jrJ, • • 
d < xi XJ > = """' JI':.,r HJ,r ds 
l 8 L., 8 8 
r=l 
Observación. 2.5.5. Por componentes 
Se puede mostrar que para particiones 
Converge en probabilidad a 
m 
JJ L H/1'" HB qr ds 
r=l 
Este procesos es la covarianza de XP y yq y se denota ( X P, Xq) t = r~l JJ H8 pr H8 qr ds. 
( X P, Xq) es simétrica y bilineal como función de procesos de I to. 
Tomando 
y 
t m . . 
Xt =X+ fo K8ds + L Hidw¡ 
j=l 
vemos que {X, Y) t = O. 
Más aún, 
y 
63 
Observación 2.5.6 Si 
donde H, K son adaptados, J[ IKsl < oo a.s. y J{ H 8 2 ds < a.s. la regla de diferenciación, 
f(Xt) = f(Xo) + JJ ~(Xs)Ksds + JJ f/x(Xs)H.~dM.~ + ~ JJ f/z(Xs)H;d (M)s 
TEOREMA DE GIRSANOV

Continuar navegando

Materiales relacionados

17 pag.
Tema2

User badge image

Materiales Generales

16 pag.
SEMI_15_7_21

ESTÁCIO

User badge image

Raul Villalba