Logo Studenta

Optimización Multivariable

¡Este material tiene más páginas!

Vista previa del material en texto

DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
1 
 
 
 
 
 
Optimización Multivariable 
Máximos, Mínimos y Puntos Silla 
Aprende cómo se ven los máximos/mínimos locales en una 
función multivariable. 
¿Qué vamos a construir? 
COMPESP N° 01 
Describe con rigor científico 
los conceptos preliminares 
de la Optimización 
Multivariable. 
ACTIVIDAD N° 01 
 
Estudie la siguiente información sobre 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
2 
➢ Intuitivamente, cuando piensas en términos de gráficas, 
los máximos locales de funciones multivariables son picos, 
al igual que con las funciones de una sola variable. 
➢ El gradiente de una función multivariable en un punto 
máximo será el vector cero, que corresponde al lugar en 
el que la gráfica tiene un plano tangente horizontal. 
➢ Formalmente hablando, un punto máximo local es un 
punto en el espacio de entrada tal que todas las otras 
entradas en una pequeña región cerca de ese punto 
producen valores más pequeños cuando se introducen en 
la función multivariable f. 
 
Una observación sobre Planos 
e Hiperplanos 
 
 
En general, la gráfica de una función de n variables existe en 
un espacio de dimensión (n+1), y su tangente es un espacio 
de dimensión n. 
Por ejemplo, la gráfica de la función de una variable es 
bidimensional, y su tangente es una recta unidimensional; la 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
3 
gráfica de una función de dos variables es tridimensional, y su 
tangente es un plano bidimensional. 
Para funciones de tres o más variables, la tangente ya no será 
un plano, que es necesariamente bidimensional. 
El término formal para un subespacio que tiene una dimensión 
menos que el espacio ambiente es hiperplano. Así que, 
formalmente, el gradiente de una función multivariable 
corresponde a un hiperplano tangente. 
Seguiremos llamando plano a la tangente, pues todos nuestros 
ejemplos utilizan funciones de dos variables. Sin embargo, es 
importante recordar que hablamos formalmente de 
hiperplanos. 
 
Optimizar en dimensiones superiores 
Una de las aplicaciones más importantes del cálculo es su 
utilidad para permitirnos encontrar el máximo o el mínimo de 
una función. 
➢ Imagínate que terminas siendo el jefe de una empresa, y 
que se te ha ocurrido que cierta función puede modelar 
cuánto dinero esperas ganar con base en un número de 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
4 
parámetros tales como los salarios de los empleados, el 
costo de las materias primas, etc., y quieres encontrar la 
combinación correcta de los recursos que maximiza tus 
ingresos. 
➢ Quizás estás diseñando un prototipo innovador de puente 
para transporte de carga pesada con la esperanza de 
hacerlo más eficiente y se te ocurra una función que 
modele las estructuras, resistencia de los materiales, 
topografía, hidrología e hidráulica en función de muchos 
parámetros que definan dicho diseño, y quieras encontrar 
la forma que maximice la resistencia total. 
➢ En aprendizaje automático e inteligencia artificial, la 
manera en la que una computadora "aprende" a hacer algo 
es usualmente al minimizar alguna "función de costo" que 
el programador ha especificado. 
Máximos y Mínimos locales, Visualmente 
Vamos a empezar por pensar en funciones multivariables que 
podamos graficar; aquellas con una entrada de dos 
dimensiones y una salida escalar. Como, por ejemplo: 
 ( ) ( )
2 2
( , ) cos cos x yf x y x y e− −= 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
5 
Elegimos esta función ya que tiene un montón de pequeñas 
protuberancias y picos. Llamamos a uno de estos picos 
un máximo local. 
 
PICOS 
➢ Al punto ( )0 0,x y por debajo de un pico en el espacio de 
entrada (que en este caso se refiere al plano xy se le llama 
un punto máximo local. 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
6 
➢ La salida de una función en un punto máximo local, que 
se puede visualizar como la altura de la gráfica por encima 
de ese punto, es en sí el máximo local. 
La palabra "local" se utiliza para distinguirlo del máximo 
global de la función, que es el único mayor valor que la 
función puede alcanzar. Si estás en la cima de una montaña, 
es un máximo local, pero a menos que la montaña sea el 
Monte Everest, no es un pico máximo global. 
Al final de daremos la definición formal de un punto máximo 
local. Intuitivamente, es un punto especial en el espacio de 
entrada donde si nos desplazamos un poco en cualquier 
dirección, el valor de la función solo puede disminuir. 
Del mismo modo, si la gráfica tiene un pico invertido en un 
punto, decimos que la función tiene un punto mínimo 
local en el valor (x, y), por arriba o por debajo de este punto 
en el plano xy , y el valor de la función en este punto es 
un mínimo local. Intuitivamente, estos son puntos donde al 
movernos un poco en cualquier dirección el valor de la función 
solo puede aumentar. 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
7 
 
VALLES 
 
Puntos críticos en una sola variable 
 (repaso) 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
8 
 
LAS RECTAS TANGENTES EN EXTREMOS LOCALES TIENEN PENDIENTE 0 
 
Puede ser que recuerdes la idea de máximos/mínimos locales 
en el cálculo de una variable, donde ves muchos problemas 
como este: 
Verificación de conceptos ¿Para qué valor x el valor de la 
función ( )
2
( ) 2 5f x x= − − + es el más grande? ¿Cuál es el valor 
máximo? 
Explicación 
La tangente en cualquier máximo local tendrá una pendiente 
de 0, por eso buscamos puntos donde '( ) 0f x = : 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
9 
( )'( ) 2 2 0f x x= − − = . 
En este caso, la única solución es 2x = , en este punto f
tiene el valor: 
( )
2
(2) 2 2 5 5f = − − + = 
Para comprobar que esto es realmente un máximo y no un 
mínimo o un punto de inflexión, se tomas la segunda derivada 
confirmas que es negativa en el punto 2x = − . 
En general, los máximos y mínimos locales de una función f 
se estudian al examinar los valores de entrada a para los 
cuales '( ) 0f a = . Esto es porque siempre que la función sea 
continua y diferenciable, la recta tangente en cimas y valles 
se hará horizontal, es decir tendrá pendiente 0 . 
Uno de esos puntos a tiene diversos nombres: 
➢ Punto crítico 
➢ Punto estable 
➢ Punto estacionario 
'( ) 0f a = 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
10 
El requisito de que f sea continua y diferenciable es 
importante, pues si no fuera continua, un punto solitario de 
discontinuidad podría ser un máximo local: 
 
Y si f fuera continua pero no diferenciable, un máximo local 
se podría ver así: 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
11 
 
 
En cualquier caso, hablar de rectas tangentes en estos 
máximos no tiene sentido, ¿o sí? 
Sin embargo, aun cuando f sea continua y diferenciable, no 
es suficiente que la derivada sea 0 , pues esto también sucede 
en los puntos de inflexión: 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
12 
 
 
Esto significa que encontrar puntos críticos es una buenamanera de empezar la búsqueda de un máximo, pero no es 
necesariamente el final. 
Puntos críticos en dos variables 
La historia para funciones multivariables es muy similar. 
Cuando la función es continua y diferenciable, en un máximo 
o en un mínimo todas las derivadas parciales son cero 0 . 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
13 
0 0
0 0
( , ,...) 0
( , ,...) 0
........................
x
y
f x y
f x y
=
=
 
Respecto a la gráfica de una función, esto significa que su 
plano tangente será horizontal en un máximo o mínimo local. 
Por ejemplo, aquí hay una gráfica con muchos extremos 
locales y planos tangentes horizontales en cada uno: 
[Video: Planos tangentes Horizontales] 
 
Decir que todas las derivadas parciales son cero en un punto 
es lo mismo que decir que el gradiente en ese punto es el 
vector cero: 
https://es.khanacademy.org/math/multivariable-calculus/applications-of-multivariable-derivatives/optimizing-multivariable-functions/a/partial-derivatives-and-the-gradient/a/the-gradient
https://www.youtube.com/embed/sIqqYOQz920?feature=oembed
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
14 
0 0
0 0 0 0
( , ,...) 0
( , ,...) ( , ,...) 0
..... ...
x
y
f x y
f x y f x y
   
   
 = =
   
      
 
A menudo esta relación se escribe de manera compacta así: 
0( ) 0f x = 
La entrada 0x toma los mismos nombres que en el caso de una 
sola variable: 
➢ Punto crítico 
➢ Punto estable 
➢ Punto estacionario 
 
El pensamiento detrás de las palabras “estable” y 
“estacionario” es que cuando te mueves un poco cerca de 
este punto, el valor de la función no cambia 
significativamente. La palabra “crítico” suena un poco 
dramática, como si la función estuviera cerca de morir en esos 
puntos. 
Pero, no es suficiente que el gradiente sea cero para 
garantizar que un punto sea un máximo o mínimo local. Para 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
15 
empezar, puedes tener también algo similar a un punto de 
inflexión: 
 
[Imagen: Punto de inflexión en 3D] 
 
PUNTO DE INFLEXIÓN EN TRES DIMENSIONES 
Pero también hay una posibilidad totalmente nueva, exclusiva 
de las funciones multivariables. 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
16 
[Puntos silla] 
Considera la función ( ) 2 2,f x y x y= − . Hagamos algunas 
observaciones de lo que sucede alrededor del origen ( )0,0 . 
➢ Ambas derivadas son 0 en este punto: 
( ) ( )
( ) ( )
2 2
2 2
2 2 0 0
2 2 0 0
x y x
x
x y y
y

− = → =


− = − → − =

 
Por lo tanto ( )0,0 es un punto crítico. 
➢ Cuando te mueves en la dirección x alrededor de este 
punto, la función se ve ( ) 2 2 2,0 0f x x x= − = . La función de 
una sola variable ( ) 2f x x= tiene un mínimo 
local en 0x = . 
➢ Cuando te mueves en la dirección y alrededor de este 
punto, la función se ve ( ) 2 2 20, 0f y y y= − = − . La función 
de una sola variable ( ) 2f y y= − tiene un máximo 
local en 0y = . 
En otras palabras, las direcciones x y y nos dan información 
contradictoria con respecto a si en este valor de entrada 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
17 
ocurre un máximo o un mínimo. Así que, aun cuando el 
punto ( )0,0 es un punto crítico y no es un punto de inflexión, 
¡no puede ser ni un máximo ni u mínimo local! 
Aquí mostramos un video de esta gráfica mientras rota en el 
espacio: 
 
( ) 2 2,f x y x y= −[Video: Rotación de la gráfica de ] 
 
https://www.youtube.com/embed/NY-UOaLbhrE?feature=oembed
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
18 
¿Acaso la región alrededor de ( )0,0,0 no se parece la silla de 
montar de un caballo? 
 
 
Silla literal 
Bueno, así lo pensaron los matemáticos, y tuvieron uno de 
esos raros momentos en que decidieron un buen nombre para 
algo: puntos silla. Por definición, estos son puntos críticos 
donde la función tiene un máximo local en una dirección, pero 
un mínimo local en otra. 
Prueba del máximo o del mínimo 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
19 
"Bien," 
Te escucho decir. 
"así que no es suficiente que el gradiente sea 0 , pues cabe la 
posibilidad que tengas un punto de inflexión o un punto silla. 
Pero ¿cómo puedes saber si un punto crítico es un máximo o 
un mínimo local?" 
¡Me alegro por haber preguntado! Este es el tema que sigue, 
que trata del criterio de la segunda derivada parcial. Por 
ahora, concluyamos con la 
Definición formal 
Hemos dicho esto antes, pero la razón para aprender 
definiciones formales, aun cuando ya tienes cierta intuición, 
es el exponerte a cómo las ideas matemáticas intuitivas se 
construyen con precisión. Es una buena práctica para pensar 
claramente, y también puede ayudar a comprender aquellos 
casos cuando la intuición difiere de la realidad. 
En la definición de un máximo local, vamos a usar la notación 
vectorial para nuestro valor de entrada, y escribimos x . 
 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
20 
Definición formal de máximo local: una función 
escalar f tiene un máximo local en 0x si existe un número 
positivo 0r  , pensado como un radio, tal que la siguiente 
proposición es verdadera: 
( ) ( )0 0, /f x f x x x x r  −  
Eso parece complicado, así que veamos las partes: 
Decir 0" "x x r−  significa que la variable x se encuentra a 
una distancia menor que r del punto máximo 0x . Cuando x
es bidimensional, esto equivale a decir que x está dentro del 
círculo de radio r con centro en el punto 0x . 
 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
21 
De manera más general, si x es un vector de n dimensiones, 
el conjunto de x tales que 0x x r−  forma una bola en 
dimensión n, de radio r y centro en 0x . 
 
[Imagen: Bola Tridimensional] 
 
BOLA TRIDIMENSIONAL 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
22 
Podemos traducir esta definición del lenguaje matemático a 
del modo siguiente: 
➢ 0x es un punto máximo de f si existe una pequeña 
región (en forma de bola) en el espacio de entradas 
alrededor del punto 0x , tal que el mayor valor posible de 
f evaluada en los puntos de esa región se alcanza en el 
punto 0x . 
 
Prueba tu comprensión: escribe la definición formal para un 
mínimo local, y piensa conforme la escribes qué significa cada 
componente (y resiste la tentación de simplemente copiar las 
palabras de la definición anterior). 
 
Respuesta 
La función escalar f tiene un mínimo local en 0x si existe un 
número positivo 0r  , tal que: 
( ) ( )0 0, /f x f x x x x r  −  
 
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 
 
 
23 
Resumen 
➢ Intuitivamente, cuando piensas en términos de gráficas, 
los máximos locales de funciones multivariables son picos, 
al igual que con las funciones de una sola variable. 
 
➢ El gradiente de una función multivariable en un punto 
máximo será el vector cero, que corresponde al lugar en 
el que la gráfica tiene un plano tangente horizontal. 
 
➢ Formalmente hablando, un punto máximo local es un 
punto en el espacio de entrada tal que todas las otras 
entradas en una pequeña región cerca de ese punto 
producen valores más pequeños cuando se introducen en 
la funciónmultivariable f .

Otros materiales