Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 1 Optimización Multivariable Máximos, Mínimos y Puntos Silla Aprende cómo se ven los máximos/mínimos locales en una función multivariable. ¿Qué vamos a construir? COMPESP N° 01 Describe con rigor científico los conceptos preliminares de la Optimización Multivariable. ACTIVIDAD N° 01 Estudie la siguiente información sobre DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 2 ➢ Intuitivamente, cuando piensas en términos de gráficas, los máximos locales de funciones multivariables son picos, al igual que con las funciones de una sola variable. ➢ El gradiente de una función multivariable en un punto máximo será el vector cero, que corresponde al lugar en el que la gráfica tiene un plano tangente horizontal. ➢ Formalmente hablando, un punto máximo local es un punto en el espacio de entrada tal que todas las otras entradas en una pequeña región cerca de ese punto producen valores más pequeños cuando se introducen en la función multivariable f. Una observación sobre Planos e Hiperplanos En general, la gráfica de una función de n variables existe en un espacio de dimensión (n+1), y su tangente es un espacio de dimensión n. Por ejemplo, la gráfica de la función de una variable es bidimensional, y su tangente es una recta unidimensional; la DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 3 gráfica de una función de dos variables es tridimensional, y su tangente es un plano bidimensional. Para funciones de tres o más variables, la tangente ya no será un plano, que es necesariamente bidimensional. El término formal para un subespacio que tiene una dimensión menos que el espacio ambiente es hiperplano. Así que, formalmente, el gradiente de una función multivariable corresponde a un hiperplano tangente. Seguiremos llamando plano a la tangente, pues todos nuestros ejemplos utilizan funciones de dos variables. Sin embargo, es importante recordar que hablamos formalmente de hiperplanos. Optimizar en dimensiones superiores Una de las aplicaciones más importantes del cálculo es su utilidad para permitirnos encontrar el máximo o el mínimo de una función. ➢ Imagínate que terminas siendo el jefe de una empresa, y que se te ha ocurrido que cierta función puede modelar cuánto dinero esperas ganar con base en un número de DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 4 parámetros tales como los salarios de los empleados, el costo de las materias primas, etc., y quieres encontrar la combinación correcta de los recursos que maximiza tus ingresos. ➢ Quizás estás diseñando un prototipo innovador de puente para transporte de carga pesada con la esperanza de hacerlo más eficiente y se te ocurra una función que modele las estructuras, resistencia de los materiales, topografía, hidrología e hidráulica en función de muchos parámetros que definan dicho diseño, y quieras encontrar la forma que maximice la resistencia total. ➢ En aprendizaje automático e inteligencia artificial, la manera en la que una computadora "aprende" a hacer algo es usualmente al minimizar alguna "función de costo" que el programador ha especificado. Máximos y Mínimos locales, Visualmente Vamos a empezar por pensar en funciones multivariables que podamos graficar; aquellas con una entrada de dos dimensiones y una salida escalar. Como, por ejemplo: ( ) ( ) 2 2 ( , ) cos cos x yf x y x y e− −= DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 5 Elegimos esta función ya que tiene un montón de pequeñas protuberancias y picos. Llamamos a uno de estos picos un máximo local. PICOS ➢ Al punto ( )0 0,x y por debajo de un pico en el espacio de entrada (que en este caso se refiere al plano xy se le llama un punto máximo local. DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 6 ➢ La salida de una función en un punto máximo local, que se puede visualizar como la altura de la gráfica por encima de ese punto, es en sí el máximo local. La palabra "local" se utiliza para distinguirlo del máximo global de la función, que es el único mayor valor que la función puede alcanzar. Si estás en la cima de una montaña, es un máximo local, pero a menos que la montaña sea el Monte Everest, no es un pico máximo global. Al final de daremos la definición formal de un punto máximo local. Intuitivamente, es un punto especial en el espacio de entrada donde si nos desplazamos un poco en cualquier dirección, el valor de la función solo puede disminuir. Del mismo modo, si la gráfica tiene un pico invertido en un punto, decimos que la función tiene un punto mínimo local en el valor (x, y), por arriba o por debajo de este punto en el plano xy , y el valor de la función en este punto es un mínimo local. Intuitivamente, estos son puntos donde al movernos un poco en cualquier dirección el valor de la función solo puede aumentar. DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 7 VALLES Puntos críticos en una sola variable (repaso) DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 8 LAS RECTAS TANGENTES EN EXTREMOS LOCALES TIENEN PENDIENTE 0 Puede ser que recuerdes la idea de máximos/mínimos locales en el cálculo de una variable, donde ves muchos problemas como este: Verificación de conceptos ¿Para qué valor x el valor de la función ( ) 2 ( ) 2 5f x x= − − + es el más grande? ¿Cuál es el valor máximo? Explicación La tangente en cualquier máximo local tendrá una pendiente de 0, por eso buscamos puntos donde '( ) 0f x = : DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 9 ( )'( ) 2 2 0f x x= − − = . En este caso, la única solución es 2x = , en este punto f tiene el valor: ( ) 2 (2) 2 2 5 5f = − − + = Para comprobar que esto es realmente un máximo y no un mínimo o un punto de inflexión, se tomas la segunda derivada confirmas que es negativa en el punto 2x = − . En general, los máximos y mínimos locales de una función f se estudian al examinar los valores de entrada a para los cuales '( ) 0f a = . Esto es porque siempre que la función sea continua y diferenciable, la recta tangente en cimas y valles se hará horizontal, es decir tendrá pendiente 0 . Uno de esos puntos a tiene diversos nombres: ➢ Punto crítico ➢ Punto estable ➢ Punto estacionario '( ) 0f a = DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 10 El requisito de que f sea continua y diferenciable es importante, pues si no fuera continua, un punto solitario de discontinuidad podría ser un máximo local: Y si f fuera continua pero no diferenciable, un máximo local se podría ver así: DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 11 En cualquier caso, hablar de rectas tangentes en estos máximos no tiene sentido, ¿o sí? Sin embargo, aun cuando f sea continua y diferenciable, no es suficiente que la derivada sea 0 , pues esto también sucede en los puntos de inflexión: DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 12 Esto significa que encontrar puntos críticos es una buenamanera de empezar la búsqueda de un máximo, pero no es necesariamente el final. Puntos críticos en dos variables La historia para funciones multivariables es muy similar. Cuando la función es continua y diferenciable, en un máximo o en un mínimo todas las derivadas parciales son cero 0 . DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 13 0 0 0 0 ( , ,...) 0 ( , ,...) 0 ........................ x y f x y f x y = = Respecto a la gráfica de una función, esto significa que su plano tangente será horizontal en un máximo o mínimo local. Por ejemplo, aquí hay una gráfica con muchos extremos locales y planos tangentes horizontales en cada uno: [Video: Planos tangentes Horizontales] Decir que todas las derivadas parciales son cero en un punto es lo mismo que decir que el gradiente en ese punto es el vector cero: https://es.khanacademy.org/math/multivariable-calculus/applications-of-multivariable-derivatives/optimizing-multivariable-functions/a/partial-derivatives-and-the-gradient/a/the-gradient https://www.youtube.com/embed/sIqqYOQz920?feature=oembed DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 14 0 0 0 0 0 0 ( , ,...) 0 ( , ,...) ( , ,...) 0 ..... ... x y f x y f x y f x y = = A menudo esta relación se escribe de manera compacta así: 0( ) 0f x = La entrada 0x toma los mismos nombres que en el caso de una sola variable: ➢ Punto crítico ➢ Punto estable ➢ Punto estacionario El pensamiento detrás de las palabras “estable” y “estacionario” es que cuando te mueves un poco cerca de este punto, el valor de la función no cambia significativamente. La palabra “crítico” suena un poco dramática, como si la función estuviera cerca de morir en esos puntos. Pero, no es suficiente que el gradiente sea cero para garantizar que un punto sea un máximo o mínimo local. Para DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 15 empezar, puedes tener también algo similar a un punto de inflexión: [Imagen: Punto de inflexión en 3D] PUNTO DE INFLEXIÓN EN TRES DIMENSIONES Pero también hay una posibilidad totalmente nueva, exclusiva de las funciones multivariables. DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 16 [Puntos silla] Considera la función ( ) 2 2,f x y x y= − . Hagamos algunas observaciones de lo que sucede alrededor del origen ( )0,0 . ➢ Ambas derivadas son 0 en este punto: ( ) ( ) ( ) ( ) 2 2 2 2 2 2 0 0 2 2 0 0 x y x x x y y y − = → = − = − → − = Por lo tanto ( )0,0 es un punto crítico. ➢ Cuando te mueves en la dirección x alrededor de este punto, la función se ve ( ) 2 2 2,0 0f x x x= − = . La función de una sola variable ( ) 2f x x= tiene un mínimo local en 0x = . ➢ Cuando te mueves en la dirección y alrededor de este punto, la función se ve ( ) 2 2 20, 0f y y y= − = − . La función de una sola variable ( ) 2f y y= − tiene un máximo local en 0y = . En otras palabras, las direcciones x y y nos dan información contradictoria con respecto a si en este valor de entrada DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 17 ocurre un máximo o un mínimo. Así que, aun cuando el punto ( )0,0 es un punto crítico y no es un punto de inflexión, ¡no puede ser ni un máximo ni u mínimo local! Aquí mostramos un video de esta gráfica mientras rota en el espacio: ( ) 2 2,f x y x y= −[Video: Rotación de la gráfica de ] https://www.youtube.com/embed/NY-UOaLbhrE?feature=oembed DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 18 ¿Acaso la región alrededor de ( )0,0,0 no se parece la silla de montar de un caballo? Silla literal Bueno, así lo pensaron los matemáticos, y tuvieron uno de esos raros momentos en que decidieron un buen nombre para algo: puntos silla. Por definición, estos son puntos críticos donde la función tiene un máximo local en una dirección, pero un mínimo local en otra. Prueba del máximo o del mínimo DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 19 "Bien," Te escucho decir. "así que no es suficiente que el gradiente sea 0 , pues cabe la posibilidad que tengas un punto de inflexión o un punto silla. Pero ¿cómo puedes saber si un punto crítico es un máximo o un mínimo local?" ¡Me alegro por haber preguntado! Este es el tema que sigue, que trata del criterio de la segunda derivada parcial. Por ahora, concluyamos con la Definición formal Hemos dicho esto antes, pero la razón para aprender definiciones formales, aun cuando ya tienes cierta intuición, es el exponerte a cómo las ideas matemáticas intuitivas se construyen con precisión. Es una buena práctica para pensar claramente, y también puede ayudar a comprender aquellos casos cuando la intuición difiere de la realidad. En la definición de un máximo local, vamos a usar la notación vectorial para nuestro valor de entrada, y escribimos x . DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 20 Definición formal de máximo local: una función escalar f tiene un máximo local en 0x si existe un número positivo 0r , pensado como un radio, tal que la siguiente proposición es verdadera: ( ) ( )0 0, /f x f x x x x r − Eso parece complicado, así que veamos las partes: Decir 0" "x x r− significa que la variable x se encuentra a una distancia menor que r del punto máximo 0x . Cuando x es bidimensional, esto equivale a decir que x está dentro del círculo de radio r con centro en el punto 0x . DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 21 De manera más general, si x es un vector de n dimensiones, el conjunto de x tales que 0x x r− forma una bola en dimensión n, de radio r y centro en 0x . [Imagen: Bola Tridimensional] BOLA TRIDIMENSIONAL DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 22 Podemos traducir esta definición del lenguaje matemático a del modo siguiente: ➢ 0x es un punto máximo de f si existe una pequeña región (en forma de bola) en el espacio de entradas alrededor del punto 0x , tal que el mayor valor posible de f evaluada en los puntos de esa región se alcanza en el punto 0x . Prueba tu comprensión: escribe la definición formal para un mínimo local, y piensa conforme la escribes qué significa cada componente (y resiste la tentación de simplemente copiar las palabras de la definición anterior). Respuesta La función escalar f tiene un mínimo local en 0x si existe un número positivo 0r , tal que: ( ) ( )0 0, /f x f x x x x r − DERIVADAS PARCIALES CON ENFOQUE POR COMPETENCIAS FIDEL VERA OBESO 23 Resumen ➢ Intuitivamente, cuando piensas en términos de gráficas, los máximos locales de funciones multivariables son picos, al igual que con las funciones de una sola variable. ➢ El gradiente de una función multivariable en un punto máximo será el vector cero, que corresponde al lugar en el que la gráfica tiene un plano tangente horizontal. ➢ Formalmente hablando, un punto máximo local es un punto en el espacio de entrada tal que todas las otras entradas en una pequeña región cerca de ese punto producen valores más pequeños cuando se introducen en la funciónmultivariable f .
Compartir