Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 1 1 Nociones de Topología en Rn. Rn = {X = (x1, x2, ..., xn) : xi ∈ R} con las operaciones + (suma) y · (pro- ducto por escalar) es un espacio vectorial sobre R. 1. La norma euclidiana de un vector X ∈ Rn se define por kXk = k(x1, ..., xn)k = q x21 + ...+ x 2 n Recuerde las propiedades de una norma en un espacio vectorial. Un resultado importante son las desigualdades: |xk| ≤ kXk para cada componente xk del vector X 2. A partir de la norma se define la noción de distancia entre dos puntos X = (x1, ..., xn) e Y = (y1, ..., yn) de Rn por d(X,Y ) = kX − Y k = p (x1 − y1)2 + ...+ (xn − yn)2 3. En Rn se tiene también un producto interior definido por hX,Y i = x1y1 + ...+ xnyn = nX k=1 xkyk y para el cual se verifica: kXk =phX,Xi o bien hX,Xi = kXk2 . También es válida la desigualdad de Schwarz: |hX,Y i| ≤ kXk kY k . En R2 y R3 : hX,Y i = kXk kY k cos θ , donde θ es el ángulo (≤ 180◦) formado por los dos vectores, lo que implica que hX,Y i = 0⇔ X ⊥ Y 1.1 Bola abierta, punto interior y conjunto abierto. Vecindad abierta de un punto en Rn.- Sea X0 un punto de Rn.¿Cuáles son todos los puntos vecinos de él? (los que están más próximos, los que lo rodean) Definición 1 Se llama bola abierta de centro X0 y radio r > 0 al conjunto B(X0, r) = {X ∈ Rn : d(X,X0) < r} = {X ∈ Rn : kX −X0k < r} Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 2 Cuantomás pequeño es el r > 0, el conjunto contiene a los puntosmás próximos de X0. En R2 y R3 este conjunto es, respectivamente, un círculo y una esfera (abierta) de centro X0 y radio r. Definición 2 Sean A ⊂ Rn y X0 ∈ A. Se dice que X0 es un punto interior de A cuando: ∃r > 0 tal que B(X0, r) ⊂ A. Por ejemplo, para el conjunto A = {(x, y) : x ≥ 0, y ≥ 0} el punto (1, 2) es un punto interior y el punto (0, 2) no es un punto interior. Para el conjunto C = {(x, y) : x > 0, y > 0}, todos sus puntos son interiores. Definición 3 Un conjunto A es abierto cuando todos sus puntos son inte- riores. Definición 4 Con A ⊂ Rn, el conjunto ◦ A = {X : X es punto interior de A} se llama el interior de A. Es claro que: ◦ A ⊂ A, ◦ A es un conjunto abierto y ◦ A es el mayor conjunto abierto contenido en A. Una bola abierta es un conjunto abierto. 1.2 Punto de acumulación. Definición 5 Sean A ⊂ Rn y X0 ∈ Rn (es posible que X0 /∈ A). Se dice que X0 es un punto de acumulación de A cuando ∀r > 0 : [B(X0, r)− {X0}] ∩A 6= φ Por ejemplo, para el conjunto C = {(x, y) : x > 0, y > 0}, (el cual es abierto) los puntos (1, 2) y (0, 2) son de acumulación. Uno pertenece al conjunto y el otro no. Un ejercicio interesante es mostrar que, siendo X0 un punto de acumu- lación de A, es posible encontrar una sucesión X1, X2, ...,Xn, ... de puntos (distintos) de A tal que d(Xn,X0) < 1n . Es decir, los puntos Xn se acercan al punto X0, o equivalentemente, la sucesión de puntos de A converge al punto X0. Se define el conjunto A0 = {X ∈ Rn : X es punto de acumulación de A} . Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 3 1.3 Conjunto cerrado, clausura, punto frontera. Definición 6 Un conjunto F ⊂ Rn es cerrado cuando FC es abierto. Por ejemplo, B̄(X0, r) = {X ∈ Rn : kX −X0k ≤ r}, llamado bola ce- rrada de centro X0 y radio r (positivo), es un conjunto cerrado. El siguiente teorema entrega una caracterización de los conjuntos cerra- dos. Teorema 7 F es cerrado⇔ F contiene todos sus puntos de acumulación. Definición 8 Se llama clausura de F al conjunto F̄ = F ∪ F 0 (F junto con todos sus puntos de acumulación) Es obvio que: F ⊂ F̄ y, según el Teorema, F es cerrado⇔ F̄ = F. Además, F̄ es el menor cerrado que contiene a F. Un punto X ∈ F̄ se llama punto de clausura o punto de adherencia de F. Definición 9 Sean A ⊂ Rn y X0 ∈ Rn. Se dice que X0 es un punto frontera de A cuando: ∀r > 0 : B(X0, r) ∩A 6= φ ∧ B(X0, r) ∩AC 6= φ X0 es punto frontera de A cuando pertenece a la clausura de A y a la clausura de su complemento. 1.4 Conjunto compacto. Definición 10 Un conjunto K ⊂ Rn es acotado cuando ∃r > 0 tal que K ⊂ B(θ, r). Definición 11 Un conjunto K ⊂ Rn es compacto cuando es cerrado y es acotado. Por ejemplo, una bola cerrada es un conjunto compacto; mientras que el conjunto A = {(x, y) : x ≥ 0, y ≥ 0} no es compacto, porque (aunque es cerrado) no es acotado. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 4 Ejercicio 12 Represente gráficamente los siguientes conjuntos e indique: in- terior, adherencia, frontera y conjunto de puntos de acumulación. A = {(x, y) ∈ R2 : 0 < x2 + y2 < 1} B = {(x, y) ∈ R2 : 0 < |x|+ |y| ≤ 1} C = {(x, y) ∈ R2 : x2 < y < x} D = {(x, y) ∈ R2 : y = x2 ∧ x > 0} E = {(x, y, z) ∈ R3 : x2 + y2 − z2 = 1} F = {(x, y, z) ∈ R3 : x2 + y2 + z2 = 1} G = {(x, y, z) ∈ R3 : 0 < x2 + y2 + z2 < 1} Decida en cada caso si el conjunto es compacto. Ejercicio 13 Sea A = {(x, 0) : 0 ≤ x ≤ 1} ∪ ©¡ 1 n , y ¢ : n ∈ N ∧ 0 ≤ y ≤ 1ª a) Haga una gráfica que ilustre el conjunto A. b) Determine: el interior de A y su clausura. c) Decida si el conjunto A es abierto o si es cerrado. Ejercicio 14 Sea A = {(x, y) : x2 + y2 < 1} ∪ ©(2 + 1 n , 0) : n ∈ Nª Deter- mine el interior, el conjunto de puntos adherentes y el conj. de puntos de acumulación de A. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 5 2 Límite. Se estudiarán funciones de varias variables reales y con valores en el espacio vectorial Rm. Es decir, una función F : A ⊂ Rn → Rm, X 7→ F (X) con dominio un conjunto A de Rn. Como X = (x1, ..., xn), F (X) = (f1(X), ..., fm(X)), con fk : A → R, X → f(X), la función F está determinada por las m funciones componentes f1, ..., fm. La función F : R2 → R2, F (x, y) = (y+x2 cosxy, 5x+exy), es una función de 2 variables con valores en R2. Sus componentes son f1(x, y) = y+x2 cosxy y f2(x, y) = 5x+ exy. 2.1 Definición de límite. Al igual que en el cálculo de una variable, interesa estudiar el comportamiento de F cerca de un punto X0, el cual puede pertenecer al conjunto A (dominio de la función) o no. En todo caso debe ser un punto de acumulación de A, para poder acercarse a X0 a través de puntos del conjunto A (donde es posible evaluar la función). Definición 15 Sean F : A ⊂ Rn → Rm, X0 un punto de acumulación de A y L ∈ Rm. Se escribe lim X→X0 F (X) = L cuando se cumple la condición dado ε > 0, ∃δ > 0 tal que: ∀X : kX −X0k < δ, X ∈ A, X 6= X0 ⇒ kF (X)− Lk < ε (1) Observaciones.- 1. La condición (1) puede darse en forma equivalente por: dado ε > 0, ∃δ > 0 tal que: ∀X : X ∈ A, X 6= X0, X ∈ B(X0, δ)⇒ F (X) ∈ B(L, ε) Esto significa que si X es cercano de X0 entonces su imagen F (X) es próxima de L. 2. Puede existir un L que satisfaga la condición (1), o puede no existir. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 6 3. Si el límite existe, es único. 4. La notación lim X→X0 X∈A F (X) = L enfatiza el hecho que la evaluación de F se hace sobre puntos próximos de X0 y que pertenecen al conjunto A. 5. Considerando que F (X) = (f1(X), ..., fm(X)), L = (L1, ..., Lm) y | fk(X)− Lk| ≤ kF (X)− Lk , ∀k se obtiene lim X→X0 F (X) = L⇔ lim X→X0 fk(X) = Lk, ∀k Esto justifica que los teoremas posteriores sobre límites se den sólo para funciones a valores reales: f : A→ R 2.2 Teoremas sobre límites. Es directo de la definición que al estudiar el límite: lim X→X0 X∈A f(X) = L, podemos considerar una parte B ⊂ A, con la condición que X0 continue siendo un punto de acumulación de B. Entonces se tiene: lim X→X0 X∈A f(X) = L⇒ lim X→X0 X∈B f(X) = L Es obvio que si la implicación en la condición (1) vale para puntos del con- junto A, debe continuar valiendo para puntos de una parte B de dicho con- junto. Como conclusión se tiene el siguiente resultado. Teorema 16 Si B1 y B2 son partes de A, que tienen a X0 como punto de acumulación, lim X→X0 X∈B1 f(X) = L, lim X→X0 X∈B2 f(X) = M con L 6= M , entonces lim X→X0 X∈A f(X) no existe Ejemplo 17 Estudio del límite lim (x,y)→(0,0) xy x2 + y2 Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 7 Ejemplo 18 Estudio del límite lim (x,y)→(0,0)x3 x2 − y El dominio de la función f (x, y) = x 3 x2−y es A = R 2 − {(x, y) ∈ A : y 6= x2} . 1) Si tomamos el conjunto Bm = {(x, y) ∈ A : y = mx} (recta que pasa por el origen), se tiene lim (x,y)→(0,0) (x,y)∈B x3 y − x2 = limx→0 x3 mx− x2 = lim x→0 x2 m− x = 0 2) Por otro lado, si se considera el conjunto C1 = ½ (x, y) ∈ A : x 3 y − x2 = 1 ¾ (curva de nivel de f ) vemos que: x3 y − x2 = 1 ⇔ x 3 = y − x2 ⇔ y = x3 − x2 lo que muestra que C1 es una curva que pasa por el origen. La siguiente es su gráfica -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -0.5 0.5 1 1.5x Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 8 Ahora podemos calcular lim (x,y)→(0,0) (x,y)∈C1 x3 y − x2 = 1 Por lo tanto, de 1) y 2), lim (x,y)→(0,0) x3 y − x2 no existe. Es claro que cuando lim X→X0 X∈A f(X) = L exista, cualquier parte B de A va a conducir al mismo resultado (L) y por supuesto que el Teorema anterior no va a ser aplicable. En este caso, una parte B convenientemente elejida nos proporciona el único valor posible L para el límite y entonces podemos aplicar el siguiente Teorema. Teorema 19 Si es válido el acotamiento | f(X)− L| ≤ h(X), para X ∈ B(X0, r) (para X cerca de X0) y lim X→X0 h(X) = 0, entonces lim X→X0 f(X) = L Ejemplo 20 Estudio del límite lim (x,y)→(0,0) xy2 x2 + y2 Al igual que en el cálculo de una variable se tiene los teoremas sobre álgebra de límites: Teorema 21 Si lim X→X0 f(X) = L y lim X→X0 g(X) =M entonces: a) lim X→X0 [f(X) + g(X)] = L+M . b) lim X→X0 [f(X) · g(X)] = L ·M c) lim X→X0 [c · f(X)] = c · L, para una constante c d) lim X→X0 · f(X) g(X) ¸ = L M , cuando M 6= 0 Aplicación.- Al tomar las funciones proyecciones: pr1 : R2 → R, pr1(x, y) = x pr2 : R2 → R, pr2(x, y) = y Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 9 y aplicar la definición de límite se tiene: lim (x,y)→(x0,y0) [pr1(x, y)] = x0 y lim (x,y)→(x0,y0) [pr2(x, y)] = y0. Ahora, usando el Teorema, resulta el valor del límite para una función polinomial f(x, y) en dos variables: lim (x,y)→(x0,y0) f(x, y) = f(x0, y0) (2) Por ejemplo: lim (x,y)→(−1,2) [5x3y − 2xy2 + 3] = 5 (−1)3 2− 2 (−1) 22 + 3 = 1 lim (x,y)→(−1,2) [x4 + y − 2xy] = (−1)4 + 2− 2 (−1) (2) = 7 También este procedimiento es válido para funciones que son cuociente de polinomios, como por ejemplo lim (x,y)→(−1,2) · 5x3y − 2xy2 + 3 x4 + y − 2xy ¸ = 1 7 , al aplicar la parte d) del Teorema. Note que este razonamiento es aplicable a funciones de tres o más va- riables. Otro resultado es el Teorema de sustitución para límites: Teorema 22 Sean f : A ⊂ Rn → R , y h : I ⊂ R→ R. Si lim X→X0 f(X) = L y lim t→L h(t) =M , entonces lim X→X0 h(f(X)) = lim t→L h(t) =M Por ejemplo, lim (x,y)→(0,0) sin(x2 + y2) x2 + y2 = lim t→0 sin t t = 1 Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 10 3 Continuidad. La noción de función continua es la misma que en el cálculo de una variable. Definición 23 Sean F : A ⊂ Rn → Rm y X0 ∈ A. Se dice que F es una función continua en el punto X0 cuando lim X→X0 F (X) = F (X0). En la definición se pide que: i) F esté definida en X0. ii) lim X→X0 F (X) exista y iii) el límite anterior coincida con el valor que toma F en el punto X0. Observe que la condición (2) en la discusión anterior para funciones poli- nomiales establece simplemente que éstas son funciones continuas en todo su dominio (Rn) Ejemplo 24 Estudie la continuidad de la función f , en cada punto de su dominio f(x, y) = ( xy x2 + y2 si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0) Ejemplo 25 Estudie la continuidad de la función f , en cada punto de su dominio f(x, y) = x3 − y3 x− y si x 6= y 0 si x = y Ejemplo 26 Estudie la continuidad de la función f , en cada punto de su dominio f(x, y) = x3 + y3 x− y si x 6= y 0 si x = y 4 Derivadas parciales. Tomemos la base canónica de Rn : B = {e1, e2, ..., en}, donde e1 = (1, 0, 0, ..., 0), e2 = (0, 1, 0, ..., 0), ..., en = (0, 0, 0, ..., 1). Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 11 Definición 27 Sean f : A ⊂ Rn → R y X0 un punto interior de A. Se definen las derivadas parciales de f en el punto X0 mediante los límites: ∂f ∂xk (X0) = lim h→0 · f(X0 + h · ek)− f(X0) h ¸ (3) cuando estos existen. Tenemos derivada parcial con respecto a cada variable xk de la cual de- pende la función (k va de 1 a n). Es fácil ver que si se toma la función ϕ(t) = f(X0 + t · ek), entonces ϕ0(0) = lim h→0 · ϕ(h)− ϕ(0) h ¸ = ∂f ∂xk (X0) O sea, una derivada parcial es una derivada (ordinaria) del cálculo de una variable. Lo que permite trabajar, en muchos casos, con todas las reglas de derivación conocidas del curso anterior. Para una función de dos variables: x, y , la definición queda: ∂f ∂x (x0,y0) = lim h→0 · f(x0 + h, y0)− f(x0, y0) h ¸ ∂f ∂y (x0, y0) = lim h→0 · f(x0, y0 + h)− f(x0, y0) h ¸ Ejemplo 28 Calcule las derivadas parciales, en todo punto donde existan, de la función f(x, y) = ( xy x2 + y2 si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0) Volviendo a la definición (general) de derivada parcial podemos notar que ella se da en términos de los vectores de la base canónica. Cada vector ek determina geométricamente una dirección en Rn, precisamente la dirección del eje coordenado correspondiente. Así, la derivada parcial ∂f ∂xk (X0) es una derivada en la dirección del eje xk y mide la tasa de cambio de la función en dicha dirección. Note además que, de acuerdo al ejemplo anterior, una función puede tener todas sus derivadas parciales en un punto sin que sea continua en dicho punto. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 12 4.1 Derivada direccional. En la definición de derivada parcial (3) podemos cambiar el vector ek que da la dirección, por otro vector unitario ~v que determine otra dirección en el espacio Rn. Definición 29 Sean f : A ⊂ Rn → R , X0 un punto interior de A y ~v un vector unitario. Se define la derivada direccional de f en el punto X0 en la dirección dada por el vector ~v por: ∂f ∂~v (X0) = lim h→0 · f(X0 + h · ~v)− f(X0) h ¸ Esta también corresponde a una tasa de cambio de f enX0 en la dirección del vector ~v. El siguiente ejemplo muestra que una función puede tener derivada direc- cional en un punto, en todas las direcciones, sin que ella sea continua en ese punto. Ejemplo 30 Calcule las derivadas direccionales en (0, 0), en todas las di- recciones, de la función f(x, y) = 2xy2 x2 + y4 si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0) Muestre también que la función no es continua en el origen. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 13 5 La Diferencial.- Definición 31 Sea F : A ⊂ Rn → Rm, X 7−→ F (X), una función de n variables y a valores vectoriales, definida en un conjunto abierto A y sea X0 ∈ A. Se dice que F es diferenciable en X0 cuando existe una aplicación lineal L : Rn → Rm,H 7−→ L(H) tal que: lim H→θ F (X0 +H)− F (X0)− L(H) kHk = Θ (vector nulo) (4) Si en la condición 4 se reemplaza H = X −X0 se obtiene: lim X→X0 F (X)− F (X0)− L(X −X0) kX −X0k = Θ (5) Mirando esta última condición podemos tomar la aplicación G(X) = (F (X0)− L(X0)) + L(X) (6) que es la suma de un vector constante más una aplicación lineal (se llama aplicación afín), y escribir lim X→X0 F (X)−G(X) kX −X0k = Θ (7) La condición 7 se expresa diciendo que la función definida en 6 es una buena aproximación de la función F en una vecindad del punto X0. El límite 7 puede entenderse en el sentido que la diferencia F (X)−G(X) tiende a cero, más rapidamente que kX −X0k, cuando X → X0. Por esto, cuando f es diferenciable en el punto X0, se tiene la aproxi- mación F (X) ≈ G(X) = F (X0) + L(X −X0) válida para X próximo de X0. La aplicación lineal L de 4 se llama La Diferencial de F en el punto X 0 y se denota DF (X0) = L. Observaciones.- 1. Se puede probar que existe a lo más una aplicación lineal satisfaciendo la condición (4). Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 14 2. Cuando no existe una L lineal que cumpla (4), se dice que F no es diferenciable en el puntoX0. 3. En el caso particular que F sea una aplicación lineal, es inmediato verificar que L = F verifica la condición 4 de la definición. O sea, DF (X0) = F , en cualquier punto X0. 4. También, cuando F es una aplicación afín, es decir F (X) = B +L(X) (un vector constante más una aplicación lineal) se tiene que DF (X0) = L, en cualquier punto X0. Tomemos una F diferenciable en X0 y considere el j-ésimo vector êj de la base canónica de Rn. Podemos restringir el límite de la condición (4) al camino determinado por el eje xj (h 7→ h · êj) y obtener lim h→0 F (X0 + h · êj)− F (X0)− L(h · êj) kh · êjk = Θ lo que lleva fácilmente a: L(êj) = lim h→0 F (X0 + h · êj)− F (X0) h Ahora si consideramos que F = (f1, f2, ..., fm) está determinada por sus funciones componentes, lo mismo que L = (L1, L2, ..., Lm); la fórmula ante- rior da Li(êj) = lim h→0 fi(X0 + h · êj)− fi(X0) h = ∂fi ∂xj (X0) Esto muestra que, con respecto a las bases canónicas en el dominio y codominio, la matriz de L está dada por: JF (X0) = ∂f1 ∂x1 (X0) ∂f1 ∂x2 (X0) ... ... ∂f1 ∂xn (X0) ∂f2 ∂x1 (X0) ∂f2 ∂x2 (X0) ... ... ∂f2 ∂xn (X0) ... ... ... ... ... ∂fm ∂x1 (X0) ∂fm ∂x2 (X0) ... ... ∂fm ∂xn (X0) llamada matriz jacobiana de f en el punto X 0. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 15 Caso particular.- n=2 y m=1. Para f : A ⊂ R2 → R, (x, y) 7→ f(x, y). diferenciable en (x0, y0) se tiene: Jf(x0, y0) = µ ∂f ∂x (x0, y0) ∂f ∂y (x0, y0) ¶ Df(x0, y0)(h, k) = ∂f ∂x (x0, y0) · h+ ∂f ∂y (x0, y0) · k La buena aproximación de f en una vecindad de (x0, y0) es g(x, y) = f(x0, y0) + ∂f ∂x (x0, y0) · (x− x0) + ∂f ∂y (x0, y0) · (y − y0) cuyo gráfico z = g(x, y) corresponde a un plano que pasa por el punto (x0, y0, f(x0, y0)). Precisamente la condición (4) que define diferenciabilidad de f en (x0, y0) hace que este plano sea tangente a la superficie gráfico de f en el punto (x0, y0, f(x0, y0)). Ejemplo 32 Estudie la diferenciabilidad en (0, 0) de las funciones f(x, y) = x2y x2 + y2 si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0) g(x, y) = x2y2 x2 + y2 si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0) Cuando corresponda, encuentre el plano tangente a la gráfica de la función en el origen. 5.1 Teoremas sobre diferenciabilidad. La relación entre diferenciabilidad y continuidad está determinada en el si- guiente teorema. Teorema 33 F diferenciable en X0 ⇒ F continua en X0. Dem.- Se sigue del hecho que toda aplicación lineal L es una función con- tinua, es decir lim X→X0 L(X) = L(X0), y además F (X)− F (X0) = F (X)− F (X0)− L(X −X0) + L(X −X0). Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 16 Luego, kF (X)− F (X0)k ≤ kF (X)− F (X0)− L(X −X0)k+kL(X)− L(X0)k Como (5) implica que lim X→X0 kF (X)− F (X0)− L(X −X0)k = 0, se concluye que lim X→X0 F (X) = F (X0) En forma práctica el Teorema se usa aplicando su contrarecíproco: F no continua en X0 ⇒ F no diferenciable en X0. Definición 34 Una función F = (f1, f2, ..., fm) definida en el abierto A ⊂ Rn y con valores en Rm es de clase C1 en el conjunto A cuando todas las derivadas parciales ∂fi ∂xj : A→ R son funciones continuas. La importancia de esta condición está en el siguiente resultado (cuya demostración la consideramos fuera del alcance de este curso): Teorema 35 Una función F de clase C1 en el abierto A es diferenciable en cada punto de este conjunto. El teorema anterior muestra que la función f(x, y) = ( xy x2 + y2 si (x, y) 6= (0, 0) 0 si (x, y) = (0, 0) es diferenciable en todo punto (x, y) 6= (0, 0) (el conjunto A = R2 − {(0, 0)} es abierto). Además, f no es diferenciable en (0, 0), porque no es continua. ¿Cuál es la ecuación del plano tangente al gráfico de f en el punto (2, 3, 6 13 )? ( f(2, 3) = 6 13 ). Determínela a partir de z = f(2, 3) + ∂f ∂x (2, 3) (x− 2) + ∂f ∂y (2, 3)(y − 3) Se calcula ∂ ∂x ³ xy x2+y2 ´ = −y x2−y2 (x2+y2)2 , evaluado en (2, 3): −34−9 132 = 15 169 ∂ ∂y ³ xy x2+y2 ´ = x x 2−y2 (x2+y2)2 , evaluado en (2, 3): 24−9 132 = − 10 169 La ecuación es: z = 6 13 + 15 169 (x− 2)− 10 169 (y − 3). Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 17 La relación entre diferenciabilidad y derivadas direccionales está dada por: Teorema 36 Sean f : A ⊂ Rn → R diferenciable en el punto X0 y ~v un vector unitario. Se tiene entonces ∂f ∂~v (X0) = Df(X0)(~v) Dem.- De la definición de diferenciabilidad en X0: lim H→θ f(X0 +H)− f(X0)−Df(X0)(H) kHk = Θ , basta restringir el límite al camino determinado por h→ h · ~v para obtener Df(X0)(~v) = lim h→0 f(X0 + h~v)− f(X0) h = ∂f ∂~v (X0) Observación.- Al definir el vector ∇f(X0) = µ ∂f ∂x1 (X0), ∂f ∂x2 (X0), ..., ∂f ∂xn (X0) ¶ llamado gradiente de f en X0, la igualdad Df(X0)(H) = ∂f ∂x1 (X0)h1 + ∂f ∂x2 (X0)h2 + ...+ ∂f ∂xn (X0)hn puede escribirse Df(X0)(H) = ∇f(X0) ·H donde “·” representa el producto interior de los dos vectores. La fórmula del teorema anterior ahora se escribe ∂f ∂~v (X0) = Df(X0)(~v) = ∇f(X0) · ~v y luego, utilizando la desigualdad de Scharwz,¯̄̄̄ ∂f ∂~v (X0) ¯̄̄̄ = |∇f(X0) · ~v| ≤ k∇f(X0)k k~vk = k∇f(X0)k Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 18 O sea, k∇f(X0)k es una cota superior para el valor absoluto de cualquier derivada direccional en X0. Por otra parte, al considerar el vector unitario ~u = ∇f(X0) k∇f(X0)k (supuesto que el vector gradiente no es nulo) se obtiene ∂f ∂~u (X0) = ∇f(X0) · ∇f(X0)k∇f(X0)k = k∇f(X0)k lo que indica que la dirección del vector ~u determina la máxima derivada direccional de f en X0. Por lo tanto ∇f(X0) proporciona la dirección de mayor crecimiento para la función f . La dirección contraria −∇f(X0) corresponderá a la de mayor disminución de la función. Esto explica que el flujo de calor se pro- duzca en la dirección de −∇T (X), donde T es la función temperatura para los distintos puntos de un cuerpo. 5.2 Derivadas de orden superior.- Dada una función f : A→ R de n variables, definida en el abierto A de Rn y con derivadas parciales ∂f ∂xi : A → R se definen las derivadas parciales de segundo orden en el punto X0 ∈ A por ∂2f ∂xj∂xi (X0) = ∂ ∂xj · ∂f ∂xi ¸ (X0) = lim h→0 " ∂f ∂xi (X0 + h · êj)− ∂f∂xi (X0) h # cuando el límite existe. Esta definición es para cada i, j ∈ {1, 2, ..., n} (hay n2 derivadas de segundo orden). Las derivadas de segundo orden de f son la derivadas parciales (de primer orden) de las funciones ∂f ∂xi . En forma inductiva se definen las derivadas parciales de tercer orden, cuarto orden, etc. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 19 Por ejemplo para la función f(x, y) = x2y3 + e2x sin 3y se tiene: ∂f ∂x (x, y) = ∂ ∂x (x2y3 + e2x sin 3y) = 2xy3 + 2e2x sin 3y. ∂f ∂y (x, y) = ∂ ∂y (x2y3 + e2x sin 3y) = 3x2y2 + 3e2x cos 3y ∂2f ∂x2 (x, y) = ∂ ∂x (2xy3 + 2e2x sin 3y) = 2y3 + 4e2x sin 3y ∂2f ∂y∂x (x, y) = ∂ ∂y (2xy3 + 2e2x sin 3y) = 6xy2 + 6e2x cos 3y ∂2f ∂x∂y (x, y) = ∂ ∂x (3x2y2 + 3e2x cos 3y) = 6xy2 + 6e2x cos 3y ∂2f ∂y2 (x, y) = ∂ ∂y (3x2y2 + 3e2x cos 3y) = 6x2y − 9e2x sin 3y Se puede observar que las derivadas mixtas ∂ 2f ∂y∂x (x, y) y ∂ 2f ∂x∂y (x, y) coinci- den (note que se obtienen de procesos distintos). Este resultado proviene de una propiedad más general que se comenta a continuación. Una función f es de clase C2 en el abierto A cuando todas las derivadas parciales de segundo orden son continuas en A. Para funciones de clase C2 se verifica la igualdad ∂2f ∂xi∂xj (x, y) = ∂2f ∂xj∂xi (x, y) El siguiente ejemplo muestra el caso de una función donde no se verifica la igualdad anterior. Sea f (x, y) = xy x2 − y2 x2 + y2 si x2 + y2 6= 0 0 si x2 + y2 = 0 . Calcule ∂2f ∂x∂y (0, 0) y ∂2f ∂y∂x (0, 0) . 5.3 Regla de la cadena.- En el cálculo de una variable la regla de la cadena indica cómo calcular la derivada de una compuesta de dos funciones derivables: d dx [g(f(x))] = g0(f(x)) · f 0(x) La derivada de g ◦ f es el producto de la derivada de g y la derivada de f , calculadas en los puntos que se indica. En el cálculo de variasvariables se tiene Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 20 Teorema 37 Si F : A ⊂ Rn → Rm es diferenciable en X0 y G : B ⊂ Rm → Rp es diferenciable en Y0 = F (X0), entonces la compuesta G ◦ F es diferenciable en X0 y D(G ◦ F )(X0) = DG(Y0) ◦DF (X0) O sea, la diferencial de la compuesta es igual a la compuesta de las diferen- ciales respectivas. Obs.- En el teorema se supone además que A y B son conjuntos abiertos y que la composición está bien definida. Según se vio en álgebra lineal, al representar aplicaciones lineales me- diante matrices la composición de aplicaciones corresponde a la multipli- cación de sus matrices. Por esto, la fórmula del teorema se expresa en tér- minos de matrices jacobianas por J(G ◦ F )(X0) = JG(Y0) · JF (X0) Recuerde que la matriz jacobiana está formada por las derivadas par- ciales de las componentes de la función. Luego, podemos concluir que las derivadas parciales (de las componentes) de la G◦F están determinadas por las derivadas parciales (de las componentes) de la F y de la G, según se analiza a continuación: Asociamos F (X → F (X) = Y ) con las fórmulas que definen sus m componentes y1 = f1(x1, x2, ..., xn) y2 = f2(x1, x2, ..., xn) .............. ym = fm(x1, x2, ..., xn) Sus mn derivadas parciales son: ∂fk ∂xj o ∂yk ∂xj , lo que indica que las variables yk dependen de las variables xj. Asociamos G (Y → G(Y ) = Z) con las fórmulas que definen sus p com- ponentes z1 = g1(y1, y2, ..., ym) z2 = g2(y1, y2, ..., ym) .............. zp = gp(y1, y2, ..., ym) Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 21 Sus pm derivadas parciales son: ∂gi ∂yk o ∂zi ∂yk , lo que indica que las variables zi dependen de las variables yk. Ahora, si las variables zi dependen de las yk y las yk dependen de las xj, al componer las dos aplicaciones las variables zi dependerán de las xj. El cálculo de las derivadas parciales ∂zi ∂xj resulta de ∂z1 ∂x1 ∂z1 ∂x2 ...... ∂z1 ∂xn ∂z2 ∂x1 ∂z2 ∂x2 ...... ∂z2 ∂xn ...... ...... ...... ∂zp ∂x1 ∂zp ∂x2 ...... ∂zp ∂xn = ∂z1 ∂y1 ∂z1 ∂y2 ...... ∂z1 ∂ym ∂z2 ∂y1 ∂z2 ∂y2 ...... ∂z2 ∂ym ...... ...... ...... ∂zp ∂y1 ∂zp ∂y2 ...... ∂zp ∂ym ∂y1 ∂x1 ∂y1 ∂x2 ...... ∂y1 ∂xn ∂y2 ∂x1 ∂y2 ∂x2 ...... ∂y2 ∂xn ...... ...... ...... ∂ym ∂x1 ∂ym ∂x2 ...... ∂ym ∂xn Así se tiene que: ∂zi ∂xj = ∂zi ∂y1 ∂y1 ∂xj + ∂zi ∂y2 ∂y2 ∂xj + ...+ ∂zi ∂ym ∂ym ∂xj = mX k=1 ∂zi ∂yk ∂yk ∂xj Con mayor precisión, cuando ∂zi ∂xj está calculado (evaluado) en el punto X0, ∂zi ∂yk se evalúa en Y0 = F (X0) y ∂yk ∂xj se evalúa en X0. Ejemplo 38 Cambio de coordenadas rectangulares a polares.- La transformación es T : R2 → R2, (r, θ) 7→ (r cos θ, r sin θ) = (x, y) Es decir, x = r cos θ y = r sin θ Para la función z = f(x, y), el cambio de coordenadas da z = f(r cos θ, r sin θ) y las derivadas quedan ∂z ∂r = ∂z ∂x ∂x ∂r + ∂z ∂y ∂y ∂r = ∂z ∂x cos θ + ∂z ∂y sin θ ∂z ∂θ = ∂z ∂x ∂x ∂θ + ∂z ∂y ∂y ∂θ = −∂z ∂x r sin θ + ∂z ∂y r cos θ Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 22 La regla se recuerda mediante el siguiente esquema z ∂z ∂x % - ∂z ∂y x y ∂x ∂r %- ∂x ∂θ ∂y ∂r %- ∂y ∂θ r θ r θ Para calcular las derivadas de segundo orden, por ejemplo ∂ 2z ∂r2 , conviene recordar que la fórmula para ∂z ∂r es ∂z ∂r (r, θ) = ∂z ∂x (r cos θ, r sin θ) cos θ + ∂z ∂y (r cos θ, r sin θ) sin θ Luego, ∂2z ∂r2 = µ ∂2z ∂x2 ∂x ∂r + ∂2z ∂y∂x ∂y ∂r ¶ cos θ + µ ∂2z ∂x∂y ∂x ∂r + ∂2z ∂y2 ∂y ∂r ¶ sin θ = ∂2z ∂x2 cos2 θ + ∂2z ∂y2 sin2 θ + 2 ∂2z ∂y∂x sin θ cos θ donde en la última igualdad se ha supuesto que ∂ 2z ∂y∂x = ∂ 2z ∂x∂y (consideramos el caso que f es C2). Queda de ejercicio calcular las otras tres derivadas de segundo orden. Ejemplo 39 Para el caso w = f(x, y, z) diferenciable y la curva ~r(t) = (x(t), y(t), z(t)) derivable, se tiene la compuesta w(t) = f(x(t), y(t), z(t)) con derivada dw dt = ∂f ∂x dx dt + ∂f ∂y dy dt + ∂f ∂z dz dt = ∇f · ~r 0 Ejemplo 40 Con z = f(u) derivable y u = g(x, t) diferenciable, la com- puesta queda z = f(g(x, t)) y sus derivadas parciales son ∂z ∂x = df du ∂u ∂x = f 0 ∂u ∂x ∂z ∂t = df du ∂u ∂t = f 0 ∂u ∂y Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 23 5.4 Teorema de la función inversa.- Desde el punto de vista (más básico) del álgebra, para que una función tenga inversa ella debe ser biyectiva. Sin embargo sabemos que restringiendo apropiadamente una función podemos conseguir que ella tenga inversa. Es el caso de las funciones trigonométricas con las conocidas arcsin, arccos, etc. El cálculo diferencial se preocupa de estudiar la diferenciabilidad (o deri- vabilidad, según sea el caso) de esta inversa. Primero damos una versión particular de este teorema para el cálculo en una variable. Teorema 41 Sea f : I → R, y x0 ∈ I tal que f 0(x0) 6= 0. Entonces existen vecindades V de x0 y W de y0 = f(x0) tales que: a) f : V →W es biyectiva b) la inversa f−1 :W → V es derivable y c) para todo y = f(x) ∈W : (f−1)0(y) = 1 f 0(x) Por ejemplo, para f : ¤−π 2 , π 2 £→ R, f(x) = sinx, se tiene: f 0(x) = cosx 6= 0. Luego, (f−1)0(y) = 1 cosx = 1√ 1−sin2 x = 1√ 1−y2 , dado que y = sinx⇔ x = arcsin y. Por lo tanto, d dx [arcsinx] = 1√ 1−x2 , ∀x ∈ ]−1, 1[ . Teorema 42 (Caso general) Sea F : A→ Rn, X → F (X), de clase C1 en el abierto A de Rn. Si JF (X0) = ³ ∂fi ∂xj (X0) ´ tiene inversa (esto es, |JF (X0)| 6= 0), entonces existen vecindades abiertas V de X0 y W de Y0 = F (X0) tales que: a) la restricción F : V →W es biyectiva b) la inversa F−1 :W → V es de clase C1 (luego diferenciable) y c) para todo Y ∈ W : DF−1(Y ) = DF (X)−1. Lo que se traduce en JF−1(Y ) = (JF (X))−1 . Nótese que el teorema garantiza la existencia de una inversa local para F , la cual es de clase C1. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 24 Un ejemplo importante lo constituye la transformación de coordenadas rectangulares a polares: T : R2 → R2, T (r, θ) = (x, y), con x = r cos θ y = r sin θ T es de clase C1 con JT (r, θ) = µ cos θ −r sin θ sin θ r cos θ ¶ |JT (r, θ)| = ¯̄̄̄ cos θ −r sin θ sin θ r cos θ ¯̄̄̄ = r Luego, para (r0, θ0) con r0 6= 0, T admite una inversa local en una vecindad abierta V de (r0, θ0) con JT−1(x, y) = 1 r µ r cos θ r sin θ − sin θ cos θ ¶ para todo (x, y) = T (r, θ) ∈W = T (V ). 5.5 Teorema de la función implicita.- Notación.- X = (x1, ..., xn) es un vector de Rn , Y = (y1, ..., ym) es un vector de Rm y (X;Y ) = (x1, ..., xn, y1, ...ym) es un vector de Rn ×Rm ∼= Rn+m. Teorema 43 Sea F : Rn×Rm → Rm, (X,Y ) 7−→ F (X,Y ) = (F1(X,Y ), ..., Fm(X,Y )), una función de n+m variables, de clase C r y sea P0 = (X0,Y0) un punto tal que i) F (X0, Y0) = θ ii) ∂(F1, ..., Fm) ∂(y1, ..., ym) (P0) = ¯̄̄̄ ¯̄̄̄ ¯ ∂F1 ∂y1 (P0) .......... ∂F1 ∂ym (P0) .... .... ∂Fm ∂y1 (P0) .......... ∂Fm ∂ym (P0) ¯̄̄̄ ¯̄̄̄ ¯ 6= 0 Entonces existen: una vecindad abierta M de (X0, Y0) (en Rn+m) una vecindad abierta N de X0 (en Rn) Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 25 y una única función G : N → Rm, X 7→ G(X), de clase C r, tal que: ∀ X ∈ N : (X,G(X)) ∈M (X,Y ) ∈M ∧ F (X,Y ) = θ ⇔ X ∈ N ∧ Y = G(X) (8) (en particular Y0 = G(X0)) y ∀ X ∈ N : DG(X) = − · ∂F ∂Y (X;G(X)) ¸−1 ◦ · ∂F ∂X (X;G(X)) ¸ (9) Observaciones.- 1.- La ecuación F (X,Y ) = θ corresponde al sistema de m ecuaciones y n+m incognitas F1(x1, ..., xn, y1, ..., ym) = 0 F2(x1, ..., xn, y1, ..., ym) = 0 Fm(x1, ..., xn, y1, ..., ym) = 0 y el Teorema da condiciones para que este sistema se pueda resolver de ma- nera única para las incognitas y1, ..., ym en términos de las incognitas (va- riables) x1, ..., xn, en una vecindad del punto (X0, Y0), conforme indica 8. 2.- El resultado para la diferencial de G expresado en 9 se puede llevar a matrices jacobianas como JG(X) = − · ∂(F1, ..., Fm) ∂(y1, ..., ym) (X,G(X)) ¸−1 · · ∂(F1, ..., Fm) ∂(x1, ..., xn) (X,G(X)) ¸ 3.- Como caso particular, cuando n = m = 1, se tiene como hipótesis f : R×R→ R, (x, y) 7→ f(x, y) de claseC r y (x0, y0) tal que f(x0, y0) = 0 ∧ ∂f ∂y (x0, y0) 6= 0 El Teorema garantiza entonces que existen vecindad abierta deM de (x0, y0) y vecindad abierta N de x0 y única función de clase C r g : N → R tal que ∀x ∈ N : (x, g(x)) ∈M (x, y) ∈ M ∧ f(x, y) = 0⇔ x ∈ N ∧ y = g(x) ∀x ∈ N : g0(x) = − ∂f ∂x (x, g(x)) ∂f ∂y (x, g(x)) Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 26 Ejercicio 44 Considere la superficie S : x2 + y2 + z2 = 1 ¿Cerca de qué puntos es posible representar S como gráfica de z = g (x, y), con g diferen- ciable?. Considerando f (x, y, z) = x2 + y2 + z2 − 1 de clase C 1 en R3, tenemos ∂f ∂z (x, y, z) = 2z. Luego, para todo punto P0 = (x0, y0, z0) ∈ S con z0 6= 0 es posible despejar, en la ecuación f (x, y, z) = 0, z = g (x, y) con g de clase C 1. Un razonamiento más general se da en el siguiente ejercicio. Ejercicio 45 Sea S la superficie, definida en forma implícita, por f (x, y, z) = 0 con f de clase C1 y considere un punto P0 = (x0, y0, z0) ∈ S donde ∇f (x0, y0, z0) 6= θ Muestre que el vector ∇f (P0) es perpendicular (ortogonal) al plano tangente a S en el punto P0. Una de las componentes del vector gradiente es no nula. Para fijar ideas suponga que ∂f ∂z (P0) 6= 0 Por teorema de la función implícita, cerca de (x0, y0, z0) : f (x, y, z) = 0 ⇔ z = g (x, y) con g de clase C1 yµ ∂z ∂x ∂z ∂y ¶ = − 1µ ∂f ∂z ¶ µ ∂f ∂x ∂f ∂y ¶ Luego, ∂z ∂x (x0, y0) = − ∂f ∂x (P0) ∂f ∂z (P0) y ∂z ∂y (x0, y0) = − ∂f ∂y (P0) ∂f ∂z (P0) Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 27 y la ecuación del plano tangente a S en P0 es z = g (x0, y0)− ∂f ∂x (P0) ∂f ∂z (P0) (x− x0)− ∂f ∂y (P0) ∂f ∂z (P0) (y − y0) ∂f ∂x (P0) (x− x0) + ∂f ∂y (P0) (y − y0) + ∂f ∂z (P0) (z − z0) = 0 lo que muestra que ∇f (P0) es perpendicular a la superficie S en P0. Ejercicio 46 Mostrar que cerca del punto (x, y, u, v) = (1, 1, 1, 1) se puede resolver el sistema xu+ yvu2 = 2 xu3 + y2v4 = 2 de manera única para u y v como función de x e y. Calcular ∂u ∂x (1, 1) . Con F1 (x, y, u, v) = xu+ yvu 2 − 2 F2 (x, y, u, v) = xu 3 + y2v4 − 2 y F = (F1, F2) el sistema es F (x, y, u, v) = (0, 0), siendo F de clase C∞. Además, ¯̄̄̄ ∂F1 ∂u ∂F1 ∂v ∂F2 ∂u ∂F2 ∂v ¯̄̄̄ (1,1,1,1) = ¯̄̄̄ x+ 2yvu yu2 3u2x 4y2v3 ¯̄̄̄ (1,1,1,1) = ¯̄̄̄ 3 1 3 4 ¯̄̄̄ = 9 6= 0 Por TFI existe (x, y) 7→ g (x, y) = (u, v) de clase C∞ que resuelve el sistema y se tieneµ ∂u ∂x ∂u ∂y ∂v ∂x ∂v ∂y ¶ (1,1) = − µ 3 1 3 4 ¶−1µ u vu2 u3 2yv4 ¶ (1,1,1,1) = −1 9 µ 4 −1 −3 3 ¶µ 1 1 1 2 ¶ = −1 9 µ 3 2 0 3 ¶ = µ −1 3 −2 9 0 −1 3 ¶ y así ∂u ∂x (1, 1) = −1 3 . Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 28 6 Máximos y mínimos. 6.1 Máximos y mínimos relativos. El término relativo corresponde al concepto local, esto es un extremo en relación sólo a los puntos vecinos de él. Definición 47 Sean f : A ⊂ Rn → R definida en un abierto A y X0 un punto de A. Se dice que X0 es un punto de máximo relativo cuando ∃r > 0 tal que ∀X ∈ B(X0, r) : f(X) ≤ f(X0) Para la definición de mínimo relativo se reemplaza ≤ por ≥. Si la f diferenciable tiene un máximo relativo en X0, entonces al darse un vector unitario ~v en Rn y definir ϕ(t) = f(X0 + t · ~v) se tiene claramente que ϕ alcanza un máximo relativo en t = 0 y luego ϕ0(0) = lim h→0 ϕ(h)− ϕ(0) h = lim h→0 f(X0 + h · ~v)− f(X0) h = 0 Esto indica que todas las derivadas direccionales de f en X0 son nulas (en particular las derivadas parciales), o sea Df(X0) = θ Definición 48 Sean f : A ⊂ Rn → R definida en un abierto A y X0 un punto de A. Se dice que X0 es un punto crítico de f cuando f no es diferenciable en X0, o bien Df(X0) = θ Para f diferenciable , X0 es punto crítico cuando todas las derivadas parciales se anulan en el punto. En este caso los puntos críticos son las soluciones del sistema de n ecuaciones y n incognitas: ∂f ∂x1 (x1, x2, ..., xn) = 0 ∂f ∂x2 (x1, x2, ..., xn) = 0 ................ ∂f ∂xn (x1, x2, ..., xn) = 0 De acuerdo al razonamiento anterior se tiene: Teorema 49 X0 extremo relativo de f ⇒ X0 punto crítico. Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 29 Los ejemplos, f(x, y) = x2 + y2, g(x, y) = −x2 − y2 y h(x, y) = y2 − x2 muestran que un punto crítico puede ser mínimo relativo o máximo relativo, o incluso, no ser máximo ni mínimo. En el último caso el punto se denomina punto de silla. Nos interesa pues un criterio que permita decidir cual es la naturaleza de un punto crítico encontrado. Cuando las derivadas parciales segundas ∂2f ∂xi∂xj son todas continuas ( f es de clase C2), la diferencial segunda de f en X0 es la forma cuadrática D2f(X0)(H) = nX i,j=1 aijhihj , con aij = ∂2f ∂xi∂xj (X0) Note que aij = aji, de acuerdo al Teorema de Schwarz. Según el Teorema de Taylor en varias variables, en una vecindad de X0 se puede escribir f(X0 +H) = f(X0) +Df(X0)(H) + 1 2! D2f(X0)(H) +R2(H) con lim H→θ R2(H) kHk2 = 0. (*). En un punto crítico, Df(X0)(H) = 0, ∀H ∈ Rn; así que f(X0 +H) = f(X0) + 1 2! D2f(X0)(H) +R2(H) En vista de (*), en una vecindad deX0 (o sea para todoH con kHk pequeña): f(X0 +H)− f(X0) ≤ 0⇔ D2f(X0)(H) ≤ 0 f(X0 +H)− f(X0) ≥ 0⇔ D2f(X0)(H) ≥ 0 Observe que las condiciones del lado izquierdo en las equivalencias indican que X0 es un extremo relativo. Las condiciones del lado derecho se estudian para formas cuadráticas en el contexto del algebra lineal. 6.1.1 Formas cuadráticas. Una forma cuadrática es una aplicación q : Rn → R , de las forma q(X) = nX i,j=1 aijxixj , con aij = aji Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 30 La matriz A = a11 ...... a1n.... an1 ...... ann , simétrica de orden n× n, representa a q en el sentido que q(X) = XTAX, es decir q(x1, ...., xn) = (x1.....xn) a11 ...... a1n.... an1 ...... ann x1 xn Definición 50 Para una forma cuadrática q se dice: q es definida positiva⇔ q(X) ≥ 0, ∀X 6= θ q es definida negativa⇔ q(X) ≤ 0, ∀X 6= θ q es no definida⇔Existen X1, X2 tales que q(X1) < 0 < q(X2). En vista que la matrizA que representa a la forma cuadrática es simétrica, se tiene que todos sus valores propios son reales.y se puede probar que: a) todos los valores propios de A son positivos⇒ q definida positiva. b) todos los valores propios de A son negativos⇒ q definida negativa c) si la matriz posee al menos un valor propio positivo y un valor propio negativo, entonces la forma cuadrática es no definida. El criterio que permite determinar de que tipo es una forma cuadrática considera el cálculo de los siguientes n determinates obtenidos a partir de la matriz A : ∆1 = a11, ∆2 = ¯̄̄̄ a11 a12 a21 a22 ¯̄̄̄ , ..., ∆n = |A| Teorema 51 Para cada k entre 1 y n sea ∆k el determinante de orden k formado por las primeras k filas y k columnas de la matriz A. Si se tiene ∆n = |A| 6= 0 , entonces: a) ∀k : ∆k > 0⇒ q es definida positiva. b) ∀k : (−1)k∆k > 0⇒ q es definida negativa. c) en todo otro caso q es no definida. Caso de dos variables.- Para f : A ⊂ R2 → R, (x, y) 7→ f(x, y) de clase C2 en el abierto A. Sea (x0, y0) un punto crítico, esto es, un punto tal que fx(x0, y0) = fy(x0, y0) = 0 y sea ∆ = ∆(x0, y0) = ¯̄̄̄ fxx(x0, y0) fxy(x0, y0) fyx(x0, y0) fyy(x0, y0) ¯̄̄̄ = fxx(x0, y0)fyy(x0, y0)−fxy(x0, y0)2 se tiene entonces: Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 31 a) fxx(x0, y0) > 0 ∧ ∆ > 0⇒ (x0, y0) es un mínimo relativo. b) fxx(x0, y0) < 0 ∧ ∆ > 0⇒ (x0, y0) es un máximo relativo. c) ∆ < 0⇒ (x0, y0) es un punto de silla. d) Para ∆ = 0, el criterio no da información. Ejemplo 52 Identifique y clasifique los puntos críticos de f(x, y) = x2y − 2xy + 2y2 − 15y Caso de tres variables.- Para f : A ⊂ R3 → R, (x, y, z) 7→ f(x, y, z) de clase C2 en el abierto A. Sea (x0, y0, z0) un punto crítico, esto es, un punto tal que fx(x0, y0, z0) = fy(x0, y0, z0) = fz(x0, y0, z0) = 0 y sea ∆3 = ∆3(x0, y0, z0) = ¯̄̄̄ ¯̄ fxx(x0, y0, z0) fxy(x0, y0, z0) fxz(x0, y0, z0)fyx(x0, y0, z0) fyy(x0, y0, z0) fyz(x0, y0, z0) fzx(x0, y0, z0) fzy(x0, y0, z0) fzz(x0, y0, z0) ¯̄̄̄ ¯̄ 6= 0 se tiene entonces: a) fxx> 0, ∆2 > 0, ∆3 > 0⇒ (x0, y0, z0) es un mínimo relativo. b) fxx < 0, ∆2 > 0, ∆3 < 0⇒ (x0, y0, z0) es un máximo relativo. c) en otro caso el punto es silla. Ejemplo 53 Identifique y clasifique los puntos críticos de f (x, y, z) = −x2 − y3 + xy − z2 + 2z 6.2 Extremos relativos condicionados (multiplicadores de Lagrange). Según el teorema de la función implícita, la ecuación g(x, y) = 0, con g de clase C1, determina una curva C en el plano xy que admite recta tangente en todo punto para el cual ∇g(x, y) 6= θ. Además en dichos puntos, ∇g(x, y) es perpendicular a la curva C. El problema a resolver es encontrar los extremos relativos de la función f(x, y) sobre puntos de la curva C, el cual se escribe Maximizar (o minimizar) f(x, y) sujeto a g(x, y) = 0 Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 32 Ejemplo 54 Encontrar los extremos relativos de f(x, y) = y − x2 sujeto a x2 + y2 = 1. Geométricamente, las curvas de nivel de f son parábolas de ecuación f(x, y) = y − x2 = c, con c constante real. El siguiente gráfico muestra la circunferencia unitaria x2 + y2 = 1, junto con las curvas de nivel de f , para c = −5 4 ,−1,−1 2 , 0, 1 2 , 1 (en el mismo orden de abajo hacia arriba). Se ve que una curva de nivel para c > 1 no corta la circunferencia, como también para c < −5 4 . El análisis geométrico muestra que los puntos extremos relativos se pro- ducen cuando hay tangencia entre la circunferencia y alguna curva de nivel. Si consideramos los vectores gradientes a las curvas, que son perpendiculares a éstas, ellos serán paralelos en dichos puntos extremos. Así ∇f(x, y) = λ ·∇g(x, y) en los puntos extremos relativos. El método de multiplicadores de Lagrange establece que los puntos extremos relativos se encuentran en las soluciones del sistema ∇f(x, y) = λ ·∇g(x, y) g(x, y) = 0 Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 33 Este es un sistema de 3 ecuaciones y 3 incognitas: x, y; λ. Para nuestro ejemplo −2x = λ2x 1 = λ2y x2 + y2 = 1 La primera ecuación da x(λ+ 1) = 0, lo que implica dos posibilidades: a) x = 0 : y así y = 1, λ = 1 2 o también y = −1, λ = −1 2 b) λ = −1 : y así y = −1 2 , x = √ 3 2 o también y = −1 2 , x = − √ 3 2 Tenemos 4 soluciones que conducen a los 4 extremos relativos: (0, 1) y (0,−1) máximos relativos, y ( √ 3 2 , −1 2 ) y (− √ 3 2 , −1 2 ) mínimos relativos. Teorema 55 Sean f : A ⊂ R2 → R y g : A ⊂ R2 → R de clase C1. Si (x0, y0) ∈ A es tal que g(x0, y0) = 0 y ∇g(x0, y0) 6= θ entonces para que f alcance un extremo relativo en (x0, y0) es necesario que ∃λ ∈ R (multiplicador de Lagrange) tal que ∇f(x0, y0) = λ ·∇g(x0, y0). En el caso de una f de 3 variables (x, y, z) → f(x, y, z), una condición (restricción) del tipo g(x, y, z) = 0, con g de clase C1, determina una superficie en R3. Para ésta, si en un punto ∇g(x, y, z) 6= θ, entonces ∇g(x, y, z) es un vector perpendicular a la superficie (o sea perpendicular al plano tangente a la superficie). Si se agrega una segunda condición h(x, y, z) = 0, del mismo tipo, tenemos dos superficies cuya intersección (casi siempre) es una curva en R3. Si en un punto (x0,y0, z0) de esta curva los gradientes de g y h son linealmente independientes (no son paralelos), entonces la curva posee una recta tangente perpendicular al plano generado por los gradientes. El método de multiplicadores de Lagrange indica que: a) la función f(x, y, z) de clase C1, posee extremos relativos en los puntos de la superficie g(x, y, z) = 0 donde ∇f(x, y, z) = λ ·∇g(x, y, z). b) la función f(x, y, z) de clase C1, posee extremos relativos en los puntos de la curva g(x, y, z) = 0, h(x, y, z) = 0 donde ∇f(x, y, z) = λ ·∇g(x, y, z) + µ ·∇h(x, y, z). Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 34 6.3 Extremos absolutos En este caso los extremos son de carácter global. Al respecto contamos con el siguiente resultado. Teorema 56 (de los valores extremos). Si f : K ⊂ Rn → R es continua sobre el compacto K, entonces existen X1,X2 ∈ K tales que ∀X ∈ K : f (X1) ≤ f (X) ≤ f (X2) X1 se denomina el punto de mínimo absoluto de f sobre K y f (X1) el valor mínimo absoluto de f sobre K. En forma análoga, X2 será máximo absoluto. ¿Cómo encontrar estos puntos Xk, con k = 1, 2, de extremos absolutos? Se deben tener en cuenta los siguientes hechos: 1. Si Xk pertenece al interior del compacto K, entonces será también un extremo relativo y, en consecuencia, un punto crítico. 2. Si Xk no pertenece al interior del compacto K,entonces el punto está en la frontera de K. Por esta razón el procedimiento para determinar los extremos absolutos considera: a) Encontrar todos los puntos críticos en K̊. b) Encontrar los extremos en Fr (K) . c) Finalmente, evaluar f en todos los puntos encontrados en a) y en b), para elegir los extremos. Ejemplo 57 La temperatura de la placa metálica x2 + y2 ≤ 6 está dada por T (x, y) = 4x2 + 9y2 − x2y2. a) Determine los puntos críticos de T en el conjunto x2+y2 < 6 y determine la naturaleza de uno de ellos. El sistema 8x− 2xy2 = 0 18y − 2x2y = 0 , tiene soluciones: {y = 0, x = 0} , {x = 3, y = 2} {x = 3, y = −2} , {x = −3, y = 2} , {x = −3, y = −2} . Pero sólo el (0, 0) pertenece al círculo abierto. El Hessiano de T : ¯̄̄̄ 8− 2y2 −4xy −4xy 18− 2x2 ¯̄̄̄ Héctor Palma Valenzuela. Dpto. de Matemática UdeC. 35 En (0, 0) : ¯̄̄̄ 8 0 0 18 ¯̄̄̄ , lo que indica que (0, 0) es un mínimo relativo. b) Encuentre los puntos de mayor y menor temperatura en la placa. Aplicando el método de multiplicadores de Lagrange se resuelve el sistema 8x− 2xy2 = 2λx 18y − 2x2y = 2λy x2 + y2 = 6 A partir de la primera ecuación: x(4− y2 − λ) = 0 se obtiene: i) x = 0, y = ±√6, λ = 9 ii) λ = 4− y2 y se resuelve y(9− x2 − 4 + y2) = 0 x2 + y2 = 6 quedando y(2y2 − 1) = 0. Así, y = 0, x = ± √ 6, λ = 4 y = ± r 1 2 , x = ± r 11 2 , λ = 7 2 Finalmente se evalúa: T (0, 0) = 0 , T (0,±√6) = 54, T (±√6, 0) = 24, T (± q 11 2 ,± q 1 2 ) = 95 4 = 23. 75 De donde, (0, 0) es el punto de menor temperatura y los puntos (±√6, 0) son los de mayor temperatura. c) ¿En qué puntos de la placa la dirección de mayor crecimiento de la tempe- ratura es vertical? (está dada por el eje y). La dirección de mayor crecimiento está dada por ∇T (x, y) = ¡8x− 2xy2¢ · ı̂+ ¡18y − 2x2y¢ · ̂ Este vector es vertical cuando x = 0 (sobre el eje y) y cuando y = ±2 (dos segmentos de rectas) Ejemplo 58 La temperatura en un punto (x, y, z) está determinada por la función T (x, y, z) = 20 + 2x + 2y + z2 . Encuentre el (los) punto(s) de mayor tem- peratura sobre: a) la esfera x2 + y2 + z2 = 11 b) la curva intersección de la esfera x2+y2+z2 = 11 y el plano x+y+z = 3.
Compartir