CALCULO_3

Cálculo I

•
Engenharias

Pedro Sánchez moreno
6/11/2023
¡Este material tiene más páginas!
Entonces, ¿te gustó este material?
Ayude a animar a otros estudiantes a mejorar el contenido
¿Te gustó este material? ¡Compartir! 🧡
Cálculo I

181.862 Materiales compartidos
Descarga la aplicación para disfrutar aún más
Lea materiales sin conexión, sin usar Internet. Además de muchas otras características!
Vista previa del material en texto
NOTAS DE CLASE
CÁLCULO III
Doris Hinestroza
Diego L. Hoyos
1
Índice general
1. Funciones Vectoriales 5
1.1. El Espacio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2. Funciones Vectoriales . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1. Operaciones algebraicas. . . . . . . . . . . . . . . . . . . 8
1.2.2. Límites, derivadas e integrales. . . . . . . . . . . . . . . 9
1.2.2.1. Teoremas básicos . . . . . . . . . . . . . . . . . 10
1.3. Curvas y Tangentes . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4. Longitud de arco y reparametrización de una curva. . . . . . . 14
1.5. Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.5.1. Triedro de Frenet . . . . . . . . . . . . . . . . . . . . . . 19
1.5.2. El vector aceleración. . . . . . . . . . . . . . . . . . . . 20
1.5.3. *Ecuaciones de Frenet para una curva plana. . . . . . . 21
2. Campos Escalares en R2 y R3 24
2.1. Gráfica de z = f(x, y). Curvas y superficies de nivel. . . . . . . 24
2.1.1. Superficies cuádricas. . . . . . . . . . . . . . . . . . . . . 31
2.2. Límites y Continuidad . . . . . . . . . . . . . . . . . . . . . . . 31
2.3. Funciones Diferenciables . . . . . . . . . . . . . . . . . . . . . . 34
2.3.1. Derivadas parciales . . . . . . . . . . . . . . . . . . . . . 34
2.3.2. Superficies parametrizadas . . . . . . . . . . . . . . . . . 35
2.3.3. El plano tangente . . . . . . . . . . . . . . . . . . . . . . 38
2.3.4. El concepto de diferenciabilidad . . . . . . . . . . . . . . 39
2.4. La Regla de la Cadena . . . . . . . . . . . . . . . . . . . . . . . 44
2.4.1. El vector gradiente . . . . . . . . . . . . . . . . . . . . . 46
2.5. Derivadas Direccionales . . . . . . . . . . . . . . . . . . . . . . 48
2.6. Máximos y Mínimos. . . . . . . . . . . . . . . . . . . . . . . . . 51
2.6.1. Criterio para determinar extremos de funciones de dos
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.6.2. Extremos condicionados. . . . . . . . . . . . . . . . . . 55
2.7. *Temas de Lectura . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.7.1. Campos Escalares y Campos Vectoriales . . . . . . . . . 65
2
2.7.2. Derivada en una dirección de un campo escalar en Rn.
Derivadas direccionales y parciales. . . . . . . . . . . . . 66
2.7.3. Diferenciabilidad de un campo escalar en Rn. . . . . . . 68
2.7.4. Regla de la cadena para campos escalares en Rn. . . . . 71
2.7.5. Derivada en una dirección de un campo vectorial. Deriva-
da direccional . . . . . . . . . . . . . . . . . . . . . . . . 73
2.7.6. Diferenciabilidad de un campo vectorial . . . . . . . . . 74
2.7.7. Regla de la cadena para campos vectoriales. . . . . . . . 76
2.7.8. Fórmula de Taylor de orden dos para campos escalares . 80
2.7.9. Naturaleza de un punto crítico teniendo como criterio los
valores propios de la matriz Hessiana . . . . . . . . . . . 82
2.7.10. Criterio para determinar extremos de funciones de dos
variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
2.7.11. Ley de la conservación de la energía. Campos conservativos 85
3. Integrales Múltiples 87
3.1. Integrales Dobles . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.1.1. Propiedades de la Integral doble . . . . . . . . . . . . . 88
3.1.2. Integración en regiones más generales . . . . . . . . . . 89
3.1.3. Cálculo de integrales dobles: áreas y volúmenes. . . . . . 91
3.1.4. Cambio de variable . . . . . . . . . . . . . . . . . . . . 95
3.1.4.1. La fórmula del cambio de variable . . . . . . . 97
3.2. Integrales Triples . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.2.1. Regiones más generales . . . . . . . . . . . . . . . . . . 102
3.2.2. Cambio de variable en integrales triples. . . . . . . . . . 104
3.2.2.1. Coordenadas cilíndricas. . . . . . . . . . . . . . 105
3.2.2.2. Coordenadas esféricas. . . . . . . . . . . . . . . 106
3.3. Aplicaciones de las integrales múltiples. . . . . . . . . . . . . . 107
3.3.1. Momentos y centros de masa. . . . . . . . . . . . . . . . 107
3.3.2. Densidad y masa. . . . . . . . . . . . . . . . . . . . . . . 109
3.3.3. Momento de Inercia. . . . . . . . . . . . . . . . . . . . 112
3.3.4. Probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . 116
3.3.4.1. Valores esperados . . . . . . . . . . . . . . . . 116
4. Integrales de Línea. Áreas de Superficies e Integrales de Su-
perficie 117
4.1. Integral de Línea . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.1.1. Propiedades de la Integrales de línea . . . . . . . . . . 119
4.2. El concepto de trabajo como integral de línea . . . . . . . . . . 121
4.3. Campos conservativos y funciones potenciales . . . . . . . . . . 123
4.4. El teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . 124
4.5. Área de una superficie . . . . . . . . . . . . . . . . . . . . . . . 130
4.6. Integral de superficie . . . . . . . . . . . . . . . . . . . . . . . . 133
3
4.6.1. Integral de superficie de una función escalar . . . . . . . 133
4.6.2. Integral de superficie de un campo vectorial . . . . . . . 134
4
Capítulo 1
Funciones Vectoriales
En este caṕítulo combinaremos el álgebra lineal y los métodos fundamentales
del cálculo para estudiar algunas aplicaciones de las curvas y algunos problemas
de Mecánica.
1.1. El Espacio Rn
El espacio Rn es el conjunto de todas las n-uplas de números reales:
R
n = {(x1, x2, ..., xn) : xi ∈ R, i = 1, 2, 3, ...n)} .
Los elementos de Rn se le llaman vectores.
En Rn definimos la suma de vectores y producto por escalares. Si −→a = (x1, x2, ..., xn)
y
−→
b = (y1, y2, ..., yn) entonces
−→a + −→b es el elemento de Rn dado por
−→a + −→b = (x1 + y1, x2 + y2, ..., xn + yn).
Para cada escalar λ ∈ R, el vector λ−→a es definido por
λ−→a = (λx1, λx2, ..., λxn).
El producto escalar entre dos vectores de Rn está definido por
−→a · −→b =
n
∑
i=1
xiyi.
Recordemos algunas propiedades del producto escalar:
5
−→a · −→b = −→b · −→a
(−→a + −→b ) · −→c = −→a · −→c + −→b · −→c
(−→
λa
)
· −→b = λ
(−→a · −→b
)
= −→a ·
(−→
λb
)
La longitud o norma de un vector de Rn es definida por
||−→a || =
√−→a .−→a =
√
(x1)
2
+ (x2)
2
+ ... + (xn)
2
o
||−→a ||2 = −→a · −→a .
La distancia entre −→a y −→b se define por
dist(−→a ,−→b ) = ‖−→a −−→b ‖,
para cada −→a y −→b ∈ Rn
Propiedades importantes de la definición de longitud o norma son las siguientes:
||−→a || ≥ 0, ∀−→a ∈ Rn
||λ−→a || = |λ| ||−→a ||
||−→a + −→b || ≤ ||−→a || + ||−→b ||
∣
∣
∣
−→a · −→b
∣
∣
∣ ≤ ||−→a || ||−→b ||
El ángulo θ entre los vectores −→a y −→b está dado por la relación.
cos θ =
−→a · −→b
‖−→a ‖ ‖−→b ‖
En el caso que −→a y −→b ∈ R3 definiremos otro producto entre vectores conocido
como producto vectorial que se denota por −→a ×−→b y lo definimos como
−→a ×−→b =
∣
∣
∣
∣
∣
∣
i j k
x1 x2 x3
y1 y2 y3
∣
∣
∣
∣
∣
∣
= (x2y3 − x3y2, x3y1 − x1y3, x1y2 − x2y1).
6
Recordemos algunas propiedades del producto vectorial
−→a ×−→b ⊥ −→a y −→a ×−→b ⊥ −→b
−→a ×−→b = −−→b ×−→a
(−→a + −→b ) ×−→c = −→a ×−→c + −→b ×−→c
−→a ×
(−→
b ×−→c
)
= (−→a · −→c )−→b −
(−→a · −→b
)−→c
(λ−→a ) ×−→b = λ
(−→a ×−→b
)
= −→a ×
(
λ
−→
b
)
(−→a ×−→b ) · −→c = −→a ·
(−→
b ×−→c
)
.
La norma de −→a ×−→b está dada por
||−→a ×−→b || = ||−→a || ||−→b ||sen θ
donde θ es el ángulo comprendido entre estos vectores.
1.2. Funciones Vectoriales
Una
−→
F : J → Rn donde J es un conjunto de números reales, se llama función
vectorial.
El valor de la función
−→
F en t lo designaremos corrientemente por
−→
F (t). Puesto
que
−→
F (t) ∈ Rn −→
F (t) = (f1(t), f2(t), ..., fn(t))
donde cada fi es una función real fi : J → R, i = 1, 2, ...n. Las funciones
fi son llamadas las componentes de la función vectorial
−→
F . Aśí, cada función
vectorial da origen a n funciones reales f1, f2,...,fn. Indicaremos esta relación
por
−→
F = (f1, f2,..,fn). Llamamos a la variable t el parámetro de la función.
La ecuación −→x = −→F (t) donde −→x = (x1, x2, ..., xn) ∈ Rn, nos permite definir
las ecuaciones
x1 = f1(t)
x2 = f2(t)
...
xn = fn(t)llamadas ecuaciones paramétricas con parámetro t.
En algunos casos representaremos las funciones vectoriales como combinación
lineal de la base usual en Rn. Por ejemplo cuando n = 2 algunas veces uti-
lizaremos la representación
−→
F (t) = (x(t), y(t)) = x(t)i + y(t)j donde i = (1, 0)
7
y j = (0, 1) y cuando n = 3 utilizaremos
−→
F (t) = (x(t),y(t),z(t)) =x(t)i +
y(t)j+z(t)k donde i = (1, 0, 0), j = (0, 1, 0), k =(0, 0, 1).
Ejemplo 1.2.1 Consideremos el caso de la ecuación de una recta que pasa
por el punto P0 = (a, b, c) y tiene vector director
−→a = (l, m, n) . Las ecuaciones
paramétricas de la recta están dadas por
x = a + lt,
y = b + mt,
z = c + nt.
Estas variables las podemos escribir en forma vectorial de la siguiente manera−−→
F (t) = (x(t), y(t), z(t)) = (a+lt, b+mt, c+nt) = (a, b, c)+t(l, m, n) = P0+t
−→a ,
donde el parámetro t ∈ R. Así́, la ecuación vectorial de la recta define la
función vectorial −→
F (t) = P0 + t
−→a .
Ejemplo 1.2.2 Si consideramos las ecuaciones paramétricas dadas por x =
cos t y y = sent, 0 ≤ t ≤ 2π, obtenemos la función vectorial
−→
F (t) = cos ti + sen tj.
La norma o longitud de
−−→
F (t) para cada t está dada por
∥
∥
∥
−→
F (t)
∥
∥
∥ =
√
cos2 t + sen2t = 1.
El vector
−→
F (t) describe una circunferencia de radio 1 en sentido contrario a
las manecillas del reloj dando una vuelta completa cuando t aumenta de 0 a
2π.
1.2.1. Operaciones algebraicas.
Las operaciones algebraicas de los vectores pueden aplicarse para las funciones
vectoriales. Sean
−→
F ,
−→
G , funciones vectoriales definidas sobre un dominio común
y f una función real, entonces definimos las funciones
−→
F +
−→
G, f
−→
F ,
−→
F · −→G,
mediante
(−→
F +
−→
G
)
(t) =
−−→
F (t) +
−−→
G(t),
f
−→
F (t) = f(t)
−→
F (t),
(−→
F · −→G
)
(t) =
−→
F (t) · −→G(t).
8
(El producto aqúí considerado es el de producto escalar).
Observemos que el producto escalar de funciones vectoriales es una función
real.
Además en el caso de que
−→
F y
−→
G tengan sus valores en R3 podemos definir el
producto vectorial
(−→
F ×−→G
)
(t) =
−→
F (t) × −→G (t).
1.2.2. Límites, derivadas e integrales.
Los conceptos fundamentales de ĺímite, continuidad, derivadas e integral pueden
generalizarse naturalmente para funciones vectoriales.
Si
−→
F = (f1, f2,..,fn) es una función vectorial y L = (l1, l2, ..., ln) ∈ Rn, definimos
el ĺímite por
ĺım
t→a
−→
F (t) = L ⇐⇒ ĺım
t→a
f1(t) = l1, ĺım
t→a
f2(t) = l2, ĺım
t→a
fn(t) = ln
siempre que los ĺímites existan.
Diremos que
−→
F es continua en a si ĺım
t→a
−→
F (t) =
−→
F (a). Es decir,
−→
F es continua
en a si y solo si cada componente es continua en a.
Si una función vectorial continua está definida en el intervalo [a, b], entonces ca-
da componente real es continua en [a, b] y por lo tanto integrable. Aśí podemos
definir
∫ b
a
−→
F (t)dt =
(
∫ b
a
f1(t)dt,
∫ b
a
f2(t)dt, ...,
∫ b
a
fn(t)dt
)
Igualmente, la derivada
−→
F ′(t) de una función vectorial
−→
F (t) se define exacta-
mente de la misma forma que la derivada de una función real, es decir
−→
F (t) es
diferenciable en t, si
−→
F ′(t) = ĺım
h→0
−→
F (t + h) −−→F (t)
h
existe. De acuerdo a la definición del ĺímite para funciones vectoriales podemos
decir que la función vectorial
−−→
F (t) es diferenciable si y sólo si cada componente
es diferenciable. En este caso
−→
F ′(t) = (f ′1(t), f
′
2(t), ..., f
′
n(t))
Diremos que
−→
F es continua, derivable o integrable en un intervalo si cada com-
ponente lo es. De acuerdo a estas definiciones muchos de los resultados sobre
ĺímites, continuidad, derivación e integración de funciones reales son válidos
para las funciones vectoriales.
9
Denotaremos las derivadas por
−→
F ′(t) = Dt
−→
F =
d
−→
F
dt
.
En el caso de n = 2, si
−→
F (t) = (x(t), y(t)) = x(t)i + y(t)j,
−→
F ′(t) = Dt
−→
F =
d
−→
F
dt
=
(
dx
dt
,
dy
dt
)
=
dx
dt
i +
dy
dt
j.
En el caso de n = 3, si
−→
F (t) = (x(t), y(t), z(t)) = x(t)i + y(t)j+z(t)k,
−→
F ′(t) = Dt
−→
F =
d
−→
F
dt
=
(
dx
dt
,
dy
dt
,
dz
dt
)
=
dx
dt
i +
dy
dt
j+
dz
dt
k.
1.2.2.1. Teoremas básicos
Teorema 1.2.1 Si
−→
F ,
−→
G , funciones vectoriales y f una función real son
diferenciables, entonces lo mismo ocurre con las funciones
−→
F +
−→
G, f
−→
F ,
−→
F ·−→G,
y tenemos
(
−→
F +
−→
G)′ =
−→
F ′ +
−→
G′
(f
−→
F )′ = f ′
−→
F + f
−→
F ′
(−→
F · −→G
)′
=
−→
F ′ · −→G + −→F ·
−→
G′
Si
−→
F y
−→
G tienen valores en R3, entonces
(−→
F ×−→G
)′
=
−→
F ′ ×−→G + −→F ×
−→
G′
Demostración. Vamos a demostrar la segunda propiedad. Las demás se prue-
ban de manera similar.
(f
−→
F )′ = ((ff1)
′
, (ff2)
′
, ..., (ffn)
′
)
= (f ′f1 + ff
′
1, f
′f2 + ff
′
2, ..., f
′fn + ff
′
n)
= f ′(f1, f2, ..., fn) + f(f
′
1, f
′
2, ..., f
′
n)
= f ′
−→
F + f
−→
F ′
El siguiente es un teorema muy importante y caracteriza las funciones vectori-
ales que tienen longitud constante.
10
Teorema 1.2.2 Una función vectorial
−→
F (t) diferenciable tiene longitud con-
stante en un intervalo abierto I, si y sólo si
−→
F (t) ·−→F ′(t) = 0. Esto significa que
los vectores
−→
F (t) y
−→
F ′(t) son perpendiculares para cada t ∈ I.
Demostración. Vamos inicialmente a suponer que la longitud de
−→
F (t) es
constante. Definamos la función g(t) = ||−→F (t)||2 = −→F (t) · −→F (t). De acuerdo a
la hipótesis g(t) = c para todo t ∈ I donde c es una constante. Por lo tanto
g′(t) = 0 en I. Como g es un producto escalar, tenemos que
g′(t) =
−→
F ′(t) · −→F (t) + −→F (t) ·
−→
F ′(t) = 2
−→
F (t) ·
−→
F ′(t) = 0,
entonces
−→
F (t) · −→F ′(t) = 0 en I.
Para mostrar el rećíproco consideremos que
−→
F (t) · −→F ′(t) = 0 en I y definamos
g(t) =
∥
∥
∥
−→
F (t)
∥
∥
∥
2
. Derivando g(t) tenemos que g′(t) = 2
−→
F (t) · −→F ′(t) y aplicando
la hipótesis tenemos que g′(t) = 0 para todo t ∈ I. Aśí la longitud de −→F (t) es
constante.
Los siguientes teoremas se demuestran teniendo en cuenta las propiedades de
los vectores y los teoremas básicos de derivadas de una variable como la regla
de la cadena y los teoremas fundamentales del cálculo.
Teorema 1.2.3 (Regla de la cadena para funciones vectoriales). Sea−→
G =
−→
F ◦ u donde −→F es una función vectorial y u es una función real. Si u es
continua en t y
−→
F es continua en u(t) entonces G es continua en t. Además si
u es diferenciable en t y
−→
F es diferenciable en u(t) entonces
−→
G es diferenciable
en t y −→
G′(t) =
−→
F ′(u(t))u′(t).
Teorema 1.2.4 (Primer Teorema Fundamental del Calculo para funciones
Vectoriales) Sea
−→
F : [a, b] → Rn una función vectorial continua y definamos
−→
A (t) =
∫ t
a
−→
F (s)ds, a ≤ t ≤ b
Entonces
−→
A′ existe y
−→
A′(t) =
−→
F (t).
Teorema 1.2.5 (Segundo Teorema Fundamental del Calculo para funciones
Vectoriales). Supongamos que la función
−→
F tiene derivada continua
−→
F ′ en un
intervalo I. Entonces para cada t ∈ I tenemos
∫ t
a
−→
F ′(s)ds =
−→
F (t) −−→F (a)
11
o
−→
F (t) =
−→
F (a) +
∫ t
a
−→
F ′(s)ds.
1.3. Curvas y Tangentes
A las funciones vectoriales diferenciables las llamaremos curvas y las denotare-
mos con la letra −→r en lugar de la letra −→F . Así, una curva en Rnes una función
−→r : I → Rn diferenciable; la curva es regular, si −→r′ (t) 6= −→0 para todo t. A no
ser que se diga lo contrario, nuestras curvas siempre serán regulares. También
llamaremos curva o trayectoria al rango o conjunto imagen de la función −→r ,
esto es, al conjunto C definido por
C = {−→x : −→x = −→r (t) para algún t ∈ I}.
En este caso, la función −→r se denomina parametrización de C, y diremos que
la curva C está descrita paramétricamente (o parametrizada) por −→r . Cuando
n = 2 ó 3 podemos representar geométricamente la curva. Por ejemplo, en el
caso de n = 3, la curva descrita por −→r (t) = P + t−→a es una ĺínea recta que pasa
por el punto P y tiene vector director −→a .
Observación 1.3.1 El gráfico de cualquier función real y = f(x) puede ser
dado en forma paramétrica mediante las ecuaciones: x = t y = f(t) o en formavectorial como
−→r (t) = (t, f(t)).
Definición 1.3.1 La derivada
−→
r′ (t0) de una curva
−→r en t0 está ligada al con-
cepto de tangencia, como en el caso de una función real. Formamos el cociente
de Newton −→r (t0 + h) −−→r (t0)
h
,
12
Investigamos el comportamiento de este cociente cuando h → 0. El cociente es
el producto del vector −→r (t0 + h) − −→r (t0) por el escalar 1/h. Observemos que
el numerador es paralelo a este cociente. Si hacemos que h → 0 tenemos que
ĺım
h→0
−→r (t0 + h) −−→r (t0)
h
=
−→
r′ (t0)
suponiendo que este ĺímite exista. La interpretación geométrica sugiere la sigu-
iente definición.
Definición 1.3.2 Sea C la curva parametrizada por −→r = −→r (t). Si la derivada−→
r′ existe y no es nula, la ecuación de la recta tangente que pasa por el punto
−→r (t0) y tiene vector director
−→
r′ (t0) está dada por
−→r (t) = −→r (t0) + t
−→
r′ (t0). El
vector
−→
r′ (t0) se llama vector tangente a C en
−→r (t0).
Ejemplo 1.3.1 Recta. Consideremos la función vectorial −→r (t) = P + t−→a ,
siendo −→a 6= −→0 , tenemos que −→r′ = −→a , así́ que la recta tangente coincide con la
curva de −→r .
Ejemplo 1.3.2 Circunferencia. Si −→r (t) describe una circunferencia de radio
R y centro en el punto P , entonces ||−→r (t) − P || = R. El vector −→r (t) − P
geométricamente representa un vector que va desde el punto P al punto −→r (t).
Puesto que este radio vector tiene longitud constante, tenemos que −→r (t) − P
y su derivada (−→r (t) − P )′ = −→r′ (t) son perpendiculares y por lo tanto el radio
vector es perpendicular a la recta tangente. Así́ pues, para una circunferencia
la definición de tangente coincide con aquella dada en la geometríáa elemental.
Puede pensarse que la curva C es la trayectoria de una partícula que se mueve
en el espacio a medida que transcurre el tiempo t, así, −→r (t) es la posición
de la partícula en el tiempo t.
−→
r′ (t) es entonces la velocidad de la partícula,
que también denotamos −→v (t). La norma de la velocidad ‖ −→v (t) ‖ se denomina
13
rapidez de la curva y se denota v(t). La segunda derivada
−→
r′′(t) es la aceleración
de la curva y se denota −→a (t).
Si conocemos la aceleración de una partícula en un tiempo t y si también sabe-
mos su velocidad y su posición en un tiempo específico t0, entonces podemos
conocer su velocidad y su posición en cualquier tiempo t, como se muestra en
el siguiente ejemplo.
Ejemplo 1.3.3 Se sabe que la aceleración de una partícula que se mueve en
el espacio está dada por −→a (t) = 2t−→i + sent−→j + cos 2t−→k . Si su velocidad y
posición en t = 0 están dados por −→v (0) = −→i y −→r (0) = −→j , hallar su posición
en cualquier tiempo t.
Solución. Puesto que −→a (t) = −→v′ (t), entonces
−→v (t) =
∫ −→a (t)dt =
∫
(2t
−→
i +sent
−→
j +cos 2t
−→
k )dt = t2
−→
i −cos t−→j + 12 sen2t
−→
k +−→c ,
donde la constante −→c = (c1, c2, c3). Por un lado −→v (0) = (0,−1, 0)+(c1, c2, c3) =
(c1, c2−1, c3) y por otro lado, −→v (0) = (1, 0, 0), de tal manera que c1 = 1, c2 = 1
y c3 = 0, y la velocidad es entonces
−→v (t) = (t2+1)−→i +(1−cos t)−→j + 12 sen2t
−→
k .
Ya podemos hallar su posición puesto que
−→r (t) =
∫
−→v (t)dt = ( t
3
3
+ t)
−→
i + (t − sent)−→j − 1
4
cos 2t
−→
k + (c1, c2, c3)
y puesto que por hipótesis −→r (0) = (0, 1, 0), y por otro lado −→r (0) = (c1, c2,− 14 +
c3) tenemos que la posición en un tiempo t está dada por
−→r (t) = ( t
3
3
+ t)
−→
i +
(t − sent + 1)−→j + (14 − 14 cos 2t)
−→
k .
1.4. Longitud de arco y reparametrización de una
curva.
Sea C una curva parametrizada por −→r = −→r (t), t ∈ [a, b]. Si reemplazamos t
por una función diferenciable h : [c, d] → [a, b], creciente o decreciente de otra
variable u, t = h(u), obtenemos una nueva parametrización de −→r de la forma−→α (u) = −→r (h(u)), esto es, la composición de r con h.
Nota: A veces, para simplificar la notación y cuando no haya peligro de con-
fusión, denotaremos la reparametrización −→α con la misma letra −→r y en lugar
de escribir t = h(u) escribimos t = t(u) así: −→r (u) = −→r (t(u)); lo mismo para
la inversa u = h−1(t) escribimos u = u(t). Si h es creciente, diremos que el
cambio de parámetro preserva la orientación y si h es decreciente, diremos que
14
h invierte la orientación.
Ejemplo 1.4.1 Sabemos que la ecuación y =
√
1 − x2, x ∈ [−1, 1] repre-
senta la mitad superior de un círculo de radio 1. Podemos parametrizar di-
cho semicírculo por −→r (t) = (t,
√
1 − t2), t ∈ [−1, 1] con orientación del
punto (−1, 0) al punto (1, 0). Escribiendo t = t(u) = cosu obtenemos la
reparametrización −→r (u) = (cosu,
√
1 − cos2 u) = (cos u, sen u). Si tomamos
u ∈ [0, π] = [arc cos(1), arc cos(−1)] obtenemos una reparametrización que in-
vierte la orientación pues en dicho intervalo cos es decreciente.
La longitud de una curva −→r = −→r (t) para t ∈ [a, b] se define por
L(−→r ) =
b
∫
a
||
−→
r′ (t)||dt
En los casos n = 2 y n = 3, esto es, cuando −→r (t) = (x(t), y(t)) y −→r (t) =
(x(t), y(t), z(t)), sus longitudes son
L(−→r ) =
∫ b
a
√
x′(t)2 + y′(t)2dt
y
L(−→r ) =
∫ b
a
√
x′(t)2 + y′(t)2 + z′(t)2dt
Por ejemplo, en el círculo −→r (t) = (acost, asent), para t ∈ [0, 2π], tenemos que
−→r ′(t) = (−asent, acost) y ||−→r′ (t)|| = a por lo que su longitud es
L(−→r ) =
∫ 2π
0
adt = 2πa
y en el caso de la hélice −→r (t) = (acost, asent, bt), su longitud desde el punto
(1, 0, 0) hasta el punto (1, 0, 2π) es
∫ 2π
0
√
a2 + b2dt = 2π
√
a2 + b2.
Nótese que al reparametrizar una curva, ni su forma ni su longitud cambian.
Esto último se deduce del hecho de que haciendo t = h(u) y suponiendo h
creciente
d
∫
c
∥
∥
∥
−→
α′(u)
∥
∥
∥ du =
d
∫
c
∥
∥
∥
−→
r′ (h(u))h′(u)
∥
∥
∥ du =
d
∫
c
||
−→
r′ (h(u))||h′(u)du =
b
∫
a
∥
∥
∥
−→
r′ (t)
∥
∥
∥ dt
15
El estudiante puede hacer algo análogo para h decreciente.
Sin embargo, escribiendo −→r (u) = −→r (t(u)) se tiene que
∥
∥
∥
∥
d−→r
du
∥
∥
∥
∥
=
∥
∥
∥
∥
d−→r
dt
∥
∥
∥
∥
∣
∣
∣
∣
dt
du
∣
∣
∣
∣
lo que muestra que su rapidez sí cambia por el factor
∣
∣
dt
du
∣
∣; incluso la velocidad
puede invertir su sentido en el caso en que t = t(u) sea decreciente pues en este
caso
dt
du
< 0.
Pregunta: Se podrá reparametrizar una curva cualquiera de tal manera que
su rapidez sea constante? La respuesta es sí, como veremos a continuación.
Sea −→r = −→r (t), t ∈ [a, b] una curva cualquiera, y sea s = s(t) =
∫ t
a
∥
∥
∥
−→
r′ (u)
∥
∥
∥ du.
s = s(t) se denomina función longitud de arco y mide la longitud de −→r desde
a hasta t. Puesto que
ds
dt
=
∥
∥
∥
−→
r′ (t)
∥
∥
∥ > 0, s(t) es una función creciente y como
s(a) = 0 y s(b) = L (su longitud total), su inversa t = t(s) es creciente con
dominio [0, L]. Utilizando esta inversa como cambio de parámetro, obtenemos
la parametrización −→r (s) = −→r (t(s)) en donde el parámetro es la longitud del
arco s. La velocidad de esta parametrización es
d−→r
ds
=
d−→r
dt
dt
ds
Como
dt
ds
=
1
ds
dt
=
1
∥
∥
∥
−→
r′ (t)
∥
∥
∥
, tenemos que
∥
∥
∥
∥
d−→r
ds
∥
∥
∥
∥
= 1. Así vemos que cuando la
curva está parametrizada por longitud de arco, su rapidez es constante e igual
a 1. Recíprocamente, si −→r = −→r (t) es una curva tal que
∥
∥
∥
−→
r′ (t)
∥
∥
∥ = 1, entonces
s =
∫ t
0
∥
∥
∥
−→
r′ (u)
∥
∥
∥
du =
∫ t
0
du = t, es decir el parámetro t es la longitud del arco
s. Hemos demostrado el siguiente teorema:
Teorema 1.4.1 Una curva −→r = −→r (t) está parametrizada por longitud de arco
si y solo si
∥
∥
∥
−→
r′ (t)
∥
∥
∥
= 1.
Ejemplo 1.4.2 Parametrizar por longitud de arco el círculo de radio a, −→r (t) =
(a cos(t), a sen(t)),t ∈ [0, 2π].
Tenemos que
−→
r′ (t) = (−a sen(t), a cos(t)) y
∥
∥
∥
−→
r′ (t)
∥
∥
∥ = a. Así, s =
∫ t
0
∥
∥
∥
−→
r′ (u)
∥
∥
∥ du =
∫ t
0 a du = at. Despejando t tenemos que t =
s
a
y reemplazando obtenemos
−→r (s) = (a cos( s
a
), a sen(
s
a
)) es la parametrización pedida.
16
1.5. Curvatura
La curvatura es el concepto más importante de la teoría de curvas y mide
qué tanto se dobla una curvaen un punto determinado. Puesto que la forma
como se dobla una curva tiene que ver con su concavidad, es apenas natural
pensar que la segunda derivada tiene que estar involucrada, esto es, la razón de
cambio del vector tangente. Definiremos inicialmente la curvatura de una curva
parametrizada por la longitud de arco s y luego deduciremos una fórmula para
la curvatura de una curva con cualquier parámetro t.
Definición 1.5.1 Sea C una curva parametrizada por −→r = −→r (s) donde s =
∫ t
0
∥
∥
∥
−→
r′ (u)
∥
∥
∥ du. Definimos la curvatura de C por
k(s) =
∥
∥
∥
−→
r′′(s)
∥
∥
∥ (1.1)
Ejemplo 1.5.1 Calcular la curvatura del círculo de radio a, −→r (t) = (a cos t, asent).
En el ejemplo anterior vimos que la parametrización por longitud de arco del
círculo es −→r (s) = (a cos( s
a
), a sen(
s
a
)). Tenemos entonces que la segunda
derivada de −→r es −→r′′(s) =
(
−1
a
cos(
s
a
),−1
a
sen(
s
a
)
)
y por lo tanto k(s) =
∥
∥
∥
−→
r′′(s)
∥
∥
∥ =
1
a
.
Nota.
Esta definición solo es válida para curvas parametrizadas por longitud de arco
y no sirve como definición de curvatura de una curva con cualquier parámetro
t (es decir, escribir k(t) =
∥
∥
∥
−→
r′′(t)
∥
∥
∥). Para ver porqué esto es así, vea el ejercicio
y la observación al final de esta sección.
En principio, si queremos calcular la curvatura de una curva con cualquier
parámetro t, deberíamos primero reparametrizarla por longitud de arco y aplicar
la ecuación 1.1 como se hizo en el ejemplo anterior. Esto no es práctico por la
dificultad en el cálculo de la integral involucrada o porque a menudo es muy
difícil o virtualmente imposible invertir dicha integral. Para encontrar una fór-
mula de la curvatura con cualquier parámetro t, definamos el vector tangente
unitario de una curva parametrizada por −→r = −→r (t) así:
−→
T (t) =
−→
r′ (t)
∥
∥
∥
−→
r′ (t)
∥
∥
∥
(1.2)
Reparametrizando entonces por longitud de arco, tenemos que −→r (s) = −→r (t(s))
donde t = t(s) es la inversa de la función longitud de arco s = s(t); se tiene en-
17
tonces también que el vector tangente unitario tiene la forma
−→
T (s) =
−→
T (t(s)).
Entonces
−→
r′ (s) =
−→
T (s) y la segunda derivada de −→r es
−→
r′′(s) =
−→
T ′(s) =
d
−→
T
dt
dt
ds
=
−→
T ′(t)
∥
∥
∥
−→
r′ (t)
∥
∥
∥
y puesto que la curvatura es la norma de este vector, tenemos que
k(t) =
∥
∥
∥
−→
T ′(t)
∥
∥
∥
∥
∥
∥
−→
r′ (t)
∥
∥
∥
. (1.3)
Esta fórmula nos permite calcular la curvatura de una curva cualquiera sin tener
que reparametrizarla por longitud de arco. Podemos encontrar una fórmula
más sencilla que sólo involucre r y sus derivadas (y no el vector
−→
T ) dada en el
siguiente teorema.
Teorema 1.5.1
k(t) =
∥
∥
∥
−→
r′ (t) ×−→r′′(t)
∥
∥
∥
∥
∥
∥
−→
r′ (t)
∥
∥
∥
3 (1.4)
Demostración. Escribiendo v(t) =
∥
∥
∥
−→
r′ (t)
∥
∥
∥ tenemos que
−→
r′ (t) = v(t)
−→
T (t);
derivando obtenemos
−→
r′′(t) = v′(t)
−→
T (t) + v(t)
−→
T ′(t)
.
Entonces
−→
r′ ×
−→
r′′ = v
−→
T ×
(
v′
−→
T + v
−→
T ′
)
= vv′
−→
T ×−→T + v2−→T ×
−→
T ′
= v2
−→
T ×
−→
T ′
Por lo tanto
∥
∥
∥
−→
r′ ×
−→
r′′
∥
∥
∥
= v2
∥
∥
∥
−→
T ×
−→
T ′
∥
∥
∥
=
∥
∥
∥
−→
r′
∥
∥
∥
2 ∥
∥
∥
−→
T
∥
∥
∥
∥
∥
∥
−→
T ′
∥
∥
∥
sen(π/2)
puesto que
−→
T es perpendicular a
−→
T ′. Y como
∥
∥
∥
−→
T
∥
∥
∥
= 1 se tiene que
18
∥
∥
∥
−→
r′ ×
−→
r′′
∥
∥
∥ =
∥
∥
∥
−→
r′
∥
∥
∥
2 ∥
∥
∥
−→
T ′
∥
∥
∥ .
Dividiendo a ambos lados de esta última ecuación por
∥
∥
∥
−→
r′
∥
∥
∥
3
se obtiene la fór-
mula deseada.
La curvatura de una curva con cualquier parámetro t está bien definida por
la ecuación 1.3, en el sentido de que es independiente de la parametrización
elegida, es decir, que para calcular la curvatura no interesa qué parametrización
tomemos. Esto se demuestra de la siguiente manera: si −→α es una reparametrización
de −→r , esto es,−→α (u) = −→r (h(u)) con h(u) = t y llamamos kα,kr,Tαy Tr a las
curvaturas y al vector tangente unitario en las dos parametrizaciones, entonces:
kα(u) =
∥
∥
∥
−→
T ′α(u)
∥
∥
∥
∥
∥
∥
−→
α′(u)
∥
∥
∥
=
∥
∥
∥
−→
T ′r(h(u))h
′(u)
∥
∥
∥
∥
∥
∥
−→
r′ (h(u))h′(u)
∥
∥
∥
=
∥
∥
∥
−→
T ′r(t)
∥
∥
∥
∥
∥
∥
−→
r′ (t)
∥
∥
∥
= kr(t)
Note que si en la ecuación 1.3 hacemos t = s obtenemos la ecuación 1.1.
Puede probarse fácilmente que si la curvatura de una curva es cero en todos
sus puntos, dicha curva es una linea recta, que es efectivamente lo que nos
dice la intuición. Para ello notemos que como la curvatura es independiente
de la parametrización, podemos suponer
∥
∥
∥
−→
r′ (t)
∥
∥
∥ = 1. Si k = 0, entonces por
la ecuación 1.1 debe ser
−→
r′′(t) = 0. Integrando entre t0 y t se obtiene que−→
r′ (t) =
−→
r′ (t0) e integrando de nuevo obtenemos
−→r (t)−−→r (t0) = (t− t0)−→r ′(t0)
esto es, −→r (t) = (t − t0)−→r ′(t0) + −→r (t0) que ciertamente es una línea recta.
1.5.1. Triedro de Frenet
Para una curva −→r = −→r (t) definimos el vector normal unitario por
−→
N (t) =
−→
T ′(t)
∥
∥
∥
−→
T ′(t)
∥
∥
∥
(1.5)
Note que
−→
N ⊥ −→T puesto que ‖T ‖ = 1. Definimos también el vector binormal
por
−→
B (t) =
−→
T (t) ×−→N (t)
19
vector que es perpendicular tanto a
−→
T como a
−→
N . La tripla
{−→
T ,
−→
N,
−→
B
}
se de-
nomina triedro de Frenet y juega un papel central en el estudio de la geometría
de curvas.
El plano generado por el par
{−→
T ,
−→
N
}
se denomina plano osculador .
El plano generado por el par
{−→
N,
−→
B
}
se denomina plano normal.
El plano generado por el par
{−→
T ,
−→
B
}
se denomina plano rectificante.
Las ecuaciones de dichos planos en un punto −→r (t0) son
plano osculador: (−→x −−→r (t0)) ·
−→
B (t0) = 0.
plano normal: (−→x −−→r (t0)) ·
−→
T (t0) = 0.
plano rectificante: (−→x −−→r (t0)) ·
−→
N (t0) = 0.
1.5.2. El vector aceleración.
Si escribimos −→v = −→r′ y v =
∥
∥
∥
−→
r′
∥
∥
∥, tenemos que −→v = v−→T . Derivando a ambos
lados de esta ecuación, obtenemos:
−→
v′ = −→a = v′−→T + v
−→
T ′
Como
−→
T ′ =
∥
∥
∥
−→
T ′
∥
∥
∥
−→
N = kv
−→
N , entonces
−→a = v′−→T + kv2−→N
20
Escribiendo aT = v′ y aN = kv2 tenemos que la aceleración es una combinación
lineal de los vectores
−→
T y
−→
N de la forma −→a = aT
−→
T + aN
−→
N , lo que nos dice
que el vector aceleración está siempre sobre el plano osculador.
Podemos encontrar expresiones para aT y aN en términos solamente de las
derivadas de −→r así:
−→v · −→a = v−→T ·
(
v′
−→
T + kv2
−→
N
)
= vv′
−→
T · −→T + kv3−→T · −→N
= vv′
Así, aT = v′ =
−→v · −→a
v
=
−→
r′ · −→r′′
∥
∥
∥
−→
r′
∥
∥
∥
.
Para aN , observemos que aN = kv2 =
∥
∥
∥
−→
r′ ×−→r′′
∥
∥
∥
∥
∥
∥
−→
r′
∥
∥
∥
2
∥
∥
∥
−→
r′
∥
∥
∥
3 =
∥
∥
∥
−→
r′ ×−→r′′
∥
∥
∥
∥
∥
∥
−→
r′
∥
∥
∥
.
El estudiante puede demostrar fácilmente que también se tiene que ‖−→a ‖2 =
a2T + a
2
N .
1.5.3. *Ecuaciones de Frenet para una curva plana.
Las ecuaciones de Frenet expresan la variación de los vectores
−→
T y
−→
N en tér-
minos de ellos mismos y desempeñan un papel fundamental en el estudio de la
geometría de las curvas. Deduciremos estas ecuaciones en el caso de una curva
plana.
De la ecuación 1.5 obtenemos
−→
T ′ =
∥
∥
∥
−→
T ′
∥
∥
∥
−→
N y reemplazando
∥
∥
∥
−→
T ′
∥
∥
∥por lo dado
en la ecuación 1.3 tenemos que
−→
T ′ = vk
−→
N (1.6)
donde v =
∥
∥
∥
−→
r′
∥
∥
∥.
Esta es la primera ecuación de Frenet. Por otro lado como
∥
∥
∥
−→
N
∥
∥
∥ = 1 tenemos
que
−→
N ′ ⊥ N y como la curva es plana, entonces −→N ′ es paralelo a −→T y por lo
tanto existe un escalar λ tal que
−→
N ′ = λ
−→
T . Al multiplicar a ambos lados de
esta ecuación por
−→
T , obtenemos que λ =
−→
T · −→N ′. Por otro lado, derivando la
ecuación
−→
T · −→N = 0 obtenemos −→T ′ · −→N + −→T · −→N ′ = 0 lo que es equivalente a
kv
−→
N · −→N + −→T · −→N ′ = 0 por la primera ecuación de Frenet (ecuación 1.6) y así,
λ =
−→
T · −→N ′ = −vk, y obtenemos la segunda ecuación de Frenet
21
−→
N ′ = −vk−→T (1.7)
Las ecuaciones 6 y 7, llamadas Ecuacionesde Frenet se pueden escribir en la
forma matricial
( −→
T ′−→
N ′
)
=
∥
∥
∥
−→
r′
∥
∥
∥
(
0 k
−k 0
)
( −→
T−→
N
)
Ejercicio
Demostrar que si una curva tiene curvatura k =
1
a
(constante) entonces es un
círculo de radio a (con centro en algún punto
−→
P ).
Puesto que la curvatura es independiente de la parametrización, podemos
suponer v(t) =
∥
∥
∥
−→
r′ (t)
∥
∥
∥ = 1. Para demostrar que −→r es un círculo de radio
a con centro en
−→
P , debemos probar que −→r (t) + a−→N (t) = −→P pues entonces
−→r (t) − −→P = −a−→N (t) y así,
∥
∥
∥
−→r (t) −−→P
∥
∥
∥ = a, como se observa en la figura
abajo.
Para ver esto, observe que
d
dt
(−→r (t) + a−→N (t)) = −→r′ (t) + a−→N ′(t). Pero la se-
gunda ecuación de Frenet (ecuación 1.7) es
−→
N ′(t) = −1
a
−→
T (t), por lo tanto
−→
r′ (t)+ a
−→
N ′(t) =
−→
T (t)− a.1
a
−→
T (t) = 0 y por lo tanto −→r (t)+ a−→N (t) =constante.
Llamando
−→
P a dicha constante, se tiene lo que se quiere demostrar.
Observación.
22
Se definió la curvatura de una curva parametrizada por longitud de arco como
la norma del cambio en el vector tangente (ecuación 1.1). Esta definición no
funciona para una curva con cualquier parámetro t. Para ver esto basta observar
que
∥
∥
∥
−→
r′′(t)
∥
∥
∥ = 2 (constante) para la parábola −→r (t) =
(
t, t2
)
, lo que significaría
que la parábola es un círculo!!
23
Capítulo 2
Campos Escalares en R2 y R3
Una función de n variables ó campo escalar, es una función f : U ⊆ Rn → R. Si
(x1, x2, . . . , xn) ∈ U , su imagen por f es un número real xn+1 = f(x1, x2, . . . , xn).
En este curso solo estudiaremos los casos n = 2 y n = 3 y entonces escribire-
mos z = f(x, y) y w = f(x, y, z) respectivamente. U es el dominio de f y es un
subconjunto del plano ó del espacio.
Ejemplo 2.0.2 Hallar el dominio de f(x, y) = x ln y.
Es claro que xpuede tomar cualquier valor real, mientras que ysolo puede tomar
valores positivos; por lo tanto el dominio de f es el conjunto U = {(x, y)|x ∈
R, y ∈ R+}, esto es, el semiplano superior del plano R2.
Ejemplo 2.0.3 Hallar el dominio de f(x, y) =
√
1 − x2 − y2.
Puesto que 1 − x2 − y2 ≥ 0, f solo puede ser calculado en los puntos del disco
x2 + y2 ≤ 1.
2.1. Gráfica de z = f(x, y). Curvas y superficies
de nivel.
La gráfica de una función de dos variables es un subconjunto de R3 y se define
por
Graf(f) = {(x, y, f(x, y))|(x, y) ∈ U} ⊂ R3
La gráfica de z = f(x, y) la denominamos superficie. Dibujar "a mano" una su-
perficie es difícil y lo mejor es recurrir a un computador. Sin embargo, podemos
hacernos una idea de cómo es una superficie (o por lo menos las más utilizadas
en la práctica), viendo las curvas que se forman al cortar la superficie con planos
paralelos a los planos coordenados, llamadas trazas. En particular, las trazas
24
con planos paralelos al plano xy se denominan curvas de nivel, que se obtienen
intersectando la gráfica de f con los planos z = c (constante), esto es, la curva
de nivel en el nivel c es el subconjunto del plano definido por
Lf (c) = {(x, y)|f(x, y) = c} ⊂ R2
Para las trazas con planos paralelos a los planos coordenados xz y yz hacemos
y = c y x = c. Veamos algunos ejemplos.
Ejemplo 2.1.1 Sea f : R2 → R definida por
z = f(x, y) = x2 + y2.
Dado un número real c, la curva de nivel al nivel c de f está dada por
Lf (c) = {(x, y) : x2 + y2 = c}.
Claramente si c < 0, Lf (c) = ∅ (vacío); si c = 0, Lf(c) = {(0, 0)}; para
cualquier c > 0, los conjuntos de nivel son circunferencias con centro en el
origen de radio
√
c. La figura muestra las circunferencias concéntricas
En el ejemplo anterior, las curvas de nivel son círculos que se expanden a
medida que aumentamos el valor de c. En la siguiente gráfica, a la derecha
vemos una imagen tridimensional de estos círculos; cada uno de ellos está
sobre el plano z = c.
25
Sin embargo, esto no es suficiente. Necesitamos ver las trazas con los planos
coordenados yz y xz. Para ver el corte con el plano yz, hacemos x = 0 en la
función f ; tenemos entonces que dicho corte es la parábola z = y2. Igualmente,
para el corte con el plano xz, hacemos y = 0 para obtener la parábola z = x2.
Abajo puede verse la gráfica de dicha función, llamada paraboloide.
Ejemplo 2.1.2 Hagamos la gráfica de la función z = f(x, y) =
√
x2 + y2.
Las curvas de nivel están dadas por el conjunto
Lf(c) = {(x, y) :
√
x2 + y2 = c} = {(x, y) : x2 + y2 = c2}
esto es, círculos concéntricos de radio c.
26
Observe que esta gráfica aparentemente es igual a la del paraboloide, sin em-
bargo la gráfica de f no es un paraboloide como lo muestran los cortes con los
otros planos coordenados: Si x = 0, obtenemos z =
√
y2 = |y|, esto es, las dos
rectas z = y y z = −y. De la misma manera, si y = 0 obtenemos las rectas
z = x, y z = −x. Vemos la gráfica abajo, que evidentemente es un cono.
Ejemplo 2.1.3 Veamos ahora la función z = y2 − x2.
Las curvas de nivel son las hipérbolas y2−x2 = c, como se observa en la figura
abajo.
27
Note que en el caso c = 0 obtenemos la hipérbola degenerada x2 = y2 que
corresponde a las dos rectas y = x y y = −x.
El corte con el plano yz es la parábola z = y2 y el corte con el plano xz es
la parábola z = −x2. Esta gráfica se llama paraboloide hiperbólico o silla de
montar y tiene el aspecto que se muestra abajo.
Ejemplo 2.1.4 Veamos la gráfica de la superficie dada por la ecuación z = y2.
Observe que en la ecuación no aparece la variable x; esto significa que x toma
28
todos los valores reales. Superficies de este tipo se llaman cilindros. ¿Cuales
son las curvas de nivel? Su gráfica puede verse abajo.
Para el caso de una función de tres variables w = f(x, y, z), su gráfica se define
por el conjunto
Grf(f) = {(x, y, z, f(x, y, z)) |(x, y, z) ∈ U} ⊂ R4
Por supuesto no podemos hacer un dibujo de ella por estar en el espacio cu-
atridimensional R4. Sin embargo tenemos el concepto de superficie de nivel
definido de forma análoga al de curva de nivel así:
Sf (c) = {(x, y, z) |f(x, y, z) = c} ⊂ R3
y aunque no podamos despejar z explícitamente en términos de x y de y, sí
podemos encontrar las trazas con los planos coordenados. Veamos ejemplos de
esto.
Ejemplo 2.1.5 Consideremos la función de tres variables w = f(x, y, z) =
x2 + y2 + z2. La superficie de nivel en el nivel 1 es el conjunto {(x, y, z) :
x2 +y2 +z2 = 1}. Haciendo z = c, obtenemos círculos x2 +y2 = 1−c2 de radio√
1 − c2 por lo que debemos tener −1 ≤ c ≤ 1. En la figura abajo se muestran
estas curvas.
29
De la misma manera obtenemos círculos al cortar la superficie con planos par-
alelos a los otros dos planos coordenados. La figura obtenida es una esfera de
radio 1.
Ejemplo 2.1.6 Las superficies de nivel de la función f(x, y, z) = x2 + y2 − z2
es el conjunto de nivel {x, y, z) : x2 +y2−z2 = c}. El lector no tendrá dificultad
en comprobar que las gráficas que se muestran abajo corresponden a c = 1, c =
0, c = −1 respectivamente, llamadas hiperboloide de una hoja, doble cono e
hiperboloide de dos hojas.
30
Observemos que la gráfica de una función de dos variables puede verse como
la superficie de nivel de una función de tres variables. Si f : Ω ⊂ R2 → R,
recordemos que la gráfica de f es
Gf = {(x, y, z) ∈ R3 : z = f(x, y), (x, y) ∈ Ω}
Gf = {(x, y, z) ∈ R3 : (x, y) ∈ Ω, z − f(x, y) = 0 } = Lg(0)
donde g(x, y, z) = z − f(x, y). Así la gráfica de una función de dos variables es
una superficie de nivel de una función de tres variables.
2.1.1. Superficies cuádricas.
Consideremos las funciones de tres variables sobre R3 que son de tipo polinomial
f(x, y, z) = Ax2 + By2 + Cz2 + Dxy + Exz + Fyz + Hx + Iy + Jz + K,
donde A, B, C, D, E, F, G, H, I, J, K son constantes. Si A, B.C, D, E, F no son
simultáneamente cero las superficies de nivel
Lf (c) = {(x, y, z) ∈ R3 : Ax2+By2+Cz2+Dxy+Exz+Fyz+Hx+Iy+Jz+K = c
se llaman superficies cuádricas.
Si A = B = C = D = E = F = 0, tenemos que la superficie de nivel de f
determina como superficie un plano dado por Hx + Iy + Jz + K = c
En general estas superficies cuádricas pertenecen a nueve tiposdiferentes: El
elipsoide, el hiperboloide de una hoja, el hiperboloide de dos hojas, el cono, el
paraboloide elíptico, el paraboloide hiperbólico, el cilindro elíptico, el cilindro
hiperbólico.
2.2. Límites y Continuidad
Utilizamos la notación ĺım
(x,y)→(x0,y0)
f(x, y) = L para indicar que podemos aprox-
imar la función f(x, y) tanto como queramos a un número L siempre y cuan-
do tomemos (x, y) suficientemente cerca del punto (x0, y0) pero con (x, y) 6=
31
(x0, y0). En otras palabras, f(x, y) está cerca de L si (x, y) está cerca de (x0, y0)
y entre más cerca esté (x, y) de (x0, y0), más cerca está f(x, y) de L. Esto sig-
nifica que podemos tomar la distancia entre f(x, y) y L tan pequeña como
queramos siempre y cuando la distancia entre (x, y) y (x0, y0) sea lo suficien-
temente pequeña. Tenemos entonces la equivalencia
ĺım
(x,y)→(x0,y0)
f(x, y) = L ⇔ ĺım
||(x,y)−(x0,y0)||→0
|f(x, y) − L| = 0
que podemos escribir también en la forma
f(x, y) → L cuando (x, y) → (x0, y0)⇔|f(x, y) − L| → 0 cuando
√
(x − x0)2 + (y − y0)2 → 0.
Así, el límite de una función de dos variables se reduce al límite usual del
cálculo de una variable, y es por esta razón que las propiedades usuales de los
límites unidimensionales también son válidas para límites de funciones de dos
variables. Claramente se ve que la definición anterior de límite es válida para
cualquier campo escalar en Rn, con solo reemplazar la pareja (x, y) por un
vector −→x ∈ Rn y la pareja (x0, y0) por cualquier vector −→a ∈ Rn.
Las propiedades de los límites y de la continuidad las resumimos en los sigu-
ientes teoremas:
Teorema 2.2.1 Si ĺım−→x →−→a
f(−→x ) = b y ĺım−→x →−→a g(
−→x ) = c, entonces
1. ĺım−→x →−→a
(f(−→x ) + g(−→x )) = b + c,
2. ĺım−→x →−→a
λf(−→x ) = λb para todo escalar λ,
3. ĺım−→x →−→a
f(−→x )g(−→x ) = b · c,
4. ĺım−→x →−→a
|f(−→x )| = |b| ,
Definición 2.2.1 Diremos que un campo escalar f es continuo en −→a si ĺım−→x →−→a f(
−→x ) =
f(−→a ).
Así como con las funciones de una sola variable, también son continuas las
sumas, productos y cocientes de funciones continuas (una vez que, en el último
caso, se evite la división entre cero).
Teorema 2.2.2 Si una función g de n-variables es continua en −→a y una fun-
ción f de una variable es continua en g(−→a ), entonces la función compuesta
f ◦ g, definida por (f ◦ g)(−→x ) = f(g(−→x )) es continua en −→a .
32
Decir que f es continua sobre un conjunto U significa que f(−→x ) es continua en
cada punto del conjunto.
Para calcular un límite, existe la dificultad de que (x, y) puede aproximarse a
(x0, y0) por muchos caminos, (contrario al caso unidimensional en el cual solo
existen dos caminos de acercamiento: por la izquierda y por la derecha) y para
que el límite exista, debe ser el mismo para todos los caminos de acercamiento.
Es claro entonces, que el límite no existe si por dos caminos distintos se ob-
tienen límites diferentes, como se ve en el siguiente ejemplo.
Ejemplo 2.2.1 Para probar que ĺım
(x,y)→(0,0)
x2 − y2
x2 + y2
(que es de la forma
0
0
) no
existe, observamos resultados distintos si nos acercamos al origen por el eje x
y por el eje y así:
Acercamiento por el eje x: tomamos y = 0
ĺım
(x,0)→(0,0)
f(x, 0) = ĺım
x→0
x2
x2
= 1
Acercamiento por el eje y: tomamos x = 0
ĺım
(0,y)→(0,0)
f(0, y) = ĺım
y→0
−y2
y2
= −1
Son continuas las funciones f(x, y) = x, f(x, y) = y, todos los polinomios de
la forma f(x, y) =
∑
aijx
iyj y en general todas las posibles combinaciones de
sumas, productos, cocientes y composiciones de las funciones elementales, con
excepción posiblemente de los puntos en donde los denominadores sean cero
o el límite no exista. Por ejemplo, la función F (x, y) = cos(x3 − 4xy + y2) es
continua en todo punto del plano, puesto que la función g(x, y) = x3−4xy+y2
es continua (como un polinomio) en toda su extensión y también f(t) = cos t es
continua para todo número t ∈ R. Por supuesto, la función dada en el ejemplo
anterior no es continua en el origen.
Ahora introducimos algunos conceptos relativos a conjuntos en el espacio de
Rn . Sean −→a ∈ Rn y r > 0. El conjunto
B(x; r) = {−→x ∈ Rn : ‖−→x −−→a ‖ < r}.
se llama una n-bola abierta de radio r y centro −→a . En el espacio R2, una
bola abierta es el “interior” de un ćírculo; en R3 es el interior de una esfera. Un
punto −→a es un punto interior de un conjunto U si existe una bola abierta
B(−→a ; r) contenida en U. Todos los puntos interiores de U forman el interior de
U. Por otra parte, −→a es un punto frontera de U si toda bola abierta con centro
en −→a contiene puntos que pertenecen a U y otros que no pertenecen. Todos los
puntos de frontera de U forman la frontera de U. Finalmente, un conjunto
33
es abierto si todos sus puntos son interiores y un conjunto es cerrado
si contiene todos sus puntos frontera. Por ejemplo en los números reales , R,
los tipos más sencillos de conjuntos abiertos son los intervalos abiertos. La
unión de dos o más intervalos abiertos es también abierto. El intervalo [a, b]
es un intervalo cerrado. El conjunto U =
{
(x, y) : x2 + y2 ≤ 1
}
es un conjunto
cerrado en R2 .
2.3. Funciones Diferenciables
De la misma manera que la existencia de una recta tangente está íntimamente
relacionado con el concepto de diferenciabilidad de una función de una variable,
la existencia de un plano tangente, que definiremos más adelante, tiene que ver
con el concepto de diferenciabilidad de una función de dos variables. Para llegar
a este concepto definiremos inicialmente las derivadas parciales.
2.3.1. Derivadas parciales
Si en una función de dos variables z = f(x, y) consideramos una variable,
por ejemplo y, como constante, obtenemos una función que depende exclusiva-
mente de la variable x. Así, si escribimos y = y0 (constante) y h(x) = f(x, y0),
la derivada h′(x0) se denomina derivada parcial de f con respecto a x en el
punto (x0, y0) y se denota
∂f
∂x
(x0, y0) ó
∂f
∂x
|(x0,y0). De la misma manera, si es-
cribimos g(y) = f(x0, y), entonces la derivada parcial de f con respecto a y en
el punto (x0, y0) será la derivada g′(y0) y se denota
∂f
∂y
(x0, y0) ó
∂f
∂y
|(x0,y0).
Notación. Si las derivadas parciales se calculan en un punto genérico (x, y),
escribimos
∂f
∂x
y
∂f
∂y
en lugar de
∂f
∂x
(x, y) y
∂f
∂y
(x, y). Estas derivadas también
se denotan fx y fy ó, Dxf y Dyf .
Recordemos que la definición usual de derivada es
h′(x0) = ĺım△x→0
h(x0 + △x) − h(x0)
△x
Al escribir dicha fórmula en términos de f obtenemos
∂f
∂x
(x0, y0) = ĺım△x→0
f(x0 + △x, y0) − f(x0, y0)
△x (2.1)
De la misma manera tenemos que
34
∂f
∂y
(x0, y0) = ĺım△y→0
f(x0, y0 + △y) − f(x0, y0)
△y . (2.2)
Puesto que las derivada parciales son también funciones de las variables x y y,
podemos también derivarlas parcialmente para obtener derivadas parciales de
segundo orden denotadas como se muestra a continuación:
∂
∂x
(
∂f
∂x
)
=
∂2f
∂x2
,
∂
∂y
(
∂f
∂y
)
=
∂2f
∂y2
,
∂
∂x
(
∂f
∂y
)
=
∂2f
∂x∂y
,
∂
∂y
(
∂f
∂x
)
=
∂2f
∂y∂x
.
Las derivadas parciales que involucran las dos variables x y y se denominan
derivadas parciales mixtas. Un hecho importante es que bajo ciertas condiciones
estas derivadas mixtas son iguales como lo dice el siguiente teorema.
Teorema 2.3.1 Si las derivadas parciales mixtas son continuas en un conjunto
abierto U que contiene un punto (x0, y0), entonces
∂2f
∂x∂y
(x0, y0) =
∂2f
∂y∂x
(x0, y0).
Las derivadas parciales de z = f(x, y) se interpretan geométricamente como las
pendientes de las tangentes a las curvas intersección de la gráfica de f con los
planos x =constante y y =constante como se observa en las gráficas abajo.
2.3.2. Superficies parametrizadas
En el capítulo anterior definimos curva (parametrizada) en el espacio como una
función −→r : I ⊆ R → R3. En este caso, como el dominio es un subconjunto de
35
la recta real, tenemos un solo parámetro que denotamos con la letra t y escribi-
mos −→r (t) = (x(t), y(t), z(t)). Análogamente tenemos el concepto de superficie
parametrizada como unafunción −→r : U ⊆ R2 → R3. Como el dominio es un
subconjunto del plano, tenemos ahora dos parámetros que denotamos con las
letras u y v, y escribimos
−→r (u, v) = (x(u, v), y(u, v), z(u, v))
x, y y z son por supuesto, funciones de U en R. Las ecuaciones x = x(u, v), y =
y(u, v), z = z(u, v) son las ecuaciones paramétricas. La gráfica abajo ilustra la
situación.
Ejemplo 2.3.1 1. El cilindro.
Un cilindro de radio a se puede parametrizar en la forma
−→r (u, v) = (a cosu, a senu, v), u ∈ [0, 2π], −∞ < v < ∞
La secuencia siguiente muestra cómo se transforma el rectángulo [0, 2π]×
[0, 1] en el cilindro.
2. La esfera.
Para la parametrización de la esfera observe la gráfica abajo.
36
En el triángulo rectángulo △OAB se tiene que x = h cos θ y y = h sen θ
y en el triángulo rectángulo △OBC se tiene que z = a cosϕ. Pero de
nuevo en △OBC se tiene que h = a sen ϕ, de manera que las
ecuaciones paramétricas de la esfera son
x = a cos θ sen ϕ
y = a sen θ senϕ
z = a cosϕ
en donde θ ∈ [0, 2π] y ϕ ∈ [0, π]. Así la función −→r tiene la forma
−→r (θ, ϕ) = (a cos θ senϕ, a sen θ senϕ, a cosϕ)
3. La gráfica de z = f(x, y).
Análogo a la parametrización de la gráfica de una función de una variable
y = f(x) como la curva −→r (t) = (t, f(t)), la gráfica de una función de dos
variables z = f(x, y) se puede ver como una superficie parametrizada solo
con tomar x = u, y = v, z = f(u, v), esto es,
−→r (u, v) = (u, v, f(u, v))
4. Ejercicio (para los curiosos).
Pruebe que una parametrización del hiperboloide de una hoja x2+y2−z2 =
1 está dada por las ecuaciones
x = cosu coshv
y = senu cosh v
z = senh v
37
para u ∈ [0, 2π], −∞ < v < +∞.
2.3.3. El plano tangente
En una superficie parametrizada,−→r (u, v) = (x(u, v), y(u, v), z(u, v)) con (u, v) ∈
U , las rectas u = u0 (constante) y v = v0(constante) se convierten por la acción
de −→r en las curvas sobre la superficie −→r (u) = −→r (u, v0) y −→r (v) = −→r (u0, v)
como se observa en la gráfica abajo.
Dichas curvas se denominan curvas coordenadas. Los vectores tangentes en el
punto u0 y v0 son respectivamente
−→
r′ (u0) =
∂−→r
∂u
(u0, v0) y
−→
r′ (v0) =
∂−→r
∂v
(u0, v0)
y se definen por
∂−→r
∂u
(u0, v0) =
(
∂x
∂u
(u0, v0),
∂y
∂u
(u0, v0),
∂z
∂u
(u0, v0)
)
∂−→r
∂v
(u0, v0) =
(
∂x
∂v
(u0, v0),
∂y
∂v
(u0, v0),
∂z
∂v
(u0, v0)
)
Si dichos vectores son linealmente independientes, entonces generan un plano
que pasa por el punto −→r (u0, v0) denominado plano tangente, con vector normal
∂−→r
∂u
(u0, v0)×
∂−→r
∂v
(u0, v0). Por lo tanto, si
−→r (u0, v0) = (x0, y0, z0), la ecuación
del plano tangente en ese punto es
(x − x0, y − y0, z − z0) ·
∂−→r
∂u
(u0, v0) ×
∂−→r
∂v
(u0, v0) = 0
38
En el caso particular en el que tenemos la gráfica de z = f(x, y), con la
parametrización−→r (x, y) = (x, y, f(x, y)) tenemos que ∂
−→r
∂x
×∂
−→r
∂y
=
(
1, 0,
∂f
∂x
)
×
(
0, 1,
∂f
∂y
)
=
(
−∂f
∂x
,−∂f
∂y
, 1
)
. Si escribimos z0 = f(x0, y0), la ecuación del
plano tangente es
z = f(x0, y0) +
∂f
∂x
(x0, y0)(x − x0) +
∂f
∂y
(x0, y0)(y − y0) (2.3)
2.3.4. El concepto de diferenciabilidad
Recordamos inicialmente el concepto de diferenciabilidad para una función de
una variable y = f(x), para luego, de forma análoga, abordar el caso z =
f(x, y).
Diferenciabilidad de y = f(x).
Sabemos que en el caso de una función de una variable de la forma y = f(x),
la derivada de f en un punto x0 se define como
f ′(x0) = ĺım△x→0
f(x0 + △x) − f(x0)
△x
en caso de que dicho límite exista. Si esto último es cierto, la pendiente de la
recta secante está cercana a la pendiente de la tangente si △x es pequeño así:
f(x0 + △x) − f(x0)
△x ≈ f
′(x0)
39
El error cometido en la aproximación está dado por
ε =
f(x0 + △x) − f(x0)
△x − f
′(x0)
Entre más pequeño sea △x, menor es el error. La expresión anterior se puede
escribir en la forma
f(x0 + △x) − f(x0)
△x = f
′(x0) + ε
donde ε → 0 cuando △x → 0. Si escribimos △y = f(x0 + △x) − f(x0),
obtenemos la ecuación
△y = f ′(x0)△x + ε△x (2.4)
donde ε → 0 cuando △x → 0.
Si escribimos x = x0 +△x, entonces f(x) = f(x0)+△y y la ecuación 2.4 toma
la forma
f(x) = f(x0) + f
′(x0)(x − x0) + ε(x − x0)
donde ε → 0 cuando x → x0. Podemos escribir entonces
f(x) ≈ f(x0) + f ′(x0)(x − x0)
si x está cerca de x0. Entre más cerca esté x de x0 más pequeño es el error
cometido en la aproximación . La expresión de la derecha en la aproximación
anterior es lineal en x, esto es, la función
L(x) = f(x0) + f
′(x0)(x − x0)
es una linea recta. Así,
f(x) ≈ L(x)
cerca de x0 y esta es exactamente la idea de diferenciabilidad:
Una función y = f(x) es diferenciable en un punto x0, si el incremento en y,
△y se puede escribir como en la ecuación 2.4, es decir, si localmente (esto es,
en cualquier vecindad de x0) se puede aproximar por una recta, más específi-
camente, por la recta tangente en x0; hablando claro, si localmente, la gráfica
de f es "casi" una recta.
En un computador se puede comprobar esto. Dibuje la gráfica de, por ejemplo,
f(x) = x2 con un programa de cálculo simbólico (MuPad por ejemplo) y haga
40
zoom cerca del origen de coordenadas. Se dará cuenta de que entre mayor sea
el zoom, la gráfica de la parábola será cada vez más recta.
Esto no sucede por ejemplo con la función f(x) = |x| pues no importa qué tan
cerca se esté del origen, la gráfica de f siempre se verá como una punta (dos
rectas).
El primer sumando en el miembro derecho de la ecuación 2.4 se denomina
diferencial de f y se denota df o más comúnmente dy, así, la diferencial en
cualquier x es
dy = f ′(x)△x
y se toma generalmente como una aproximación para △y; entre más pequeño
sea △x mejor es la aproximación.
Diferenciabilidad de z = f(x, y).
De la misma manera como la diferenciabilidad de una función de una variable
y = f(x) tiene que ver con la existencia de una función lineal (una recta) L(x)
que aproxima a f en una vecindad de un punto x0, la diferenciabilidad de
z = f(x, y) en un punto (x0, y0) tiene que ver con la existencia de una función
lineal (un plano) L(x, y) que aproxima a f en una vecindad de (x0, y0), esto es,
algo como
f(x, y) ≈ A + Bx + Cy.
Para encontrar tal aproximación, le aplicamos el mismo análisis anterior a las
derivadas parciales, ecuaciones 2.1 y 2.2, y obtenemos formas análogas a la
ecuación 2.4 para los incrementos parciales
f(x0 + △x, y0) − f(x0, y0) =
∂f
∂x
(x0, y0)△x + ε1△x
f(x0, y0 + △y) − f(x0, y0) =
∂f
∂y
(x0, y0)△y + ε2△y
donde ε1 y ε2→ 0 cuando △x y △y→ 0.
Tenemos así aproximaciones lineales para los incrementos parciales. Parece nat-
ural pensar que el incremento de f en ambas variables simultáneamente, pueda
aproximarse por la suma (ya que necesitamos que la aproximación sea lineal)
de las dos aproximaciones parciales. Esto no siempre sucede, pero cuando es
así, tenemos nuestra definición de diferenciabilidad:
Una función de dos variables z = f(x, y) es diferenciable en (x0, y0), si el
41
incremento de z, △z = f(x0 + △x, y0 +△y)− f(x0, y0) puede escribirse en la
forma
△z = ∂f
∂x
(x0, y0)△x +
∂f
∂y
(x0, y0)△y + ε1△x + ε2△y (2.5)
donde (ε1, ε2) → (0, 0) cuando (△x,△y)→ (0, 0).
Si escribimos x = x0 + △x y y = y0 + △y, entonces la ecuación 2.5 toma
la forma
f(x, y) = f(x0, y0)+
∂f
∂x
(x0, y0)(x−x0)+
∂f
∂y
(x0, y0)(y−y0)+ε1(x−x0)+ε2(y−y0)
(2.6)
donde (ε1, ε2) → (0, 0) cuando (x, y) → (x0, y0).
La ecuación 2.6 explica el concepto de forma clara: si escribimos
L(x, y) = f(x0, y0) +
∂f
∂x
(x0, y0)(x − x0) +
∂f
∂y
(x0, y0)(y − y0)
tenemos entonces la aproximación lineal
f(x, y) ≈ L(x, y)
en una vecindad de (x0, y0). Note que la función L es precisamente el plano
tangente en el punto (x0, y0) (vea de nuevo la ecuación 2.3). Tenemos así, que
f es diferenciable si puede linealizarse localmente, esto es, si en una vecindad
de un punto (x0, y0) la gráfica de f se ve “casi” plana, siendo dicho plano
precisamente el plano tangente.
Los dos primeros términos de la derecha de la ecuación 2.5 se denomina la
diferencial de f y se denota df o más comúnmente dz así:
dz =
∂f
∂x
(x0, y0)△x +
∂f
∂y
(x0,y0)△y
y es una aproximación para el incremento △z. Si le aplicamos esta definición a
las variables independientes x y y obtenemos que dx =
∂x
∂x
△x + ∂x
∂y
△y = △x
y de la misma manera, dy = △y. Por esta razón, es común que la diferencial
en cualquier punto (x, y) se escriba en la forma
dz =
∂f
∂x
dx +
∂f
∂y
dy. (2.7)
Nota. A veces, por abuso de notación, la ecuación 2.7 se escribe
42
dz =
∂z
∂x
dx +
∂z
∂y
dy
Si fes diferenciable en (x0, y0), de la ecuación 2.6 se deduce de forma inmediata
que f es continua en dicho punto pues claramente f(x, y) → f(x0, y0) cuando
(x, y) → (x0, y0).
Contrario a lo que sucede en el caso de una variable en el que la existencia
de la derivada es suficiente para garantizar la existencia de la recta tangente,
para una función de dos variables la sola existencia de las derivadas parciales
no implica la existencia del plano tangente. Por ejemplo, la función
f(x, y) =
{ xy
x2 + y2
si (x, y) 6= (0, 0)
0 si (x, y) = (0, 0)
no es diferenciable en (0, 0) pues aunque
∂f
∂x
(0, 0) =
∂f
∂y
(0, 0) = 0, la función
no es continua en (0, 0). Abajo se muestra su gráfica generada por MuPad para
xǫ[−0.01, 0.01] y yǫ[−0.01, 0.01].
−0.4
0.010
0.005
−0.005 x
0.005
y
0.000
0.000−0.005
−0.010 −0.010
−0.2
0.0z
0.2
0.4
0.010
El teorema siguiente establece las condiciones suficientes para la diferenciabil-
idad.
Teorema 2.3.2 Si las derivadas parciales de z = f(x, y) existen y son contin-
uas en (x0, y0) entonces fes diferenciable en dicho punto, es decir, △z puede
escribirse como en la ecuación 2.5.
43
2.4. La Regla de la Cadena
Sea z = f(x, y) un campo escalar diferenciable en un conjunto abierto U ∈ R2,
y supongamos que x = x(t) y y = y(t) son funciones diferenciables de t. Se
tiene entonces que z = z(t) = f(x(t), y(t)), esto es, tenemos la composición
z(t) = f ◦ h(t) donde h es la función vectorial definida por h(t) = (x(t), y(t)).
El teorema siguiente establece la forma como se calcula la derivada z′(t):
Teorema 2.4.1 En las condiciones del comentario anterior, se tiene que
dz
dt
=
∂f
∂x
dx
dt
+
∂f
∂y
dy
dt
(2.8)
Demostración. Puesto que f es diferenciable se tiene que
△z = ∂f
∂x
△x + ∂f
∂y
△y + ε1△x + ε2△y
donde (ε1, ε2) → (0, 0) cuando (△x,△y) → (0, 0).
Dividiendo ambos miembros de la ecuación por △t y tomando el límite cuando
△t → 0 obtenemos
dz
dt
=
∂f
∂x
ĺım
△t→0
△x
△t +
∂f
∂y
ĺım
△t→0
△y
△t + ĺım△t→0ε1
△x
△t + ĺım△t→0ε2
△y
△t (2.9)
donde (ε1, ε2) → (0, 0) cuando (△x,△y) → (0, 0).
Por un lado, ĺım
△t→0
△x
△t =
dx
dt
y ĺım
△t→0
△y
△t =
dy
dt
. Por otro lado,
ĺım
△t→0
△x = ĺım
△t→0
x(t + △t) − x(t) = 0
puesto que x = x(t) es una función continua (por ser diferenciable). De la mis-
ma manera, ĺım
△t→0
△y = 0, lo que significa que ĺım
△t→0
ε1 = ĺım△t→0
ε2 = 0 por lo que
la ecuación 2.9 se convierte en la ecuación 2.8.
Nota. A veces, por abuso de notación, la regla de la cadena se escribe así:
dz
dt
=
∂z
∂x
dx
dt
+
∂z
∂y
dy
dt
En el caso en que x y y sean funciones diferenciables de dos variables s y t,
x = x(s, t), y = y(s, t), entonces z = z(s, t) = f(x(s, t), y(s, t)) y las derivadas
parciales de z con respecto a s y t están dadas por:
44
∂z
∂s
=
∂z
∂x
∂x
∂s
+
∂z
∂y
∂y
∂s
∂z
∂t
=
∂z
∂x
∂x
∂t
+
∂z
∂y
∂y
∂t
(2.10)
Podemos utilizar la regla de la cadena para encontrar
dy
dx
en el caso en que la
ecuación F (x, y) = k defina y como función implícita de x. Derivando a ambos
lados de la ecuación F (x, y(x)) = k (aplicando la ecuación 2.8 obtenemos
∂F
∂x
dx
dx
+
∂F
∂y
dy
dx
= 0
Así tenemos que
dy
dx
= −
∂F
∂x
∂F
∂y
. (2.11)
Análogamente, si la ecuación F (x, y, z) = k define z como función implícita
de x y y, podemos encontrar fórmulas para las derivadas parciales de z con
respecto a x y y aplicando las fórmulas dadas por las ecuaciones 2.10 a la
ecuación F (x, y, z(x, y)) = k para obtener
∂z
∂x
= −
∂F
∂x
∂F
∂z
∂z
∂y
= −
∂F
∂y
∂F
∂z
Ejercicio. Si z(t) = f(x(t), y(t)), calcular
d2z
dt2
.
Tenemos que
dz
dt
=
∂z
∂x
dx
dt
+
∂z
∂y
dy
dt
. Derivando a ambos lados de esta ecuación,
aplicando la regla de la derivada de un producto, obtenemos:
d2z
dt2
=
d
dt
(
∂z
∂x
)
dx
dt
+
∂z
∂x
d2x
dt2
+
d
dt
(
∂z
∂y
)
dy
dt
+
∂z
∂y
d2y
dt2
(2.12)
Para las derivadas con respecto a t de
∂z
∂x
y
∂z
∂y
, debemos aplicar de nuevo la
regla de la cadena (ecuación 2.8) porque
∂z
∂x
y
∂z
∂y
son funciones de x y y y
estas a su vez son funciones de t así:
d
dt
(
∂z
∂x
)
=
∂2z
∂x2
dx
dt
+
∂2z
∂y∂x
dy
dt
45
d
dt
(
∂z
∂y
)
=
∂2z
∂x∂y
dx
dt
+
∂2z
∂y2
dy
dt
reemplazando estas dos expresiones en la ecuación 2.12, asumiendo que las
derivadas parciales mixtas son iguales y reduciendo términos semejantes, obten-
emos la expresión
d2z
dt2
=
∂2z
∂x2
(
dx
dt
)2
+ 2
∂2z
∂x∂y
dx
dt
dy
dt
+
∂2z
∂y2
(
dy
dt
)2
+
∂z
∂x
d2x
dt2
+
∂z
∂y
d2y
dt2
La regla de la cadena para una función de tres variables w = w(t) = f(x(t), y(t), z(t))
tiene una forma análoga a la ecuación 2.8:
dw
dt
=
∂w
∂x
dx
dt
+
∂w
∂y
dy
dt
+
∂w
∂z
dz
dt
(2.13)
2.4.1. El vector gradiente
Observe que la ecuación 2.8 puede escribirse en la forma
dz
dt
=
(
∂f
∂x
,
∂f
∂y
)
·
(
dx
dt
,
dy
dt
)
El vector
(
∂f
∂x
,
∂f
∂y
)
se denomina gradiente de fen (x, y) y se denota ∇f , así:
∇f =
(
∂f
∂x
,
∂f
∂y
)
Nota. La notación ∇f significa ∇f(x, y).
Si calculamos el gradiente en un punto (x0, y0) escribimos
∇f(x0, y0) =
(
∂f
∂x
(x0, y0),
∂f
∂y
(x0, y0)
)
Si escribimos −→r (t) = (x(t), y(t)), entonces −→r ′(t) =
(
dx
dt
,
dy
dt
)
y la ecuación
2.8, calculada en un punto t0, toma la forma
dz
dt
|t=t0 =
d
dt
|t=t0f(−→r (t)) = ∇f(−→r (t0)) ·
−→
r′ (t0) (2.14)
Podemos utilizar la forma de la regla de la cadena como la expresa la ecuación
2.14 para probar que el vector gradiente de z = f(x, y) en un punto P = (x0, y0)
es perpendicular a la curva de nivel f(x, y) = k que pasa por P . Para ver esto,
46
supongamos que dicha curva de nivel está descrita por la función vectorial−→r (t) = (x(t), y(t)) que pasa por P en un tiempo t0, esto es, P = −→r (t0) =
(x0, y0). Es claro entonces que debe ser f(x(t), y(t)) = f(
−→r (t)) = k. Derivando
a ambos lados de esta ecuación tenemos que
d
dt
f(−→r (t)) = 0 (2.15)
Aplicando la fórmula 2.14 para el lado izquierdo de la ecuación 2.15 en el punto
P , tenemos que
∇f(x0, y0) ·
−→
r′ (t0) = 0
lo que prueba lo afirmado. La gráfica abajo ilustra la situación.
De la misma manera, el vector gradiente de una función de tres variables
w = F (x, y, z) en un punto P = (x0, y0, z0) es perpendicular a la superfi-
cie de nivel S definida por la ecuación F (x, y, z) = k que pasa por P . Si−→r (t) = (x(t), y(t), z(t)) es cualquier curva sobre S que pasa por P en un tiem-
po t0, entonces F (
−→r (t)) = k y de nuevo
∇F (x0, y0, z0) ·
−→
r′ (t0) = 0 (2.16)
47
Como la ecuación 2.16 es válida para todas las curvas sobre S que pasan por P ,
resulta natural definir el plano tangente a S en el punto P como el plano que
pasa por P (x0, y0, z0) y que tiene por vector normal el gradiente ∇F (x0, y0, z0),
por lo que su ecuación será
(−→x − P ) · ∇F (P ) = 0
siendo su expresión cartesiana
∂F
∂x
(x0, y0, z0)(x − x0) +
∂F
∂y
(x0, y0, z0)(y − y0) +
∂F
∂z
(x0, y0, z0)(z − z0) = 0.
(2.17)
Observe que como la gráfica de una función de dos variables z = f(x, y) puede
verse como la superficie de nivel F (x, y, z) = 0 donde F (x, y, z) = f(x, y) − z,
al aplicar la ecuación 2.17 a esta F en particular, obtenemos la ecuación 2.3.
2.5. Derivadas Direccionales
Recordemos que la derivada parcial con respecto a x de una función de dos
variables z = f(x, y) se define por
∂f
∂x
(x0, y0) = ĺım
t→0
f(x0 + t, y0) − f(x0, y0)
t
Esta es la misma ecuación 2.1 en donde hemos reemplazado △x por t. Esta
expresión puede escribirse en la forma
∂f
∂x
(x0, y0) = ĺım
t→0
f((x0, y0) + t(1, 0)) − f(x0, y0)
t
Si escribimos −→x0 = (x0, y0) y
−→
i = (1, 0)obtenemos
48
∂f
∂x
(−→x0) = ĺım
t→0
f(−→x0 + t
−→
i ) − f(−→x0)
t
De la misma manera, escribiendo
−→
j = (0, 1) la derivada parcial con respecto a
y se escribe
∂f
∂y
(−→x0) = ĺım
t→0
f(−→x0 + t
−→
j ) − f(−→x0)
t
Esta forma de expresar las derivadas parciales muestran que dichas derivadas
se calculan tomando la variación de f a lo largo de las rectas −→α (t) = −→x0 + t
−→
i
y
−→
β (t) = −→x0 + t
−→
j , esto es, rectas paralelas a los ejes coordenados que pasan
por −→x0. Podemos pensar en generalizar esto, calculando la variación de f a
lo largo de cualquier recta que pase por −→x0, esto es, una recta de la forma−→r (t) = −→x0 + t−→u donde −→u es un vector unitario cualquiera. Esto nos conduce
al concepto de derivada direccional en la dirección de un vector unitario −→u en
un punto −→x0, denotada D−→u f(−→x0) y definida de la manera natural
D−→u f(
−→x0) = ĺım
t→0
f(−→x0 + t−→u ) − f(−→x0)
t
(2.18)
y se puede interpretar geométricamente como la pendiente de la tangente de
la curva de intersección de la gráfica de f con un plano perpendicular al plano
coordenado xy en el punto −→x0.
Es claro entonces que
49
∂f
∂x
(−→x0) = D−→i f(
−→x0)
∂f
∂y
(−→x0) = D−→j f(
−→x0)
esto es, las derivadas parciales son las derivadas direccionales en las direcciones−→
i y
−→
j , que corresponden a las pendientes de las tangentes de las curvas de
intersección de la gráfica de f con planos perpendiculares al plano coordenado
xy paralelos a los planos coordenados xz y yz respectivamente, como se explicó
en la sección 2.3.1.
Una forma sencilla de calcular la derivada direccional en la dirección de un
vector unitario −→u de una función f la da el siguiente teorema:
Teorema 2.5.1
D−→u f(
−→x0) = ∇f(−→x0) · −→u (2.19)
Demostración. Si llamamos −→r (t) = −→x0 + t−→u a la recta que pasa por −→x0 con
vector director −→u , entonces −→r (0) = −→x0 y
−→
r′ (0) = −→u . Entonces
d
dt
|t=0f(−→r (t)) = ĺım
t→0
f(−→r (t)) − f(−→r (0))
t
= ĺım
t→0
f(−→x0 + t−→u ) − f(−→x0)
t
= D−→u f(
−→x0)
Pero, por la regla de la cadena (ecuación 2.14) se tiene que
d
dt
|t=0f(−→r (t)) = ∇f(−→r (0)) ·
−→
r′ (0)
= ∇f(−→x0) · −→u
lo que demuestra el teorema.
Nota. Observe que la definición de derivada direccional (ecuación 2.18) ó su
expresión en términos del gradiente (ecuación 2.19) es válida para cualquier
campo escalar f definido en Rn.
La derivada direccional de un campo escalar f en un punto −→x0 en la dirección
de un vector −→u (unitario), representa la tasa de cambio de f en dicho punto
en la dirección dada. Podemos preguntarnos por la dirección en la cual dicha
tasa de cambio es máxima ó mínima. Podemos encontrar la razón de cambio
máxima y mínima de f a partir de la ecuación 2.19. Puesto que ‖−→u ‖ = 1,
D−→u f(
−→x0) = ∇f(−→x0) · −→u
= ‖∇f(−→x0)‖ cos θ
50
dónde θ es el ángulo entre ∇f(−→x0) y −→u . Puesto que el coseno oscila entre −1 y
1, la razón máxima se obtiene cuando cos θ = 1, esto es θ = 0, es decir, cuando−→u y ∇f(−→x0) tienen la misma dirección y es mínima cuando cos θ = −1, esto es
θ = π, es decir, cuando −→u y ∇f(−→x0) tienen direcciones opuestas. Resumiendo,
la derivada direccional máxima se obtiene en la dirección del gradiente, esto es,
−→u = ∇f‖∇f‖ y su valor es D ∇f||∇f|| f = ‖∇f‖; la derivada direccional mínima se
obtiene en la dirección opuesta al gradiente y su valor es −‖∇f‖ .
2.6. Máximos y Mínimos.
1. f(−→a ) es un valor máximo global de f en U si f(−→a )≥f(x, y) para todo
(x, y) ∈ U.
2. f(−→a ) es un valor mínimo global de f en U si f(−→a )≤f(x, y) para todo
(x, y) ∈ U.
3. f(−→a ) es un valor extremo global de f en U si es un valor máximo global
o mínimo global.
Son válidas las mismas definiciones, sustituyendo la palabra global por local en
(1) y (2), cuando las desigualdades se cumplen en alguna vecindad abierta de−→a .
La definición es una generalización natural de las mismas nociones para fun-
ciones de una sola variable; y aún más, las generalizaciones para funciones de
tres y más variables son claras.
Teorema 2.6.1 (Existencia de máximo o mínimo)) Si f es continua en un
dominio cerrado y acotado U, entonces f alcanza tanto un valor máximo global
como un mínimo global en U .
A continuación definiremos lo que son puntos frontera, puntos críticos y puntos
singulares.
1. Puntos frontera. Vea la sección 2.2
2. Puntos críticos. Decimos que −→a es un punto crítico si es interior en U
donde f es diferenciable y ∇f(−→a ) = 0. En dicho punto, el plano tangente
es horizontal.
3. Puntos singulares. Decimos que a es un punto singular si es interior en
U donde f no es diferenciable (por ejemplo, un punto de la gráfica donde
f tiene una esquina aguda).
51
Teorema 2.6.2 (Condiciones necesarias para los extremos) Sea f una
función definida en un conjunto U que contiene a −→a . Si f(−→a ) es un valor
extremo, entonces −→a deberá ser un punto frontera de U, o un punto crítico de
f, o un punto singular de f.
Demostración. Supongamos que −→a = (x0, y0) no es punto frontera ni singular
(por lo que −→a será un punto interior en el que ∇f existe) y veremos si ∇f(−→a ) =−→
0 Puesto que f tiene un valor extremo en (x0, y0), la función g(x) = f(x, y0)
tiene un valor extremo en x0. Además, g es diferenciable en x0 puesto que f lo
es para (x0, y0) y por lo tanto, por el teorema del punto crítico para funciones
de una variable,
g′(x0) = fx(x0, y0) = 0
En forma análoga, la función h(y) = f(x0, y) tiene un valor extremo en y0 y
satisface la expresión
h′(x0) = fy(x0, y0) = 0
El gradiente es cero, ya que ambas derivadas parciales son 0.
Ejemplo 2.6.1 Encuentre el valor máximo o mínimo local de f(x, y) = x2 −
2x + y2/4.
Solución La función dada es derivable en todo el plano xy. Por lo tanto,
los únicos puntos críticos posibles son los puntos críticos que se obtienen al
igualar a cero fx(x, y) y fy(x, y). Pero fx(x, y) = 2x − 2 y fy(x, y) = y/2 son
iguales a cero sólo cuando x = 1 e y = 0. Falta por decidir si (1, 0) es un
máximo, un mínimo o nada de esto. Pronto desarrollaremos un instrumento
para esto, pero por ahora debemos proceder con un poco de ingenio. Obsérvese
que f(1, 0) = −1 y que
f(x, y) = x2 − 2x + y
2
4
= x2 − 2x + 1y
2
4
− 1 = (x − 1)2 + y
2
4
− 1 ≥ −1
Por lo tanto, f(1, 0) es en realidad un mínimo global de f. No hay valores
máximos locales.
Ejemplo 2.6.2 Encuentre los valores máximo o mínimo locales de f(x, y) =
−x2/a2 + y2/b2.
Solución. Los únicos puntos críticos se obtienen al igualar a cero fx(x, y) =
−2x/a2 y fy(x, y) = 2y/b2. Esto produce el punto (0, 0) que no da máximo ni
mínimo (vea la figura 11). Se llama punto de silla. Debe notarse que en toda
vecindad de (0, 0) hay puntos en los que f(x, y) < f(0, 0), y otros puntos en
los que f(x, y) > f(0, 0). La función dada no tiene extremos locales.
Este ejemplo ilustra la dificultad de que ∇f(x0, y0) = 0 no garantiza que exista
un extremo local en (x0, y0). Por fortuna, existe un criterio regular para decidir
lo que sucede en un punto crítico. El próximo teorema es un análogo a la prueba
de segunda derivada para funciones de una variable.
52
2.6.1. Criterio para determinar extremos de funciones de
dos variables
Teorema 2.6.3 [Condiciones suficientes para los extremos] Supóngase que f(x, y)
tiene segundas derivadas parciales continuas en una vecindad de −→a ∈ R2 y que
∇f(−→a ) = 0. Sea A = ∂
2f(−→a )
∂x2
, B =
∂2f(−→a )
∂x∂y
, C =
∂2f(−→a )
∂y2
y sea Hf(−→a )
la matriz definida por
Hf(−→a ) =
[
A B
B D
]
Escribamos D(−→a ) = det(Hf(−→a )). Entonces
1. Si D(−→a ) > 0 y ∂
2f(−→a )
∂x2
> 0, entonces tiene un mínimo relativo en −→a .
2. Si D(−→a ) > 0 y ∂
2f(−→a )
∂x2
< 0, entonces tiene un máximo relativo en −→a .
3. Si Si D(−→a ) < 0, entonces tiene un punto silla en −→a .
4. Si D(−→a ) = 0, el criterio no decide nada.
Nota. La matriz Hf(−→a ) se denomina matriz hessiana de f en −→a .
Para su demostración, remitimos al lector al apéndice. Sin embargo, podemos
ver de manera intuitiva porqué es cierto. D es
D(−→a ) = ∂
2f(−→a )
∂x2
· ∂
2f(−→a )
∂y2
−
(
∂2f(−→a )
∂x∂y
)2Para los casos 1 y 2, en los cuales D(−→a ) > 0, se tiene entonces que ∂
2f(−→a )
∂x2
·
∂2f(−→a )
∂y2
>
(
∂2f(−→a )
∂x∂y
)2
≥ 0, por lo que las dos derivadas ∂
2f(−→a )
∂x2
y
∂2f(−→a )
∂y2
deben tener el mismo signo. Así, si
∂2f(−→a )
∂x2
> 0, se tiene concavidad hacia
arriba en las direcciones de ambos ejes, por lo que se puede sospechar que
en −→a existe un mínimo. Y si ∂
2f(−→a )
∂x2
< 0, se tiene concavidad hacia abajo
en la dirección de ambos ejes, por lo que se puede sospechar la existencia
de un máximo en −→a . En el caso 3, en el cual D(−→a ) < 0, el producto de
las dos derivadas
∂2f(−→a )
∂x2
y
∂2f(−→a )
∂y2
debe ser negativo y por lo tanto deben
tener signos opuestos; de tal manera que tenemos concavidad hacia arriba en la
dirección de uno de los ejes y concavidad hacia abajo en la dirección del otro,
por lo que sospechamos un punto silla en −→a . Se deja al estudiante comprobar
la parte 4.
53
Ejemplo 2.6.3 Encuentre los extremos, si los hay, de la función f(x, y) =
3x3 + y2 − 9x + 4y.
Solución. Puesto que fx(x, y) = 9x2−9 y fy(x, y) = 2y+4, los puntos críticos
que se obtienen al resolver las ecuaciones simultáneas fx(x, y) = fy(x, y) = 0
son (1,−2) y (−1,−2).Ahora bien, fxx(x, y) = 18x, fyy(x, y) = 2 y fxy(x, y) =
fyx(x, y) = 0. Por lo tanto, en el punto crítico (1,−2) tenemos
D(1,−2) = fxx(1,−2)fyy(1,−2) − f2xy(1,−2) = 18(2)− 0 = 36 > 0
Además, fxx(1,−2) = 18 > 0, por lo que según el teorema anterior, f(1,−2) =
−10 es un valor mínimo local de f. En la comprobación de la función dada en
otro punto crítico (−1,−2) encontramos que fxx(−1,−2) = −18, fyy(−1,−2) =
2 y fxy(−1,−2) = 0, lo cual produce D(−1,−2) = −36 < 0. Entonces, (−1,−2)
es un punto de silla y f(−1,−2) no es valor extremo.
Ejemplo 2.6.4 Encuentre los valores máximo y mínimo de f(x, y) = 2x2 +
y2 − 4x − 2y + 5 en el conjunto cerrado U = {(x, y)|x2 + y2/2 ≤ 1}.
Solución. Como fx(x, y) = 4x − 4 y fy(x, y) = 2y − 2, el único punto crítico
posible es (1, 1). Sin embargo, este punto está fuera de U, entonces puede ser
ignorado. La frontera de U es la elipse x2 + y2/2 = 1, que se puede describir
paramétricamente por
x = cos t, y =
√
2 sen t, 0 ≤ t ≤ 2π
Deseamos maximizar o minimizar la función de una variable
g(t) = f(cos t,
√
2 sen t), 0 ≤ t ≤ 2π
Por la regla de la cadena,
g′(t) =
∂f
∂x
dx
dt
+
∂f
∂y
dx
dt
= (4x − 4)(−sen t) + (2y − 2)(
√
2 cos t)
= (4 cos t − 4)(−sen t) + (2
√
2 sen t − 2)(
√
2 cos t) = 4 sen t − 2
√
2 cos t
Haciendo g′(t) = 0 obtenemos tan t =
√
2/2 con los dos soluciones t1 =
arctan(
√
2/2) y t2 = π + t1. De donde g(t) tiene los cuatro puntos críticos
0, t1, t2 y 2π en el intervalo [0, 2π]. Estos, a su vez, determinan los tres pun-
tos (1, 0), (2/
√
6, 2/
√
6) y (−2/
√
6,−2/
√
6) en la frontera de U. Los valores
correspondientes de f son
f(1, 0) = 3, f
(
2√
6
,
2√
6
)
≈ 2,101, f
(−2√
6
,
−2√
6
)
≈ 11,899
Luego, concluimos que el valor mínimo de f en U es 2.101 y el valor máximo
es 11.899.
54
Ejemplo 2.6.5 Encuentre la distancia mínima entre el origen y la superficie
z2 = x2y + 4.
Solución. Sea P (x, y, z) un punto cualquiera de la superficie dada. El cuadra-
do de la distancia entre el origen y P es d2 = x2 + y2 + z2. Busquemos las
coordenadas de P que hagan que d2 (y por lo tanto d ) sea mínima. Puesto
que P pertenece a la superficie, sus coordenadas satisfacen la ecuación de ésta.
Sustituyendo z2 = x2y +4 en d2 = x2 + y2 + z2 resulta d2 como función de dos
variables x e y
d2 = f(x, y) = x2 + y2 + x2y + 4
Para obtener los puntos críticos, hacemos fx(x, y) = 0 y fy(x, y) = 0, con lo
que se obtiene
2x + 2xy = 0 y 2y + x2 = 0
Por eliminación de y entre esas ecuaciones, se tendrá 2x−x3 = 0. Por lo tanto,
x = 0 o x = ±
√
2. Sustituyendo estos valores en la segunda ecuación se obtiene
y = 0 e y = −1. Luego, los puntos críticos son (0, 0), (
√
2,−1) y (−
√
2,−1).
Para probar cada uno de ellos, necesitamos fxx(x, y) = 2 + 2y, fyy(x, y) =
2, fxy(x, y) = 2x y D(x, y) = fxxfyy − f2xy = 4 + 4y − 4x2. Puesto que
D(±
√
2,−1) = −8 < 0, ni (
√
2,−1) ni (−
√
2,−1) producen un extremo. Sin
embargo, D(0, 0) = 4 > 0 y fxx(0, 0) = 2 > 0; por lo tanto, (0, 0) produce la
distancia mínima. Sustituyendo x = 0 e y = 0 en la expresión de d2, obtenemos
d2 = 4. Luego, la distancia mínima entre el origen y la superficie dada es 2.
2.6.2. Extremos condicionados.
Ahora distinguimos entre dos clases de problemas. Encontrar el valor mínimo
de f(x, y) es un problema de extremo libre. Encontrar el mínimo de f(x, y)
sujeto a una condición g(x, y) = 0 es un problema de extremo condicionado o
de extremo restringido. El ejemplo 2.6.5 de la sección anterior fue un proble-
ma de extremo condicionado. Se nos pidió encontrar la distancia mínima entre
la superficie z2 = x2y + 4 al origen. Formulamos el problema de minimizar
d2 = x2 + y2 + z2 sujeta a la restricción z2 = x2y + 4. Manejamos el problema
sustituyendo el valor de z2 de la restricción en la expresión de d2 y después
resolvimos el problema de valor extremo libre que resultó. Sin embargo, con
frecuencia sucede que no es fácil despejar una de las variables en la ecuación de
restricción y, aún cuando pueda lograrse, puede ser más práctico otro método.
Este es el método de multiplicadores de Lagrange.
El método de Lagrange proporciona un recurso algebraico para encontrar los
puntos extremos restringidos. Si p0 es un extremo restringido, entonces la curva
de nivel y la restricción son tangentes en dicho punto. Las gráficas abajo ilustran
esta situación.
55
Dichas curvas tienen una recta tangente común y, por consecuencia, tienen una
perpendicular común. Pero en cualquier punto de una curva de nivel, el vector
gradiente ∇f es perpendicular a ella (ver sección 2.4.1) y en forma similar ∇g
es perpendicular a la curva de restricción g(x, y) = 0, pues dicha curva puede
verse como curva de nivel de la función z = g(x, y). Por lo tanto, ∇f y ∇g son
paralelos en p0, es decir,
∇f(p0) = λ0∇g(p0)
para algún número no nulos λ0. Esto sugiere la siguiente formulación del método
de Lagrange.
Método de multiplicadores de Lagrange. Si un campo escalar f(x1, x2, ..., xn)
tiene un extremo (máximo o mínimo) sujeto a la restricción g(x1, x2, ..., xn) = 0,
entonces existe un escalar λ tal que
∇f = λ ∇g
en dicho punto extremo. El número λ se llama multiplicador de Lagrange.
56
Teniendo en cuenta el método de multiplicadores de Lagrange observemos que
podemos formar la siguiente función
L(x1, x2, ..., xn, λ) = f(x1, x2, ..., xn) − λg(x1, x2, ..., xn)
conocida como función de Lagrange. En este caso los puntos extremos son
puntos críticos de L y por lo tanto las derivadas parciales de la función L son
cero en estos puntos.
Ejemplo 2.6.6 Encuentre el punto del plano 2x − 2y + z = 4 que esté más
próximo al origen.
Solución. Se desea minimizar la distancia d =
√
x2 + y2 + z2 sujeta a 2x −
2y+z−4 = 0. Para facilitar el problema se minimiza el cuadrado de la distancia
d2 = x2 + y2 + z2. La función de Lagrange será
L(x, y, z, λ) = x2 + y2 + z2 − λ (2x − 2y + z − 4)
Luego, el sistema de ecuaciones de Lagrange es
∂L
∂x
= 2x − 2λ = 0, ∂L
∂y
= 2y + 2λ = 0,
∂L
∂z
= 2z − λ = 0,
∂L
∂λ
= −2x + 2y − z + 4 = 0
Si se sustituyen los valores de 2x, 2y y z de las tres primeras ecuaciones en la
cuarta, se obtiene
−2λ − 2λ − λ
2
+ 4 = 0, o − 9
2
λ + 4 = 0, o λ =
8
9
Por tanto, x = 8/9, y = −8/9 y z = 4/9, aśí (8/9,−8/9, 4/9) es el punto
requerido, y la distancia de dicho punto al origen es
√
64 + 64 + 16
81
= 4 ·
√
4 + 4 + 1
81
= 4 ·
√
1
9
=
4
3
Ejemplo 2.6.7 ¿ Cual es el área máxima que puede tener un rectángulo si la
longitud de su diagonal es 2?
Solución. Coloque el rectángulo en el primer cuadrante con dos de sus lados
a lo largo de los ejes coordenados; entonces, el vértice opuesto al origen tendrá
como coordenadas (x, y), siendo positivas x e y. La longitud de su diagonal
será
√
x2 + y2 = 2 y su área xy. Entonces podemos formular el problema como
57
maximización de f(x, y) = xy sujeta a la restricción g(x,