Logo Studenta

Diferenciação em Rn

¡Este material tiene más páginas!

Vista previa del material en texto

Diferenciación en Rn
Como ya venimos haciendo, todos los conjuntos y funciones a los que nos referimos son
medibles, salvo aclaración en contrario.
En estas notas, además de con los espacios Lp(Rn) que ya conocemos, vamos a trabajar
con el espacio de funciones localmente integrables de Rn, es decir, de aquellas funciones
que son integrables sobre cualquier compacto de Rn. Éste es un espacio estrictamente más
grande que L1(Rn) (por ejemplo, contiene a las constantes) y lo notaremos L1loc(Rn).
Lo que vamos a hacer ahora es generalizar el Teorema Fundamental del Cálculo al caso
de la integral de Lebesgue y probar que los resultados valen con hipótesis menos restrictivas
que las necesarias para la integral de Riemann.
1. El Lema Simple de Vitali
En lo que sigue, vamos a trabajar con cubos de Rn, porque son los conjuntos medibles
con geometŕıa más simple. Comencemos por recordar que, dado E ⊂ Rn, definimos su
diámetro como
δ(E) = sup{|x− y| : x, y ∈ E}.
Por lo tanto, el diámetro de un cubo Q de lado ` es δ(Q) = `
√
n, y su medida es m(Q) = `n.
El siguiente lema de cubrimiento nos dice que podemos controlar la medida exterior de
un conjunto cualquiera cubriéndolo con cubos y quedándonos sólo con algunos de ellos que,
además, son disjuntos (lo que es una ventaja, porque nos permite sumar sus medidas).
Lema 1.1. (Lema simple de Vitali) Sea K una colección de cubos cerrados de medida
positiva que cubre a un conjunto E (no necesariamente medible). Si sup{δ(Q) : Q ∈ K} <
∞, entonces existe una sucesión disjunta Q1, Q2, . . . (que eventualmente puede ser finita)
de miembros de K tal que
me(E) ≤ 5n
∑
k
m(Qk)
Demostración. Sea s1 = sup{δ(Q) : Q ∈ K}. Por hipótesis sabemos que s1 < ∞ y por
definición de supremo podemos elegir un cubo Q1 ∈ K tal que δ(Q1) > 12s1.
Para elegir los demás cubos procedemos inductivamente: supongamos elegidos {Q1, . . . , Qk−1} ⊂
K; si cualquier otro cubo de la familia K corta a alguno de estos no seguimos, en caso con-
trario llamamos
sk = sup{δ(Q) : Q ∈ K y Q ∩ (Q1 ∪ · · · ∪Qk−1) = ∅}
y elegimos Qk ∈ K tal que
Qk ∩ (Q1 ∪ · · · ∪Qk−1) = ∅ y δ(Qk) >
1
2
sk.
Veamos que se cumple que me(E) ≤ 5n
∑
km(Qk). Si a la derecha tenemos una serie
divergente no hay nada que probar, aśı que podemos suponer que
∑
km(Qk) <∞.
Recordemos que esta suma puede tener finitos o infinitos términos. En este último caso,
como se trata de una serie convergente, tiene que valer ĺımk→∞m(Qk) = 0 y, por lo tanto,
ĺımk→∞ δ(Qk) = 0.
Afirmamos que si esto pasa, cualquier cubo de la familia K tiene que cortar a alguno
de los cubos Q1, Q2, . . . . En efecto, si suponemos que existe Q ∈ K tal que Q ∩ Qk = ∅
para todo k ∈ N, en particular tiene que valer que Q∩ (Q1∪· · ·∪Qk−1) = ∅. Pero entonces
sk ≥ δ(Q) para todo k ∈ N, por lo que tendŕıamos δ(Qk) > 12sk ≥
1
2δ(Q) para todo k ∈ N,
lo que es absurdo, porque ĺımk→∞ δ(Qk) = 0.
Sea entonces Q ∈ K y consideremos el mı́nimo k ∈ N tal que
Q ∩Qk 6= ∅ y Q ∩ (Q1 ∪ · · · ∪Qk−1) = ∅
Por definición de sk tiene que valer sk ≥ δ(Q) y, por cómo elegimos Qk, tiene que valer
δ(Qk) >
1
2sk ≥
1
2δ(Q), es decir que δ(Q) < 2δ(Qk).
Entonces, si llamamos Q∗k = 5Qk al cubo concéntrico con Qk tal que δ(Q
∗
k) = 5δ(Qk),
vale que Q ⊂ Q∗k y, por lo tanto,
E ⊂
⋃
Q∈K
Q ⊂
⋃
k∈N
Q∗k
y, tomando medida,
me(E) ≤
∑
k∈N
m(Q∗k) = 5
n
∑
k∈N
m(Qk),
como queŕıamos.
Nos falta el caso en que la suma de la derecha tiene finitos términos. Pero si esto
pasa, quiere decir que entonces todo cubo de la familia K corta a alguno de los cubos
Q1, Q2, . . . y el resto del razonamiento es igual que antes (con una suma finita en lugar de
una infinita).
Observación 1.2. Si suponemos que 0 < me(E) <∞ podemos omitir pedir que sup{δ(Q) :
Q ∈ K} < ∞ (en efecto, podemos elegir un sólo cubo de diámetro suficientemente grande
para que se cumpla la conclusión), pero sin alguna hipótesis el resultado es falso.
2. La función maximal de Hardy-Littlewood
Definición 2.1. Para cada f ∈ L1(Rn) definimos la función maximal de Hardy-Littlewood
como
Mf(x) = sup
Q3x
1
m(Q)
∫
Q
|f(y)| dy
donde el supremo se toma sobre todos los cubos cerrados de Rn que contienen al punto x.
Observen que la maximal considera el “peor” de todos los promedios posibles alrededor
de un punto, de ah́ı su nombre. Nosotros la vamos a usar a para probar el Teorema de
Diferenciación de Lebesgue, pero es un operador que resulta ser muy importante en análisis
para controlar a otros operadores.
Observación 2.2. M es sublineal, es decir que dado α ∈ C, M(f + αg)(x) ≤ Mf(x) +
|α|Mg(x).
Demostración.
M(f + αg)(x) = sup
Q3x
1
m(Q)
∫
Q
|f(y) + αg(y)| dy
≤ sup
Q3x
1
m(Q)
∫
Q
|f(y)| dy + |α| sup
Q3x
1
m(Q)
∫
Q
|g(y)| dy
= Mf(x) + |α|Mg(x)
Proposición 2.3. Mf es una función semicontinua inferiormente (y, por lo tanto, medi-
ble).
Demostración. Tenemos que ver que para todo λ ∈ R, el conjunto {x : Mf(x) > λ} es
abierto.
Primero vamos a probar que es abierto el conjunto {x : M̃f(x) > λ}, con
M̃f(x) = sup
Qo3x
1
m(Q)
∫
Q
|f(y)| dy
donde el supremo se toma sobre los cubos que contienen a x en su interior. Si y ∈ {x :
M̃f(x) > λ}, quiere decir que existe Q0 tal que y ∈ Qo0 y
1
m(Q0)
∫
Q0
|f(z)| dz > λ
Como Qo0 es abierto, existe r > 0 tal que B(y, r) ⊂ Qo0. Si w ∈ B(y, r) ⊂ Qo0, tenemos que
M̃f(w) = sup
Qo3w
1
m(Q)
∫
Q
|f(z)| dz ≥ 1
m(Q0)
∫
Q0
|f(z)| dz > λ
de donde deducimos que B(y, r) ⊂ {x : M̃f(x) > λ}, lo que prueba que M̃f es semicontinua
inferiormente.
Para terminar la demostración, vamos a probar que M̃f = Mf . Es claro queMf ≥ M̃f ,
aśı que basta probar la otra desigualdad.
Dado x, sea Q un cubo tal que x ∈ Q. Entonces existe una sucesión de cubos Qk tales
que x ∈ Qok para todo k ∈ N y Q = ∩kQk. Como |f |χQk ≤ |f | y f ∈ L1, por convergencia
mayorada tenemos que
1
m(Q)
∫
Q
|f(y)| dy = ĺım
k→∞
1
m(Qk)
∫
Qk
|f(y)| dy ≤ sup
k
1
m(Qk)
∫
Qk
|f(y)| dy ≤ M̃f(x)
aśı que, tomando supremo, deducimos que Mf(x) ≤ M̃f(x) para todo x, como queŕıamos.
Observación 2.4. De la demostración anterior se deduce, en particular, que es lo mismo
definir la maximal considerando cubos cerrados (como hicimos) o abiertos.
Proposición 2.5. (Desigualdad maximal de Hardy-Littlewood) Para todo λ > 0,
m({Mf > λ}) ≤ 5
n
λ
‖f‖1
Demostración. Llamemos Eλ = {Mf > λ}. Para estimar la medida de este conjunto
vamos a usar el Lema simple de Vitali (sabemos que es medible porque ya probamos que
es abierto).
Observen que si x ∈ Eλ, entonces existe Q tal que x ∈ Q y
1
m(Q)
∫
Q
|f(y)| dy > λ.
Esto quiere decir que la colección Kλ de todos los cubos que verifican esta condición es un
cubrimiento del conjunto Eλ. Además, para todo Q ∈ Kλ,
m(Q) <
1
λ
∫
Q
|f(y)| dy ≤ ‖f‖1
λ
<∞,
y por lo tanto también δ(Q) < ∞. Esto quiere decir que podemos aplicar el Lema simple
de Vitali y obtener una subfamilia (eventualmente finita) (Qk) ⊂ Kλ tal que
m(Eλ) ≤ 5n
∑
k
m(Qk) (por el Lema Simple de Vitali)
< 5n
∑
k
1
λ
∫
Qk
|f(y)| dy (porque Qk ∈ Kλ)
= 5n
1
λ
∫
∪Qk
|f(y)| dy (porque los Qk son disjuntos)
≤ 5
n
λ
‖f‖1
Corolario 2.6. Si f ∈ L1, entonces Mf es finita en casi todo punto.
Demostración. Como {Mf = ∞} ⊂ {Mf > k} para todo k ∈ N, por la desigualdad
maximal tenemos que
m({Mf =∞}) ≤ m({Mf > k}) ≤ 5
n
k
‖f‖1
para todo k ∈ N, lo que prueba que m({Mf =∞}) = 0.
Observación 2.7. Recuerden que si g ∈ L1(Rn) entonces, por la desigualdad de Chebyshev,
m({|g| > λ}) ≤ 1
λ
‖g‖1
Aśı que si Mf estuviera acotada en L1 por la norma de f (que ya vimos que no es el
caso), podŕıamos obtener la desigualdad maximal reemplazando g = Mf . Es por esto que
la desigualdad maximal se llama desigualdad de tipo débil, y es lo mejor a lo que podemos
aspirar en el caso p = 1.
Observación 2.8. Si f ∈ L1loc(Rn) y definimos
M∗f(x) = sup
r>0
1
m(B(x, r))
∫
B(x,r)
|f(y)| dy,
entonces existen constantes c1, c2 tales que c1M
∗f ≤Mf ≤ c2M∗f .
Demostración. Sabemos que m(B(x, r)) = ωn r
n conde ωn es el volumen de la bola unitaria
(de hecho calculamos su valorexacto como aplicación del Teorema de Cambio de Variables)
y que existe un cubo Q que tiene lados de longitud 2r tal que B(x, r) ⊂ Q. Entonces,
m(Q) = (2r)n =
2nm(B(x, r))
ωn
=
m(B(x, r))
c1
y
c1
m(B(x, r))
∫
B(x,r)
|f(y)| dy ≤ 1
m(Q)
∫
Q
|f(y)| dy
de donde, tomando supremo, obtenemos que c1M
∗f(x) ≤Mf(x).
Consideremos ahora un cubo Q que contiene a x de diámetro r. Entonces el lado del
cubo es ` = r√
n
(porque que δ(Q) = `
√
n) y m(Q) = r
n
nn/2
. Además, Q ⊂ B(x, 2r) y
m(B(x, 2r)) = ωn (2r)
n = ωn 2
nnn/2m(Q) = c2m(Q). Entonces,
1
m(Q)
∫
Q
|f(y)| dy ≤ c2
m(B(x, r))
∫
B(x,r)
|f(y)| dy
de donde, tomando supremo, obtenemos que Mf(x) ≤ c2M∗f(x).
Observación 2.9. La observación anterior dice que, salvo constantes, es equivalente con-
siderar la maximal sobre bolas centradas en x que sobre cubos (no centrados) que contienen
a x. También son equivalentes salvo constantes la maximal sobre cubos centrados en x y
sobre bolas no centradas que contengan a x, y se prueba de manera análoga. Además, las
bolas pueden ser cerradas o abiertas, al igual que en el caso de los cubos.
Proposición 2.10. Mf 6∈ L1(Rn) a menos que f ≡ 0 en casi todo punto.
Demostración. Veamos primero que esto pasa si f es una función caracteŕıstica, digamos
f = χE . Si E ⊂ Rn es acotado y z ∈ E, existe un cubo Q tal que E ⊂ Q y
Mf(z) ≥ 1
m(Q)
∫
Q
|f(y)| dy = 1
m(Q)
m(E ∩Q) = m(E)
m(Q)
Si consideramos x tal que |x| > 1, entonces el cubo |x|Q (concéntrico con Q y de diámetro
|x|δ(Q)) también contiene a E, y entonces
Mf(z) ≥ 1
m(|x|Q)
∫
|x|Q
|f(y)| dy = m(E)
|x|nm(Q)
Pero entonces, si llamamos k = m(E)m(Q) tenemos∫
Rn
Mf(x) dx ≥
∫
Rn
k
|x|n
dx ≥
∫
{|x|>1}
k
|x|n
dx =∞
Si en cambio f = χE con E ⊂ Rn no acotado, podemos escribir E = ∪kEk con
Ek = E ∩ B(0, k). Como f 6≡ 0, debe existir algún k tal que m(Ek) > 0, y si f̃ = χEk
tenemos que f̃ ≤ f , aśı que Mf̃ ≤Mf y, por lo anterior,∫
Rn
Mf(x) dx ≥
∫
Rn
Mf̃(x) dx =∞
Por último, si f es integrable y f 6≡ 0, podemos suponer que m({f > 0}) > 0 (si no,
esto vale para {f < 0} y la demostración es análoga). Como
{f > 0} =
⋃
k∈N
{
f >
1
k
}
=
⋃
k∈N
Ek,
debe existir k0 ∈ N tal que m(Ek0) > 0. Como además fχEk0 >
1
k0
χEk0 ,
Mf(x) ≥M(fχEk0 )(x) ≥
1
k0
MχEk0 (x)
y, por lo anterior, ∫
Rn
Mf(x) dx ≥ 1
k0
∫
Rn
MχEk0 (x) =∞
Teorema 2.11. Si 1 < p ≤ ∞, entonces existe c > 0 tal que ‖Mf‖p ≤ c‖f‖p, es decir que
M es un operador acotado de Lp en Lp.
Demostración. Si p =∞, entonces para todo x
Mf(x) = sup
Q3x
1
m(Q)
∫
Q
|f(y)| dy ≤ sup
Q3x
1
m(Q)
‖f‖∞
∫
Q
dy = ‖f‖∞
de donde deducimos que ‖Mf‖∞ ≤ ‖f‖∞.
Si ahora 1 < p < ∞ y f ∈ Lp, consideremos E1 = {|f | ≥ t} y E2 = {|f | < t}, donde
t > 0 es un valor que vamos a elegir después. Entonces f = fχE1 + fχE2 = f1 + f2.
Veamos que f1 ∈ L1 ∩ Lp y que f2 ∈ Lp ∩ L∞.
En efecto,∫
Rn
|f1|p dx =
∫
E1
|f1|p dx =
∫
E1
|f |p dx ≤
∫
Rn
|f |p dx = ‖f‖pp <∞
y, por la desigualdad de Chebyshev,
m(E1) ≤
1
tp
‖f‖pp <∞
aśı que como f1 ∈ Lp(E1), entonces f1 ∈ L1(E1).
Que f2 ∈ Lp se puede ver como antes. Además, como |f2| ≤ t para todo x, entonces
‖f2‖∞ ≤ t, por lo que f2 ∈ L∞.
Ahora, como vimos en la Proposición 4.2 de las notas de Lp, podemos calcular la norma
p de la maximal usando su función de distribución. Tenemos que
‖Mf‖pp = p
∫ ∞
0
λp−1m({Mf > λ}) dλ
Como f = f1 + f2 y la maximal es sublineal, Mf ≤Mf1 +Mf2, aśı que
{Mf > λ} ⊂
{
Mf1 >
λ
2
}
∪
{
Mf2 >
λ
2
}
y, tomando medida,
m({Mf > λ}) ≤ m
({
Mf1 >
λ
2
})
+m
({
Mf2 >
λ
2
})
Observemos que si tomamos t = λ2 , como ‖Mf2‖∞ ≤ ‖f2‖∞ ≤ t =
λ
2 , entonces Mf2 ≤
λ
2
en casi todo punto y, por lo tanto
m
({
Mf2 >
λ
2
})
= 0.
Además, usando la desigualdad maximal de Hardy-Littlewood,
m({Mf > λ}) ≤ m
({
Mf1 >
λ
2
})
≤ 5
n2
λ
‖f1‖1
aśı que, volviendo al cálculo de la norma,
‖Mf‖pp ≤ p
∫ ∞
0
λp−1
5n2
λ
‖f1‖1 dλ
= c̃
∫ ∞
0
λp−2‖f1‖1 dλ (llamando c̃ = p 5n2)
= c̃
∫ ∞
0
λp−2
∫
{|f |>λ
2
}
|f | dx dλ
= c̃
∫
Rn
∫ 2|f |
0
λp−2 dλ dx (por Fubini-Tonelli)
= c̃
2p−1
p− 1
∫
Rn
|f |p dx
= c ‖f‖pp (llamando c = c̃ 2
p−1
p−1 )
Observación 2.12. En la demostración anterior no se usa la definición de la maximal,
sólo que es de tipo débil cuando p = 1 y acotada cuando p =∞, por lo que para cualquier
operador en las mismas condiciones valdrá la misma conclusión. De hecho, este es un
caso particular de un teorema más general que se conoce con el nombre de Teorema de
Interpolación de Marcinkiewicz.
3. El Teorema de Diferenciación de Lebesgue
Definición 3.1. Dada f ∈ L1loc(Rn), decimos que x es un punto de diferenciación de la
integral de f si
ĺım
δ(Q)→0
Q3x
1
m(Q)
∫
Q
f(y) dy = f(x)
(el ĺımite se toma sobre cubos que contienen a x y cuyos diámetros tienden a cero, es decir
que se contraen al punto x).
Definición 3.2. Dada f ∈ L1loc(Rn), decimos que x es un punto de Lebesgue de f si
ĺım
δ(Q)→0
Q3x
1
m(Q)
∫
Q
|f(y)− f(x)| dy = 0
Observación 3.3. Todo punto de Lebesgue es un punto de diferenciación, ya que∣∣∣∣ 1m(Q)
∫
Q
f(y) dy − f(x)
∣∣∣∣ ≤ 1m(Q)
∫
Q
|f(y)− f(x)| dy
Nuestro objetivo es probar que si f ∈ L1loc(Rn), casi todo punto x ∈ Rn es un punto
de Lebesgue (y, por lo tanto, de diferenciación). El primer problema que tenemos es que
no sabemos que exista el ĺımite de los promedios de la integral, por eso introducimos el
siguiente operador.
Definición 3.4. Para cada f ∈ L1(Rn) y cada x ∈ Rn definimos el operador ĺımite superior
como
Lf(x) = ĺım sup
δ(Q)→0
Q3x
1
m(Q)
∫
Q
|f(y)− f(x)| dy
Observación 3.5. Las propiedades de Lf(x) son parecidas a las de Mf(x). En primer
lugar, observemos que:
L(f + g) ≤ L(f) + L(g)
Proposición 3.6. Si f es continua (e integrable) entonces Lf(x) = 0 en todo punto.
Demostración. Como f es continua en x, dado ε > 0 existe δ∗ > 0 tal que si δ(Q) < δ∗ se
tiene que |f(x)− f(y)| < ε.
Entonces, si δ(Q) < δ∗,
1
m(Q)
∫
Q
|f(y)− f(x)| dy < 1
m(Q)
εm(Q) = ε
y, por lo tanto, Lf(x) ≤ ε. Pero como ε es arbitrario, debe ser Lf ≡ 0.
Lema 3.7. Si λ > 0,
me({Lf(x) > λ}) ≤
c
λ
‖f‖1
donde c es una constante que sólo depende de la dimensión
Demostración. Tenemos que
1
m(Q)
∫
Q
|f(y)− f(x)| dy ≤ 1
m(Q)
∫
Q
|f(y)| dy + 1
m(Q)
∫
Q
|f(x)| dy
=
1
m(Q)
∫
Q
|f(y)| dy + |f(x)|
≤Mf(x) + |f(x)|
y, por lo tanto,
Lf(x) ≤Mf(x) + |f(x)|
Luego,
{Lf > λ} ⊂
{
Mf >
λ
2
}
∪
{
|f | > λ
2
}
y, tomando medida,
me({Lf > λ}) ≤ m
({
Mf >
λ
2
})
+m
({
|f | > λ
2
})
≤ 5
n2
λ
‖f‖1 +
2
λ
‖f‖1
=
2(5n + 1)
λ
‖f‖1
por la desigualdad maximal y la desigualdad de Chebyshev.
Proposición 3.8. Si f ∈ L1(Rn), casi todo punto es un punto de Lebesgue, o sea que para
casi todo punto x vale
ĺım
δ(Q)→0
Q3x
1
m(Q)
∫
Q
|f(y)− f(x)| dy = 0
(en particular, Lf es medible).
Demostración. La idea es usar que ya probamos que esto vale para una función continua,
y que las funciones continuas que están en L1 son densas en L1.
Entonces, dada f ∈ L1, sea (ψk)k∈N una sucesión de funciones continuas (e integrables)
tales que ‖f − ψk‖1 → 0 cuando k →∞.
Como L(ψk) = 0 (por ser continua), tenemos que
L(f) = L((f − ψk) + ψk) ≤ L(f − ψk) + L(ψk) = L(f − ψk)
Y entonces, tomando medida,
me({Lf > λ}) ≤ me({L(f − ψk) > λ})
Por lo tanto, por el lema anterior,
me({Lf > λ}) ≤
c
λ
‖f − ψk‖1 → 0 cuando k →∞
Entonces, para todo λ > 0 debe ser me({Lf > λ}) = 0 y como
{Lf 6= 0} ⊂
∞⋃
k=1
{Lf > 1/k}
concluimos que me({Lf 6= 0}) = 0, es decir que Lf(x) = 0 en casi todo punto.
Observación 3.9. El mismo resultado vale si f ∈ L1loc(Rn). Para probarlo, basta aplicar
el resultado a fk = f · χQk donde Qk es el cubo de centro 0 y diámetro k.
Teorema 3.10. (Teorema de Diferenciación de Lebesgue) Si f ∈ L1loc(Rn), entonces para
casi todo x ∈ Rn
ĺım
δ(Q)→0
Q3x
1
m(Q)
∫
Q
f(y) dy = f(x)
Es decir, casi todo punto es un punto de diferenciación.
Demostración. Es consecuencia inmediata de la proposición anterior y de las observaciones
3.3 y 3.9.
Observen que el teorema que obtuvimos, cuando consideramos n = 1, es más fuerte que
el TeoremaFundamental del Cálculo que conoćıamos de Análisis 1, porque sólo requiere
que la función esté en L1 del intervalo que estemos considerando. Más concretamente, vale
lo siguiente.
Corolario 3.11. Si f ∈ L1([a, b]) y consideramos su integral indefinida
F (x) =
∫ x
a
f(t) dt
tenemos que F ′(x) = f(x) en casi todo punto de (a, b).
Demostración. Basta observar que los cocientes incrementales de F son promedios de f
sobre intervalos [x, x+ h] o [x+ h, x] (según el signo de h), que son cubos de dimensión 1
que contienen a x, y aplicar el Teorema de Diferenciación.
4. Cubrimientos de Vitali
Queremos ahora ver para qué funciones podemos garantizar que vale la regla de Barrow
(en R). Para eso vamos a necesitar un lema de cubrimiento más refinado que el Lema Simple
de Vitali.
Definición 4.1. Decimos que una colección de cubos K cubre a un conjunto E (no nece-
sariamente medible) en el sentido de Vitali si para cada x ∈ E y cada η > 0 existe un cubo
Q ∈ K tal que x ∈ Q y δ(Q) < η.
Lema 4.2. (Lema de Vitali) Si una colección de cubos K cubre a un conjunto E (no
necesariamente medible) en el sentido de Vitali y 0 < me(E) < ∞, entonces existe una
sucesión de cubos disjuntos (Qk) ⊂ K tal que
me
(
E −
⋃
k
Qk
)
= 0 y
∑
k
m(Qk) <∞
Demostración. Sea β = 25n y sea ε tal que 0 < ε <
β
2 . Tomemos un abierto G tal que
E ⊂ G y m(G) < (1+ε)me(E). Podemos suponer que todos los cubos de K están incluidos
en G y que tienen diámetro menor que 1, porque si sacamos a los que no cumplen esto
seguimos teniendo un cubrimiento en el sentido de Vitali.
Por el Lema Simple de Vitali, existen N1 ∈ N y {Q1, . . . , QN1} ⊂ K disjuntos tales que
N1∑
k=1
m(Qk) > βme(E)
Entonces,
me
(
E −
N1⋃
k=1
Qk
)
≤ m
(
G−
N1⋃
k=1
Qk
)
= m(G)−
N1∑
k=1
m(Qk)
porque los Qk son disjuntos y estamos suponiendo que están incluidos en G.
Entonces,
me
(
E −
N1⋃
k=1
Qk
)
< (1 + ε)me(E)− β me(E) <
(
1− β
2
)
me(E)
porque hab́ıamos elegido ε < β2 .
Si ahora llamamos E1 = E − ∪N1k=1Qk, observen que E1 está cubierto en el sentido de
Vitali por los cubos de la colección que no tocan a los ya elegidos. En efecto, si x ∈ E1, como
∪N1k=1Qk es un cerrado que no contiene a x, existe r > 0 tal que B(x, r) ∩ (∪
N1
k=1Qk) = ∅, y
como K es un cubrimiento en el sentido de Vitali hay cubos que contienen a x y a su vez
están contenidos en B(x, r) de diámetro tan chico como se quiera.
Por lo tanto, existen {QN1+1, . . . , QN2} ⊂ K disjuntos (entre śı y de los anteriores) tales
que
me
(
E −
N2⋃
k=1
Qk
)
= me
(
E1 −
N2⋃
k=N1+1
Qk
)
<
(
1− β
2
)
me(E1) =
(
1− β
2
)
me
(
E −
N1⋃
k=1
Qk
)
aśı que, por lo anterior,
me
(
E −
N2⋃
k=1
Qk
)
<
(
1− β
2
)(
1− β
2
)
me(E) =
(
1− β
2
)2
me(E)
Siguiendo con este razonamiento obtenemos (Qk)k∈N ⊂ K disjuntos tales que
me
(
E −
∞⋃
k=1
Qk
)
= 0
ya que
me
(
E −
∞⋃
k=1
Qk
)
≤ me
(
E −
Ni⋃
k=1
Qk
)
<
(
1− β
2
)i
me(E)→ 0 cuando i→∞
Además, como los Qk son disjuntos y están contenidos en G,
∞∑
k=1
m(Qk) ≤ m(G) < (1 + ε)me(E) <∞
Observación 4.3. Si me(E) = ∞, se puede conseguir una sucesión (Qk)k∈N tal que
me(E − ∪kQk) = 0, pero no vale que
∑
km(Qk) <∞.
Corolario 4.4. Si una colección de cubos K cubre a un conjunto E (no necesariamente
medible) en el sentido de Vitali y 0 < me(E) < ∞, entonces para cada ε > 0 existe una
sucesión finita disjunta {Q1, . . . , QN} ⊂ K tal que
me
(
E ∩
( N⋃
k=1
Qk
))
> me(E)− ε
Demostración. Por el Lema de Vitali, podemos obtener (Qk)k∈N ⊂ K tal que
me
(
E −
∞⋃
k=1
Qk
)
= 0 y
∞∑
k=1
m(Qk) <∞
Como la serie es convergente, existe N tal que
∑∞
k=N+1m(Qk) < ε. Entonces,
me(E) = me
(
E ∩
( ∞⋃
k=1
Qk
))
≤ me
(
E ∩
( N⋃
k=1
Qk
))
+me
(
E ∩
( ∞⋃
k=N+1
Qk
))
≤ me
(
E ∩
( N⋃
k=1
Qk
))
+
∞∑
k=N+1
m(Qk)
< me
(
E ∩
( N⋃
k=1
Qk
))
+ ε
5. Derivada de funciones monótonas
Definición 5.1. Dada f : R → R, las derivadas de Dini de f en x se definen por las
fórmulas
D+f(x) = ĺım sup
h→0+
f(x+ h)− f(x)
h
(Derivada superior por la derecha)
D+f(x) = ĺım inf
h→0−
f(x+ h)− f(x)
h
(Derivada inferior por la derecha)
D−f(x) = ĺım sup
h→0−
f(x+ h)− f(x)
h
(Derivada superior por la izquierda)
D−f(x) = ĺım inf
h→0−
f(x+ h)− f(x)
h
(Derivada inferior por la izquierda)
Entonces f ′(x) existe si y sólo si
D+f(x) = D+f(x) = D
−f(x) = D−f(x)
y además el valor común es finito.
Observación 5.2. Para trabajar siempre con h > 0 notemos que
D−f(x) = ĺım sup
h→0+
f(x)− f(x− h)
h
D−f(x) = ĺım inf
h→0+
f(x)− f(x− h)
h
Teorema 5.3 (Lebesgue-Vitali). Si f : [a, b] → R es monótona creciente entonces f ′(x)
existe (y es finita) en casi todo punto de [a, b]. Además f ′(x) es integrable en [a, b] y vale:∫ b
a
f ′(x) dx ≤ f(b)− f(a)
Demostración. Vamos a probar que en casi todo punto
D+f(x) ≤ D−f(x), D−f(x) ≤ D+f(x) (1)
Esto implica que
D+f(x) ≤ D−f(x) ≤ D−f(x) ≤ D+f(x) ≤ D+f(x)
aśı que las 4 derivadas deben ser iguales.
Sean u, v ∈ Q con u > v > 0, y consideremos los conjuntos
E = Eu,v =
{
x ∈ [a, b] : D+f(x) > u > v > D−f(x)
}
Como
{D+f(x) > D−f(x)} =
⋃
u,v∈Q
u>v>0
Eu,v,
si probamos que m(Eu,v) = 0 para todo u, v ∈ Q, entonces D+f(x) ≤ D−f(x) en casi todo
punto.
Fijemos u, v y supongamos que me(E) > 0. Entonces, dado ε > 0, existe un abierto G
tal que E ⊂ G y m(G) < me(E) + ε.
Si x ∈ E, entonces
D−f(x) = ĺım inf
h→0+
f(x)− f(x− h)
h
< v
Por lo tanto, hay valores de h > 0 tan pequeños como se quiera tales que
f(x)− f(x− h)
h
< v
Si I = [x− h, x], como G es abierto, podemos además elegir h de modo que I ⊂ G. Y, por
lo anterior, si ∆f(I) = f(x) − f(x − h) es el incremento de f en el intervalo I, entonces
∆f(I) < v.m(I).
Es decir que hay intervalos cerrados tan pequeños como se quiera que cumplen que
1. I ⊂ G
2. ∆f(I) < v.m(I)
O sea que la colección de los intervalos que cumplen estas dos condiciones cubre a E
en el sentido de Vitali. Entonces, existen {I1, I2, . . . , IN} disjuntos tales que
me
(
E ∩
( N⋃
k=1
Ik
))
> me(E)− ε
Si
E1 = E ∩
( N⋃
k=1
Iok
)
,
entonces también me(E1) > me(E)−ε (sólo difiere en finitos puntos del conjunto anterior).
Si x ∈ E1 entonces x ∈ Iok para algún k y existen valores de h arbitrariamente pequeños
tales que
f(x+ h)− f(x)
h
> u
Si J = [x, x+ h] y razonamos como antes, los intervalos J tales que J ⊂ Ik para algún k y
∆f(J) > u.m(J), cubren a E1 en el sentido de Vitali.
Entonces existen {J1, . . . , JM} disjuntos tales que
me
(
E1 ∩
( M⋃
i=1
Ji
))
> me(E1)− ε > me(E)− 2ε
de donde,
me(E)− 2ε <
M∑
i=1
m(Ji)
y
u.(me(E)− 2ε) < u
M∑
i=1
m(Ji) ≤
M∑
i=1
∆f(Ji)
Como cada Ji está incluido en algún Ik resulta
u.(me(E)− 2ε) <
N∑
k=1
∑
Ji⊂Ik
∆f(Ji)
Como f es monótona creciente y los Ji son disjuntos
∑
Ji⊂Ik ∆f(Ji) ≤ ∆f(Ik)
Luego, usando que los intervalos Ik son disjuntos y están contenidos en G,
u.(me(E)− 2ε) ≤
N∑
k=1
∆f(Ik) <
N∑
k=1
v.m(Ik) ≤ v.m(G) < v.(me(E) + ε)
Como la desigualdad vale para todo ε > 0 resulta que u.me(E) ≤ v.me(E) pero como
v < u esto implica que deber ser me(E) = 0. Luego, D
+f(x) ≤ D−f(x) en casi todo punto.
Para probar que D−f(x) ≤ D+f(x) se puede usar un argumento análogo o aplicar lo
anterior a g(x) = −f(−x) (g es monótona creciente).
En definitiva, en casi todo punto
D+f(x) = D+f(x) = D
−f(x) = D−f(x)
Llamemos f ′(x) al valor común (en principio podŕıa ser infinito). Observemos que
f ′(x) = ĺım
h→0
f(x+ h)− f(x)
h
= ĺım
n→∞
f(x+ 1/n)− f(x)
1/n
y, por lo tanto, es medible.
Para probar que f ′ es finita en casi todo punto, basta probar que es integrable en [a, b].
Como f es monótona, los puntos de discontinuidad de f son a lo sumo numerables y,
por lo tanto, los puntos de continuidad de f son densos en [a, b]
Sean α, β ∈ [a, b] con α < β puntos de continuidad de f . Entonces, por el lema de Fatou∫ β
α
f ′(x) dx ≤ ĺım inf
h→0
∫ β
α
f(x+ h)− f(x)
h
dx
Pero ∫ β
α
f(x+ h)− f(x)
h
dx =
1
h
{∫ β
α
f(x+ h)dx−
∫ β
α
f(x)dx
}
=
1
h
{∫ β+h
α+h
f(x)dx−
∫ β
α
f(x)dx
}
=
1
h
{∫ β+h
β
f(x)dx−
∫ α+h
α
f(x)dx}
Como α y β son puntos de continuidad, por el Teorema Fundamental del Cálculo,
cuando h→ 0,
1
h
∫ α+h
α
f(x)dx→ f(α)
y
1
h
∫ β+h
β
f(x)dx→ f(β)
aśı que
ĺım
h→0
∫ β
α
f(x+ h)− f(x)
h
dx = f(β)− f(α)
y, el Lema de Fatou, ∫ β
α
f ′(x)dx ≤ f(β)− f(α)
Por último, si consideramos una sucesión εn → 0 y tal que αn = a + εn, βn = b − εn
sean puntos de continuidad de f para todo n ∈ N y llamamos fn = f ′χ[αn,βn], podemos
usar convergencia monótona (ya que f ′(x) ≥ 0) para obtener∫ b
a
f ′(x) dx = ĺım
n→∞
∫ βn
αn
f ′(x) dx ≤ ĺım
n→∞
(f(βn)− f(αn)) = f(b−)− f(a+) ≤ f(b)− f(a)
En definitiva, f ′(x) es integrable y en particular es finita en casi todo punto.
6. Funciones de variación acotada
Las funciones monótonas crecientes para las que acabamos de probar el último resul-
tado son una clase bastante restringida. Su importancia es que vamos a ver ahora que las
funciones de variación acotada son una clase mucho más grande de funciones que se pueden
escribir como diferencia de dos funciones monótonas crecientes, aśı que heredan varias de
sus propiedades.
Definición 6.1. Sea f : [a, b]→ R. Para cada partición π de [a, b]
π : a = x0 < x1 < x2 < . . . < xn = b
consideramos la suma
S(f,Π) =
n∑
i=1
|f(xi)− f(xi−1)|
Definimos la variación de f en [a, b] por
V ba (f) = sup
π
n∑
i=1
|f(xi)− f(xi−1)|
donde el supremo se toma sobre todas las particiones π de [a, b]. Claramente 0 ≤ V ba (f). Si
V ba (f) < +∞ decimos que f es de variación acotada.
Proposición 6.2. Valen las siguientes propiedades:
1. Si [a′, b′] ⊂ [a, b] entonces V b′a′ (f) ≤ V ba (f)
2. V ba (f + g) ≤ V ba (f) + V ba (g) y, si α ∈ R, V ba (αf) = |α|V ba (f)
3. Si a < c < b entonces V ba (f) = V
c
a (f) + V
b
c (f)
Demostración. Le dejo para que verifiquen las primeras 2 propiedades. Para probar la
tercera, consideremos una partición arbitraria
Π : a = x0 < x1 < x2 < . . . < xn = b
de [a, b] y consideremos la partición Π′ que consiste en agregar a Π el punto c.
Supongamos que xi < c < xi+1, entonces
Π′ : a = x0 < x1 < . . . < xi < c < xi+1 < . . . < x2 < . . . < xn = b
y vale que S(f,Π) ≤ S(f,Π′) ya que
|f(xi+1)− f(xi)| ≤ |f(xi+1)− f(c)|+ |f(c)− f(xi)|
Si ahora descomponemos Π′ como Π1 ∪Π2 con
Π1 : a = x0 < x1 < . . . < xi < c
que es una partición de [a, c] y
Π2 : c < xi+1 < . . . < x2 < . . . < xn = b
que es una partición de [c, b], entonces, por la definición de variación tenemos que
S(f,Π) ≤ S(f,Π′) = S(f,Π1) + S(f,Π2) ≤ V ac (f) + V bc (f) (2)
y, tomando supremo sobre todas las particiones Π de [a, b],
V ba (f) ≤ V ca (f) + V bc (f)
Para probar la desigualdad opuesta, consideramos una partición de [a, c]
Π1 : a = x0 < x1 < x2 < . . . < xn = c
y una partición de [c, b]
Π2 : c = xn < xn+1 < xn+2 < ... < xm = b
Entonces,
Π = Π1 ∪Π2 : a = x0 < x1 < x2 < . . . < xm = b
es una partición de [a, b] y tenemos que
V ba ≥ S(f,Π) = S(f,Π1) + S(f,Π2)
Tomando supremo sobre todas las particiones Π1 de [a, c] deducimos que, para cualquier
partición Π2 de [c, b],
V ba (f) ≥ V ca (f) + S(f,Π2)
Luego, tomando supremo sobre todas las posibles Π2 tenemos que
V ba (f) ≥ V ca (f) + V bc (f),
como queŕıamos.
Teorema 6.3 (Descomposición de Jordan). Una función f : [a, b] → R es de variación
acotada en [a, b] si y sólo si se puede escribir como diferencia de funciones monótonas
crecientes.
Demostración. Sea f de variación acotada. Por la proposiciṕon anterior, v(x) = V xa (f) es
una función monótona creciente. Llamamos u(x) = v(x) − f(x) (para que f = v − u) y
queremos ver que u(x) es monótona creciente.
Si a ≤ x < y ≤ b tenemos que
u(y)− u(x) = v(y)− v(x)− [f(y)− f(x)] ≥ V yx (f)− |f(y)− f(x)| ≥ 0
(porque Π : x, y es una partición de [x, y] y S(f,Π) = |f(y)− f(x)| ≤ V yx (f)).
Es decir que si f es de variación acotada podemos escribirla como f = v − u con u, v
monótonas crecientes.
Para probar la rećıproca, notemos que si f es monótona creciente entonces es de varia-
ción acotada, ya que
V ba (f) = f(b)− f(a),
y, por la proposición anterior, si f = u−v con u, v de variación acotada, entonces f también
lo es.
Corolario 6.4. Las funciones f de variación acotada en [a, b] tienen las siguientes pro-
piedades (que se deducen de las correspondientes propiedades de las funciones monótonas)
1. En cada punto existen los ĺımites laterales f(x+) y f(x−).
2. Los puntos de discontinuidad son a lo sumo numerables.
3. Son derivables en casi todo punto y f ′ ∈ L1([a, b])
7. Funciones absolutamente continuas
Pasamos ahora a una subclase de las funciones de variación acotada, que son las fun-
ciones absolutamente continuas. Para esta clase vamos a poder finalmente probar que vale
la regla de Barrow.
También veremos que las funciones de variación acotada pueden descomponerse en una
parte absolutamente continua (o “buena” en el sentido anterior) y otra singular (o “mala”,
en el sentido de que tiene derivada igual a cero en casi todo punto pero, sin embargo, no
es constante).
Definición 7.1. Decimos que una función f : [a, b] → R es absolutamente continua en
[a, b] si para cada ε > 0, existe un δ > 0 tal que para cualquier familia finita de intervalos
disjuntos Ii = (ai, bi) ⊂ [a, b] (i = 1, . . . , N) se tiene que si
N∑
i=1
(bi − ai) < δ
entonces
N∑
i=1
|f(bi)− f(ai)| < ε
Las funciones absolutamente continuas forman un espacio vectorial que notaremos AC[a, b].
Proposición 7.2. Si f ∈ L1([a, b]), su “integral indefinida” F : [a, b]→ R dada por
F (x) = C +
∫ x
a
f(t)dt
con C una constante, es absolutamente continua.
Demostración. Si consideramos en el intervalo [a, b] una famila finita cualquiera de subin-
tervalos disjuntos Ii = (ai, bi) (1 ≤ i ≤ N) entonces:
N∑
i=1
|F (bi)− F (ai)| ≤
N∑
i=1
∫ bi
ai
|f(t)| dt =
∫
∪iIi
|f(t)| dt
En consecuencia, por la absoluta continuidad de la integral,
N∑
i=1
|F (bi)− F (ai)| < ε
siempre que
m
( N⋃
i=1
Ii
)
=
N∑
i=1
m(Ii) =
N∑
i=1
(bi − ai) < δ
Observación 7.3. Toda función absolutamente continua en [a, b] es uniformemente con-
tinua en [a, b].
Demostración. Basta considerar el caso de una familia formada por un solo intervalo.
Proposición 7.4. Si f : [a, b] → R es absolutamente continua en [a, b], entonces es de
variación acotada en [a, b].
Demostración. Tomemos ε = 1 en la definición de función absolutamente continua. Enton-
ces existe δ > 0 tal que para cualquier familia Ii = (ai, bi) de subintervalos disjuntos de
[a, b], tenemos que si
N∑
i=1
(bi − ai) < δ
vale que
N∑
i=1
|f(bi)− f(ai)| < 1
En particular, si x < y con |x− y| < δ son dos puntos cualesquiera de [a, b], y elegimos
los intervalos Ii para que formen una partición de [x, y], teniendo en cuenta la definición
de variación tenemos que
V yx (f) ≤ 1
Ahora consideremos una partición a = x0 < x1 < . . . < xn = b de [a, b] con |xi+1−xi| <
δ. Entonces, por la aditividad de la variación respecto al intervalo,
V ba (f) =
n−1∑
i=0
V
xi+1
xi (f) < +∞
Observación 7.5. La rećıproca no es cierta. Por ejemplo, ya vimos que la función singular
de Cantor es continua y monótona creciente (y por lo tanto de variación acotada), pero
se puede ver que no es absolutamente continua tomando como intervalos Ii los intervalos
que forman una etapa Fn en la construcción del conjunto de Cantor (en la notación que
ya usamos).
El siguiente lema es clave para generalizar la regla de Barrow a la integral de Lebesgue.
Lema 7.6. (Vitali) Si ϕ : [a, b] → R es absolutamente continua, y ϕ′(t) = 0 en casi todo
punto de [a, b], entonces ϕ es constante en [a, b].
Demostración. Sea E = {x ∈ (a, b) : ϕ′(x) = 0}. Por hipótesis, m(E) = b− a.
Sea ε > 0 y sea δ > 0 el número que corresponde a ε por la absoluta continuidad de ϕ.
Consideremos un punto x ∈ E. Entonces
ĺım
h→0
ϕ(x+ h)− ϕ(x)
h
= 0
luego, si |h| es pequeño
|ϕ(x+ h)− ϕ(x)| < ε|h|
o, llamando I = [x, x+ h],
|∆ϕ(I)| < ε.m(I)
Los intervalos que tienen esta propiedad cubren a E en el sentido de Vitali. Aśı que
podemos elegir una sucesión finita Ik (1 ≤ k ≤ N) de intervaloscerrados disjuntos de esta
familia de modo que
N∑
k=1
m(Ik) ≥ m
(
E ∩
( N⋃
k=1
Ik
))
> m(E)− δ = b− a− δ
Entonces, podemos escribir
(a, b)−
N⋃
k=1
Ik =
M⋃
i=1
Ji
siendo los Ji intervalos abiertos disjuntos y, como
M∑
i=1
m(Ji) < δ,
por la absoluta continuidad tenemos que
M∑
i=1
|∆ϕ(Ji)| < ε
Vamos a probar que ϕ(a) = ϕ(b) (del mismo modo se prueba que ϕ(x) = ϕ(y) para
x, y ∈ [a, b] cualesquiera, basta restringirse a un subintervalo). Tenemos que
|ϕ(b)− ϕ(a)| =
∣∣∣∣∣
N∑
k=1
∆ϕ(Ik) +
M∑
i=1
∆ϕ(Ji)
∣∣∣∣∣
≤
N∑
k=1
|∆ϕ(Ik)|+
M∑
i=1
|∆ϕ(Ji)|
≤
N∑
k=1
ε.m(Ik) + ε
En consecuencia, tenemos que
|ϕ(b)− ϕ(a)| ≤ (b− a+ 1)ε
y como ε > 0 era arbitrario, deber ser ϕ(a) = ϕ(b), como queŕıamos demostrar.
Teorema 7.7 (Vitali). Si f es absolutamente continua en [a, b], entonces f ′ ∈ L1([a, b]) y
se verifica la regla de Barrow
f(b)− f(a) =
∫ b
a
f ′(t) dt
Demostración. Como f es absolutamente continua en [a, b], f es de variación acotada en
[a, b]. Entonces, su derivada f ′ existe en casi todo punto de [a, b] y es integrable.
Si consideramos la función ϕ : [a, b]→ R dada por
ϕ(x) = f(x)−
∫ x
a
f ′(t) dt (3)
entonces ϕ es absolutamente continua por ser diferencia de dos funciones absolutamente
continuas, y por el teorema de diferenciación de Lebesgue (corolario 3.11):
ϕ′(x) = f ′(x)− f ′(x) = 0
en casi todo punto de [a, b]. Por el lema anterior, ϕ es constante. Evaluando en x = b y
después en x = a obtenemos el resultado.
Observación 7.8. El requerimiento de que f sea absolutamente continua es esencial, como
muestra la función singular de Cantor, que tiene derivada cero en casi todo punto pero la
diferencia de valores en sus extremos es igual a 1.
Definición 7.9. Una función tal que h′(x) = 0 en casi todo punto se llama una función
singular.
Observación 7.10. La función singular Cantor es un ejemplo de una función singular no
constante.
Teorema 7.11. (Descomposición de Lebesgue) Si f : [a, b] → R es de una función de
variación acotada, entonces se la puede descomponer en la forma f = g + h, donde g es
absolutamente continua en [a, b], y h es singular en [a, b].
Demostración. Como f : [a, b]→ R es de variación acotada, sabemos que f ′(x) existe para
casi todo x ∈ [a, b] y f ′ ∈ L1([a, b]). Además, sabemos que la función
g(x) =
∫ x
a
f ′(t) dt
es absolutamente continua en [a, b] y que g′(x) = f ′(x) para casi todo x ∈ (a, b).
Entonces, si llamamos h(x) = f(x) − g(x), tenemos que h′(x) = 0 en casi todo punto
de (a, b), es decir que es singular.
Observen que además, por el lema 7.6, esta descomposición es única salvo constantes
en el siguiente sentido: si f = g̃+ h̃ es otra descomposición de f como suma de una función
absolutamente continua g̃ y una función singular h̃ entonces g − g̃ = h̃− h es una función
que es a la vez absolutamente continua y singular, y por lo tanto debe ser constante.
	El Lema Simple de Vitali
	La función maximal de Hardy-Littlewood
	El Teorema de Diferenciación de Lebesgue
	Cubrimientos de Vitali
	Derivada de funciones monótonas
	Funciones de variación acotada 
	Funciones absolutamente continuas

Continuar navegando

Materiales relacionados