Descarga la aplicación para disfrutar aún más
Vista previa del material en texto
Matemáticas II Clase 23: Aplicaciones de la diagonalización de matrices simétricas Jorge Rivera Lunes 25 de octubre, 2021 Apunte de Curso: Págs. 245 - 251 1 Agenda Objetivos de la clase Aplicación 1: estudio del signo de una matriz Aplicación 2: potencia de una matriz (simétrica) Cuestiones complementarias 2 Objetivos de la clase • Aplicar la diagonalización de matrices simétricas para conocer el signo de una matriz. • Aplicar la diagonalización de matrices simétricas para obtener potencias de una matriz (simétrica) y evaluar polinomios en matrices. • Tratar algunos temas complementarios. 3 Aplicación 1: estudio del signo de una matriz Previa • Para A ∈ Rn×n una matriz simétrica, sabemos que existe una matriz ortogonal P ∈ Rn×n (es decir, P−1 = Pt) tal que para D ∈ Rn×n la matriz diagonal de valores propios de A se cumple que A = PDPt. • Notemos ahora lo siguiente: ya que P es invertible ocurre que Im(P) = Rn. Es decir, para cualquier X ∈ Rn ocurre que el vector Y = PX es un vector arbitrario de Rn. • Por otro lado, recuerde también que si una matriz B ∈ Rn×n es invertible, entonces Bt también es invertible. 4 • Recuerde también que si D es una matriz diagonal, entonces la forma cuadrática correspondiente tiene una expresión muy sencilla (se ilustra caso 3× 3): dado X = x1x2 x3 ∈ R3 tenemos que D = λ1 0 00 λ2 0 0 0 λ3 ⇒ QD(X ) = λ1x21 + λ2x22 + λ3x23 . 5 Presentación del resultado • Lo que sigue se ilustra para el caso de matrices de 3× 3 y se puede extender directamente a matrices de cualquier orden. • Dada A ∈ Rn×n una matriz simétrica, consideremos que A = PDPt es la diagonalización de A, con P ortogonal y D = λ1 0 00 λ2 0 0 0 λ3 . • Dado X ∈ R3 tenemos entonces que X tAX = X tPDPtX . • Usando propiedades de la traspuesta, lo anterior se puede escribir como QA(X ) = (P tX )tD(PtX ) = Y tDY donde Y = PtX ∈ Rn es un vector arbitrario de Rn (Pt es invertible ya que P lo es). 6 • De esta manera, denotando Y = y1y2 y3 = PtX (que es un vector arbitrario de R3) tenemos que QA(X ) = [ y1 y2 y3 ]λ1 0 00 λ2 0 0 0 λ3 y1y2 y3 = λ1y21 + λ2y22 + λ3y23 . • En consecuencia: (i) A es definida positiva śı y solo śı λ1 > 0, λ2 > 0 y λ3 > 0. (ii) A es semidefinida positiva śı y solo śı λ1 ≥ 0, λ2 ≥ 0 y λ3 ≥ 0. (iii) A es definida negativa śı y solo śı λ1 < 0, λ2 < 0 y λ3 < 0. (iv) A es semidefinida negativa śı y solo śı λ1 ≤ 0, λ2 ≤ 0 y λ3 ≤ 0. (v) A no tiene signo si algunos valores propios son positivos y otros son negativos. 7 Ejemplo 1 • Para A = [ 2 1 1 4 ] , el polinomio caracteŕıstico es pA(λ) = λ 2 − 6λ+ 7λ. NOTA. En general, recuerde que para una matriz A ∈ R2×2 el polinomio caracteŕıstico es pA(λ) = λ 2 − tr(A)λ+ detA. • Usando lo anterior, los valores propios de A cumplen que λ2−6λ+7λ = 0 ⇒ λ1 = 6 + √ 36− 28 2 = 6 + √ 8 2 ∨ λ2 = 6− √ 8 2 . • Ya que λ1 > 0 y λ2 > 0 tenemos que A es definida positiva. • En consecuencia, hemos probado que para X = [ x1 x2 ] ∈ R2, si X ̸= 02 se cumple que QA(X ) = 2x 2 1 + 4x 2 2 + 2x1x2 > 0. 8 Ejemplo 2 ¿Es cierto (o no) lo siguiente?: ∀x1, x2 ∈ R, si x1 ̸= o x2 ̸= 0 se tiene que x21 + 2x 2 2 + 2x1x2 > 0. • Lo anterior “se parece” a una forma cuadrática. En efecto, identificando los elementos cuando (el coeficiente del término cruzado es la suma de los elementos que no están en la diagonal) A = [ 1 1 1 2 ] ∧ X = [ x1 x2 ] , uno tiene X tAX = x21 + 2x 2 2 + 2x1x2. • Ya que pA(λ) = λ2 − 3λ+ 1, los valores propios de A son pA(λ) = λ 2 − 3λ+ 1 = 0 ⇒ λ1 = 3 + √ 5 2 ∨ λ1 = 3− √ 5 2 . • Como λ1 > 0 y λ2 > 0, la matriz A es definida positiva, por lo que se cumple lo indicado. 9 Aplicación 2: potencia de una matriz (simétrica) • Para ilustrar, supongamos que A ∈ R3×3 es simétrica y que su diagonalización es A = PDPt, con D = Diag(λ1, λ2, λ3) = λ1 0 00 λ2 0 0 0 λ3 . • Se tiene entonces que A2 = AA = (PDPt)(PDPt) = (PD) (PtP)︸ ︷︷ ︸ In (DPt). • Es decir: A2 = PD2Pt. • Pero: D2 = λ1 0 00 λ2 0 0 0 λ3 λ1 0 00 λ2 0 0 0 λ3 = λ21 0 00 λ22 0 0 0 λ23 = Diag(λ21, λ22, λ23). 10 • Finalmente, para k ∈ N notamos que Ak = AAA · · ·A︸ ︷︷ ︸ k veces = (PDPt)(PDPt)(PDPt) · · · (PDPt)︸ ︷︷ ︸ k veces . • Ya que PPt, que aparece entremedio de las multiplicaciones anteriores, es igual a la matriz identidad, lo anterior queda Ak = P DD · · ·D︸ ︷︷ ︸ k veces Pt. • Por otro lado, es directo ver que DD · · ·D︸ ︷︷ ︸ k veces = λk1 0 00 λk2 0 0 0 λk3 = Diag(λk1 , λk2 , λk3). • En general: para una matriz simétrica A ∈ Rn×n tal que su diagonalización es A = PDPt, se puede probar que para todo k ∈ N: Ak = P Diag(λk1 , λ k 2 , · · · , λkn)Pt. 11 Ejemplo 1 Para A = [ 2 √ 3√ 3 4 ] se pide encontrar una expresión para Ak , con k ∈ N. Para ello, luego de realizar el ejercicio de diagonalización de A uno obtiene que (ver ppt de clase anterior) A = [ 2 √ 3√ 3 4 ] = [ − √ 3 2 1 2 1 2 √ 3 2 ][ 1 0 0 5 ][ − √ 3 2 1 2 1 2 √ 3 2 ] . Luego: Ak = [ − √ 3 2 1 2 1 2 √ 3 2 ][ 1 0 0 5k ][ − √ 3 2 1 2 1 2 √ 3 2 ] . 12 • Es decir: Ak = − √ 3 2 1 2 1 2 √ 3 2 1 0 0 5k − √ 3 2 1 2 1 2 √ 3 2 = − √ 3 2 5k 2 1 2 5k √ 3 2 − √ 3 2 1 2 1 2 √ 3 2 = 3+5 k 4 √ 3(5k−1) 4 √ 3(5k−1) 4 1+3∗5k 4 13 Ejemplo 2 Dadas las constantes α, β, γ ∈ R, considere el siguiente polinomio de segundo grado: q(x) = αx2 + βx + γ. Con esto, dada una matriz A ∈ R2×2, definamos el polinomio evaluado en esa matriz como q(A) = αA2 + βA+ γI 2, donde I 2 es la matriz identidad. • Por ejemplo, si q(x) = 2x2 − x + 4 y A = [ 2 3 3 1 ] , tenemos que q(A) = 2 ([ 2 3 3 1 ])2 − [ 2 3 3 1 ] + 4 [ 1 0 0 1 ] . 14 • Desarrollando el producto y las sumas correspondientes, lo anterior da como resultado (verifique Ud.) q(A) = 2 ([ 2 3 3 1 ])2 − [ 2 3 3 1 ] + 4 [ 1 0 0 1 ] = 2 [ 13 9 9 10 ] + [ 2 −3 −3 3 ] = [ 28 15 15 23 ] 15 • Supongamos entonces que A ∈ R2×2 es simétrica y que su diagonalización es A = PDPt. Con eso, usando el polinomio q(x) = αx2 + βx + γ se tiene que q(A) = α(PDPt)2 + β(PDPt) + γI 2 = α(PDPt)(PDPt) + βPDPt + γPPt = αPD2Pt + βPDPt + γPPt = P(αD2 + βD + γI 2)Pt • Si D = Diag(λ1, λ2) (diagonal de valores propios de A) sabemos que D2 = Diag(λ21, λ 2 2), por lo que αD2+βD+γI 2 = α [ λ21 0 0 λ22 ] +β [ λ1 0 0 λ2 ] +γ [ 1 0 0 1 ] = [ q(λ1) 0 0 q(λ2) ] . 16 • En consecuencia, sobre la base de todo lo anterior, q(A) = P Diag(q(λ1, q(λ2))P t, donde P es la matriz ortogonal que proviene de la descomposición de A y Diag(q(λ1, q(λ2)) es una matriz diagonal cuyos elementos son el polinomio evaluado en los valores propios de A. • El resultado anterior se puede extender a cualquier matriz simétrica A ∈ Rn×n y para cualquier polinomio q(x) = akx k + ak−1x k−1 + · · ·+ a1x + a0 de modo que q(A) = P Diag(q(λ1, q(λ2), · · · , q(λn))Pt, donde λ1, λ2, · · · , λn son los valores propios de A y P la matriz ortogonal tal que A = PDPt (con D la diagonal de valores propios de A). 17 Cuestiones complementarias Determinante y valores propios • Para A ∈ Rn×n una matriz simétrica, expliquemos por qué el determinante de A es igual al producto de sus valores propios λ1, λ2, . . . , λn. • En efecto, usando la diagonalización de A sabemos que A = PDPt, con P matriz ortogonal y D diagonal de valores propios. • Luego, usando la propiedad det(AB) = det(BA) = det(A)det(B), tenemos que det(A) = det(PDPt) = det(PPt︸︷︷︸ In D) = det(D) = λ1λ2 · · ·λn, que es lo que queŕıamos probar. NOTA. El resultado anterior sigue siendo válido para cualquier matriz A ∈ Rn×n (sea o no simétrica). Es decir, si λ1, λ2, . . . , λn son los valores propios de A ∈ Rn×n, se cumple que det(A) = λ1λ2 · · ·λn. 18 Propiedad importante de matrices rango completo • En ciertas cuestiones de estad́ıstica, de econometŕıa y, en general,en el análisis de bases de datos, será usual trabajar con matrices donde el número de filas es mayor que el número de columnas (m > n): se trata de “matrices alargadas”. • Por ejemplo: m es el número de personas (“grande”) y n son caracteŕısticas de esas personas, por ejemplo, edad, género, ingreso, etc. (menor que m). • Esas matrices no son invertibles (no son cuadradas!). Sin embargo, usualmente serán de rango completo, es decir, sus n columnas son l.i.. 19 • Supongamos entonces que m, n ∈ N tal que m > n y sea A ∈ Rm×n una matriz de rango completo (rg(A) = n), por lo que sus n columnas son l.i. • Definamos entonces B = AtA ∈ Rn×n. • La idea es probar que si A es de rango completo entonces B es definida positiva y, por lo tanto, B es invertible. • Si A es definida positiva, todos sus valores propios son mayor estricto que 0. Como el determinante de B es el producto de sus valores propios, cuando es definida positiva ocurre que el determinante es mayor estricto que 0, por lo que es invertible (det(B) ̸= 0). 20 • Dado X ∈ Rn, la forma cuadrática asociada a B es QB(X ) = X tBX = X tAtAX = (AX )t(AX ) = (AX ) · (AX ) = ∥AX∥2. • Solo por lo anterior tenemos que B es semidefinida positiva (eso ya que para todo X ∈ Rn se tiene que QB(X ) ≥ 0). • Para probar que B es definida positiva, debemos mostrar que QB(X ) = 0 solo cuando X = 0n. Supongamos entonces QB(X ) = 0. Luego ∥AX∥ = 0. • Ya que la norma de un vector es 0 solo cuando el vector es el origne, lo anterior implica qyue AX = 0n. • Finalmente, como A es de rango completo, el hecho que AX = 0n implica que X = 0n. Con eso probamos que B = AtA es definida positiva, y por lo tanto invertible. 21 Objetivos de la clase Aplicación 1: estudio del signo de una matriz Aplicación 2: potencia de una matriz (simétrica) Cuestiones complementarias
Compartir