Title | 5. Diagonalización de Matrices. Aplicaciones |
---|---|
Author | Tiberiu Vasile Marin |
Course | Matemáticas II |
Institution | Universidad de Huelva |
Pages | 42 |
File Size | 1.2 MB |
File Type | |
Total Downloads | 87 |
Total Views | 159 |
Download 5. Diagonalización de Matrices. Aplicaciones PDF
Cap´ıtulo 5 Diagonalizaci´ on de matrices. Aplicaciones
A lo largo de todo el tema s´ olo se considerar´ an matrices cuadradas y n denotaremos los vectores de R en la forma x1 x 2 . ~v = · · · xn
Abordamos en este tema el problema de la diagonalizaci´ on de matrices cuadradas, que constituye uno de los problemas centrales del a´lgebra lineal. Para entender la importancia y la necesidad de diagonalizar una matriz, vamos a considerar el siguiente ejemplo concreto que es un problema t´ıpico de los que consideraremos en las aplicaciones. Una empresa de transportes tiene una flota de camiones con sedes en Barcelona, Alicante y La Coru˜ na. Cada mes, la mitad de los camiones con sede en Barcelona y Alicante se incorporan a La Coru˜ na y la otra mitad permanece en la sede donde estaba. Por su parte, los camiones con sede en La Coru˜ na se incorporan a Barcelona y Alicante repartidos en dos partes iguales. Escribir la matriz de transici´on y determinar la evoluci´ on de la flota de camiones a largo plazo. Si A1 , B1 y C1 denotan el n´ umero de camiones que hay durante el primer mes en Alicante, Barcelona y La Coru˜ na, respectivamente, y N denota el 161
n´ umero total de camiones que posee la empresa, se tiene N = A1 + B1 + C1 . Dividiendo por N ambos miembros, resulta 1=
A1 B1 C1 = a 1 + b1 + c 1 . + + N N N
Las cantidades a1 = A1 /N, b1 = B1 /N y c1 = C1 /N representan las proporciones (tantos por uno) de camiones que la empresa posee en cada sede y el total de las tres es 1. En estos problemas manejaremos proporciones y as´ı el n´ umero total de individuos (camiones en nuestro caso) es indiferente. Denotando por a2 , b2 y c2 las proporciones de camiones que, durante el segundo mes, tienen su sede en Alicante, Barcelona y La Coru˜ na, deducimos del enunciado de nuestro ejemplo las siguientes relaciones con a1 , b1 y c1 :
a2 = a1 /2 + c1 /2 b2 = b1 /2 + c1 /2 c2 = a1 /2 + b1 /2,
(5.1)
El sistema anterior puede expresarse matricialmente en la forma 1 0 1 a2 a1 2 2 1 b2 = 0 21 2 b1 . 1 1 0 c2 c1 2 2
La matriz
1
T = 0
1 2 1 2
0
2
1 2
1 2 1 2
0
recibe el nombre de La ecuaci´ on matricial anterior a´ un puede expresarse de una forma m´as simple, si denotamos por ~xn el vector columna con las proporciones de camiones que hay en cada sede durante el n−´esimo mes: ~x2 = T ~x1 , donde
an ~xn = bn . cn
(5.2)
La relaci´ on que existe entre el estado de la empresa durante el mes n y el estado durante el mes anterior es obviamente la misma que se recoge en (5.1) 1 0 21 an−1 an 2 1 bn = 0 21 2 bn−1 . 1 1 0 cn−1 cn 2 2 Que puede expresarse m´ as simplemente en la forma (5.2): .
(5.3)
Una ecuaci´ on de este tipo se dir´ a que es una (para determinar el estado de la empresa durante el mes n se recurre al estado en el mes anterior). Para obtener una expresi´ on de ~xn en funci´on s´ olo de n, puede procederse como sigue: ~xn = T ~xn−1 = T (T ~xn−2 ) = T 2~xn−2 , ya que ~xn−1 = T x ~ n−2 . Continuando de esta forma, obtenemos ~xn = T 2~xn−2 = T 2 (T ~xn−3 ) = T 3~xn−3 . Haciendo esto mismo n − 1 veces, resulta Hemos “resuelto” la ecuaci´ on de recurrencia, pero nos encontramos con una nueva dificultad: el c´alculo de la potencia . Ahora es el momento de introducir el problema de la diagonalizaci´ on de matrices.
Estas ecuaciones aparecen cuando se estudia la evoluci´on en el tiempo de un sistema (f´ısico, econ´ omico, etc.) y se realiza la medici´ on del estado del sistema a intervalos regulares de tiempo. Un problema concreto de esta clase es el anterior sobre la empresa de transportes. Si A es una matriz diagonal
d1 0 0 ··· 0 0 d2 0 · · · 0 A= 0 d3 · · · 0 0 , · · · · · · · · · · · · 0 0 0 · · · dN
es f´ acil comprobar que An viene dada por
A
n d1 0 = 0 · · ·
0
0 0 ··· 0 n d2 0 · · · 0 0 dn3 · · · 0 . ··· ··· ··· 0 0 · · · dnN
Tambi´en, si A es semejante a una matriz diagonal D, el c´ alculo de An es muy f´ acil.
Si P es una matriz invertible tal que A = P −1 DP , vamos a ver que se verifica la igualdad An = P −1 Dn P . En efecto, la matriz An viene dada por = (P −1 DP )(P −1 DP ) · · · (P −1 DP )(P −1 DP ) = = P −1 D(P P −1 )D(P P −1 )D · · · (P P −1 )DP =
El problema de saber qu´e matrices son semejantes a una matriz diagonal es un tema cl´ asico del a´lgebra lineal que se conoce con el nombre de diagonalizaci´ on de matrices. Para descubrir c´omo podemos afrontar este problema y para que nos sirva como motivaci´ on de los conceptos de autovalor y autovector asociados a una matriz A, que estudiaremos en la secci´on siguiente, vamos a considerar matrices de orden 3 y supongamos que una matriz A puede escribirse en la forma . Denotamos las columnas de P por ~v1 , ~v2 y ~v3 , y sea D la matriz
λ1 0 0 D = 0 λ2 0 . 0 0 λ3
La igualdad se traduce en esta otra AP puede calcularse multiplicando A por las columnas de P
. El producto
Ahora veamos la forma que tiene la matriz P D. Procediendo de igual forma
λ1 0 0 = (P 0 |P λ2 |P 0 ). λ3 0 0 Recordemos que el producto de P por una matriz columna b es la suma de los productos de cada elemento de b por la columna correspondiente de P . Usando esta idea en la igualdad anterior se obtiene
Finalmente, igualando las expresiones obtenidas para las columnas de AP y P D, obtenemos A~vi = λi~vi (i = 1, 2, 3).
Reciben este nombre los sistemas de ecuaciones diferenciales del tipo ®
x˙ 1 = a1 x1 + b1 x2 x˙ 2 = a2 x1 + b2 x2 ,
(5.4)
donde x1 y x2 son funciones de t y, como es usual, x˙ 1 denota la derivada de xi respecto de t (suponemos que los coeficientes ai y bi son constantes). La matriz ñ ô a 1 b1 A= a 2 b2 permite expresar el sistema diferencial matricialmente ñ
ô
ñ
ô
x x˙ 1 = A· 1 . x2 x˙ 2
Para mayor comodidad, podemos denotar el vector columna (x1 , x2 )t por x, en cuyo caso el sistema se expresa de la forma siguiente x˙ = Ax.
Este tipo de sistemas suele presentarse cuando se estudia la evoluci´ on en el tiempo de un sistema f´ısico bidimensional. Por ejemplo, podr´ıan ser las ecuaciones del movimiento de una masa puntual que realiza un movimiento plano. Si buscamos soluciones de la forma x(t) = eλt · ~v, donde λ es una constante real y ~v es un vector columna, ambos por determinar, la derivada de x(t) viene dada por x(t) ˙ = λ eλt ~v. Sustituyendo en (??), obtenemos λ eλt ~v = A · (eλt ~v). Dividiendo por eλt , resulta la igualdad λ ~v = A · ~v .
(5.5)
Esto prueba que x(t) ˙ = eλt ·~v es una soluci´on no trivial del sistema homog´eneo (??), si λ es un autovalor de la matriz de coeficientes A y ~v un autovector no nulo de A asociado a λ.
Definici´ on 5.2.1. Sea A una matriz cuadrada de orden n. Diremos que el escalar λ es un autovalor (o valor propio) de A si existe alg´ un vector no nulo n ~v de R tal que . Entonces diremos que ~v es un autovector (o vector propio) de A asociado al autovalor λ. La ecuaci´ on A~v = λ~v puede escribirse en la forma (A − λIn )~v = 0. Por tanto, si λ es un autovalor de A, entonces el sistema homog´eneo v1 (A − λIn ) · · · = 0 vn
tiene soluci´ on distinta de la trivial y cada una de las soluciones no triviales es un autovector de A asociado al autovalor λ. Estas ideas conducen al siguiente criterio.
Det(A − λIn ) es un polinomio en λ de grado n que recibe el nombre de polinomio caracter´ıstico de A. Las ra´ıces de este polinomio son los autovalores de A. Por tanto, A puede tener, a lo m´ as, n autovalores reales. M´ as precisamente, los autovalores pueden ser λ1 , .., λs , distintos entre s´ı y con multiplicidades m1 , .., ms . En cuyo caso el polinomio caracter´ıstico se descompone en factores de la forma det(A − λIn ) = (−1)n (λ − λ1 )m1 · · · (λ − λs )ms . Diremos que mi es la multiplicidad algebraica del autovalor λi , para diferenciarla de la multiplicidad geom´ etrica que se definir´a m´as adelante. Para calcular los autovalores y autovectores de A se procede del siguiente modo: 1. Se encuentran las ra´ıces de la ecuaci´ on caracter´ıstica det(A − λIn ) = 0. 2. Para cada valor de λ obtenido en el paso anterior, se resuelve el sistema homog´eneo v1 (A − λIn ) · · · = 0 vn y cada soluci´ on (no nula) obtenida (v1 , ..., vn )t es un autovector asociado a λ. Ejemplos 5.2.3. (1) Hallar los autovalores y los correspondientes autovectores de la matriz ô ñ 2 −12 . A= 1 −5 El polinomio caracter´ıstico de A es
2 − λ −12 |A − λI2 | = 1 −5 − λ
= −(2 − λ)(5 + λ) + 12 =
= λ2 + 3λ + 2 = (λ + 1)(λ + 2). Por tanto, los autovalores son: λ1 = −1 y λ2 = −2. Una vez encontrados los autovalores, procedemos a determinar los autovectores asociados a cada uno de ellos. a) Autovectores asociados a λ1 = −1. Debemos resolver el sistema homog´eneo ñô ôñ ô ñ 0 v1 2 − (−1) −12 = , 0 1 −5 − (−1) v2
lo que traducido a componentes produce el sistema ®
3v1 − 12v2 = 0 v1 − 4v2 = 0
Basta considerar la segunda ecuaci´ on v1 − 4v2 = 0. Esto significa que la segunda componente de ~v , v2 , puede variar libremente y la primera viene dada por v1 = 4v2 . Entonces todo autovector de A asociado a λ1 = −1 es de la forma ñ ô 4 , t 6= 0. ~v = t 1 b) Autovectores asociados a λ2 = −2. n este caso el sistema a resolver es ñ
2 − (−2) −12 1 −5 − (−2)
ôñ
ô
ñô
0 v1 = , v2 0
lo que traducido a componentes produce el sistema ®
4v1 − 12v2 = 0 v1 − 3v2 = 0
Como antes, basta considerar la segunda ecuaci´on que se reduce a v1 = 3v2 . Por tanto, los autovectores son ~v = t
ñ ô
3 , t 6= 0. 1 ñ
ô
200 −1200 . 100 −500 N´ otese que B = 100A, donde A es la matriz anterior. El objetivo de este ejercicio es entender qu´ e relaci´ on existe entre los autovalores (2) Calcular los autovalores y autovectores de la matriz B =
de A y los de B. Supongamos que λ es un autovalor de A y ~v es un autovector de A asociado a λ. Entonces A~v = λ~v y multiplicando ambos miembros de la igualdad anterior por 100, obtenemos 100A~v = (100λ)~v . Como B = 100A, resulta B~v = (100λ)~v lo que nos dice que 100λ es un autovalor de B (es decir, los autovalores de B = 100A se obtienen multiplicando los de A por 100) y el autovector para B es el propio ~v (los autovectores de A y 100A son id´ enticos). Por tanto, los autovalores de B son λ1 = −100 y λ2 = −200, mientras que los autovectores son los encontrados para A. . En el ejemplo anterior hemos visto que ambos autovalores tienen asociados infinitos autovectores. As´ı, al autovalor λ1 = −1 le corresponden como autovectores todos los vectores de la forma t~v , donde ~v = (4, 1)t y t 6= 0. Entonces, al conjunto de todos los autovalores, {t~v : t 6= 0}, le falta tan s´ olo el vector nulo para ser un subespacio vectorial de R2 de dimensi´ on 1. El teorema siguiente muestra que esto es un hecho general. Teorema 5.2.4. Si λ es un autovalor de una matriz cuadrada A de orden n, denotamos por Sλ (A) el conjunto formado por todos los autovectores asociados a λ, junto con el vector nulo. Sλ (A) es un subespacio vectorial de Rn que recibe el nombre de subespacio propio de λ. Si µi es la dimensi´ on de este subespacio, µi recibe el nombre de multiplicidad geom´ etrica de λ. ´ Probamos s´ olo que la suma de dos autovectores es otro DEMOSTRACION: autovector. Si ~v1 y ~v2 son autovectores asociados con λ, entonces A~vi = λ~vi , para i = 1, 2. Sumando las dos igualdades, obtenemos A~v1 + A~v2 = λ~v1 + λ~v2 = λ(~v1 + ~v2 ).
Por otra parte, A(~v1 + ~v2 ) = A~v1 + A~v2 , por tanto, se tiene la igualdad A(~v1 + ~v2 ) = λ(~v1 + ~v2 ), lo que prueba que ~v1 + ~v2 es autovector.
Uno de los problemas cl´ asicos del a´lgebra lineal consiste en determinar bajo qu´e condiciones, para una matriz cuadrada A, existe una matriz invertible P de forma que el producto P −1 AP es una matriz D diagonal. Entonces A es diagonalizable si es semejante a una matriz diagonal. Como dijimos al inicio del tema, existe una relaci´ on estrecha entre el problema de los autovalores y el de la diagonalizaci´ on. Los resultados siguientes ponen de manifiesto esta afirmaci´ on. Teorema 5.3.1. ´ Sean A y B semejantes de orden n. Entonces existe DEMOSTRACION: una matriz invertible P tal que B = P −1 AP . Por las propiedades de los determinantes, tenemos |B − λIn | = |P −1 AP − λIn | = |P −1 AP − P −1 (λIn )P | = = |P −1 (A − λIn )P | = |P −1 ||A − λIn ||P | = |A − λIn |,
donde se ha utilizado el hecho de que N´ otese que hemos probado que el polinomio caracter´ıstico de A coincide con el de B. Es muy f´acil comprobar que los autovalores de una matriz diagonal son sus elementos diagonales. Por tanto, se sigue del teorema precedente que los autovalores de A = P −1 DP (D es una matriz diagonal) son los elementos de la diagonal principal de D. Teorema 5.3.2.
´ Si A es diagonalizable existe una matriz invertible P tal DEMOSTRACION: −1 que D = P AP es diagonal. Denotamos los elementos diagonales de D por d1 , ..., dn y las columnas de P por p1 , .., pn . La igualdad D = P −1 AP se traduce en esta otra P D = AP . El producto AP puede calcularse multiplicando por bloques AP = A(p1 , .., pn ) = (Ap1 , .., Apn ). Ahora veamos la forma que tiene la matriz P D. Como en el caso del producto AP , cada columna de P D se obtiene haciendo el producto de P por la correspondiente columna de D: d1 0 |....|P P D = (P ... 0
0 0 ). ... dn
Como ya se vi´o en la introducci´on, el segundo miembro de la igualdad anterior es igual a (d1 p1 , ..., dn pn ). Finalmente, igualando las expresiones obtenidas para las columnas de AP y P D, obtenemos Api = di pi (i = 1, 2, .., n), lo que prueba que cada pi es un autovector de A y son linealmente independientes porque son las columnas de una matriz invertible P . El teorema siguiente prueba que autovectores asociados a autovalores distintos son linealmente independientes. Teorema 5.3.3.
´ La demostraci´ on completa usa el principio de inducci´on DEMOSTRACION: matem´ atica, pero nos vamos a conformar con una demostraci´on simplificada. Hacemos la prueba para el caso de 2 autovalores distintos y mostramos c´ omo se reduce la prueba del caso de 3 autovectores distintos al caso anterior. Caso n = 2. Razonamos por contradicci´on. Sean λ1 6= λ2 autovalores de A y ~vi autovector asociado a λi (i = 1, 2). Si los autovectores no son linealmente independientes, uno de ellos es un m´ ultiplo del otro. Podemos suponer que
~v2 = α~v1 (α 6= 0). Aplicando A a ambos miembros de la igualdad anterior, resulta λ2~v2 = A~v2 = A(α~v1 ) = αλ1~v1 . Es decir, hemos obtenido la igualdad λ2~v2 = αλ1~v1 .
(5.6)
Por otra parte, si se multiplica la igualdad ~v2 = α~v1 por λ2 , obtenemos λ2~v2 = αλ2~v1 .
(5.7)
Restando (5.6) y (5.7), se obtiene 0 = α(λ1 − λ2 )~v1 , lo que s´ olo es posible si α = 0. Caso n = 3. De nuevo razonamos por contradicci´ on. Supongamos que λ1 , λ2 , λ3 son autovalores distintos de A y que ~vi (i = 1, 2, 3) es un autovector asociado a λi . Si fuese ~v3 combinaci´ on lineal de los otros dos, existen escalares αi (i = 1, 2) tales que ~v3 = α1~v1 + α2~v2 (α1 y α2 no simult´ aneamente nulos). Aplicando a ambos miembros la matriz A, encontramos λ3~v3 = A~v3 = A(α1~v1 + α2~v2 ) = α1 A~v1 + α2 A~v2 = α1 λ1~v1 + α2 λ2~v2 . Hemos obtenido, pues, la igualdad λ3~v3 = α1 λ1~v1 + α2 λ2~v2 .
(5.8)
Ahora multiplicamos la igualdad ~v3 = α1~v1 + α2~v2 por λ3 y resulta λ3~v3 = α1 λ3~v1 + α2 λ3~v2 .
(5.9)
Finalmente, restando (5.8) y (5.9) 0 = α1 (λ1 − λ3 )~v1 + α2 (λ2 − λ3 )~v2 . Por el caso anterior, los autovectores ~v1 y ~v2 son linealmente independientes, por tanto, la igualdad anterior obliga a que αi = 0 (i = 1, 2), lo que termina la prueba. A la luz de los resultados anteriores resulta evidente el teorema siguiente, que nos ofrece una condici´ on suficiente de diagonalizaci´ on.
Teorema 5.3.4. Si alguno de los autovalores es m´ ultiple, para comprobar si una matriz es diagonalizable, tenemos que determinar las dimensiones de los subespacios propios asociados a cada autovalor m´ ultiple y comprobar que cada una de estas dimensiones coincide con la multiplicidad algebraica del autovalor. Si, adem´ as, la suma de todos los ´ ordenes de multiplicidad m´ as el n´ umero de autovalores simples es igual al orden de la matriz, entonces ´ esta es diagonalizable. Ejemplo 5.3.5. Probar que la matriz 5 0 0 A = 0 −1 1 3 0 −1
no es diagonalizable. En primer lugar, se determina la ecuaci´ on caracter´ıstica para calcular los autovalores:
5−λ 0 0 0 −1 − λ 1 3 0 −1 − λ
= (1 + λ)2 · (5 − λ) = 0.
Por tanto, los autovalores son λ1 = 5 y λ2 = −1 (doble). Entonces, para que A pueda ser diagonalizable, el autovalor λ2 = −1 debe aportar 2 autovectores linealmente independientes; es decir, su multiplicidad geom´etrica debe ser tambi´en 2. Por ello, ahora se procede a resolver el sistema homog´eneo 5 − λ2 0 0 v1 0 −1 − λ2 1 v2 = 0, 3 0 −1 − λ2 v3 cuya forma final es
4v1 = 0 v3 = 0 3v1 = 0.
Los autovectores asociados al autovalor λ2 = −1 son de la forma ~v = (0, v2 , 0) con v2 arbitrario. Esto nos dice que el subespacio propio asociado al autovalor λ2 = −1 tiene dimensi´on 1 (todos los autovectores son de la forma t(0, 1, 0)). En consecuencia, para A s´ olo podemos encontrar dos autovectores linealmente independientes ~v1 y ~v2 : ~v1 es el que aporta el autovalor λ1 = 5 y ~v2 = (0, 1, 0). Por tanto, A no es diagonalizable. Terminamos el apartado considerando el caso de que la matriz A posee alg´ un autovalor complejo. Como los coeficientes de la ecuaci´ on caracter´ıstica son todos reales, si A posee un autovalor complejo λ1 = a + bi, entonces tambi´en posee el autovalor λ2 = a − bi (en el tema sobre n´ umeros complejos hemos probado que un polinomio con coeficientes reales, caso de tener una ra´ız compleja a + bi, tambi´en tiene la raiz a − bi). Es decir, que el n´ umero de los posibles autovalores complejos de A es par (cada autovalor complejo a + bi va acompa˜ nado por su conjugado a − bi).
Entonces, en el caso de matrices de orden 2, caso de tener autovalores complejos, se tratar´ıa de dos autovalores distintos (complejo conjugados) y la matriz ser´ıa diagonalizable en el campo complejo (las matrices D y P tendr´ıan elementos complejos). Lo mismo ocurre si A es de orden 3 y tiene autovalores complejos. Si este es el caso, A tiene un autovalor real y dos complejos conjugados. Por tener 3 autovalores distintos es diagonalizable en el campo complejo. ñ
ô
1 3 Ejemplo 5.3.6. Diagonalizar en el campo complejo la matriz A = −1 1 y calcular A8 . Calculamos los autovalores de A:
1−λ 3 = (1 − λ)2 + 3 = 0. det(A − λI2 ) = −1 1 − λ √ √ Por tanto, los autovalores son λ1 = 1 + 3i y λ2√= 1 − 3i. Pasamos ahora a calcular los autovectores asociados a λ1 = 1 + 3i: #ñ ô " √ ñ ô √ v1 − 3i 3 v1 √ = (A − (1 + 3i)I2 ) = 0, v2 −1 − 3i v2
que se traduce en el sistema (
√ − 3iv√ 1 + 3v2 = 0 −v1 − 3iv...