ALGEBRA LINEAR Francesco Russo e Aron Simis - Portale Posta DMI

ÁLGEBRA LINEAR 

Francesco Russo e Aron Simis

Conteúdo 

Capítulo 1. Preliminares de uma aplicação linear 1 

1.1. Polinômio característico e polinômio minimo 1 

1.2. Autovalores e autovetores 3 

1.3. Diagonalização e triangulação de uma aplicação linear 4 

1.4. Subespaços invariantes de uma aplicação linear 7 

1.5. Decomposição T -primária de um espaço vetorial 8 

Exercicios de revisão e referentes ao capítulo 10 

Capítulo 2. A teoria dos fatores invariantes e dos divisores elementares 17 

2.1. Matrizes com elementos polinomiais 17 

2.2. Escalonamento de matrizes com elementos polinomiais 23 

2.3. Forma canônica de Smith 26 

2.4. Equivalencia em Mn×n(k[X]) e semelhnanca em Mn×n(k) 30 

2.5. Forma canônica racional 31 

2.6. Fatores invariantes e divisores elementares 33 

2.7. Teoremas de decomposição T -ciclica I e T -primaria II 35 

2.8. Teorema de decomposição T –ciclica II 37 

Exercicios do capítulo 40 

Capítulo 3. Forma canônica de Jordan 45 

3.1. Forma canônica de Jordan para operadores nilpotentes 45 

3.2. Forma canônica de Jordan para operadores com polinômio minimo completamente 

redutivel sobre k 47 

Exercisios do capítulo 49 

iii

CAPíTULO 1 

Preliminares de uma aplicação linear 

1.1. Polinômio característico e polinômio minimo 

Seja K um corpo arbitrário, fixo de uma vez por todas, a menos de afirmação em contrário. 

Seja V um K-espaço vetorial de dimensão finita. Denotaremos por End(V ) o conjunto das 

aplicações lineares de V em V e observamos que End(V ), além de admitir uma estrutura de 

K-espaço vetorial (com dim End(V ) = (dim V ) 2 ), admite uma outra operação natural, a de 

composição de aplicações , que lhe confere estrutura de anel (não comutativo). Nesta seção 

estudaremos as propriedades preliminares de uma aplicação linear T ∈ End(V ). Indicaremos 

por IV ∈ End(V ) a aplicação linear identidade, assim como I ∈ Mn×n(K) denotara a matriz 

identidade In×n. 

Seja T ∈ End(V ). Dado p(t) = a0 + a1t + . . . + art r ∈ K[t], definimos 

como a aplicação linear cuja imagem em v é 

p(T ) := a0IV + a1T + . . . + arT r ∈ End(V ) 

p(T )(v) := a0v + a1T (v) + . . . + arT r (v) ∈ V. 

Com essa notação podemos definir um homorfismo de aneis comutativos φT : K[t] → K[T ], 

dado por 

φT (p(t)) = p(T ) ∈ End(V ), 

onde K[T ] designa a K-subálgebra do anel End(V ) gerada por T ∈ End(V ). Neste mesmo 

espírito, definimos uma operação • T : K[t] × V → V de K[t] em V , dada por 

V . 

p(t) • T v = p(T )(v) ∈ V. 

A operação • T induz uma estrutura de K[t]-modulo finitamente gerado no K-espaço vetorial 

Analogamente, se A ∈ Mn×n(K), definimos 

e a operação 

como 

p(A) = a0I + a1A + . . . + arA r ∈ Mn×n(K) 

•A : K[t] × K ⊕n → K ⊕n 

p(t) •A v = p(A)(v) ∈ K ⊕n , 

onde p(A)(v) designa o produto da matriz p(A) pelo vetor coluna v. 

Dada A(t) = (ai,j(t)) ∈ Mn×n(K[t]) e dados v1, . . . , vn ∈ V , definimos 

⎛ ⎞ ⎛ ⎞ ⎛ n v1 

v1 

j=1 

⎜ ⎟ ⎜ ⎟ ⎜ 

A(t) •T ⎝ . ⎠ = A(T ) ⎝ . ⎠ = ⎝ 

vn 

vn 

a1,j(T )(vj) 

 

. 

n 

j=1 an,j(T 

⎞ 

⎟ 

⎠ . 

)(vj) 

1

2 1. POLINÔMIO MINIMO E CARATERISTICO 

1.1.1. Definição. (Polinômio carateristico e polinômio minimo) Seja T ∈ End(V ) e 

seja B = {v1, . . . , vn} uma base de V . O polinômio carateristico de T é 

c T (t) := det(tI − [T ] B B) ∈ K[t]. 

O polinômio minimo de T , indicado com m T (t) é o gerador monico do ideal ker (φT ) ⊆ K[t], 

i. e. é o polinômio monico de menor grau p(t) ∈ K[t] com a propriedade que p(T ) = 0 End(V ). 

Se A ∈ Mn×n(K), definimos o polinômio carateristico de A como 

c A (t) = det(tI − A) ∈ K[t] 

e o polinômio minimo de A, m A (t), como o gerador mônico de ker (φA). 

Por definição de matriz associada a uma aplicação linear com respeito a uma base B, temos 

= A = [ai,j], 

n 

T (vj) = ai,jvi. 

que, se [T ] B B 

i=1 

Se B ∈ Mn×n(K) é uma matriz inversível, então 

det(tI − B −1 AB) = det(B −1 (tI − A)B) = det(tI − A) 

para qualquer matriz A ∈ Mn×n(K). Portanto o polinômio caraterestico de T é bem definido, 

não dependendo da escolha da base B utilizada na sua definição. c T (t) é um polinômio monico 

de grau n = dim(V ). Observamos que 

det(tI − A) = det((tI − A) t ) = det(tI − A t ). 

Se C(t) = tI − At ∈ Mn×n(K[t]), temos 

(1.1.1) 

⎛ 

v1 

⎜ 

C(t) •T ⎝ . 

vn 

⎞ ⎛ 

T (v1) − 

⎟ ⎜ 

⎠ = ⎝ 

n i=1 ai,1(vi) 

. 

T (vn) − n i=1 ai,n(vi) 

⎞ ⎛ 

⎟ ⎜ 

⎠ = ⎝ 

0V 

. 

0V 

⎞ 

⎟ 

⎠ . 

Se ad(C(t)) ∈ Mn×n(K[t]) é a matriz adjunta de C(t) ∈ Mn×n(K[t]), temos 

(1.1.2) ad(C(t)) · C(t) = C(t) · ad(C(t)) = det(tI − A t ) · I = c T (t) · I. 

Podemos agora demonstrar um resultado clássico importante. 

1.1.2. Teorema. (Cayley-Hamilton) Seja T ∈ End(V ). Então 

i. e. T anula o proprio polinômio carateristico. 

Analogamente, se A ∈ Mn×n(K), então 

c T (T ) = 0 End(V ), 

c A (A) = 0 Mn×n(K).

1.2. DEFINIÇÕES 3 

Demonstração. Seja B = {v1, . . . , vn} uma base de V . De (1.1.2) e de (1.1.1), deduzimos 

⎛ 

c 

⎜ 

⎝ 

T (T )(v1) 

. 

cT ⎞ 

⎟ 

⎠ = (c 

(T )(vn) 

T ⎛ ⎞ 

⎛ ⎛ ⎞⎞ 

v1 

v1 

⎜ ⎟ 

⎜ ⎜ ⎟⎟ 

(t) · I) •T ⎝ . ⎠ = ad(C(t)) •T ⎝C(t) •T ⎝ . ⎠⎠ 

= 

vn 

⎛ ⎞ ⎛ ⎞ 

vn 

= ad(C(t)) •T 

⎜ 

⎝ 

0V 

. 

0V 

⎟ ⎜ 

⎠ = ⎝ 

Portanto a aplicação linear c T (T ) é a aplicação nula porque se anula sobre uma base de V . 

 

1.1.3. Corolário. Seja T ∈ End(V ). O polinômio minimo de T divide o polinômio carateristico 

de T . 

0V 

. 

0V 

⎟ 

⎠ . 

1.2. Autovalores e autovetores 

Nesta seção introduziremos as primeiras noções de subespaços invariantes, através dos autovalores 

de uma aplicação linear. 

1.2.1. Definição. (Autovalor e autovetor de un aplicação linear) Seja T ∈ End(V ). 

Um autovetor de T é um vetor v ∈ V \ 0V tal que existe λ ∈ K com a propriedade que 

T (v) = λv. 

O elemento λ ∈ K se diz autovalor de T e v se diz autovetor relativo ao autovalor λ. 

Analogamente, se A ∈ Mn×n(K), um vetor não nulo v ∈ K ⊕n se diz autovetor da matriz A 

se existir λ ∈ K tal que 

A · v = λv. 

O elemento λ ∈ K se diz nesse caso autovalor de A. 

Indicamos com Vλ, λ ∈ K, o seguinte subespaço de V 

Vλ = ker (λIV − T ). 

Esse subespaço vetorial de V , chamado de autoespaço de T relativo a λ ∈ K. 

Observamos que λ ∈ K é autovalor se e somente se Vλ = 0V . A relação entre os autovalores 

de T ∈ End(V ) (ou de A ∈ Mn×n(K)) e o polinômio caraterístico de T é exprimida pelo seguinte 

resultado. 

1.2.2. Teorema. Os autovalores de T ∈ End(V ) (ou de A ∈ Mn×n(K)) são precisamene as 

raizes em K de c T (t) (respectivamente de c A (t)), que coincidem com as raizes em k de m T (t) 

(respectivamente de m A (t)). 

Em particular se n = dim(V ), então T tem no maximo n autovalores distintos. 

Demonstração. Seja B = {v1, . . . , vn} uma base de V e seja [T ] B B a matriz de T em relação 

à base B. O aplicação linear λIV − T tem núcleo não trivial se e somente se det([λIV − T ] B B ) = 0 

se e somente se cT (λ) = 0. 

Seja agora λ ∈ k um autovalor e seja v ∈ Vλ \ 0V . Temos 

0V = m T (T )(v) = m T (λ) · v. 

Sendo v = 0V , temos m T (λ) = 0, i. e. qualquer raiz de c T (t) em k é raiz de m T (t). Sendo que 

m T (t) divide c T (t), qualquer raiz de m T (t) em k é raiz de c T (t).


1.2.3. Teorema. Sejam λ1, . . . , λm autovalores distintos de uma aplicação linear T ∈ End(V ) 

e sejam wj ∈ Vλj \ 0V , j = 1, . . . , m, então w1, . . . , wm são linearmente independentes sobre K. 

Em particular a soma dos subespaços Vλ1 , . . . , Vλm é direta. 

Demonstração. Seja pj(t) = 

i=j (t − λi). Por definição tem-se: 

 

pj(T )(wk) = i=j (λj − λi)wj se k = j 

0V 

se k = j 

Seja 

a1w1 + . . . + amwm = 0V 

com ai ∈ k. Temos que para cada j = 1, . . . , m 

m 

n 

 

0V = pj(T )(0V ) = pj(T )( aiwi) = aipj(T )(wi) = aj (λj − λi)wj. 

i=1 

Portanto aj = 0 para cada j = 1, . . . , m. 

1.2.4. Definição. (Multiplicidade algébrica e geométrica de um autovalor) 

Seja c T (t) o polinômio caraterístico de T ∈ End(V ) e seja λ ∈ K um autolavor de T . Se 

c T (t) = (t − λ) µ q(t) com q(t) ∈ K[t] e com q(λ) = 0, dizemos que µ é a multiplicidade algébrica 

de λ. 

A multiplicidade geométrica do autovalor λ ∈ K de T é a dimensão do autoespaço Vλ relativo 

ao autovalor λ. 

1.3. Diagonalização e triangulação de uma aplicação linear 

1.3.1. Definição. (Endomorfismo diagonalizavel ou triangularizavel) Uma aplicação 

linear T ∈ EndK(V ) é diagonalizável sobre K se existe uma base B = {v1, . . . , vn} de V tal que 

[T ] B B seja uma matriz diagonal. Equivalentemente, T é diagonalizável sobre K se e somente se 

existe uma base do K-espaço V formada por autovetores de T . 

Dizemos que T é triangularizavel superiormente (respectivamente, inferiormente) sobre K 

se existe uma base B = {v1, . . . , vn} de V tal que [T ] B B seja uma matriz triangular superior 

(respectivamente, triangular inferior). 

Correspondentemente, uma matriz A ∈ Mn×n(K) se diz diagonalizável (triangularizavel 

superiormente ou inferiormente) sobre K se existe P ∈ Mn×n(K) inversível tal que P −1 · A · P 

seja diagonal (triangular superior, respectivamente, triangular inferior). 

Sempre que não se prestar a confusão, omitiremos o complemento “sobre K”. 

O Teorema 1.2.3 tem o seguinte corolário, cuja demonstração é imediata. 

1.3.2. Corolário. Se T ∈ End(V ) admite n autovalores distintos, onde n = dim(V ), então 

T é diagonalizavel. 

i=1 

Em geral, uma aplicação linear não é diagonalizavel como mostram os seguinte exemplos. 

1.3.3. Exemplo. Seja 

e seja TA : K 2 → K 2 definido por 

A = 

 

x 

TA( 

y 

0 1 

0 0 

 

 

x 

) = A · 

y 

 

. 

i=j


Então c TA(t) = t 2 , o único autovalor é 0 e V0 = ker (T ) é um subespaço de dimensão 1. 

Portanto não existe uma base de K 2 formada por autovetores de T . O aplicação linear TA é 

claramente triagularizavel superiormente. Temos m TA(t) = t 2 . 

Observemos que T não é diagonalizavel sobre K, qualquer que seja o corpo K. O exemplo 

seguinte mostra que, em geral, a diagonalizabilidade depende do corpo K. 

Seja Tθ : R2 → R2 a aplicação linear definida por 

 

x cos(θ) sin(θ) 

Tθ( ) = 

y − sin(θ) cos(θ) 

 

x 

· 

y 

com θ ∈ [0, 2π). Se θ = 0, π, então c Tθ(t) não tem raizes reais. A aplicação linear Tθ não é 

sequer triangularizavel sobre R para esses valores de θ - mas o é sobre C. 

Esses exemplos simples põem em evidência a necessidade de critérios mediante os quais 

uma aplicação linear seja diagonaliável ou triangularizavel. O próximo resultado fornece um tal 

critério de triangularização . 

1.3.4. Teorema. As seguintes condições são equivalentes para T ∈ End(V ): 

(1) T triangularizavel superiormente (ou inferiormente); 

(2) c T (t) é completamente fatorável sobre K. 

Demonstração. Suponhamos triangularizavel superiormente (logo, inferiormente também 

- porque?). Consideremos uma base B de V tal que A = [T ] B B seja triangular. É imediato ver 

que tI − [T ] B B é triangular, logo cT (t) = m j=1 (t − ai,i). Portanto, cT é completamente fatorável 

sobre K. 

Reciprocamente, suponhamos que cT (t) = m j=1 (t − λj) µj com λj ∈ K µ1 + . . . + µm = n. 

Seja 0 = v1 ∈ Vλ1 e completemos este vetor a uma base B de V . Temos: 

[T ] B 

 

λ1 A1 

B = 

, 

0 (n−1)×1 A2 

com A1 ∈ M 1×(n−1)(K) e A2 ∈ M (n−1)×(n−1)(K). 

Calculando o polinômio carateristico de T , temos 

c T (t) = det(tI − [T ] B B) = (t − λ1) det(tI (n−1)×(n−1) − A2) = (t − λ) · c A2 (t). 

Segue que A2 ∈ M (n−1)×(n−1)(K) tem polinômio carateristico completamente sobre K. Procedendo 

por indução sobre n = dim(V ), existe uma matriz invertível P2 ∈ M (n−1)×(n−1)(K) tal 

que P −1 

2 A2 P2 seja triangular superior. Pondo 

segue facilmente que 

 

P = 

P −1 · [T ] B 

B · P = 

1 0 1×(n−1) 

0 (n−1)×1 

λ1 

P2 

 

., 

A3 

0 (n−1)×1 P −1 

2 · A2 · P2 

como queríamos. 

Como vimos anteriormente a obstrução para a diagonalização de T ∈ End(V ) reside na 

possibilidade que existam um numero insuficiente de autovetores para formar uma base de V . A 

dimensão de um autoespaço é limitada superiormente pela multiplicidade algébrica do autovalor. 

 

, 

 

,


1.3.5. Proposição. Seja T ∈ End(V ) e sejam λi ∈ K os autovalores de T de multiplicidade 

µi ≥ 1, i = 1, . . . , m. Então 

e 

1 ≤ dim(Vλi ) ≤ µi 

dim(Vλ1 ⊕ . . . ⊕ Vλm ) ≤ 

m 

µi. 

Demonstração. Seja {v1, . . . , vri } uma base de Vλi que completamos a uma base B = 

{v1, . . . , vn} de V . Temos 

[T ] B B = 

λi · Iri×ri A1 

0 (n−ri)×ri A2 

com A1 ∈ M ri×(n−ri)(K) e A2 ∈ M (n−ri)×(n−ri)(K). 

Calculando o polinômio carateristico de T , temos 

i=1 

 

, 

c T (t) = det(tI − [T ] B B) = (t − λi) ri det(tI(n−ri)×(n−ri) − A2), 

que implica µi ≥ ri. 

1.3.6. Teorema. Seja T ∈ End(V ) e seja n = dim(V ). As seguintes condições são equivalentes: 

(1) T diagonalizavel; 

(2) (a) cT (t) = m j=1 (t − λj) µj com µ1 + . . . + µm = n = dim(V ), onde os elementos λj 

são distintos; 

(b) dim(Vλj ) = µj para cada j = 1, . . . , m; 

(3) V = Vλ1 ⊕ . . . ⊕ Vλm . 

Portanto se T ∈ End(V ) é diagonalizavel, mT (t) = m j=1 (t − λj) 

Demonstração. Se T é diagonalizavel, pelo Teorema 1.3.4, o polinômio carateristico é 

da forma especificada em a). Sendo diagonalizavel e lembrando a Proposição 1.2.3 temos que 

⊕ . . . ⊕ Vλm = V . Deduzimos portanto, via Proposição 1.3.5 

Vλ1 

n = dim(V ) = dim(Vλ1 ⊕ . . . ⊕ Vλm ) ≤ 

m 

µi = n. 

Sendo dim(Vλi ) ≤ µi temos necessariamente a igualdade. 

Se valem as condições a) e b), temos dim(Vλ1 ⊕ . . . ⊕ Vλm ) = m i=1 µi = n e portanto 

V = Vλ1 ⊕ . . . ⊕ Vλm . Essa ultima condição implica em que T seja diagonalizavel. 

Escolhendo uma base B de V formada por autovetores de T , temos que a matriz [T ] B B é 

diagonal, de onde se deduz mT (t) = m j=1 (t − λj). 

Observemos que a fatoração de m T (t) acima é caso particular de uma fatoração mais geral 

(Proposição 1.4.3). Além disso, a recíproca da última afirmação do teorema acima é válida 

(Teorema 1.5.1). 

i=1


1.4. Subespaços invariantes de uma aplicação linear 

Quando T é diagonalizavel, cT (t) = m j=1 (t − λj) µj com µ1 + . . . + µm = n = dim(V ) e 

mT (t) = m j=1 (t − λj). Isso representa de alguma forma o caso ideal. Uma maneira de ler o 

resultado anterior que permite uma generalização é a seguinte: os autoespaços são construidos 

como ker (T − λIV ) e no caso diagonalizavel fornecem uma decomposição de V em soma direta 

de autoespaços. Essa resultado vai ser generalizado a um T ∈ End(V ) qualquer na proxima 

seção. Antes são necessarias algumas definições e observações gerais que generalizam a noção de 

autoespaço para expressões polinomiais de T mais gerais que as da forma T − λIV . 

1.4.1. Definição. (Subespaço T –invariante) Seja T ∈ End(V ) e seja U ⊆ V um subespaço. 

O subespaço U se diz T -invariante se T (U) ⊆ U. 

Quando temos um subespaço T –invariante, podemos definir 

T |U : U → U 

e claramente T ∈ End(U). Vamos ver como produzir subespaços T -invariantes via polinômios. 

1.4.2. Exemplo. Seja T ∈ End(V ), seja q(t) ∈ K[t] e seja q(T ) : V → V a aplicação linear 

associada. Se U := ker (q(T )), então U e’ subespaço T -invariante. 

Temos T ◦ q(T ) = q(T ) ◦ T e portanto, se u ∈ U, 

0V = T (0V ) = T (q(T )(u)) = q(T )(T (u)), 

i. e. T (u) ∈ U. 

Em particular se λ ∈ K, temos que a noção de autoespaço é obtida considerando os polinômios 

qλ(t) = t − λ. 

Poder decompor V em subespaços T -invariantes, permite semplificar o problema do ponto 

de vista computacional, como mostraremos na proxima proposição. A existencia de uma decomposição 

de V em subespaços T –invariantes vai ser tratada na seção 1.5. 

1.4.3. Proposição. Seja T ∈ End(V ) e seja V = U1 ⊕ . . . ⊕ Ur com Ui subespaços T – 

invariantes. Se Ti = T |Ui : Ui → Ui, temos : 

c T r 

(t) = c Ti (t) 

e 

i=1 

m T (t) = m. c. m.{m T1 (t), . . . , m Tr (t)}. 

Demonstração. Sejam Bi bases de Ui e seja B = {v1, . . . , vn} = B1 ∪ . . . ∪ Br. Sendo os 

Ui subespaços T –invariantes, temos 

⎛ 

⎞ 

onde Ai = [Ti] Bi 

Bi 

[T ] B B 

⎜ 

⎝ 

A1 

A2 

. .. 

Ar 

e o restante da matriz é composto por zeros. Calculando segue imediatamente 

que c T (t) = r 

i=1 cTi (t). Por definição temos que m T (T ) = 0End(V ). Portanto m T (Ti) = 0 End(Ui) 

para cada i, i. e. m Ti (t) divide m T (t) e portanto m. c. m.{m T1 (t), . . . , m Tr (t)} divide m T (t). 

⎟ 

⎠ ,


Reciprocamente, seja p(t) ∈ K[t] divisível por cada um dos polinômios m T1 (t), . . . , m Tr (t). Afirmamos 

que p(T ) = 0 End(V ), do que segue, em particular, que m. c. m.{m T1 (t), . . . , m Tr (t)}(T ) = 

0 End(V ) e, portanto, que m T (t) divide m. c. m.{m T1 (t), . . . , m Tr (t)}. Ora, seja v ∈ V , com 

v = u1 + · · · + ur, ui ∈ Ui; escrevendo p(t) = qi(t)m Ti (t), i = 1, . . . , r, tem-se: 

p(T )(v) = p(T )(u1 + · · · + ur) = p(T )(u1) + · · · + p(T )(ur) 

= (q1 m T1 )(T )(u1) + · · · + (qr m Tr )(T )(ur) 

= (q1 m T1 (T ))(u1) + · · · + (qr m Tr (T ))(ur) 

= q1(m T1 (T (u1)) + · · · + qr(m Tr (T (ur)) 

= q1(m T1 (T1))(u1) + · · · + qr(m Tr (Tr))(ur) 

= q1(0 End(U1))(u1) + · · · + qr(0 End(Ur))(ur) 

logo p(T ) = 0 End(V ), como queríamos. 

1.5. Decomposição T -primária de um espaço vetorial 

Vamos provar um resultado importante que mostra como a partir da fatorização do polinômio 

carateristico (ou minimo) de uma aplicação linear T : V → V em fatores ”primarios”seja 

possivel construir uma decomposição de V em subespacos T −invariantes tais que a restrição 

de T a esses subespaços tenha como polinômio carateristico (respectivamente minimo) o fator 

”primário”correspondente. 

1.5.1. Teorema. (Teorema de decomposição primaria) Seja T ∈ End(V ) e seja 

m T (t) = q1(t) e1 · · · qr(t) er 

o polinômio minimo de T , onde cada qi(t) é um polinômio mônico irredutivel, 1 ≤ ei para cada 

i = 1, . . . , r e os qi(t) ∈ K[t] são distintos. Então 

(1) V é soma direta de subespaços T -invariantes; precisamente, 

(2) 

V = ker (q1(T ) e1 ) ⊕ · · · ⊕ ker (qr(T ) er ); 

c T (t) = q1(t) l1 · · · qr(t) lr , 

com 1 ≤ ei ≤ li para cada i = 1, . . . , r; 

(3) ker (qi(T ) ei ) = ker (qi(T ) li ) para cada i = 1, . . . , r; 

(4) dim(ker (qi(T ) ei )) = li · grau(qi); 

(5) O polinômio minimo (respectivamente, carateristico) da restrição de T a ker (qi(T ) ei ) 

é qi(t) ei (respectivamente, qi(t) li ). 

Demonstração. (1) Já observamos que os subespaços ker (qi(T ) ei ) são T -invariantes. Provemos, 

primeiramente, que V = ker (q1(T ) e1 ) + . . . + ker (qr(T ) er ). Para tal, provaremos que: 

• Im(hi(T )) ⊆ ker (qi(T ) ei ) para i = 1, . . . , r, onde hi(t) = 

j=i qj(t) ej ; 

• V = Im(h1(T )) + . . . + Im(hr(T )). 

A primeira afirmativa é bastante evidente, uma vez que qi(t) ei hi(t) = m T (t), logo qi(T ) ei se 

anula nos elementos da imagem de hi(T ). 

Para provar a segunda afirmativa, observemos que o máximo divisor comum dos polinômios 

é 1, logo existe uma relação h1(t)g1(t) + . . . + hr(t)gr(t) = 1, onde g1(t), . . . , gr(t) ∈ K[t] são 

polinômios convenientes. Substituindo t ↦→ T e aplicando em um v ∈ V arbitrário, obtemos 

v = IV (v) = h1(T )(g1(T )(v)) + · · · + hr(T )(gr(T )(v)),

1.5. DECOMPOSIÇÃO PRIMARIA 9 

isto é, V ⊂ Im(h1(T )) + · · · + Im(hr(T )), como se queria. 

O polinômio mT (t) não divide hi(t) e portanto hi(T ) = 0End(V ), i.e. existe v ∈ V \ 0V tal 

que hi(T )(v) = 0. 

Mostremos agora que a soma Im(h1(T )) + . . . + Im(hr(T )) é direta, isto é, que, para todo 

i = 1, . . . , r, tem-se 

ker (qi(T ) ei 

 

) ∩ ( ker (qj(T ) ej )). 

j=i 

Seja então v ∈ ker (qi(T ) ei ) ∩ ( 

j=i ker (qj(T ) ej )). Para cada i, os polinômios qi(t) ei e hi(t) são 

relativamente primos, logo existem ai(t), bi(t) ∈ K[t] tais que ai(t)qi(t) ei + bi(t)hi(t) = 1. Como 

antes, obtemos 

v = IV (v) = a(T )(qi(T ) ei (v)) + b(T )(hi(T )(v)) = 0V + 0V = 0V . 

(2) Aplicando o mesmo argumentos da parte (1) aos fatores de c T (t) (em vez de m T (t)), 

obtém-se analogamente V = ker (q1(T ) l1 )⊕· · ·⊕ker (qk(T ) lk). Como as inclusões ker (qi(T ) ei ) ⊆ 

ker (qi(T ) li ) são imediatas, uma vez que ei ≤ li, comparando as dimensões obtemos ker (qi(T ) ei ) = 

ker (qi(T ) li ) para todo i = 1, . . . , r. 

(3) e (4) Seja agora Ti a restrição de T a Ui = ker (qi(T ) ei ). Como a restrição comuta com 

somas e produtos, tem-se qi(Ti) ei = 0End(Ui) e, portanto, qi(t) é o único fator irredutivel de 

mTi (t), i.e. mTi(t) = qi(t) αi com 1 ≤ αi; isso implica em cTi (X) = qi(X) βi , βi ≥ αi ≥ 1. A 

dimensão de ker (qi(T ) ei ) é portanto βi · grau(qi(t). Vamos mostrar que βi = li e que αi = ei. 

Isso segue das relações 

r 

qi(t) li 

r 

T 

= c (t) = c Ti 

r 

(t) = qi(t) βi , 

i=1 

r 

qi(t) ei T 

= m (t) = 

i=1 

i=1 

r 

m Ti (t) = 

i=1 

i=1 

r 

qi(t) αi , 

onde as igualdades do meio foram provadas na Proposição 1.4.3. 

Como consequência obtemos uma primeira formulação da venerável decomposição de Jordan. 

1.5.2. Corolário. Seja T ∈ End(V ). Suponhamos que c T (t) se fatora completamente sobre 

K, digamos, c T (t) = (t − λ1) l1 · · · (t − λr) lr e m T (t) = (t − λ1) e1 · · · (t − λr) er . Então existe uma 

decomposição direta T -invariante V = V1 ⊕ · · · ⊕ Vr tal que: 

(i) Vi = ker ((T − λi) ei ); 

(ii) dim Vi = li, para 1 ≤ i ≤ r; 

(iii) A restrição T |Vi tem polinômio mínimo (t−λI) ei e é da forma λiI+Si, onde Si : Vi → Vi 

é nilpotente de índice ei. 

Demonstração. O único item que requer algum comentário é (iii). Novamente, usamos 

que a restrição comuta com somas e produtos, logo, pondo Ti = T |Vi e denotando por Ii a matriz 

identidade de ordem li, tem-se que (Ti − λiIi) ei = 0. Logo Si := Ti − λiIi é nilpotente de índice 

no máximo ei Por outro lado, mTi (t) = (t − λi) ei pelo item (4) do teorema anterior. Logo, o 

índice de nilpotência é exatamente ei 

 

1.5.3. Corolário. Seja T ∈ End(V ). Então T é diagonalizavel sobre K se e só se m T (X) 

é completamente fatorável sobre K e sem fatores múltiplos. 

Demonstração. Resulta imediatamente do Corolário 1.5.2 e da equivalência (1) ⇔ (3) do 

Teorema 1.3.6. 

i=1


Exercicios de revisão e referentes ao capítulo 

(1) Seja Ei,j ∈ Mm×m(K) a matriz cujos elementos el,m satisfazem a seguinte condição 

(a) el,m = 1 se (l, m) = (i, j); 

(b) el,m = 0 se (l, m) = (i, j). 

Para a ∈ K e para i = j seja Ea i,j = I + aEi,j. Para i = j seja Ei,j = I + Ei,j + 

Ej,i − Ei,i − Ej,j e seja, para c ∈ K∗ , Ec i = I + (c − 1)Ei,i. 

Essas matrizes se dizem matrizes elementares. Provar que são invertiveis e descrever 

a inversa de cada tipo. 

(2) Dada A ∈ Mm×n(K) com 

⎛ 

⎜ 

A ⎝ 

A1 

. 

Am 

⎞ 

⎟ 

⎠ , 

i.e. Ai ∈ K n , i = 1, . . . , m são os vetores linha da matriz A. Mostrar que 

(a) E a i,j · A tem como i-esima linha Ai + aAj e as outras linha iguais; 

(b) Ei,j · A tem como i-esima linha Aj, como j-esima linha Ai e as outras linhas iguais 

as linhas de A; 

(c) Ec i · A tem na i-esima linha cAi e as outras linhas iguais as linhas de A. 

Duas matrizes A, B ∈ Mm×n(K) se dizem linha equivalentes se existem um numero 

finito de matrizes elementares E1, . . . , Er ∈ Mm×m(K) tais que E1 · E2 · . . . · Er · A = B. 

Moltiplicar uma matriz A ∈ Mm×n(K) a direita por matrizes elmentares em 

Mn×n(K) e descrever o resultado sobre as colunas de A. Definir a noção de matrizes 

coluna equivalentes. 

⎛ ⎞ 

⎛ ⎞ 

(3) Dadas A ∈ Mm×n(K), X = 

⎜ 

⎝ 

x1 

. 

xn 

⎟ 

⎜ 

⎠ ∈ Mn×1(K), B = ⎝ 

b1 

. 

bm 

⎟ 

⎠ ∈ Mm×1(K), consi- 

deramos o sistema de equações lineares com coeficientes em K nas incognitas x1, . . . , xn 

dado por 

A · X = B. 

Seja 

A = A | B ∈ M m×(n+1)(K) 

a matriz associada ao sistema. 

Mostrar que qualquer sistema obtido moltiplicando por matrizes elementares a esquerda 

a matriz do sistema, i.e. operando sobre as linhas do sistema com as operações 

descritas anteriormente, tem as mesmas soluções do sistema original (usar o fato que 

as matrizes elementares são inversiveis). 

(4) Seja A ∈ Mm×n(K). Dizemos que A é linha reduzida a forma escada se: 

(a) o primeiro elemento não nulo de cada linha é igual a 1; 

(b) o primeiro elemento não nulo da (i+1)-esima linha se encontra a direita do primeiro 

elemento não nulo da i-esima linha; 

(c) os elementos de uma coluna que contem o primeiro elemento não nulo de uma 

linha, diferente desse elemento, são nulos. 

Mostrar que dada A ∈ Mm×n(K), existem um numero finito de matrizes elementares 

E1, . . . , Er tais que E1 · E2 · . . . · Er · A seja linha reduzida a forma escada.

EXERCICIOS 11 

Deduzir que, se n > m, então o sistema um sistema homogeneo da forma A · X = 

0 Mm×1(K) admite uma solução com pelo menos um elemento xi não nulo. 

(5) Seja A ∈ Mn×n(K). Mostrar que as seguintes condições são equivalentes: 

(a) A é linha equivalente a I; 

(b) A é produto de matrizes elementares; 

(c) A é invertivel; 

(d) o sistema de equações lineares homogeneas A · X = 0 Mm×1(K) admite somente a 

solução com todos os xi nulos. 

Deduzir que dada uma matriz invertivel, a matriz inversa A −1 é obtida aplicando 

a I as operações elementares que levam a matriz A em I. 

(6) Seja A ∈ Mn×n(K). Dados i, j, definimos Ai,j ∈ Mn−1×n−1(K) como a matriz obtida 

de A eliminando a i-esima linha e a j-esima coluna de A. 

Definimos det(A) indutivamente segundo a seguinte formula: 

det(A) = a1,1 det(A1,1) − a2,1 det(A2,1) + . . . + (−1) n+1 an,1 det(An,1) ∈ K. 

Mostrar as seguintes propriedades de det(A): 

(a) det(I) = 1; 

(b) a função det(A) é linear com respeito as linhas de A, i.e. para cada α, β ∈ K 

temos 

⎛ 

⎞ ⎛ ⎞ ⎛ ⎞ 

⎜ 

det( ⎜ 

⎝ 

A1 

. 

αAi + βA ′ i 

. 

Am 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟) 

= α det( ⎜ 

⎟ ⎜ 

⎠ ⎝ 

A1 

. 

Ai 

. 

Am 

(c) Se A tem duas linhas iguais, então det(A) = 0; 

(d) se i = j, então 

⎛ ⎞ ⎛ 

A1 

⎜ ⎟ ⎜ 

⎜ . ⎟ ⎜ 

⎜ ⎟ ⎜ 

det( ⎜ Ai + βAj ⎟) 

= det( ⎜ 

⎜ ⎟ ⎜ 

⎝ 

. 

⎠ ⎝ 

Am 

⎟ ⎜ 

⎟ ⎜ 

⎟ ⎜ 

⎟) 

+ β det( ⎜ 

⎟ ⎜ 

⎠ ⎝ 

para cada β ∈ K; 

(e) A matriz obtinda trocando duas linhas de A tem determinante igual a − det(A); 

(f) Se uma linha de A é nula, então det(A) = 0. 

(g) Deduzir que det(Ea i,j ) = 1 para cada a ∈ K, det( Ei,j) = −1 e det(Ec i ) = c para 

cada c ∈ K∗ . 

(h) Utilizando as propriedades acima deduzir que se E é uma matriz elementar dos 

3 tipos acima e se A ∈ Mn×n(K) é arbitraria, então temos det(E · A) = det(E) · 

det(A). Por indução mostrar que o mesmo resultado vale se E for produto de 

matrizes elementares. 

(i) provar que A ∈ Mn×n(K) é invertivel se e somente se det(A) = 0. 

(j) (Definição axiomatica do determinante) Seja 

d : Mn×n(K) → K 

A1 

. 

Ai 

. 

Am 

⎞ 

⎟ 

⎟) 

⎟ 

⎠ 

A1 

. 

A ′ i 

. 

Am 

⎟ 

⎟); 

⎟ 

⎠


uma função que satisfaz as propriedades a), b) e c) acima. Provar que d(A) = 

det(A) para cada A ∈ Mn×n(K). 

(k) Concluir que podemos calcular o determinante desenvolvendo segundo qualquer 

linha (ou coluna) porque a função assim definida satisfaz as propriedades a), b) e 

c) acima. 

(l) Sejam A, B ∈ Mn×n(K). Provar que det(A · B) = det(A) · det(B). Deduzir que se 

A é invertivel, então det(A −1 ) = det(A) −1 . 

(m) Provar que det(A) = det(A t ), onde A t é a matriz trasposta de A. 

(n) Seja A ∈ Mn×n(K), seja αi,j = (−1) i+j det(Ai,j) e seja 

ad(A) = [αi,j] t ∈ Mn×n(K) 

a matriz adjunta de A. Provar que 

A · ad(A) = ad(A) · A = det(A)I 

e deduzir que se det(A) = 0, então A −1 = ad(A) 

det(A) . 

(7) Seja A ∈ Mm×n(K). Definimos o posto linha de A, indicado com rank (A), como a 

dimensão do subespaço de K n gerado pelas linhas de A. Definimos o posto coluna de 

A, indicado com rank (A), como a dimensão do subespaço de K m gerado pelas colunas 

de A. Mostre que 

(a) para qualquer A ∈ Mm×n(K) temos rank (A) = rank (A). Portanto chamaremos 

esse numero simplesmente de posto de A e o indicaremos com rank (A). Concluir 

que rank (A) ≤ min{m, n}. 

(b) rank (A) é igual ao numero de linhas não nulas na forma linha reduzida de A, 

respectivamente rank (A) é igual ao numeros de colunas não nulas na forma coluna 

reduzida de A. 

(c) rank (A) é o maximo tamanho de uma submatriz quadrada de A com determinante 

não nulo. 

(d) A ∈ Mn×n(K) é invertivel se e somente se rank (A) = n se e somente se det(A) = 0 

se e somente se as colunas (e as linhas) de A formam una base de K n . 

(8) Sejam A, B, P, Q ∈ Mn×n(K). Mostrar que se B é invertivel e se B = P · A · Q, então 

P, A e Q são inversiveis. 

(9) A ∈ Mn×n(K) se diz nilpotente se existir r > 0 tal que Ar A ∈ Mn×n(K) é nilpotente, então I + A é invertivel. 

⎡ 

⎤ ⎡ ⎤ 

1 0 1 

0 1 0 

(10) Sejam A = ⎣ 0 −1 −1 ⎦ e B = ⎣ 0 0 0 ⎦. 

= 0. Mostrar que se 

1 1 0 

1 0 0 

(a) Encontre A−1 . 

(b) Encontre X tal que AX = B. 

(11) Seja A ∈ Mn×n(K). Definimos tr(A) = n 

i=1 ai,i ∈ K o traço de A. Mostrar que: 

(a) tr(A + B) = tr(A) + tr(B) e tr(A · B) = tr(B · A) para cada A, B ∈ Mn×n(K). 

(b) Se B é invertivel, então tr(B −1 · A · B) = tr(A). 

(12) Sejam Ui, . . . Ur subespaços vetorias do espaco vetorial V sobre K. A soma dos epaços 

Ui, indicada com U1 + . . . + Ur é o subespaço de V formado pelos vetores da forma 

v = u1 + . . . + ur, ui ∈ Ui. Mostar que

EXERCICIOS 13 

(a) a soma dos Ui é direta se e somente se cada vetor de U1 . . . + Ur admite uma unica 

escritura como a anterior. 

(b) dim(U1 +. . .+Ur) ≤ r i=1 dim(Ui) e que vale igual se e somente se a soma é direta. 

(c) Se Bi ’ e base de Ui, mostrar que ∪r i=1Bi é um sistema de geradores de U1+. . .+Ur, 

que é uma base se e somente se a soma é direta. Concluir que dado um subesaço 

U de V existe W ⊆ V subespaço tal que V = U ⊕ W (subespaço complementar de 

U). 

(d) Mostrar que Mn×n(K) é soma direta dos subespaços das matrizes simetricas (A = 

At ) e das matrizes antisimetricas (A = −At ). Mostre que as matrizes de traço nulos 

formam um subespaço de Mn×n(K). Encontrar um subespaço complementar em 

Mn×n(K). 

(13) Seja A ∈ Mn×n(K) e seja m A (t) = t r + ar−1t r−1 + . . . + a0 o polinômio minimo de A. 

Mostrar que A é invertivel se e somente se a0 = 0. 

(14) Seja T ∈ End(V ). Mostrar que T é triangularizavel superiormente se e somente se é 

triangularizavel inferiormente. 

(15) Considere o espaço vetorial V = M2×2(K), a matriz 

 

1 2 

A = 

−1 3 

e W = {B ∈ V : AB = BA} (conjunto das matrizes que comutam com A). 

(a) Mostre que W é subespaço de V . 

(b) Determine uma base para W . 

(c) Complete a base encontrada no item (a) para uma base de V . 

(d) Calcule as matrizes de mudança de base entre a base do item (c) e a base canônica 

de V , a saber, 

C = 

1 0 

0 0 

 

0 1 

, 

0 0 

(e) Encontre as coordenadas de C = 

(b). 

(16) Seja T : K 4 −→ K 3 definida por: 

 

0 

, 

1 

0 

0 

 

1 

 

1 

1 1 

 

0 0 

, 

0 1 

 

. 

em relação a base encontrada no item 

T (x1, x2, x3, x4) = (x2 − 3x3 + x4, 2x1 − 3x2 + x4, 2x1 + x2 − x3). 

(a) Encontre a matriz de T em relação as bases canônicas de K 4 e K 3 . 

(b) Determine ker (T ) e Im(T ). 

(c) T injetiva? sobrejetiva? Justifique. 

(17) Seja B = {v1 = (1, −1, 0), v2 = (1, 1, 0), v3 = (0, 0, −1)} ∈ K 3 . 

(a) Determine as coordenadas de 

v = (x, y, z) em relação a base B. 

(b) Se T : K 3 −→ K 3 é uma transformação linear tal que T (v1) = v3, T (v2) = v2 e 

T (v3) = −v1, determine T (x, y, z). 

(c) Determine (se existirem) os autovalores de T e os autovetores associados.


(18) Sejam T1 : K3 −→ K3 e T2 : K3 −→ K3 transformações lineares, tais que: 

C T1 

C = 

⎡ ⎤ 

1 0 0 

C ⎣ 1 1 0 ⎦ e T2 

C 

0 0 2 

= 

⎡ 

⎤ 

4 −2 2 

⎣ −1 2 −1 ⎦ , 

−5 4 −3 

onde C ⊂ K 3 é a base canônica. 

(a) Determine se T1 é diagonalizavel. Idem para T2. 

(b) Se possvel, determine uma base de K 3 de autovetores de T1 e represente T1 nesta 

base. Idem para T2. 

(19) Dado n ≥ 1, seja T : Pn → Pn a transformação derivada T = d/dt, onde Pn designa o 

espaço vetorial de polinômios de grau no máximo n com coeficientes reais. 

(a) Determinar os auto-valores de T e os auto-subespaços correspondentes 

(b) Determinar os polinômios c T (t) e m T (t). 

(20) Seja T : Mn×n(K) → Mn×n(K) definido por T (A) = A t . Provar que se a caracteristica 

do corpo K é diferente de dois, então T é diagonalizavel. Encontrar os autoespaços de 

T , fornecendo a decomposição de Mn×n(K) como soma direta de autoespaços de T . 

(21) Seja T : V → W uma aplicação linear de K-espaços vetoriais. Seja w ∈ Im(T ) e seja 

v tal que T (v) = w. Mostrar que os elementos de T −1 (w) são da forma v + u com 

u ∈ ker (T ). 

(22) Seja U ⊆ V um subespaço vetorial do K-espaço vetorial V . Provar que v1 ∼ v2 se e 

somente se v1 − v2 ∈ U é uma realção de equivalência sobre o conjunto V . Indicamos 

V/ ∼ com V/U e os elementos de uma classe de equivalência de um elemento v com 

[v]. Mostrar que as operações 

+ : V/U × V/U → V/U 

e 

· : K × V/U → V/U 

dadas por [v1] + [v2] = [v1 + v2] e α · [v] = [α · v] não dependem da escolha do 

representantes na classe de equivalência e estão portanto bem definidas. Provar que 

(V/U, +, ·) é um espaco vetorial sobre K, o espaço quociente de V por U. Mostrar que: 

(a) se dim(V ) = n ≥ 1, se {v1, . . . vr} é uma base de U que se extende a uma base 

{v1, . . . vn} de V , então {[vr+1], . . . , [vn]} é uma base de V/U, i.e. dim(V/U) = 

dim(V ) − dim(U); 

(b) πU : V → V/U definido por πU(v) = [v] é um homomorfismo sobrejetor de Kespaços 

vetoriais tal que ker (πU) = U; 

(c) dato T : V → W homorfismo de K-espaços vetoriais, a aplicação T : V/ker (T ) → 

W dada por T ([v]) = T (v) esta bem definida e é homomorfismo de K-espaços vetoriais. 

Verificar que T = T ◦πker (T ), i.e. o seguinte diagrama comuta (significando 

que percorrendo os dois caminhos indicados pelas setas chegamos ao mesmo ponto 

de W ): 

V 

πker (T ) 

 

 

T 

 

 

V 

 

ker (T ) W 

Te

EXERCICIOS 15 

(d) Im( T ) = Im(T ) e T : V/ker (T ) → Im(T ) é isomorfismo de espaços vetoriais. 

Deduzir uma nova prova do Teorema do Núcleo e da Imagem via formula da 

dimensão do quociente provada anteriormente. 

(23) (a) Seja T ∈ End(V ), onde V é um K-espaço vetorial de dimensão finita. Mostrar que 

T é injetor se e somente se T é sobrejetor se e somente se T ∈ Aut(V ). 

(b) Seja V = R[x], o R-espaço vetorial dos polinômios com coeficientes no corpo R. 

Definimos os aplicação linears T1(p(x)) = p ′ 

 

(x) (derivada primeira) e T2(p(x)) = 

x 

0 p(t)dt. O aplicação linear Ti, i = 1, 2, é injetor? É sobrejetor? Descrever 

ker (Ti) e Im(Ti) e relacionar os resultados com o item anterior. 

(24) Seja 

A · X = B 

um sistema de m equações lineares nas variaveis X = 

A = A | B ∈ Mm×n+1(K) 

a matriz associada ao sistema. Provar que: 

(a) rank (A) ≤ rank ( A) ≤ rank (A) + 1; 

(b) o sistema admite uma solução se e somente se B = 

⎛ 

⎜ 

⎝ 

⎛ 

⎜ 

⎝ 

x1 

. 

xn 

b1 

. 

bm 

⎞ 

⎟ 

⎠ ∈ Mn×1(K). Seja 

⎞ 

⎟ 

⎠ ∈ Im(TA) se e somente 

se rank (A) = rank ( A); 

(c) se existe uma solução, então as soluções do sistema podem ser parametrizadas por 

um subespaço linear de K n de dimensão n − rank (A) ≥ 0. 

(25) Seja A ∈ Mn×n(K). Se p(x) = a0 + a1x + . . . + arx r ∈ K[x], definimos 

p(A) = a0I + a1A + . . . + arA r ∈ Mn×n(K). 

Mostrar que existe um polinômio p(x) ∈ K[x] de grau menor ou igual a n 2 tal que 

p(A) = 0 Mn×n(K).

CAPíTULO 2 

A teoria dos fatores invariantes e dos divisores elementares 

2.1. Matrizes com elementos polinomiais 

Nesta seção estudaremos de perto matrizes cujos elementos são polinômios em uma indeterminada. 

Por conveniência e hábito, mudaremos a notação empregada anteriormente: o corpo de 

base será designado por k (minúsculo) e a indeterminada, por X (maiúsculo). A teoria a seguir 

é, de fato, uma sub-teoria da teoria das matrizes com elementos no corpo de frações racionais 

K = k(X), de modo que, em última instânica, estamos novamente no contexto da parte anterior 

e tudo que foi visto lá se aplica em principio ao corpo k(X). Contudo, para bem explorar as 

propriedades de tipo aritmético, é importante trabalhar com polinômios e não com frações . 

A teoria requer algum investimento preliminar mas as aplicações às matrizes com elementos 

no corpo das constantes k compensarão o esforço. 

O conjunto das matrizes retangulares m×n com elementos em k[X] será denotado Mm×n(k[X]). 

Esse conjunto é naturalmente um k[X]-módulo. Se m = n, podemos multiplicar tais matrizes e 

intruduzir em Mn×n(k[X]) uma estrutura de anel não comutativo com unidade, dito o anél das 

matrizes sobre k[X]. Eis alguns exemplos de matrizes com elementos em C[X]. 

A = 

⎛ 

⎜ 

⎝ 

X − 1 0 0 −1 

3 X − 2 −2 0 

0 4 X + 7 0 

1 0 5 2X 

⎞ 

⎛ 

⎟ 

⎠ , B = ⎝ 

X 3 − 4 2X − 1 

X 2 + √ 3iX X 6 

3X 7 X 

Note que A se parece muito a uma matriz da forma XI −A, com A ∈ M4×4(k). A matriz abaixo 

não é polinomial para qualquer corpo de contantes k pois 1 

X ∈ k[X]. 

⎛ ⎞ 

C = ⎝ 

0 0 0 

0 0 0 

0 0 1 

X 

Passaremos a denotar matrizes polinomiais por A(X), B(X), etc. A notação indica que 

estamos considerando tais matrizes e não apenas matrizes com elementos em k. O mote deste 

parágrafo é a dupla identidade de um objeto de Mm×n(k[X]) como uma matriz com elementos 

polinomiais ou como um polinômio a coeficientes matriciais. Um exemplo permite esclarecer 

este ponto: 

X − 1 2 X 2 + 1 

X 3 − X X 3 + 2X 2 1 

 

= 

+ 

⎠ 

⎞ 

⎠ 

 

0 0 0 

X 

1 1 0 

3 

0 0 1 

+ 

X 

0 2 0 

2 

 

1 0 0 −1 2 1 

X + 

−1 0 0 

0 0 1 

Esta identificação é válida para matrizes retangulares em geral. Além disso, no caso de 

matrizes quadradas, esta identificação pode ser traduzida em termos de um isomorfismo natural: 

17

18 2. Mn×n(k[X]) E FATORES INVARIANTES 

2.1.1. Proposição. Existe um isomorfismo natural de anéis 

Mn×n(k[X]) (Mn×n(k))[X], 

cuja restrição ao subanél Mn×n(k) é a identidade. 

Demonstração. Dada A(X) ∈ Mn×n(k[X]), digamos 

⎛ 

f11(X) 

⎜ 

A(X) = ⎝ . 

. . . 

⎞ 

f1n(X) 

⎟ 

. ⎠ , 

fn1(X) . . . fnn(X) 

onde fij(X) = 

l α(l) 

ij Xl ∈ k[X], à mesma associamos o polinômio 

PA(X) := 

AlX l 

com coeficientes matriciais, onde 

Al = 

⎛ 

⎜ 

⎝ 

l 

α (l) 

11 . . . α (l) 

1n 

. 

α (l) 

n1 . . . α (l) 

nn 

Esta associação fornece uma aplicação µ : Mm×n(k[X]) → (Mm×n(k))[X], cuja restrição ao 

subanél Mm×n(k) é claramente a identidade. Esta aplicação por outro lado, obviamente admite 

uma inversa. Por comodidade, denotaremos abreviadamente 

 

 

A(X) = 

, PA(X) = 

l 

α (l) 

ij Xl 

i,j 

. 

⎞ 

⎟ 

⎠ . 

l 

α (l) 

ij 

i,j Xl . 

Com esta notação , fica fácil verificar que µ é um homomorfismo, isto é, preserva soma e 

produto de matrizes. Com efeito, dadas 

 

 

 

 

A(X) = 

, B(X) = 

, 

com, respectivamente, 

e 

temos 

l 

α (l) 

ij Xl 

⎛ 

 

µ (A(X) + B(X)) = µ ⎝ 

i,j 

µ(A(X)) = PA(X) = 

µ(B(X)) = PB(X) = 

= 

l 

l 

α (l) 

ij 

(α (l) 

ij 

l 

l 

+ β(l) 

ij )Xl 

 

i,j Xl + 

= µ(A(X)) + µ(B(X)). 

l 

α (l) 

ij 

β (l) 

ij 

 

i,j 

β (l) 

ij 

 

 

l 

β (l) 

ij Xl 

i,j Xl 

i,j Xl , 

⎞ 

⎠ = 

 

i,j Xl 

l 

i,j 

 

α (l) 

ij 

 

+ β(l) 

ij 

i,j Xl

2.1. MATRIZES COM ELEMENTOS POLINOMIAIS 19 

Para o produto, as fórmulas ficam mais complicadas, mas a verificação 

principio. Observemos que 

segue o mesmo 

A(X) · B(X) = 

 

 

 

 

· 

 

Segue que 

= 

= 

= 

= 

 

l 

α (l) 

ij Xl 

i,j 

l 

β (l) 

ij Xl 

( 

α (l) 

i1 Xl )( 

β (l) 

1j Xl ) + · · · + ( 

α (l) 

in Xl )( 

l 

 

n 

 

( 

α (l) 

it Xl )( 

t=1 

t=1 

l 

l 

⎛ ⎛ 

n 

⎝ ⎝ 

( 

α (k) 

l 

0≤k≤l 

l 

0≤k≤l 

⎛ 

⎝ 

⎛ 

⎝ n 

( α (k) 

t=1 

l 

l 

β (l) 

tj Xl ) 

it β(l−k) 

tj 

it β(l−k) 

tj 

0≤k≤l 

i,j 

 

l 

i,j 

⎞⎞ 

)X (l) ⎠⎠ 

⎞⎞ 

)X (l) ⎠⎠ 

⎛⎛ 

µ (A(X) · B(X)) = µ ⎝⎝ 

 

⎛ 

⎝ n 

( α (k) 

t=1 

= 

⎛ 

⎝ n 

( α (k) 

= ( 

l 

l 

0≤k≤l 

α (l) 

ij 

t=1 

it β(l−k) 

tj 

 

i,j Xl )( 

= µ (A(X)) µ (B(X)) . 

l 

i,j 

i,j 

it β(l−k) 

tj 

β (l) 

ij 

⎞ 

) ⎠ X (l) 

 

l 

⎞⎞ 

)X (l) ⎠⎠ 

i,j Xl ) 

β (l) 

nj Xl ) 

2.1.2. Observação. A identificação entre matrizes polinomiais e polinômios matriciais, 

mesmo no caso retangular m × n, é a expressão dos seguintes fatos algébricos mais avançados: 

(1) O anél k[X] é N-graduado, isto é, tem-se k[X] = 

d≥0 k[X]d – soma direta de k-espaços 

vatoriais k[X]d de dimensão 1, onde k[X]d := k Xd = {αXd | α ∈ k} k. 

(2) Um k[X]-módulo livre de posto r é, analogamente a um k-espaço vetorial de dimensão 

r, uma soma direta k[X] r := k[X]⊕· · ·⊕k[X] (r somandos). Um tal módulo é também 

N-graduado, isto é, k[X] r = 

d≥0 k[X]r d , onde k[X]r d = k[X]d ⊕· · ·⊕k[X]d (soma direta 

de r k-espaços vatoriais k[X]d de dimensão 1). 

(3) Dada uma fatoração r = mn, temos k[X] r = k[X] mn = (k[X] m ) n , que pode ser visto 

na forma sugestiva 

k[X] ⊕ · · · ⊕k[X] 

k[X] ⊕ · · · ⊕k[X] 

. 

k[X] ⊕ · · · ⊕k[X] 

i,j 

⎞ 

⎠ 

 

i,j


(m somas diretas de n somandos cada). Reminiscente de uma matriz? De fato, isto 

fornece um isomorfismo de k[X]-módulos k[X] mn Mm×n(k[X]) em analogia com o 

caso de k-espaços vatoriais. 

(4) Usando a graduação introduzida acima, temos ainda 

k[X] mn = 

(k[X] mn )d = 

(k[X]d) mn = 

(k X d ) mn = 

d≥0 

d≥0 

d≥0 

= 

(k mn )X d (Mm×n(k))[X] 

d≥0 

como k[X]-módulos, onde na última passagem, identificamos kmn com Mm×n(k) como 

de hábito. 

(5) Finalmente, no caso em que m = n (isto é, r = n2 é um quadrado perfeito), resulta a 

bonificação de que isomorfimso acima preserva o produto de Mn×n(k[X]) (neste caso, 

este é de fato um anél, não só um k[X]-módulo!) 

Como primeira aplicação da identificação entre matrizes com elementos polinomiais e polinômios 

com coefficientes matrizes vamos fornecer uma outra demonstração do Teorema de Cayley- 

Hamilton, vide-se Teorema 1.1.2. 

2.1.3. Teorema. (Cayley-Hamilton) Seja A ∈ Mn×n(k). Então 

c A (A) = 0 Mn×n(K). 

Demonstração. Seja c A (X) = X n + pn−1X n−1 + · · · + p1X + p0, pi ∈ k. Dada XI − A, 

podemos construir a matriz adjunta ad(XI − A) cujas entradas são polinômios de grau no 

máximo n − 1. Portanto temos 

com Bi ∈ Mn×n(k). Lembramos que 

ad(XI − A) = B0 + B1X + · · · + Bn−1X n−1 , 

ad(XI − A) · (XI − A) = (XI − A) · ad(XI − A) = c A (X) · I = 

= p0 · I + · · · + (pn−1 · I)X n−1 + IX n . 

Da escritura de ad(XI − A) como polinômio matricial obtemos 

ad(XI − A) · (XI − A) = (B0 + B1X + · · · + Bn−1X n−1 ) · (XI − A) = 

= (−B0 · A) + (B0 − B1 · A)X + · · · + (Bn−2 − Bn−1 · A)X n−1 + Bn−1X n . 

Dois polinômios matriciais são iguais se e só se os coefficientes deles são iguais como matrizes 

em Mn×n(k). Segue que: 

−B0 · A = p0 · I, 

B0 − B1 · A = p1 · I, 

. 

Bn−2 − Bn−1 · A = pn−1 · I, 

Bn−1 = I. 

Multiplicando as ultimas n − 1 equações por potencias crescentes de A obtemos: 

−B0 · A = p0 · I, 

B0 · A − B1 · A 2 = p1 · A, 

. 

Bn−2 · A n−1 − Bn−1 · A n = pn−1 · A n−1 , 

Bn−1 · A n = A n .

2.1. MATRIZES COM ELEMENTOS POLINOMIAIS 21 

Somando as colunas verticais das equações obtemos 0 Mn×n(K) = c A (A). 

2.1.1. Divisão euclidiana de matrizes polinomiais. Uma vez de posse da identificação 

canônica Mn×n(k[X]) (Mn×n(k))[X], podemos perguntar se peculiaridades dos polinômios 

usuais passam aos polinômios matriciais (logo, também às matrizes polinomiais). Por exemplo, 

temos: 

2.1.4. Definição. (grau de um polinômio matricial e matriz polinomial propria) 

Dada A(X) ∈ Mn×n(k[X]) não nula, o grau gr(A(X)) desta matriz é o grau do polinômio 

matricial associado (este sendo o maior exponente r de X cujo coeficiente Ar é uma matriz não 

nula). 

Uma matriz A(X) ∈ Mn×n(k[X]) é dita própria se o coeficente dominante Ar do polinômio 

matricial associado é uma matriz invertivel sobre k (isto é, se det Ar = 0) 

Propriedades do grau usual sob adição e multiplicação de matrizes mantêm-se apenas 

parcialmente: 

2.1.5. Lema. Sejam A(X), B(X) ∈ Mn×n(k[X]) não nulas cuja soma e produto também 

sejam não nulas. Então: 

(i) gr(A(X) + B(X)) ≤ max{gr(A(X)), gr(B(X))} 

(ii) gr(A(X)B(X)) ≤ gr(A(X))+gr(B(X)); a igualdade dá-se se os coeficientes dominantes 

A e B dos polinômios matriciais associados satisfazem AB = 0. 

Resulta que a divisão euclidiana é um deles, desde que sob certas hipóteses. Como o coeficiente 

dominante de um polinômio usual f(X) ∈ k[X] é invertivel, precisamos uma hipótese que 

garanta isto no caso de uma matriz polinomial. Precisamente, temos 

2.1.6. Proposição. (Divisão euclidiana) Sejam A(X), B(X) ∈ Mn×n(k[X]), com B(X) 

própria. Então existem Q(X), R(X) ∈ Mn×n(k[X]), unicamente determinados por A(X) e 

B(X), satisfazendo as condições : 

(1) A(X) = Q(X)B(X) + R(X) 

(2) R(X) = 0 ou gr(R(X)) < gr(B(X)). 

Demonstração. A demonstração é praticamente a mesma do caso conhecido da divisão 

euclidiana para polinômios a coeficientes num corpo. Primeiramente, escrevemos as matrizes 

dadas em forma polinomial, digamos, A(X) = ArX r + · · · + A0, B(X) = BsX s + · · · + B0, onde 

Ar = 0 e det(Bs) = 0. 

Existência: Se r < s, fazemos Q(X) = 0 e R(X) = A(X). Suponhamos então que r ≥ s. 

Procedemos por indução sobre r, o caso em que r = 0 (isto é, A(X) = Ar) é absorvido pelo 

caso r < s, a menos que s = 0. Neste último caso, pomos Q(X) = ArB−1 e R(X) = 0 (este 

caso será um caso particular do caso geral abaixo). 

Suponhamos, assim, que r ≥ 1 e consideremos o polinômio A(X) − ArB −1 

s X r−s B(X), que 

tem grau no máximo r−1. Denotemos este polinômio por A1(X). Pela hipótese indutiva, existem 

Q1(X) e R1(X) tais que A1(X) = Q1(X)B(X) + R1(X), com R1(X) = 0 ou gr(R1(X)) < 

gr(B(X)). Tomando Q(X) := Q1(X) + ArB −1 

s X r−s e R1(X) = R(X), encontramos o quociente 

e o resto desejados. 

Unicidade: Suponhamos que 

A(X) = Q(X)B(X) + R(X) = Q ′ (X)B(X) + R ′ (X). 

Então (Q(X) − Q ′ (X))B(X) = R ′ (X) − R(X). Pelo Lema 2.1.5 (i), o grau do membro direito 

é no máximo igual a s − 1 = gr(B(X)) − 1. No membro esquerdo, temos um fator que é matriz 

s


própria. Seu coeficiente dominante é uma matriz invertivel, portanto não anula qualquer matriz 

não nula. Se Q(X) − Q ′ (X) = 0, segue do Lema 2.1.5 (ii) que o grau do membro esquerdo é 

no minimo s; absurdo. Logo, necessariamente, Q(X) = Q ′ (X). Consequentemente, também 

R ′ (X) = R(X). 

2.1.7. Observação. A rigor, o que acabamos de demonstrar foi divisão euclidiana á direita 

(isto é, aquela em que o quociente é multiplicador à esquerda). Deixamos como exercicio de 

rotina verificar a existência e unicidade de uma divisão á esquerda. Em geral, o quociente(resp. 

o resto) á direita é distinto do quociente(resp. o resto) á esquerda. No que segue, fixaremos a 

divisão sistematicamente á direita. 

2.1.2. Polinômios matriciais e resto da divisão. Analogamente aos homomorfismos 

de substituição (ou de avaliação ) já conhecidos (por exemplo, k[X] → k, f(X) ↦→ f(α) ou 

k[X] → Mn×n(k), f(X) ↦→ f(A)), podemos definir o valor de um polinômio matricial P (X) ∈ 

Mn×n(k[X]) numa matriz A ∈ Mn×n(k), através da aplicação 

P (X) = PrX r + Pr−1X r−1 + · · · + P0 ↦→ PD(A) = PrA r + Pr−1A r−1 + · · · + P0. 

Como no processo de divisão euclidiana, chamamos aqui também a atenção ao fato de que esta 

aplicação de substituição admite uma versão à esquerda 

P (X) = PrX r + Pr−1X r−1 + · · · + P0 ↦→ PE(A) = A r Pr + A r−1 Pr−1 + · · · + P0 

e que, em geral os resultados das substituições dão matrizes distintas. 

Mais grave é o fato de que, ao contrário dos processos de substituição anteriores, o presente 

não é um homomorfismo de anéis. É fácil ver que preserva a soma de matrizes e o produto por 

um polinômio, mas não o produto de matrizes em geral. 

2.1.8. Exercicio. Dar exemplo de substituições cujos valores á direita e á esquerda são 

distintos. Dar igualmente exemplo de que a substituição nào preserva o produto de matrizes. 

(Sugestão: probabilisticamente, qualquer exemplo deve funcionar!) 

Apesar da falência da substituição em preservar o produto de matrizes, o seguinte resultado 

básico é válido e, conforme veremos em seguida, extremamente útil. É uma generalização natural 

do fato que se f(X) ∈ k[X] e se f(X) = g(X) · (X − α) + r, então r = f(α). 

2.1.9. Proposição. (Teorema do Resto) Dada A ∈ Mn×n(k), o resto da divisão à direita 

(resp. à esquerda) de um polinômio matricial P (X) ∈ Mn×n(k[X]) pela matriz característica 

XI − A é o valor PD(A) (resp. PE(A)). 

Demonstração. Seja P (X) = PrX r + Pr−1X r−1 + · · · + P0. Então é fácil verificar que 

para cada k = 0, 1, . . . , r, 

X j I − A j = (X j−1 I + X j−2 A + · · · + XA j−2 + A j−1 ) · (XI − A) 

= Qj(X) · (XI − A). 

Moltiplicando ambos os membros da equação anterior a esquerda por Pj e somando de 0 até r 

temos 

r 

P (X) − PD(A) = Pk · (X j I − A j r 

) = ( Pj · Qj(X)) · (XI − A) 

j=0 

= Q(X) · (XI − A), 

de onde segue a proposição pela unicidade do quociente e do resto da divisão a direita (resp. 

a esquerda). Da mesma forma se prova a parte relativa a divisão a esquerda por XI − A. 

j=0

2.2. ESCALONAMENTO DE MATRIZES COM ELEMENTOS POLINOMIAIS 23 

2.1.10. Proposição. Seja A ∈ Mn×n(k) e sejam m A (X) e c A (X) os polinômios minimo e 

carateristico de A. Então c A (X) divide m A (X) n . Em particular m A (X) e c A (X) têm os mesmos 

fatores irredutiveis mônicos. 

Demonstração. Sabemos que m A (X) divide c A (X) pelo Teorema de Cayley-Hamilton 

e portanto os fatores irredutiveis mônicos de m A (X) dividem c A (X). O Teorema da divisão 

garante a existencia de R(X) ∈ Mn×n(k[X]) tal que 

m A (X) · I = R(X) · (XI − A). 

Tomando os determinantes a esquerda e a direita obtemos 

(m A (X)) n = det(R(X)) · c A (X). 

2.2. Escalonamento de matrizes com elementos polinomiais 

Primeiramente, estabeleceremos resultados análogos aos de eliminação gaussiana sobre k. 

Todas as operações a ser efetuadas deverão preservar o caráter polinomial dos resultados (isto é, 

sem criar frações com denominadores polinomiais não constantes). Guiados por este principio, 

retomamos as operações elementares, desta vez em Mm×n(k[X]). 

Abaixo, damos a forma da matriz elementar correspondente a cada uma das operações 

elementares acima. 

(1) Transposição de linhas (colunas) i e j: 

⎛ 

1 

⎜ 

Mi,j = ⎜ 

⎝ 

. .. 

1 

0 · · · 1 

1 

. .. 

1 

1 · · · 0 

onde (Mi,j)kk = (Mi,j)ij = (Mi,j)ji = 1, se k = i, j; (Mi,j)kl = 0, em caso contrário 

(Mantemos a convenção de que os espaços vazios são ocupados por zeros). Mais 

geralmente, o resultado de efetuar uma permutação das linhas (colunas) de uma matriz 

corresponde a uma matriz com 0 e 1, sendo que cada 0 figura em exatamente uma linha 

e uma coluna (estas matrizes são chamadas de matrizes de permutação ). 

1 

. .. 

1 

⎞ 

⎟ 

⎠


(2) Multiplicação de uma linha (coluna) i por uma constante α ∈ k, α = 0: 

⎛ 

1 

⎞ 

⎜ 

Mα i = ⎜ 

⎝ 

. .. 

1 

α 

1 

. .. 

⎟ 

⎠ 

com (Mα i)ii = α. 

(3) Soma de uma linha (coluna) j com uma linha i multiplicada por um polinômio p(X) ∈ 

k[X]: 

⎛ 

1 

⎞ 

⎜ 

Mp i+j = ⎜ 

⎝ 

. .. 

1 

. 

p(X) 

. .. 

· · · 1 

. .. 

⎟ 

⎠ 

com (Mp i+j)ji = p(X). 

2.2.1. Observação. Comparando com as definições do primeiro curso de álgebra linear, vemos 

que (1) é a mesma; (3) contempla a possibilidade de multiplicar uma linha por um polinômio 

(não só uma constante) antes de somá-la a outra. Finalmente, (2) só permite multiplicação por 

elementos não-nulos do corpo k. A razão do desequilíbrio aparente entre as operações de tipo 

(2) e (3) é devido à necessidade das operações serem reversiveis (isto é, corresponderem a 

multiplicações por matrizes quadradas que admitam inversas com elementos polinomiais). 

2.2.2. Exemplo. Considere as seguintes matrizes sobre Q[X]: 

 

X 

1 

 

0 

, 

X − 1 

 

1 

0 

2X 

3 

 

A primeira não admite inversa sobre Q[X] (embora a admita sobre Q(X), o que é um fácil 

exercicio). A segunda admite inversa sobre Q[X]. É claro, por outro lado, que toda matriz A 

sobre k[X], cujos elementos pertencem todos a k e tal que det A = 0, admite inversa sobre k, 

logo sobre k[X] por maior razão. 

Observemos que a noção do determinante de uma matriz quadrada A sobre k[X] não precisa 

ser reintroduzido: definimo-lo como sendo o determinante de A, esta considerada como matriz 

sobre k(X) (que é um corpo, em cujo caso já sabemos a definição ). É bastante evidente que, 

se A é matriz quadrada sobre k[X], então det A ∈ k[X]. pelo mesmo principio, a definição de 

posto de uma matriz retangular sobre k[X] não precisa ser repetida. 

A proposição a seguir diz exatamente quais matrizes quadradas sobre k[X] admitem inversa 

sobre k[X]. 

2.2.3. Proposição. Seja k um corpo arbitrário. Uma matriz quadrada A sobre k[X] admite 

inversa sobre k[X] se e somente se det A ∈ k \ {0}. 

1 

1

2.2. ESCALONAMENTO DE MATRIZES COM ELEMENTOS POLINOMIAIS 25 

Demonstração. Pela conhecida relação , temos A ad(A) = (det A)I, onde ad(A) é a matriz 

dos cofatores de A. Em particular, pela definição mesma dos cofatores, ad(A) é matriz sobre 

k[X]. Trabalhando sobre k(X), a inversa é dada por A −1 = (det A) −1 ad(A). Se det A ∈ k, 

segue que os elementos de A −1 são polinômios. Inversamente, se A admite inversa A −1 sobre 

k[X], então det A det(A −1 ) = 1 é o produto de dois polinômios que dá como resultado 1. Logo, 

det A admite inverso multiplicativo em k[X] e, portanto, tem de pertencer a k \ {0}. 

Como no caso de escalonamento sobre um corpo K, diremos que uma matriz B ∈ Mm×n(k[X]) 

é elementarmente equivalente a uma matriz A ∈ Mm×n(k[X]) se B = AE ou B = F A, onde 

E e F são matrizes elementares (isto é, correspondem a operações elementares por linha 

ou coluna, sobre k[X]). Dizemos que B é equivalente a A se existirem matrizes elementares 

E1, . . . , Er, F1, . . . , Fs tais que B = E1 · · · ErAF1 · · · Fs. Usaremos, neste caso, a notação 

B ∼ A. 

Como antes, trata-se de uma relação de equivalência no conjunto Mm×n(k[X]). Ainda como 

antes, nossa tarefa será exibir uma forma canônica para cada classe de equivalência. 

Para familiarizar-nos com o teorema de escalonamento em Mm×n(k[X]), convem tratar primeiro 

alguns exemplos simples, onde possamos reconhecer o padrão geral. 

2.2.4. Exemplo. Consideremos a matriz 

X X + 1 

X + 2 X + 4 

 

∈ M2×2(Q[X]) 

Deixaremos ao aluno o prazer de determinar explicitamente as operações elementares usadas 

em cada uma das passagens abaixo. 

 

X 

X + 2 

 

X + 1 

X + 4 

∼ 

 

X 

X + 2 

 

1 X 

∼ 

2 2 

 

1 1 

∼ 

1 1 

X 

2 

 

∼ 

 

1 

1 

 

0 

1 

∼ 

−X + 2 0 

 

0 

−X + 2 

Fácil demais? Porque os polinômios são todos de grau 1? Porque a matriz é quadrada? Nos 

dois próximos exemplos, transgredimos estas condições . 

2.2.5. Exemplo. Uma matriz com elementos polinomiais de graus diferentes: 

 

X2 X − 1 

X + 1 

X2 

∼ 

 

X + 1 

X 

X2 2 

X + 1 

∼ 

X − 1 X 

−X 

2 −X3 

+ X − 1 

∼ 

 

X + 1 1 

X2 −X3 + X2 ∼ 

 

+ X − 1 

 

1 X + 1 

−X3 + X2 + X − 1 X2 ∼ 

 

 

1 0 

−X3 + X2 + X − 1 X4 ∼ 

 

− (X + 1)(X − 1) 

 

1 0 

0 X4 

− (X + 1)(X − 1)


2.2.6. Exemplo. Uma matriz 2 × 3 com elementos polinomiais, de posto 1: 

 

X X2 X3 X2 X3 X4 

X 0 X3 ∼ 

X2 0 X4 

X 0 0 

∼ 

X2 

0 0 

∼ 

 

X 

0 

0 

0 

 

0 

0 

2.2.7. Exemplo. A matriz característica de uma matriz A ∈ M2(k): 

 

X − a11 −a12 

XI − A = 

−a21 X − a22 

Suponhamos, primeiramente, que A não é diagonal; digamos, a12 = 0. Então tem-se: 

XI − A ∼ 

∼ 

 

1 X − a11 

−a −1 

21 (X − a22) 

 

 

1 X − a11 

∼ 

−a21 X − a22 a12a21 

 

 

1 0 

1 0 

∼ 

X − a22 −(X − a11)(X − a22) + a12a21 0 cA(X) 

onde cA(X) é o polinômio característico de A. 

Suponhamos, em seguida, que A seja diagonal, isto é, a12 = a21 = 0. Se a11 = a22, temos: 

 

X − a11 0 

X − a11 −X + a11 

XI − A = 

∼ 

0 X − a22 

0 (X − a22) 

 

X − a11 a11 − a22 

1 0 

∼ 

∼ 

0 (X − a22) (a11 − a22) −1 

(X − a22) 0 

 

1 0 

∼ 

, 

0 cA(X) 

ainda da mesma forma anterior. 

Finalmente, se A é escalar (isto é, a12 = a21 = 0, a11 = a22 := a, então a forma canônica 

será a própria matriz característica. 

2.3. Forma canônica de Smith 

Estamos preparados para os principais resultados desta parte. 

2.3.1. Teorema. (Forma canônica de Smith) Toda matriz A ∈ Mm×n(k[X]) é equivalente 

a uma matriz m × n semi-diagonal sobre k[X] da forma 

⎛ 

f1(X) 0 · · · 

⎞ 

0 

(2.3.1) 

⎜ 

SA = ⎜ 

⎝ 

0 

. 

f2(X) 

0 

. 

. .. 

· · · 

fr(X) 

0 

. 

0 

. 

0 

0 

. 

· · · 

· · · 

· · · 

0 ⎟ 

. ⎟ 

0 ⎟ , 

⎟ 

0 ⎟ 

. 

⎠ 

0 0 · · · 0 0 · · · 0 

onde r é o posto de A e, para todo 1 ≤ j ≤ r, fj(X) ∈ k[X] é polinômio mônico que divide 

fj+1(X) (com a convenção de que fr+1 = 0). 

 

,

2.3. FORMA CANÔNICA DE SMITH 27 

Demonstração. Podemos supor que A não é a matriz nula. Procedemos por indução 

sobre m. No conjunto de todas as matrizes equivalentes a A escolhamos uma que admite como 

elemento na posição (1, 1) um polinômio mônico de menor grau possivel; denotemos um tal 

polinômio por g(X). Dividindo todo elemento da primeira linha de A por g(X), obtemos uma 

matriz m × n da forma 

g(X) 

. 

r12(X) 

. 

. . . 

 

r1n(X) 

, 

. 

onde r1j(X) são os respectivos restos das divisões. Em particular, gr(r1j(X)) < gr(g(X)), para 

todo j. Esta matriz foi obtida de A por (m − 1) transformações elementares, logo é equivalente 

a A. Por hipótese, segue necessariamente que r1j(X) = 0 para todo j. Procedendo similarmente 

com a primeira coluna desta matriz, obtemos 

⎛ 

⎜ 

A ∼ ⎜ 

⎝ 

g(X) 0 . . . 0 

0 

. A1 

0 

onde A1 é matriz m − 1 × n − 1 polinomial. Pela hipótese indutiva, esta matriz é equivalente a 

uma matriz 

SA1 = 

⎛ 

f2(X) 0 · · · 

⎞ 

0 

(2.3.2) 

⎜ 

⎝ 

0 

. 

f3(X) 

0 

. 

. .. 

· · · 

fr(X) 

0 

. 

0 

. 

0 

0 

. 

· · · 

· · · 

· · · 

0 ⎟ 

. ⎟ 

0 ⎟ , 

⎟ 

0 ⎟ 

. 

⎠ 

0 0 · · · 0 0 · · · 0 

onde r − 1 é o posto de A1 e os polinômios se comportam conforme o enunciado do teorema. 

Consequentemente, aplicando à matriz dada A operações elementares da forma 

⎛ 

⎞ 

1 0 . . . 0 

⎜ 0 

⎟ 

⎜ 

⎟ 

⎝ . P1 ⎠ 

0 

, 

onde P1 é matriz m − 1 × n − 1 elementar usada para passar de A1 a SA1 , chegamos a que A é 

equivalente a 

⎛ 

f1(X) 0 0 0 0 0 0 

⎞ 

0 

⎜ 

SA = ⎜ 

⎝ 

0 

0 

. 

0 

0 

. 

f2(X) 

0 

. 

f3(X) 

0 

. 

. .. 

· · · 

fr(X) 

0 

. 

0 

0 

. 

0 

0 

. 

· · · 

· · · 

· · · 

· · · 

0 ⎟ 

0 ⎟ 

. ⎟ 

0 ⎟ . 

⎟ 

0 ⎟ 

. 

⎠ 

0 0 0 · · · 0 0 · · · 0 

⎞ 

⎟ 

⎠ ,


Ponhamos f1(X) := g(X). Resta mostrar que g(X)|f2(X). Ora, a matriz acima é ainda 

equivalente à matriz que se obtem ao somar a primeira linha multiplicada por g(X) á segunda 

linha. Tornando a dividir f2(X) por g(X), como no inicio, obtemos uma matriz equivalente 

com um elemento (o resto desta divisão) com grau menor do que o de g(X). Novamente, somos 

obrigados a concluir que g(X) divide f2(X), como queriamos demosntrar. 

2.3.2. Teorema. (Unicidade da forma canônica de Smith) A forma (2.3.1) é unicamente 

determinada pela matriz dada A. Mais precisamente, para todo 2 ≤ j ≤ r, fj(X) = 

dj(X) 

dj−1(X) , onde dj(X) é o mdc (mônico) de todos os subdeterminantes de ordem j de A. 

Demonstração. Fixemos um j, 1 ≤ j ≤ r, com r = p(A). Se B é elementarmente equivalente 

a A, então, devido às possiveis formas das matrizes elementares, vemos que todo menor de 

ordem j de B é um menor de ordem j de A multiplicado por um α ∈ k \ 0 ou uma combinação 

da forma ∆ + p(X)∆ ′ , onde p(X) ∈ k[X] e ∆, ∆ ′ são menores de ordem j de A. 

Daqui resulta, pela definição , que o mdc (mônico) de todos os menores de ordem j de B 

é igual ao mdc (mônico) dj de todos os menores de ordem j de A. Iterando este processo, 

deduzimos que o mdc (mônico) de todos os menores de ordem j da matriz de Smith SA é igual 

a dj. 

Ora, como fl|fl+1, para 1 ≤ l ≤ r − 1, resulta facilmente que o mdc (mônico) de todos os 

menores de ordem j da matriz de Smith é o produto f1 · · · fj. Logo, dj = f1 · · · fj. Daqui resulta 

o enunciado procurado. 

2.3.3. Definição. (Fatores invariantes de uma matriz polinomial) Os polinômios 

mônicos fj(X) da forma de Smith são chamados os fatores invariantes da matriz A ∈ Mn×n(k[X]). 

2.3.4. Corolário. Sejam A, B ∈ Mm×n(k[X]). Então A é equivalente a B se e só se têm 

os mesmos fatores invariantes. 

2.3.5. Teorema. (Caracterização do polinômio minimo) Seja A ∈ Mn×n(k). Sejam 

f1(X), . . . , fn(X) ∈ k[X] os fatores invariantes da matriz carateristica de A, XI − A. Então a 

matriz característica XI − A tem posto n e, além disso, tem-se: 

c A (X) = f1(X) · · · fn(X), m A (X) = fn(X). 

Demonstração. A afirmação relativa ao posto e ao polinômio característico é óbvia. De 

fato por definição temos 

XI − A = E · SA(X) · E ′ , 

com E, E ′ são produto de matrizes elementares em Mn×n(k[X]). Tomando os determinantes, 

deduzimos 

c A (X) = det(E) · det(E ′ ) · f1(X) · · · fn(X). 

Sendo cA (X) mônico e sendo os fi(X) mônicos, temos det(E) · det(E ′ ) = 1. 

Seja dn−1(X) o m.c.d. mônico dos menores de ordem n − 1 de XI − A. Sabemos que 

fn(X) = det(XI−A) 

dn−1(X) . Por definição de matriz adjunta, temos que o m.c.d. mônico dos elementos 

da matriz ad(XI − A) é exatamente dn−1(X). Portanto 

ad(XI − A) = dn−1(X) · P (X),

2.3. FORMA CANÔNICA DE SMITH 29 

com P (X) ∈ Mn×n(k[X]) matriz com elementos polinômios relativamente primos entre si. De 

ad(XI − A) · (XI − A) = det(XI − A) · I obtemos 

e portanto 

dn−1(X) · P (X) · (XI − A) = dn−1(X) · fn(X) · I 

P (X) · (XI − A) = fn(X) · I. 

Pelo teorema do resto podemos interpretar a relação anterior como que o resto da divisão a 

direita de fn(X) · I por XI − A é nulo, i.e. fn(A) = 0. Isso implica que m A (X) divide fn(X), 

i.e. 

fn(X) = h(X) · m A (X). 

Para concluir é suficiente mostrar que h(X) tem grau zero porque os dois polinômios fn(X) e 

m A (X) são mônicos. Dividindo m A (X)·I a direita por XI −A e sendo m A (A) = 0 por definição, 

o teorema da divisão garante a existencia de R(X) ∈ Mn×n(k[X]) tal que 

Combinando as relações anteriores obtemos 

m A (X) · I = R(X) · (XI − A). 

P (X) · (XI − A) = h(X) · m A (X) · I = h(X) · R(X) · (XI − A), 

que, sendo XI − A de posto n, implica 

P (X) = h(X) · R(X). 

Então h(X) ∈ k porque, por construção, os elementos de P (X) eram relativamente primos entre 

si. 

2.3.6. Observação. Assim, o polinômio característico de A é o produto de todos os fatores 

invariantes de XI − A e o polinômio minimo de A é o fator característico de maior grau de 

A. Para calcular m A (X) podemos determinar a forma normal de Smith ou, mais diretamente, 

calcular o mdc dos subseterminantes submáximos da matriz característica de A. Qual método é 

mais eficiente? A resposta depende de várias circunstâncias, mas, em geral, para valores grandes 

de n, a forma normal de Smith é preferivel. 

2.3.7. Observação. Sejam k e k ′ dois corpos com k ⊆ k ′ (e.g. R ⊆ C) e seja A ∈ Mn×n(k). 

A priori pensando A como elemento de Mn×n(k ′ ) teremos a noção de polinômio minimo de A 

com coeficientes em k ′ , i.e. o polinômio mônico de menor grau de k ′ [X] que se anula sobre 

A e não é claro que esse polinômio coincida com o polinômio minimo de A em k[X]. Quanto 

acabamos de mostrar revela que o polinômio minimo de A não depende do corpo. Isso porque se 

A ∈ Mn×n(k) ⊂ Mn×n(k ′ ), então o n-esimo fator invariante de XI − A pertence sempre a k[X]. 

Que depende do corpo é a fatorização do polinômio minimo e portanto a ”forma canônica”. Por 

exemplo considerando 

A = 

0 −1 

1 0 

como matriz com coeficentes reais, temos que m A (X) = X 2 + 1 e que A é in forma canonica 

racional como matriz real. Em M2×2(C), o polinômio minimo de A se fatora em m A (X) = 

(X − i)(X + i) e a forma canônica racional como matriz complexa de A é 

i 0 

0 −i 

 

.


2.4. Equivalencia em Mn×n(k[X]) e semelhnanca em Mn×n(k) 

2.4.1. Teorema. Sejam A(X), B(X) ∈ Mn×n(k[X]) com B(X) propria e A(X) e B(X) de 

grau um. Então A(X) é equivalente a B(X) se e só se existirem P, Q ∈ Mn×n(k) inversiveis 

tais que B(X) = P · A(X) · Q. 

Demonstração. Se B(X) = P · A(X) · Q, então claramente A(X) é equivalente a B(X) 

(lembramos que cada matriz in Mn×n(k) invertivel é produto de matrizes elementares!). 

Ao contrario se A(X) e B(X) são equivalentes, existem P (X), Q(X) ∈ Mn×n(k[X]) produtos 

de matrizes elementares tais que 

(2.4.1) 

B(X) = P (X) · A(X) · Q(X). 

Sendo B(X) propria pudemos dividir a esquerda a matriz P (X) por B(X) e a matriz Q(X) a 

direita obtendo 

(2.4.2) 

(2.4.3) 

P (X) = B(X) · P1(X) + P, 

Q(X) = Q1(X) · B(X) + Q, 

onde sendo B(X) de grau um, temos P, Q ∈ Mn×n(k). Combinando (2.4.2) e (2.4.1), obtemos 

(2.4.4) 

P · A(X) · Q1(X) = B(X) · D1(X), 

com D1(X) = (Q(X) −1 − P1(X)) · Q1(X). Seja 

P1(X) · A(X) · Q(X) = D2(X) · B(X), 

onde D2(X) = P1(X) · P (X) −1 . 

No resto da demostração vamos provar que essas matrizes P e Q têm a propriedade querida, 

i.e. que B(X) = P ·A(X)·Q. Por isso vamos substuir na primeira equação de cima as expressões 

obtidas nas equações anteriores. Então 

B(X) = (P + B(X)P1(X)) · A(X) · Q(X) 

= P · A(X) · Q(X) + B(X) · D2(X) · B(X) 

= P · A(X) · Q + P · A(X) · Q1(X) · B(X) + B(X) · D2(X) · B(X) 

= P · A(X) · Q + B(X) · D(X) · B(X), 

onde D(X) = D1(X) + D2(X). Para concluir é bastante mostrar que D(X) = 0. De 

B(X) − P · A(X) · Q = B(X) · D(X) · B(X), 

sendo que A(X) e B(X) têm grau um, segue que B(X)D(X)B(X) tem grau no máximo um. Se 

D(X) = 0, então , sendo B(X) uma matriz propria, B(X) · D(X) · B(X) teria grau pelo menos 

dois que seria impossivel. Obtemos que D(X) = 0 e que B(X) = P · A(X) · Q como desejado. 

Mostamos agora que P e Q são inversiveis. Se B(X) = B1X + B0 e se A(X) = A1X + A0, 

obtemos 

B1X + B0 = P · (A1X + A0) · Q = (P · A1 · Q)X + P · A0 · Q, 

i.e. B1 = P · A1 · Q e a afirmação segue do feito que B1 é invertivel (por que?). 

O proximo teorema é de importancia fundamental e vai permitir de dezurir muitos resultados 

da teoria dos fatores invariantes e da forma canônica de Smith da matriz característica XI − A, 

A ∈ Mn×n(k). 

2.4.2. Teorema. Duas matrizes A, B ∈ Mn×n(k) são semelhantes se e só se XI − A é 

equivalente a XI − B em Mn×n(k[X]).

2.5. FORMA CANÔNICA RACIONAL 31 

Demonstração. Se A é semelhante a B, então existe P ∈ Mn×n(k) invertivel tal que 

P · B · P −1 = A. Facilmente obtemos P (XI − B)P −1 = XI − A e a conclusão segue do feito 

que uma matriz invertivel em Mn×n(k) é produto de matrizes elementares. Portanto XI − B é 

equivalente a XI − A. 

Se XI − A é equivalente a XI − B pelo teorema 2.4.1, existem P, Q ∈ Mn×n(k) tais que 

XI − B = P · (XI − A) · Q. Eseguindo a multiplicação obtemos P · Q = I, i.e. Q = P −1 e 

B = P · A · P −1 , i.e. A e B são semelhantes. 

2.4.3. Corolário. Sejam k um subcorpo do corpo k ′ e sejam A, B ∈ Mn×n(k). Então A e 

B são semelhantes em Mn×n(k) se e só se são semelhantes em Mn×n(k ′ ). 

Demonstração. Sendo Mn×n(k) ⊆ Mn×n(k ′ ), é claro que se A e B são semelhantes em 

Mn×n(k), então são semelhantes em Mn×n(k ′ ). 

Se A e B são semelhantes em Mn×n(k ′ ), entao pelo teorema anterior XI − A e XI − B são 

equivalentes em Mn×n(k ′ [X]) e portanto tem os mesmos fatores invariantes em k ′ [X]. Mas os 

fatores invariantes de XI − A e XI − B são polinômios em k[X] e portanto as matrizes XI − A 

e XI − B são equivalentes em Mn×n(k[X]) pelo corollario 2.3.4 tendo a mesma forma canônica 

de Smith. Aplicando mais uma vez o teorema 2.4.2 deduzimos que A e B são semelhantes em 

Mn×n(k). 

2.4.4. Observação. Não é verdade que se A = P ′ · B · P ′−1 com P ′ ∈ Mn×n(k ′ ), então 

P ′ ∈ Mn×n(k). O corolario anterior garante só a existência de uma matriz P ∈ Mn×n(k) tal 

que A = P · B · P −1 . 

2.5. Forma canônica racional 

O Teorema 2.4.2 permite de deduzir os teoremas da forma canônica racional da teoria dos 

fatores invariantes e até de fornecer uma demosntração diferente do Teorema de Decomposição 

Primaria, Teorema 1.5.1. Vamos tratar primeiro o caso das matrizes companheiras. 

2.5.1. Definição. (Matriz companheira de um polinômio monico g(X) = Xm − 

αm−1X m−1 − . . . − α1X − α0 de grau m). A matriz m × m 

⎛ 

0 0 0 . . . α0 

⎜ 1 0 0 . . . α1 

⎜ 

C(g(X)) = ⎜ 0 1 0 . . . α2 

⎜ 

⎝ 

. 

. . . .. . 

⎞ 

⎟ . 

⎟ 

⎠ 

0 0 0 1 αm−1 

se diz a matriz companheira de g(X) e se indica com C(g(X)). 

2.5.2. Proposição. Seja f(X) ∈ k[X] um polinômio mônico de grau n ≥ 1e seja C(f(X)) ∈ 

Mn×n(K) a matriz companheira de f(X). Então XI − C(f(X)) é equivalente a 

⎛ 

⎞ 

1 0 0 0 0 0 

⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 

. 

1 0 

1 

0 

0 

. .. 

· · · 

· · · 

. 

. .. 

0 

0 

. 

. 

⎟ ∈ Mn×n(k[X]). 

⎟ 

⎠ 

0 f(X)


Demonstração. É facil verificar (verifique!) que para uma matriz da forma C(f(X)) 

temos mC(f(X)) (X) = cC(f(X)) (X) = f(X), cfr. Lema 2.8.2. Portanto os fatores invariantes de 

XI − C(f(X)) são tais que 

f1(X) · · · fn(X) = c C(f(X)) (X) = f(X) = m C(f(X)) (X) = fn(X). 

Segue que f1(X) = · · · = fn−1(X) = 1 e fn(X) = f(X). A forma canônica de Smith de 

XI − C(f(X)) é esatamente como acima. 

2.5.3. Teorema. (Forma canônica racional-primeira versão ) Cada matriz A ∈ Mn×n(k) 

é semelhante a uma unica matriz da forma 

⎛ 

C(fl(X)) 0 

⎜ 0 C(fl+1(X)) 

⎜ 

⎝ . 

0 0 

· · · 

. .. 

0 

0 

. 

⎞ 

⎟ 

⎠ 

0 C(fn(X)) 

, 

onde os fj(X), j = l, . . . , n, 1 ≤ l ≤ n, são polinômios mônicos não costantes com a 

propriedade que fi(X) divide fi+1(X) para cada i = l, . . . , n − 1. Os polinômios fj(X) são os 

fatores invariantes não constantes de XI − A. 

Demonstração. Seja ⎛ 

⎜ 

⎝ 

1 0 0 0 0 0 

0 1 0 0 · · · 0 

0 

. 

fl(X) 

. .. 

0 · · · 

. 

0 

. 

0 fn(X) 

a forma canônica de Smith de XI − A, i.e. os fj(X) são os fatores invariantes não constantes 

de XI − A. Seja 

⎛ 

C(fl(X)) 

⎜ 0 

C = ⎜ 

⎝ . 

0 

C(fl+1(X)) 

0 

. .. 

0 

· · · 

0 

0 

. 

⎞ 

⎟ 

⎠ 

0 C(fn(X)) 

. 

Observamos que C ∈ Mn×n(k). 

Então 

⎛ 

XI − C(fl(X)) 

⎜ 0 

XI − C = ⎜ 

⎝ . 

0 

XI − C(fl+1(X)) 

0 

. .. 

0 

· · · 

0 

0 

. 

⎞ 

⎟ 

⎠ 

0 XI − C(fn(X)) 

e pela proposição 2.5.2 cada bloco XI − C(fj(X)) e’ equivalente a 

⎛ 

⎞ 

1 0 0 0 0 0 

⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 

. 

1 0 

1 

0 

0 

. .. 

· · · 

· · · 

. 

. .. 

0 

0 

. 

. 

⎟ . 

⎟ 

⎠ 

0 fj(X) 

⎞ 

⎟ 

⎠

2.6. FATORES INVARIANTES E DIVISORES ELEMENTARES 33 

Portanto XI − C é equivalente a 

⎛ 

1 0 0 0 0 0 

⎞ 

⎜ 0 

⎜ 0 

⎜ . 

⎜ 

⎝ 

. 

1 0 

fl(X) 

0 

0 

. .. 

· · · 

· · · 

. 

. .. 

0 

0 

. 

. 

⎟ 

⎠ 

0 fn(X) 

e de consequencia a XI − A. Disso deduzimos que A é semelhante a C pelo Teorema 2.4.2. A 

unicidade é clara porque se A fosse semelhante a uma matriz da forma 

C ′ ⎛ 

C(f 

⎜ 

= ⎜ 

⎝ 

′ l ′(X)) 0 0 0 0 

0 C(f ′ l ′ +1 (X)) · · · 0 

. 

. 

.. 

. 

0 C(f ′ ⎞ 

⎟ 

⎠ 

n(X)) 

, 

com f ′ i (X) mônico e irredutivel e tal que f ′ i (X) divide f ′ i+1 (X), os fatores invariantes de XI −C′ 

seriam f ′ l ′(X), . . . , f ′ n(X)(argumentaremos como acima) e seriam também os fatores invariantes 

de XI − A. Portanto teremos l = l ′ e f ′ j (X) = fj(X) e a unicidade resulta provada. 

2.6. Fatores invariantes e divisores elementares 

2.6.1. Proposição. Se f(X) = q1(X) e1 · · · ql(X) el é um polinômio de grau n, onde os qj(X) 

são irredutiveis, mônicos e distintos, então C(f(X)) é semelhante a uma matriz da forma 

⎛ 

C(q1(X) 

⎜ 

⎝ 

e1 ) 

C(q2(X) e2 ) 

. .. 

C(ql(X) el) 

⎞ 

⎟ 

⎠ . 

Demonstração. Seja 

⎛ 

C(q1(X) 

⎜ 

C = ⎜ 

⎝ 

e1 ) 

0 

0 

C(q2(X) 

0 0 0 

e2 

. 

) 

. .. 

· · · 0 

. 

0 C(ql(X) el) 

⎞ 

⎟ 

⎠ . 

Então 

⎛ 

XI − C(q1(X) 

⎜ 

XI − C = ⎜ 

⎝ 

e1 ) 

0 

0 

XI − C(q2(X) 

0 0 0 

e2 

. 

) 

. .. 

· · · 0 

. 

0 XI − C(ql(X) el) 

⎞ 

⎟ 

⎠ 

e como antes cada bloco XI − C(qj(X) ej ) e’ equivalente a 

⎛ 

1 0 0 0 0 0 

⎜ 0 1 0 0 · · · 0 

⎜ 0 1 0 · · · 0 

⎜ 

⎝ 

. 

. .. . . 

0 qj(X) ej 

⎞ 

⎟ . 

⎟ 

⎠


Sendo que os polinômios qj(X) são irredutiveis e relativamente primos, o m.c.d. mônico dos 

menores de ordem n − 1 de XI − C é igual a 1 (por que?). Portanto XI − C é equivalente a 

⎛ 

⎞ 

1 0 0 0 0 0 

⎜ 0 1 0 0 · · · 0 ⎟ 

⎜ 0 1 0 · · · 0 ⎟ 

⎜ 

⎝ 

. 

. .. 

⎟ 

. . ⎠ 

0 f(X) 

que é a forma canônica de Smith de XI − C(f(X)). Portanto C(f(X)) é semelhante a C. 

2.6.2. Corolário. (Forma canônica racional-segunda versão ). Seja A ∈ Mn×n(k) 

com polinômio minimo mA (X) = q1(X) e1 . . . qr(X) er . Então 

i) Existe uma matriz semelhante a A da forma 

⎛ 

⎞ 

⎜ 

D = ⎜ 

⎝ 

onde cada Di tem a forma 

⎛ 

C(qi(X) 

⎜ 

Di = ⎜ 

⎝ 

ei ) 

D1 

D2 

. .. 

C(qi(X) ei,2 ) 

Dr 

. .. 

⎟ 

⎠ , 

C(qi(X) ei,p i ) 

e temos ei = ei,1 ≥ ei,2 ≥ . . . ≥ ei,pi para cada i = 1, . . . , r, p1 ≥ p2 ≥ . . . ≥ pr. 

ii) A forma da matriz no ponto acima se diz forma canônica racional de A e é unica modulo 

uma permutação dos blocos. 

iii) Os polinômios qi(X) ei,j , i = 1, . . . , r, j = 1, . . . , pi se dizem divisores elementares de A. 

Os divisores elementares são os fatores primários dos fatores invariantes de XI − A. 

Demonstração. Sejam fk(X), . . . , fn(X) os fatores invariantes não costantes de XI − A. 

Na fatorização dos fj(X) podem aparacer como fatores irredutiveis só q1(X), . . . , qr(X) (por 

que?). Portanto aplicando o teorema 2.5.3 e a proposição 2.6.1 deduzimos que A é semelhante 

a uma matriz 

⎛ 

⎞ 

⎜ 

B = ⎜ 

⎝ 

Bk 

Bk+1 

onde cada Bl, l = k, . . . , n tem a forma 

⎛ 

C(q1(X) 

⎜ 

Bl = ⎜ 

⎝ 

e1,n−l+1) 

C(q2(X) e2,n−l+1) 

. .. 

Bn 

. .. 

⎟ 

⎠ , 

⎞ 

⎟ 

⎠ 

C(qr(X) er,n−l+1) 

com ei,n−l+1 ≥ 0, ei,1 = ei e ei,n−l+1 ≤ ei,n−l para cada i = 1, . . . , r. Sendo XI − B claramente 

equivalente a XI − D, obtemos que A é semelhante a D. Resulta claro, revertendo o argumento 

⎞ 

⎟ 

⎠ ,

2.7. DECOMPOSIÇÃO PRIMARIA E CICLICA 35 

que grupando as matrizes companheiras de divisores elementares distintos, podemos construir 

B como acima tal que XI − D seja equivalente a XI − B. Sendo que os qi(X) são irredutiveis 

e distintos, cada matriz XI − Bl e’ equivalente a uma matriz do tipo 

⎛ 

1 

⎜ 1 

⎜ 

⎝ 

. .. 

q1(X) e1,n−l · · · qr(X) er,n−l 

⎞ 

⎟ 

⎠ . 

Sejam fl(X) = q1(X) e1,n−l · · · qr(X) er,n−l; temos que fl(X) é mônico e divide fl+1(X). Segue 

que XI − B, e portanto XI − A, e’ equivalente a 

⎛ 

1 

⎜ 0 

⎜ 0 

⎜ 

⎝ . 

0 

1 

0 

0 

fk(X) 

. .. 

0 

0 

0 

0 

· · · 

· · · 

. 

0 

0 

0 

. 

⎞ 

⎟ , 

⎟ 

⎠ 

0 fn(X) 

onde cada fl(X) divide o seguinte e é mônico. Isso mostra a unicidade da forma canônica 

racional de A (por que?). 

Segue imediatamente o seguinte fato. 

2.6.3. Corolário. Duas matrizes A, B ∈ Mn×n(k) são semelhantes se e só se têm a mesma 

forma canônica racional se e só se têm os mesmos divisores elementares. 

A demonstração da segunda versão da forma canonica racional mostra tambem como dados 

os divisores elementares de uma matriz A ∈ Mn×n(k) se construem os fatores invariantes de 

XI − A. Sejam qi(X) ei,j os divisores elementares, i = 1, . . . , r, j = 1, . . . , pi, p1 ≥ . . . ≥ pr. 

Pondo ei,m = 0 se m > pi, podemos construir a seguinte matriz em Mp1×r(k[X]) 

⎛ 

⎞ 

⎜ 

⎝ 

q1(X) e1,p1 q2(X) e2,p1 · · · · · · qr(X) er,p 1 

q1(X) e1,p1−1 q2(X) e2,p1−1 · · · · · · qr(X) er,p1−1 . 

. .. . . 

q1(X) e1,1 q2(X) e2,1 · · · · · · qr(X) er,1 

Então os fatores invariantes de XI − A são os polinômios monicos obtidos multiplicando os 

elementos de cada linha da matriz acima. Ao contrario dados os fatores invariantes não costantes 

de XI − A podemos construir uma matriz como acima em qual cada entrada seja um divisor 

elementar de A. 

⎟ 

⎠ . 

2.7. Teoremas de decomposição T -ciclica I e T -primaria II 

Os resultados da seção anterior permitem de demonstrar diferentemente o Teoremas de Decomposição 

T -primaria e tambem de provar o Teorema de Decomposição T -ciclica. Vamos obter 

os teoremas de decomposição ciclica e primaria como corolarios dos resultados anteriores pela 

bem nota correspondencia entre matrizes semelhantes como matrizes de uma mesma aplicação 

linear com respeito a bases diferentes. Na proxima seção forneceremos uma demonstração direta 

do Teorema de Decomposição T -ciclica e portanto dos resultado dessa seção. Antes precisamos 

da definição de subespaço T -ciclico.


2.7.1. Definição. (Subespaço T -ciclico) Seja T ∈ End(V ). Dado um vetor u ∈ V , o 

subconjunto 

U = {f(T )(u) | f(X) ∈ k[X]} 

é subespaço de V . Um subespaço de V desta forma é dito ser T -ciclico, associado ao vetor u (u 

éntão dito ser um gerador de U, se não der lugar a confusões). 

2.7.2. Observação. A designação acima vem do fato de que um tal subespaço é o k[X]submódulo 

de V gerado pelo elemento u ∈ V , onde a estrutura de k[X]-módulo de V é a 

introduzida no Capítulo 1. 

Se U é subespaço T -ciclico, então U é obviamente T -invariante. Se r = dim(U), então 

B = {u, T (u), . . . , T r−1 (u)} é uma base de U. Se T r (u) = r−1 i=0 αiT i (u) e se f(X) = Xr − 

r−1 i=0 αiX i , temos que 

[T ] B B = C(f(X)), 

vide-se o Lemma 2.8.2 para os detalhes das demonstrações das afirmações acima. 

2.7.3. Corolário. (Existencia e unicidade decomposição T -ciclica) Seja T ∈ End(V ) 

com polinômio minimo m T (X) = q1(X) e1 . . . qr(X) er . Então 

i) V = U1,1 ⊕ U1,2 ⊕ . . . ⊕ U1,p1 ⊕ U2,1 ⊕ . . . ⊕ Ur,pr com Ui,j subespaços T -ciclicos tais que 

para cada i = 1, . . . , r e para cada j = 1, . . . , pi − 1, dim(Ui,j) ≥ dim(Ui,j+1). 

ii) O polinômio minimo da restrição de T a Ui,j e’ da forma qi(X) ei,j com ei = ei,1 ≥ 

ei,2 ≥ . . . ≥ ei,pi para cada i = 1, . . . , r. (os polinômios qi(X) ei,j se dizem divisores 

elementares de T ) 

iii) dim(Ui,j) = ei,j · di, onde di = grau(qi(X)). 

iv) Existe uma base B de V tal que 

[T ] B B = 

onde cada Ai tem a forma 

⎛ 

C(qi(X) 

⎜ 

Ai = ⎜ 

⎝ 

ei ) 

⎛ 

⎜ 

⎝ 

A1 

A2 

C(qi(X) ei,2 ) 

. .. 

. .. 

Ar 

⎞ 

⎟ 

⎠ , 

C(qi(X) ei,p i ) 

v) A forma da matriz no ponto iv) se diz forma canônica racional de T e e’ unica modulo 

uma permutação dos blocos. 

Demonstração. Seja B ′ uma base de V e seja A = [T ] B′ 

B ′. O resultado segue aplicando a 

segunda versão da forma canônica racional a matriz A. 

⎞ 

⎟ 

⎠ .

2.8. DECOMPOSIÇÃO T -CICLICA 37 

2.7.4. Corolário. (Teorema de decomposição primaria) Seja T ∈ End(V ), seja 

o polinônmio característico de T e seja 

c T (X) = q1(X) l1 · · · qr(X) lr 

m T (X) = q1(X) e1 · · · qr(X) er 

o polinômio minimo de T , onde cada qi(X) é um polinômio mônico irredutivel, 1 ≤ ei ≤ li para 

cada i = 1, . . . , r e os qi(X) são distintos. Então 

i) ker (qi(T ) ei ) = 0V é um subespaço T -invariante para cada i = 1, . . . , r. 

ii) V = ker (q1(T ) e1 ) ⊕ · · · ⊕ ker(qk(T ) er ). 

iii) dim(ker (qi(T ) ei )) = li · grau(qi(X)). 

iv) O polinômio minimo da restrição de T a ker (qi(T ) ei ) é qi(X) ei . 

Demonstração. Seja Vi = pi j=1 Ui,j, onde os Ui,j são os subespaços T -ciclicos contruidos 

aplicando o corolario 2.7.3. Então cada Vi é T -invariante e V = V1 ⊕ . . . ⊕ Vr; a restrição 

de T a cada Vi tem como polinômio minimo qi(X) ei . Disso segue facilmente que o polinômio 

carateristico de T |Vi é qi(X) l1 , vide-se Proposição 2.1.10. Portanto dim(Vi) = li · grau(qi(X)). 

Para concluir e’ suficiente mostrar que Vi = ker (qi(T ) ei ) = ker (qi(T ) li ). Temos as inclusoes 

Vi ⊆ ker (qi(T ) ei ) ⊆ ker (qi(T ) li ). Se Vi,,j = ker (qi(T ) li ) ∩ Vj = 0V , com j = i, esse subespaço 

de Vj seria T -invariante por ser interseção de subespaços T -invariantes e para qualquer v ∈ Vi,j 

teremos qi(T ) li (v) = 0V = qj(T ) em,j li 

(v). O polinômio minimo de T|Vi,j deveria dividir qi(X) 

e qj(X) em,j , que são coprimos e seria portanto o polinômio costante 1. Essa contradição prova 

que ker (qi(T ) li ) ⊆ Vi, concluindo a demonstração. 

2.8. Teorema de decomposição T –ciclica II 

O objetivo dessa seção e’ demonstrar diretamente o Teorema de Decomposição T -ciclica, 

Teorema 2.8.1 abaixo, já provado no Corolario 2.7.3. Dessa maneira vamos obter uma nova 

demonstração do Corolario 2.6.2 que não depende da teoria dos fatores invariantes e das matrizes 

polinomiais. Para ficar completamtente independentes da citada teoria, usaremos o Teorema da 

decomposição T -primária demonstrado diretamente no Teorema 1.5.1. 

Pelo teorema de decomposição primária, querendo achar uma forma canônica para um operador 

T : V → V podemos supor sem perda de generalidade que m T (X) = q(X) e com e ≥ 1 e 

q(X) irredutivel em k[X]. A partir desse caso com o procedimento usual acharemos a ”forma 

canônica”para um T qualquer fatorizando o polinômio minimo de T em fatores irredutiveis 

mônicos. Para encontrar a forma canônica vamos demostrar um teorema de existencia e unicidade 

para uma decomposição de V em subespaços T -ciclicos; a restrição de T a esse subespaços 

vai ter como matriz em uma base oportunamente escolhida uma matriz naturalmente associada 

a q(X) li , e = l1 ≥ l2 ≥ . . . ≥ lp. 

2.8.1. Teorema. (Existencia e unicidade da decomposição ciclica) Seja T : V → V 

uma aplicação linear e suponhamos que 

m T (X) = q(X) e , 

com q(X) ∈ k[X] irredutivel e mônico e com e ≥ 1. Então : 

i) (existência) V = U1 ⊕ U2 . . . ⊕ Up, onde cada Ui e’ um subespaço T -ciclico tal que 

o polinômio minimo de T |Ui seja da forma q(X)ei com e = e1 ≥ e2 ≥ . . . ≥ ep, 

dim(Ui) = d · ei, d = grau(q(X)).


ii) (unicidade) Se V = U ′ 1 ⊕ U ′ 2 . . . ⊕ U ′ p ′, onde cada U ′ j e’ um subespaço T -ciclico tal que 

o polinômio minimo de T |U ′ seja da forma q(X) 

j e′ j com e = e ′ 1 ≥ e′ 2 ≥ . . . ≥ e′ p ′, então 

p = p ′ e ei = e ′ i para cada i = 1, . . . , p. 

Demonstração. Para indução sobre n = dim(V ) ≥ 1. Para n = 1, necessariamente 

mT (X) = X − α e o teorema e’ verdadeiro. 

Seja d = grau(q(X)) ≥ 1. Temos q(T ) e−1 = 0End(V ) por definição de polinômio minimo. 

Então existe u ∈ V tal que q(T ) e−1 (u) = 0V . Seja U1 =< u, T (u), . . . >, i.e. o subespaco 

ciclico T -invariante gerado por u e seja T1 a restrição de T a U1. Sendo que q(T1) e = 0End(U1) o polinômio minimo de T1 e’ da forma q(X) e1 com e1 ≤ e. De q(T1) e−1 (u) = 0 deduzimos 

e1 = e. Então U1 =< u, T (u), . . . , T de−1 (u) > porque sendo q(X) e o polinômio minimo de T |U1 , 

T de (u) ∈< u, T (u), . . . , T de−1 (u) > e portanto T r (u) ∈< u, T (u), . . . , T de−1 (u) > para cada 

r ≥ d · e. Por outro lado temos que se u, T (u), . . . , T de−1 (u) fossem linearmente dependentes, 

então o polinômio minimo de T |U1 seria de grau menor a d · e (lembramos que f(T |U1 ) = 0 se e 

só se f(T )(u) = 0). Concluimos que dim(U1) = de. Se d · e = n, o teorema esta demostrado. 

Suponhamos d · e < n. 

Sendo U1 um subespaço T -invariante, T induz uma transformação linear T : V/U1 → V/U1 

definida como 

T ([v]) = [T (v)]. 

(Mostrar que e’ bem definida!). Se f(X) ∈ k[X], então se verifica logo que 

f(T )([v]) = [f(T )(v)]. 

Dessa ultima relação deduzimos que m T (X) divide m T (X), i.e. m T (X) = q(X) e2 , e2 ≤ e1 = e. 

Se W é um subespaço T -ciclico de V gerado por w tal que q(X) e seja o polinômio minimo de 

T |W , então q(X) e é um multiplo do polinômio minimo da restrição de T ao subesaço T -ciclico 

gerado por [w]. 

Aplicando a ipotese de indução a V/U1, de dimensão n − dim(U1) < n, obtemos 

V/U1 = U 2 ⊕ U 3 . . . ⊕ U p, 

onde cada U j e’ T -ciclico e a restrição de T a cada U j tem polinômio minimo da forma q(X) ej 

com e2 ≥ e3 ≥ . . . ≥ ep. Para completar a demostração vamos construir a partir de U j, 

j = 2, . . . , p subespaços Uj de V tais que: 

a) cada Uj seja isomorfo a U j e então T -ciclico; 

b) o polinômio minimo da restrição de T a Uj seja exatamente q(X) ej ; 

c) V = U1 ⊕ U2 . . . ⊕ Up. 

Cada subespaço U j e’ gerado por um vetor [uj] e temos 

U j =< [uj], . . . , T ljd−1 ([uj]) > . 

De q(T ) lj ([uj]) = 0 V/U1 deduzimos q(T )ej (uj) ∈ U1; sendo U1 gerado por u1 obtemos q(T ) ej (uj) = 

f(T )(u1) por algum f(X) ∈ k[X]. Afirmamos que podemos deduzir a existencia de um vetor 

u ′ j ∈ U1 tal que q(T ) ej (T )(uj + u ′ j ) = 0V . Demonstrado isso pegaremos 

Uj =< uj + u ′ j , . . . , T ejd−1 

(uj + u ′ j ) > 

e verificaremos as propriedades a), b) e c). 

A afirmação segue dos seguintes fatos. Temos 

0V = q(T ) e (uj) = q(T ) e−ej q(T ) ej (uj)q(T ) e−ej f(T )(u1).

2.8. DECOMPOSIÇÃO T -CICLICA 39 

Sendo que a restrição de T a U1 tem polinômio minimo q(X) e , temos que q(X) e divide q(X) e−ej f(X). 

Isso implica f(X) = h(X)q(X) ej (por que?). Tomando u ′ j = −h(T )(u1) ∈ U1, temos 

q(T ) ej (uj + u ′ j ) = f(T )(u1) + q(T ) ej (−h(T )(u1)) = 0V . 

Sendo que u ′ j ∈ U1, claramente [uj] = [uj + u ′ j ] e então esse vetor é um gerador de U j, 

j = 2, . . . , p. Observamos antes que o polinômio minimo da restrição de T a Uj é um multiplo 

de q(X) ej , mas q(T ) ej (uj + u ′ j ) = 0V implica que o polinômio minimo da restrição de T a Uj 

seja esatamente q(X) ej , assim que b) esta demonstrado. Mostramos a). Argumentando como 

no caso de U1 no inicio da demonstração, temos que os espaços vetorias Uj e U j têm dimensão 

d·lj. O mapa natural πj : Uj → U j definido como πj(uj +u ′ j ) = [uj +u ′ j ] = [uj] é uma aplicação 

linear sobrejetora que, pelo teorema do nucleo e da imagem, induz um isomorfismo entre Uj e 

U j para cada j = 2, . . . p, completando a demonstração do ponto a). 

Indicamos con π : V → V/U1 o mapa projeção definido como π(v) = [v]. Entao a restrição 

de π a cada Uj é o πj definido anteriormente. Sendo que πj é um isomorfismo, temos Uj∩U1 = 0V 

para cada j = 2, . . . , p. Se w1 + w2 + . . . + wp = 0V , com wi ∈ Ui, i = 1, . . . , p, aplicando 

π, teremos π(w2) + . . . + π(wp) = 0V , π(wj) ∈ U j para cada j = 2, . . . , p. Isso implica 

π(wj) = 0 V/U1 (por que?) e portanto wj = 0V para cada j = 2, . . . , p pela injetividade de 

πj. Portanto a soma U1 + . . . + Up é direta e coincide com V sendo um subespaço de dimensão 

n = dim(V ). 

Passamos a mostrar a unicidade da decomposição na forma especificada em ii). Seja m ≥ 1 

o menor inteiro tal que em = e ′ m. Sendo e1 = e = e ′ 1 , temos 2 ≤ m ≤ min{p, p′ }. Podemos supor 

sem perda de generalidade que em > e ′ m. Por outro lado sabemos que e ′ m ≥ e ′ j para cada j ≥ m 

e portanto que q(T ) e′ m(U ′ j ) = 0V para cada j ≥ m. Então 

q(T ) e′ m(V ) = q(T ) e′ m(U ′ 1) ⊕ q(T ) e′ m(U ′ 2) ⊕ . . . ⊕ q(T ) e′ m(U ′ m−1), 

onde a soma continua direta porque os U ′ j são T -invariantes. Cada U ′ k e’ T -ciclico de dimensão 

d · e ′ k . Se verifica facilmente que dim(q(T )e′ m(U ′ k )) = d · (e′ k − e′ m) para cada k = 1, . . . , m − 1. 

Calculando com a outra decomposição obtemos 

q(T ) e′ m(V ) ⊇ q(T ) e′ m(U1) ⊕ q(T ) e′ m(U2) ⊕ . . . ⊕ q(T ) e′ m(Um−1) ⊕ q(T ) e′ m(Um) 

com dim(q(T ) e′ m(Ut)) = d(et−e ′ m) para cada t = 1, . . . , m. Disso deduzimos m−1 

k=1 d·(e′ k −e′ m) ≥ 

m 

k=1 d(ek − e ′ m) e portanto em ≤ e ′ m contra a hipotese. 

Combinando o teorema de decomposição primária e o teorema de decomposição ciclica, 

dado T : V → V aplicação linear podemos sempre supor a existencia de subespaços T -ciclicos. 

Portanto para estudar T é suficiente conhecer a restrição dele aos subespacos T -ciclicos que T 

individua, sendo esses essencialmente ”unicos”. 

2.8.2. Lema. Seja U um subsespaço T -ciclico de V de dimensão m ≥ 1. 

Então : 

i) U tem uma base B da forma B = {u, T (u), . . . , T m−1 (u)}. 

ii) Se T m (u) = α0u + α1T (u) + . . . + αm−1T m−1 (u), então 

[T ] B B = 

⎛ 

⎜ 

⎝ 

0 0 0 . . . α0 

1 0 0 . . . α1 

0 

. 

1 

. 

0 

. 

. . . 

. .. 

α2 

. 

0 0 0 1 αm−1 

⎞ 

⎟ = C(X 

⎟ 

⎠ 

m − αm−1X m−1 − . . . − α1X − α0).


iii) O polinomio minimo de T |U e’ 

g(X) = X m − αm−1X m−1 − . . . − α1X − α0. 

Demonstração. Podemos pensar U como gerado por u, T (u), T 2 (u), etc. Se T r (u) = 0U, 

então T l (u) = 0U para cada l ≥ r e 

U =< u, T (u), . . . , T r−1 (u) > . 

Sendo que dim(U) = m, temos que T j (u) = 0U para cada j = 1, . . . , m − 1. Mostramos que os 

m vetores u, T (u), . . . , T m−1 (u) são linearmente indipendentes. Seja 

β0u + β1T (u) + . . . + βm−1T m−1 (u) = 0U 

uma relação entre os vetores com βi ∈ k. Suponhamos que exista i, 1 ≤ i ≤ m − 1 tal que βi = 0 

e tal que 

β0u + β1T (u) + . . . + βiT i (u) = 0U. 

Então T i (u) ∈< u, T (u), . . . , T i−1 (u) >. Aplicando T teremos que tambem T i+k (u) ∈< 

u, T (u), . . . , T i−1 (u) > de onde deduziremos que o subespaço U estaria contido em 

< u, T (u), . . . , T i−1 (u) >; 

i − 1 ≤ m − 2 implica i ≤ m − 1 e isso e’ impossivel porque dim(U) = m. A parte ii) é clara. 

Vamos provar iii). Seja f(X) ∈ k[X]. Então f(T |U) = 0 End(U) se e somente se f(T )(u) = 0U. 

Portanto o polinônio minimo de T |U é o polinômio mônico h(X) de menor grau positivo tal que 

h(T )(u) = 0. Sendo {u, T (u), . . . , T m−1 (u)} uma base de V , o grau de h(X) é maior o igual a 

m. Sendo g(T )(u) = 0U, teremos que o grau de h(X) é exatamente m e que h(X) divide g(X); 

sendo os dois mônicos temos h(X) = g(X). 

Exercicios do capítulo 

(1) Mostrar que em geral para A(X), B(X) ∈ Mn×n(k[X]), 

grau(A(X) · B(X)) = grau(A(X)) + grau(B(X)). 

(2) Efetuar a divisão euclidiana à direita de A(X) por B(X) nos seguintes casos, escrevendo 

primeiramente as duas matrizes como polinômios matriciais. 

(a) 

(b) 

A(X) = 

 

X3 + 5X + 1 3X3 + X − 1 

A(X) = 

2X 3 + X 2 + 2 4X 3 + 2X + 2 

 

2X2 − 1 X2 B(X) = 

2X 2 + 2 X 2 + 2 

−3X −X 

3X 2 2X 2 

 

 

, 

 

 

X 2 

, B(X) = 

−2 X 

(3) No Exercício anterior, item (b), verifique que a divisão é exata (isto é, tem resto nulo) 

em um lado, mas não no outro.

(4) Dadas as matrizes 

P (X) = 

⎛ 

EXERCICIOS DO CAPÍTULO 41 

⎝ 2X4 − X 2 + 2 −X 3 + X − 1 1 − X 2 

X 3 − X + 1 −X 4 + X 2 − 2 1 + X 2 

X 2 − 1 −X − 1X 4 + X 2 − 1 

⎛ 

A = ⎝ 

0 1 0 

0 0 1 

2 0 0 

determinar o valor PD(A) pelos dois métodos da divisão euclidiana e da substituição 

direta. 

⎞ 

⎠ , 

(5) Seja A ∈ Mn×n(R) tal que A 2 = −In×n. 

(a) Mostrar que n = 2r por algum inteiro r ≥ 1. 

(b) Mostrar que para cada v ∈ R n \ 0, temos 

dim(< A(v), v >) = 2. 

Deduzir que para n = 2, a matriz A é semelhante a 

0 −1 

1 0 

 

. 

(c) Mostrar que A é semelhante em Mn×n(R) a 

 

0 −Ir×r 

0 

Ir×r 

(d) Se substituirmos R por C a conclusão do ponto (i) continua verdadeira? Se não 

construir um contraexemplo. 

(6) Seja A ∈ Mm×n(Z). Mostrar que existem P ∈ Mm×m(Z) e Q ∈ Mn×n(Z) inversiveis 

tais que 

⎛ 

d1 0 · · · 

⎞ 

0 

⎜ 

P · A · Q = ⎜ 

⎝ 

0 

. 

d2 

0 

. 

. .. 

· · · 

dr 

0 

. 

0 

. 

0 

0 

. 

· · · 

· · · 

· · · 

0 ⎟ 

. ⎟ 

0 ⎟ , 

⎟ 

0 ⎟ 

. 

⎠ 

0 0 · · · 0 0 · · · 0 

onde r é o posto de A e onde, para todo 1 ≤ j ≤ r, dj ∈ Z é um inteiro positivo que 

divide dj+1 (com a convenção de que dr+1 = 0). 

 

. 

⎞ 

⎠ ,


(7) Seja A ∈ M10×10(Q) a matriz seguinte. 

⎛ 

−1 

⎜ 0 

⎜ 0 

⎜ 0 

⎜ 

A = ⎜ 0 

⎜ 0 

⎜ 0 

⎜ 0 

⎝ 0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

3 

2 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

3 

2 

0 

0 

0 

0 

0 

0 

0 

0 

0 

3 

0 

0 

0 

0 

0 

0 

0 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

1 

0 

0 

0 

0 

0 

0 

0 

0 

0 

⎞ 

0 

0 ⎟ 

0 ⎟ 

0 ⎟ 

0 ⎟ 

0 ⎟ . 

⎟ 

−9 ⎟ 

−12 ⎟ 

2 ⎠ 

0 0 0 0 0 0 0 0 0 4 

(a) Encontrar c A (X) e m A (X). 

(b) Encontrar os fatores invariantes de XI − A (e a forma canonica racional de A). 

(8) Achar a forma normal de Smith de 

 

x2 x − 1 

A = 

x + 1 x2 (9) Determinar a forma normal de Smith de cada uma das seguintes matrizes sobre Q[X], 

pelo método das operações elementares: 

(a) 

(b) 

(c) 

(d) 

⎛ 

⎝ 

 

. 

X − 1 0 −1 

3 X − 2 0 

0 4 X + 7 

X X 2 − 1 X 3 

X 2 X − 1 X 2 + X − 1 

⎛ 

⎝ 

⎛ 

⎝ 

X 0 0 

0 X − 1 0 

0 0 X − 2 

X 0 0 

0 X 0 

0 0 X − 2 

(10) Verificar, justificando devidamente, quais das matrizes seguintes sobre C[X] estão na 

forma normal de Smith. 

(a) Uma matriz A ∈ Mm×n(C) na forma reduzida linha/coluna 

(b) Uma matriz diagonal A(X) ∈ Mn×n(C[X]) cuja diagonal principal é composta de 

polinômios mônicos em ordem estritamente crescente de graus. 

⎞ 

⎠ 

⎞ 

⎠ 

⎞ 

⎠

EXERCICIOS DO CAPÍTULO 43 

(c) Uma matriz diagonal A(X) ∈ Mn×n(C[X]) da forma 

⎛ 

⎞ 

1 0 . . . 0 0 

⎜ 0 1 . . . 0 0 ⎟ 

⎜ 

⎟ 

⎜ . . . . ⎟ 

⎝ 0 0 . . . 1 0 ⎠ 

0 0 . . . 0 f(X) 

com f(X) ∈ C[X] mônico. 

(d) Uma matriz diagonal A(X) ∈ Mn×n(C[X]) com o mesmo polinômio mônico repetido 

ao longo da diagonal principal. 

(11) Determinar a forma normal de Smith de cada uma das seguintes matrizes sobre R[X], 

pelo método dos subdeterminantes: 

(a) 

(b) 

⎛ 

⎝ 

f(X) 0 

0 g(X) 

0 1 

⎞ 

⎠ e 

onde f(X), g(X) ∈ R[X] são mônicos. 

⎛ 

f(X) 0 1 

0 g(X) 0 

⎝ 1 + 2X X3 + 4X 2 + X + 2 X 3 + 4X + 2 

0 X 2 + X X 2 

1 − 2X X 3 + 3X 2 − 3X − 1 X 3 − X 2 + 4X − 2 

(c) A matriz característica da matriz 

⎛ 

0 

⎜ 1 

⎝ 0 

0 

0 

1 

0 

0 

0 

−α0 

−α1 

−α2 

⎞ 

⎟ 

⎠ 

0 0 1 −α3 

onde αi ∈ R. 

(12) Usando a teoria dos fatores invariantes da matriz carateristica associada, demonstrar 

os seguintes fatos: 

(a) uma matriz A ∈ Mn×n(k) é semelhante a A t ; 

(b) Sejam A, B ∈ M2×2(R) (resp. M2×2(C)). Então A e B são semelhantes se e só se 

m A (X) = m B (X). 

(c) Sejam A, B ∈ M3×3(R) (resp. M3×3(C)). Então A e B são semelhantes se e só se 

c A (X) = c B (X) e m A (X) = m B (X). 

(d) Construir duas matrizes A, B ∈ M3×3(R) não semelhantes e com m A (X) = 

m B (X). 

(e) Para cada n ≥ 4 construir exemplos de matrizes A, B ∈ Mn×n(R) não semelhantes 

e tais que c A (X) = c B (X) e m A (X) = m B (X). 

(13) Encontrar o polinômio minimo de 

⎛ 

A = ⎝ 

2 1 1 

2 3 2 

1 1 2 

calculando os fatores invarientes de XI − A. 

⎞ 

⎠ , 

 

⎞ 

⎠


(14) Seja 

⎛ 

2 

⎜ 

A = ⎜ 1 

⎝ 0 

−1 

0 

0 

1 

1 

1 

⎞ 

−1 

−1 ⎟ 

0 ⎠ ∈ M4×4(C). 

0 0 0 1 

Encontrar a forma canônica racional de A. 

(15) Mostrar que se por A ∈ Mn×n(k), temos m A (X) = c A (X), então A é semelhante a 

C(det(XI − A)) = C(c A (X)).

CAPíTULO 3 

Forma canônica de Jordan 

3.1. Forma canônica de Jordan para operadores nilpotentes 

Introduzimos a definição de operador nilpotênte e de matriz nilpotênte. 

3.1.1. Definição. (Operador e matriz nilpotênte) Seja T : V → V uma aplicação linear 

de V . O operador T se diz nilpotênte se existir um inteiro p ≥ 1 tal que 

T p = T ◦ · · · ◦ T 

= 0End(V ). 

p 

O menor inteiro r ≥ 1 com a propriedade que T r = 0V se diz índice de nilpotência de T . 

Uma matriz A ∈ Mn×n(k) se diz nilpotênte se existir p ≥ 1 tal que 

A p = A · · · A 

= 0 

p 

e o índice de nilpotência de A ó menor inteiro r ≥ 1 com a propriedade que A r = 0. 

Enunciamos algumas propriedades dos operadores nilpotentes que são consequencias diretas 

da definição. 

(i) Se r é o índice de nilpotência de T , então m T (X) = X r e o polinômio minimo de 

um operador nilpotênte é portanto completamente redutivel em k[X]. Claramente se 

n = dim(V ), c T (X) = X n . 

(ii) λ = 0 é o único auto-valor de uma aplicação linear nilpotente T . 

(iii) Se T : V → V é nilpotente, os auto-vetores de T são exatamente os elementos do núcleo 

ker (T ) (todos associados ao auto-valor único 0) 

Vamos considerar agora casos particulares dos resultados demonstrados anteriormente. 

3.1.2. Proposição. Seja T : V → V um operador nilpotente de índice de nilpotência r e 

seja U ⊆ V um subespaço T -ciclico de dimensão m ≥ 1. 

Então 

i) U tem uma base B da forma B = {u, T (u), . . . , T m−1 (u)}. 

ii) 

[T ] B ⎛ 

⎞ 

0 0 0 . . . 0 

⎜ 1 0 0 . . . 0 ⎟ 

⎜ 

B = ⎜ 0 1 0 . . . 0 ⎟ . 

⎜ 

⎝ 

. 

. . . .. 

⎟ 

. ⎠ 

0 0 0 1 0 

iii) O polinomio minimo de T |U é X m e m ≤ r. 

Demonstração. O polinômio minimo de T |U é da forma X l , 1 ≤ l ≤ r e as afirmações 

seguem por exemplo do Lema 2.8.2. 

45

46 3. FORMA CANÔNICA DE JORDAN 

Estamos agora na posição para mostrar o Teorema da forma canônica de Jordan para operadores 

nilpotentes. Precisamos só de uma definição. . 

3.1.3. Definição. (Bloco elementar de Jordan de tamanho n). Definimos como bloco 

elementar de Jordan de tamanho n a matriz Jn ∈ Mn×n(k) da forma 

⎛ 

⎞ 

0 0 0 . . . 0 

⎜ 1 0 0 . . . 0 ⎟ 

⎜ 

Jn = ⎜ 0 1 0 . . . 0 ⎟ . 

⎜ 

⎝ 

. 

. . . .. 

⎟ 

. ⎠ 

0 0 0 1 0 

3.1.4. Teorema. (Forma canônica de Jordan para operadores nilpotentes) Seja 

T : V → V uma aplicação linear nilpotente de índice de nilpotência r, i.e. mT (X) = Xr . Então 

i) V = U1 ⊕ U2 ⊕ . . . ⊕ Up com Ui subespaço T -ciclico. 

ii) O polinômio minimo da restrição de T a Ui é da forma Xri com r = r1 ≥ r2 ≥ . . . ≥ rp 

para cada i = 1, . . . , p, onde dim(Ui) = ri. 

iii) Existe uma base B de V tal que 

⎛ 

⎞ 

[T ] B B = 

⎜ 

⎝ 

Jr 

Jr2 

onde cada Jri é um bloco elementar de Jordan de tamanho ri, r = r1 ≥ . . . ≥ rp. 

iv) A forma da matriz no ponto iii) se diz forma canônica de Jordan de T e é unicamente 

determinada. 

Demonstração. Pelo teorema de decomposição ciclica sabemos che existem U1, . . . Up subespacos 

T -ciclicos tais que V = U1⊕U2⊕. . .⊕Up. Se dim(Ui) = ri, podemos supor r1 ≥ . . . ≥ rp. 

Sendo T nilpotênte podemos aplicar a Proposição 3.1.2 para deduzir que o polinômio minimo 

da restrição de T a Ui seja X ri . É claro que T r1 = 0V e que T r1−1 = 0V (se ui ó gerador de Ui, 

T r1 (ui) = 0V mas T r1−1 (u1) = 0V ). Portanto r1 = r. 

Sendo m T (X) = X r , aplicando o teorema de unicidade da decomposição T -ciclica, obtemos 

a demonstração do ponto iv), o ponto iii) sendo claro. 

3.1.5. Definição. (índices de nilpotência sucessivos de um operador nilpotênte) 

Os inteiros {r1, . . . , rp} se dizem índices de nilpotência sucessivos de T . 

3.1.6. Corolário. (Forma canônica de Jordan de matrizes nilpotentes) Seja A ∈ 

Mn×n(k) uma matriz nilpotente de índice de nilpotência r. Então 

i) existe uma unica matriz semelhante a A, dita a forma canônica de Jordan de A, da 

forma ⎛ 

⎞ 

⎜ 

⎝ 

Jr 

Jr2 

. .. 

. .. 

onde cada Jri bloco elementar de Jordan de tamanho ri, com r = r1 ≥ . . . ≥ rp. Os 

interiro {r1, . . . , rp} se dizem índices de nilpotência sucessivos de A. 

Jrp 

Jrp 

⎟ 

⎠ , 

⎟ 

⎠ ,

3.2. FORMA CANÔNICA DE JORDAN 47 

ii) Duas matrizes nilpotentes A, B ∈ Mn×n(k) são semelhantes se e só se têm a mesma 

forma canônica de Jordan se e só se têm os mesmos índices de nilpotência successivos. 

3.2. Forma canônica de Jordan para operadores com polinômio minimo 

completamente redutivel sobre k 

Nessa seção vamos estudar as aplicações lineares T : V → V por quais o polinômio minimo 

de T seja completamente redutivel em k[X], i.e. m T (X) = (X − λ1) e1 · · · (X − λr) er com 

λi ∈ k distintos, i = 1, . . . , r. Essa condição é satisfeita para qualquer T : V → V se por 

exemplo o corpo k é algebricamente fechado (e.g. k = C!). Observamos que temos c T (X) = 

(X − λ1) s1 · · · (X − λr) sr com si ≥ ei para cada i = 1, . . . , r. 

Nessa hipotese, aplicando o teorema de decomposição primária e o teorema da forma canônica 

de Jordan para operadores nilpotentes, vamos obter uma forma canônica para operadores quaisquer. 

Precisamos introduzir uma definição. 

3.2.1. Definição. (Bloco elementar de Jordan de tamanho n relativo ao autovalor 

λ ∈ k) Dados n ≥ 1 e λ ∈ k definimos o bloco elementar de Jordan de tamanho n relativo ao 

autovalor λ como a matriz J(λ)n ∈ Mn×n(k) da forma: 

⎛ 

⎜ 

J(λ)n = ⎜ 

⎝ 

λ 0 0 . . . 0 

1 λ 0 . . . 0 

0 1 λ . . . 0 

. . . 

. .. . 

0 0 0 1 λ 

Claramente J(0)n = Jn, i.e. os blocos elementares relativos ao autovalor 0 são os blocos 

elementares de Jordan. 

3.2.2. Teorema. (Forma canônica de Jordan) Seja T : V → V um operador tal que 

cT (X) = (X − λ1) s1 · · · (X − λr) sr , com λi ∈ k distintos, i = 1, . . . r, e seja mT (X) = (X − 

λ1) e1 · · · (X − λr) er , ei ≤ si, o polinômio minimo de T . Então 

i) V = V1 ⊕ . . . ⊕ Vr, onde Vi = ker ((T − λiIV ) ei ) e’ um subespaço T -invariante de 

dimensão si para cada i = 1, . . . , r. 

ii) Para cada i = 1, . . . , r, se Ti é a restrição de T a Vi, então Ti = λiIVi + Si com 

Si : Vi → Vi operador nilpotênte de índice de nilpotência ei. 

iii) Se ei = ei,1 ≥ ei,2 ≥ . . . ≥ ei,pi , i = 1, . . . , r, são os índices de nilpotência sucessivos de 

Si, então existe uma base B de V tal que 

⎛ 

⎞ 

[T ] B B = 

⎜ 

⎝ 

A1 

onde cada Ai ∈ Msi×si (k) tem a forma 

⎛ 

J(λi)ei 

⎜ 

Ai = ⎜ 

⎝ 

A2 

J(λi)ei,2 

. .. 

. .. 

Ar 

⎞ 

⎟ . 

⎟ 

⎠ 

⎟ 

⎠ , 

J(λi)ei,p i 

⎞ 

⎟ 

⎠ .

48 3. FORMA CANÔNICA DE JORDAN 

iv) A forma da matriz no ponto iii) se diz forma canônica de Jordan de T e é unica modulo 

uma permutação dos blocos Ai. 

Demonstração. O teorema de decomposição primária, teorema 1.5.1, mostra que V = 

V1 ⊕ . . . ⊕ Vr (lembramos que cada Vi é claramente T -invariante), que dim(Vi) = si e que se 

Ti = T |Vi , então mTi (X) = (X − λi) ei . Seja Si : Vi → Vi o operador Ti − λiIVi . Por definição 

temos que Si é nilpotênte e que o índice de nilpotência dele é esatamente ei. Aplicando o 

Teorema da forma canônica de Jordan para operadores nilpotêntes a Si deduzimos a existencia 

de uma bade Bi de Vi tal que [Si] Bi seja composta de blocos elementares de Jordan de tamanhos 

Bi 

ei = ei,1, . . . , ei,pi , i = 1, . . . , r, onde ei = ei,1 ≥ ei,2 ≥ . . . ≥ ei,pi são os índices de nilpotência 

sucessivos de Si. Segue imediatamente que [Ti] Bi 

Bi = Ai. Tomando come base de V a base 

B obtidas como união das bases Bi por i = 1, . . . r, obtemos que [T ] B B 

é exatamente como 

especificado no ponto iii). A unicidade modulo permutações das Ai segue da unicidade da forma 

canônica de Jordan para operadores nilpotentes. 

Vamos fazer algumas observações e comentarios. 

(1) Características de Segre. Da interpretação matricial acima, deduzimos a seguinte 

tabela de números inteiros positivos 

λ1, s1, e1,1, e1,2, . . . , . . . , e1,p1 

λ2, s2, e2,1, e2,2, . . . , e1,p2 , 0 

. 

λr, sr, er,1, er,2, . . . , . . . , er,pr 

(cujas linhas têm comprimento diferentes, em geral). Estes inteiros são chamados características 

de Segre. Por hipótese, eles determinam completamente a forma canônica 

de Jordan, logo são invariantes da classe de semelhança das matrizes representativas de 

T . Se T for nilpotênte as características de Segre são a dimensão do espaço e os índices 

de nilpotência sucessivos. 

(2) Observemos as relações óbvias r j=1 sj = n e pj l=1 ej,l = sj (1 ≤ j ≤ r). A segunda 

relação mostra que, esencialmente, as características de Segre dependem só do 

polinômio minimo de T e das índices de nilpotência sucessivos de Si e não do polinômio 

característico. 

(3) Para cada j = 1, . . . , r, a multiplicidade de λj como raíz do polinômio mínimo mT (X) 

é a característica de Segre ej,1 (o primeiro, maior por hipótese). 

(4) A dimensão do auto-espaço Vλj = ker (T −λjI) associado ao auto-valor λj é ainda dado 

por dim(ker (Tj − λjI)) = sj − rank (Tj − λjI) = sj − ( pj l=1 (ej,l − 1)) = −(−pj) = pj. 

Assim, há um total de pj auto-vetores linearmente independentes associados a λj, 

portanto um para cada sub-bloco elementar de Jordan daquele auto-valor. 

Embora a segunda observação mostre que não todas as características de Segre sejam necessarias 

para determinar a classe de semelhanca de uma matriz (podemos por exemplo eliminar 

a segunda coluna de inteiros na matriz que define as características de Segre), enunciamos o 

seguinte corolario nessa forma. 

3.2.3. Corolário. (Forma canônica de Jordan de matrizes) Seja A ∈ Mn×n(k) uma 

matriz com polinômio minimo completamente redutivel em k[X]. Então

EXERCISIOS DO CAPÍTULO 49 

i) existe uma matriz semelhante a A, dita a forma canônica de Jordan de A, da forma 

⎛ 

⎞ 

⎜ 

⎝ 

A1 

A2 

onde cada Ai ∈ Msi×si (k) tem a forma 

⎛ 

J(λi)ei 

⎜ 

Ai = ⎜ 

⎝ 

. .. 

J(λi)ei,2 

Ar 

. .. 

⎟ 

⎠ , 

J(λi)ei,p i 

com ei = ei,1 ≥ ei,2 ≥ . . . ≥ ei,pi , i = 1, . . . , r. 

ii) A forma canônica de Jordan de A única modulo permutações dos blocos Ai. 

iii) Duas matrizes A, B ∈ Mn×n(k) com polinômios minimos completamente redutiveis em 

k[X] são semelhantes se e só se têm a mesma forma canônica de Jordan se e só se têm 

as mesmas características de Segre. 

Exercisios do capítulo 

⎞ 

⎟ 

⎠ ,

ALGEBRA LINEAR Francesco Russo e Aron Simis - Portale Posta DMI

Create successful ePaper yourself

Delete template?

Save as template?