Appunti di algebra - Matematica e Applicazioni

Aspetti di Algebra Lineare 

Appunti per il corso di Complementi di Matematica del Secondo anno del Corso 

di Laurea Triennale in Scienza dei Materiali, Università di Milano–Bicocca, anni 

accademici 2006/2007 e 2007/2008. 

Gregorio Falqui 

Dipartimento di Matematica e Applicazioni 

Università di Milano – Bicocca 

Nota Introduttiva. Il materiale contenuto in questi appunti si basa sulle 

lezioni tenute negli anni accademici dal 2006 in avanti per gli studenti del secondo 

anno di Scienza dei materiali. Per prepararle, mi sono basato sui seguenti 

libri: 

T. Apostol, Calcolo Vol II (Boringhieri, Torino) 

S. Abeasis, Algebra lineare e geometria, (Zanichelli, Bologna). 

Queste note non vogliono sostituire un libro di testo, ma piuttosto costituire 

un resumé degli argomenti trattati nel corso. Conformemente allo spirito e alla 

pratica (e, segnatamente, al limitato tempo a disposizione per l’esposizione) 

delle lezioni, molto spesso le dimostrazioni – specie quelle piú lunghe – sono 

omesse. Per queste, per ulteriori esempi, nonché per una formulazione più 

completa dei problemi e del quadro teorico, si rimanda ai due libri menzionati. 

Si assume (come da pratica del corso) che gli studenti siano già stati esposti (nei 

corsi del primo anno) alle nozioni basilari della geometria euclidea del piano R 2 

e nello spazio R 3 . 

AVVISO IMPORTANTE: 

V ersione numero 0, December5, 2007, Soggetta a cambiamenti 

Commenti e correzioni sono benvenuti. 

1

Contents 

1 Spazi vettoriali 3 

1.1 Generatori, basi (in)dipendenza lineare . . . . . . . . . . . . . . 4 

2 Applicazioni lineari e matrici 5 

3 Determinanti e matrici inverse 14 

4 Autovalori ed Autovettori 23 

5 Prodotti scalari e hermitiani. 29 

6 Spazi euclidei e normati 31 

6.1 Ortogonalità e sue prime applicazioni . . . . . . . . . . . . . . . 32 

7 Operatori Hermitiani (simmetrici) 36 

7.1 Uno spazio euclideo notevole . . . . . . . . . . . . . . . . . . . . 41 

2

1 Spazi vettoriali 

La nozione di spazio vettoriale formalizza le proprietà algebriche fondamentali 

dei vettori (applicati nello stesso ”punto”, cioè con l’origine coincidente) nello 

spazio ”fisico” E 3 . Come si vedrà, tali proprietà sono proprie di elementi di altri 

spazi (e.g., spazi di funzioni). 

Definizione 1.1 Sia F il campo dei numeri reali R o quello dei complessi C 

(spesso, se non si deve distinguere, ci si riferisce agli elementi di F come agli 

scalari). Uno spazio vettoriale V su F è un insieme dotato di due ”operazioni”: 

1. Somma , + : V × V → V, 

2. Moltiplicazione per uno scalare ·F × V → V, 

che soddisfano le proprietà elementari della somma e moltiplicazione per uno 

scalare dei vettori dello spazio E 3 , ovvero (nella lista qui sotto, lettere a, b, . . . 

rappresentamo scalari, mentre lettere u, v, x, y . . . indicano vettori): 

• Commutatività x + y = y + x a · x = x · a, ∀a, x, y. 

• Associatività (x + y) + z = x + (y + z), ∀ x, y, z. 

• Esistenza dello zero e dell’opposto Esiste un (unico) vettore 0 ∈ Vt.c.v + 

0 = v, ∀ v; Per ogni v ∈ V esiste (unico) un elemento (−v)t.c.v+(−v) = 0 

• Proprietà che connettono + e · Le operazioni in V sono ”compatibili” con 

quelle note in F; per esempio, 

(a + b) · v = a · v + b · v. 

Si noti che in questa ultima equazione, il simbolo + nella parte sinistra 

indica la somma di numeri, mentre il simbolo + a destra è la somma di 

elementi di V. 

Esempio 1. Lo spazio delle n-uple (ordinate) di elementi di F è uno spazio 

vettoriale, quando si definiscano la somma e la moltiplicazione per uno scalare 

nel seguente modo: 

(x 1 , x 2 , · · · , x n ) + (y 1 , y 2 , · · · , y n ) := (x 1 + y 1 , x 2 + y 2 , · · · , x n + y n ) 

a · (x 1 , x 2 , · · · , x n ) := (ax 1 , ax 2 , · · · , ax n ), 

ovvero, come si dice abitualmente, componente per componente. 

Esempio 2. Sia I un intervallo di R, e sia C I lo spazio delle funzioni (possibilmente 

continue) definite su I a valori reali (o complessi), ovvero: 

C I := {f : I → F} 

3

Questo spazio è vettoriale, definendo la somma di due funzioni e la moltiplicazione 

di una funzione per uno scalare nel modo solito, ovvero: 

(f 1 + f 2 )(x) := f 1 (x) + f 2 (x); (af)(x) := a f(x). 

Esempio 3. Fissiamo un numero naturale N, e consideriamo l’insieme P n 

dei polinomi di grado N. Allora la nozione usuale di somma di polinomi e di 

moltiplicazione di un polinomio per un numero forniscono a P n la struttura di 

spazio vettoriale. 

Esempio 4 Sia a(t) x ′′ + b(t)x ′ + c(t)x = 0 un’equazione differenziale lineare 

omogenea del secondo ordine. Lo spazio delle sue soluzioni è uno spazio 

vettoriale. 1 Questo è un modo compatto di dire che la somma di due soluzioni 

dell’equanzione in questione è ancora una soluzione, e che se moltiplichiamo 

una soluzione per uno scalare (cioè un numero, identificabile con una funzione 

costante), otteniamo ancora una soluzione dell’equazione. La affermazione che 

l’integrale generale della equazione a(t) x ′′ +b(t)x ′ +c(t)x = 0 è la somma di due 

soluzioni indipendenti è un altro modo di dire che lo spazio della soluzioni ha 

dimensione 2. In generale, se l’equazione diferenziale ha ordine n, la dimensione 

dello spazio delle sue soluzioni ha dimensione n. 

1.1 Generatori, basi (in)dipendenza lineare 

Sia V uno spazio vettoriale. Si dice che un insieme di elementi {v 1 , v 2 , · · · , v n } 

è un insieme (finito) di generatori per V , o anche che {v 1 , v 2 , · · · , v n } generano 

V se ogni elemento x ∈ V può essere scritto come combinazione lineare degli 

elementi {v 1 , v 2 , · · · , v n }; in una formule, se 

∀w ∈ V esistono n scalari 

a 1 , a 2 , · · · , a n tali che w = a 1 v 1 + a 2 v 2 + · · ·a n v n . 

(1.1) 

Si dice che un insieme di elementi di V è linearmente dipendente se esiste una 

loro combinazione lineare che dia come risultato il vettore 0, con coefficienti non 

tutti nulli, ovvero, in formule 

0 = 

n∑ 

a n v n = 0, con almeno uno degli a k ≠ 0. 

k=1 

Nel caso contrario, (cioè, se l’unica combinazione lineare dei v i che dia il vettore 

0 è quella con tutti i coefficienti a k = 0), l’insieme {v 1 , v 2 , · · · , v n } si dice 

linearmente indipendente. 

Se uno spazio vettoriale V ammette un insieme finito di generatori, esso si 

dice finito dimensionale. Dato un sistema di generatori V = {v 1 , v 2 , · · · , v n } di 

uno spazio vettoriale, possono accadere due situazioni: 

1 Questa proprietà è vera per equazioni differenziali lineari omogenee di qualsiasi ordine. 

4

1. V è linearmente indipendente; 

2. V è linearmente dipendente. 

Nel caso 2) è facile rendersi conto che è possibile (iterativamente) arrivare a 

selezionare un sottoinsieme stretto V ′ V che è ancora un insieme di generatori 

di V , e soddisfa la proprietà 1), ovvero è possibile selezionare un numero 

”minimale” di elementi di V che generino ancora V . 

Definizione 1.2 Sia V finito-dimensionale. Un insieme lineramente indipendente 

di generatori di V è detto base di V . Si dimostra che il numero di elementi 

in due basi distinte di V è lo stesso. Questo numero è detto dimensione di V . 

Uno spazio vettoriale che non ammette alcun sistema fnito di generatori si dice 

infinito-dimensionale. 

Esempio 1, cos(2x), sin 2 (x) non sono indipendenti nello spazio delle funzioni 

periodiche. Infatti, una delle possibili forme della regola di duplicazione degli 

archi è 

cos(2x) = cos 2 (x) − sin 2 (x) = 1 − 2 sin 2 (x), 

ovvero 

cos(2x) − 1 + 2 sin 2 (x) = 0 

2 Applicazioni lineari e matrici 

In questa sezione, salvo dove espressamente indicato, gli spazi vettoriali (o, 

altrimenti detto, lineari) considerati saranno di dimensione finita. 

Siano V e W due spazi lineari di dimensione rispettivamente M ed N, e sia 

L : V → W 

una applicazione lineare. Fissiamo due basi {v 1 , v 2 , . . ., v M } e {w 1 , w 2 , . . .,w N } 

rispettivamente in V e W. Lo scopo è trovare una rappresentazione opportuna 

di L. 

La prima osservazione è la seguente: per conoscere il valore che la applicazione 

lineare (che è una “funzione”) L assume su un qualsiasi x ∈ V , è 

sufficiente conoscere i valori L(v i ), i = 1, . . .,M che L assume sugli elementi 

della base considerata. 

Infatti, dato che {v i } i=1,M è una base di V , ogni vettore x ∈ V si rappresenta 

in uno ed un solo modo come combinazione lineare di elementi della base, ovvero 

x = 

M∑ 

x i v i ; 

i=1 

5

Dato che L è lineare si ha: 

M∑ 

L(x) = L( x i v i ) = 

i=1 

M∑ 

x i L(v i ) 

il che “dimostra” l’affermazione. 

Ora, per ogni i fissato, consideriamo il vettore L(v i ) ∈ W; dato che la 

famiglia {w 1 , . . .,w N } è una base in W, potremo sviluppare questo vettore lungo 

tale base; in altre parole, sono univocamente determinati, (per ogni valore di 

i = 1, . . .,M), gli N scalari l ji tali che valga: 

N∑ 

Per i fissato, i = 1, . . .,M, L(v i ) = l ji w j . (2.1) 

Quindi, date le due basi {v i } e {w j } in V e W, per le proprietà note delle basi in 

uno spazio lineare, risultano definiti univocamente gli N · M scalari l ji definito 

da (2.1). 

Notando che tali scalari hanno, in modo naturale, un doppio indice (osserviamo 

che, in generale, N ≠ M), è naturale arrangiarli in una tabella, che per convenzione 

– e comodità, come si vedrà dopo – avrà N(= dimensione del codominio) 

righe ed M = dimensione del dominio colonne, come qui sotto: 

⎧ 

⎪⎨ 

Nrighe 

⎪⎩ 

i=1 

j=1 

Mcolonne 

⎡{ }} ⎤{ 

l 11 l 12 · · · l 1M 

l 21 l 22 · · · l 2M 

. . . . 

⎢ 

⎥ 

⎣ 

⎦ 

l N1 l N2 · · · l NM 

Tale tabella si chiama Matrice rappresentativa di L nelle basi {v i } e {w j }; i 

numeri l ij vengono anche detti elementi di matrice di L relativi alle basi considerate. 

Dunque, dati due spazi V e W, (rispettivamente di dimensione M ed N), 

muniti di base (risp.{v 1 , v 2 , . . .,v M } e {w 1 , w 2 , . . .,w N }) , ad un operatore lineare 

possiamo associare una matrice ad N righe ed M colonne (detta matrice 

N × N). È vero anche il viceversa, ovvero che a due spazi muniti di base come 

sopra ed ad una matrice ad N righe ed M colonne L = {l ij } possiamo associare 

univocamente un operatore lineare. 

Basta procedere a ritroso: Consideriamo, per i = 1, . . .,M i vettori y i in W 

definiti da 

M∑ 

y i = l ji w j 

j=1 

6

e diciamo che tali vettori y i sono i valori che l’opratore (da costruire) L assume 

sui vettori di base, ovvero, definiamo L(v i ) := y i . Per quanto detto all’inizio 

della sezione, questo basta per definire L, come operatore lineare, su un qualsiasi 

vettore x ∈ V ; infatti, ponimao per definizione, 

M∑ 

M∑ M∑ 

se x = x i v i , allora L(x) := x i y i ≡ x i L(v i ). (2.2) 

i=1 

È immediato verificare che la formula qui sopra definisce (per costruzione!) una 

applicazione lineare. Questo procedimento si chiama “estensione per linearità” 

di una funzione definita sugli elementi di una base. 

Osservazione 1. Un modo esplicito per costruire la matrice rappresentativa 

L di un operatore L : V → W rispetto alle basi {v 1 , v 2 , . . .,v M } e 

{w 1 , w 2 , . . .,w N } di V e W è il seguente: Si considera il primo vettore della base 

v 1 , si calcola L(v 1 ) e lo si sviluppa lungo la base dei w j come L(v 1 ) = ∑ N 

j=1 l j1w j ; 

questo dà luogo ad una N-upla di scalari {l 11 , l 21 , . . .,l N1 }; Tale N-upla (ordinata) 

forma la prima colonna della matrice L; considerando il secondo vettore 

v 2 , si calcola L(v 2 ) e si ottiene un’altra N-upla di scalari, {l 12 , l 22 , . . .,l N2 }, che 

va a formare la seconda colonna di L; e così via, fino all’ultimo elemento della 

base di V , v M . Esempio. La matrice rappresentativa dell’applicazione lineare 

0, che associa ad igni vettore di V il vettore 0 ∈ W, è la matrice in cui tutti gli 

elementi sono nulli. 

Sia W = V ; la matrice che rappresenta l’applicazione lineare identità (Id(x) = 

x, ∀x ∈ V ) è la matrice il cui elemento 1 ij è 1 se i = j, e 0 altrimenti, ovvero, 

in simboli ij = δ ij , dove δ ij è il simbolo di Kronecker. Graficamente, 1 è una 

matrice quadrata (il numero di righe è uguale a quello delle colonne) con 1 sulla 

diagoinale principale (quella che va da alto-sx a basso-dx) e 0 in tutti gli altri 

“posti”. 

Esempio(Meno banale). Sia V lo spazio dei polinomi in una indeterminata t 

di grado d ≤ 2, e W lo spazio dei polinomi (sempre in T) di grado non superiore 

a 3. Consideriamo in V la base {v 1 = 1, v 2 = t −1, v 3 = t 2 −2t}, e in W la base 

standard, {w 1 = 1, w 2 = t, w 3 = t 2 , w 4 = t 3 }; consideriamo l’operatore 

L : V → W 

p(t) ↦→ 

d p(t) + (2 + t)p(t) + ∫ t 

p(s)ds, 

dt 0 

ed esemplifichiamo le costruzioni fatte in questo caso. 

Per prima cosa, notiamo che L è ben definito; infatti, l’integrale di un polinomio 

di ordine p è un integrale di ordine al più p+1, e quindi L manda elementi 

di V in elementi di W. La linearità di L è evidente. Verifichiamo prima che 

la famiglia {v 1 , v 2 , v 3 } sia una base di V ; la dimensione di V è 3, quindi basta 

verificare l’indipendenza lineare dei v i . Supponiamo che ∑ 3 

i=1 c iv i = 0 (ovvero 

consideriamo una combinazione lineare dei polinomi v i che dia il polinomio nullo. 

Si avrà: 0 = c 1 (1) + c 2 (t − 1) + c 3 (t 2 − t) = 0. raccogliendo le potenze di t si ha 

i=1 

i=1 

0 = (c 1 − c 2 ) + (c 2 − c 3 )t + c 3 t 2 ( come polinomio), 

7

ovvero, per il principio di identità dei polinomi, {c 3 = 0, (c 2 −c 3 ) = 0, (c 1 −c 2 ) = 

0}. Ma la soluzione di queste equazioni è c 1 = c 2 = c 3 = 0, e dunque i v i sono 

indipendenti. 

Dato che (t n ) ′ = nt n−1 , e ∫ t 

0 sn ds = 1 

n + 1 tn+1 , si ha: 

L(v 1 ) = d ∫ t 

dt (1) + (2 + t) 1 + ds = 0 + (2 + t) + t = 2 + 2t 

0 

2w 1 + 2w 2 + 0w 3 + 0w 4 (a); 

L(v 2 ) = d ∫ t 

dt (t − 1) + (2 + t)(t − 1) + (s − 1)ds = 1 + (t 2 + t − 2) + 1 2 t2 − t = −1 + 3 2 t2 = 

L(v 3 ) = d dt (t2 − t) + (2 + t)(t 2 − t) + 

0 

= −1w 1 + 0w 2 + 3 2 w 3 + 0w 4 (b); 

∫ t 

= 4 3 t3 + 1 2 t2 − 1 = −1w 1 + 0w 2 + 1 2 w 3 + 4 3 w 4 (c). 

0 

(s 2 − s)ds = 2t − 1 + (t 3 + t 2 − 2t) + ( 1 3 t3 − 1 2 t2 ) = 

(2.3) 

Le colonne della matrice (4 × 3) L che vogliamo costruire si leggono ordinatamente 

da (a), (b), (c) di questa equazione. Ovvero: 

⎡ ⎤ 

2 −1 −1 

2 0 0 

L = 

3 1 

0 

2 2 

⎢ ⎥ 

⎣ 4 ⎦ 

0 0 

3 

Se avessimo voluto calcolare la matrice che rappresenta L, rispetto alle basi 

standard sia di V che di W, avremmo dovuto calcolare: 

L(v ′ 1 ) = L(v 1) = 2 + 2t 

L(v 2 ′ = d ∫ t 

dt (t) + (2 + t)(t) + s ds = 1 + 2t + 3 2 t2 

L(v ′ 3 ) = d dt (t2 ) + (2 + t)(t 2 ) + 

0 

∫ t 

0 

s 2 ds = 2t + 2t 2 + 4 3 t3 

8

e, dunque, la matrice che rappresenta L nelle basi standard è 

⎡ ⎤ 

2 1 0 

2 2 2 

L ′ = 

0 3 2 

2 

⎢ ⎥ 

⎣ 4 ⎦ 

0 0 

3 

Nota. Da questo esempio, si evince la necessità di specificare le basi nella 

costruzione della matrice rappresentativa di un operatore. Infatti, nel nostro 

caso si ha che lo stesso operatore è rappresentato su basi diverse da diverse 

matrici. Questo punto verrà ulteriormente esaminato più oltre. 

Osserviamo che la formula (2.2) fornisce un modo algoritmico e rapido per 

calcolare il valore L(x) – o meglio, lo sviluppo di L(x) nella base dei w k , una 

volta noti lo sviloppu di x ∈ V sulla base dei v i , e la matrice L rappresentativa 

di L nelle basi considerate. 

Infatti, lo sviluppo di x sui v i sarà della forma x = ∑ i v i; allora, 

M∑ M∑ ∑ M∑ N∑ 

L(x) = L( x i v i ) = x i L(v i )) = (l ji w j ); 

i=1 

i=1 

Scambiando l’ordine della somma nell’ultima espressione (cosa lecita) si ha 

⎛ 

L(x) = ∑ j 

j 

∑ 

⎜ l ji x i 

⎟ 

⎝ i ⎠ w j 

} {{ } 

=(L(x)) j 

⎞ 

Ovvero, le componenti (L(x)) j di L(x) lungo la base w j di W sono dati dalle 

somme ∑ N 

i=1 l jix i . 

È comodo dare una visualizzazione grafica a questo procedimento. Consideriamo 

la matrice L, di elementi l ji e ordiniamo in una colonna le componenti 

x i di x lungo v i ; giustapponendo questi due oggetti, 

⎡ 

⎤⎛ 

⎞ 

l 11 l 12 · · · l 1M x 1 

l 21 l 22 · · · l 2M 

x 2 

. . . . 

. 

⎢ 

⎥⎜ 

⎟ 

⎣ 

⎦⎝ 

⎠ 

l N1 l N2 · · · l NM x M 

9 

i=1 

j+1

si vede che, e.g, la componente (L(x)) 1 è pari al “prodotto scalare” della prima 

riga di L (che e’ identificabile con la M-upla [l 11 , l 12 , · · ·l 1M ]) per la M-upla 

data da [x 1 , x 2 , · · · , x M ]. Analogamente, la componente (L(x)) 2 sarà data dal 

prodotto scalare della seconda riga di L con la M-upla delle x i etc. etc. 

Osservazione. Se W è dotato di una struttura euclidea ( , ) W , e la base w j 

è una base ortonormale, il calcolo degli elementi della matrice L si può effettuare 

attraverso il prodotto scalare; ovvero: 

l ji = (w j , L(e i )) W . 

Come è stato osservato più sopra, lo spazio degli operatori lineari ha una 

struttura di algebra. Ovvero, sono definite, per due operatori L 1 , L 2 : V → W, 

e per uno sclare α sono definite la somma (L 1 + L 2 ) : V → W e il prodotto per 

α, (α · L) : V → W. Inoltre, se L : V → W e Λ : W → Y , è definito il prodotto 

(cioè, la composizione) dei due operatori, 

T ≡ Λ ◦ L : V −→ Y 

x ↦→ Λ(L(x)) 

(2.4) 

Supponiamo, come prima che questi spazi siano dotati di basi, rispettivamente 

{v i } i=1,...,M , {w j } j=1,...,M , e {y k } k=1,...,P , dove M, N, P sono rispettivamente le 

dimensioni degli spazi V, W, e Y . 

È naturale domandarsi come si traducano, a livello di metrici rappresentative, 

le operazioni di somma, prodotto per uno scalare e composizione per i 

corrispondenti operatori lineari. 

Per le prime due operazioni, la risposta è immediata (e la verifica lasciata al 

lettore). 

A) La somma di due operatori definiti da V a valori in W è rappresentata dalla 

somma elemento per elemento delle corrispondenti matrici. Ovvero, se L 1 ha, 

rispetto alle basi considerate, elementi di matrice {l (1) 

ji } ed L 2 ha elementi di 

matrice {l (2) 

ji }, la somma S = (L 1 + L 2 ) avrà elementi di matrice dati da 

s i j = l (1) 

ji + l (2) 

ji 

Esempio. Siano L 1 , L 2 : R 2 → R 3 rappresentati da 

⎡ ⎤ ⎡ 

1 0 

0 2 

L 1 = ⎣ −1 2 ⎦ L 2 = ⎣ 4 −1 

0 4 

2 −5 

allora la somma S = (L 1 + L 2 ) è rappresentata dalla matrice 

⎡ 

⎤ ⎡ ⎤ 

1 + 0 0 + 2 1 2 

S = ⎣ −1 + 4 2 + (−1) ⎦ = ⎣ 3 1 ⎦ 

0 + 2 4 + (−5) 2 −1 

⎤ 

⎦ ; 

10

L’operazione di composizione di due matrici merita, invece, uno sguardo 

più attento. Consideriamo la relazione (2.4). Chiamiamo L e Λ le matrici che 

rappresentano, rispettivamente, L : V → W e Λ : W → Y ; i loro elementi 

saranno [l j,i ] j=1,...,N 

i=1,...,M e [λ k,j] k=1,...,P 

j=1,...,N 

. Il nostro problema è esprimere gli elementi 

della matrice T che rappresenta T : V → Y , T = Λ ◦L in termini degli elementi 

di matrice l ji , λ kj ; ovvero, considerato l’i-esimo elemento v i della base di V , 

dobbiamo sviluppare T(v i ) sulla base assegnata degli y k , ovvero scrivere 

Ora, 

T(v i ) = 

P∑ 

t ki y k . (2.5) 

k=1 

T(v i ) = Λ(L(v i )) = (Per la definizione dei l ji ) = Λ( 

= (Per la linearità di Λ) = 

= 

N∑ 

l ji w j ) = 

j=1 

N∑ 

l ji Λ(w j ) = Per la definizione dei λ jk = 

j=1 

( 

N∑ ( ∑ 

P ) ) 

l ji λ kj y j = 

j=1 

k=1 

(Scambiando l’ordine delle due somme finite e dei fattori numerici l ji e λ kj ) 

( 

P∑ N 

) 

∑ 

= (λ kj l ji y k . 

k=1 

j=1 

Confrontando quest’ultima espressione con la (2.5) otteniamo il risultato desiderato: 

N∑ 

t ki = (λ kj l ji . (2.6) 

j=1 

A parole: l’elemento di posto (k, i) della matrice T associata alla composizione 

dei due operatori Λ e L (in quest’ordine, ovvero T = Λ◦L si calcola nel seguente 

modo, una volta note le matrici rappresentative di Λ e ̷L: 

si considerano la k-esima riga di Λ e la i-esima colonna di L (entrambe sono 

N-uple di scalari) e se ne fa il “prodotto scalare” (in R n ). 

Esempio. Sia M = 2, N = 3, P = 4. Allora Λ e L sono le matrici (risp. 4 × 2 e 

3 × 2) 

Λ = 

⎡ 

⎢ 

⎣ 

⎤ 

λ 11 λ 12 λ 13 

λ 21 λ 22 λ 23 

λ 31 λ 32 λ 33 

λ 41 λ 42 λ 43 

⎡ 

⎥ 

⎦ L = ⎣ 

⎤ 

l 11 l 12 

l 21 l 22 

⎦ (2.7) 

l 31 l 22 

La matrice T manda uno spazio vettoriale di dimensione 2 in uno di dimensione 

4, quindi sarà una matrice 4 × 2. L’elemento, e.g., di posto (3, 2) della matrice 

11

T si ottiene facendo il prodotto scalare del “vettore a tre componenti” 

⎡ ⎤ 

l 12 

[λ 31 , λ 32 , λ 33 ] con il “vettore a tre componenti” ⎣ l 

} {{ } 

22 

⎦ 

terza riga di Λ 

l 32 

} {{ } 

seconda colonna di L. 

Si ottiene, esplicitamente, 

T 32 = λ 31 l 12 + λ 32 l 22 + λ 33 l 32 . 

In termini algoritmici, per calcolare la matrice T basta giustapporre la matrici 

Λ e L come nella (2.7), e ripetere il procedimento esplicitato qui sopra facendo 

variare gli indici di riga di T (qui da 1 a 4) e di colonna di T (qui da 1 a 2). 

Si dice che la matrice T è il prodotto righe per colonne delle matrici Λ e L, 

e si scrive T = Λ · L 

Osservazione. Consideriamo il caso di matrici che rappresentano operatori 

con dominio e codominio coincidenti (ovvero di operatori L : V → V , per 

qualche spazio V di dimensione M, dotato di una base {v i } i=1,...,M ); Chiamiamo 

questo spazio Mat(N). Le operazioni che abbiamo considerato (somma, 

prodotto per uno scalare, e prodotto righe per colonne, che viene chiamato 

prodotto tout court) sono compatibili l’una con l’altra (per esempio, (L 1 + L 2 ) · 

L 3 = L 1 · L 3 + L 2 · L 3 , e così via). 

Rispetto al prodotto di scalari, ci sono però due importanti differenze: 

1. Per il prodotto di numeri reali (o complessi), la equazione a·b = 0 implica 

che o a = 0 o b = 0 (eventualmente entrambi). Ciò non è vero per il 

prodotto di due matrici. 

Consideriamo ad esempio le due matrici 

( 0 1 

M 1 = 

0 0 

) 

, M 2 = 

( 1 0 

0 0 

) 

. (2.8) 

Entrambe sono non nulle (la matrice nulla, introdotta più sopra, è quella 

in cui tutti gli elementi sono nulli); peraltro, 

( ) ( ) ( ) 

0 1 1 0 0 0 

M 1 · M 2 = · = = 0. 

0 0 0 0 0 0 

2. Per il prodotto tra scalari, vale la proprietà di commutatività, ovvero, 

a · b = b · a, ∀ a, b. 

Questo non è più vero, in generale per il prodotto tra matrici (ovvero, per il 

prodotto(=composizione) di due operatori lineari in uno spazio vettoriale). 

12

Le due matrici definite in (2.8) forniscono un esempio di questo fenomeno. 

Infatti, abbiamo già verificato che M 1 · M 2 = 0. Viceversa, 

( ) ( ) ( ) 

1 0 0 1 0 1 

M 2 · M 1 = · = ≠ 0. 

0 0 0 0 0 0 

È d’uso definire la differenza dei prodotti M 1 · M 2 − M 2 · M 1 commutatore tra 

(in quest’ordine) M 1 ed M 2 , e denotarla come 

Si osservi che 

M 1 · M 2 − M 2 · M 1 := [M 1 , M 2 ] 

[M 1 , M 2 ] = −[M 2 , M 1 ] 

Osservazione. L’affermazione che due matrici non commutano in generale 

non significa che, date due matrici M 1 ed M 2 non valga mai M 1 · M 2 = M 2 · 

M 1 ; per esempio, le matrici 0 e 1 commutano con qualsiasi altra matrice. La 

affermazione significa piuttosto che fissata una matrice M 1 , la condizione su 

un’altra matrice M 2 di commutazione con M 1 è, in generale, non banale. 

Esempio. Sia M una matrice 2 × 2 della forma 

M = 

( 

a 0 

0 b 

) 

, a ≠ b, 

e sia L una matrice 2 × 2 generica, 

( ) 

L11 L 

L = 12 

. 

L 21 L 22 

Allora il commutatore [M, L] è dato da 

( ) ( ) ( ) ( a 0 L11 L 

[M, L] = · 12 L11 L 

− 12 a 0 

· 

0 b L 21 L 22 L 21 L 22 0 b 

) 

= 

= 

( ) ( ) ( 

aL11 aL 12 aL11 bL 

− 

12 

= 

bL 21 bL 22 aL 21 bL 22 

0 (a − b)L 12 

(b − a)L 21 0 

) 

. 

Ovvero, L commuta con M se e solo se i suoi elementi fuori della diagonale 

L 12 , L 21 sono nulli. 

Esercizio. Dimostrare che questo è vero per matrici N × N. 

Esercizio. Calcolare i tre commutatori [σ i , σ j ], i < j, dove le matrici complesse 

σ i , i = 1..3 sono date rispettivamente da 

σ 1 = 

( 0 1 

−1 0 

) 

, σ 2 = 

( 0 i 

i 0 

) ( i 0 

, σ 3 = 

0 −i 

) 

. (2.9) 

Queste matrici (o, talvolta, il loro prodotto con −i) sono dette matrici di Pauli e 

giocano un ruolo importante nella teoria del momento angolare intrinseco degli 

13

elettroni e di altre particelle elementari. 

Esempio La proprietà di non–commutatività è una proprietà intrinseca degli 

operatori e non dipende dalla loro rappresentazione matriciale. Ad esempio, 

consideriamo lo spazio V = C ∞ (R) delle funzioni definite sull’asse reale (e.g., 

a valori reali), derivabili un numero arbitrario di volte. Consideriamo i due 

operatori: 

ˆx : V → V 

f(x) ↦→ xf(x) , ˆ∂ : V → V 

f(x) ↦→ f ′ (x) . (2.10) 

A parole, ˆx associa ad una funzione f il prodotto tra f e la funzione x, mentre 

ˆ∂ associa ad una funzione la sua derivata prima. È immediato verificare che 

questi due operatori sono ben definiti. Infatti, la derivata prima di una funzione 

derivabile un numero arbitrario di volte è anch’essa derivabile un numero arbitrario 

di volte, e il prodotto xf(x) è derivabile un numero arbitrario di volte. 

La linearità di queste due operazioni è ovvia. 

Vogliamo calcolare [ˆ∂, ˆx]. 

Per una qualsiasi funzione f(x), si ha: 

(ˆ∂ ◦ ˆx)(f)(x) = d 

dx (xf(x)) = f(x) + xf ′ (x); 

mentre 

(ˆx ◦ ˆ∂)(f)(x) = x d 

dx (f(x)) = xf ′ (x); 

Sottraendo queste espressioni si verifica che, per ogni funzione f(x), si ha 

[ˆ∂, ˆx](f(x)) = f(x), 

e dunque si ottiene [ˆ∂, ˆx] = 1. 

Questa relazione (o, meglio, la corrispondente con l’operatore −iˆ∂, dove è 

una costante fondamentale, la cui dimensione è quella di un momento angolare, 

detta costante di Planck ridotta 2 ) è fondamentale in meccanica quantistica. 

3 Determinanti e matrici inverse 

Come è stato asserito in una delle lezioni precedenti, se la applicazione lineare 

L : V → W è invertibile (cioè è iniettiva e suriettiva), la sua inversa è ancora una 

applicazione lineare. Vogliamo, in questa lezione, approfondire questo concetto. 

Per prima cosa, si può osservare che il dato di una applicazione lineare 

definisce due sottospazi vettoriali notevoli, 

Ker(L) ⊂ V := {x ∈ V|L(x) = 0}, 

Im(L) ⊂ W := {y ∈ W |y = L(x) per qualche x ∈ V } 

(3.1) 

2 Ridotta significa divisa per 2π 

14

Il primo spazio si chiama nucleo (detto Ker dall’inglese kernel), il secondo Immagine 

di L. Verifichiamo che Ker(L) è un sottospazio vettoriale del dominio. 

Dobbiamo dunqie verificare che se x, y sono tali che L(x) = L(y) = 0, ogni loro 

combinazione lineare è ancora in Ker(L), ovvero, per igni scelta di scalari α, β, 

si ha 

L(α x + β y) = 0 

Questo segue dalla linarità di L. Infatti: 

L(α x + β y) = α L(x) + β L(y) = α 0 + β 0 = 0. 

Analogamente si verifica che Im(L) è sottospazio vettoriale di W. U n legame 

notevole tar le dimensioni di questi due spazi è dato dal seguente teorema, che 

non dimostriamo: 

Proposizione 3.1 (Teorema della nullità più rango) Se V e W sono di dimensione 

finita vale che 

dimKer } {{ }(L) + } dimIm {{ }(L) = dimV. (3.2) 

nullità rango 

La prima conseguenza di questa formula è che se L : V → W con V e W di 

dimensione differente, allora L non può essere invertibile. Infatti questa formula 

dice (o meghlio ribadisce) che la dimensione dell’immagine di L non può eccedere 

quella del dominio V . Quindi, se dimW > dimV, L non può essre suriettivo. 

Viceversa, per definizione, dimIm(L) ≤ dimW; quindi se dimV > dimW, si ha, 

necessariamente dimKer(L) > 0. Questo significa che esiste almeno un vettore 

non nullo ξ nel nucleo di L; ma allora tutti i multipli di ξ sono nel nucleo, per 

la linearità di L, e dunque L non è iniettivo. 

Proposizione 3.2 Sia L : V → W un’operatore lineare tra spazi della stessa 

dimensione N; allora L è invertibile se e solo se Ker(L) = {0}. 

Dimostrazione. La necessità di questa affermazione è ovvia. Dato che L è 

lineare, L(0) = 0; se L è invertibile (cioè, in particolare, iniettivo), il suo nucleo 

non può contenere alcun altro elemento. 

La sufficienza è un po’ più sottile, e la dimostrazione serve, tar l’altro, a 

enucleare alcune osservazioni che verranno utili in seguito. Sia {v 1 , . . .,v N } una 

(qualsiasi) base di V . Allora gli N vettori L(v 1 ), . . .,L vN di W sono (indipendentemente 

dall’invertibilità o meno di L) un sistema di generatori per lo spazio 

vettoriale Im(L). Infatti, y ∈ Im(L) ⇐⇒ y = L(x), per x ∈ V . Sviluppando 

tale x lungo la base dei v i , si ha x = ∑ i x iv i ; dunque, 

L(x) = ∑ i 

x i L(v i ) 

il che dimostra l’affermazione. 

15

Ritornando al nostro caso, dobbiamo dimostrare che, se V e W hanno la 

stessa dimensione e il nucleo di L è ridotto al solo elemento 0 ∈ V , allora L è 

iniettivo e suriettivo. 

Per l’inietrtività si procede così: sia L(x) = L(y); allora L(x−y) = 0, ovvero 

x − y è nel nucleo di L. Ma dunque x − y = 0 ⇐⇒ x = y. 

Per la suriettività, consideriamo una combinazione lineare ∑ i c iL(v i ), e supponiamo 

che questa dia zero (in W), ovvero ∑ i c iL(v i ) = 0. Per la linearit1‘a 

di L, si ha 

0 = ∑ c i L(v i ) = ∑ L ( c i v i ) = L( ∑ c i v i ) 

i 

i 

i 

Dunque il vettore ∑ i c iv i è nel nucleo di L, e dunque è il vettore nullo, dato 

che sto supponendo Ker(L) = {0}. Ma v i é una base di V , e dunque i c i sono 

tutti nulli. Questo dimostra che gli N vettori L(v i ( sono anch’essi indipendenti, 

e dunque, dato che dim(W) = dimV = N formano una base di W. Ovvero, W 

ha una base formata da elemnti nell’immagine di L, e dunque L è suriettivo. 

Vogliamo ora caratterizzare ”operativamente” l’esistenza di inversi di operatori, 

in termini delle matrici rappresentative. Ciò si effettua tramite la generalizzazione 

al caso di dimensione N della nozione di determinante (che, nel caso 

di N = 3, come si è visto, nel corso di Matematica II (Stewart, §3) rappresenta 

il prodotto misto di tre vettori). 

Ricordiamo che, dati tre vettori v 1 , v 2 , v 3 nello spazio euclideo E 3 , sviluppati 

rispetto alla base ortonormale⃗i,⃗j, ⃗ k come 

v 1 = v 1 1 ⃗ i + v 1 2 ⃗ j + v 1 3 ⃗ k, v 2 = v 2 1 ⃗ i + v 2 2 ⃗ j + v 2 3 ⃗ k, v 3 = v 3 1 ⃗ i + v 3 2 ⃗ j + v 3 3 ⃗ k, 

il loro triplo prodotto misto v 1 · (v 2 × v 3 ) si calcola considerando la matrice 3 

⎡ 

M := ⎣ 

v1 1 v1 2 v1 

3 

v2 1 v2 2 v2 

3 

v3 1 v3 2 v3 

3 

e calcolando, per esempio rispetto alla prima colonna, 

det 3 M = 

v 

(−1) 1+1 (v1 2( 1 det 2 

2 v2 

3 

v3 2 v3 

3 

riordinando i termini 

⎤ 

⎦ 

) 

) + (−1) 2+1 v 1 2 (det 2( 

v 

2 

1 v 3 1 

v 2 3 v 3 3 

□ 

) 

) + (−1) 3+1 v 1 3 (det 2( 

v 

2 

1 v 3 1 

v 2 2 v 3 2 

v 1 1 v2 2 v3 3 + v2 1 v3 2 v2 3 + v3 1 v1 2 v2 3 − v1 1 v3 2 v2 3 − v2 1 v1 2 v3 3 − v3 1 v2 2 v1 3 . (3.3) 

) 

) = 

3 Nel corso di matematica II si considerava la matrice trasposta, ovvero con le righe scambiate 

con le colonne 

16

Ora, possiamo considerare la funzione Det 3 come una funzione che alla terna 

ordinata di vettori v 1 , v 2 , v 3 , cioè alle colonne delle loro componenti v j i associa 

un numero reale. Questa funzione gode delle seguenti proprietà: 

1. 

Det 3 ([cv 1 , v 2 , v 3 ]) = Det 3 ([v 1 , cv 2 , v 3 ]) = Det 3 ([v 1 , v 2 , cv 3 ]) ≡ c De 3 ([v 1 , v 2 , v 3 ]), 

ovvero se moltiplico una delle tre colonne per uno scalare il determinante 

è moltiplicato per lo stesso numero (omogeneità); 

2. Se, e.g., v 1 = x + y, allora 

(Additività) 

Det 3 ([v 1 , v 2 , v 3 ]) = Det 3 ([x, v 2 , v 3 ]) + Det 3 ([y, v 2 , v 3 ]) 

3. Se i, j, k è una permutazione di 1, 2, 3, allora 

4. 

Det 3 ([v i , v j , v k ]) = ±Det 3 ([v 1 , v 2 , v 3 ]), 

Dove il segno è + se la permutazione è pari (ovvero si ottiene con un 

numero pari di scambi di numeri adiacenti), ed è − se è dispari, ovvero si 

ottiene con un numero dispari di scambi elementari. (Completa antisimmetria). 

(Normalizzazione). 

Det 3 ([⃗i,⃗j, ⃗ k]) = 1 

Nel caso di spazi vettoriali a dimensione N, si considerano collezioni di N vettori, 

e si definisce una funzione Det, che alle N-uple di vettori (e dunque, considerando 

il loro sviluppo lungo una base, a matrici quadrate di ordine N) che 

gode delle (corrispettive) delle quattro proprietà qui ricordate. Questa funzione, 

si può, operativamente, definira in due modi: 

Iterativamente. Si osserva, dalla prima riga della (3.3) che il determinante di 

matrici 3 × 3 è definito attraverso il determinante di matrici 2 × 2, dove 

( ) 

v11 v 

Det 12 

2 = v 

v 21 v 11 v 22 − v 12 v 21 . (3.4) 

22 

Allora si definisce il determinante di una matrice N × N, Det(M) attraverso il 

suo sviluppo secondo una colonna, come segue. 

Si fissa una colonna, e.g., la k-esima; allora il determinante di M si scrive 

come somma di N termini, 

Det N (M) =m 1,k · (−1) 1+k Det N−1 ˜M1,k + 

m 2,k · (−1) 2+k Det N−1 ˜M2,k + 

· · ·+ 

m N,k · (−1) N+k Det N−1 ˜M N,k , 

17 

(3.5)

dove ˜M h,k è la matrice (N − 1) × (N − 1) che si ottiene dalla M rimuovendo la 

h-esima riga e la k-esima colonna. Si noti che la prima delle formule (3.3) segue 

queta regola, con k = 1 (prima colonna). 

Per via combinatoria Si considera l’insieme P N di tutte le permutazioni degli 

N numeri [1, 2, 3, . . ., N]; è noto che questo insieme (in effetti è un gruppo) è 

costituito da N! elementi, ed è generato da scambi elementari, ovvero tra due 

elementio adiacenti (e.g., lo scambio che manda [1, 2, 3, . . ., N] in [2, 1, 3 . . ., N]). 

Un elemento π è detto pari se si ottiene con un numero pari n π di scambi 

elementari, e dispari altrimenti. Il segno sgn(π) di una permutazione π ∈ P N 

è, per definizione, il numero (−1) nπ (cioè è 1 se la permutazione è pari, −1 se è 

dispari. 

Data una matrice N × N, M, con elementi m ij , si può definire/calcolare il 

suo determinante attraverso la formula 

Det N (M) = ∑ 

sgn(π) M 1π(1) M 2 π(2) · · ·M N π(N) (3.6) 

} {{ } 

π∈P N 

N termini 

La seconda riga della (3.3) dà un esempio di tale fomula. Si noti che il numero 

delle permutazioni della stringa [1, 2, 3] è 3! = 6; le permutazioni [1, 2, 3], [2, 3, 1], [3, 1, 2] 

sono pari, le permutazioni [2, 1, 3], [1, 3, 2], [3, 2, 1] sono dispari. 

Vale che: 

• Il determinante definito attraverso la (3.5) coincide con quello definito 

attraverso la (3.6). 

• Il determinante così efinito per matrici N ×N (ovvero per N-uple di vettori 

in uno spazio N-dimensionale dotato di una base gode delle proprietà 1–4 

del prodotto triplo di vettori in E 3 . 

Ulteriori proprietà notevoli del determinante, che si desumono agevolmente dalla 

proprietà base e/o dalla definizione sono: 

1. Il determinante della matrice identità 1 N è 1. 

2. data una matrice M ad elementi m ij , si definisce la sua trasposta come la 

matrice ottenuta scambiando le righe di M con le sue colonne, ovvero la 

matrice M T il cui elemento di posto ij è l’elemento m ji (pittoricamente, 

si scambiamo gli elementi di M con una riflessione lungo la diagonale 

principale). Allora vale che 

Det(M) = Det(M T ) 

3. Una matrice si dice triangolare superiore (risp. inferiore) se tutti gli elementi 

sopra (risp. sotto) la diagonale principale sono nulli. Il determinante 

di una matrice triangolare superiore (inferiore) è il prodotto degli 

elementi sulla diagonale principale. 

18

4. (Teorema di Binet) Il determinante del prodotto righe per colonne di due 

matrici è il prodotto dei determinanti, i.e. 

Det(M 1 · M 2 ) = Det(M 1 ) Det(M 2 ) 

5. Se due colonne (o righe, per quanto detto sopra) di M sono linearmente 

dipendenti, allora 

Det(M) = 0 

Per il prodotto triplo di tre vettori, questa proprietà è ben nota. In effetti 

questa è una conseguenza diretta delle proprietà 1 e 2 della lista. 

Vale anche il converso dell’ultima proprietà, espressa dalla seguente relazione: 

Proposizione 3.3 Det(M) ≠ 0 se e solo se le colonne (e le righe) di M sono 

lineramente indipendenti. 

Un’altra proprietà è la seguente. Se Det(M) ≠ 0 allora è definita univocamente 

l’inversa (denotata M −1 ) della matrice M, che soddisfa le relazioni definitorie 

M −1 · M = M · M −1 = 1. (3.7) 

La matrice M −1 si calcola nel seguente modo: in analogia alla nella (3.5) associamo 

alla matrice M la matrice ̂M definita nel seguente modo: 

̂M ij = (−1) i+j Det(˜M ij ), 

dove, come sopra,è la matrice (N −1)×(N −1) che si ottiene dalla M rimuovendo 

la i-esima riga e la j-esima colonna. 

Questa matrice si chiama matrice ”cofattore” (il suo elemento ij è, come si 

può vedere, il coefficiente (”cofattore”) del termine m ij nello sviluppo (3.6) del 

determinante di M). Allora, la matrice inversa M −1 è la trasposta di ̂M divisa 

per il determinante di M. Si noti che dal teorema di Binet segue che 

Det(M −1 ) = 

1 

Det(M) . 

Proposizione 3.4 Sia L : V → V un operatore lineare; allora L è invertibile 

se e solo se per una (e dunque, come si vedrà, per ogni) sua rappresentazione 

matriciale L = [l ij ], si ha Det(L) ≠ 0. 

Dimostrazione. Abbiamo visto più sopra che L è invertibile se e solo se, data 

una base v i i vettori L(v i ) sono linearmente indipendenti. Ma le colonne della 

matrice L che rappresenta L nella base v i sono proprio le componenti dei vettori 

L(v i ). Quindi L è invertibile se ammette una rappresentazione matriciale con 

una matrice invertibile. La proprietà è indipendente dalla scelta della base. 

19

Infatti, se v i ′ è un’altra base di V , risultano definiti univocamente gli N 2 numeri 

G ij tali che 

v i ′ = ∑ G ji v i 

j 

Evidentemente, vale che se 

v i = ∑ j 

G ′ jiv ′ j 

allora, le due matrici G ′ e G sono una l’inversa dell’altra. 

Se L è la matrice che rappresenta L nella base dei v i , la matrice L ′ 

rappresenta L nella base dei v i ′ è data dal prodotto 

che 

L ′ = G −1 LG 

(la verifica della validità di questa affermazione è immediata). Dunque dal 

teorema di Binet, 

Det(L ′ ) = Det(G −1 LG) = Det(G −1 )Det(L)Det(G) = Det(L). 

Per il futuro, è utile sottolineare le affermazioni qui sopra. La relazione 

□ 

v ′ i = ∑ j 

G ji v i 

si legge così: la rappresentazione matriciale di L nella base v i ′ si ottiene coniugando 

(ovvero con il prodotto G −1 LG) la matrice che rappresenta L nella base 

dei v i con la matrice le cui colonne sono le componenti dei vettori della nuova 

base rispetto alla precedente. 

Osservazione. Dalla legge di coniugio si deduce la seguente affermazione: 

affermazioni concernenti una rappresentazione matriciale di un operatore L sono 

intrinseche, ovvero proprie dell’operatore L se e solo se sono invarianti per coniugio 

tramite una qualsiasi matrice invertibile G. Ad esempio: 

L 12 è nullo non è invariante per coniugio. 

L 13 + L 24 = 3 non è invariante per coniugio. 

Invece: 

Da sopra, il determinante di un operatore si definisce come il determinante di 

una sua (qualsiasi) rappresentazione matriciale. 

Un’altra proprietà: definiamo la Traccia di un operatore nel seguente modo. 

Consideriamo una (qualsiasi) rappresentazione matriciale L di L, e definiamo 

n∑ 

Tr(L) = L ii , 

ovvero la somma degli elementi diagonali della matrice L. Verifichiamo che il 

numero Tr(L) è indipendente dalla rappresentazione matriciale. A questo scopo, 

ci serve il seguente 

20 

i=1

Lemma 3.5 Per ogni coppia di matrici A, B si ha 

Tr(AB) = Tr(AB). 

Considerato vero il lemma (vedi sotto) osserviamo che se L ′ è un’altra rappresentazione 

matriciale di L, deve esistere una matrice G (la matrice del cambiamento 

di base) per cui 

L ′ = G −1 LG. 

Dunque: 

Tr(L ′ ) = Tr(G} {{ −1 L} 

}{{} G ) = (Lemma) = Tr(G} {{ G −1 

} L) = Tr(L). 

=A =B 

=1 

Questo prova l’asserto, una volta che si sia provata la validità del lemma. Questa 

segue dal fatto che gli elementi sulla diagonale del prodotto AB è 

[AB] ii = ∑ k 

A ik B ki 

Dunque, 

Tr(AB) = 

n∑ 

[AB] ii = 

i=1 

n∑ 

i=1 

( n∑ 

k=1 

A ik B ki 

) 

= 

n∑ 

k=1 

( n∑ 

i=1 

B ki A ik 

) 

= 

n∑ 

[BA] kk = Tr(BA), 

k=1 

dove l’unico passaggio non banale è l’inversione (lecita) dell’ordine in quale 

vengono effettuate le somme sugli indici i e k (e il fatto che gli elementi A ij , B ij 

sono dei numeri reali (o complessi). 

Applicazioni delle nozioni qui esposte sono state già viste nella teoria delle 

equazioni lineari (eventualmente non omogenee). 

Consideriamo un sistema di N equazioni lineari non omogenee nelle M incognite 

{x 1 , x 2 , . . .,x M }. Queste si scrivono nella forma 

⎧ 

⎪⎨ 

⎪⎩ 

a 11 x 1 + a 12 x + a 13 x 3 + · · ·a 1M x M = b 1 

a 21 x 1 + a 22 x + a 23 x 3 + · · ·a 2M x M = b 2 

. 

(3.8) 

a N1 x 1 + a N2 x + a N3 x 3 + · · ·a NM x M = b N 

Qui, gli NM elementi a ji sono scalari (che possona naturalmente essere arrangiati 

in una matrice A = [a ji ] j=1,...,N 

i=1,...,M , mentre gli N scalari [b 1, b 2 , . . ., b N ] formano 

il cosiddetto vettore dei termini noti. Possiamo dunque pensare al lato sinistro 

di (3.8) come alla rappresentazione di un operatore L : R M → T M , rispetto 

alla nase standard dei due spazi coinvolti, ed al lato destro (cioè al vettore dei 

termini noti) come alla assegnazione di un vettore B ∈ R N . 

In questo senso, il problema della soluzione di (3.8) può essere riformulato 

in questo modo: 

21

Trovare un (tutti i) vettori [x 1 , x 2 , · · · , x M ] in R M che vengono mandati 

dalla applicazione A, rappresentata dalla matrice A = a ji nel vettore B = 

[b 1 , . . .,b N ] ∈ R N . 

In particolare, consideriamo il caso in cui N = M (la matrice A è dunque 

quadrata), e B = [0, 0, · · · , 0] (sistema omogeneo), ovvero il sistema 

⎧ 

a 11 x 1 + a 12 x + a 13 x 3 + · · ·a 1N x N = 0 

⎪⎨ a 21 x 1 + a 22 x + a 23 x 3 + · · ·a 2N x M = 0 

⎪⎩ 

. 

a N1 x 1 + a N2 x + a N3 x 3 + · · ·a NN x N = 0 

(3.9) 

Le soluzioni di questo sistema sono dunque gli elementi del nucleo dell’operatore 

A rappresentato dalla matrice quadrata [a ji ] i,j=1,...,N . Dalla teoria esposta più 

sopra, abbiamo che: 

1. Se DetA ≠ 0 il nucleo dell’operatore A, rappresentato dalla matrice A 

è solo il vettore nullo, cioè il sistema (3.11) ha solo la soluzione {x 1 = 

0, x 2 = 0, . . .,x N = 0}. 

2. Se Det(A) = 0 il nucleo dell’operatore A non è banale, cioè esiste almeno 

un vettore (e dunque tutti i suoi multipli scalari) ¯x non nullo nel nucleo. 

Se [¯x 1 , ¯x x , . . ., ¯x N ] sono le sue compenenti, questa N-upla fornisce una 

soluzione (detta non banale) del sistema lineare. 

Infine, nel caso Det(A) = 0, è naturale porsi il problema di come trovare una 

soluzione non banale del sistema. Per risolvere questo problema si possono fare 

le seguenti osservazioni/ipotesi: 

Det(A) = 0 significa che Det(A T ) = 0; quindi le colonne di A T (che sono le 

righe di A) non sono linearmente indipendenti. Questo vuole dire che c’è una 

equazione ”ridondante”, ovvero che una delle equazioni del sistema (3.11) è una 

combinazione lineare delle altre equazioni. Quindi per trovare le soluzioni del 

sistema in questione, posso considerare un sistema con una equazione in meno. 

Supponiamo di potere omettere l’ultima. Allora dobbiamo studiare le soluzione 

del sistema em ridotto (ad N variabili ed N − 1 equazioni) 

⎧ 

a 11 x 1 + a 12 x + a 13 x 3 + · · ·a 1N x N = 0 

⎪⎨ a 21 x 1 + a 22 x + a 23 x 3 + · · ·a 2N x M = 0 

⎪⎩ 

. 

a N−1,1 x 1 + a N−1,2 x + a N−1,3 x 3 + · · ·a N−1,N x N = 0. 

(3.10) 

Supponendo che il determinante della matrice (N − 1) × (N − 1) ottenuta dalla 

A rimuovendo l’ultima riga e l’ultima colonna, riscriviamo il sistema come un 

sistema di N − 1 equazioni in N − 1 incognite, considerando l’ultima variabile 

22

x N come un parametro, nella forma 

⎧ 

a 11 x 1 + a 12 x + a 13 x 3 + · · ·a 1,N−1 x N−1 = −a 1,N x N := β 1 

⎪⎨ a 21 x 1 + a 22 x + a 23 x 3 + · · ·a 2,N−1 x N−1 = −a 2,N x N := β 2 

⎪⎩ 

. 

a N−1,1 x 1 + a N−1,2 x + a N−1,3 x 3 + · · ·a N−1,N−1 x N−1 

= −a N−1,N x N := β N−1 

(3.11) 

Quest’ultimo sistema si considera, ora, come un sistema non omogeneo (ripetiamo, 

di N − 1 equazioni in N − 1 incognite), con matrice dei coefficienti Ã N,N 

che ha determinante non nullo. La soluzione a questo sistema si può trovare 

con la regola di Cramer, ed è data dal vettore (ad N − 1 componenti) 

⎡ ⎤ ⎡ ⎤ 

˜x 1 

β 1 

˜x 2 

β 2 

= Ã N,N ⎢ ⎥ ⎢ ⎥ 

⎣ . ⎦ ⎣ . ⎦ 

˜x N−1 ] β N−1 

In definitiva, la soluzione non banale del sistema degenere (3.8) è data dal 

vettore (ad N componenti) 

⎡ ⎤ 

−a 1N 

−a 2N 

x = x N · 

⎢ 

. 

⎥ 

⎣ −a N−1,N 

⎦ 

1 

Questa formula – valida nel caso in cui Det(Ã N,N ) ≠ 0 – fornisce, al variare di 

x N , le componenti del generico vettore del nucleo dell’operatore rappresentato 

dalla matrice A. 

4 Autovalori ed Autovettori 

La nozione di autovalore ed autovettore di un operatore e/o di una matrice sono 

relativi al seguente problema. Supponiamo di avere un operatore L, definito in 

uno spazio V di dimensione N per il quale esistano N vettori indipendenti ψ i , 

ed N scalari λ i tali che 

L · ψ i = λ i ψ i , i = 1, . . .,N. (4.1) 

Allora, nella base degli ψ i , l’operatore in questione è rappresentato dalla matrice 

diagonale diag(λ i ), cioè quella che ha, sulla diagonale principale, gli scalari 

[λ 1 , λ 2 , . . .,λ N ]. 

23

L’azione dell’operatore L si descrive in modo semplice. Se x = ∑ i x iψ i è la 

decomposizione di un vettore lungo al base degli ψ i , allora 

L(x) = ∑ i 

(x i )Lψ i = ∑ i 

(λ i x i )ψ i , 

ovvero L agisce moltiplicando ciascuna componente di x rispetto alla base ψ i 

per il corrispondente scalare λ i . Se v i = ∑ j G jiψ j è un’altra base di V , allora 

la matrice che rappresenta L rispetto alla nuova base è data dalla matrice L = 

G −1 · diag(λ i )G, che, in generale non è diagonale. 

Il problema che però ci vogliamo/dobbiamo porre è il seguente. Dato un 

operatore L : V → V , possiamo trovare una base nella quale L sia diagonale? 

E, se sì, come? 

Definizione 4.1 Sia L : V → V , ψ ≠ 0 ∈ V l e λ uno scalare. Si dice che λ 

è un autovalore di L, con autovettore ψ (e si dice che ψ è un autovettore di L 

relativo all’autovalore λ) se vale che 

Lψ = λψ, con ψ ≠ 0. (4.2) 

Nota Bene. La condizione ψ ≠ 0 è fondamentale. Infatti la relazione L 0 = λ0 

è vera per ogni scalare λ, e non dice nulla su L. La seguente osservazione è, 

nella sua semplicità, cruciale. Riscrivendo la (4.2) nella forma 

Lψ = λψ ⇔ (L − λ1)ψ = 0, (4.3) 

(nel prosieguo, ometteremo il simbolo 1), abbiamo che λ è un autovalore di L 

se e solo se l’operatore L − λ ha nucleo non banale (cioè esiste un vettore non 

nullo ψ ∈ Ker(L −λ)). Questo pone delle condizioni algebriche non banali su λ. 

Infatti, sia v i una base di V , e consideriamo la rappresentazione matriciale di L 

(e di L−λ) definita dalla v i . Come sappiamo, la condizione che il nucleo di L−λ 

sia non banale si traduce nella richiesta che la matrice L − λ rappresentativa di 

L − λ abbia determinante nullo. 

Proposizione 4.2 Se λ è un autovalore, allora il polinomio in λ (di ordine 

N = dim(V ) definito da 

P L (λ) = Det(L − λ1) ≡ Det(l ij − λδ ij ) = 0 (4.4) 

ha λ come radice. 

In più questa condizione non dipende dalla scelta della base. 

Dimostrazione. Se λ è un autovalore, allora il determinante di l ij − λδ ij 

si annulla, per quanto detto sopra. Dobbiamo solo fare vedere che questa condizione 

è indipendente dalla scelta della base in V . In effetti, vale che non solo 

gli zeri, ma il polinomio Det(l ij − λδ ij ) è definito da L, ovvero non cambia al 

cambiare della base. Abbiamo già osservato che se v ′ j = ∑ i G ijv i è un’altra base 

24

di V , allora la matrice G di elementi G ij è invertibile, e le matrici rappresentative 

- nelle due basi v i e v j ′ di L sono legate dalla relazione 

L ′ = Gg · LG −1 

Dato che posso scrivere λ1 = G −1 · λ1G ottengo 

Det(L ′ − λ1) = Det(G −1 · LG − G −1 λ1G) = Det(G −1 (L − λ1)G) = 

per il teorema di Binet = Det(G −1 )Det(L − λ1)Det(G) = Det(L − λ1), 

dove nell’ultima uguaglianza della prima riga si è raccolto a sinistra il fattore 

G −1 e a destra il fattore G, mentre nell’ultima uguaglianza della seconda riga si 

è usato il fatto che Det(G −1 1 

) = 

Det(G) . 

Il polinomio Det(L − λ1) si chiama polinomio caratteristico dell’operatore L (o 

anche associato all’operatore L). Il polinomio caratteristico di un operatore 

L : V → V è un polinomio di ordine N = dim(V ), con coefficiente di ordine più 

alto dato da c N = (−1) N 4 . 

Proposizione 4.3 Siano ψ 1 e ψ 2 autovettori di L : V → V relativi ad autovalori 

distinti, cioè valgano 

Lψ 1 = λ 1 ψ 1 , Lψ 2 = λ 2 ψ 2 , con λ 1 ≠ λ 2 . 

Allora ψ 1 e ψ 2 sono linearmente indipendenti. 

Dimostrazione. Supponiamo che ci sia una combinazione lineare 

allora L(c 1 ψ 1 + c 2 ψ 2 ) = 0 e dunque vale che 

c 1 ψ 1 + c 2 ψ 2 = 0; (4.5) 

c 1 λ 1 ψ 1 + c 2 λ 2 ψ 2 = 0. (4.6) 

Se λ 1 ≠ λ 2 , allora almeno uno dei due autovalori non è nullo; supponiamo 

λ 1 ≠ 0. Moltiplicando (4.5) per λ 1 e sottraendo questa da (4.6) si trova 

c 2 (λ 2 − λ 1 )ψ 2 = 0 

Ma ψ 2 non è il vettore nullo, e (λ 2 −λ 1 ) ≠ 0. Quindi deve essere c 2 = 0. Quindi, 

sostituendo nella (4.5), si ha che anche c 1 = 0, il che chiude la dimostrazione. 

4 Talvolta il polinomio caratteristico di L è definito da Det(λ − L). La nostra definizione e 

questa differiscono per il fattore moltiplicativo (−1) N . 

25 

□ 

□

Per induzione, si dimostra che questa proprietà è vera anche per il caso di M 

autovettori corrispondenti ad M autovalori distinti, ovvero vale che: 

Proposizione 4.4 Siano {ψ i } i=1,...,M M autovettori di L : V → V relativi ad 

M autovalori distinti λ 1 ≠ λ 2 ≠ · · · , λ M . Allora gli {ψ i } i=1,...,M sono linearmente 


Questo considerazione mostrano che se un operatore definito su uno spazio a 

dimensione N allora può avere al più N autovalori distinti, e, in questo caso, gli 

autovettori relativi a tali autovalori formano una base di V . Quindi in questa 

base L è rappresentato da una matrice diagonale (si dice che L è diagonalizzabile. 

Esempio. Consideriamo la matrice di Pauli iσ 1 = 

rappresentatrice dell’operatore 

σ 1 : C 2 → C 2 

( 0 1 

1 0 

) 

, pensata come 

Il polinomio caratteristico di σ 1 è 

( 

−λ 1 

Det( 

1 −λ 

) 

) = λ 2 − 1. 

Quindi σ 1 ammette due autovalori distinti, λ 1 = 1, λ 2 = −1. Per trovare 

autovettori relativi a questi due autovalori, dobbiamo determinare il nucleo di 

σ 1 −1 (per λ 1 ) e di σ 1 +1 (ovvero sostituire λ = ±1 nella equazione (σ 1 −λ1)ψ = 

0). Detto ψ = [ψ 1 , ψ 2 ] dobbiamo (incominciando dal caso di λ 1 ) risovere il 

sistema ( 

−1 1 

1 −1 

)( 

ψ1 

) ( 

0 

= 

ψ 2 0 

) 

, ⇔ 

{ 

−psi1 + ψ 2 = 0 

ψ 1 − ψ 2 = 0 

Le soluzioni di questo sistema (le due equazioni sono una l’opposto dell’altra...) 

sono tutti i vettori ψ tali che la prima compopnente sia uguale alla seconda, 

ovvero, gli autovettori relativi a λ 1 = 1 sono dati da 

( ) a 

ψ 1 = , a ≠ 0. (4.7) 

a 

Un calcolo analogo porta alla caratterizzazione degli autovettori relativi a λ 2 = 

−1 come a tutti i vettori della forma 

( ) −b 

ψ 2 = , b ≠ 0. (4.8) 

b 

Osserviame che ψ 1 e ψ 2 forniscono, per ogni scelta degli scalari, (eventualmnete 

complessi) a, b una base in C 2 . È utile verificare la legge di trasformazione delle 

rappresentazioni matriciali degli operatori in questo caso. 

26

( 0 1 

La matrice σ 1 = 

1 0 

) 

è riferita alla base naturale di C 2 data da 

( 

1 

e 1 = 

0 

) ( 

0 

, e 2 = 

1 

Fissati a, b non nulli, la matrice che definisce i vettori ψ 1 (a), ψ 2 (b) rispetto alla 

base standard è 

[ ] 

[ ] 

a −b 

1/2 a 

−1 

1/2 a −1 

G = , con inversa G −1 = 

. 

a b 

−1/2 b −1 1/2 b −1 

) 

. 

Se consideriamo il prodotto G −1 σ 1 G otteniamo 

[ ] 

1/2 a 

−1 

1/2 a −1 ( ) [ 

0 1 a −b 

· · 

−1/2 b −1 1/2 b −1 1 0 a b 

} {{ } 

[ ] [ 

1/2 a 

−1 

1/2 a −1 a −b 

· 

1/2 b −1 −1/2 b −1 a b 

] 

] 

= 

( 1 0 

0 −1 

) 

(4.9) 

In altre parole, la trasformazione G che manda i vettori della base standard nei 

vettori della base degli autovettori di σ 1 , diagonalizza σ 1 . 

Esempio 2 Consideriamo la matrice 

⎡ ⎤ 

A = 

Il suo polinomio caratteristico è 

⎢ 

⎣ 

2 1 1 

1 2 3 

1 −1 −2 

⎥ 

⎦ 

λ 3 − 3λ 2 − 2λ = λ(λ + 1)(λ − 3), 

e dunque i suoi autovalori sono λ 1 = 0, λ 2 = −1, λ 3 = 3 (Osserviamo che la 

presenza dell’autovalore 0 significa che il nucleo di A è non banale. Infatti, la 

terza riga è la differenza delle prime due. 

Calcoliamo l’autovettore relativo a λ 1 . Dato che, appunto, la terza equazione 

è combinazione lineare delle prime due, possiamo considerare il sistema in due 

equazioni e tre incognite (ψ 1 , ψ 2 ψ 3 ) dato dalle prime due righe di Aψ = 0, 

ovvero il sistema 

{ { 

2ψ1 + ψ 2 + ψ 3 = 0 2ψ1 + ψ 

ovvero 

2 = −ψ 3 

ψ 1 + 2ψ 2 + 3ψ 3 = 0 ψ 1 + 2ψ 2 = −3ψ 3 

Scriviamo questo sistema matricialmente come 

( )( ) ( ) 

2 1 ψ1 −ψ3 

= . (4.10) 

1 2 ψ 2 −3ψ 3 

27

Ci accorgiamo che il determinante della matrice 2×2 associata a questo sistema 

non omogeneo, cioè 

( ) 2 1 

Â 33 = 

1 2 

è invertibile, con inversa data da 

(Â33) −1 = 

( 2 

3 

− 1 3 

− 1 3 

2 

3 

) 

Dunque la soluzione generale di (4.10) è 

( ) ( 2 

) ( ) ( 

psi1 

− 1 1 −ψ3 

= 

3 3 

2 · = 

ψ 3 3 

ψ 2 −3ψ 3 − 5ψ 3 3 

− 1 3 

3 

) 

. 

Dunque l’autovettore relativo all’autovalore 0 di A si scrive come 

⎡ 

1 

ψ ⎤ ⎡ ⎤ 

3 3 1 

ψ 1 = ⎣ − 5ψ ⎦ 

3 3 = µ ⎣ −5 , ⎦ 

ψ 3 3 

dove µ = ψ 3 /3 è un qualsiasi numero non nullo. 

Con conti analoghi, si vede che gli autovettori relativi agli altri due autovalori 

sono 

⎡ ⎤ 

0 

λ 2 = −1, ψ 2 = µ ⎣ −1 ⎦ 

1 

e 

⎡ ⎤ 

1 

λ 3 = 3, ψ 3 = µ ⎣ 1 ⎦ 

0 

In quest’ultimo caso si ha però che 

⎡ ⎤ 

−1 1 1 

A − 31 = ⎢ 

⎣ 

1 −1 3 ⎥ 

⎦ 

1 −1 −5 

e dunque non si può utilizzare la matrice Â33) per definire il sistema lineare 2×2 

da risolvere. Una buona scelta è utilizzare Â31), ovvero considerare il sistema 

{ 

ψ2 + ψ 3 = ψ 1 

−ψ 2 + 3ψ 3 = −ψ 1 

28

5 Prodotti scalari e hermitiani. 

La nozione di prodotto scalare in R 3 e si generalizza nel seguente modo: 

Definizione 5.1 Sia V uno spazio lineare /R. Un prodotto scalare su V e’ 

una applicazione (“funzione”) 

che soddisfi: 

1. (x, y) = (y, x) (simmetria) 

(·, ·) : V × V → R 

2. (x, y + z) = (x, y) + (y + z) (linearità) 

3. (c x, y) = c(x, y) (omogeneità) 

4. (x, x) ≥ 0 e (x, x) = 0 ⇔ x = 0 (positività) 

Notiamo che, grazie alla proprietà 1) valgono anche: 

(x + y, z) = (x, z) + (y + z), e (x, c y) = c(x, y). 

Si può dunque dire che un prodotto scalare su uno spazio vettoriale reale V è 

una applicazione simmetrica, “bilineare” (proprietà 2) e 3)) e definita positiva 

di V ×V in R. Esempio. Sullo spazio standard R n delle n-uple di numeri reali 

si ha il prodotto scalare standard: se x = (x 1 , x 2 , . . ., x n ) e y = (y 1 , y 2 , . . .,y n ), 

allora si pone: 

n∑ 

(x,y) = x i y i . 

Esempio. Sempre in R n si possono porre “diversi” prodotti scalari. Per esempio, 

fissata una n-upla di numeri positivi a = a 1 , a 2 , . . .,a n , si può porre 

(x,y) a = 

i=1 

n∑ 

a i x i y i 

Esempio Prodotto scalare “standard” in C I . 

Sia I = [a, b] un intervallo (chiuso e limitato) della retta reale, e consideriamo 

lo spazio delle funzioni continue C I definite su I a valori reali. 

Sappiamo che C I è uno spazio vettoriale. Poniamo, per definizione, 

(f, g) = 

∫ b 

a 

i=1 

f(x) g(x) dx. 

Vogliamo verificare che (·, ·) : C I × C I → R è un prodotto scalare. 

Per prima cosa, notiamo che è ben definito. Infatti, se f e g sono funzioni 

continue su un intervallo chiuso e limitato, lo è anche il loro prodotto, e quindi 

l’integrale ∫ b 

a fg(d) x è un numero reale. 

29

Le proprietà di simmetria, linearità e omoigeneità sono ovvie. La proprità 

di positività segue dal fatto che (f, f) = ∫ b 

a f2 (x) dx, e dunque (f, f) ≥ 0. In 

particolare, (f, f) = 0 se e solo se f = 0 per tutti gli x, ovvero fè la funzione 

nulla, cioè lo zero dello spazio vettoriale C I . 

Analogamene al caso di R n , se ψ(x) è una funzione non negativa, la legge 

(f, g) ψ = 

∫ b 

a 

f(x)g(x)ψ(x) dx 

definisce un prodotto scalare in C I . 

Consideriamo ora spazi vettoriali sui numeri complessi. 

Definizione 5.2 Sia V uno spazio lineare /C. Un prodotto scalare, detto anche, 

se è il caso di distinguere, un prodotto hermitiano su V e’ una applicazione 

(“funzione”) 

(·, ·) : V × V → C 

che soddisfi: 

1. (x, y) = (y, x) (simmetria hermitiana) 

2. (x, y + z) = (x, y) + (y + z) (linearità) 

3. (x, c y) = c(x, y) (omogeneità) 

4. (x, x) ≥ 0 e (x, x) = 0 ⇔ x = 0 (positività) 

Notiamo che, grazie alla proprietà 1) e 2) valgono anche: 

(x + y, z) = (x, z) + (y, z), e (c x, y) = c(x, y). 

Si può dunque dire che un prodotto scalare su uno spazio vettoriale complesso 

V è una applicazione simmetrica, “sesquilineare” 5 (proprietà 2) e 3)) e definita 

positiva di V × V in C. 

Esempio. Il prodotto scalare standard in C n è definito nel seguente modo. 

Siano se x = (x 1 , x 2 , . . .,x n ) e y = (y 1 , y 2 , . . .,y n ) elementi di C n . Il prodotto 

scalare (o hermitiano, o euclideo) standard è definito da 

(x,y) = 

n∑ 

x i y i . 

i=1 

Esempio. Se C I (C) è lo spazio delle funzioni continue sull’intevallo I = [a, b] a 

valori complessi, allora la legge 

(f, g) = 

∫ b 

a 

f(x)g(x) dx 

5 sesqui=1 e 1 2 . 30

dà luogo ad un prodotto hermitiano in C I (C). 

Nota. Si noti che nel caso complesso, è cruciale prendere il complesso coniugato 

delle componenti (e.g., in C n ). Se si ponesse, in completa analogia con il caso 

reale, 

n∑ 

〈x,y〉 = x i y i 

si otterrebbe una forma bilineare in C n , che non gode della proprietà di positività. 

Per rendersi conto di ciò, basta considerare, in C 2 , il vettore η = (1, i) ≠ 

0. Allora, 

(η, η) = 1 1 + i i = 1 − i 2 = 2, mentre 〈η, η〉 = 1 1 + i i = 1 + i 2 = 0 

i=1 

6 Spazi euclidei e normati 

Proposizione 6.1 (Disuguaglianza di Cauchy-Schwartz) Sia (V, (, )) uno spazio 

euclideo. Allora, per ogni coppia v 1 , v 2 vale che 

|(v 1 , v 2 )| 2 ≤ (v 1 , v 1 )(v 2 , v 2 ), (6.1) 

e l’uguaglianza vale solo se v 2 = cv 2 (cioè se v 1 e v 2 sono linearmente dipendenti). 

Dimostrazione. Se uno dei due vettori è nullo, la affermazione è vera. Quindi 

possiamo supporre che entrambi i vettori siano non nulli. Definiamo x = 

(v 2 , v 2 ), y = (v 1 , v 2 ) e consideriamo la combinazione lineare 

ξ = xv 1 − yv 2 

Dalla proprietà di positività del prodotto scalare, abbiamo (ξ, ξ) ≥ 0. Dunque 

0 ≤ (ξ, ξ) = (xv 1 −yv 2 , xv 1 −yv 2 ) = |x| 2 (v 1 , v 1 )−xy(v 2 , v 1 )−xy(v 1 , v 2 )+|y| 2 (v 2 , v 2 ). 

ovvero, sostituendo, le espressioni di x e y, 

|(v 2 , v 2 )| 2 (v 1 , v 1 )−(v 2 , v 2 )(v 1 , v 2 )(v 2 , v 1 )−(v 1 , v 1 )(v 1 , v 2 )(v 1 , v 2 )+|(v 1 , v 2 )| 2 (v 2 , v 2 ) ≥ 0. 

Notando che (v i , v i ) > 0 e che (v 2 , v 1 ) = (v 1 , v 2 ), si ottiene 

0 ≤ (v 2 , v 2 ) 2 (v 1 , v 1 ) − (v 2 , v 2 )|(v 1 , v 2 )| 2 , 

e dunque, dividendo per (v 2 , v 2 ), si ha che 

|(v 1 , v 2 )| 2 ≤ (v 1 , v 1 )(v 2 , v 2 ), 

che è quello che si doveva mostrare. 

In particolare, notiamo che l’uguaglianza vale sse ξ = 0, ovvero sse v 1 e v 2 

sono linearmente dipendenti. 

31

In uno spazio euclideo si può definire un concetto di lunghezza (detta norma) 

di un vettore. Definiamo norma di v ∈ V la quantità 

‖v‖ = √ (v, v). (6.2) 

Proposizione 6.2 La norma di un vettore è una applicazione ‖ · ‖ : V → R 

che soddisfa le seguenti proprietà 

1. ‖v‖ ≥ 0, con ugualianza sse v = 0 (positività); 

2. ‖c v‖ = |c|‖v| (omogeneità); 

3. ‖v + u‖ ≤ ‖v‖ + ‖u‖ (disuguaglianza triangolare). 

Dimostrazione Le prime due proprietà seguono immediatamente dall proprietà 

2 e 3 del prodotto scalare. Per l’ultima, osservato che la disuguaglianza di 

Cauchy–Schwartz si può scrivere come 

il che implica le due disuguaglianze 

Consideriamo 

|(v 1 , v 2 )| 2 ≤ ‖v 1 ‖ 2 ‖v 2 ‖ 2 , (6.3) 

(v 1 , v 2 ) ≤ ‖v 1 ‖‖v 2 ‖, |(v 1 , v 2 )| ≤ ‖v 1 ‖‖v 2 ‖. 

‖v 1 + v 2 ‖ 2 = (v 1 + v 2 , v 1 + v 2 ) = (v 1 , v 1 ) + (v 1 , v 2 ) + v 1 , v 2 ) + (v 2 , v 2 ) = 

‖v 1 ‖ 2 + ‖v 2 ‖ 2 + (v 1 , v 2 ) + v 1 , v 2 ). 

Utilizzando le disuguaglianze di cui sopra, si ha 

‖v 1 + v 2 ‖ 2 ≤ ‖v 1 ‖ 2 + ‖v 2 ‖ 2 + 2‖v 1 ‖‖v 2 ‖ = (‖v 1 ‖ + ‖v 2 ‖) 2 

e dunque, dato che entranbi i membri di questa equazione sono numeri reali non 

negativi, la tesi si ottiene prendendo la radice quadrata. 

6.1 Ortogonalità e sue prime applicazioni 

Consideriamo uno spazio vettoriale V dotato di un prodotto interno (o hermitiano, 

se V è sui complessi) ( , ). 

Definizione 6.3 Due vettori v 1 , v 2 si dicono ortogonali sse (v 1 , v 2 ) = 0. 

Dalla definizone vediamo subito che lo 0 di V è l’unico vettore di V ortogonale 

a se stesso. Infatti (0 , 0) = 0, e (v , v) = 0 ↔ v = 0 (proprietà 3 del prodotto 

euclideo/hermitiano). 

32 

□ 

□

Proposizione 6.4 Siano v 1 , v 2 , non nulli e ortogonali; allora v 1 e v 2 sono linearmente 


Dim. Sia c 1 v 1 + c 2 v 2 = 0 una combinazione lineare di v 1 e v 2 che dia 0. 

Dobbiamo verificare che c 1 = c 2 = 0. Dal fatto che (0 , 0) = 0 abbiamo 

0 = (c 1 v 1 + c 2 v 2 , c 1 v 1 + c 2 v 2 ) 

Sviluppando questa uguaglianza si ha (consideriamo il caso hermitiano) 

0 = ¯c 1 c 1 (v 1 , v 1 ) + ¯c 1 c 2 (v 1 , v 2 ) + ¯c 2 c 1 (v 2 , v 1 ) + ¯c 2 c 2 (v 2 , v 2 ). 

Dato che (v 1 , v 2 ) = (v 2 , v 1 ) sono per ipotesi nulli, ne otteniamo 

0 = |c 1 | 2 (v 1 , v 1 ) + |c 2 | 2 (v 2 , v 2 ) 

I due addendi del membro destro sono non negativi, e dunque deve valere 

|c 1 | 2 (v 1 , v 1 ) = |c 2 | 2 (v 2 , v 2 ) = 0; dato che i vettori v 1 , v 2 non sono nulli (e dunque 

(v i , v i ) > 0), ne possiamo concludere che c 1 = c 2 = 0 

Osserviamo che, più in generale, vale la seguente proprietà: 

Sia {v 1 , . . .,v k } un insieme di vettori non nulli di V , che soddisfino 

(v i , v j ) = 0, i ≠ j = 1, . . ., k. 

Allora questi vettori sono lineramente indipendenti. Infatti basta notare che, 

detto ξ = ∑ k 

i=1 x iv i , si ha 

□ 

k∑ 

(ξ, ξ) = i x j (v i , v j ) = 

i,j=1x ∑ i 

|x i |(v i , v i ). 

Esempio 1. Nello spazio R n , questa proprietà, applicata a vettori v i = e li , dove 

e i è la n-upla data da (0, 0, . . ., 0 1 , 0, . . ., 0), ribadisce che questi vettori sono 

}{{} 

posto i 

indipendenti. Peraltro, garantisce che, per esempio, i vettori v = (1, 1, 0, . . ., 0) 

ed u = (1, −1, 0, . . ., 0) sono indipendenti. 

Nota. Una coseguenza di questa proprietà è che, presi n + k vettori v α non 

nulli in uno spazio vettoriale euclideo V n di dimensione n deve aversi, per quelche 

α, β, (v α , v β ) ≠ 0. Viceversa, una base di V n formata da vettori ortogonali a 

due a due si chiama base ortogonale. In particolare, se questi vettori sono tutti 

di norma uguale a 1, la base si dice base ortonormale. Ad esempio, la terna 

−→ i , 

−→ j , 

−→ k è una base ortonormale dello spazio euclideo R 3 , dotato del prodotto 

scalare standard. 

33

Esempio 2. Consideriamo lo spazio delle funzioni (diciamo continue) C [−π,π] 

nell’intervallo I = [−π, π], e i vettori u n ∈ C [−π,π] definiti da 

u 0 (x) = 1, u 2n−1 (x) = cos(n x), u 2n = sin(n x), n = 1, 2, 3, . . .. 

Questo insieme (o sistema, o famiglia) di vettori è ortogonale. 

Infatti, consideriamo n ≠ m e il prodotto scalare 

(u n , u m ) = 

∫ π 

−π 

u n (x)u m (x) dx. 

Ora, se n è nullo, abbiamo (u 0 , u m ) = ∫ u I n(x)dx = 0; supponiamo che sia n 

che m siano non nulli e (per esempio), sia n = 2k − 1, m = 2l. Allora si ha 

∫ 

(u n , u m ) = cos(k x) sin(l x) dx 

Integrando per parti si ha 

(u n , u m ) = 1 k sin(k x) sin(l x)∣ ∣ π −π − l k 

dato che le funzioni sono periodiche otteniamo 

(u n , u m ) = − l ∫ 

sin(k x) cos(l x)dx. 

k 

I 

I 

∫ 

I 

sin(k x) cos(l x)dx. 

Se k = l, abbiamo dunque (u n , u m ) = −(u n , u m ) e dunque (u n , u m ) = 0. se 

k ≠ l, si ha, analogamente, 

∫ 

sin(k x) cos(l x) = − l ∫ 

cos(k x) sin(l x) dx 

k 

e dunque otteniamo che 

I 

(u 2k−1 , u 2l ) = l2 

k 2(u 2k−1, u 2l ) 

che dimostra che (u 2k−1 , u 2l ) = 0, ∀ k, l. Il caso n, m entrambi pari o dispari 

si tratta analogamente. Dunque gli u n sono un sistema ortogonale in C [−π,π] . 

Ricordando che ∫ 

∫ 

cos 2 (n x) dx = sin 2 (n x)dx = π 

I 

e osservamdo che (u 0 , u 0 ) = 2π si vede che la famiglia 

v 0 = u 0 

√ 

2π 

, v n = u n 

√ π 

I 

I 

34

è ortonormale in C [−π,π] . 

Esempio 3. Una variante dell’esempio 2. Sia V C lo spazio delle funzioni periodiche 

da I = [−π, π] a valori complessi. Consideriamo, in V C C la famiglia 

{e n } n∈Z definita da: 

e 0 (x) = 1, e n (x) = exp(i n x), n ≠ 0. (6.4) 

Questa è una famiglia ortogonale. Infatti, consideriamo il prodotto scalare 

∫ 

∫ 

∫ 

(e n , e m ) = e n (x)e m (x) dx = exp(−i n x) exp(i m x) dx ≡ exp(i(n−m) x)dx 

I 

Supponiamo n ≠ m. Integrando 

I 

1 

∣ 

(e n , e m ) = ∣ exp(i(n − m) x) π 

i(n − m) 

= 0, −π 

per la periodicità della funzione esponenziale con argomento immaginario. Se, 

ora, n = m (eventualmente entrambi = 0) abbiamo 

∫ 

(e n , e n ) = 1 dx = 2π. 

I 

Dunque la famiglia ortonormale corrispondente alla famiglia e n si ottene come 

v n = √ en 

2π 

. 

Basi ortonormali godono di una proprietà fondamentale, ovvero che le componenti 

dello sviluppo di un generico vettore v sulla base in questione si calcolano 

attraverso prodotti scalari. Ovvero, vale che 

Proposizione 6.5 Sia {e 1 , . . .,e n } una (qualsiasi) base ortonormale in V n . Lo 

sviluppo dell’elemento v ∈ V lungo V è dato da 

I 

v = ∑ i 

v i e i , con v i = (v, e i ). (6.5) 

In altre parole, le componenti di v lungo la base e i sono i prodotti scalari (e i , v). 

Dimostrazione. Dato che e i sono una base, lo sviluppo 

v = ∑ i 

v i e i 

è univocamente determinato. Scegliamo un indice k e prendiamo il prodotto 

scalare (e k , v) di entrambi i membri di questa uguaglianza; a sinistra abbiamo 

(v, e k ), mentre a destra (grazie alla linearità del prodotto euclideo) 

∑ 

v i (e k , e i ) = v k perchè (e k , e i ) = 0 se i ≠ k, e vale 1 per i = k. 

i 

Nota. Questa dimostrazione è fatta per spazi di dimensione finita. Peraltro 

vale anche in dimensione infinita. 

35

Proposizione 6.6 (Formule di Parseval) Sia V n uno spazio vettoriale (complesso) 

di dimensione finita, e {e i } i=1,...,n una sua base ortonormale. Allora, per 

ogni coppia di vettori x, y ∈ V n , 

(y, x) = 

n∑ 

(e i , y)(e i , x). (6.6) 

i=1 

In particolare, ‖x‖ 2 = ∑ i |(e i, x)| 2 . 

Dimostrazione. Scriviamo, secondo la (6.5), 

x = ∑ i 

(e i , x)e i 

e calcoliamo (y, x); sfruttando sempre la linearità di ( , ) abbiamo 

(y, x) = (y, ∑ (e i , x)e i ) = ∑ ( ) ∑ 

y, (ei , x)e i = (e i , x)(y, e i ) = ∑ 

i 

i 

i 

i 

(e i , y)(e i , x), 

come affermato. La seconda affermazione si ottiene prendendo y = x. 

□ 

7 Operatori Hermitiani (simmetrici) 

Il problema di determinare se e quando un operatore è diagonalizzabile non è di 

facile risoluzione. In questa ultima lezione introdurremo una classe di operatori 

lineari, detti operatori Hermitiani definiti su spazi euclidei (complessi), per i 

quali vale un teorema di diagonalizzazione. 

Consideriamo uno spazio vettoriale euclideo complesso (V, (,)); sia L : V → 

V . L’aggiunto di L è quell’operatore L † che verifica 

(y, Lx) = (L † y, x) = (x, L † y), ∀ x, y ∈ V. (7.1) 

Per definizione, (L 1 + L 2 ) † = L † 1 + L † 2, e (zL) † = zL † . 

Esempio 1. Se V è di dimensione finita, l’aggiunto di un operatore esiste 

sempre. In particolare, se L è la rappresentazione matriciale di L rispetto ad 

una base ortonormale {e i } i=1,...,N=dimV , gli elementi di matrice [l † ] ij sono dati 

dai complessi coniugati degli elementi della matrice trasposta L T , ovvero, in 

formule, 

l † ij = l ji 

Per rendersi conto di questo fatto, basta ricordare che rispetto ad una base 

ortonormale, l’elemento di matrice l ij si calcola come 

l ij = (e i , L(e j )) 

36

Dunque, l’elemento l † ij è 

(e i , L † (e j )) = (L † (e j ), e i ) = (e j , L(e i )) = l ji , 

dove, nella terza uguaglianza si è usata (“al contrario”) la definizione di aggiunto. 

Per comodità, data una matrice L, si chiama matrice aggiunta (o, anche, 

coniugata Hermitiana) di L, la matrice il cui elemento di posto i, j è il complesso 

coniugato dell’elemento di posto j, i della matrice L. In poche parole, la matrice 

aggiunta è la coniugata della trasposta (o la trasposta della coniugata). 

Nota Nel caso reale, la matrice aggiunta si riduce alla matrice trasposta. 

Esempio 2 Sia C ∞ ([a, b]) lo spazio delle funzioni periodiche definite sull’intervallo 

[a, b], derivabili un numero arbitrario di volte, dotato del prodotto euclideo 

(f, g) = 

∫ b 

a 

f(x)g(x) dx , 

e consideriamo l’operatore ˆ∂, che associa ad f(x) la sua derivata. Verifichiamo 

che ˆ∂ † = −ˆ∂. 

∫ b 

(f, ˆ∂(g)) = f(x) d (g(x)) dx = ( integrando per parti ) 

a dx 

f(x)g(x) ∣ ∫ b 

b − ( d f(x))g(x) dx = 

a 

a dx 

( dato che le funzioni sono periodiche ) 

= 

∫ b 

a 

− d 

dx (f(x))g(x) dx = (−ˆ∂f, g). 

Definizione 7.1 Un operatore si chiama autoaggiunto o hermitiano se L = L † ; 

una matrice si chiama autoaggiunta o hermitiana se è uguale alla sua aggiunta. 

Un operatore si dice antiautoaggiunto (o anti hermitiano) se il suo aggiunto è il 

suo opposto (cioè, L+L † = 0). Osserviamo che se L è hermitiano, i L è antihermitiano 

e viceversa. Nel caso reale, una matrice hermitiana è una matrice che 

coincide con la sua trasposta, ed è detta più comunemente matrice simmetrica 

(omettendo ”rispetto alla riflessione secondo la diagonale principale”). 

Esempi. Le matrici di Pauli definite in (2.9) sono (così come l’operatore ˆ∂ 

discusso qui sopra, antiautoaggiunte. L’operatore iˆ∂ è autoaggiunto. 

Nel seguito considereremo autovalori ed autovettori di operatori (matrici) 

hermitiani. 

Nota. Un operatore autoaggiunto è rappresentato, in una base ortonormale 

da una matrice autoaggiunta. Questa proprietà è invariante per coniugio per 

matrici unitarie, ovvero matrici la cui inversa coincide con la aggiunta. Due 

basi ortonormali in uno spazio vettoriale complesso (finito dimensionale) sono 

37

collegate da una matrice unitaria. 

Esercizio. Dimostrare queste affermazioni, ricordando che 

e 

(AB) † = B † A † notare l’inversione dell’ordine 

(G −1 ) † = (G † ) −1 . 

Esercizio. Dimostrare anche queste ultime due affermazioni. 

Proposizione 7.2 Se λ è un autovalore di un operatore hermitiano H, allora 

λ è reale (λ = λ; nel caso di operatori antihermitiani, λ è immaginario puro. 

Dimostrazione. Se λ è un autovalore di H, allora esiste un vettore non nullo 

ψ tale che 

Hψ = λψ, ⇒, (ψ, Hψ) = (ψ, λψ) = λ(ψ, ψ); 

Ma (ψ, Hψ) = (H † ψ, ψ); dato che H † = H, quest’ultima equazione diventa 

(λψ, ψ) = λ(ψ, ψ). 

Nella sezione precedente, abbiamo visto che autovettori di un operatore qualsiasi 

relativi ad autovalori distinti sono linearmente indipendenti. Per operatori 

Hermitiani, vale una proprietà più forte, ovvero: 

Proposizione 7.3 Siano λ 1 e λ 2 due autovalori distinti di un operatore Hermitiano 

H : V → V , e siano ψ 1 e ψ 2 due autovettori relativi, ovvero, 

Hψ 1 = λ 1 ψ 1 , Hψ 2 = λ 2 ψ 2 , con λ i ∈ R, ψ i ≠ 0, i = 1, 2. (7.2) 

Allora ψ 1 e ψ 2 sono ortogonali. 

Dimostrazione. Da un lato 

(ψ 1 , Hψ 2 ) = (ψ 1 , λ 2 ψ 2 ) = λ 2 (ψ 1 , ψ 2 ) 

Dall’altro (utilizzando H = H † e il fatto che gli autovalori sono reali), 

(ψ 1 , Hψ 2 ) = (H † (ψ 1 ), ψ 2 ) = (Hψ 1 , ψ 2 ) = (λ 1 ψ 1 , ψ 2 ) = λ 1 (ψ 1 , ψ 2 ) 

Sottraendo queste due relazioni si ha 

0 = (ψ 1 , Hψ 2 ) − (ψ 1 , Hψ 2 ) = (λ 2 − λ 1 )(ψ 1 , ψ 2 ). 

Dato che abbiamo supposto λ 1 ≠ λ 2 deve essere (ψ 1 , ψ 2 ) = 0. 

□ 

□ 

38

Nota La semplicità della dimostrazione di questa proposizione non rende giustizia 

alla sua importanza. Di fatto, la proprietà di ortogonalità di autovettori 

relativi ad autovalori differenti è l’elemento cruciale che assicura la diagonalizzabilità 

di operatori (matrici) Hermitiani. 

Una generalizzazione della proprietà qui sopra è la seguente. Dato uno spazio 

Euclideo V , ed un suo sottospazio vettoriale, W ⊂ V , il complemento ortogonale 

W ⊥ di W in V è definito nel seguente modo: 

W ⊥ := {y ∈ V t.c. (y, x) = 0, ∀ x ∈ W }, (7.3) 

o, a parole, è l’insieme (che si dimostra essere un sottospazio vettoriale di V ) 

di tutti quei vettori che sono ortogonali (secondo ( , )) a ogni elemento del 

sottospazio assegnato W. 

Proposizione 7.4 Sia H : V → V un operatore hermitiano, e sia W un sottospazio 

invariante per H, ovvero tale che 

H x ∈ W ∀ x ∈ W. (7.4) 

Allora anche il suo complemento ortogonale W ⊥ è invariante sotto H, ovvero 

H y ∈ W ⊥ ∀ y ∈ W ⊥ . (7.5) 

Dimostrazione. Esplicitando la (7.5), dobbiamo dimostrare che per tutti gli 

y tali che (y, x) = 0, ∀x ∈ W 

succede che 

(x, Hy) = 0, ∀x ∈ W. 

Ora: 

(x, Hy) = ((H † x), y) = (H è hermitiano ) = (Hx, y), ∀x, y. 

Ma, se x ∈ W, Hx ∈ W per l’ipotesi (7.4), e quindi (Hx, y) = 0, dato che 

y ∈ W ⊥ . Dunque (x, Hy) = 0 se x ∈ W, ovvero Hy ∈ W ⊥ . 

Da questi risultati segue la diagonalizzabilità di un operatore Hermitiano H, 

ovvero che H “ammette una base di autovettori”. L’argomento procede per 

induzione “a ritroso”. Descriviamolo algoritmicamente. 

Passo 1 

Si considera dapprima H 1 ≡ H : V → V ; il polinomio caratteristico di H 0 

ammette (per il teorema fondamentale dell’algebra) una radice λ 1 . In particolare 

questa è una radice reale. In corrispondenza di λ 1 , esiste 6 almeno un autovettore 

ψ 1 , 

H 1 ψ 1 = λ 1 ψ 1 

6 Questo è un teorema: data una radice del polinomio caratteristico di una matrice, allora 

esiste almeno un autovettore. Il problema della non diagonalizzabilità di una matrice nasce dal 

fatto che non è detto che ad una radice di ordine n del polinomio caratteristico corrispondano 

esattamente n auutovalori indipendenti 

39 

□

Considero allora V 1 := {spazio generato da ψ 1 }, e, soprattutto, il suo complemento 

ortogonale V1 ⊥ . Per la proposizione (7.4), H definisce un operatore 

H 2 := H| V ⊥ 

1 

: V ⊥ 

1 → V ⊥ 

1 . 

Questo operatore è ben definito ed Hermitiano. Quindi posso tornare al passo 

1, e riapplicare l’argomento. 

Dopo un numero N = dimV di passi si costruisce la base richiesta. 

Il procedimento qui sopra illustra anche l’ultima particolarità saliente degli 

operatori Hermitiani. Consideriamo la sequenza degli autovalori 7 λ 1 , λ 2 , · · · , λ N , 

e quella degli autovettori relativi {ψ 1 , ψ 2 , . . .,ψ N }. Per costruzione, gli ψ j sono 

ortogonali l’un l’altro, i.e., (ψ i , ψ j ) = 0, i ≠ j. Quindi, eventualmente dividendo 

per ‖ψ j ‖, posso considerare una nuova sequenza di autovettori {ψ ′ 1, ψ ′ 2, · · · , ψ ′ N }, 

fatta da vettori ortonormali, i.e., 

(ψ ′ i, ψ ′ j) = δ ij . 

Se {v k } è una base ortonormale di V (e.g., la base standard in C N ), allora 

una matrice U che diagonalizza (la matrice H rappresentativa di) H, si ottiene 

giustapponendo le colonne delle componenti degli autovettori ψ i ′ rispetto alla 

base considerata. 

La aggiunta di U è la matrice la cui i-esima riga è formata dai complessi 

coniugati di queste componenti. Consideriamo il prodotto della matrici U † · U. 

L’elemento di posto k, j, è, per definizione, la somma termine a termine (su l) 

dei prodotti degli elementi di posto k, l di U † (cioè il complesso coniugato della 

componente l-esima del k-esimo autovettore) per gli elementi di posto l, j di U, 

ovvero la componente l-esima del j-esimo autovettore. In breve, 

[ 

U† · U ] = (ψ kj k, ψ j ) V = δ kj 

In modo compatto, U † · U = 1. Quindi la matrice U che diagonalizza un operatore 

Hermitiano rispetto ad una base ortonormale di autovettori soddisfa la 

condizione 

U −1 = U † ; 

una tale matrice si dice Unitaria (la corrispondente condizione nel caso reale è 

O −1 = O T , e la matrice viene detta ortogonale). Un operatore che, in una base 

ortonormale, viene rappresentato da una matrice unitaria si dice unitario. 

Gli operatori unitari godono della seguente proprietà caratteristica: 

Proposizione 7.5 U : V → V è unitario se e solo se, ∀ x, y ∈ V , 

(U(y), U(x)) = (x, y), (7.6) 

cioè se conserva i prodotti scalari tra vettori (e, in particolare, le loro norme). 

7 Non è detto che i λ i siano tutti distinti, ma questo non importa 

40

Dimostrazione Da un lato, possiamo scrivere il membro sinistro della (7.6) 

come 

(U(y), U(x)) = (U † (U(y)), x) = ( se U † · U = 1) = (y, x). 

D’altro canto, sia e i una base ortonormale di V . Allora 

U(e k ) = ∑ j 

U kj e j , 

Allora, 

(U(e k ), U(e l )) = ∑ j 

∑ 

U k jU ln (e j , e n ). 

Ma la base è ortonormale, dunque (e j , e n ) = δ jn . La somma doppia di quest’ultima 

equazione diventa una somma singola (per la proprietà del simbolo δ di Kronecker, 

e.g., su j, ovvero 

n 

(U(e k ), U(e l )) = ∑ j 

∑ 

U k jU ln δ jn = ∑ n 

n 

[U † ] n k 

{}}{ 

U kn U ln = ∑ n 

U ln U † nk = [UU † ] lk . 

Dato che (U(e k ), U(e l )) = (e k , e l ) = δ kl = δ lk , ne segue che [UU † ] lk = δ lk . 

Ritornando a considerare un operatore autoaggiunto H, possiamo sintetizzare 

le considerazioni fin qui fatte nel seguente 

Teorema 7.6 Un operatore (matrice) autoaggiunto (a) si diagonalizza tramite 

un operatore (matrice) unitario (a). 

Nel caso dello spazio euclideo V = E 3 , un operatore lineare ortogonale 

é dunque un operatore lineare che conserva gli angoli tra i vettori e le loro 

lunghezze. Dunque è un operatore che rappresenta una rotazione rigida attorno 

ad un asse 8 . 

7.1 Uno spazio euclideo notevole 

In questa sezione finale studieremo in modo informale uno spazio euclideo complesso 

(in generale, specie nel caso infinito dimensionale, tali spazi si chiamano 

spazi di Hilbert) di notevole interesse in meccanica quantistica. 

Definizione 7.7 Chiamiamo ′ L 2 (R, C) lo spazio delle funzioni f, definite sull’asse 

reale a valori complessi, derivabili infinite volte, ”a quadrato integrabili”, ovvero 

tali che valga 

∫ 

|f(x)| 2 dx < ∞. (7.7) 

8 A meno di riflessioni. 

R 

□ 

41

Lo spazio ′ L 2 (R, C) è dotato di un prodotto scalare definito, come negli altri 

casi di spazi di funzioni su intervalli della retta reale, da 

∫ 

(f, g) = f(x)g(x) dx. (7.8) 

R 

Infatti, una applicazione, diretta ma non banale, della disuguaglianza di Cauchy– 

Schwartz mostra che, 

∫ ∫ 

∫ 

|f(x)| 2 dx e |g(x)| 2 dx < ∞ ⇒ f(x)g(x) dx < ∞, 

R 

R 

ovvero che, date f, g ∈ ′ L 2 (R, C), allora (f, g) è ben definito; il fatto che sia 

un prodotto euclideo si mostra come nel caso di funzioni definite su intervalli. 

Osserviamo che ogni f ∈ ′ L 2 (R, C) si annulla all’infinito (cioè lim x→±∞ f(x) = 

0); questo permette di rendersi conto che gli operatori −iˆ∂, e dunque anche 

−∂ 2 x = (−iˆ∂) 2 sono hermitiani su ′ L 2 (R, C). In ′ L 2 (R, C) consideriamo lo spazio 

F delle funzioni della forma 

Su F definiamo l’operatore 

f(x) = P(x) exp (− x2 

), dove P è un polinomio. 

2 

R 

Ĥ : F −→ F 

f(x) ↦→ (− 1 2 ∂2 x + 1 ̂x 2 2 )(f(x)) = − 1f ′′ (x) + x 2 f(x). 

2 

(7.9) 

Vogliamo verificare che l’operatore Ĥ ammette, la sequenza di numeri 

λ n = (n + 1 ), n = 0, 1, . . . 

2 

come autovalori, e come corrispondenti autovettori funzioni f n della forma 

f n = P n (x) exp (− x2 

2 ), 

per polinomi P n di grado n, univocamente definiti (a meno di una costante 

moltiplicativa, come è ovvio). 

Per semplicità notazionale, consideriamo l’operatore Ĥ motiplicato per 2, 

ovvero mostriamo che 

Ĥ ′ := −∂x 2 + x2 

ha autovalori dati da λ n = 2n + 1, n = 0, 1, . . .. 

Procediamo prima con esempi di grado basso, cominciando come ovvio con 

n = 0. Abbiamo, detta ψ 0 := exp (− x2 

2 ), 

dψ 0 

dx = −xψ 0, 

d 2 

dx 2ψ 0 = −ψ 0 + x dψ 0 

dx = −ψ 0 + x 2 ψ 0 (7.10) 

42

Dunque, 

Ĥ ′ (ψ 0 ) = −(∂ 2 x + x 2 )(ψ 0 ) = −(−ψ 0 + x 2 ψ 0 ) + ψ 0 = ψ 0 . 

Dunque, la affermazione è vera per n = 0. Consideriamo il caso n = 1, e 

ψ 1 = (x + a)ψ 0 . Abbiamo, in questo caso, 

ψ 1 ′ = aψ 0 − x(x + a)ψ 0 , ⇒, ψ 1 ” = (x 3 + ax 2 − 3 x − a)ψ 0 

Allora, 

Ĥ ′ (ψ 1 ) = ( −(x 3 + ax 2 − 3 x − a) + (x 2 (x + a)) ) ψ 0 = (3x + a)ψ 0 . 

D’altro canto, λψ 1 = (λ x + λ a)ψ 0 ; dunque l’uguaglianza 

Ĥ ′ ψ 1 = λψ 1 

è vera se e solo se λ = 3, a = 0; vediamo che per n = 1 la affermazione è vera, 

con ψ 1 = xψ 0 . 

Per n generico, si può procedere nel seguente modo: 

Si osserva che 

il che implica che 

d 2 

exp (−x2 

f(x 2 )) = ( f ′′ (x) − 2 x − f(x) + x 2 f(x) ) exp (− x2 

2 )), 

H(f(x) exp (− x2 

2 )) = (− (f ′′ (x) + 2 x + f(x)) exp (− x2 

2 ). 

e dunque l’equazione agli autovalori Ĥ′ ψ = λψ si scrive come 

(− (f ′′ (x) + 2 x + (1 − λ)f(x))exp (− x2 

2 ) = 0, ⇔ f ′′ (x) + 2 x + (1 − λ)f(x). 

(7.11) 

Ora, se f(x) = P n (x) è un polinomio di grado n, con coefficiente leading 1, 

ovvero 

∑n−1 

n∑ 

P n (x) = x n + x k , o P n = a k x k , a n = 1, 

abbiamo che la (7.11) diviene: 

− 

k=2 

k=0 

n∑ 

n∑ 

(k(k − 1)a i )(x k−2 + ( (2ka k x k ) + 

k=1 

k=0 

n∑ 

((1 − λ)a k x k ) = 0. (7.12) 

Quindi per risolvere il nostro problema basta verificare che questa equazione è 

risolubile nello spazio dei polinomi, ovvero dei coefficienti {a 0 , . . .,a n−1 }. 

43 

k=0

Consideriamo il temine di ordine più elevato (ovvero n) in (7.12); il primo 

addendo non contribuisce; dunque si ha 

(2n + 1 − λ) = 0 ⇒ λ n = 2n + 1. 

Questa prima equazione determina λ n = 2n + 1, e dunque, per lo studio delle 

equazioni successive possiamo considerare la equazione 

− 

n∑ 

n∑ 

(k(k − 1)a k )(x k−2 + ( (2ka k x k ) + 

k=2 

k=1 

n∑ 

((−2n)a k x k ) = 0. (7.13) 

Per il termine di ordine n − 1 di P n si ha (anche qui il primo addendo non 

contribuisce): 

k=0 

2(n − 1)a n−1 − 2na n−1 ≡ (−2)a n−1 = 0 ⇔ a n−1 = 0. 

La equazione per a n−2 è (qui c’entra anche il primo addendo) 

La equazione per a n−3 è 

=1 

{}}{ 

− (n − 2)(n − 3) a n +2(n − 2)a n−2 − 2na n−2 

≡ −(n − 2)(n − 3) − 2a n−2 = 0 

⇔ a n−2 = − 1 (n − 2)(n − 3) 

4 

−(n −3)(n −4)a n−1 +2(n −3)a n−3 −2na n−3 ≡ −(n −3)(n −4)a n−1 −6a n−3 = 0 

Ma abbiamo visto che a n−1 = 0, e dunque anche a n−3 = 0. 

In generale, guardando in faccia la (7.13) si osserva che, per i coefficienti a i 

questa dà luogo ad equazioni ricorsive che determinano il termine a p−2 , noto il 

termine a p ; infatti si ha, per p = n − l, l = 2, . . ., n − 1 

−(n − l − 1)(n − l − 2)a n−l − 2la n−l−2 = 0 

e, per l’ultimo termine (p = 0 ↔ l = n), (qui il secondo addendo della (7.13) 

non contribuisce) 

Questo conclude la dimostrazione. 

−2a 2 − 2na 0 = 0, ⇔ a 0 = − 1 n a 2. 

Osservazioni. 1) È evidente che P n(x) non è la funzione nulla; dato che 

∫ 

(ψ n , ψ n ) = Pn(x) 2 exp(−x 2 ) dx 

R 

è un numero finito (l’integrando decade esponenzialmente), chiamiamolo c 9 n , 

se considero ψ n ′ = ψn 

c n 

ho 

9 E.g., c 0 = ∫ R exp(−x2 )dx = √ π 

44

i) Ĥψ′ n = (n + 1 2 )ψ′ n 

ii) (ψ n ′ , ψ′ n ) = 1 (gli autovettori “primati” hanno norma pari ad 1). 

2) (ψ n , ψ m ) = 0 se n ≠ m (Autovettori corrispondenti ad autovalori distiniti 

sono “ortogonali”!); in particolare si ha anche che 

(ψ n ′ , ψ′ m ) = 0 se n ≠ m, 

ovvero i vettori {ψ ′ n } n=0,1,2,... formano una famiglia (o sistema) di vettori ortonormali 

in L 2 (R, C) 10 

3) I polinomi corrispondenti ai vettori ψ ′ n, ovvero 

P ′ n ≡ ψ′ n exp(x2 ) ≡ P n 

√ 

cn 

si chiamano Polinomi di Hermite. Osserviamo che la relazione di ricorrenza 

a k+2 = G(a k ), a n = 1, a n−1 = 0 

implica che i polinomi di Hermite sono pari se n è pari e dispari se n è dispari. 

10 In un senso opportuno, essi formano una base nello spazio di Hilbert L 2 (R, C) . 

45

Appunti di algebra - Matematica e Applicazioni

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?