ePaper herunterladen

Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ...

Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ... Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ...

von iag.uni.hannover.de Mehr von diesem Publisher

20.12.2013 Aufrufe

Lineare Algebra II Sommersemester 2009 Wolfgang Ebeling 1

Lineare Algebra II

Sommersemester 2009

Wolfgang Ebeling

c○Wolfgang Ebeling

Institut für Algebraische Geometrie

Leibniz Universität Hannover

Postfach 6009

30060 Hannover

E-mail: ebeling@math.uni-hannover.de

1 Summen von Vektorräumen 3

1 Summen von Vektorräumen

Im Folgenden sei K zunächst ein beliebiger Körper. Wir betrachten verschiedene

Summen von Vektorräumen.

Definition Es sei V ein K-Vektorraum und U 1 , U 2 Unterräume von V .

Dann heißt

U 1 + U 2 := {u 1 + u 2 | u 1 ∈ U 1 , u 2 ∈ U 2 }

die Summe von U 1 und U 2 .

Lemma 1.1 Für die oben definierte Summe U 1 +U 2 der Unterräume U 1 und

U 2 gilt:

(i) U 1 + U 2 = Span(U 1 ∪ U 2 ).

(ii) U 1 + U 2 ⊆ V ist ein Unterraum.

(iii) dim(U 1 + U 2 ) ≤ dim U 1 + dim U 2 .

Beweis. (i) U 1 + U 2 ⊆ Span(U 1 ∪ U 2 ) ist klar. Zum Beweis der umgekehrten

Inklusion sei v ∈ Span(U 1 ∪ U 2 ). Dann gibt es u 1 , . . . , u k ∈ U 1 , w 1 , . . . , w m ∈

U 2 und λ 1 , . . . , λ k , µ 1 , . . . , µ m ∈ K mit

v = λ 1 u 1 + · · · + λ k u k + µ 1 w 1 + · · · + µ m w m .

Setze v 1 := λ 1 u 1 + · · · + λ k u k und v 2 := µ 1 w 1 + · · · + µ m w m . Dann ist v 1 ∈ U 1

und v 2 ∈ U 2 , also v = v 1 + v 2 ∈ U 1 + U 2 .

(ii) folgt aus (i).

(iii) Ist u 1 , . . . , u k eine Basis von U 1 und w 1 , . . . , w m eine Basis von U 2 , so

ist u 1 , . . . , u k , w 1 , . . . , w m ein Erzeugendensystem von Span(U 1 ∪ U 2 ). Damit

folgt die Behauptung aus (i).

✷

Satz 1.1 (Dimensionsformel für Summen) Für endlich dimensionale Unterräume

U 1 , U 2 ⊆ V gilt

dim(U 1 + U 2 ) = dim U 1 + dim U 2 − dim(U 1 ∩ U 2 ).

Beweis. Es sei {v 1 , . . . , v m } eine Basis von U 1 ∩ U 2 . Wir ergänzen diese Basis

zu Basen

{v 1 , . . . , v m , u 1 , . . . , u k } von U 1 und {v 1 , . . . , v m , u ′ 1, . . . , u ′ l} von U 2 .

Wir müssen zeigen:

B := {v 1 , . . . , v m , u 1 , . . . , u k , u ′ 1, . . . , u ′ l} ist eine Basis von U 1 + U 2 .

1 Summen von Vektorräumen 4

Es ist klar, dass B ein Erzeugendensystem von Span(U 1 ∪ U 2 ) und nach

Lemma 1.1(i) damit von U 1 + U 2 ist. Wir müssen also noch zeigen, dass B

linear unabhängig ist. Dazu sei

Wir setzen

λ 1 v 1 + · · · + λ m v m + µ 1 u 1 + · · · + µ k u k + µ ′ 1u ′ 1 + · · · + µ ′ lu ′ l = 0.

v := λ 1 v 1 + · · · + λ m v m + µ 1 u 1 + · · · + µ k u k .

Dann ist v ∈ U 1 und −v = µ ′ 1u ′ 1 + · · · + µ ′ l u′ l ∈ U 2. Daraus folgt v ∈ U 1 ∩ U 2 .

Also ist

v = λ ′ 1v 1 + · · · + λ ′ mv m

für gewisse Skalare λ ′ 1, . . . , λ ′ m. Da {v 1 , . . . , v m , u 1 , . . . , u k } eine Basis von U 1

bildet, folgt aus der Eindeutigkeit der Darstellung von v als Linearkombination

der Vektoren dieser Basis insbesondere µ 1 = · · · = µ k = 0. Setzen wir

dies in die obige Gleichung ein, so folgt

λ 1 = · · · = λ m = µ ′ 1 = · · · = µ ′ l = 0.

Lemma 1.2 Ist V = U 1 + U 2 , so sind die folgenden Aussagen äquivalent:

(i) U 1 ∩ U 2 = {0}.

(ii) Jedes v ∈ V lässt sich eindeutig darstellen als v = u 1 + u 2 mit u 1 ∈ U 1

und u 2 ∈ U 2 .

(iii) Je zwei vom Nullvektor verschiedene Vektoren u 1 ∈ U 1 und u 2 ∈ U 2

sind linear unabhängig.

Beweis. (i) ⇒ (ii): Es sei

v = u 1 + u 2 = u ′ 1 + u ′ 2 (u 1 , u ′ 1 ∈ U 1 , u 2 , u ′ 2 ∈ U 2 ).

Dann folgt u 1 − u ′ 1 = u ′ 2 − u 2 ∈ U 1 ∩ U 2 , nach (i) also u 1 − u ′ 1 = u ′ 2 − u 2 = 0.

(ii) ⇒ (iii): Nach (ii) besitzt der Nullvektor eine eindeutige Darstellung

0 = 0u 1 + 0u 2 .

(iii) ⇒ (i): Es sei 0 ≠ v ∈ U 1 ∩ U 2 . Dann sind nach (iii) v und −v linear

unabhängig im Widerspruch zu 1v + (−1)v = 0.

✷

Ist eine der drei äquivalenten Bedingungen von Lemma 1.2 erfüllt, so

heißt V die direkte Summe von U 1 und U 2 . Also gilt z. B.:

✷

1 Summen von Vektorräumen 5

Definition Ein Vektorraum V heißt direkte Summe von zwei Unterräumen

U 1 und U 2 , in Zeichen V = U 1 ⊕ U 2 , wenn

V = U 1 + U 2 und U 1 ∩ U 2 = {0}.

Beispiel 1.1 Es sei V = R 3 . Ist U 1 = Span{e 1 , e 2 } und U 2 = Span{e 3 }, so

ist V = U 1 ⊕ U 2 . Ist dagegen U 3 = Span{e 2 , e 3 }, so ist zwar V = U 1 + U 3 , die

Summe ist aber nicht direkt, da U 1 ∩ U 3 = Span{e 2 }.

Satz 1.2 Es sei V ein endlich dimensionaler K-Vektorraum und U 1 , U 2 Untervektorräume

von V . Dann sind die folgenden Bedingungen äquivalent:

(i) V = U 1 ⊕ U 2 .

(ii) Es gibt Basen {u 1 , . . . , u k } von U 1 und {u ′ 1, . . . , u ′ l } von U 2, so dass

{u 1 , . . . , u k , u ′ 1, . . . , u ′ l } eine Basis von V ist.

(iii) Es gilt V = U 1 + U 2 und dim V = dim U 1 + dim U 2 .

Beweis. (i) ⇒ (ii) folgt aus dem Beweis der Dimensionsformel (Satz 1.1) und

der Tatsache, dass U 1 ∩ U 2 = {0}.

(ii) ⇒ (iii) ist klar.

(iii) ⇒ (i): Aus der Dimensionsformel folgt dim(U 1 ∩ U 2 ) = 0. Daraus

folgt U 1 ∩ U 2 = {0}.

✷

Definition Es sei U ⊆ V ein Unterraum. Ein Unterraum W ⊆ V heißt

Komplement von U in V , falls

U ⊕ W = V.

Bemerkung 1.1 Zu einem Unterraum U ist ein Komplement W im Allgemeinen

nicht eindeutig bestimmt: Ist zum Beispiel V = R 3 und U =

Span{e 1 , e 2 }, so sind W 1 = Span{e 3 } und W 2 = Span{e 1 + e 3 } Komplemente

von U.

Satz 1.3 Ist V endlich dimensional und U ⊆ V ein Unterraum, so besitzt

U ein Komplement in V .

Beweis. Man nehme eine Basis {v 1 , . . . , v r } von U und ergänze sie nach I,

Satz 11.4, zu einer Basis {v 1 , . . . , v r , v r+1 , . . . , v n } von V . Man setze

W := Span{v r+1 , . . . , v n }.

Nun sei K = R oder K = C und (V, 〈 , 〉) ein euklidischer (K = R) oder

unitärer (K = C) Vektorraum .

✷

1 Summen von Vektorräumen 6

Definition

Es sei V ein euklidischer (unitärer) Vektorraum.

(a) Zwei Vektoren v, w ∈ V heißen orthogonal, in Zeichen v ⊥ w, falls

〈v.w〉 = 0.

(b) Zwei Unterräume U, W ⊆ V heißen orthogonal, in Zeichen U ⊥ W ,

falls u ⊥ w für alle u ∈ U, w ∈ W .

U ⊥ := {v ∈ V | 〈u, v〉 = 0 für alle u ∈ U}

das orthogonale Komplement von U.

Bemerkung 1.2 Das orthogonale Komplement U ⊥ eines Unterraums U ist

ein Unterraum. Aus dem unten stehenden Satz 1.4 folgt, dass es ein Komplement

von U ist.

Definition Es sei V ein euklidischer (unitärer) Vektorraum und U 1 , U 2

Unterräume von V . Man sagt, V ist die orthogonale direkte Summe der Unterräume

U 1 und U 2 , in Zeichen V = U 1 ⊥ U 2 , falls

(i) V = U 1 ⊕ U 2 und

(ii) U 1 ⊥ U 2 .

Lemma 1.3 Es sei V ein euklidischer (unitärer) Vektorraum und U 1 , U 2

Unterräume von V . Gilt

(i) V = U 1 + U 2 und

(ii) U 1 ⊥ U 2 ,

so ist V die orthogonale direkte Summe der Unterräume U 1 und U 2 .

Beweis. Wir haben zu zeigen: U 1 ∩ U 2 = {0}. Es sei v ∈ U 1 ∩ U 2 , v ≠ 0.

Wegen (i) ist v = u 1 + u 2 mit u 1 ∈ U 1 und u 2 ∈ U 2 . Dann gilt

0 ≠ 〈v, v〉 = 〈v, u 1 〉 + 〈v, u 2 〉 = 0 wegen (ii),

ein Widerspruch.

✷

Satz 1.4 Es sei V ein endlich dimensionaler euklidischer (unitärer) Vektorraum

und W ⊆ V ein Unterraum. Dann gilt

V = W ⊥ W ⊥ .

Insbesondere ist

dim V = dim W + dim W ⊥ .

1 Summen von Vektorräumen 7

Beweis. Es sei {w 1 , . . . , w m } eine ON-Basis von W . Diese ergänze man nach

I, Satz 20.2, zu einer ON-Basis {w 1 , . . . , w m , w m+1 , . . . , w n } von V . Dann ist

w m+1 , . . . , w n ∈ W ⊥ . Es sei nun v ∈ V . Dann können wir v schreiben als

mit

v = λ 1 w 1 + · · · + λ m w m + λ m+1 w m+1 + · · · + λ n w n

λ 1 w 1 + · · · + λ m w m ∈ W, λ m+1 w m+1 + · · · + λ n w n ∈ W ⊥ .

Daraus folgt die Behauptung.

Wir wollen nun auch Summen von mehr als zwei Unterräumen betrachten.

Definition Es sei V ein K-Vektorraum und U 1 , . . . , U s Unterräume von V .

Dann heißt

U 1 + · · · + U s := {u 1 + · · · + u s | u i ∈ U i , i = 1, . . . , s}

die Summe von U 1 , . . . , U s .

Wie oben beweist man:

Lemma 1.4 Für die Summe U 1 + · · · + U s der Unterräume U 1 , . . . , U s gilt:

(i) U 1 + · · · + U s = Span(U 1 ∪ · · · ∪ U s ).

(ii) U 1 + · · · + U s ⊆ V ist ein Unterraum.

(iii) dim(U 1 + · · · + U s ) ≤ dim U 1 + · · · + dim U s .

Satz 1.5 Ist V = U 1 + · · · + U s , so sind die folgenden Aussagen äquivalent:

(i) Für jedes i = 1, . . . , s gilt: Ist W i := U 1 + · · · + Ûi + · · · + U s , so ist

U i ∩W i = {0}. (Hierbei bedeutet Ûi: In der Summe wird U i weggelassen,

”nimmt seinen Hut und geht”.)

(ii) Jedes Element v ∈ V lässt sich eindeutig darstellen als v = u 1 +· · ·+u s

mit u i ∈ U i .

(iii) Für jede Teilmenge I ⊆ {1, . . . , s} gilt: Ist für i ∈ I u i ∈ U i , u i ≠ 0, so

ist die Teilmenge S I := {u i | i ∈ I} linear unabhängig.

Definition Ist eine der äquivalenten Bedingungen von Satz 1.5 erfüllt, so

heißt V die direkte Summe von U 1 , . . . , U s , in Zeichen V = U 1 ⊕ · · · ⊕ U s .

✷

1 Summen von Vektorräumen 8

Beweis. (i) ⇒ (ii): Es sei

Dann folgt

v = u 1 + · · · + u s = u ′ 1 + · · · + u ′ s (u i , u ′ i ∈ U i ).

u i −u ′ i = (u ′ 1−u 1 )+· · ·+(u ′ i−1−u i−1 )+(u ′ i+1−u i+1 )+· · ·+(u ′ s−u s ) ∈ W i ∩U i .

Nach (i) folgt u i − u ′ i = 0.

(ii) ⇒ (iii): Es sei I = {i 1 , . . . , i r } ⊆ {1, . . . , s} und

λ 1 u i1 + · · · + λ r u ir = 0.

Da nach (ii) auch der Nullvektor 0 ∈ V eine eindeutige Darstellung

0 = 0u i1 + · · · + 0u ir

besitzt, folgt λ 1 = . . . = λ r = 0.

(iii) ⇒ (i): Es sei W i ∩ U i ≠ {0}. Dann gibt es ein u i ∈ U i mit u i ≠ 0 und

u i = u 1 + · · · + u i−1 + u i+1 + · · · + u s mit u j ∈ U j .

Es sei I die Menge aller Indizes j ∈ {1, . . . , s} mit u j

Teilmenge S I linear abhängig im Widerspruch zu (iii).

≠ 0. Dann ist die

✷

Satz 1.6 Es sei V ein endlich dimensionaler K-Vektorraum und U 1 , . . . , U s

Unterräume von V . Dann sind die folgenden Bedingungen äquivalent:

(i) V = U 1 ⊕ · · · ⊕ U s .

(ii) Ist für jedes i ∈ {1, . . . , s} eine Basis {u (i)

1 , . . . , u (i)

k i

} von U i gegeben, so

ist

{u (1)

1 , . . . , u (1)

k 1

, . . . , u (s)

1 , . . . , u (s)

k s

}

eine Basis von V .

(iii) Es gilt V = U 1 + · · · + U s und dim V = dim U 1 + · · · + dim U s .

Beweis. (i) ⇒ (ii): Es sei

B := {u (1)

1 , . . . , u (1)

k 1

, . . . , u (s)

1 , . . . , u (s)

k s

}.

Offensichtlich ist B ein Erzeugendensystem von V . Es reicht daher zu zeigen,

dass B linear unabhängig ist. Dazu sei

λ (1)

1 u (1) + · · · + λ (1)

k 1

u (1)

k 1

+ · · · + λ (s)

1 u (s)

1 + · · · + λ (s)

k s

u (s)

k s

= 0.

1 Summen von Vektorräumen 9

Setzen wir w i := λ (i)

1 u (i) + · · · + λ (i)

k i

u (i)

k i

, so folgt

w 1 + · · · + w s = 0.

Aus Satz 1.5 (iii) folgt w 1 = . . . = w s = 0. Also ist

λ (i)

1 u (i) + · · · + λ (i)

k i

u (i)

k i

= 0 für i = 1, . . . , s.

Daraus folgt λ (i)

1 = · · · = λ (i)

k i

= 0.

(ii) ⇔ (iii) ist klar.

(ii) ⇒ (i) folgt aus Satz 1.5 (ii).

Es sei nun wieder K = R, C und V ein euklidischer (unitärer) Vektorraum.

Definition Es sei V ein euklidischer (unitärer) Vektorraum und U 1 , . . . , U s

Unterräume von V . Man sagt, V ist die orthogonale direkte Summe der Unterräume

U 1 . . . , U s , in Zeichen V = U 1 ⊥ . . . ⊥ U s , falls

(i) V = U 1 ⊕ · · · ⊕ U s und

(ii) U i ⊥ U j für i ≠ j.

✷

Lemma 1.5 Es sei V ein euklidischer (unitärer) Vektorraum und U 1 , . . . , U s

Unterräume von V . Gilt

(i) V = U 1 + · · · + U s und

(ii) U i ⊥ U j für i ≠ j,

so ist V die orthogonale direkte Summe der Unterräume U 1 , . . . , U s .

Beweis. Wir haben zu zeigen: U i ∩ W i = {0}. Es sei v ∈ U i ∩ W i , v ≠ 0. Dann

gilt

v = u 1 + · · · + u i−1 + u i+1 + · · · + u s mit u j ∈ U j .

Da U i ⊥ U j für i ≠ j gilt, folgt dann

0 ≠ 〈v, v〉 = 〈v, u 1 〉 + · · · + 〈v, u i−1 〉 + 〈v, u i+1 〉 + · · · + 〈v, u s 〉 = 0,

ein Widerspruch.

✷

2 Normierte Vektorräume 10

2 Normierte Vektorräume

Es sei K = R, C und V ein K-Vektorraum. Ist 〈 , 〉 : V × V → K eine symmetrische

Bilinearform (hermitesche Sesquilinearform), so erhält man daraus

eine Abbildung

q : V −→ K

v ↦−→ q(v) := 〈v, v〉 .

Sie heißt die zu 〈 , 〉 gehörige quadratische Form.

Man kann 〈 , 〉 aus q zurückgewinnen. Dies nennt man Polarisierung:

K = R : 〈v, w〉 = 1 (q(v + w) − q(v − w)) ,

4

K = C : 〈v, w〉 = 1 (q(v + w) − q(v − w) + iq(v + iw) − iq(v − iw)) .

4

(Beweis durch Nachrechnen.)

Definition Es sei V ein K-Vektorraum. Unter einer Norm auf V versteht

man eine Funktion

|| || : V −→ R

v ↦−→ ||v||

mit folgenden Eigenschaften:

(i) ||v|| ≥ 0, ||v|| = 0 ⇔ v = 0,

(ii) ||λv|| = |λ| · ||v|| für alle λ ∈ K, v ∈ V .

(iii) ||v + w|| ≤ ||v|| + ||w|| für alle v, w ∈ V (Dreiecksungleichung).

Ein normierter Vektorraum ist ein Paar (V, || ||), das aus einem Vektorraum

V und einer Norm || || auf V besteht.

Definition Es sei X eine Menge. Unter einer Metrik auf X versteht man

eine Abbildung

d : X × X −→ R

(x, y) ↦−→ d(x, y)

mit folgenden Eigenschaften:

(i) d(x, y) = 0 ⇔ x = y

(ii) d(x, y) = d(y, x) für alle x, y ∈ X (Symmetrie)

(iii) d(x, z) ≤ d(x, y) + d(y, z) für alle x, y, z ∈ X (Dreiecksungleichung).

2 Normierte Vektorräume 11

Ein metrischer Raum ist ein Paar (X, d), X Menge, d Metrik. Man nennt

d(x, y) den Abstand oder die Distanz der Punkte x und y bzgl. d.

Bemerkung 2.1 Aus den Axiomen folgt, dass d(x, y) ≥ 0 für alle x, y ∈ X.

Beweis. Wende Dreiecksungleichung auf x, y, x an:

0 (i)

= d(x, x) ≤ d(x, y) + d(y, x) (ii)

= 2d(x, y).

Satz 2.1 Es sei (V, || ||) ein normierter Vektorraum. Dann wird durch

eine Metrik d auf V definiert.

Beweis.

d(x, y) := ||x − y|| für x, y ∈ V

(i) d(x, y) = 0 ⇔ ||x − y|| = 0 ⇔ x − y = 0 ⇔ x = y.

(ii) d(x, y) = ||x − y|| = | − 1| ||x − y|| = ||y − x|| = d(y, x).

(iii) d(x, z) = ||x−z|| = ||x−y+y−z|| ≤ ||x−y||+||y−z|| = d(x, y)+d(y, z).

Satz 2.2 Ist (V, 〈 , 〉) ein euklidischer (unitärer) Vektorraum, so wird durch

eine Norm auf V definiert.

‖v‖ := √ 〈v, v〉

Für den Beweis dieses Satzes brauchen wir das folgende Resultat:

Satz 2.3 (Cauchy-Schwarzsche Ungleichung) Für v, w ∈ V gilt

|〈v, w〉| ≤ ‖v‖‖w‖

und Gleichheit gilt genau dann, wenn v und w linear abhängig sind.

Beweis. Für w = 0 sind beide Seiten der Ungleichung gleich 0, die Ungleichung

ist daher erfüllt. Es genügt daher, den Fall w ≠ 0 zu behandeln.

Für λ, µ ∈ K gilt

0 ≤ 〈λv + µw, λv + µw〉

= λλ〈v, v〉 + λµ〈v, w〉 + λµ〈w, v〉 + µµ〈w, w〉.

✷

✷

3 Normalform orthogonaler und unitärer Endomorphismen 12

Setzen wir nun λ := 〈w, w〉 und µ := −〈v, w〉, so folgt

0 ≤ λ(〈v, v〉〈w, w〉 − 〈v, w〉〈v, w〉) = λ(‖v‖ 2 ‖w‖ 2 − |〈v, w〉| 2 ).

Wegen λ ≥ 0 folgt daraus

0 ≤ ‖v‖ 2 ‖w‖ 2 − |〈v, w〉| 2 .

Nun ziehen wir auf beiden Seiten die Quadratwurzel. Dann bleibt das Ungleichheitszeichen

erhalten und wir erhalten die behauptete Ungleichung.

Für den Beweis des Zusatzes bemerken wir (für λ := 〈w, w〉 und µ :=

−〈v, w〉) :

|〈v, w〉| = ‖v‖‖w‖

⇔ 〈λv + µw, λv + µw〉 = 0

⇔ λv + µw = 0

⇔ v = − µ λ w.

Man beachte, dass dies der gleiche Beweis wie für I, Satz 3.4 ist, nur dass wir

statt einer symmetrischen Bilinearform auch eine hermitesche Sesquilinearform

zugelassen haben.

✷

Beweis von Satz 2.2. (i) und (ii) sind einfach (siehe Vorlesung).

(iii): Um die Dreiecksungleichung

√

〈v + w, v + w〉 ≤

√

〈v, v〉 +

√

〈w, w〉

zu beweisen, geht man durch Quadrieren zu der äquivalenten Ungleichung

〈v + w, v + w〉 ≤ 〈v, v〉 + 2 √ 〈v, v〉〈w, w〉 + 〈w, w〉

über, die gleichbedeutend ist mit

〈v, v〉 + 2|〈v, w〉| + 〈w, w〉 ≤ 〈v, v〉 + 2 √ 〈v, v〉〈w, w〉 + 〈w, w〉.

Diese Ungleichung ist äquivalent zu der Cauchy-Schwarzschen Ungleichung.

✷

3 Normalform orthogonaler und unitärer Endomorphismen

Nun sei im Folgenden wieder K = R, C und (V, 〈 , 〉) ein euklidischer

(unitärer) Vektorraum. Wir erinnern an die folgende Definition.

3 Normalform orthogonaler und unitärer Endomorphismen 13

Definition Es sei V ein euklidischer (unitärer) Vektorraum. Ein Endomorphismus

f : V → V heißt orthogonal (unitär), falls gilt:

〈f(v), f(w)〉 = 〈v, w〉 für alle v, w ∈ V.

Theorem 3.1 Es sei V ein unitärer Vektorraum der Dimension n und f :

V → V ein unitärer Endomorphismus. Dann besitzt V eine ON-Basis, die

aus Eigenvektoren von f besteht. Insbesondere ist f diagonalisierbar.

Beweis. Der zugrundeliegende Körper ist C und die Eigenwerte von f sind

die Nullstellen des charakteristischen Polynoms P f (x), das ein komplexes

Polynom ist. Nach dem Fundamentalsatz der Algebra hat P f (x) genau n

Nullstellen λ 1 , . . . λ n ∈ C. Also gilt

P f (x) = (x − λ 1 ) · · · (x − λ n ).

Wir führen nun Induktion nach n = dim V durch.

Der Induktionsanfang n = 1 ist klar.

Wir nehmen nun an, dass die Behauptung bereits für n − 1 bewiesen

ist. Es sei v 1 ein Eigenvektor von f zum Eigenwert λ 1 . Ohne Einschränkung

können wir annehmen, dass ‖v 1 ‖ = 1. Es sei

Dann gilt nach Satz 1.4

Behauptung f(W ) = W .

W := Span{v 1 } ⊥ = {w ∈ V | 〈v 1 , w〉 = 0}.

V = Span{v 1 } ⊥ W.

Beweis. Da f ein Isomorphismus ist, reicht es zu zeigen: f(W ) ⊆ W . Nach

I, Satz 21.1 (v), gilt |λ 1 | = 1. Damit gilt für w ∈ W :

λ 1 〈v 1 , f(w)〉 = 〈λ 1 v 1 , f(w)〉 = 〈f(v 1 ), f(w)〉 = 〈v 1 , w〉 = 0.

Da λ 1 ≠ 0 folgt 〈v 1 , f(w)〉 = 0, also f(w) ∈ W .

Nun betrachten wir den Endomorphismus f| W : W → W . Da f| W die Einschränkung

eines unitären Endomorphismus ist, ist f| W auch wieder unitär.

Da dim W = n − 1 können wir auf f| W : W → W die Induktionsvoraussetzung

anwenden. Danach besitzt W eine ON-Basis {v 2 , . . . , v n } aus Eigenvektoren.

Dann ist

B := {v 1 , v 2 , . . . , v n }

eine ON-Basis von V aus Eigenvektoren.

✷

✷

3 Normalform orthogonaler und unitärer Endomorphismen 14

Korollar 3.1 Eine unitäre Matrix A ist diagonalisierbar. Genauer gilt: Es

gibt eine unitäre Matrix S mit

⎛

⎞

λ 1 0 · · · 0

S T 0 λ 2 · · · 0

AS = ⎜

⎝

.

. . ..

⎟ . ⎠ .

0 0 · · · λ n

Hierbei gilt |λ i | = 1 für i = 1, . . . , n.

Beweis. Siehe Vorlesung.

In LA I hatten wir bereits orthogonale Abbildungen f : R n → R n betrachtet

und für n = 1, 2, 3 klassifiziert. Allgemeiner wollen wir nun beweisen:

Theorem 3.2 Es sei V ein euklidischer Vektorraum der Dimension n und

f : V → V ein orthogonaler Endomorphismus. Dann besitzt V eine ON-Basis

B, bezüglich der f die Darstellungsmatrix

⎛

⎞

+1

. .. +1 0

−1

MB B (f) =

.. . ,

−1

0 A 1 ⎜

.

⎝

.. ⎟

⎠

A k

✷

besitzt, wobei für j = 1, . . . , k

( )

cos αj − sin α

A j =

j

sin α j cos α j

mit α j ∈ [0, 2π), aber α j ≠ 0, π.

Für den Beweis dieses Theorems brauchen wir ein Lemma.

Lemma 3.1 Jedes Polynom P (x) mit reellen Koeffizienten besitzt eine Zerlegung

P (x) = (x − λ 1 ) · · · (x − λ r )Q 1 (x) · · · Q k (x),

wobei λ 1 , . . . , λ r ∈ R und Q 1 (x), . . . , Q k (x) Polynome vom Grad 2 sind, die

keine reelle Nullstelle haben.

3 Normalform orthogonaler und unitärer Endomorphismen 15

Beweis. Das Polynom P (x) hat n komplexe Nullstellen. Ist λ ∈ C eine Nullstelle

von P (x), so auch λ:

P (λ) = a 0 + a 1 λ + · · · + a n λ n = a 0 + a 1 λ + · · · + a n λ n = P (λ) = 0 = 0.

Also hat man eine Zerlegung

P (x) = (x − λ 1 ) · · · (x − λ r )(x − µ 1 )(x − µ 1 ) · · · (x − µ k )(x − µ k ),

wobei λ 1 , . . . , λ r ∈ R und µ 1 , . . . , µ k ∉ R. Es sei j = 1, . . . , k und µ j = ξ j +iη j

mit ξ j , η j ∈ R. Setze

Q j (x) = (x − µ j )(x − µ j ) = x 2 − 2ξ j x + (ξ 2 j + η 2 j ).

Beweis von Theorem 3.2. Wir führen Theorem 3.2 auf Theorem 3.1 zurück.

Dazu komplexifizieren wir f. Es sei B ′ irgendeine ON-Basis von V und A :=

MB B′ (f) die Darstellungsmatrix von f bezüglich ′ B′ . Dann ist A orthogonal

und als reelle Matrix auch unitär. Also ist der Endomorphismus

✷

A : C n → C n ,

z ↦→ Az,

unitär. Es sei

P A (x) = P (x) = (x − λ 1 ) · · · (x − λ r )(x − µ 1 )(x − µ 1 ) · · · (x − µ k )(x − µ k )

die Zerlegung des charakteristischen Polynoms von A, die nach Lemma 3.1

existiert. Nach I, Satz 21.1 (v) gilt λ i = ±1, i = 1, . . . , r, µ j = cos α j +i sin α j ,

α j ∈ [0, 2π), α j ≠ 0, π, j = 1, . . . , k. Nach Theorem 3.1 erhalten wir für A eine

ON-Basis ˜B von C n von Eigenvektoren von A. Es sei nun z ein Eigenvektor zu

einem nicht reellen Eigenwert µ. Dann ist z ein Eigenvektor zum Eigenwert

µ, denn

Az = Az = µz = µ z.

Deswegen können wir die Basis ˜B so anordnen:

v 1 , . . . , v p die Eigenvektoren zum Eigenwert + 1,

w 1 , . . . , w q die Eigenvektoren zum Eigenwert − 1,

z 1 , . . . , z k die Eigenvektoren zu den Eigenwerten µ 1 , . . . , µ k ,

z 1 , . . . , z k die Eigenvektoren zu den Eigenwerten µ 1 , . . . , µ k .

Da A reell ist, liegen die Eigenvektoren v 1 , . . . , v p , w 1 , . . . , w q in R n .

3 Normalform orthogonaler und unitärer Endomorphismen 16

Zu einem Paar z, z von Eigenvektoren zu µ, µ konstruieren wir nun einen

unter A invarianten Unterraum W ⊆ R n . Dazu sei

z = x + iy,

x, y ∈ R n

und

Behauptung

A(W ) = W

W := Span{x, y} ⊆ R n .

Beweis. Es gilt

0 = 〈z, z〉 = 〈x + iy, x − iy〉 = 〈x, x〉 − 〈y, y〉 + 2i〈x, y〉

1 = 〈z, z〉 = 〈x + iy, x + iy〉 = 〈x, x〉 + 〈y, y〉.

Daraus folgt 〈x, x〉 = 〈y, y〉 = 1 2

x = 1(z + z), y = 1 (z − z) folgt

2 2i

und 〈x, y〉 = 0. Aus µ = cos α + i sin α,

Ax = 1 2 (Az + Az) = 1 (µz + µ z) = cos αx − sin αy,

2

Ay = 1 2i (Az − Az) = 1 2i (µz − µ z) = sin αx + cos αy. ✷

Nun setzen wir

x ′ := √ 2x, y ′ := − √ 2y.

Bezüglich der ON-Basis {x ′ , y ′ } von W wird die Einschränkung von A auf

W beschrieben durch die Matrix

( )

cos α − sin α

.

sin α cos α

Damit haben wir eine Orthonormalbasis

B ′′ := {v 1 , . . . , v p , w 1 , . . . , w q , x ′ 1, y ′ 1, . . . , x ′ k, y ′ k}

von R n gefunden, bezüglich der die Abbildung A : R n → R n die in Theorem

3.2 angegebene Gestalt hat. Die Transformationsmatrix, die die Standardbasis

des R n in die Basis B ′′ des R n transformiert, transformiert dann

die Basis B ′ von V in eine ON-Basis B von V mit den gewünschten Eigenschaften.

✷

4 Normalform selbstadjungierter Endomorphismen 17

4 Normalform selbstadjungierter Endomorphismen

Es sei V ein euklidischer (unitärer) Vektorraum. In LA I hatten wir bereits

selbstadjungierte Endomorphismen betrachtet. Wir erinnern an die Definition.

Definition

Ein Endomorphismus f : V → V heißt selbstadjungiert, falls

In LA I hatten wir bewiesen:

〈f(v), w〉 = 〈v, f(w)〉 für alle v, w ∈ V.

Theorem 4.1 Es sei V ein euklidischer (unitärer) Vektorraum und f : V →

V ein selbstadjungierter Endomorphismus. Dann besitzt V eine ON-Basis,

die aus Eigenvektoren von f besteht.

Korollar 4.1 Ist A ∈ Mat(n, n; K) eine symmetrische bzw. hermitesche

Matrix, so gibt es eine orthogonale bzw. unitäre Matrix S, so dass

⎛

⎞

λ 1 0

S T ⎜

AS = ⎝

..

⎟ . ⎠

0 λ n

mit λ 1 , . . . , λ n ∈ R.

Wir halten noch das folgende Korollar fest.

Korollar 4.2 Es sei V ein euklidischer (unitärer) Vektorraum, f : V → V

ein selbstadjungierter Endomorphismus und λ 1 , . . . , λ k die paarweise verschiedenen

Eigenwerte. Dann ist

V = Eig(f, λ 1 ) ⊥ . . . ⊥ Eig(f, λ k ).

Beweis. Aus dem Theorem folgt, dass V die direkte Summe der Eigenräume

ist. Es bleibt zu zeigen: Eig(f, λ i ) ⊥ Eig(f, λ j ) für alle i ≠ j, i, j = 1, . . . , k.

Dazu sei v ∈ Eig(f, λ i ), w ∈ Eig(f, λ j ), i ≠ j. Dann gilt

λ i 〈v, w〉 = 〈λ i v, w〉 = 〈f(v), w〉 = 〈v, f(w)〉 = 〈v, λ j w〉 = λ j 〈v, w〉.

Daraus folgt

also 〈v, w〉 = 0.

(λ i − λ j )〈v, w〉 = 0,

✷

5 Symmetrische Bilinearformen 18

5 Symmetrische Bilinearformen

Es sei nun V ein endlich dimensionaler reeller Vektorraum mit einer symmetrischen

Bilinearform

〈 , 〉 : V × V → R.

(Diese Bilinearform braucht nicht positiv definit zu sein.) Wie wir bereits

gesehen haben, entspricht dieser Bilinearform eine quadratische Form

q : V → R,

q(v) = 〈v, v〉.

Bezüglich einer Basis B = {v 1 , . . . , v n } von V wird 〈 , 〉 dargestellt durch die

Matrix

A = (a ij ), a ij = 〈v i , v j 〉.

Nach der Transformationsformel ändert sich bei einem Basiswechsel mit Transformationsmatrix

S ∈ GL(n; R) die Darstellungsmatrix wie folgt:

A ↦→ S T AS.

Nach dem Satz über die Hauptachsentransformation gibt es eine orthogonale

Matrix S mit

⎛

⎞

λ 1 0 · · · 0

S T AS = S −1 0 λ 2 · · · 0

AS = ⎜

⎝ . .

..

⎟ . . ⎠ , (λ 1, . . . , λ n ∈ R).

0 0 · · · λ n

Wir fragen nun nach einer Normalform, wenn wir allgemeiner S ∈ GL(n; R)

zulassen.

Satz 5.1 Es sei 〈 , 〉 : V × V → R eine symmetrische Bilinearform. Dann

gibt es eine Basis B von V , bezüglich der 〈 , 〉 dargestellt wird durch

⎛

E k

⎞

0

⎝ −E l

⎠ .

0 0

Beweis. Nach dem Satz über die Hauptachsentransformation gibt es eine

Basis B ′ = {w 1 , . . . , w n }, bezüglich der die darstellende Matrix wie folgt

5 Symmetrische Bilinearformen 19

aussieht:

⎛

λ 1 . . . 0

λ k λ k+1

... λ k+l

⎜

0

⎝ 0

..

.

0

⎞

{ > 0 für i ≤ k,

, λ i

< 0 für k

⎟

⎠

Wir setzen

Dann gilt:

v i :=

{ 1 √|λi

| w i für 1 ≤ i ≤ k + l,

w i

sonst.

⎧

⎨ +1 für 1 ≤ i ≤ k,

〈v i , v i 〉 = −1 für k

⎩

0 sonst.

Also hat 〈 , 〉 bezüglich der Basis B = {v 1 , . . . , v n } die gewünschte Gestalt.

✷

Definition

Menge

Es sei 〈 , 〉 : V × V → R eine symmetrische Bilinearform. Die

V 0 := {v ∈ V | 〈v, w〉 = 0 für alle w ∈ V }

heißt das Radikal (oder der Nullraum) von 〈 , 〉. Es ist ein Unterraum von

V .

Korollar 5.1 Es sei 〈 , 〉 : V × V → R eine symmetrische Bilinearform.

Dann gibt es eine Zerlegung

in Unterräume, so dass gilt:

V = V + ⊕ V − ⊕ V 0 ,

(i) Die Zerlegung ist orthogonal bezüglich 〈 , 〉.

(ii) 〈v, v〉 > 0 für 0 ≠ v ∈ V + , 〈v, v〉 < 0 für 0 ≠ v ∈ V − .

Beweis. Es sei B = {v 1 , . . . , v n } eine Basis wie in Satz 5.1. Setze

V + := Span{v 1 , . . . , v k }, V − := Span{v k+1 , . . . , v k+l }.

5 Symmetrische Bilinearformen 20

Dann bleibt zu zeigen, dass V 0 = Span{v k+l+1 , . . . , v n }. Die Inklusion

Span{v k+l+1 , . . . , v n } ⊆ V 0

ist klar. Es sei umgekehrt v ∈ V 0 . Dann gilt

v = µ 1 v 1 + · · · + µ k+l v k+l + µ k+l+1 v k+l+1 + · · · + µ n v n .

Für i ∈ {1, . . . , k + l} gilt aber 〈v, v i 〉 = ±µ i = 0. Daraus folgt µ i = 0.

✷

Wie der Beweis zeigt, hängt die Zerlegung von einer Basis B von V ab.

Ist A die Darstellungsmatrix von 〈 , 〉 bezüglich dieser Basis, so gilt

dim V + = Anzahl der positiven Eigenwerte von A,

dim V − = Anzahl der negativen Eigenwerte von A.

Der Trägheitssatz von Sylvester besagt, dass diese Zahlen tatsächlich unabhängig

von der Wahl von B sind.

Satz 5.2 (Trägheitssatz von Sylvester) Es sei 〈 , 〉 : V × V → R eine

symmetrische Bilinearform, B eine Basis von V und A die Darstellungsmatrix

von 〈 , 〉 bezüglich B. Dann sind die Zahlen

k := Anzahl der positiven Eigenwerte von A,

l := Anzahl der negativen Eigenwerte von A

unabhängig von der Auswahl von B.

Beweis. Es sei B ′ eine andere Basis, k ′ , l ′ die entsprechenden Anzahlen und

V = V + ⊕ V − ⊕ V 0 = V ′ + ⊕ V ′ − ⊕ V 0

die entsprechenden zugehörigen Zerlegungen nach Korollar 5.1. Da die Anzahl

der von Null verschiedenen Eigenwerte gleich dim V − dim V 0 ist und

damit nicht von der Auswahl der Basis abhängt, gilt k + l = k ′ + l ′ . Daher

reicht es, l = l ′ zu zeigen.

Angenommen, es gibt

0 ≠ v ∈ V + ∩ (V ′ − ⊕ V 0 ).

Dann gilt 〈v, v〉 > 0 und v = v ′ − + v 0 mit v ′ − ≠ 0. Dann folgt aber

〈v, v〉 = 〈v ′ −, v ′ −〉 + 〈v 0 , v 0 〉 = 〈v ′ −, v ′ −〉 < 0,

ein Widerspruch. Also gilt V + ∩ (V ′ − ⊕ V 0 ) = {0} und aus Satz 1.2 folgt

k + l ′ + dim V 0 ≤ dim V, also k + l ′ ≤ k + l, d.h. l ′ ≤ l.

Durch Vertauschen der Rollen von l und l ′ folgt l ≤ l ′ , also l = l ′ und k = k ′ .

✷

5 Symmetrische Bilinearformen 21

Definition Die Zahl k nennt man auch den Index, die Zahl k−l die Signatur

der symmetrischen Bilinearform 〈 , 〉.

Korollar 5.2 Eine symmetrische Bilinearform ist genau dann positiv definit,

wenn alle Eigenwerte einer Darstellungsmatrix positiv sind.

Definition Eine symmetrische Matrix A ∈ Mat(n, n; R) heißt positiv definit,

in Zeichen A > 0, falls die zugehörige Form 〈 , 〉 A positiv definit ist,

d.h.

x T Ax > 0 für alle x ∈ R n , x ≠ 0.

Korollar 5.3 Eine symmetrische Matrix A ∈ Mat(n, n; R) ist genau dann

positiv definit, wenn alle Eigenwerte positiv sind.

Wir wollen zum Abschluss noch ein anderes Kriterium dafür angeben,

dass eine symmetrische Matrix A = (a ij ) positiv definit ist. Dazu bezeichnen

wir mit

⎛

⎞

a 11 · · · a 1k

⎜

A k := ⎝

.

. ..

⎟ . ⎠

a k1 · · · a kk

die linke obere k × k-Teilmatrix von A. Die Determinante det A k bezeichnet

man auch als Hauptminor von A.

Satz 5.3 (Hurwitz-Kriterium) Es sei A ∈ Mat(n, n; R) eine symmetrische

Matrix. Dann gilt:

A positiv definit ⇔ det A k > 0 für 1 ≤ k ≤ n.

Beweis. ” ⇒”: Wir zeigen zunächst

det A = det A n > 0.

Da A positiv definit ist, gibt es ein S ∈ GL(n; R) mit

⎛ ⎞

1 0

S T ⎜

AS = ⎝

. ..

⎟

⎠ .

0 1

Also folgt

1 = det(S T AS) = det A(det S) 2 , also det A > 0.

5 Symmetrische Bilinearformen 22

Um nun det A k > 0 für 1 ≤ k < n zu zeigen, betrachten wir

U k := {x ∈ R n | x k+1 = . . . = x n = 0} ⊆ R n .

Die Form 〈 , 〉 A definiert durch Einschränkung eine Form 〈 , 〉 k : U k ×U k → R

mit Darstellungsmatrix A k . Da auch 〈 , 〉 k positiv definit ist, folgt det A k > 0.

”⇐”: Wir führen Induktion über n durch. Der Induktionsanfang n = 1

ist klar. Nach Induktionsvoraussetzung ist A n−1 positiv definit. Also gibt es

ein S ′ ∈ GL(n − 1; R) mit

Es sei

Es gilt

und

(S ′ ) T A n−1 S ′ =

⎛

S := ⎜

⎝

S T AS = ⎜

⎝

⎛

⎜

⎝

1 0

. ..

0 1

S ′ 0.

0

0 · · · 0 1

⎛

⎞

⎟

⎠ = E n−1 .

⎟ ∈ GL(n; R).

⎠

⎞

1 b 1

. .. .

⎟

1 b n−1 ⎠ =: B

b 1 · · · b n−1 b n

det B = (det S) 2 det A > 0.

Es genügt zu zeigen, dass B positiv definit ist. Dazu setze

⎛

⎞

1 −b 1

. . .

T := ⎜

.

⎟ ∈ GL(n; R).

⎝ 1 −b n−1 ⎠

0 · · · 0 1

Dann ist

Nun ist

⎛

T T BT = ⎜

⎝

⎞

1 0

. .. .

⎟

1 0 ⎠

0 · · · 0 c n

=: C.

det C = (det T ) 2 det B = det B > 0

und damit c n > 0. Also ist C positiv definit und damit auch B und A.

✷

6 Das Minimalpolynom 23

6 Das Minimalpolynom

Wir kommen nun auf das schon in LA I betrachtete Problem zurück, für die

Darstellungsmatrix eines Endomorphismus f : V → V eines K-Vektorraums

eine Normalform zu finden. Dabei spielt neben dem charakteristischen Polynom

ein anderes Polynom eine Rolle, das wir nun einführen wollen. Dazu

machen wir zunächst einen Exkurs über den Polynomring.

Es sei K ein beliebiger Körper. Dann betrachten wir den Polynomring in

einer Variablen über K:

K[x] := {a 0 + a 1 x + · · · + a n x n | a i ∈ K}.

Auf K[x] ist eine Addition und eine Multiplikation erklärt. Es sei P (x), Q(x) ∈

K[x],

P (x) = a 0 + a 1 x + · · · + a n x n , Q(x) = b 0 + b 1 x + · · · + b m x m .

O. B. d. A. sei n ≤ m. Zur Definition der Addition setzen wir a n+1 = . . . a m =

0. Dann definieren wir

P (x) + Q(x) := (a 0 + b 0 ) + (a 1 + b 1 )x + · · · + (a m + b m )x m .

Die Multiplikation ist dadurch erklärt, dass man formal ausmultipliziert:

mit

P (x) · Q(x) = (a 0 + a 1 x + · · · + a n x n ) · (b 0 + b 1 x + · · · + b m x m )

:= a 0 b 0 + (a 0 b 1 + a 1 b 0 )x + · · · + a n b m x n+m

= c 0 + c 1 x + · · · + c n+m x n+m

c k :=

k∑

a i b k−i .

Statt P (x) und Q(x) schreiben wir von nun an auch P und Q.

i=0

Satz 6.1 Mit dieser Addition und Multiplikation wird K[x] zu einem kommutativen

Ring mit Einselement.

Beweis. Die Axiome sind leicht nachzuprüfen. Was ist das Einselement?

Das Nullpolynom (alle Koeffizienten a i = 0) bezeichnen wir mit 0.

✷

Definition

Der Grad eines Polynoms

P (x) = a 0 + a 1 x + · · · + a n x n mit a n ≠ 0

ist die Zahl n (n = deg P ). Den Grad des Nullpolynoms definieren wir als

deg(0) := −∞. Das Polynom P heißt normiert, falls a n = 1 ist.

6 Das Minimalpolynom 24

Satz 6.2 (Gradformel) Für P, Q ∈ K[x] gilt:

deg(P · Q) = deg P + deg Q.

Dabei soll formal n − ∞ = m − ∞ = −∞ − ∞ = −∞ gelten.

Beweis. Dies folgt aus c n+m = a n b m ≠ 0 falls a n ≠ 0 und b m ≠ 0.

✷

Satz 6.3 (Division mit Rest) Es seien P, Q ∈ K[x] mit P, Q ≠ 0. Dann

gibt es eindeutig bestimmte Polynome q, r mit

(i) P = Qq + r,

(ii) deg r < deg Q.

Beweis. Wir zeigen zunächst die Eindeutigkeit. Es seien q, q ′ , r, r ′ ∈ K[x] mit

P = Qq + r = Qq ′ + r ′ , deg r, deg r ′ < deg Q.

Dann folgt

1.Fall: q = q ′ ⇒ r = r ′ .

2.Fall: q ≠ q ′ . Dann ist

Q(q − q ′ ) = r ′ − r.

deg(r ′ − r) = deg Q + deg(q − q ′ ) ≥ deg Q

im Widerspruch zu deg(r ′ − r) ≤ max{deg r, deg r ′ } < deg Q.

Nun beweisen wir die Existenz von q und r. Wenn es ein q ∈ K[x] gibt

mit

P = Qq,

so können wir r = 0 setzen und die Behauptung ist bewiesen. Andernfalls

betrachten wir die Menge

M := {deg(P − Qp) | p ∈ K[x]} ⊆ N = {0, 1, 2, . . .}.

Diese Menge besitzt ein Minimum in N. Es sei q ∈ K[x] mit

deg(P − Qq) ≤ deg(P − Qp) für alle p ∈ K[x].

Es sei ferner

d.h.

r := P − Qq,

P = Qq + r.

6 Das Minimalpolynom 25

Es bleibt zu zeigen: deg r < deg Q. Angenommen, deg r ≥ deg Q. Es sei

Q = b 0 + b 1 x + · · · + b m x m (b m ≠ 0),

r = c 0 + c 1 x + · · · + c k x k (c k ≠ 0).

Dann ist nach Annahme k ≥ m. Es sei

Dann ist

Es ist also

p := q + c k

b m

x k−m ∈ K[x].

P − Qp = P − Qq − Q c k

b m

x k−m = r − Q c k

b m

x k−m .

Daher folgt

P − Qp = c k x k − b m

c k

b m

x k + Terme der Ordnung < k.

im Widerspruch zur Wahl von q.

deg(P − Qp) < k = deg r = deg(P − Qq).

Dies führt zu dem schon aus der Schule bekannten Verfahren zur Polynomdivision

(siehe Vorlesung und Übungen).

In Polynome können wir nun Körperelemente einsetzen. Ist

und λ ∈ K, so setzen wir

P (x) = a 0 + a 1 x + · · · + a n x n ∈ K[x]

P (λ) := a 0 + a 1 λ + · · · + a n λ n ∈ K.

Auf diese Weise definiert P (x) eine Funktion

Damit erhalten wir eine Abbildung

˜P : K −→ K

λ ↦−→ P (λ) .

✷

˜ : K[x] −→ Abb(K, K)

P ↦−→ ˜P

.

Warnung Wir müssen zwischen Polynomen P und Polynomfunktionen ˜P

unterscheiden, denn bei endlichen Körpern können Unterschiede auftreten:

Ist z.B. K = F 2 und P (x) = x 2 + x, so ist ˜P die Nullfunktion, da P (0) =

P (1) = 1 + 1 = 0. Also ist in diesem Fall die Abbildung ˜ nicht injektiv.

6 Das Minimalpolynom 26

Definition Ist 0 ≠ P ∈ K[x] und λ ∈ K, so dass P (λ) = 0 gilt, so heißt λ

eine Nullstelle von P .

Korollar 6.1 Es sei 0 ≠ P ∈ K[x] und λ eine Nullstelle von P . Dann gibt

es genau ein Polynom Q ∈ K[x] mit

Es ist deg Q = deg P − 1.

P = Q(x − λ).

Beweis. Wir dividieren P durch (x − λ) mit Rest: Nach Satz 6.3 gibt es

eindeutig bestimmte Q, r ∈ K[x] mit

P = (x − λ)Q + r, deg r < 1 = deg(x λ ).

Also ist r(x) = a 0 ∈ K. Setzen wir λ in diese Gleichung ein, so folgt

0 = P (λ) = (λ − λ)Q(λ) + a 0 = a 0 ,

also r = 0.

✷

Korollar 6.2 Es sei 0 ≠ P ∈ K[x]. Dann ist die Anzahl der Nullstellen von

P höchstens gleich dem Grad von P .

Beweis. Wir führen Induktion über den Grad n := deg P . Für n = 0 ist P

eine konstantes Polynom P (x) = a 0 ≠ 0 und das hat gar keine Nullstelle.

Damit ist die Behauptung für n = 0 bewiesen.

Nun sei deg P = n ≥ 1 und die Behauptung sei schon für alle Polynome

Q ∈ K[x] mit deg Q ≤ n − 1 bewiesen. Hat P keine Nullstelle, so ist

die Behauptung richtig. Andernfalls sei λ ∈ K eine Nullstelle von P . Nach

Korollar 6.1 gibt es dann ein Q ∈ K[x] mit

P = (x − λ)Q und deg Q = n − 1.

Alle von λ verschiedenen Nullstellen von P müssen auch Nullstellen von Q

sein. Nach Induktionsannahme hat Q höchstens n − 1 verschiedene Nullstellen,

also P höchstens n verschiedene Nullstellen.

✷

Korollar 6.3 Hat K unendlich viele Elemente, so ist die Abbildung

injektiv.

˜ : K[x] → Abb(K, K), P ↦→ ˜P ,

6 Das Minimalpolynom 27

Beweis. Es seien P 1 , P 2 ∈ K[x] mit ˜P 1 = ˜P 2 . Betrachte Q := P 1 − P 2 . Dann

ist ˜Q = 0, also hat Q unendlich viele Nullstellen. Aus Korollar 6.2 folgt damit

Q = 0, also P 1 = P 2 .

✷

Satz 6.4 Es sei K ein unendlicher Körper. Jedes Polynom 0 ≠ P ∈ K[x]

besitzt eine Darstellung

P = (x − λ 1 ) ν1 · · · (x − λ r ) νr · Q,

wobei λ 1 , . . . , λ r paarweise verschieden sind und Q ein Polynom ohne Nullstellen

ist. Diese Darstellung ist bis auf die Reihenfolge der Faktoren eindeutig.

Definition Man nennt ν i die Ordnung oder Vielfachheit der Nullstelle λ i .

Für den Beweis des Satzes brauchen wir ein Lemma.

Lemma 6.1 Es sei K ein unendlicher Körper und P, Q ∈ K[x] Polynome

mit P (λ) ≠ 0, Q(λ) ≠ 0. Gilt

für alle x ∈ K, so ist ν = µ.

(x − λ) ν P (x) = (x − λ) µ Q(x)

Beweis. O. B. d. A. sei ν ≥ µ. Dann gilt

(x − λ) ν−µ P (x) − Q(x) = 0 (für x ≠ λ).

Da K unendlich viele Elemente enthält, gilt für die Polynome

(x − λ) ν−µ P − Q = 0.

Falls ν > µ, wäre Q(λ) = 0, ein Widerspruch.

✷

Beweis von Satz 6.4. Die Existenz der Darstellung folgt aus Korollar 6.1.

Zum Beweis der Eindeutigkeit: Die λ i sind genau die Nullstellen von P ,

liegen also eindeutig fest. Die Eindeutigkeit der ν i folgt aus Lemma 6.1. Es

bleibt die Eindeutigkeit von Q zu zeigen. Dazu sei

(x − λ 1 ) ν1 · · · (x − λ r ) νr Q = (x − λ 1 ) ν1 · · · (x − λ r ) νr Q ′ .

Dann gilt für alle x ≠ λ 1 , . . . , λ r

Q(x) = Q ′ (x).

Also hat Q − Q ′ unendlich viele Nullstellen und es folgt Q = Q ′ .

✷

6 Das Minimalpolynom 28

Definition Man sagt, das Polynom 0 ≠ P ∈ K[x] zerfällt über K, falls es

eine Darstellung

gibt.

P (x) = a(x − λ 1 ) ν1 · · · (x − λ r ) νr (a ∈ K)

Beispiel 6.1 Das Polynom P (x) = 1 + x 2 zerfällt nicht über R, aber über

C:

P (x) = (x − i)(x + i).

Satz 6.5 (Fundamentalsatz der Algebra) Jedes nicht konstante Polynom

P ∈ C[x] besitzt eine Nullstelle.

Diesen Satz hat erstmals C. F. Gauß 1799 bewiesen. Heutzutage wird er

meist in der Vorlesung Funktionentheorie bewiesen, da man mit Methoden

dieser Vorlesung einen sehr knappen und eleganten Beweis geben kann.

Korollar 6.4 Jedes Polynom P ∈ C[x] zerfällt.

Definition

Eine Teilmenge I eines Ringes R heißt ein Ideal, falls gilt:

(I1) I ⊆ R ist eine Untergruppe bezüglich der Addition.

(I2) Ist r ∈ R und s ∈ I, so ist auch r · s ∈ I.

Beispiel 6.2 I := 〈P 1 , . . . , P n 〉 := {Q 1 P 1 + · · · + Q n P n | Q i ∈ R}.

Definition

I = 〈P 1 , . . . , P n 〉 heißt das von P 1 , . . . , P n erzeugte Ideal.

Definition Ein Ideal I heißt Hauptideal, falls es von einem Element erzeugt,

wird, d.h. I = 〈P 〉 = {QP | Q ∈ R} für ein P ∈ R.

Lemma 6.2 Es seien R, R ′ Ringe und f : R → R ′ ein Ringhomomorphismus.

Dann ist der Kern von f ein Ideal in R.

Beweis. Nach I, Satz 8.4, ist Ker f eine Untergruppe von R. Es sei r ∈ R

und s ∈ Ker f. Dann gilt

f(r · s) = f(r) · f(s) = f(r) · 0 = 0,

also r · s ∈ Ker f.

✷

Satz 6.6 (i) K[x] ist ein Hauptidealring, d.h. jedes Ideal von K[x] ist ein

Hauptideal.

6 Das Minimalpolynom 29

(ii) Zu jedem Ideal I ≠ {0} in K[x] gibt es genau ein normiertes Polynom

P mit I = 〈P 〉.

Beweis. (i): Im Fall I = {0} ist I = 〈0〉. Es sei also I ≠ {0}. Dann hat die

Menge

M := {deg P | 0 ≠ P ∈ I} ⊆ N

ein Minimum m := min M. Es sei P ∈ I mit deg P = m.

Behauptung I = 〈P 〉 = K[x] · P .

Beweis. Es gilt 〈P 〉 ⊆ I nach Definition eines Ideals.

Es bleibt zu zeigen: I ⊆ 〈P 〉. Dazu sei Q ∈ I beliebig. Nach Satz 6.3 gibt

es eine Darstellung

Q = qP + r, deg r < deg P.

Ist r = 0, so ist Q ∈ 〈P 〉. Andernfalls folgt mit (I1) und (I2)

r = Q − qP ∈ I.

Wegen 0 ≤ deg r < deg P = m ist dies ein Widerspruch zur Wahl von P . ✷

(ii): Mit P liegt auch aP in I für a ∈ K. Also kann man P als normiert

annehmen. Es sei

Dann gilt

Es folgt

I = 〈P 〉 = 〈P ′ 〉 mit P, P ′ normiert.

P ′ = Q ′ P, P = QP ′ für geeignete Q, Q ′ ∈ K[x].

Nach der Gradformel folgt daraus

P = QQ ′ P ⇔ P (1 − QQ ′ ) = 0.

deg QQ ′ = 0, also QQ ′ = 1,

und damit sind Q und Q ′ ebenfalls nach der Gradformel konstant. Da P, P ′

normiert sind, folgt Q = Q ′ = 1, also P = P ′ .

✷

Nun wollen wir die Theorie auf Matrizen anwenden. Die Menge Mat(n, n; K)

ist ein Vektorraum der Dimension n 2 und obendrein ein Ring mit der Matrizenaddition

und Matrizenmultiplikation. Wie üblich setzen wir für A ∈

Mat(n, n; K):

A n = A · · · A (n-mal), A 0 = E.

6 Das Minimalpolynom 30

Wir setzen nun Matrizen in Polynome ein, d.h. wir betrachten die Einsetzungsabbildung

ϕ A : K[x] −→ Mat(n, n; K)

P (x) = ∑ n

i=0 a ix i ↦−→ P (A) := ∑ n

i=0 a iA i .

Die Abbildung ϕ A ist linear, also ein Homomorphismus von K-Vektorräumen

und sogar ein Ringhomomorphismus:

(P + Q)(A) = P (A) + Q(A),

(λP )(A) = λP (A),

(P · Q)(A) = P (A)Q(A).

Das Bild von ϕ A ist der Untervektorraum

K[A] := Span{E, A, A 2 , . . .}

von Mat(n, n; K). Wir betrachten nun die Menge

I A := {P ∈ K[x] | P (A) = 0} = Ker ϕ A .

Aus Lemma 6.2 folgt, dass I A ein Ideal in K[x] ist. Da K[x] ein Hauptidealring

ist, gibt es (falls I A ≠ {0}) genau ein normiertes Polynom µ A ∈ K[x]

mit

I A = 〈µ A 〉.

Satz 6.7 Es gibt genau ein normiertes Polynom 0 ≠ µ A ∈ K[x] mit folgenden

Eigenschaften:

(i) µ A (A) = 0.

(ii) Ist P ∈ K[x] ein Polynom mit P (A) = 0, so ist P = Q · µ A .

(iii) Unter allen normierten Polynomen P ∈ K[x] mit P (A) = 0 hat µ A

minimalen Grad.

Definition Das Polynom µ A ∈ K[x] heißt das Minimalpolynom von A.

Beweis. Wir zeigen zunächst I A ≠ {0}. Es ist K[A] ⊆ Mat(n, n; K), also gilt

dim K[A] ≤ n 2 =: N.

Daher sind die Matrizen

E, A, A 2 , . . . , A N

6 Das Minimalpolynom 31

linear abhängig, d.h. es gibt a 0 , a 1 , . . . , a N ∈ K, nicht alle gleich 0, mit

a 0 E + a 1 A + · · · + a N A N = 0.

Also ist

0 ≠ P (x) := a 0 + a 1 x + · · · + a N x N ∈ I A .

Nach Satz 6.6 ist dann

I A = 〈µ A 〉

für ein eindeutig bestimmtes normiertes Polynom µ A ≠ 0.

✷

Beispiel 6.3 Es sei

⎛

A = ⎜

⎝

Man rechnet leicht aus:

⎛

A 2 =

⎜

⎝

0 1 0

. .. . ..

0 1

0 0

⎞

0 0 1 0

. .. . .. . ..

0 0 1

0 0

⎟ ∈ Mat(n, n; K).

⎠

⎞

, . . . , A n = 0.

⎟

⎠

Daraus folgt

Satz 6.8 Es gilt

µ A (x) = x n .

deg µ A = dim K[A].

Beweis. Es sei m := dim K[A]. Dann sind

E, A, A 2 , . . . , A m

linear abhängig. Wie im Beweis von Satz 6.7 zeigt man, dass es ein (normiertes)

Polynom P ∈ K[x] gibt mit deg P ≤ m und P (A) = 0. Also ist

deg µ A ≤ m = dim K[A].

Es sei umgekehrt m ′ = deg µ A . Zum Beweis von dim K[A] ≤ m ′ betrachten

wir

U := Span{E, A, . . . , A m′ −1 }.

6 Das Minimalpolynom 32

Dann sind E, A, . . . , A m′ −1 linear unabhängig, denn andernfalls wäre m ′ =

deg µ A nicht minimal. Also ist dim U = m ′ . Es genügt zu zeigen:

Dazu ist zu zeigen, dass

Es sei

Da µ A (A) = 0 folgt

K[A] ⊆ U.

A s ∈ V für s ≥ m ′ .

µ A (x) = a 0 + a 1 x + · · · + a m ′ −1x m′ −1 + x m′ .

A m′ = −a 0 E − · · · − a m ′ −1A m′ −1 ∈ U.

Durch Multiplikation mit A auf beiden Seiten folgt dann aber auch

A m′ +1 = −a 0 A − · · · − a m ′ −1A m′ ∈ U.

Die Behauptung folgt dann durch Induktion.

✷

Korollar 6.5 Ist m = deg µ A , so ist {E, A, . . . , A m−1 } eine Basis von K[A].

Korollar 6.6 Eine Matrix A ∈ Mat(n, n; K) ist genau dann invertierbar,

wenn µ A (0) ≠ 0 gilt. In diesem Fall liegt A −1 ∈ K[A].

Beweis. Es sei

µ A (x) = a 0 + a 1 x + · · · + a m−1 x m−1 + x m

das Minimalpolynom von A. Dann gilt

Setzen wir

so folgt

a 1 A + · · · + a m−1 A m−1 + A m = −a 0 E.

B := a 1 E + · · · + a m−1 A m−2 + A m−1 ,

AB = −a 0 E.

Nach Korollar 6.5 ist B ≠ 0. Ist A nicht invertierbar, so gilt det A = 0, also

µ A (0) = a 0 = 0. Ist A invertierbar, so ist B = −a 0 A −1 und µ A (0) = a 0 ≠ 0.

✷

Lemma 6.3 (Invarianz) Sind die Matrizen A, B ∈ Mat(n, n; K) ähnlich,

dann stimmen die Minimalpolynome µ A und µ B überein.

6 Das Minimalpolynom 33

Beweis. Es sei P ∈ K[x] und B = S −1 AS. Dann gilt

P (S −1 AS) = a 0 E + a 1 S −1 AS + · · · + a m (S −1 AS) m

= a 0 S −1 ES + a 1 S −1 AS + · · · + a m S −1 A m S

= S −1 P (A)S.

Daraus folgt

Damit können wir definieren:

P (A) = 0 ⇔ P (B) = P (S −1 AS) = 0.

✷

Definition Es sei V ein endlich dimensionaler K-Vektorraum und f : V →

V ein Endomorphismus. Dann ist das Minimalpolynom µ f von f das Minimalpolynom

einer Darstellungsmatrix von f.

Nun zeigen wir, dass auch das charakteristische Polynom einer Matrix A

in I A liegt.

Satz 6.9 (Satz von Cayley-Hamilton) Es sei P A

Polynom einer Matrix A ∈ Mat(n, n; K). Dann gilt

das charakteristische

P A (A) = 0.

Daraus folgt unmittelbar:

Korollar 6.7 Das Minimalpolynom µ A teilt das charakteristische Polynom

P A einer Matrix A ∈ Mat(n, n; K).

Beweis von Satz 6.9. Wir wenden einen Trick an. Wir setzen

Dann gilt

B(x) := (A − xE) T ∈ Mat(n, n; K[x]).

det B(x) = P A (x) ∈ K[x].

Nun ersetzen wir die Unbestimmte x durch die Matrix A und jeden Eintrag

a ij durch die Matrix a ij E. Das ergibt

⎛

⎞

a 11 E − A a 21 E · · · a n1 E

a 12 E a 22 E − A · · · a n2 E

B(A) = ⎜

⎝

.

. . .

⎟ ∈ Mat(n, n; K[A]).

. . ⎠

a 1n E a 2n E · · · a nn E − A

7 Diagonalisierbarkeit 34

Diese Matrix kann mit einem Spaltenvektor des K n2 multipliziert werden,

d.h. einem Spaltenvektor, dessen Einträge wiederum Spaltenvektoren des K n

sind. Insbesondere gilt

⎛ ⎞ ⎛

⎞ ⎛ ⎞

e 1 a 11 e 1 − Ae 1 + a 21 e 2 + · · · + a n1 e n

⎜ ⎟ ⎜

⎟ ⎜ ⎟

B(A) ⎝ . ⎠ = ⎝

.

⎠ = ⎝

0. ⎠ .

e n a 1n e 1 + a 2n e 2 + · · · + a nn e n − Ae n 0

Nun sei B ∗ (x) ∈ Mat(n, n; K[x]) die zu B(x) adjungierte Matrix, die wir in

LA I definiert haben. Ihre Einträge sind entsprechend der Definition Polynome

vom Grad ≤ n − 1, und es gilt

B ∗ (x)B(x) = (det B(x))E = P A (x)E.

Setzen wir nun A für x ein, so folgt

⎛ ⎞

⎛

⎜ ⎟

⎝

0. ⎠ = B ∗ ⎜

(A)B(A) ⎝

0

⎞ ⎛ ⎞

e 1 P A (A)e 1

⎟ ⎜ ⎟

. ⎠ = ⎝ . ⎠ .

e n P A (A)e n

Also ist P A (A) = 0.

✷

7 Diagonalisierbarkeit

Nun kommen wir zurück auf das Problem, für die Darstellungsmatrix eines

Endomorphismus eines endlich dimensionalen K-Vektorraums eine Normalform

zu finden. Zunächst betrachten wir noch einmal die Diagonalisierbarkeit.

Es sei V ein K-Vektorraum der Dimension n und f : V → V ein Endomorphismus.

Definition Es sei λ ein Eigenwert von f.

(i) Die algebraische Vielfachheit von λ, in Zeichen ν alg (f, λ), ist die Vielfachheit

von λ als Nullstelle des charakteristischen Polynoms.

(ii) Die geometrische Vielfachheit von λ, in Zeichen ν geom (f, λ), ist die Dimension

des Eigenraums Eig(f, λ).

Lemma 7.1 Ist λ Eigenwert von f, so gilt

1 ≤ ν geom (f, λ) ≤ ν alg (f, λ).

7 Diagonalisierbarkeit 35

Beweis. Es sei (v 1 , . . . , v s ) eine Basis von Eig(f, λ). Da λ Eigenwert von f

ist, gilt s ≥ 1. Wir ergänzen diese Basis zu einer Basis

B = (v 1 , . . . , v s , v s+1 , . . . , v n )

von V . Dann ist

⎛

A := MB B (f) =

⎜

⎝

⎞

λ 0

. ..

∗

0 λ

.

⎟

0 A ′ ⎠

Daraus folgt

und damit

P f (x) = (x − λ) s P A ′(x)

ν geom (f, λ) = dim Eig(f, λ) = s ≤ ν alg (f, λ).

✷

Theorem 7.1 Es sei V ein n-dimensionaler K-Vektorraum und f : V → V

ein Endomorphismus von V . Dann sind die folgenden Bedingungen äquivalent:

(i) f ist diagonalisierbar.

(ii) Das charakteristische Polynom zerfällt in Linearfaktoren und es gilt

ν geom (f, λ) = ν alg (f, λ) für alle Eigenwerte λ von f.

(iii) Sind λ 1 , . . . , λ k die paarweise verschiedenen Eigenwerte von f, so ist

V = Eig(f, λ 1 ) ⊕ · · · ⊕ Eig(f, λ k ).

Beweis. (i) ⇒ (ii): Es sei f diagonalisierbar und λ 1 , . . . , λ k die paarweise

verschiedenen Eigenwerte von f. Zu λ i (i = 1, . . . , k) betrachten wir eine

Basis

(v (i)

1 , . . . , v s (i)

i

) von Eig(f, λ i ).

Setzen wir r i := ν alg (f, λ i ), so gilt

s 1 + · · · + s k = n, r 1 + · · · + r n = n und s i ≤ r i .

Daraus folgt aber s i = r i für alle i = 1, . . . , k.

7 Diagonalisierbarkeit 36

(ii) ⇒ (iii): Es sei

W := Eig(f, λ 1 ) + · · · + Eig(f, λ k ).

Nach I, Satz 19.3, und der Bedingung (iii) in Satz 1.5 folgt

W = Eig(f, λ 1 ) ⊕ · · · ⊕ Eig(f, λ k ).

Aus (ii) und Satz 1.6 (iii) folgt dann W = V .

(iii) ⇒ (i): Für jedes i = 1, . . . , k sei

Nach Satz 1.6 (ii) ist dann

(v (i)

1 , . . . , v (i)

s i

) eine Basis von Eig(f, λ i ).

B := (v (1)

1 , . . . , v (1)

s 1

, . . . , v (k)

1 , . . . , v (k)

s k

)

eine Basis von V . Da sie nach Definition aus Eigenvektoren von f besteht,

ist f diagonalisierbar.

✷

Als Anwendung von Theorem 7.1 betrachten wir das Problem, zwei Endomorphismen

mit einer gemeinsamen Basis zu diagonalisieren (simultane

Diagonalisierung).

Bemerkung 7.1 Angenommen, die Matrizen A, B ∈ Mat(n, n; K) lassen

sich simultan diagonalisieren. Das bedeutet, dass es eine Matrix S ∈ GL(n; K)

gibt mit

SAS −1 = D und SBS −1 = ˜D,

wobei D und ˜D Diagonalmatrizen sind. Dann gilt

BA = S −1 ˜DSS −1 DS = S −1 ˜DDS = S −1 D ˜DS = S −1 DSS −1 ˜DS = AB.

Das bedeutet, dass A und B kommutieren müssen.

Satz 7.1 Sind f, g diagonalisierbare Endomorphismen von V und gilt f ◦g =

g ◦ f, so sind f und g simultan diagonalisierbar.

Beweis. Nach Theorem 7.1 gilt

V = Eig(f, λ 1 ) ⊕ · · · ⊕ Eig(f, λ k )

= Eig(g, µ 1 ) ⊕ · · · ⊕ Eig(g, µ l ),

wobei λ 1 , . . . , λ k bzw. µ 1 , . . . , µ l die verschiedenen Eigenwerte von f bzw. g

sind. Es sei λ einer der Eigenwerte von f und

W := Eig(f, λ).

8 Nilpotente Endomorphismen 37

Es sei w ∈ W . Dann gilt

f(g(w)) = g(f(w)) = g(λw) = λg(w).

Also ist auch g(w) ein Eigenvektor von f zum Eigenwert λ, also liegt auch

g(w) in W . Damit gilt g(W ) ⊆ W . Setze

W j := W ∩ Eig(g, µ j ) für j = 1, . . . , l.

Behauptung W = W 1 ⊕ · · · ⊕ W l .

Beweis. Wegen I, Satz 19.3, und der Bedingung (iii) in Satz 1.5 reicht es zu

zeigen:

W = W 1 + · · · + W l .

Es sei w ∈ W . Dann gibt es w j ∈ Eig(g, µ j ) , so dass w = w 1 + · · · + w l .

Dann gilt

f(w) = f(w 1 ) + · · · + f(w l ) = λw 1 + · · · + λw l = λw.

Da f(w j ) ∈ Eig(g, µ j ) und λw j ∈ Eig(g, µ j ) und die Darstellung von w in

eindeutig ist, folgt

also w j ∈ W und somit w j ∈ W j .

Eig(g, µ 1 ) ⊕ · · · ⊕ Eig(g, µ l )

f(w j ) = λw j ,

Da die Behauptung für alle Eigenwerte λ von f gilt, folgt die Aussage des

Satzes.

✷

8 Nilpotente Endomorphismen

Wie wir in Theorem 7.1 gesehen haben, gibt es zwei Bedingungen für die

Diagonalisierbarkeit:

(a) Das charakteristische Polynom muss in Linearfaktoren zerfallen, und

(b) die geometrische Vielfachheit muss gleich der algebraischen Vielfachheit

der Eigenwerte sein.

Wir untersuchen nun, welche Aussage man noch treffen kann, wenn nur die

Bedingung (a) erfüllt ist.

✷

8 Nilpotente Endomorphismen 38

Definition Eine Matrix A = (a ij ) ∈ Mat(n, n; K) heißt obere Dreiecksmatrix,

wenn a ij = 0 für i > j gilt.

Satz 8.1 Für einen Endomorphismus f eines n-dimensionalen Vektorraums

sind die folgenden Bedingungen äquivalent:

(i) Es gibt eine Basis B, so dass MB B (f) eine obere Dreiecksmatrix ist.

(ii) Das charakteristische Polynom P f zerfällt in Linearfaktoren, d.h.

P f (x) = ±(x − λ 1 ) · · · (x − λ n ) mit λ 1 , . . . , λ n ∈ K.

Beweis. (i) ⇒ (ii): Dies folgt aus I, Satz 18.1.

(ii) ⇒ (i): Wir führen den Beweis durch Induktion über n. Für n = 0, 1 ist

die Behauptung klar. Es sei n ≥ 2 und v 1 ein Eigenvektor zu dem Eigenwert

λ 1 . Wir ergänzen ihn zu einer Basis

von V . Dann gilt

und

B = (v 1 , w 2 , . . . , w n )

V = U 1 ⊕ W mit U 1 := Span{v 1 } und W := Span{w 2 , . . . , w n }

⎛

MB B (f) = ⎜

⎝

⎞

λ 1 a 12 · · · a 1n

a 22 · · · a 2n

0. .

..

⎟ . . ⎠ .

0 a n2 · · · a nn

Wir definieren nun lineare Abbildungen h : W → U 1 und g : W → W durch

für j = 2, . . . , n. Dann gilt

h(w j ) = a 1j v 1 und g(w j ) = a 2j w 2 + · · · + a nj w n

f(w) = h(w) + g(w) für alle w ∈ W.

Für die charakteristischen Polynome gilt

P f (x) = (x − λ 1 )P g (x), also P g (x) = ±(x − λ 2 ) · · · (x − λ n ).

Deswegen können wir die Induktionsvoraussetzung auf g : W → W anwenden.

Demnach gibt es eine Basis (v 2 , . . . , v n ) von W , bezüglich der g durch

eine obere Dreiecksmatrix dargestellt wird. Für f gilt dann

f(v j ) = h(v j ) + g(v j ) ∈ Span{v 1 , . . . , v j } für j = 2, . . . , n.

Also ist auch die Darstellungsmatrix von f bezüglich der Basis B = (v 1 , . . . , v n )

eine obere Dreiecksmatrix.

✷

Wir betrachten nun eine Anwendung dieses Satzes.

8 Nilpotente Endomorphismen 39

Definition (i) Ein Endomorphismus f : V → V heißt nilpotent, wenn

f k = 0 für ein k ≥ 1 ist.

(ii) Eine Matrix A ∈ Mat(n, n; K) heißt nilpotent, wenn A k = 0 für ein

k ≥ 1 ist.

Lemma 8.1 Es sei A nilpotent.

(i) Ist B ähnlich zu A, dann ist auch B nilpotent.

(ii) 0 ist der einzige Eigenwert von A.

Beweis.

(i): Es sei B = S −1 AS und A k = 0. Dann gilt

B k = (S −1 AS)(S −1 AS) · · · (S −1 AS) = S −1 A k S = 0.

(ii): Es sei A k = 0. Aus det A k = 0 folgt det A = 0. Deshalb ist 0 ein

Eigenwert von A. Dies ist auch der einzige Eigenwert: Ist λ ∈ K ein Eigenwert

von A mit Eigenvektor x ≠ 0, dann gilt

A k x = λ k x = 0

und daraus folgt λ = 0.

✷

Satz 8.2 Für einen Endomorphismus f eines n-dimensionalen Vektorraums

V sind die folgenden Bedingungen äquivalent:

(i) f ist nilpotent.

(ii) Es sei B eine Basis von V . Dann ist die Darstellungsmatrix M B B (f)

von f bezüglich der Basis B nilpotent.

(iii) Es gilt P f (x) = ±x n .

(iv) Es gilt f d = 0 für ein d mit 1 ≤ d ≤ n.

(v) Es gibt eine Basis B von V , so dass

⎛

M B B (f) =

⎜

⎝

0 ∗

. ..

0 0

⎞

⎟

⎠ .

8 Nilpotente Endomorphismen 40

Beweis. (i) ⇔ (ii) ist klar.

(ii) ⇒ (iii): Es sei A := MB B (f). Nach Lemma 8.1 (ii) ist 0 der einzige

Eigenwert von A. Deswegen hat das charakteristische Polynom die Gestalt

P f (x) = ±x n .

(iii) ⇒ (iv): Aus dem Satz von Cayley-Hamilton folgt µ f (x) = x d für ein

d mit 1 ≤ d ≤ n. Das bedeutet f d = 0.

(iv) ⇒ (i) ist klar.

(iii) ⇒ (v) folgt aus Satz 8.1.

(v) ⇒ (ii): Es sei A = MB B(f) = (a ij) mit a ij = 0 für i ≥ j.

Behauptung

A r = (a (r)

ij ) mit a(r) ij = 0 für i ≥ j + 1 − r.

Beweis. Wir führen Induktion nach r durch.

Induktionsanfang r = 1: Dies gilt nach Voraussetzung.

Induktionsschritt r − 1 → r: Es gilt

a (r)

ij =

n∑

l=1

a il a (r−1)

lj

.

Es sei nun i ≥ j + 1 − r und 1 ≤ l ≤ n. Wir unterscheiden zwei Fälle:

Fall 1: j + 1 − r ≥ l. Dann ist i ≥ l, also a il = 0 nach Voraussetzung.

Fall 2: l > j +1−r. Dann ist l ≥ j +1−(r −1). Dann gilt aber a (r−1)

lj

= 0

nach Induktionsvorausetzung.

Also gilt

a (r)

ij = 0.

Aus der Behauptung folgt A n = 0. Ist A ′ die Darstellungsmatrix von f

bezüglich einer anderen Basis, so ist A ′ ähnlich zu A. Die Behauptung folgt

damit aus Lemma 8.1 (i).

✷

Wir wollen nun zeigen, dass wir die Matrix in Satz 8.2 (v) noch auf eine

einfachere Gestalt bringen können.

✷

Definition

Die Matrix

⎛

J k = ⎜

⎝

0 1 0

. . .

0 1

0 0

⎞

⎟ ∈ Mat(k, k; K)

⎠

heißt Jordanmatrix von der Ordnung k.

8 Nilpotente Endomorphismen 41

Nach Beispiel 6.3 ist J k nilpotent, genauer gilt Jk k

Potenz mit dieser Eigenschaft. Wie sieht J 1 aus?

= 0 und k ist die minimale

Theorem 8.1 (Jordannormalform nilpotenter Endomorphismen) Es

sei f ein nilpotenter Endomorphismus eines K-Vektorraums V und d :=

min{l | f l = 0} (d heißt auch der Nilpotenzindex von f). Dann gibt es eindeutig

bestimmte Zahlen s 1 , . . . , s d ∈ N mit

d · s d + (d − 1)s d−1 + · · · + s 1 = n = dim V

und eine Basis B von V , so dass

⎛

⎞

J d .. . J d J d−1 0

.

MB B .. (f) =

J d−1

. 0

.. J 1 ⎜

.

⎝

.. ⎟

⎠

J 1

Beweis. Wir definieren U l := Ker f l und betrachten die Kette von Unterräumen

{0} = U 0 ⊆ U 1 ⊆ . . . ⊆ U d−1 ⊆ U d = V.

Dabei gilt U d = V nach Definition von d, und da d die minimale Potenz mit

f d = 0 ist, sind alle Inklusionen echt.

Behauptung

(1) Für 1 ≤ l ≤ d ist f −1 (U l−1 ) = U l , insbesondere f(U l ) = U l−1 .

(2) Ist W ein Unterraum von V mit W ∩ U l = {0} für ein 1 ≤ l ≤ d, so

ist f| W injektiv.

Beweis.

(1): Es gilt

v ∈ f −1 (U l−1 ) ⇔ f(v) ∈ U l−1 ⇔ 0 = f l−1 (f(v)) = f l (v) ⇔ v ∈ U l .

8 Nilpotente Endomorphismen 42

(2) Es gilt Ker f = U 1 ⊆ U l für jedes 1 ≤ l ≤ d, also W ∩ Ker f = {0}. ✷

Nun konstruieren wir schrittweise eine direkte Summenzerlegung von V .

Zunächst wählen wir ein Komplement W d ⊆ V von U d−1 in V = U d :

Aus Behauptung (1) folgt dann

(a) f(W d ) ⊆ U d−1 und

(b) f(W d ) ∩ U d−2 = {0}.

V = U d = U d−1 ⊕ W d .

Denn aus W d ⊆ U d und f(U d ) = U d−1 folgt (a). Aus f −1 (U d−2 ) = U d−1 und

W d ∩ U d−1 = {0} folgt (b). Also gibt es eine Zerlegung

U d−1 = U d−2 ⊕ W d−1 mit f(W d ) ⊆ W d−1 .

Fahren wir so fort, so erhalten wir folgendes Schema:

U d

↓

U d−1 ⊕ W d

↓ ↓

U d−2 ⊕ W d−1 ⊕ W d

↓ ↓ ↓

. . .

↓ ↓ ↓

U 1 ⊕ W 2 ⊕ W 3 ⊕ · · · ⊕ W d

↓ ↓ ↓ ↓

U 0 ⊕ W 1 ⊕ W 2 ⊕ · · · ⊕ W d−1 ⊕ W d

Dabei zeigen die Pfeile an, wie f die entsprechenden Unterräume abbildet.

Jede Zeile ist eine Zerlegung von V , wegen U 0 = {0} ist insbesondere

Da die Abbildungen

V = W 1 ⊕ W 2 ⊕ · · · ⊕ W d .

f| Wd f| Wd−1 f| W2

W d −→ Wd−1 −→ . . . −→ W1

nach Behauptung (2) alle injektiv sind, können wir mit einer Basis von W d

anfangen, das Bild dieser Basis unter f| Wd zu einer Basis von W d−1 ergänzen,

9 Die Jordansche Normalform 43

usw., bis wir zu einer Basis von V gelangen:

w (d)

1 , f(w (d)

1 ), . . . , f d−1 (w (d)

1 ),

.

w s (d)

d

,

.

f(w s (d)

d

), . . . , f d−1 (w s (d)

d

),

w (d−1)

1 , . . . , f d−2 (w (d−1)

1 ),

.

w s (d−1)

d−1

, . . . , f d−2 (w s (d−1)

d−1

),

.

w (1)

1 ,

.

w (1)

s 1 .

Dabei ist die erste Spalte eine Basis von W d , die zweite Spalte eine Basis

von W d−1 , und schließlich die letzte Spalte eine Basis von W 1 = U 1 = Ker f.

Ordnen wir die Basis nun so an, dass wir die Zeilen von oben nach unten

lesen, aber in jeder Zeile umgekehrt, also von rechts nach links, laufen, so

erhalten wir eine Basis von V , bezüglich der die Darstellungsmatrix von f

die angebene Gestalt hat.

Wir müssen nun noch zeigen, dass die Zahlen s 1 , . . . , s d eindeutig bestimmt

sind. Dazu sei ˜W l ein Komplement von f(W l+1 ) in W l , l = 1, . . . , d

(hier setzen wir W d+1 = {0}). Dann gilt wegen

U l = U l−1 ⊕ f(W l+1 ) ⊕ ˜W l

und da f| Wl+1

injektiv ist

s l = dim ˜W l = dim U l − dim U l−1 − dim W l+1 .

Damit sind diese Zahlen rekursiv aus den Dimensionen der Kerne von f l

berechenbar.

✷

9 Die Jordansche Normalform

Es sei K ein beliebiger Körper, V ein endlich dimensionaler K-Vektorraum

mit dim V ≥ 1 und f : V → V ein Endomorphismus mit zerfallendem

charakteristischen Polynom

P f (x) = ±(x − λ 1 ) r1 · · · (x − λ k ) r k

,

λ 1 , . . . , λ k ∈ K paarweise verschieden.

9 Die Jordansche Normalform 44

Wir haben bereits gesehen, dass dann f durch eine obere Dreiecksmatrix

dargestellt werden kann. Dieses Ergebnis soll nun noch präzisiert werden.

Im Allgemeinen gilt

dim Eig(f, λ i ) = ν geom (f, λ i ) ≤ r i .

Gilt hier nicht die Gleichheit, so betrachtet man anstelle des Eigenraums

einen größeren Unterraum.

Definition

Für einen Eigenwert λ der Vielfachheit r ≥ 1 nennt man

Hau(f, λ) := Ker(f − λid) r

den Hauptraum (oder verallgemeinerten Eigenraum) von f zum Eigenwert λ.

Satz 9.1 (Hauptraumzerlegung) Es sei f ein Endomorphismus von V

und

P f (x) = ±(x − λ 1 ) r1 · · · (x − λ k ) r k

mit paarweise verschiedenen λ 1 , . . . , λ k ∈ K. Es sei

V i := Hau(f, λ i ) ⊆ V

der Hauptraum zum Eigenwert λ i . Dann gilt:

(1) dim V i = r i und f(V i ) ⊆ V i für i = 1, . . . , k.

(2) V = V 1 ⊕ · · · ⊕ V k .

(3) f hat eine Zerlegung f = f D + f N mit

(a) f D ist diagonalisierbar.

(b) f N ist nilpotent.

Durch Kombination dieses Satzes mit der Klassifikation nilpotenter Endomorphismen

(Theorem 8.1) erhält man das Hauptresultat dieses Abschnitts.

Theorem 9.1 (Jordansche Normalform) Es sei f ein Endomorphismus

von V und

P f (x) = ±(x − λ 1 ) r1 · · · (x − λ k ) r k

9 Die Jordansche Normalform 45

mit paarweise verschiedenen λ 1 , . . . , λ k ∈ K. Dann gibt es eine Basis B von

V , so dass

⎛

⎞

λ 1 E r1 + N 1 0

MB B (f) =

. ..

,

⎜

⎟

⎝ 0 λ k E rk + N k ⎠

wobei N i für i = 1, . . . , k in der Normalform von Theorem 8.1 ist. Ausgeschrieben

bedeutet das:

⎛

λ i 1

. .. . ..

.

0

. . 1

λ i .. . λ i E ri +N i =

λ i 1

.

.. .

. .. 1 λ i λ i ⎜

⎝

. ⎟ .. ⎠

0 λ i

⎞

Die Eigenwerte λ 1 , . . . , λ k , die Zahlen r 1 , . . . , r k sowie die Zahlen s (i)

j

d i s (i)

d i

+ (d i − 1)s (i)

d i −1 + · · · + s(i) 1 = r i , i = 1, . . . k

nach Theorem 8.1 sind durch f eindeutig bestimmt. Man nennt sie Invarianten

von f.

Beweis von Theorem 9.1. Setze für i = 1, . . . , k

V i := Hau(f, λ i ) und g i := (f − λ i id)| Vi .

Anwendung von Theorem 8.1 auf g i ergibt eine Basis B i von V i . Nach Satz 9.1

setzen sich die Basen B 1 , . . . , B k zu einer Basis B mit der gewünschten Eigenschaft

zusammen.

✷

mit

9 Die Jordansche Normalform 46

Korollar 9.1 Für einen Endomorphismus f von V sind die folgenden Bedingungen

äquivalent:

(i) f ist diagonalisierbar.

(ii) µ f (x) = (x − λ 1 ) · · · (x − λ k ), wobei λ 1 , . . . , λ k die verschiedenen Eigenwerte

von f sind.

Beweis. Es sei wie oben

d i := min{l i | g l i

i = 0}.

Dann gilt für das Minimalpolynom von g i

µ gi (x) = x d i

.

Die Abbildung g i ist aber genau dann diagonalisierbar, wenn d i = 1.

✷

Nun wollen wir den Satz über die Hauptraumzerlegung beweisen. Dazu

betrachten wir für einen Eigenwert λ von f die Abbildung

g := f − λid.

Die folgenden Überlegungen gelten für einen beliebigen Endomorphismus g

und seine Potenzen. Man hat zwei Ketten von Unterräumen:

{0} ⊆ Ker g ⊆ Ker g 2 ⊆ . . . ⊆ Ker g l ⊆ . . .

V ⊇ Im g ⊇ Im g 2 ⊇ . . . ⊇ Im g l ⊇ . . .

Da V endlich dimensional ist, müssen die beiden Ketten stationär werden,

d.h. irgendwann sind die Inklusionen nicht mehr echt. Genauer bedeutet das,

dass es d und d ′ geben muss mit

{0} ⊆ Ker g ⊆ Ker g 2 ⊆ . . . ⊆ Ker g d = Ker g d+1 = . . .

V ⊇ Im g ⊇ Im g 2 ⊇ . . . ⊇ Im g d′ = Im g d′ +1

= . . .

Genauer gilt Folgendes:

Lemma 9.1 (Fitting) Zu einem Endomorphismus g von V betrachten wir

die Zahlen

Dann gilt:

d := min{l | Ker g l = Ker g l+1 },

d ′ := min{l | Im g l = Im g l+1 },

r := ν alg (g, 0).

9 Die Jordansche Normalform 47

(i) d = d ′ .

(ii) Ker g d+i = Ker g d , Im g d+i = Im g d für alle i ∈ N.

(iii) Die Räume U := Ker g d und W := Im g d sind unter g invariant.

(iv) (g| U ) d = 0 und g| W ist ein Isomorphismus.

(v) Für das Minimalpolynom von g| U gilt µ g|U (x) = x d .

(vi) V = U ⊕ W , dim U = r ≥ d, dim W = n − r.

Beweis. Wir betrachten das Diagramm

Nach der Dimensionsformel gilt

Daraus folgt

Ker g l ⊆ V −→ Im g l

|∩ ‖ ∪|

Ker g l+1 ⊆ V −→ gl+1

Im g l+1

dim V = dim Ker g l + dim Im g l = dim Ker g l+1 + dim Im g l+1 .

Im g l+1 = Im g l ⇔ dim Im g l+1 = dim Im g l

⇔

g l

dim Ker g l+1 = dim Ker g l

⇔ Ker g l+1 = Ker g l .

Daraus folgt zunächst einmal die Aussage (i).

Weiterhin ist die Aussage Im g l+1 = Im g l gleichbedeutend damit, dass

g| Im g l : Im g l → Im g l+1 ein Isomorphismus ist. Daraus folgt (ii), (iii) und

(iv).

(v): Es genügt zu zeigen, dass (g| U ) d−1 ≠ 0. Angenommen, (g| U ) d−1 = 0.

Dann folgt

Ker g d = U ⊆ Ker g d−1 .

Da aber Ker g d−1 ⊆ Ker g d , erhalten wir Ker g d−1 = Ker g d im Widerspruch

zur Definition von d.

(vi): Wir zeigen zunächst V = U ⊕ W . Es sei v ∈ U ∩ W . Dann ist

g d (v) = 0 und v = g d (w) für ein w ∈ V . Daraus folgt g 2d (w) = 0, also

w ∈ Ker g 2d . Nach (ii) gilt Ker g 2d = Ker g d . Damit folgt w ∈ Ker g d und

somit

v = g d (w) = 0.

9 Die Jordansche Normalform 48

Nach Definition von U ist dim U ≥ d, Denn es gilt

{0} ⊂ Ker g ⊂ . . . ⊂ Ker g d−1 ⊂ Ker g d ,

und in jedem Schritt erhöht sich die Dimension mindestens um 1. Nun gilt

P g (x) = x r · Q(x) = P g|U (x) · P g|W (x) mit Q(0) ≠ 0.

Auf der anderen Seite gilt

P g|U (x) = ±x m mit m = dim U,

P g|W (0) ≠ 0 (da g| W ein Isomorphismus nach (iv)).

Daraus folgt m = r, was zu zeigen war.

✷

Beweis von Satz 9.1. Wir führen Induktion über die Zahl k der verschiedenen

Eigenwerte durch. Für k = 1 ist der Satz trivial. Es sei nun k ≥ 2. Zu λ 1

definieren wir

g := f − λ 1 · id.

Dann gilt

Nach Lemma 9.1 gilt

P g (x − λ 1 ) = P f (x), also ν alg (g, 0) = ν alg (f, λ 1 ) = r 1 .

V = Hau(f, λ 1 ) ⊕ W, W = Im g d ,

und die beiden Summanden werden von g und damit auch von f = g + λ 1 id

invariant gelassen. Außerdem gilt

P f|W (x) = ±(x − λ 2 ) r2 · · · (x − λ k ) r k

.

Damit können wir auf f| W die Induktionsannahme anwenden und erhalten

(1) und (2).

Zum Beweis von (3) bemerken wir zunächst, dass es nach Satz 8.1 eine

Basis B von V gibt, so dass die Darstellungsmatrix MB B (f) eine obere

Dreiecksmatrix ist. Diese Matrix schreiben wir als

⎛

⎞

λ 1 E r1 + N 1 0

MB B (f) =

. ..

.

⎜

⎟

⎝ 0 λ k E rk + N k ⎠

9 Die Jordansche Normalform 49

Dann ist jedes N i eine obere Dreiecksmatrix mit Nullen auf der Diagonalen,

nach Satz 8.2 also nilpotent. Setze

⎛

⎞ ⎛

⎞

λ 1 E r1 0

N D := ⎜ . 1 0

.. ⎟

⎝

⎠ und N := ⎜

⎝

. .

⎟

. ⎠ .

0 λ k E rk 0 N k

Dann rechnet man aus:

DN =

⎛

⎜

⎝

⎞

λ 1 N 1 0

..

⎟

. ⎠ = ND.

0 λ k N k

✷

Bemerkung 9.1 Man kann zeigen, dass die Zerlegung f = f D + f N

Satz 9.1 sogar eindeutig ist, wenn man (a), (b) und (c) verlangt.

in

Bemerkung 9.2 Es sei f ein Endomorphismus mit charakteristischem Polynom

P f (x) = ±(x − λ 1 ) r1 · · · (x − λ k ) r k

und Minimalpolynom

µ f (x) = ±(x − λ 1 ) d1 · · · (x − λ k ) d k

mit paarweise verschiedenen λ 1 , . . . , λ k ∈ K. Die Matrix

⎛

⎞

λ i 1 0

.. .

⎜

⎝ . ⎟ ∈ Mat(m, m; K)

.. 1 ⎠

0 λ i

nennt man auch einen Jordanblock der Länge m zum Eigenwert λ i . Dann

folgt aus Theorem 9.1, dass r i die Summe der Längen aller Jordanblocks

zum Eigenwert λ i und d i die Länge des größten Jordanblocks zum Eigenwert

λ i ist.

Beispiel 9.1 Gegeben sei die Matrix

⎛

−5 15 11

⎞

A := ⎝ −5 11 5 ⎠ .

3 −6 −2

9 Die Jordansche Normalform 50

Dann gilt

P A (x) = −x 3 + 4x 2 − 5x + 2 = −(x − 1) 2 (x − 2).

Damit ist k = 2, λ 1 = 1, r 1 = 2, λ 2 = 2, r 2 = 1. Wir setzen

⎛

−6 15 11

⎞

⎛

−7 15 11

B 1 := A − E = ⎝ −5 10 5 ⎠ , B 2 := A − 2E = ⎝ −5 9 5

3 −6 −3

3 −6 −4

⎞

⎠ .

Dann gilt

Daraus folgt

⎛

B1 2 = ⎝

−6 −6 −24

−5 −5 −20

3 3 12

⎞

⎠ .

1 = dim Eig(A, 1) = dim Ker B 1 < dim Ker B 2 1 = dim Hau(A, 1) = 2.

Damit ist A nicht diagonalisierbar. Durch Lösen der Gleichungssysteme B 2 1x =

0 und B 2 x = 0 erhält man Basen

{(4, 0, −1) T , (0, 4, −1) T } von Hau(A, 1),

{(6, 5, −3) T } von Hau(A, 2) = Eig(A, 2).

Daraus bilden wir die Matrix

⎛

⎞

⎛

4 0 6

T := ⎝ 0 4 5 ⎠ mit T −1 = 1 ⎝

4

−1 −1 −3

Dann gilt

⎛

B := T −1 AT = ⎝

−31

4

−25

4

49

0

4

39

0

4

0 0 2

7 6 24

5 6 20

−4 −4 −16

Nun transformieren wir die Basis von Hau(A, 1) so, dass ein Basisvektor v

ein Eigenvektor von A zum Eigenwert 1 ist. Er hat die Form

⎞

⎠ .

v = α(4, 0, −1) T + β(0, 4, −1) T .

⎞

⎠ .

Dann müssen α und β der Bedingung

( −35

) (

49

4 4 α

β

−25

4

35

4

) ( ) 0

=

10 Affine Quadriken 51

genügen. Daraus folgt, dass man α = 7 und β = 5 wählen kann. Mit der

4 4

neuen Transformationsmatrix

⎛

⎞

⎛

⎞

7 0 6

˜T := ⎝ 5 4 5 ⎠ mit ˜T −1 := 1 7 6 24

⎝ 0 3 5 ⎠

7

−3 −1 −3

−7 −7 −28

ergibt sich

⎛

˜T −1 A ˜T = ⎝

1 7 0

0 1 0

0 0 2

Um nun zur Jordannormalform zu kommen, suchen wir einen Vektor

⎞

⎠ .

w = γ(4, 0, −1) T + δ(0, 4, −1) T

mit der Eigenschaft (B − E)w = v. Also müssen γ und δ der Bedingung

( −35

) ( ) ( )

49

4 4 γ α

=

δ β

−25

4

35

4

genügen. Daraus folgt γ = δ = 1 . Mit der neuen Transformationsmatrix

2

⎛

⎞

⎛

⎞

7 2 6

1 0 2

S := ⎝ 5 2 5 ⎠ mit S −1 := ⎝ 0 3 5 ⎠

−3 −1 −3

−1 −1 −4

ergibt sich schließlich

⎛

S −1 AS = ⎝

10 Affine Quadriken

1 1 0

0 1 0

0 0 2

Wir betrachten nun Quadriken. Die Literatur für diesen Abschnitt ist

⎞

⎠ .

• G. Fischer: Analytische Geometrie. Vieweg 1978.

Es sei K im Folgenden immer ein Körper, für den 1 + 1 ≠ 0 ist.

Definition Unter einem quadratischen Polynom über K in den Unbestimmten

x 1 , . . . , x n versteht man einen Ausdruck der Gestalt

n∑

P (x 1 , . . . , x n ) = a ii x 2 i +

∑

n∑

2a ij x i x j + 2a 0i x i + a 00 ,

i=1

wobei a ij ∈ K für 0 ≤ i ≤ j ≤ n.

1≤i

10 Affine Quadriken 52

β

α

Abbildung 1: Ellipse x2 1

α 2 + x2 2

β 2 = 1

β

α

Abbildung 2: Hyperbel x2 1

α 2 − x2 2

β 2 = 1

Definition Eine Teilmenge Q ⊆ K n heißt (affine) Quadrik (oder (affine)

Hyperfläche zweiter Ordnung), wenn es ein quadratisches Polynom P gibt,

so dass

Q = {(x 1 , . . . , x n ) ∈ K n | P (x 1 , . . . , x n ) = 0}.

Beispiel 10.1 (a) x2 1

+ x2 α 2 2

= 1, α, β > 0. Diese Gleichung beschreibt eine

β 2

Ellipse (vgl. Abbildung 1).

(b) x2 1

− x2 α 2 2

= 1, α, β > 0. Diese Gleichung beschreibt eine Hyperbel (vgl.

β 2

Abbildung 2).

3).

Es ist vorteilhaft, die Gleichung für eine Quadrik durch Matrizen auszudrücken.

Dazu setzen wir a ji := a ij für 0 ≤ i < j ≤ n und

⎛

⎞

a 11 · · · a 1n

⎜

A = ⎝

.

. .

⎟

. . ⎠ ,

a n1 · · · a nn

10 Affine Quadriken 53

Abbildung 3: Parabel x 2 1 − x 2 = 0

⎛

x = ⎜

⎝

⎞

1

x 1

⎟

. ⎠ ,

x n

⎛

A = ⎜

⎝

a 00 a 01 · · · a 0n

a 10

. A

a n0

Dann sind A und A symmetrisch und es gilt

⎞

⎟

⎠ .

und

P (x 1 , . . . , x n ) = x T Ax

Q = {(x 1 , . . . , x n ) ∈ K n | x T Ax = 0}.

Man nennt A die erweiterte Matrix zu A und x den erweiterten Spaltenvektor

zu x.

Definition Es seien V und W K-Vektorräume. Eine Abbildung f : V → W

heißt affin, wenn es eine lineare Abbildung F : V → W und einen Vektor

w 0 ∈ W gibt mit

f(v) = F (v) + w 0 für alle v ∈ V.

Ist W = V und F : V → V ein Automorphismus, so nennt man die Abbildung

f : V → V eine Affinität.

Eine affine Abbildung ensteht also durch die Hintereinanderschaltung einer

linearen Abbildung F : V → W und einer Translation t : W → W ,

w ↦→ w + w 0 .

Beispiel 10.2 Für V = K n lässt sich eine Affinität wie folgt beschreiben:

mit A ∈ GL(n; K) und b ∈ K n .

f : K n −→ K n

x ↦−→ Ax + b

Satz 10.1 (i) Sind f, g Affinitäten, so auch f ◦ g.

10 Affine Quadriken 54

(ii) Ist f eine Affinität, so ist f bijektiv und die Umkehrabbildung f −1 ist

wieder eine Affinität. Es gilt

Beweis.

(i) Es sei

Dann gilt

f −1 (v) = F −1 (v) − F −1 (w 0 ).

f(v) = F (v) + w 0 ,

g(v) = G(v) + u 0 .

(f ◦ g)(v) = f(g(v)) = f(G(v) + u 0 ) = F (G(v) + u 0 ) + w 0

= F (G(v)) + F (u 0 ) + w 0 = (F ◦ G)(v) + (F (u 0 ) + w 0 ).

(ii)

(f −1 ◦ f)(v) = F −1 (f(v)) − F −1 (w 0 )

= F −1 (F (v) + w 0 ) − F −1 (w 0 )

= v + F −1 (w 0 ) − F −1 (w 0 ) = v,

(f ◦ f −1 )(v) = F (f −1 (v)) + w 0

= F (F −1 (v) + F −1 (w 0 )) + w 0

= v − w 0 + w 0 = v.

Wir wollen nun untersuchen, wie sich die Gleichung einer Quadrik bei

einer Affinität von K n ändert. Dafür erweitern wir die obige Schreibweise

auf Affinitäten. Es sei f : K n → K n , x ↦→ y mit

y = Sx + b (S ∈ GL(n; K), b ∈ K n ).

✷

Dann definieren wir

⎛

S = ⎜

⎝

1 0 · · · 0

b 1

. S

b n

⎞

⎟

⎠ ,

⎛

y = ⎜

⎝

⎞

1

y 1

⎟

. ⎠ .

y n

In dieser Schreibweise wird f gegeben durch

y = Sx.

10 Affine Quadriken 55

Satz 10.2 Ist Q ⊆ K n eine Quadrik und f : K n → K n eine Affinität, so ist

auch f(Q) ⊆ K n eine Quadrik.

Beweis. Es sei Q gegeben durch

x T Ax = 0

und f durch

y = Sx.

Nach Satz 10.1 wird die Abbildung f −1 : K n → K n beschrieben durch

f −1 (y) = S −1 y − S −1 b.

Ist T := S −1 und

T :=

⎛

⎜

⎝

⎞

1 0 · · · 0

⎟

−S −1 (b) S −1 ⎠ ,

so ist x = Ty. Damit gilt

y = f(x) ∈ f(Q) ⇔ x ∈ Q ⇔ 0 = x T Ax = y T (T T AT)y,

also

f(Q) = {y ∈ K n | y T By = 0} mit B = T T AT.

Wir wollen nun versuchen, die Affinität so zu wählen, dass die neue Gleichung

so einfach wie möglich wird.

Beispiel 10.3 Es sei Q ⊆ R 2 gegeben durch

x 2 1 + 4x 2 2 − 4x 1 x 2 − 6x 1 + 14x 2 + 13 = 0.

Im ersten Schritt eliminieren wir den gemischten Term x 1 x 2 . Es ist

x 2 1 + 4x 2 2 − 4x 1 x 2 = (x 1 − 2x 2 ) 2 .

Also wird Q nach der Koordinatentransformation

z 1 = x 1 − 2x 2 ,

z 2 = x 2

✷

10 Affine Quadriken 56

gegeben durch

z 2 1 − 6z 1 + 2z 2 + 13 = 0.

Nun reduzieren wir die linearen Terme durch quadratische Ergänzung. Die

Gleichung ist äquivalent zu

(z 2 1 − 6z 1 ) + 2z 2 + 13 = 0.

Durch quadratische Ergänzung der Klammer ergibt sich

oder

Nach der Transformation

erhält man die Gleichung

(z 2 1 − 6z 1 + 9) + 2z 2 + 13 − 9 = 0

(z 1 − 3) 2 + 2(z 2 + 2) = 0.

y 1 = z 1 − 3,

y 2 = z 2 + 2

y 2 1 + 2y 2 = 0.

Wir verallgemeinern nun die Methode aus diesem Beispiel. Wir betrachten

den Spezialfall K = R.

Es sei also die Quadrik Q ⊆ R n beschrieben durch

⎛

A = ⎜

⎝

a 00 a 01 · · · a 0n

a 10

. A

a n0

⎞

⎟

⎠ .

Im ersten Schritt bringen wir die symmetrische Teilmatrix A auf Normalform.

Nach Satz 5.1 gibt es eine Matrix T 1 ∈ GL(n; R) mit

⎛

E k 0

⎞

0

T1 T AT 1 = ⎝ 0 −E m−k 0 ⎠ ,

0 0 0

wobei m der Rang von A und k der Index von A ist. Ist

⎛

⎞

1 0 · · · 0

T 1 = ⎜

⎟

⎝

0. T 1 ⎠

10 Affine Quadriken 57

so wird

⎛

B 1 = T T 1 AT 1 = ⎜

⎝

c 00 c 01 · · · c 0n

c 10 E k 0 0

. 0 −E m−k 0

c n0 0 0 0

In den neuen Koordinaten lautet die Gleichung

⎞

⎟

⎠ .

z 2 1 + · · · + z 2 k − z 2 k+1 − · · · − z 2 m + 2(c 01 z 1 + · · · + c 0n z n ) + c 00 = 0,

hat also keine gemischten Terme mehr.

Im zweiten Schritt reduzieren wir durch eine Translation die linearen

Terme. Wir setzen

⎛

⎞

1 0 · · · 0 0 · · · 0 0 · · · 0

−c 10 1

. . . .

−c k0 1 0

c

T 2 =

k+1,0 1

⎜

. ..

⎟ .

Damit ergibt sich

⎜

⎝

.

c m0 1

0 0 1

.

.. .

0 1

B 2 := T T 2 B 1 T 2 = T T 2 T T 1 AT 1 T 2

⎛

⎞

d 00 0 · · · 0 0 · · · 0 c 0,m+1 · · · c 0n

0 +1 0

. . ..

0 +1 0

0 −1

=

. .

..

.

0 0 1

c m+1,0 0

⎜

⎝

. ⎟

. 0

. . ⎠

c n0 0

Das bedeutet, dass Q in den neuen Koordinaten beschrieben werden kann

durch die Gleichung

u 2 1 + · · · + u 2 k − u 2 k+1 − · · · − u 2 m + 2(c m+1,0 u m+1 + · · · + c n0 u n ) + d 00 = 0.

⎟

⎠

10 Affine Quadriken 58

Nun unterscheiden wir drei Fälle:

(1) d 00 = c m+1,0 = . . . = c n0 = 0.

(2) d 00 ≠ 0, c m+1,0 = . . . = c n0 = 0.

(3) c r0 ≠ 0 für mindestens ein r ∈ {m + 1, . . . , n}.

Fall (1): Dann reduziert sich die obige Gleichung auf

u 2 1 + · · · + u 2 k − u 2 k+1 − · · · − u 2 m

und wir sind fertig.

Fall (2): O.B.d.A. d 00 < 0 (sonst multipliziere man die Gleichung mit −1

und ordne durch eine weitere Transformation u 1 , . . . , u m um). Setze

d.h. betrachte

(u 1 , . . . , u n ) = ρ(y 1 , . . . , y n ) mit ρ = √ −d 00 ,

( 1 0

T 3 :=

0 1E ρ n

Dividiert man die entstehende Gleichung durch ρ 2 , so erhält man

)

.

y 2 1 + · · · + y 2 k − y 2 k+1 − · · · − y 2 m = 1.

Fall (3): O.B.d.A. r = m + 1 (sonst ordne man in einer weiteren Transformation

u m+1 , . . . , u n um). Setzt man

y i = u i für i ≠ m + 1,

2y m+1 = 2(c m+1,0 u m+1 + · · · + c n0 u n ) + d 00 ,

so erhält man als neue Gleichung für Q

y 2 1 + · · · + y 2 k − y 2 k+1 − · · · − y 2 m + 2y m+1 = 0.

Die Transformation kann man so beschreiben: Durch simultane Zeilen- und

Spaltenumformungen der Matrix B 2 beseitigt man mit Hilfe von c m+1,0 =

c 0,m+1 nacheinander die Einträge

d 00 , c m+2,0 = c 0,m+2 , . . . , c n0 = c 0n .

Insgesamt ergibt dies eine affine Transformation T 3 .

Damit haben wir folgendes Ergebnis bewiesen:

10 Affine Quadriken 59

Theorem 10.1 (Affine Klassifikation von Quadriken) Gegeben sei eine

Quadrik

Q = {x ∈ R n | x T Ax = 0},

wobei A eine symmetrische (n + 1) × (n + 1)-Matrix ist. Es sei

m := Rang A, m := Rang A.

Dann gibt es eine Affinität f : R n → R n , so dass f(Q) beschrieben wird

durch eine der folgenden Gleichungen

(1) y 2 1 + · · · + y 2 k − y2 k+1 − · · · − y2 m = 0, falls m = m,

(2) y 2 1 + · · · + y 2 k − y2 k+1 − · · · − y2 m = 1, falls m + 1 = m,

(3) y 2 1 + · · · + y 2 k − y2 k+1 − · · · − y2 m + 2y m+1 = 0, falls m + 2 = m.

Speziell für n = 2, 3 erhalten wir die Tabellen 1 und 2.

Typ m m k Gleichung Beschreibung

(1) 0 0 0 0 = 0 Ebene R 2

1 1 1 y1 2 = 0 (Doppel-)Gerade

2 2 1 y1 2 − y2 2 = 0 Geradenpaar (mit Schnittpunkt)

2 2 2 y1 2 + y2 2 = 0 Punkt

(2) 1 2 1 y1 2 = 1 Zwei parallele Geraden

2 3 1 y1 2 − y2 2 = 1 Hyperbel

2 3 2 y1 2 + y2 2 = 1 Kreis

(3) 1 3 1 y1 2 + 2y 2 = 0 Parabel

Tabelle 1: Normalformen von nicht leeren Quadriken im R 2

Nun wollen wir statt allgemeinen Affinitäten nur solche Affinitäten zulassen,

bei denen die lineare Abbildung orthogonal ist.

Definition Es sei V ein euklidischer Vektorraum. Eine Affinität f : V → V

heißt Kongruenz (oder Bewegung), falls es eine orthogonale Abbildung F :

V → V und ein w 0 ∈ V gibt, so dass

f(v) = F (v) + w 0 für alle v ∈ V.

Eine Kongruenz ist also die Hintereinanderschaltung einer orthogonalen

Abbildung und einer Translation. Ist insbesondere V = R n und

f(x) = Ax + b für alle x ∈ R n

10 Affine Quadriken 60

Typ m m k Gleichung Beschreibung

(1) 0 0 0 0 = 0 Raum R 3

1 1 1 y1 2 = 0 (Doppel-)Ebene

2 2 1 y1 2 − y2 2 = 0 Ebenenpaar (mit Schnittgerade)

2 2 2 y1 2 + y2 2 = 0 Gerade

3 3 2 y1 2 + y2 2 − y3 2 = 0 Kreiskegel

3 3 3 y1 2 + y2 2 + y3 2 = 0 Punkt

(2) 1 2 1 y1 2 = 1 Zwei parallele Ebenen

2 3 1 y1 2 − y2 2 = 1 hyperbolischer Zylinder

2 3 2 y1 2 + y2 2 = 1 Kreiszylinder

3 4 1 y1 2 − y2 2 − y3 2 = 1 zweischaliges Hyperboloid

3 4 2 y1 2 + y2 2 − y3 2 = 1 einschaliges Hyperboloid

3 4 3 y1 2 + y2 2 + y3 2 = 1 Kugel

(3) 1 3 1 y1 2 + 2y 2 = 0 parabolischer Zylinder

2 4 1 y1 2 − y2 2 + 2y 3 = 0 hyperbolisches Paraboloid

2 4 2 y1 2 + y2 2 + 2y 3 = 0 elliptisches Paraboloid

Tabelle 2: Normalformen von nicht leeren Quadriken im R 3

mit A ∈ GL(n; R), so ist f genau dann eine Kongruenz, wenn A orthogonal

ist.

Nun modifizieren wir unsere Überlegungen, die zum Beweis von Theorem

10.1 führten, so, dass wir statt beliebiger Affinitäten nur Kongruenzen

zulassen.

Gegeben sei wieder die Quadrik

Q = {x ∈ R n | x T Ax = 0}.

Nach dem Satz über die Hauptachsentransformation gibt es eine orthogonale

Matrix T 1 mit

⎛

⎞

λ 1 0 · · · 0

T1 T 0 λ 2 · · · 0

AT 1 = ⎜

⎝

.

. . ..

⎟ . ⎠ , (λ 1, . . . , λ n ∈ R).

0 0 · · · λ n

Wir können λ 1 , . . . , λ m ≠ 0 und λ m+1 = . . . = λ n = 0 annehmen. Damit sind

die gemischten Terme beseitigt. Mit der erweiterten Matrix T 1 wie oben gilt

10 Affine Quadriken 61

dann

⎛

B 1 := T T 1 AT 1 =

⎜

⎝

d 00 c 01 · · · c 0m c 0,m+1 · · · c 0n

c 10 λ 1 0

.

. .. 0

c m0 0 λ m

c m+1,0 0

. 0

.. .

c n0 0

⎞

.

⎟

⎠

Wie oben führt eine Translation zu

⎛

d 00 0 · · · 0 c 0,m+1 · · · c 0n

0 λ 1 0

.

.. . 0

B 2 := T T 2 B 1 T 2 =

0 0 λ m

c

⎜ m+1,0 0

⎝

.

. 0

..

c n0 0

⎞

.

⎟

⎠

Nun unterscheiden wir wieder drei Fälle:

Fall (1): d 00 = c m+1,0 = . . . = c n0 = 0.

Hier sind wir bereits fertig: O.B.d.A. λ 1 , . . . , λ k > 0, λ k+1 , . . . , λ m < 0. Wir

setzen für i = 1, . . . , m

α i := √ 1

|λi | .

Damit erhalten wir die Gleichung

y1

2

α1

2

+ · · · + y2 k

α 2 k

− y2 k+1

− · · · − y2 m

αk+1

2 αm

2

= 0.

Fall (2): d 00 ≠ 0, c m+1,0 = . . . = c n0 = 0.

O.B.d.A. d 00 < 0, λ 1 , . . . , λ k > 0, λ k+1 , . . . , λ m < 0. Wir dividieren die

Gleichung durch |d 00 | und setzen

α i :=

√

|d00 |

√

|λi | .

Dann erhalten wir die Gleichung

y1

2

α1

2

+ · · · + y2 k

α 2 k

− y2 k+1

− · · · − y2 m

αk+1

2 αm

2

= 1.

10 Affine Quadriken 62

Fall (3): c r0 ≠ 0 für mindestens ein r ∈ {m + 1, . . . , n}.

Hier ist die Transformation, mit der wir d 00 , c m+2,0 , . . . , c n0 beseitigt haben,

keine Kongruenz. Deswegen brauchen wir hier zusätzliche Überlegungen. Wir

setzen

v := (c m+1,0 , . . . , c n0 ) T ∈ R n−m , v 1 = 1

‖v‖ v,

und konstruieren nach dem E. Schmidtschen Orthonormalisierungsverfahren

eine Orthonormalbasis v 1 , . . . , v n−m von R n−m . Dann beschreibt die Matrix

⎛

⎞

1 0 · · · 0 0 · · · 0

0 1 0

.

.. . 0

T 3 :=

0 0 1

, mit µ := −d 00

2‖v‖ ,

⎜

⎟

⎝ µv 1 0 v 1 · · · v n−m

⎠

eine Kongruenz und man rechnet leicht aus:

⎛

0 0 · · · 0 ‖v‖ 0 · · · 0

0 λ 1 0 0

. . .. . 0

B 3 := T T 0 0 λ

3 B 2 T 3 =

m 0

‖v‖ 0 · · · 0 0

⎜

⎝

0. 0 0

0

⎞

.

⎟

⎠

Wieder nehmen wir λ 1 , . . . , λ k > 0 und λ k+1 , . . . , λ m < 0 an und setzen

√

‖v‖

α i := √

|λi | .

Damit ergibt sich die Gleichung

y1

2

α1

2

+ · · · + y2 k

α 2 k

− y2 k+1

− · · · − y2 m

+ 2y

αk+1

2 αm

2 m+1 = 0.

Damit haben wir bewiesen:

Theorem 10.2 (Metrische Klassifikation von Quadriken) Gegeben sei

eine Quadrik

Q = {x ∈ R n | x T Ax = 0},

10 Affine Quadriken 63

wobei A eine symmetrische (n + 1) × (n + 1)-Matrix ist. Es sei

m := Rang A, m := Rang A.

Dann gibt es eine Kongruenz f : R n → R n und α 1 , . . . , α m ∈ R, so dass f(Q)

beschrieben wird durch eine der folgenden Gleichungen:

(1)

(2)

(3)

y1

2

α1

2

y1

2

α1

2

y1

2

α1

2

+ · · · + y2 k

α 2 k

+ · · · + y2 k

α 2 k

+ · · · + y2 k

α 2 k

− y2 k+1

− · · · − y2 m

αk+1

2 αm

2

− y2 k+1

− · · · − y2 m

αk+1

2 αm

2

= 0, falls m = m,

= 1, falls m + 1 = m,

− y2 k+1

− · · · − y2 m

+ 2y

αk+1

2 αm

2 m+1 = 0, falls m + 2 = m.

Speziell für n = 2 erhalten wir folgende Tabelle:

Typ m m k Gleichung Beschreibung

(1) 0 0 0 0 = 0 Ebene R 2

1 1 1 x 2 = 0 (Doppel-)Gerade

2 2 1 x 2 − αy 2 = 0, α > 0 Geradenpaar

2 2 2 x 2 + αy 2 = 0, α > 0 Punkt

x

(2) 1 2 1 2

= 1, α > 0

α 2 Zwei parallele Geraden

2 3 1

x 2

− y2

= 1, α, β > 0

α 2 β 2 Hyperbel

2 3 2

x 2

+ y2

= 1, α, β > 0

α 2 β 2 Ellipse, Kreis

(3) 1 3 1 x 2 + αy = 0, α ≠ 0 Parabel

Tabelle 3: Metrische Klassifikation von nicht leeren Quadriken im R 2

Im Fall n = 3 illustrieren wir im Folgenden den Klassifikationssatz durch

Bilder.

Fall (1): Der interessanteste Fall ist m = 3, k = 2. Die Gleichung

x 2

α 2 + y2

β 2 − z2

γ 2 = 0

beschreibt einen elliptischen Kegel (Bild 4).

Fall (2): In diesem Fall beschränken wir uns auf m = 3. Für k = 3 ergibt

sich die Gleichung

x 2

α + y2

2 β + z2

2 γ = 1, 2

die ein Ellipsoid beschreibt (Bild 5).

10 Affine Quadriken 64

Abbildung 4: Elliptischer Kegel x2

α 2 + y2

β 2 − z2

γ 2 = 0

Abbildung 5: Ellipsoid x2

α 2 + y2

β 2 + z2

γ 2 = 1

Für k = 2 beschreibt

ein einschaliges Hyperboloid (Bild 6).

x 2

α 2 + y2

β 2 − z2

γ 2 = 1

Abbildung 6: Einschaliges Hyperboloid x2

α 2 + y2

β 2 − z2

γ 2 = 1

Für k = 1 ergibt sich die Gleichung

x 2

α 2 + y2

β 2 − z2

γ 2 = −1

für ein zweischaliges Hyperboloid (Bild 7).

10 Affine Quadriken 65

Abbildung 7: Zweischaliges Hyperboloid x2

α 2 + y2

β 2 − z2

γ 2

= −1

Fall (3): Hier beschränken wir uns auf den Fall m = 2. Für k = 0 erhalten

wir die Gleichung

x 2

α + y2

− 2z = 0,

2 β2 die ein elliptisches Paraboloid beschreibt (Bild 8).

Abbildung 8: Elliptisches Paraboloid x2

α 2 + y2

β 2 − 2z = 0

Für k = 1 beschreibt

ein hyperbolisches Paraboloid (Bild 9).

y 2

β 2 − x2

α 2 − 2z = 0

Abbildung 9: Hyperbolisches Paraboloid y2

β 2 − x2

α 2 − 2z = 0

11 Der Dualraum 66

11 Der Dualraum

Ein grundlegender Begriff in der Linearen Algebra ist der Begriff des Dualraums,

den wir nun einführen wollen. Im Folgenden sei K wieder ein beliebiger

Körper.

Definition Es seien V, W K-Vektorräume. Die Menge aller linearen Abbildungen

von V nach W bezeichnen wir mit

Hom K (V, W ) := {f : V → W | f linear}.

Auf der Menge Hom K (V, W ) erklären wir eine Addition und skalare Multiplikation

wie folgt (f, g ∈ Hom K (V, W ), λ ∈ K):

(f + g)(x) = f(x) + g(x),

(λf)(x) = λf(x) für alle x ∈ V.

Mit dieser Addition und skalaren Multiplikation wird Hom K (V, W ) zu einem

K-Vektorraum. Nun betrachten wir den Spezialfall W = K.

Definition

Der Vektorraum

V ∗ := Hom K (V, K) = {ϕ : V → K | ϕ linear}

heißt der Dualraum von V . Die Elemente von V ∗ heißen Linearformen auf

V .

Beispiel 11.1 Wir betrachten eine lineare Gleichung

a 1 x 1 + · · · + a n x n = 0.

Setzt man a = (a 1 , . . . , a n ) (Zeilenvektor!), so gilt

⎛ ⎞

a · x = ( x

) 1

⎜ ⎟

a 1 · · · a n ⎝ . ⎠ = a 1 x 1 + · · · + a n x n .

x n

Deswegen können wir a als eine lineare Abbildung

a : K n −→ K

x ↦−→ a · x

auffassen, d.h. als ein Element von (K n ) ∗ .

11 Der Dualraum 67

Beispiel 11.2 Es sei I = [a, b] ⊆ R ein Intervall und V = C[a, b] der Vektorraum

der auf I stetigen Funktionen. Dann ist

∫ b

a

: V → R, f ↦→

∫ b

a

f(x) dx,

eine Linearform auf V . Linearformen auf unendlich dimensionalen Vektorräumen

nennt man auch lineare Funktionale. Mit ihnen beschäftigt sich die Funktionalanalysis.

Wir setzen von nun an voraus, dass V ein endlich dimensionaler K-

Vektorraum ist und n = dim V > 0. Es sei B = {v 1 , . . . , v n } eine Basis

von V . Dann gibt es zu jedem i = 1, . . . , n genau eine lineare Abbildung

mit

v ∗ i (v j ) := δ ij :=

(δ ij heißt das Kroneckersymbol).

v ∗ i : V → K

{ 1 falls j = i,

0 falls j ≠ i

Satz 11.1 Die Menge B ∗ := {v ∗ 1, . . . , v ∗ n} ist eine Basis von V ∗ . Insbesondere

gilt dim V ∗ = dim V = n.

Definition

Man nennt B ∗ die zu der Basis B duale Basis.

Beweis.

(a) B ∗ ist linear unabhängig:

n∑

α i vi ∗ = 0 ⇒ α i vi ∗ (v j ) = 0 ⇒ α j = 0

i=1

(j = 1, . . . , n).

(b) B ∗ ist ein Erzeugendensystem: Es sei v ∗ ∈ V ∗ . Wir setzen

Behauptung

v ∗ = ∑ n

i=1 α iv ∗ i .

α i := v ∗ (v i ), i = 1, . . . , n.

Beweis. Da eine lineare Abbildung durch die Bilder einer Basis eindeutig

festgelegt ist, reicht es zu zeigen, dass die Bilder der Basisvektoren v j , j =

1, . . . , n, unter den beiden linearen Abbildungen übereinstimmen:

( n∑

)

n∑

α i vi

∗ (v j ) = α i vi ∗ (v j ) = α j = v ∗ (v j ).

i=1

✷

✷

11 Der Dualraum 68

Korollar 11.1 Zu jedem v ∈ V mit v ≠ 0 gibt es ein ϕ ∈ V ∗ mit ϕ(v) ≠ 0.

Beweis. Dies folgt daraus, dass man jeden Vektor v ≠ 0 zu einer Basis von

V ergänzen kann.

✷

Korollar 11.2 Zu jeder Basis B = {v 1 , . . . , v n } von V gibt es einen Isomorphismus

Ψ B : V → V ∗ mit Ψ B (v i ) = v ∗ i .

Warnung

Dieser Isomorphismus hängt von der Wahl der Basis ab!

Beweis. Dies folgt aus der Tatsache, dass eine lineare Abbildung durch die

Bilder der Vektoren einer Basis bestimmt ist.

✷

Beispiel 11.3 V = K n , B = {e 1 , . . . , e n } kanonische Basis. Duale Basis:

B ∗ = {e ∗ 1, . . . , e ∗ n} (kanonische Basis von V ∗ ).

Wir machen die Konvention, Vektoren als Spalten und Linearformen als Zeilen

zu schreiben. Dann gilt

e ∗ i = (0, . . . , 0, 1, 0, . . . , 0),

1 an der i-ten Stelle.

Definition

Ist V ein K-Vektorraum und U ⊆ V ein Unterraum, so heißt

U 0 := {ϕ ∈ V ∗ | ϕ(u) = 0 für alle u ∈ U} ⊆ V ∗

der zu U orthogonale Raum (oder der Annullator von U).

Der zu U orthogonale Raum U 0 ist ein Unterraum von V ∗ .

Warnung Der zu einem Unterraum U ⊆ V orthogonale Raum U 0 liegt in

V ∗ und ist nicht zu verwechseln mit dem orthogonalen Komplement U ⊥ von

U, das nur in Räumen mit Skalarprodukt definiert ist und dann in V liegt!

Satz 11.2 Für jeden Unterraum U ⊆ V gilt

dim U 0 = dim V − dim U.

Genauer gilt: Ist {u 1 , . . . , u k } eine Basis von U und B = {u 1 , . . . , u k , w 1 , . . . , w l }

eine Basis von V , so bilden die Linearformen {w ∗ 1, . . . , w ∗ l } aus B∗ eine Basis

von U 0 .

11 Der Dualraum 69

Beweis.

(a) Lineare Unabhängigkeit: Da w1, ∗ . . . , wl ∗

sind, sind sie linear unabhängig.

(b) Zu zeigen: U 0 = Span{w1, ∗ . . . , wl ∗}.

”⊇”: klar, da wj ∗ (u i ) = 0.

”⊆”: Es sei ϕ ∈ U 0 ,

Elemente der dualen Basis B∗

ϕ = µ 1 u ∗ 1 + · · · + µ k u ∗ k + λ 1 w ∗ 1 + · · · + λ l w ∗ l .

Wendet man diese Abbildung auf u i (i = 1, . . . , k) an, so folgt

0 = ϕ(u i ) = µ i .

Nun wollen wir auch lineare Abbildungen dualisieren. Es sei f : V → W

eine lineare Abbildung und ψ ∈ W ∗ . Dann betrachten wir dazu das Diagramm

f

V W

ψ

ψ◦f

K

Dann gilt ψ ◦ f ∈ V ∗ . Damit können wir definieren:

✷

Definition

Die Abbildung

heißt die zu f duale Abbildung.

f ∗ : W ∗ → V ∗ , ψ ↦→ f ∗ (ψ) := ψ ◦ f,

Bemerkung 11.1 Die Abbildung f ∗ ist linear:

f ∗ (ψ 1 + ψ 2 ) = (ψ 1 + ψ 2 ) ◦ f = ψ 1 ◦ f + ψ 2 ◦ f = f ∗ (ψ 1 ) + f ∗ (ψ 2 ),

f ∗ (λψ) = (λψ) ◦ f = λψ ◦ f = λf ∗ (ψ).

Satz 11.3 Es seien V und W K-Vektorräume mit Basen B und C und

f : V → W eine lineare Abbildung. Dann gilt

M B∗

C ∗ (f ∗ ) = ( M C B (f) ) T

,

d.h. die duale Abbildung wird bezüglich der dualen Basen durch die transponierte

Matrix beschrieben.

11 Der Dualraum 70

Beweis. Es sei B = {v 1 , . . . , v n }, C = {w 1 , . . . , w m }, M C B (f) = (a ij), M B∗

C ∗ (f ∗ ) =

(b ij ). Dann gilt

f(v j ) =

f ∗ (w ∗ i ) =

m∑

a ij w i , also a ij = wi ∗ (f(v j )) = f ∗ (wi ∗ )(v j ),

i=1

n∑

b ji vj ∗ , also b ji = f ∗ (wi ∗ )(v j ).

j=1

Also gilt a ij = b ji .

✷

Definition

Es sei

f i−1 f i

· · · −→ V i−1 −→ Vi −→ Vi+1 −→ · · ·

eine (endliche oder unendliche) Sequenz von K-Vektorräumen und linearen

Abbildungen. Die Sequenz heißt exakt, wenn für jedes i gilt:

Ker f i = Im f i−1 .

Unter einer kurzen exakten Sequenz versteht man eine exakte Sequenz der

Gestalt

0 −→ U −→ f

V −→ g

W −→ 0.

Es sei

0 −→ U f

−→ V

eine kurze exakte Sequenz. Dann gilt

g

−→ W −→ 0

Exaktheit an der Stelle U ⇔ f injektiv,

Exaktheit an der Stelle V ⇔ Im f = Ker g,

Exaktheit an der Stelle W ⇔ g surjektiv.

Ist f : V → W eine lineare Abbildung zwischen K-Vektorräumen V und W ,

so hat man immer eine kurze exakte Sequenz

0 −→ Ker f ↩→ V f

−→ Im f −→ 0,

wobei Ker f ↩→ V die Inklusionsabbildung ist. Dazu gehört eine duale kurze

exakte Sequenz

0 ←− im f ∗ f ∗

←− W ∗ ←↪ Ker f ∗ ←− 0.

Der Zusammenhang zwischen diesen beiden kurzen exakten Sequenzen ist

der Folgende:

11 Der Dualraum 71

Satz 11.4 Für eine lineare Abbildung f : V → W zwischen endlich dimensionalen

Vektorräumen gilt

Im f ∗ = (Ker f) 0 und Ker f ∗ = (Im f) 0 .

Korollar 11.3 Unter den obigen Voraussetzungen gilt

Beweis.

Rang f ∗ = dim Im f ∗

Rang f ∗ = Rang f.

= dim(Ker f) 0 (nach Satz 11.4)

= dim V − dim Ker f (nach Satz 11.2)

= dim Im f = Rang f.

Mit Hilfe von Satz 11.3 erhalten wir damit einen neuen Beweis des folgenden

Resultats.

Korollar 11.4 Für jede Matrix A ∈ Mat(m × n; K) gilt

Zeilenrang A = Spaltenrang A.

Beweis von Satz 11.4. Wir zeigen Im f ∗ = (Ker f) 0 . Der Beweis der zweiten

Gleichung geht analog.

”⊆”: Es sei ϕ ∈ Im f ∗ . Dann ist ϕ = f ∗ (ψ) = ψ ◦ f für ein ψ ∈ V ∗ . Für

x ∈ Ker f gilt dann

ϕ(x) = ψ(f(x)) = ψ(0) = 0,

also ϕ ∈ (Ker f) 0 .

”⊇”: Es sei umgekehrt ϕ ∈ V ∗ mit ϕ| Ker f = 0 gegeben. Wir müssen ein

ψ ∈ W ∗ mit ϕ = ψ ◦ f konstruieren. Dazu sei

B = {u 1 , . . . , u r , v 1 , . . . , v k } Basis von V,

B = {w 1 , . . . , w r , w r+1 , . . . , w m } Basis von W

mit Ker f = Span{v 1 , . . . , v k }, Im f = Span{w 1 , . . . , w r } und f(u i ) = w i für

i = 1, . . . , r. Dann gibt es genau eine lineare Abbildung ψ mit

{ ϕ(ui ) für i = 1, . . . , r,

ψ(w i ) :=

0 sonst.

✷

11 Der Dualraum 72

Nach Konstruktion von ψ ist ϕ = ψ ◦ f.

Es sei nun

〈 , 〉 : V × V −→ K

(v, w) ↦−→ 〈v, w〉

eine Bilinearform. Dann können wir die beiden folgenden Abbildungen betrachten:

〈v, ·〉 : V → K,

Damit erhalten wir Abbildungen

w ↦→ 〈v, w〉,

〈·, w〉 : V → K, v ↦→ 〈v, w〉.

b 1 : V → V ∗ , v ↦→ 〈v, ·〉,

b 2 : V → V ∗ ,

w ↦→ 〈·, w〉.

Definition Eine Bilinearform 〈 , 〉 : V → K heißt nicht ausgeartet, wenn

die beiden Abbildungen b 1 und b 2 injektiv sind.

Beispiel 11.4 Ein Skalarprodukt 〈 , 〉 auf einem R-Vektorraum ist nicht

ausgeartet. Denn

b 1 (v) = 0 ⇔ 〈v, w〉 = 0 für alle w ∈ V ⇔ v = 0,

da 〈 , 〉 positiv definit ist. Da 〈 , 〉 symmetrisch ist, folgt, dass auch b 2 injektiv

ist.

Daraus folgt unmittelbar:

Satz 11.5 In einem endlich dimensionalen euklidischen Vektorraum V ist

die Abbildung

Ψ : V → V ∗ , v ↦→ 〈v, ·〉,

ein Isomorphismus.

Bemerkung 11.2 Im Gegensatz zu den Isomorphismen Ψ B : V → V ∗ in

Korollar 11.2, die von der Wahl der Basis abhängen, ist dieser Isomorphismus

kanonisch, d.h. er hängt nicht von der Wahl einer Basis ab. Er existiert aber

nur, wenn ein Skalarprodukt gegeben ist.

Satz 11.6 Es sei V ein euklidischer Vektorraum und Ψ : V → V ∗ der kanonische

Isomorphismus. Dann gilt:

(i) Für jeden Unterraum U ⊆ V ist Ψ(U ⊥ ) = U 0 .

✷

12 Multilineare Abbildungen 73

(ii) Ist B = {v 1 , . . . , v n } eine Orthonormalbasis von V und B ∗ = {v ∗ 1, . . . , v ∗ n}

die duale Basis, so ist Ψ(v i ) = v ∗ i .

Beweis.

(i): Nach den Dimensionsformeln gilt

dim U ⊥ = dim V − dim U = dim U 0 .

Daher reicht es zu zeigen: Ψ(U ⊥ ) ⊆ U 0 . Dies folgt aus

(ii): Dies folgt aus

Ψ(v)(u) = 〈v, u〉 = 0 für v ∈ U ⊥ und u ∈ U.

Ψ(v i )(v j ) = 〈v i , v j 〉 = δ ij = v ∗ i (v j ).

✷

12 Multilineare Abbildungen

Literatur für diesen Abschnitt:

• M. Spivak: Calculus on Manifolds. W. A. Benjamin 1965.

• W. Greub: Multilinear Algebra, 2nd Edition. Springer-Verlag 1978.

Definition Es seien V 1 , . . . , V p , W K-Vektorräume. Eine Abbildung ϕ : V 1 ×

· · · × V p → W heißt multilinear oder genauer p-linear, wenn für jedes i =

1, . . . , p gilt

ϕ(v 1 , . . . , v i + v ′ i, . . . , v p ) = ϕ(v 1 , . . . , v i , . . . , v p ) + ϕ(v 1 , . . . , v ′ i, . . . , v p ),

ϕ(v 1 , . . . , λv i , . . . , v p ) = λϕ(v 1 , . . . , v i , . . . , v p ),

für v i , v i

′ ∈ V i , λ ∈ K. Gilt W = K, so heißt ϕ eine multilineare (oder

p-lineare) Funktion.

Beispiel 12.1 (a) Der Fall p = 1 und W = K ist der Spezialfall der Linearformen.

(b) Im Fall p = 2, W = K, V 1 = V 2 = V , erhalten wir gerade die am

Anfang der Vorlesung betrachteten Bilinearformen.

Dies ist eine bilineare Funktion.

12 Multilineare Abbildungen 74

Es sei Hom(V 1 , . . . , V p ; W ) die Menge aller p-linearen Abbildungen ϕ :

V 1 × · · · × V p → W . Wir erklären eine Addition durch

(ϕ + ψ)(v 1 , . . . , v p ) = ϕ(v 1 , . . . , v p ) + ψ(v 1 , . . . , v p )

und eine skalare Multiplikation mit λ ∈ K durch

(λϕ)(v 1 , . . . , v p ) = λϕ(v 1 , . . . , v p ).

Damit wird Hom(V 1 , . . . , V p ; W ) zu einem K-Vektorraum.

Definition Ist V 1 = . . . = V p = V und W = K, so nennt man eine multilineare

Funktion ϕ : V × · · · × V → K auch eine Multilinearform oder einen

p-Tensor auf V . Die Menge aller p-Tensoren auf V bezeichnen wir mit T p (V ).

Nach den Bemerkungen vor der Definition ist T p (V ) ein K-Vektorraum.

Beispiel 12.2 Es sei V = K n und det die Funktion

det :

K

} n × ·

{{

· · × K n

}

−→ K

n

(a 1 , . . . , a n ) ↦−→ det(a 1 · · · a n )

,

wobei (a 1 · · · a n ) die n × n-Matrix mit den Spalten a 1 , . . . , a n ist. Aus den

Eigenschaften der Determinante folgt, dass det eine Multilinearform ist, also

det ∈ T n (K n ).

Definition Ist ϕ ∈ T p (V ) und ψ ∈ T q (V ), so definieren wir das Tensorprodukt

ϕ ⊗ ψ ∈ T p+q (V ) durch

(ϕ ⊗ ψ)(v 1 , . . . , v p , v p+1 , . . . , v p+q ) = ϕ(v 1 , . . . , v p ) · ψ(v p+1 , . . . , v p+q ).

Warnung Man beachte, dass hier die Reihenfolge wichtig ist, da ϕ⊗ψ und

ψ ⊗ ϕ ganz unterschiedlich sind.

Satz 12.1 Das Tensorprodukt hat die folgenden Eigenschaften:

(i) (ϕ ⊗ ψ) ⊗ θ = ϕ ⊗ (ψ ⊗ θ).

(ii) (ϕ 1 + ϕ 2 ) ⊗ ψ = ϕ 1 ⊗ θ + ϕ 2 ⊗ ψ.

(iii) ϕ ⊗ (ψ 1 + ψ 2 ) = ϕ ⊗ ψ 1 + ϕ ⊗ ψ 2 .

(vi) (λϕ) ⊗ ψ = ϕ ⊗ (λψ) = λ(ϕ ⊗ ψ).

12 Multilineare Abbildungen 75

Beweis. Der Nachweis dieser Eigenschaften ist einfach. Siehe Vorlesung.

Der Vektorraum T 1 (V ) ist gerade der Dualraum V ∗ . Mit dem Tensorprodukt

können wir nun die anderen Vektorräume T p (V ) durch T 1 (V ) ausdrücken:

Satz 12.2 Es sei (v 1 , . . . , v n ) eine Basis von V und (v ∗ 1, . . . , v ∗ n) die duale

Basis. Dann ist die Menge aller p-fachen Tensorprodukte

v ∗ i 1

⊗ · · · ⊗ v ∗ i p

, 1 ≤ i 1 , . . . , i p ≤ n,

eine Basis von T p (V ). Insbesondere hat T p (V ) die Dimension n p .

Beweis.

(a) Man beachte zunächst, dass

✷

Gilt

so ist

vi ∗ 1

⊗ · · · ⊗ vi ∗ p

(v j1 , . . . , v jp ) = δ i1 ,j 1

· · · δ ip,jp

{ 1 falls j1 = i

=

1 , . . . , j p = i p ,

0 sonst.

ϕ(w 1 , . . . , w p ) =

Also gilt

(w 1 , . . . , w p ) =

=

ϕ =

n∑

j 1 ,...,j p=1

n∑

i 1 ,...,i p=1

n∑

i 1 ,...,i p=1

( n∑

j=1

a 1j v j , . . . ,

)

n∑

a pj v j ,

j=1

a 1,j1 · · · a p,jp ϕ(v j1 , . . . , v jp )

ϕ(v i1 , . . . , v ip ) · v ∗ i 1

⊗ · · · ⊗ v ∗ i p

(w 1 , . . . , w p ).

ϕ(v i1 , . . . , v ip ) · v ∗ i 1

⊗ · · · ⊗ v ∗ i p

.

Also bilden die v ∗ i 1

⊗ · · · ⊗ v ∗ i p

ein Erzeugendensystem von T p (V ).

(b) Zum Beweis der linearen Unabhängigkeit nehmen wir an

n∑

i 1 ,...,i p=1

a i1 ,...,i p

v ∗ i 1

⊗ · · · ⊗ v ∗ i p

= 0.

13 Alternierende Multilinearformen 76

Indem wir beide Seiten dieser Gleichung auf (v j1 , . . . , v jp ) anwenden, erhalten

wir

a j1 ,...,j p

= 0.

Also sind die v ∗ i 1

⊗ · · · ⊗ v ∗ i p

linear unabhängig. ✷

Wie im Fall des Dualraums können wir einer linearen Abbildung f : V →

W eine lineare Abbildung f ∗ : T p (W ) → T p (V ) zuordnen: Diese Abbildung

ist definiert durch

f ∗ ϕ(v 1 , . . . , v p ) = ϕ(f(v 1 ), . . . , f(v p )) für ϕ ∈ T p (W ), v 1 , . . . , v p ∈ V.

Man kann leicht zeigen:

Satz 12.3 Für eine lineare Abbildung f : V → W und ϕ ∈ T p (W ), ψ ∈

T q (W ) gilt

f ∗ (ϕ ⊗ ψ) = f ∗ ϕ ⊗ f ∗ ψ.

13 Alternierende Multilinearformen

Für den Grundkörper K setzen wir in diesem Abschnitt voraus:

n K := 1

}

+ ·

{{

· · + 1

}

≠ 0 für alle n ≥ 1.

n

Wir identifizieren dann n K mit n.

Die Multilinearform det ∈ T n (K n ) hat die folgende wichtige Eigenschaft:

det(a 1 , . . . , a i , . . . , a j , . . . , a n ) = − det(a 1 , . . . , a j , . . . , a i , . . . , a n ).

Solche Multilinearformen nennt man alternierend.

Definition Eine Multilinearform ω ∈ T p (V ) heißt alternierend, wenn für

jede Permutation σ ∈ S p gilt

ω(v 1 , . . . , v p ) = sign σ · ω(v σ(1) , . . . , v σ(p) ) für alle v 1 , . . . , v p ∈ V.

Die Menge aller alternierenden p-Tensoren bezeichnen wir mit ∧p (V ).

Offensichtlich ist ∧p (V ) ein Unterraum von T p (V ).

Lemma 13.1 Es sei ω ∈ T p (V ) eine Multilinearform. Dann sind die folgenden

Bedingungen äquivalent:

(i) ω ist alternierend.

13 Alternierende Multilinearformen 77

(ii) ω(v 1 , . . . , v p ) = −ω(v τ(1) , . . . , v τ(p) ) für jede Transposition τ ∈ S p .

(iii) Ist v i = v j für ein i ≠ j, so ist ω(v 1 , . . . , v p ) = 0.

Beweis.

(i) ⇒ (ii): Klar.

(ii) ⇒ (i): Es sei σ ∈ S p . Dann gibt es nach I, Lemma 17.1, eine Darstellung

σ = τ 1 ◦ · · · ◦ τ m ,

wobei die τ i Transpositionen sind. Es gilt

{ gerade falls sign σ = 1,

m =

ungerade falls sign σ = −1.

Daraus folgt die Behauptung.

(ii) ⇒ (iii): Es sei v i = v j mit i ≠ j und τ sei die Transposition, die i und

j vertauscht. Dann gilt

Also folgt mit 1 + 1 ≠ 0

ω(v 1 , . . . , v p ) = ω(v τ(1) , . . . , v τ(p) ) = −ω(v 1 , . . . , v p ).

ω(v 1 , . . . , v p ) = 0.

(iii) ⇒ (ii): Es sei τ die Transposition, die i und j vertauscht (i ≠ j).

Dann gilt

i

0 = ω(v 1 , . . . , v i + v j , . . . , v i + v j , . . . , v p )

Daraus folgt

Definition

j

= ω(v 1 , . . . , v i , . . . , v i , . . . , v p ) + ω(v 1 , . . . , v i , . . . , v j , . . . , v p )

+ ω(v 1 , . . . , v j , . . . , v i , . . . , v p ) + ω(v 1 , . . . , v j , . . . , v j , . . . , v p ).

ω(v 1 , . . . , v i , . . . , v j , . . . , v p ) = −ω(v 1 , . . . , v j , . . . , v i , . . . , v p ).

Es sei ϕ ∈ T p (V ). Dann definieren wir

Alt(ϕ)(v 1 , . . . , v p ) := 1 ∑

sign σ · ϕ(v σ(1) , . . . , v σ(p) ).

p!

σ∈S p

Satz 13.1 (i) Für ϕ ∈ T p (V ) ist Alt(ϕ) ∈ ∧p (V ).

✷

13 Alternierende Multilinearformen 78

(ii) Für ω ∈ ∧p (V ) gilt Alt(ω) = ω.

(iii) Für ϕ ∈ T p (V ) gilt Alt(Alt(ϕ)) = Alt(ϕ).

Beweis.

(i) Es sei τ ∈ S p beliebig. Dann gilt

(ii) Es gilt

Alt(ϕ)(v τ(1) , . . . , v τ(p) )

= 1 ∑

sign σ · ϕ(v σ(τ(1)) , . . . , v σ(τ(p)) )

p!

σ∈S p

= sign τ · 1 ∑

sign(σ ◦ τ) · ϕ(v (σ◦τ)(1) , . . . , v (σ◦τ)(p) )

p!

σ◦τ∈S p

= sign τ · Alt(ϕ)(v 1 , . . . , v p ).

Alt(ω)(v 1 , . . . , v p ) = 1 ∑

sign σ · ω(v σ(1) , . . . , v σ(p) )

p!

σ∈S p

= 1 ∑

(sign σ) 2 ω(v 1 , . . . , v p )

p!

σ∈S p

= ω(v 1 , . . . , v p ).

(iii) folgt aus (i) und (ii).

Wir möchten eine Basis von ∧p (v) bestimmen. Dazu bemerken wir, dass

mit ω ∈ ∧p (V ) und η ∈ ∧q (V ) das Tensorprodukt ω ⊗ η im Allgemeinen

nicht in ∧ p+q (V ) liegt. Daher definieren wir ein neues Produkt:

Definition Ist ω ∈ ∧p (V ) und η ∈ ∧q (V ), so definieren wir das Dachprodukt

ω ∧ η ∈ ∧p+q (V ) durch

ω ∧ η :=

(p + q)!

Alt(ω ⊗ η).

p!q!

Satz 13.2 Das Dachprodukt hat folgende Eigenschaften:

(i) (ω 1 + ω 2 ) ∧ η = ω 1 ∧ η + ω 2 ∧ η.

(ii) ω ∧ (η 1 + η 2 ) = ω ∧ η 1 + ω ∧ η 2 .

(iii) (λω) ∧ η = ω ∧ (λη) = λ(ω ∧ η).

(iv) ω ∧ η = (−1) pq η ∧ ω.

✷

13 Alternierende Multilinearformen 79

(v) f ∗ (ω ∧ η) = f ∗ (ω) ∧ f ∗ (η).

Beweis. Diese Eigenschaften sind leicht nachzuweisen.

Mehr Arbeit erfordert der Nachweis der Gleichung (ω∧η)∧θ = ω∧(η∧θ).

Dazu brauchen wir zwei Hilfssätze:

Lemma 13.2 Für ϕ ∈ T p (V ) mit Alt(ϕ) = 0 und ψ ∈ T q (V ) gilt

Beweis. Es gilt

Alt(ϕ ⊗ ψ) = Alt(ψ ⊗ ϕ) = 0.

(p + q)!Alt(ϕ ⊗ ψ)(v 1 , . . . , v p+q )

= ∑

σ∈S p+q

sign σ · ϕ(v σ(1) , . . . , v σ(p) ) · ψ(v σ(p+1) , . . . , v σ(p+q) ).

Nun betrachten wir die Untergruppe G ⊆ S p+q , die aus allen Permutationen

σ besteht, die p + 1, . . . , p + q fest lassen. Dann gilt

∑

sign σ · ϕ(v σ(1) , . . . , v σ(p) ) · ψ(v σ(p+1) , . . . , v σ(p+q) )

σ∈G

=

⎛

⎞

⎝ ∑

sign σ ′ · ϕ(v σ ′ (1), . . . , v σ ′ (p)) ⎠ · ψ(v p+1 , . . . , v p+q )

σ ′ ∈S p

= p!Alt(ϕ) · ψ(v p+1 , . . . , v p+q ) = 0

Nun sei σ 0 ∉ G. Es sei

Wir setzen außerdem

Dann gilt

∑

Gσ 0 := {σ ◦ σ 0 | σ ∈ G}.

(v σ0 (1), . . . , v σ0 (p+q)) = (w 1 , . . . , w p+q ).

sign σ · ϕ(v σ(1) , . . . , v σ(p) ) · ψ(v σ(p+1) , . . . , v σ(p+q) )

σ∈Gσ 0

(

= sign σ 0 · ∑

)

sign σ ′ · ϕ(w σ ′ (1), . . . , w σ ′ (p)) · ψ(w p+1 , . . . , w p+q )

= 0.

σ ′ ∈G

✷

13 Alternierende Multilinearformen 80

Man beachte, dass G ∩ Gσ 0 = ∅ gilt. Denn angenommen σ ∈ G ∩ Gσ 0 . Dann

gilt σ = σ ′ ◦σ 0 für ein σ ′ ∈ G, also σ 0 = (σ ′ ) −1 ◦σ ∈ G, ein Widerspruch. Wenn

wir auf diese Weise fortfahren, können wir S p+q so in disjunkte Teilmengen

zerlegen, dass die Summe über jede dieser Teilmengen jeweils 0 ergibt. Also

ergibt die Summe über ganz S p+q Null.

Die andere Gleichung Alt(ψ ⊗ ϕ) = 0 wird analog bewiesen. ✷

Lemma 13.3 Für ω ∈ ∧p (V ), η ∈ ∧q (V ) und θ ∈ ∧r (V ) gilt

Beweis. Es gilt

Alt(Alt(ω ⊗ η) ⊗ θ) = Alt(ω ⊗ η ⊗ θ) = Alt(ω ⊗ Alt(η ⊗ θ)).

Alt(Alt(η ⊗ θ) − η ⊗ θ) = Alt(η ⊗ θ) − Alt(η ⊗ θ) = 0.

Aus Lemma 13.2 folgt damit

0 = Alt(ω ⊗ [Alt(η ⊗ θ) − η ⊗ θ])

= Alt(ω ⊗ Alt(η ⊗ θ)) − Alt(ω ⊗ η ⊗ θ).

Die andere Gleichung wird analog bewiesen.

Satz 13.3 Für ω ∈ ∧p (V ), η ∈ ∧q (V ) und θ ∈ ∧r (V ) gilt

Beweis.

(ω ∧ η) ∧ θ = ω ∧ (η ∧ θ) =

(ω ∧ η) ∧ θ =

=

(p + q + r)!

Alt(ω ⊗ η ⊗ θ).

p!q!r!

((p + q) + r)!

Alt((ω ∧ η) ⊗ θ)

(p + q)!r!

( )

(p + q + r)! (p + q)!

Alt Alt(ω ⊗ η) ⊗ θ

(p + q)!r! p!q!

(p + q + r)!

Alt(ω ⊗ η ⊗ θ) (nach Lemma 13.3).

p!q!r!

✷

Satz 13.4 Es sei (v 1 , . . . , v n ) eine Basis von V und (v ∗ 1, . . . , v ∗ n) die duale

Basis. Dann ist die Menge aller p-fachen Dachprodukte

v ∗ i 1

∧ · · · ∧ v ∗ i p

, 1 ≤ i 1 < . . .

eine Basis von ∧p (V ). Insbesondere hat ∧p (V ) die Dimension

( n n!

=

p)

p!(n − p)! .

13 Alternierende Multilinearformen 81

Beweis.

(a) Es sei ω ∈ ∧p (V ) ⊆ T p (V ). Nach Satz 12.2 können wir schreiben:

Es folgt

ω =

ω = Alt(ω) =

Nach Satz 13.3 gilt aber

n∑

i 1 ,...,i p=1

n∑

i 1 ,...,i p=1

a i1 ,...,i p

v ∗ i 1

⊗ · · · ⊗ v ∗ i p

.

a i1 ,...,i p

Alt(v ∗ i 1

⊗ · · · ⊗ v ∗ i p

).

Alt(v ∗ i 1

⊗ · · · ⊗ v ∗ i p

) = Konstante · v ∗ i 1

∧ · · · ∧ v ∗ i p

.

Also spannen die Elemente vi ∗ 1

∧ · · · ∧ vi ∗ p

den Raum ∧p (V ) auf.

(b) Die lineare Unabhängigkeit wird wie im Beweis von Satz 12.2 bewiesen.

✷

Hat V die Dimension n, so folgt aus Satz 13.4, dass ∧n (V ) die Dimension

1 hat. Das bedeutet, dass alle alternierenden n-Tensoren auf V Vielfache eines

von Null verschiedenen n-Tensors sind. Für V = K n ist det ∈ ∧n (K n ) ein

solcher Tensor. Er ist dadurch ausgezeichnet, dass det(e 1 , . . . , e n ) = 1 gilt.

Deswegen erhalten wir die folgende Charakterisierung der Determinante:

Korollar 13.1 Die Determinante det ist der eindeutig bestimmte alternierende

n-Tensor mit

det(e 1 , . . . , e n ) = 1.

Satz 13.5 Es sei V ein K-Vektorraum, (v 1 , . . . , v n ) eine Basis von V und

ω ∈ ∧n (V ). Ist w j = ∑ n

i=1 a ijv i , j = 1, . . . , n, so gilt

ω(w 1 , . . . , w n ) = det(a ij ) · ω(v 1 , . . . , v n ).

Beweis. Wir definieren η ∈ T n (K n ) durch

η((a 11 , . . . , a n1 ) T , . . . , (a 1n , . . . , a nn ) T ) = ω( ∑ a i1 v i , . . . , ∑ a in v i ).

Dann ist η ∈ ∧n (K n ), also η = λ · det für ein λ ∈ K. Es gilt

λ = λ det(e 1 , . . . , e n ) = η(e 1 , . . . , e n ) = ω(v 1 , . . . , v n ).

✷

14 Symmetrische Multilinearformen 82

Es sei nun K = R. Satz 13.5 zeigt, dass ein von Null verschiedener alternierender

n-Tensor ω ∈ ∧n (V ) die (geordneten) Basen von V in zwei disjunkte

Klassen einteilt: eine mit ω(v 1 , . . . , v n ) > 0 und eine mit ω(v 1 , . . . , v n ) <

0. Wenn (v 1 , . . . , v n ) und (w 1 , . . . , w n ) zwei Basen von V sind und A =

(a ij ) die durch w j = ∑ a ij v i definierte Matrix des Basiswechsels, dann sind

(v 1 , . . . , v n ) und (w 1 , . . . , w n ) genau dann in der gleichen Klasse, wenn det A >

0 gilt. Also ist die Klasseneinteilung unabhängig von ω. Damit können wir

definieren:

Definition Eine Orientierung eines reellen Vektorraums V ist eine Klasse

von Basen, für die gilt: Für einen von Null verschiedenen alternierenden n-

Tensor ω ∈ ∧n (V ) ist ω(v 1 , . . . , v n ) > 0 für alle Basen aus dieser Klasse oder

ω(v 1 , . . . , v n ) < 0 für alle Basen aus dieser Klasse.

Beispiel 13.1 Die Standardorientierung des R n ist die Orientierung, zu der

die Standardbasis (e 1 , . . . , e n ) gehört. Hier kommt es auf die Reihenfolge an:

Vertauschen wir zwei dieser Basiselemente, so gehört die neue Basis zu der

anderen Orientierung.

Ist nun V ein euklidischer Vektorraum, so gilt für die Transformationsmatrix

A, die eine Orthonormalbasis in eine andere transformiert, det A = ±1.

Damit können wir definieren:

Definition Es sei V ein euklidischer Vektorraum und eine Orientierung von

V gewählt. Das Volumenelement von V ist das eindeutig bestimmte Element

ω ∈ ∧n (V ) mit ω(v 1 , . . . , v n ) = 1 für jede Orthonormalbasis (v 1 , . . . , v n ) aus

der Orientierung von V .

Beispiel 13.2 Für V = R n mit dem gewöhnlichen euklidischen Skalarprodukt

und der Standardorientierung ist det das Volumenelement und

| det(v 1 , . . . , v n )|

ist das Volumen des von den Vektoren v 1 , . . . , v n aufgespannten Parallelotops.

14 Symmetrische Multilinearformen

Analog zu alternierenden Multilinearformen kann man auch symmetrische

Multilinearformen betrachten. Für den Grundkörper K setzen wir weiterhin

n K ≠ 0 für alle n ≥ 1 voraus.

14 Symmetrische Multilinearformen 83

Definition Eine Multilinearform ϕ ∈ T p (V ) heißt symmetrisch, wenn für

jede Permutation σ ∈ S p gilt

ϕ(v 1 , . . . , v p ) = ϕ(v σ(1) , . . . , v σ(p) ) für alle v 1 , . . . , v p ∈ V.

Die Menge aller symmetrischen p-Tensoren bezeichnen wir mit S p (V ).

Definition

Es sei ϕ ∈ T p (V ). Dann definieren wir

Sym(ϕ)(v 1 , . . . , v p ) := 1 ∑

ϕ(v σ(1) , . . . , v σ(p) ).

p!

σ∈S p

Satz 14.1 (i) Für ϕ ∈ T p (V ) ist Sym(ϕ) ∈ S p (V ).

(ii) Für ϕ ∈ S p (V ) gilt Sym(ϕ) = ϕ.

(iii) Für ϕ ∈ T p (V ) gilt Sym(Sym(ϕ)) = Sym(ϕ).

Beweis. Der Beweis ist analog zum Beweis von Satz 13.1.

✷

Definition Ist ϕ ∈ S p (V ) und ψ ∈ S q (V ), so definieren wir das symmetrische

Produkt ϕ ∨ ψ ∈ S p+q (V ) durch

ϕ ∨ ψ :=

(p + q)!

Sym(ϕ ⊗ ψ).

p!q!

Wie im Fall der alternierenden Multilinearformen beweist man:

Satz 14.2 Das symmetrische Produkt hat folgende Eigenschaften:

(i) (ϕ 1 + ϕ 2 ) ∨ ψ = ϕ 1 ∨ ψ + ϕ 2 ∨ ψ.

(ii) ϕ ∨ (ψ 1 + ψ 2 ) = ϕ ∨ ψ 1 + ϕ ∨ ψ 2 .

(iii) (λϕ) ∨ ψ = ϕ ∨ (λψ) = λ(ϕ ∨ ψ).

(iv) ϕ ∨ ψ = ψ ∨ ϕ.

(v) (ϕ ∨ ψ) ∨ θ = ϕ ∨ (ψ ∨ θ).

(vi) f ∗ (ϕ ∨ ψ) = f ∗ (ϕ) ∨ f ∗ (ψ).

15 Der Quotientenraum 84

Satz 14.3 Es sei (v 1 , . . . , v n ) eine Basis von V und (v ∗ 1, . . . , v ∗ n) die duale

Basis. Dann ist die Menge aller p-fachen symmetrischen Produkte

v ∗ i 1

∨ · · · ∨ v ∗ i p

, 1 ≤ i 1 ≤ . . . ≤ i p ≤ n,

eine Basis von S p (V ). Insbesondere hat S p (V ) die Dimension

( ) n + p − 1

.

p

Definition

Ein Polynom

P (x 1 , . . . , x n ) = ∑

endlich

a ν1 ,...,ν n

x ν 1

1 · · · x νn

n

heißt homogen vom Grad p, wenn die Summe über alle n-Tupel (ν 1 , . . . , ν n )

mit ∑ n

i=1 ν i = p läuft. Es sei K p [x 1 , . . . , x n ] der Vektorraum der homogenen

Polynome in den Variablen x 1 , . . . , x n vom Grad p.

Satz 14.4 Es sei V ein K-Vektorraum der Dimension n. Dann gibt es einen

Isomorphismus

Ψ : S p (V ) → K p [x 1 , . . . , x n ].

Beweis. Es sei (v 1 , . . . , v n ) eine Basis von V und (v ∗ 1, . . . , v ∗ n) die duale Basis.

Dann definieren wir

durch

Ψ : S p (V ) → K p [x 1 , . . . , x n ]

v ∗ i 1

∨ · · · ∨ v ∗ i p

↦→ x i1 · · · x ip , 1 ≤ i 1 ≤ . . . ≤ i p ≤ n.

Da die vi ∗ 1

∨ · · · ∨ vi ∗ p

nach Satz 14.3 eine Basis von S p (V ) und die Monome

x i1 · · · x ip eine Basis von K p [x 1 , . . . , x n ] bilden, folgt, dass sich Ψ zu einem

Isomorphismus zwischen S p (V ) und K p [x 1 , . . . , x n ] erweitern lässt. ✷

15 Der Quotientenraum

Wir wollen nun den Begriff des Quotientenraums einführen. Dazu betrachten

wir Äquivalenzrelationen.

Es sei X eine Menge.

Definition Eine Äquivalenzrelation auf X ist eine Teilmenge R ⊆ X × X

mit folgenden Eigenschaften:

15 Der Quotientenraum 85

(R) (x, x) ∈ R für alle x ∈ X (reflexiv).

(S) (x, y) ∈ R ⇒ (y, x) ∈ R für alle x, y ∈ X (symmetrisch).

(T) (x, y) ∈ R, (y, z) ∈ R ⇒ (x, z) ∈ R für alle x, y, z ∈ X (transitiv).

Notation x ∼ y :⇔ (x, y) ∈ R.

Beispiel 15.1 Es sei X = Mat(n, n; K) und

R := {(A; B) ∈ X × X | ∃T ∈ GL(n; K) mit A = T −1 BT } ⊆ X × X.

Dann gilt

A ∼ B ⇔ A ist ähnlich zu B.

Definition

definieren

Mit anderen Worten

Es sei V ein K-Vektorraum und U ⊆ V ein Unterraum. Wir

R := {(u, v) ∈ V × V | u − v ∈ U}.

u ∼ v :⇔ u − v ∈ U.

Lemma 15.1 Die obige Relation R ist eine Äquivalenzrelation.

Beweis.

(R) (u, u) ∈ R, da u − u = 0 ∈ U.

(S) (u, v) ∈ R ⇒ u − v ∈ U ⇒ v − u ∈ U ⇒ (v, u) ∈ R.

(T) (u, v) ∈ R, (v, w) ∈ R ⇒ u−v ∈ U, v −w ∈ U ⇒ u−w ∈ U ⇒ (u, w) ∈

R.

Definition

definiert als

Es sei x ∈ X. Die Äquivalenzklasse von x, in Zeichen [x], ist

[x] := {y ∈ X | x ∼ y} ⊆ X.

Jedes Element y ∈ [x] heißt Repräsentant der Äquivalenzklasse [x].

✷

Lemma 15.2

(i) x ∈ [x|.

(ii) [x] ∩ [y] ≠ ∅ ⇔ x ∼ y.

(iii) x ∼ y ⇔ [x] = [y].

15 Der Quotientenraum 86

Beweis.

(i) folgt aus der Reflexivität.

(ii): Es sei [x] ∩ [y] ≠ ∅. Dann existiert ein z ∈ [x] ∩ [y]. Dann gilt z ∼ x

und z ∼ y. Aus der Transitivität folgt x ∼ y.

Ist umgekehrt x ∼ y, so folgt x ∈ [x] ∩ [y], also [x] ∩ [y] ≠ ∅.

(iii): Es sei x ∼ y. Ist z ∈ [x], so gilt z ∼ x. Aus der Transitivität folgt

z ∼ y, also z ∈ [y]. Also gilt [x] ⊆ [y]. Analog zeigt man [y] ⊆ [x].

Die umgekehrte Richtung ist klar.

✷

Korollar 15.1 Die Menge X ist die disjunkte Vereinigung der Äquivalenzklassen.

Definition Die Menge der Äquivalenzklassen heißt die Quotientenmenge

und wird mit X/ ∼ bezeichnet. Man hat eine kanonische Projektion

π : X −→ X/ ∼

x ↦−→ [x]

.

Wir kehren nun zu dem Beispiel eines Unterraums U ⊆ V in einem K-

Vektorraum V zurück.

Definition

a ∈ V in V .

Die Menge a + U := {a + u | u ∈ U} heißt die Nebenklasse von

Lemma 15.3 Es gilt [a] = a + U bezüglich der Äquivalenzrelation u ∼ v ⇔

u − v ∈ U.

Beweis. x ∈ [a] ⇔ x ∼ a ⇔ x − a ∈ U ⇔ x ∈ a + U.

✷

Definition

Der Quotientenraum V/U ist die Menge

V/U := {a + U | a ∈ V }.

Definition

Wir definieren eine Addition auf V/U durch

(a + U) + (b + U) := (a + b) + U (a, b ∈ V )

und eine skalare Multiplikation durch

λ(a + U) := (λa) + U (λ ∈ K, a ∈ V ).

Lemma 15.4 Diese Verknüpfungen sind wohldefiniert (d.h. unabhängig von

der Wahl der Repräsentanten a und b) und machen V/U zu einem K-Vektorraum.

15 Der Quotientenraum 87

Beweis. Wir zeigen zunächst die Unabhängigkeit von der Wahl der Repräsentanten.

(a) Es sei a ∼ a ′ , b ∼ b ′ . Es ist zu zeigen: (a + b) + U = (a ′ + b ′ ) + U, d.h.

Es gilt

a + b ∼ a ′ + b ′ .

a ∼ a ′ , b ∼ b ′ ⇒ a − a ′ ∈ U, b − b ′ ∈ U ⇒ (a − a ′ ) + (b − b ′ ) ∈ U

⇒ (a + b) − (a ′ + b ′ ) ∈ U ⇒ a + b ∼ a ′ + b ′ .

(b) Die entsprechende Aussage für die skalare Multiplikation zeigt man

analog.

Das Nachrechnen der Vektorraumaxiome für V/U ist einfach, siehe Vorlesung.

Was ist das neutrale Element von V/U? Was ist das additive Inverse

von a + U?

✷

Der Quotientenraum V/U lässt sich folgendermaßen geometrisch deuten:

Es sei W ein Komplement von U in V , d.h.

V = U ⊕ W.

Es sei a + U eine Nebenklasse. Dann gibt es eine eindeutig bestimmte Darstellung

a = a W + a U , a W ∈ W, a U ∈ U.

Es gilt

[a] = a + U = a W + U.

Das Element a W hängt nur von der Äquivalenzklasse ab und ist durch diese

eindeutig bestimmt. Wir können also die Elemente von V/U mit den Elementen

von W identifizieren. Allerdings ist es günstiger mit V/U zu arbeiten, da

das Komplement W nicht eindeutig bestimmt ist.

Satz 15.1 Die Abbildung

π : V −→ V/U

a ↦−→ a + U

ist ein Epimorphismus mit Ker π = U.

Beweis.

(a) Es gilt

π(a + b) = (a + b) + U = (a + U) + (b + U) = π(a) + π(b).

15 Der Quotientenraum 88

Analog zeigt man π(λa) = λπ(a).

(b) Nach Konstruktion ist π surjektiv.

π(a) = 0 ⇔ a + U = 0 + U ⇔ a ∼ 0 ⇔ a − 0 = a ∈ U,

d.h. Ker π = U.

✷

Korollar 15.2 Zu jedem Unterraum U ⊆ V eines K-Vektorraums V gibt es

eine kanonische kurze exakte Sequenz

0 −→ U ↩→ V π

−→ V/U −→ 0.

Korollar 15.3 Es sei U ein Unterraum eines endlich dimensionalen K-

Vektorraums V . Dann gilt

dim U + dim V/U = dim V.

Beweis.

dim V = dim Ker π + dim Im π = dim U + dim V/U.

Wir betrachten nun eine lineare Abbildung f : V → W zwischen K-

Vektorräumen V und W .

Satz 15.2 (Kern-Bild-Satz) Es gibt genau einen Isomorphismus

f : V/ Ker f → Im f,

✷

so dass gilt:

f(a + Ker f) = f(a) für alle a ∈ V.

Beweis. Falls f existiert, muss gelten

f(a + Ker f) = f(a) für alle a ∈ V.

Wir benutzen daher diese Gleichung zur Definition von f.

(a) Die Abbildung f ist wohldefiniert:

a ∼ b ⇒ a − b ∈ Ker f ⇒ f(a − b) = 0 ⇒ f(a) = f(b).

(b) Die Abbildung f ist linear:

f((a + Ker f) + (b + Ker f)) = f((a + b) + Ker f) = f(a + b)

= f(a) + f(b) = f(a + Ker f) + f(b + Ker f).

16 Projektive Räume 89

Der Beweis für die skalare Multiplikation geht analog.

(d) Die Abbildung f ist injektiv:

f(a + Ker f) = 0 ⇔ f(a) = 0 ⇔ a ∈ Ker f ⇔ a + Ker f = 0 + Ker f.

Beispiel 15.2 Es sei V = U ⊕ W und f : V → W die Projektion auf W ,

d.h. f(u + w) = w für alle v = u + w ∈ V mit u ∈ U und w ∈ W . Dann ist

U = Ker f und W = Im f. Dann ist die Abbildung

f : V/U → W, f(u + w + U) = w,

ein Isomorphismus. Dies ist die obige Deutung des Quotientenraums.

16 Projektive Räume

Es sei V ein endlich dimensionaler K-Vektorraum. Wir setzen

V ′ := V \ {0}.

✷

Definition

Für u, v ∈ V ′ definieren wir

u ∼ v :⇔ Es gibt λ ∈ K ∗ = K \ {0} mit u = λv.

Bemerkung 16.1 (i) ∼ ist eine Äquivalenzrelation.

(ii) Es gilt

u ∼ v ⇔ Ku = Kv ⇔ u, v spannen dieselbe Gerade auf.

Definition

Der zu V gehörige projektive Raum ist

P(V ) := V ′ / ∼ .

Als Menge ist P(V ) gerade die Menge der Ursprungsgeraden in V :

P(V ) = {Kv | v ∈ V ′ } = {Geraden in V durch 0}.

Definition

Die Dimension des projektiven Raums P(V ) ist

dim P(V ) := dim V − 1.

Notation Der Raum P n (K) := P(K n+1 ) heißt der n-dimensionale projektive

Raum über K.

16 Projektive Räume 90

✻

❆

❅❅ ❆

❍

✬ ✩

❍

❅ ❆

❍❅❆

❍

❅✟✁ ✁✁✁✁✁

❆ ✟✟✟✟✟

❍

✟❍ ✲

✟

✟✁

❆❅ ❍❍❍❍❍

✟

✟ ✁

❆❆❆❆❆ ❅❅❅❅

✁

Abbildung 10: Die reelle projektive Gerade P 1 (R)

Bemerkung 16.2 Insbesondere ist P({0}) = ∅ und dim ∅ = −1.

Beispiel 16.1 Für die reelle projektive Gerade P 1 (R) gilt:

P 1 (R) = P(R 2 ) = S 1 = R ∪ {∞} = R ∪ P 0 (R).

Die Identifikation S 1 = R ∪ {∞} geschieht über die stereographische Projektion

(Skizze siehe Vorlesung).

Beispiel 16.2 Wir betrachten die reelle projektive Ebene P 2 (R) = P(R 3 ).

Man hat eine Zerlegung

(Näheres siehe Vorlesung).

Definition

Es sei

P 2 (R) = R 2 ∪ P 1 (R)

π : V ′ −→ P(V )

v ↦−→ [v] = Kv

die kanonische Projektion. Ist U ⊆ P(V ) eine Teilmenge, so definieren wir

Ũ := π −1 (U) ∪ {0}.

Eine Teilmenge U ⊆ P(V ) heißt ein projektiver Unterraum von P(V ), falls

Ũ ⊆ V ein Untervektorraum von V ist.

Lemma 16.1 Für einen projektiven Unterraum U gilt U = P(Ũ). Insbesondere

ist U selbst wieder ein projektiver Raum und hat die Dimension

dim U = dim Ũ − 1.

16 Projektive Räume 91

Sprechweise

(i) dim U = −1: ∅

(ii) dim U = 0: Punkt

(iii) dim U = 1: projektive Gerade

(iv) dim U = 2: projektive Ebene

(v) dim U = dim P(V ) − 1: (projektive) Hyperebene.

Es sei nun

V = K n+1 = {(x 0 , x 1 , . . . , x n ) | x i ∈ K, i = 0, 1, . . . , n}.

Definition

Es sei

v = (x 0 , x 1 , . . . , x n ) ≠ 0

(d.h. x i ≠ 0 für ein i).

Den Punkt Kv ∈ P n (K) bezeichnen wir mit (x 0 : x 1 : . . . : x n ). Wir nennen

(x 0 : x 1 : . . . : x n ) die homogenen Koordinaten des Punktes Kv.

Bemerkung 16.3 Es gilt (x 0 : x 1 : . . . : x n ) = (x ′ 0 : x ′ 1 : . . . : x ′ n) genau

dann, wenn es ein λ ∈ K, λ ≠ 0, gibt mit x i = λx ′ i für alle i = 0, 1, . . . , n.

Es sei nun Ũ ⊆ Kn+1 ein Unterraum. Dann ist

homogenen Gleichungssystems

Ũ Lösungsmenge eines

a 10 x 0 +

.

· · · +a 1n x n

.

=

.

0

.

a m0 x 0 + · · · +a mn x n = 0

Mit (x 0 , . . . , x n ) ist auch (λx 0 , . . . , λx n ) für λ ∈ K ∗ eine Lösung dieses Gleichungssystems.

Deswegen kann man schreiben:

}

{(x P(Ũ) = 0 : . . . : x n ) ∈ P n n∑

(K)

a ij x j = 0, i = 1, . . . , m .

∣

j=0

Wir betrachten nun speziell die Gleichung x 0 = 0.

Definition

Die projektive Hyperebene

H ∞ := {(x 0 : . . . : x n ) ∈ P n (K) | x 0 = 0}

heißt die Hyperebene im Unendlichen.

16 Projektive Räume 92

Definition

Die Abbildung

ι : K n −→ P n (K)

(x 1 , . . . , x n ) ↦−→ (1 : x 1 : . . . : x n )

heißt die kanonische Einbettung von K n in den projektiven Raum P n (K).

Diese Abbildung ist injektiv und hat als Bild gerade die Menge

A := P n (K) \ H ∞ .

Denn sei y = (y 0 : . . . : y n ) ∈ A. Dann ist y 0 ≠ 0 und damit

Also ist

(y 0 : y 1 : . . . : y n ) = (1 : y 1

y 0

ι : K n → A

: . . . : yn

y 0

) = ι( y 1

y 0

: . . . : yn

y 0

).

eine Bijektion. Wenn wir K n mit A mittels ι identifizieren, erhalten wir

P n (K) = A ∪ H ∞ = K n ∪ P n−1 (K).

Definition Man nennt A = P n (K) \ H ∞ den affinen Teil von P n (K). Man

sagt, dass sich der projektive Raum P n (K) = A ∪ H ∞ aus dem affinen Teil

A und der Hyperebene im Unendlichen zusammensetzt.

Bemerkung 16.4 Statt der Hyperebene H ∞ = {x 0 = 0} hätte man auch

jede andere Hyperebene als Hyperebene im Unendlichen auswählen können.

Definition Eine Teilmenge W ⊆ K n heißt ein affiner Unterraum des Vektorraums

K n , falls es einen Unterraum W 0 von K n und ein Element a ∈ K n

gibt mit

W = a + W 0 .

Zur Vermeidung von Fallunterscheidungen soll auch die leere Menge ein affiner

Unterraum sein. Die Dimension eines affinen Unterraums W wird als

dim W 0 definiert. Wir definieren dim ∅ := −1.

Beispiel 16.3 Die Lösungsmenge eines linearen Gleichungssystems

a 11 x 1 + · · · +a 1n x n = b 1

.

. . .

a m1 x 1 + · · · +a mn x n = b m

ist ein affiner Unterraum. Umgekehrt ist jeder affine Unterraum W ⊆ K n

Lösungsmenge eines solchen linearen Gleichungssystems.

16 Projektive Räume 93

Lemma 16.2

(i) Es sei W ⊆ P n (K) ein projektiver Unterraum. Dann ist W := W ∩A ⊆

A = K n ein affiner Unterraum.

(ii) Ist ∅ ≠ W ⊆ A = K n ein affiner Unterraum, so gibt es genau einen

projektiven Unterraum W ⊆ P n (K) mit W ∩ A = W .

Beweis. (i) Die Menge ˜W := π −1 (W ) ∪ {0} ist ein linearer Unterraum von

K n+1 , also Lösungsmenge eines homogenen Gleichungssystems

Für einen Punkt

gilt

a 10 y 0 + · · · +a 1n y n = 0

.

. . .

a m0 y 0 + · · · +a mn y n = 0.

y = (y 0 : . . . : y n ) ∉ H ∞ (d.h. y 0 ≠ 0)

a i0 y 0 + · · · + a in y n = 0 ⇔ a i0 + a i1

y 1

y 0

+ · · · + a in

y n

y 0

= 0.

Also ist W ∩ A die Lösungsmenge des Gleichungssystems

a 11 x 1 + · · · +a 1n x n = −a 10

.

. . .

a m1 x 1 + · · · +a mn x n = −a m0 .

Daher ist W ∩ A ein affiner Unterraum.

(ii) Es sei umgekehrt W ⊆ A ein affiner Unterraum. Dann ist W die

Lösungsmenge eines Gleichungssystems

a 11 x 1 + · · · +a 1n x n = b 1

.

. . .

a m1 x 1 + · · · +a mn x n = b m .

Sind (y 0 : . . . : y n ) wieder die homogenen Koordinaten des P n (K), so betrachten

wir das homogene lineare Gleichungssystem

−b 1 y 0 + a 11 y 1 + · · · +a 1n y n = 0

.

. . .

−b m y 0 + a m1 y 1 + · · · +a mn y n = 0.

16 Projektive Räume 94

Dann ist die Lösungsmenge W dieses Gleichungssystems ein projektiver Unterraum

des P n (K) und nach Konstruktion gilt W ∩ A = W .

Wir müssen noch die Eindeutigkeit zeigen. Es sei U ein weiterer projektiver

Unterraum mit U ∩ A = W . Wir setzen

Dann gilt

W ∞ := W ∩ H ∞ , U ∞ := U ∩ H ∞ .

π −1 (W ) = π −1 (W − W ∞ ) = π −1 (U − U ∞ ) ≠ ∅.

Da das mengentheoretische Komplement eines echten Unterraums den ganzen

Vektorraum erzeugt, gilt

˜

W = Span(π −1 (W − W ∞ )) = Span(π −1 (U − U ∞ )) = Ũ.

Daraus folgt W = U.

Lemma 16.3 Der Durchschnitt von zwei projektiven Unterräumen U 1 und

U 2 ist wieder ein projektiver Unterraum.

✷

Beweis. Es sei

Dann gilt

U 1 = P(Ũ1),

U 2 = P(Ũ2).

U 1 ∩ U 2 = P(Ũ1 ∩ Ũ2).

✷

Definition Es seien U 1 , . . . , U r ⊆ P(V ) projektive Unterräume. Dann ist

der Spann von U 1 , . . . , U r , in Zeichen U 1 ∨ . . . ∨ U r , der kleinste projektive

Unterraum von P(V ), der U 1 , . . . , U r enthält.

Bemerkung 16.5 Es gilt

U 1 ∨ . . . ∨ U r = P(Ũ1 + · · · + Ũr).

Lemma 16.4 (Dimensionsformel) Es seien U 1 , U 2 ⊆ P(V ) projektive Unterräume.

Dann gilt

dim U 1 + dim U 2 = dim(U 1 ∨ U 2 ) + dim(U 1 ∩ U 2 ).

Beweis. Es sei U i = P(Ũi), i = 1, 2. Dann gilt

dim U 1 + dim U 2 = dim Ũ1 − 1 + dim Ũ2 − 1

= dim(Ũ1 + Ũ2) − 1 + dim(Ũ1 ∩ Ũ2) − 1

= dim(U 1 ∨ U 2 ) + dim(U 1 ∩ U 2 ).

✷

16 Projektive Räume 95

Beispiel 16.4 Wir betrachten die projektive Ebene P 2 (K). Es seien L 1 , L 2 ⊆

P 2 (K) zwei projektive Geraden. Dann gilt

dim(L 1 ∩ L 2 ) = dim L 1 + dim L 2 − dim(L 1 ∨ L 2 ) ≥ 2 − 2 = 0.

Daraus folgt L 1 ∩ L 2 ≠ ∅, d.h. in einer projektiven Ebene schneiden sich je

zwei Geraden stets. Sind L 1 und L 2 verschieden, so ist der Durchschnitt genau

ein Punkt. Liegt dieser Punkt in H ∞ , so sind L 1 = L 1 ∩ A und L 2 := L 2 ∩ A

zwei parallele affine Geraden.

Nun wollen wir auch Abbildungen von projektiven Räumen betrachten.

Es seien V, W endlich dimensionale K-Vektorräume und P(V ), P(W ) die zugehörigen

projektiven Räume. Es sei F : V → W eine injektive lineare

Abbildung. Dann gilt für v ∈ V , v ≠ 0,

F (Kv) = KF (v) ≠ {0}.

Daher induziert F eine injektive Abbildung

F : P(V ) −→ P(W )

Kv ↦−→ KF v .

Definition

Eine Abbildung

f : P(V ) → P(W )

heißt projektiv, falls es eine injektive lineare Abbildung F : V → W gibt mit

F = f. Eine bijektive projektive Abbildung heißt Projektivität.

Beispiel 16.5 Für m ≥ n haben wir eine kanonische Einbettung

J : P n (K) −→ P m (K)

(x 0 : . . . : x n ) ↦−→ (x 0 : . . . : x n : 0 : . . . : 0) .

Sie entsteht aus der linearen Abbildung

J : K n+1 −→ K m+1

(x 0 , . . . , x n ) ↦−→ (x 0 , . . . , x n , 0, . . . , 0) .

Lemma 16.5 Für zwei injektive lineare Abbildungen F, F ′

F = F ′ genau dann, wenn es ein λ ∈ K ∗ gibt mit F ′ = λF .

: V → W gilt

Beweis. Ist F ′ = λF , so gilt offensichtlich F ′ = F . Es bleibt die Umkehrung

zu zeigen: Ist F = F ′ , so gibt es zu jedem v ∈ V ein λ v ∈ K ∗ mit F ′ (v) =

λ v F (v). Es ist zu zeigen, dass man zu jedem v das gleiche λ v wählen kann.

16 Projektive Räume 96

Für dim V ≤ 1 ist das klar. Andernfalls gibt es linear unabhängige v, w ∈ V .

Dann gibt es λ v , λ w , λ v+w ∈ K ∗ mit

F ′ (v) = λ v F (v), F ′ (w) = λ w F (w), F ′ (v + w) = λ v+w F (v + w).

Aus der Linearität von F und F ′ folgt

(λ v − λ v+w )F (v) + (λ w − λ v+w )F (w) = 0.

Da F injektiv ist, sind auch F (v), F (w) linear unabhängig. Also folgt

λ v = λ v+w = λ w .

Um projektive Abbildungen durch Matrizen zu beschreiben, führen wir

Koordinatensysteme ein. Es sei dim V = n + 1, also dim P(V ) = n.

✷

Definition

Die Punkte P 0 , . . . , P k ∈ P(V ) heißen projektiv unabhängig, falls

dim(P 0 ∨ . . . ∨ P k ) = k

gilt.

Bemerkung 16.6 Es sei P i = Kv i , i = 0, . . . , k. Dann gilt

P 0 , . . . , P k projektiv unabhängig ⇔ v 0 , . . . , v k linear unabhängig.

Definition Ein (n + 2)-Tupel (P 0 , . . . , P n+1 ) von Punkten aus P(V ) heißt

projektive Basis, falls je n + 1 Punkte davon projektiv unabhängig sind.

Lemma 16.6 Es sei (P 0 , . . . , P n+1 ) eine projektive Basis. Dann gibt es eine

Basis (v 0 , . . . , v n ) von V mit

(i) P i = Kv i (i = 0, . . . , n).

(ii) P n+1 = K(v 0 + · · · + v n ).

Die Basis (v 0 , . . . , v n ) ist bis auf einen Skalar eindeutig bestimmt.

Beweis. Da P 0 , . . . , P n projektiv unabhängig sind, gibt es eine Basis (w 0 , . . . , w n )

von V mit

P 0 = Kw 0 , . . . , P n = Kw n .

Weiter gibt es λ 0 , . . . , λ n ∈ K mit

P n+1 = K(λ 0 w 0 + · · · + λ n w n ).

16 Projektive Räume 97

Wäre λ 0 = 0, so wären P 1 , . . . , P n+1 nicht projektiv unabhängig. Also ist

λ 0 ≠ 0 und analog λ 1 ≠ 0, . . . , λ n ≠ 0. Daher ist durch

die gesuchte Basis gegeben.

v 0 := λ 0 w 0 , . . . , v n := λ n w n

Es sei nun (P 0 , . . . , P n+1 ) eine projektive Basis und B = (v 0 , . . . , v n ) eine

zugehörige Basis, die bis auf einen Skalar eindeutig bestimmt ist. Es sei P =

Kv ∈ P(V ). Dann ist v auch bis auf einen Skalar eindeutig festgelegt. Wir

ordnen dem Punkt P den Koordinatenvektor (x 0 , . . . , x n ) von v bezüglich

der Basis B zu. Er ist damit bis auf einen Skalar festgelegt.

Definition Das Element (x 0 : . . . : x n ) ∈ P n (K) heißt der homogene Koordinatenvektor

des Punktes P bezüglich der projektiven Basis (P 0 , . . . , P n ).

✷

Notation

Wir schreiben P = (x 0 : . . . : x n ). Damit gilt:

P 0 = (1 : 0 : . . . : 0 : 0)

.

P n = (0 : 0 : . . . : 0 : 1)

P n+1 = (1 : 1 : . . . : 1 : 1).

Durch die Einführung von Koordinaten reduziert sich das Studium der

Projektivitäten beliebiger projektiver Räume auf das Studium von Projektivitäten

des P n (K). Es sei

f : P n (K) → P n (K)

eine Projektivität. Dann gibt es einen Isomorphismus

F : K n+1 → K n+1 mit F = f.

Die lineare Abbildung F wird durch eine Matrix A ∈ GL(n + 1; K) gegeben,

wobei F und somit auch A bis auf einen Skalar λ ≠ 0 festgelegt sind.

Wir untersuchen nun den Zusammenhang zwischen Affinitäten und Projektivitäten.

Es sei

f a : K n → K n , x ↦→ Ax + b (A ∈ GL(n; K)),

eine Affinität. Dann betrachten wir die kanonische Einbettung

ι : K n −→ P n (K)

(x 1 , . . . , x n ) ↦−→ (1 : x 1 : . . . : x n )

16 Projektive Räume 98

von K n in den P n (K). Setzen wir

⎛

1 0 · · · 0

b 1

A = ⎜

⎝ . A

b n

so ist durch

⎛

⎜

⎝

⎞ ⎛

x 0

⎟ ⎜

. ⎠ ↦→ A ⎝

x n

⎞

x 0

⎟

. ⎠

x n

eine bijektive lineare Abbildung F a : K n+1 → K n+1 bestimmt, die eine Projektivität

F a : P n (K) → P n (K) induziert. Es gilt F a (H ∞ ) = H ∞ . Damit

haben wir eine Motivation für die Konstruktion in § 10 nachgeliefert.

Es sei nun umgekehrt f : P n (K) → P n (K) eine Projektivität mit f(H ∞ ) =

H ∞ . Eine zugehörige lineare Abbildung F : K n+1 → K n+1 sei gegeben durch

die Matrix A ∈ GL(n + 1; K) mit

⎛

⎞

a 00 a 01 · · · a 0n

a 10 a 11 · · · a 1n

A = ⎜

⎝

.

. . ..

⎟ . ⎠ .

a n0 a n1 · · · a nn

⎞

⎟

⎠ ,

Wegen f(H ∞ ) = H ∞ muss gelten

⎛

⎞

a 00 0 · · · 0

a 10 a 11 · · · a 1n

A = ⎜

⎝

.

. . ..

⎟ . ⎠ .

a n0 a n1 · · · a nn

Wegen A ∈ GL(n+1; K) ist a 00 ≠ 0. Da A nur bis auf einen Skalar eindeutig

festgelegt ist, kann man annehmen dass

⎛

⎞

1 0 · · · 0

a 10

A = ⎜

⎟

⎝ . A ⎠

a n0

für eine Matrix A ∈ GL(n; K). Es gilt daher

⎛

⎞ ⎛ ⎞ ⎛

1 0 · · · 0 1

a 10

x 1

⎜

⎟ ⎜ ⎟

⎝ . A ⎠ ⎝ . ⎠ = ⎜

⎝

x n

a n0

1

x ′ 1

.

x ′ n

⎞

⎟

⎠ .

17 Projektive Quadriken 99

Das bedeutet, dass f a := f| K n : K n → K n eine Affinität ist, die durch

⎛ ⎞ ⎛ ⎞ ⎛ ⎞

x 1 x 1 a 10

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

f a ⎝ . ⎠ = A ⎝ . ⎠ + ⎝ . ⎠

x n x n a n0

gegeben wird.

Wir haben damit bewiesen:

Satz 16.1 Ist f a : K n → K n eine Affinität, so gibt es eine Projektivität

f : P n (K) → P n (K) mit f| K n = f a und f(H ∞ ) = H ∞ .

Ist umgekehrt f : P n (K) → P n (K) eine Projektivität mit f(H ∞ ) = H ∞ ,

dann ist f a := f| K n : K n → K n eine Affinität.

17 Projektive Quadriken

Wir wollen nun Quadriken in projektiven Räumen betrachten.

Es sei K ein Körper mit n K ≠ 0 für n = 2.

Definition Unter einem homogenen Polynom zweiten Grades in den Unbestimmten

x 0 , x 1 , . . . , x n versteht man einen Ausdruck der Form

q(x 0 , . . . , x n ) =

∑

α ij x i x j ,

wobei α ij ∈ K für 0 ≤ i ≤ j ≤ n.

0≤i≤j≤n

Definition Eine Teilmenge C ⊆ K n+1 heißt Kegel, wenn für jedes

(x 0 , . . . , x n ) ∈ C und λ ∈ K auch (λx 0 , . . . , λx n ) ∈ C ist.

Dies bedeutet, dass C die Vereinigung von Geraden durch den Ursprung

ist. Eine Gerade durch den Ursprung von K n+1 ist ein Punkt von P n (K).

Für jedes homogene Polynom zweiten Grades q ist die Menge

ein Kegel. Dies folgt aus

C = {(x 0 , . . . , x n ) ∈ K n+1 | q(x 0 , . . . , x n ) = 0}

q(λx 0 , . . . , λx n ) = λ 2 q(x 0 , . . . , x n ) für λ ∈ K.

Definition Eine Teilmenge Q ⊆ P n (K) heißt (projektive) Quadrik (oder

(projektive) Hyperfläche zweiter Ordnung), wenn es ein homogenes Polynom

zweiten Grades q gibt, so dass

Q = {(x 0 : . . . : x n ) ∈ P n (K) | q(x 0 , . . . , x n ) = 0}.

17 Projektive Quadriken 100

Bemerkung 17.1 Man beachte, dass im Gegensatz zum affinen Fall das

Polynom q keine Funktion auf dem P n (K) definiert, denn für λ ∈ K ∗ gilt

(x 0 : . . . : x n ) = (λx 0 : . . . : λx n ), aber

q(λx 0 , . . . , λx n ) = λ 2 q(x 0 , . . . , x n ).

Aber die Nullstellenmenge von q in P n (K) ist wohldefiniert, denn es gilt für

λ ∈ K ∗ :

q(x 0 , . . . , x n ) = 0 ⇔ q(λx 0 , . . . , λx n ) = 0.

Beispiel 17.1 Es sei K = R und n = 2.

(1) Es sei q(x 0 , x 1 , x 2 ) = x 2 0 + x 2 1 − x 2 2. Dann ist

ein Kegel und

C = {(x 0 , x 1 , x 2 ) ∈ R 3 | x 2 0 + x 2 1 − x 2 2 = 0}

Q = {(x 0 : x 1 : x 2 ) ∈ P 2 (R) | x 2 0 + x 2 1 − x 2 2 = 0}

die Menge der in C liegenden Geraden durch den Ursprung. Um uns ein Bild

von Q zu beschaffen, betrachten wir den affinen Teil, wobei wir eine geeignete

Hyperebene H ∞ im Unendlichen entfernen.

(a) Es sei H ∞ := {(x 0 : x 1 : x 2 ) ∈ P 2 (R) | x 0 = 0}. Auf R 2 = P 2 (R) \ H ∞

erhalten wir die Gleichung

1 + x 2 1 − x 2 2 = 0.

Diese Gleichung definiert eine Hyperbel. Sie entsteht als Schnitt des Kegels

C mit der Ebene x 0 = 1.

Abbildung 11: Schnitt von C mit der Ebene x 0 = 1

17 Projektive Quadriken 101

(b) Es sei H ∞ := {(x 0 : x 1 : x 2 ) ∈ P 2 (R) | x 2 = 0}. Dann erhalten wir auf

R 2 = P 2 (R) \ H ∞ die Gleichung

x 2 0 + x 2 1 − 1 = 0.

Diese Gleichung definiert einen Kreis. Er entsteht als Schnitt des Kegels C

mit der Ebene x 2 = 1. Wählt man als Hyperebene im Unendlichen H ∞ :=

{(x 0 : x 1 : x 2 ) ∈ P 2 (R) | 1 2 x 0 + x 2 = 0}, so kann man leicht zeigen, dass man

im affinen Teil eine Ellipse erhält.

Abbildung 12: Schnitt von C mit der Ebene 1 2 x 0 + x 2 = 1

auf R 2 = P 2 (R) \ H ∞ die Gleichung

(1 − x 2 ) 2 + x 2 1 − x 2 2 = 0 ⇔ x 2 1 − 2x 2 = −1.

Das ist eine Parabel. Sie entsteht als Schnitt des Kegels C mit der Ebene

x 0 + x 2 = 1.

(2) Es sei q(x 0 , x 1 , x 2 ) = x 2 0 − x 2 1. Dann gilt

q(x 0 , x 1 , x 2 ) = x 2 0 − x 2 1 = (x 0 − x 1 )(x 0 + x 1 ).

Damit besteht Q aus zwei Geraden.

Wir wollen die Gleichung für eine Quadrik wieder durch Matrizen ausdrücken.

Gegeben sei ein quadratisches Polynom

q(x 0 , . . . , x n ) =

∑

α ij x i x j .

Dann setzen wir

0≤i≤j≤n

⎧

⎨ α ij für i = j,

1

a ij :=

⎩

α 2 ij für i < j,

1

α 2 ji für i > j,

17 Projektive Quadriken 102

Abbildung 13: Schnitt von C mit der Ebene x 0 + x 2 = 1

wobei jeweils 0 ≤ i, j ≤ n, und A := (a ij ) ∈ Mat(n + 1, n + 1; K). Dann ist

A eine symmetrische Matrix und es gilt für x ∈ K n+1

q(x) = x T Ax.

Wir haben gesehen, dass affine Quadriken unter Affinitäten invariant bleiben.

Das Gleiche gilt auch für projektive Quadriken unter Projektivitäten.

Satz 17.1 Ist Q ⊆ P n (K) eine Quadrik und f : P n (K) → P n (K) eine

Projektivität, so ist auch f(Q) ⊆ P n (K) eine Quadrik.

Beweis. Es sei Q gegeben durch

x T Ax = 0,

A ∈ Mat(n + 1, n + 1; K),

und die zu f : P n (K) → P n (K) gehörige lineare Abbildung F : K n+1 → K n+1

sei gegeben durch

y = Sx, S ∈ GL(n + 1; K).

Es sei C der Kegel

C := {x ∈ K n+1 | x T Ax = 0}.

Dann gilt für y = (y 0 , . . . , y n ) T ∈ K n+1 und T := S −1

y = Sx ∈ F (C) ⇔ x = T y ∈ C

⇔ 0 = x T Ax = (T y) T A(T y) = y T (T T AT )y.

Die Matrix B := T T AT ist wieder symmetrisch und es gilt

f(Q) = {(y 0 : . . . : y n ) ∈ P n (K) | y t By = 0}.

✷

17 Projektive Quadriken 103

Definition Zwei Quadriken Q, Q ′ ⊆ P n (K) heißen (projektiv) äquivalent,

falls es eine Projektivität f : P n (K) → P n (K) gibt mit f(Q) = Q ′ .

Beispiel 17.2 Die beiden Quadriken

Q = {(x 0 , x 1 , x 2 ) ∈ P 2 (R) | x 2 0 + x 2 1 − x 2 2 = 0} und

Q ′ = {(x 0 , x 1 , x 2 ) ∈ P 2 (R) | x 2 0 − x 2 1 = 0}

sind nicht äquivalent, da Q ′ aus zwei Geraden besteht, aber Q keine Gerade

enthält.

Wir kommen nun zur Klassifikation der projektiven Quadriken über dem

Körper K = R. Dazu erinnern wir an die Definition der Signatur einer symmetrischen

Matrix A mit Einträgen in R:

Sign A = ♯{positive Eigenwerte} − ♯{negative Eigenwerte}.

Theorem 17.1 (Projektive Klassifikation von Quadriken) Jede Quadrik

Q ⊆ P n (R) ist äquivalent zu genau einer der folgenden Quadriken:

Q k,m = {(x 0 : . . . : x n ) ∈ P n (R) | x 2 0 + . . . + x 2 k − x 2 k+1 − . . . − x 2 m = 0}

mit −1 ≤ k ≤ m ≤ n und k+1 ≥ m−k. Insbesondere gilt für zwei Quadriken

Q = {x T Ax = 0} und Q ′ = {x T A ′ x = 0}:

Q und Q ′ sind äquivalent ⇔ Rang A = Rang A ′ , |Sign A| = |Sign A ′ |.

Um diesen Satz zu beweisen, brauchen wir noch einen Hilfssatz.

Lemma 17.1 Es seien q(x) = x T Ax und q ′ (x) = x T A ′ x quadratische Formen

auf V = R n+1 . Es gelte

Gibt es ein v 0 ∈ C, so dass

C := {x ∈ V | q(x) = 0} = {x ∈ V | q ′ (x) = 0}.

so gilt A ′ = ρ · A für ein ρ ∈ R ∗ .

v T 0 Aw ≠ 0 für mindestens ein w ∈ V, (1)

Beweis. Es seien b(x, y) := x T Ay bzw. b ′ (x, y) = x T A ′ y die zu q bzw. q ′

gehörigen symmetrischen Bilinearformen. Wir wählen ein festes v 0 ∈ C mit

der Eigenschaft (1) und betrachten für jedes w ∈ V die Gerade

g w := {w + λv 0 | λ ∈ R}.

17 Projektive Quadriken 104

Ihre Schnittpunkte mit C sind bestimmt durch die Gleichungen

oder (wegen q(v 0 ) = q ′ (v 0 ) = 0)

q(w + λv 0 ) = 0 bzw. q ′ (w + λv 0 ) = 0,

2λb(v 0 , w) + q(w) = 0 bzw. 2λb ′ (v 0 , w) + q ′ (w) = 0. (2)

Dass diese Gerade den Kegel C nicht in genau einem Punkt schneidet, ist

gleichwertig mit

b(v 0 , w) = 0 bzw. b ′ (v 0 , w) = 0.

Also gilt für alle w ∈ V

b(v 0 , w) = 0 ⇔ b ′ (v 0 , w) = 0.

Wegen der Bedingung (1) ist die Menge

H := {w ∈ V | b(v 0 , w) = 0}

eine Hyperebene in V . Da sie gleich der Menge

ist, muss es ein ρ ∈ R ∗ geben mit

Aus Gleichung (2) folgt

Daraus ergibt sich

Die Funktion

H ′ = {w ∈ V | b ′ (v 0 , w) = 0}

b ′ (v 0 , w) = ρ · b(v 0 , w) für alle w ∈ V.

b(v 0 , w) · q ′ (w) = b ′ (v 0 , w) · q(w) für alle w ∈ V.

q ′ (w) = ρ · q(w) für alle w ∈ V \ H.

f : V −→ R

w ↦−→ q ′ (w) − ρ · q(w)

verschwindet auf V \ H. Da sie außerdem stetig ist, verschwindet sie auch

auf H. Damit gilt

Daraus folgt durch Polarisierung

q ′ (w) = ρ · q(w) für alle w ∈ V.

b ′ (v, w) = ρ · b(v, w)

für alle v, w ∈ V

17 Projektive Quadriken 105

und damit

Beweis von Theorem 17.1. Es sei

A ′ = ρA.

✷

Q = {(x 0 : . . . : x n ) ∈ P n (R) | x T Ax = 0}, A ∈ Mat(n + 1, n + 1; R), A = A T .

Nach Satz 5.1 gibt es ein S ∈ GL(n + 1; R) mit

⎛

E k+1

⎞

0

S T AS = ⎝ −E l

⎠ =: A k,m , k + l = m.

0 0

Da

x T Ax = 0 ⇔ x T (−A)x = 0,

können wir annehmen, dass k + 1 ≥ m − k ist. Also ist Q äquivalent zu

Q k,m = {(x 0 : . . . : x n ) ∈ P n (R) | x T A k,m x = 0}.

Aus dem Trägheitssatz von Sylvester folgt auch die Implikation ”⇐” der

zweiten Aussage des Theorems.

Nun beweisen wir die Richtung ”⇒” der zweiten Aussage. Dazu seien

Q = {x T Ax = 0} und Q ′ = {x T A ′ x = 0} äquivalent. O. B. d. A. können

wir annehmen, dass Q = Q k,m und A = A k,m gilt. Nach Voraussetzung gibt

es eine Projektivität f : P n (R) → P n (R) mit f(Q) = Q ′ , d.h. es gibt eine

Matrix T ∈ GL(n + 1; R), so dass Q auch durch die Bilinearform mit der

Matrix

B := T T A ′ T

beschrieben wird. Nun wollen wir Lemma 17.1 anwenden. Dazu müssen wir

nachprüfen, wann die Bedingung (1) für A k,m erfüllt ist. Diese Bedingung ist

aber erfüllt, wenn k < m ist. Denn dann gilt: Bezeichnen wir mit (e 0 , . . . , e n )

die Standardbasis von R n+1 , so sind v 0 := e 0 + e m und w := e 0 Vektoren mit

v T 0 A k,m v 0 = 0, aber v T 0 A k,m w = 1 ≠ 0.

Aus Lemma 17.1 folgt damit B := ρ · A k,m für ein ρ ∈ R ∗ . Aus dem

Trägheitssatz von Sylvester (Satz 5.2) folgt dann die Behauptung.

Es bleibt noch der Fall k = m zu behandeln. Dann ist Q ein linearer

projektiver Unterraum der Dimension n−(m+1), also auch Q ′ . Daraus folgt

aber

Rang A ′ = Rang A m,m = |Sign A ′ | = |Sign A m,m | = m + 1.

17 Projektive Quadriken 106

Rang |Sign| Gleichung Beschreibung

0 0 0 = 0 P 2 (R)

1 1 x 2 0 = 0 (Doppel-)Gerade

2 2 x 2 0 + x 2 1 = 0 Punkt

2 0 x 2 0 − x 2 1 = 0 Geradenpaar

3 3 x 2 0 + x 2 1 + x 2 2 = 0 leere Quadrik

3 1 x 2 0 + x 2 1 − x 2 2 = 0 nicht ausgeartete Quadrik

Tabelle 4: Normalformen von Quadriken im P 2 (R)

Rang |Sign| Gleichung Beschreibung

0 0 0 = 0 P 3 (R)

1 1 x 2 0 = 0 (Doppel-)Ebene

2 2 x 2 0 + x 2 1 = 0 Gerade

2 0 x 2 0 − x 2 1 = 0 Ebenenpaar

3 3 x 2 0 + x 2 1 + x 2 2 = 0 Punkt

3 1 x 2 0 + x 2 1 − x 2 2 = 0 Kegel

4 4 x 2 0 + x 2 1 + x 2 2 + x 2 3 = 0 leere Quadrik

4 2 x 2 0 + x 2 1 + x 2 2 − x 2 3 = 0 Ovalfläche

4 0 x 2 0 + x 2 1 − x 2 2 − x 2 3 = 0 Regelfläche

Tabelle 5: Normalformen von Quadriken im P 3 (R)

Aus diesem Beweis folgt auch, dass zwei Quadriken Q k,m für unterschiedliche

k und m mit k + 1 ≥ m − k nicht äquivalent sind.

✷

Speziell für n = 2, 3 erhalten wir die Tabellen 4 und 5.

Beispiel 17.3 Es sei K = R und n = 3.

(1) Wir betrachten die nicht ausgeartete Quadrik

Q := {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 2 0 + x 2 1 + x 2 2 − x 2 3 = 0}.

(a) Es sei H ∞ := {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 3 = 0}. Dann ist

Q ∩ A = {(x 0 , x 1 , x 2 ) ∈ R 3 | x 2 0 + x 2 1 + x 2 2 = 1}

eine Kugel und es gilt Q ∩ H ∞ = ∅.

(b) Es sei H ∞ := {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 0 = 0}. Dann ist

Q ∩ A = {(x 1 , x 2 , x 3 ) ∈ R 3 | x 2 3 − x 2 1 − x 2 2 = 1}

17 Projektive Quadriken 107

ein zweischaliges Hyperboloid (Bild 7) und es gilt

Q ∩ H ∞ = {(x 1 : x 2 : x 3 ) ∈ P 2 (R) | x 2 1 + x 2 2 − x 2 3 = 0},

eine nicht ausgeartete Quadrik in der projektiven Ebene.

Q ∩ A = {(x 0 , x 1 , x 2 ) ∈ R 3 | x 2 0 + x 2 1 + x 2 2 − (1 − x 2 ) 2 = 0}

= {(x 0 , x 1 , x 2 ) ∈ R 3 | x 2 0 + x 2 1 + 2x 2 = 1}

ein elliptisches Paraboloid (Bild 8) und es gilt

Q ∩ H ∞ = {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 3 = −x 2 , x 2 0 + x 2 1 = 0}

= {(0 : 0 : 1 : −1)}.

(2) Nun betrachten wir die nicht ausgeartete Quadrik

Q := {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 2 0 + x 2 1 − x 2 2 − x 2 3 = 0}.

(a) Es sei H ∞ := {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 3 = 0}. Dann ist

Q ∩ A = {(x 0 , x 1 , x 2 ) ∈ R 3 | x 2 0 + x 2 1 − x 2 2 = 1}.

Dies ist ein einschaliges Hyperboloid (Bild 6). Es enthält Geraden und daher

nennt man eine solche Quadrik eine Regelfläche. Tatsächlich ist Q die

Vereinigung von Geraden (Fadenmodell des einschaligen Hyperboloids, siehe

Vorlesung). Der Schnitt mit der Hyperebene H ∞ ist eine nicht ausgeartete

ebene Quadrik (”Kreis”)

Q ∩ H ∞ = {(x 0 : x 1 : x 2 ) ∈ P 2 (R) | x 2 0 + x 2 1 − x 2 2 = 0}.

(b) Es sei H ∞ := {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 1 + x 2 = 0}. Dann ist

Q ∩ A = {(x 0 , x 1 , x 3 ) ∈ R 3 | x 2 0 − x 2 3 + 2x 1 = 1}.

Dies ist ein hyperbolisches Paraboloid (Bild 9). Es enthält ebenfalls Geraden.

Sein Durchschnitt mit H ∞ ist ein Paar von Geraden

Q ∩ H ∞ = {(x 0 : x 1 : x 2 : x 3 ) ∈ P 3 (R) | x 2 = −x 1 , x 2 0 − x 2 3 = 0}.

Damit haben wir alle interessanten Quadriken im R 3 aus §10 als geeignete

affine Teile von projektiven Quadriken im P 3 (R) zurückerhalten.

INHALTSVERZEICHNIS 108

Inhaltsverzeichnis

1 Summen von Vektorräumen 3

2 Normierte Vektorräume 10

3 Normalform orthogonaler und unitärer Endomorphismen 12

4 Normalform selbstadjungierter Endomorphismen 17

5 Symmetrische Bilinearformen 18

6 Das Minimalpolynom 23

7 Diagonalisierbarkeit 34

8 Nilpotente Endomorphismen 37

9 Die Jordansche Normalform 43

10 Affine Quadriken 51

11 Der Dualraum 66

12 Multilineare Abbildungen 73

13 Alternierende Multilinearformen 76

14 Symmetrische Multilinearformen 82

15 Der Quotientenraum 84

16 Projektive Räume 89

17 Projektive Quadriken 99

Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ...

Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ... ... Mehr anzeigen Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ...

Template löschen?

Als Template speichern ?

Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ... Lineare Algebra II - Institut fÃ¼r Algebraische Geometrie - Leibniz ...