Differentialrechnung im Rn

KAPITEL 3 

Differentialrechnung für Funktionen mehrerer Veränderlicher 

1. Reellwertige Funktionen mehrerer reeller Veränderlicher 

1.1. Beschreibung von Funktionen mehrerer Veränderlicher. 

Definition 3.1. Unter einer reellen Funktion von n reellen Veranderlichen 

versteht man eine auf einer Teilmenge D ⊆ R n erklarte Funktion f : D → R 

mit Werten in R. 

Sie ordnet jedem Vektor ⃗x = (x 1 , x 2 , . . . , x n ) T ∈ D des Denitionsbereiches in 

eindeutiger Weise eine reelle Zahl y = f(⃗x) = f(x 1 , x 2 , . . . , x n ). Fur Funktionen in 2 

oder 3 Veranderlichen schreibt man ublicherweise f(x, y) bzw. f(x, y, z). 

Die Zuordnung ⃗x → f(x 1 , x 2 , . . . , x n ) kann gegeben sein 

(1) durch eine explizite Rechenvorschrift: 

f(x, y) = 3xy + 2x + 5y − 7, 

z 

x 

y 

z= sin x2 y 2 

x 2 y 2 

(2) durch eine implizite Vorschrift: z = f(x, y) mit 

x 2 + y 2 + z 2 = 1, 

(3) durch Dierential- oder Intergralgleichungen. 

Als besonders vorteilhaft zur Diskussion einer Funktion f : R n ⊇ D → R erweisen 

sich bestimmte " 

Hilfsfunktionen\ zu betrachten, dies sind: 

42

1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 43 

(1) die Niveaumengen oder Niveauhyperachen von f zum konstanten Niveau 

c ∈ R : 

z 

N c := {⃗x ∈ D : f(⃗x) = c}. 

{(x,y,c): c=f(x,y)} 

(x,y,f(x,y)) 

ɛ 

{(x,y,z): z=f(x,y)} 

y 

(x,y) ɛ 

D 

N c 

={(x,y): f(x,y)=c} 

x 

(2) die " 

partiellen\ Funktionen von f : 

x i ↦→ f(a 1 , a 2 , . . . , a i−1 , x i , a i+1 , . . . , a n ) 

mit ⃗a = (a 1 , . . . , a n ) ∈ D konstant, 

(3) der Graph der Funktion 

Γ f := {(⃗x, f(⃗x); ⃗x ∈ D} ⊆ R n+1 . 

Er besteht aus allen Punkten (x 1 , . . . , x n , x n+1 ) mit x n+1 = f(x 1 , . . . , x n ) 

und kann somit als Niveauhyperache der Funktion 

F (x 1 , . . . , x n , x n+1 ) = x n+1 − f(x 1 , . . . , x n ) 

zum Niveau 0 angesehen werden. 

Wir nennen F (x 1 , . . . , x n , x n+1 ) = 0 die implizite und x n+1 = f(x 1 , . . . , x n ) 

die explizite Darstellung des Graphen Γ f . 

Beispiel 3.1. Die Gerade 2x + 3y = 5 ist die Niveaukurve der Funktion 

f(x, y) = 2x + 3y zum Niveau c = 5. Die explizite Darstellung lautet y = − 2 3 x + 5 3 . 

Beispiel 3.2. Jeder Graph y = h(x) einer (stetigen) Funktion einer Variablen 

x kann als Niveaukurve F (x, y) = y − f(x) = 0 einer Funktion zweier Veranderlicher 

angesehen werden.


Beispiel 3.3. Fur n = 2 wird der Graph Γ f als Flache im R 3 veranschaulicht. 

D ist die Teilmenge der (x, y)-Ebene und uber (x, y) ∈ D liegt der Flachenpunkt 

(x, y, z) mit z = f(x, y). 

Die Graphen der " 

partiellen\ Funktionen z = f(a 1 , y) und z = f(x, a 2 ) entstehen 

durch Schnitt des Graphen Γ f mit den zur z-Achse parallelen Ebenen x = a 1 und 

y = a 2 . 

Uber der Niveaulinie f(x, y) = c in D liegen alle Punkte von Γ f mit derselben 

Hohe\ z = c. Sie ist die senkrechte Projektion der Schnittkurve der Flache z = 

" 

f(x, y) mit der Ebene z = c in der (x, y)-Ebene (Hohenlinien einer Landkarte). 

1.2. Grenzwerte und Stetigkeit. Begrie der anschaulichen Geometrie werden 

fur beliebige n ∈ N ubernommen. So wird der Abstand zweier Punkte ⃗x, ⃗y ∈ R n 

deniert durch 

∑ 

|⃗x − ⃗y| = √ n (x i − y i ) 2 . 

Zu jedem festen ⃗a ∈ R n und r > 0 heit die Punktmenge 

r-Umgebung von ⃗a. 

i=1 

U r (⃗a) := {⃗x ∈ R n : |⃗x − ⃗a| < r} 

Beispiel 3.4. Fur n = 1 ist U r (a) das oene Intervall a − r < x < a + r. 

Fur n = 2 besteht U r (⃗a) aus allen Punkten der Kreisscheibe mit dem Mittelpunkt 

⃗a und dem Radius r ohne Randpunkte. 

Fur n = 3 ist U r (⃗a) eine Kugel mit dem Radius r um ⃗a ohne die Punkte der 

Kugeloberache. 

Definition 3.2. Sei D eine Teilmenge des R n . 

(1) Ein Punkt ⃗a ∈ D heit innerer Punkt von D, wenn es eine r- 

Umgebung von ⃗a gibt, die ganz in D enthalten ist. 

(2) D heit offen, wenn jeder Punkt von D ein innerer Punkt ist. 

(3) Ein Punkt ⃗ b ∈ R n heit Randpunkt von D, wenn jede r-Umgebung 

von ⃗ b sowohl mindestens einen Punkt aus D als auch mindestens 

einen nicht zu D gehorenden Punkt enthalt. Die Menge aller Randpunkte 

von D heit Rand von D und wird mit ∂D bezeichnet. 

(4) Eine Menge heit abgeschlossen, wenn sie alle ihre Randpunkte 

enthalt.


Definition 3.3. Sei f : R n ⊇ D → R und ⃗a ∈ D ∩ ∂D. 

(1) f hat den Grenzwert c ∈ R, d.h. 

lim f(⃗x) = c (bzw. f(⃗x) → c fur ⃗x → ⃗a), 

⃗x→⃗a 

wenn es zu jeder (beliebig kleinen) Schranke ε > 0 eine r-Umgebung 

U r (⃗a) gibt, so dass |f(⃗x) − c| ≤ ε fur alle ⃗x ∈ D ∩ U r (⃗a), ⃗x ≠ ⃗a, gilt. 

(2) f heit in ⃗a ∈ D stetig, wenn lim ⃗x→⃗a f(⃗x) = f(⃗a) gilt. 

(3) f heit auf D stetig, wenn f in allen ⃗a ∈ D stetig ist. 

Die Summe, das Produkt, der Quotient (Nenner ungleich Null) stetiger Funktionen 

sind stetig. 

z 

z 

Hier ist f(x,y) in 

(x 0 

,y 0 

) 

stetig. 

Hier ist f(x,y) in 

(x 0 

,y 0 

) nicht stetig. 

U ε 

(f(x 0 

,y 0 

))={z: |f(x 0 

,y 0 

)-z|


Folglich ist f uberall stetig. 

Beispiel 3.6. Wo ist die Funktion 

{ 

xy 

fur(x, y) ≠ (0, 0), 

x 

f(x, y) = 

2 +y 2 

0 fur(x, y) = (0, 0) 

stetig? 

z 

x 

y 

Fur (x, y) ≠ (0, 0) ist f als Quotient von stetigen Funktionen stetig. Es verbleibt 

f im Punkt (0, 0) zu untersuchen: Ubergang zu Polarkoordinaten: x = r cos ϕ, y = 

r sin ϕ, r ∈ R, ϕ ∈ [0, 2π). 

f(x, y) = ˜f(r, ϕ) = 

D.h., dass der Grenzwert 

r 2 cos ϕ sin ϕ 

r 2 cos 2 ϕ + r 2 sin 2 ϕ = cos ϕ sin ϕ = 1 2 sin(2ϕ) 

lim f(x, y) = lim sin(2ϕ) = sin(2ϕ) 

(x,y)→(0,0) 

r→0 

∀ϕ ∈ [0, 2π). 

nicht existiert. Oensichtlich hangt der Grenzwert nicht vom Radius, sondern 

vom Winkel ϕ ab. Geometrisch sind Gebilde, wo der Radius r variiert und 

der Winkel ϕ konstant ist, Geraden durch den Ursprung, deren Anstieg durch 

ϕ bestimmt wird. Wir betrachten deshalb den Grenzwert entlang der Geraden 

y = x = t und y = 2x = 2t, mit dem Parameter t ∈ R. Dann gilt fur y = x = t : 

t 2 

lim 

t→0 t 2 + t = 1 2 2 . 

Dagegen erhalt man fur y = 2x = 2t : 

2t 2 


t→0 t 2 + 4t = 2 2 5 . 

Der Grenzwert ist aber, wenn er existiert eindeutig bestimmt. Deshalb existiert 

der Grenzwert lim (x,y)→(0,0) 

xy 

x 2 +y 2 


x→0 

nicht. Dagegen existieren die Grenzwerte 

f(x, 0) = 0 = lim f(0, y). 

y→0 

Bemerkung 3.1. Die Stetigkeit von z = f(x, y) in (x 0 , y 0 ) ergibt sich jedoch 

nicht aus der Stetigkeit der " 

partiellen\ Funktionen x ↦→ f(x, y 0 ) und 

y ↦→ f(x 0 , y). Sondern man musste nachweisen, das fur alle moglichen Kurven 

(x(t), y(t)) → (x 0 , y 0 ) die Funktion f(x, y) immer den gleichen Grenzwert hat.


Diese Vorgehensweise ist deshalb nur gunstig, um die Unstetigkeit zu zeigen, 

d.h. es gibt zwei Kurven wo verschiedene Grenzwerte angenommen werden. 

Beispiel 3.7. Wo ist die Funktion 

{ 

xy 2 

fur(x, y) ≠ (0, 0), 

f(x, y) = 

x 2 +y 4 

0 fur(x, y) = (0, 0) 

stetig? 

z = xyy/(xx+yyyy) 

z 

x 

y 

Fur (x, y) ≠ 0 ist die Funktion als Quotient stetiger Funktionen wieder stetig. Es 

verbleibt die Funktion in (0, 0) zu untersuchen. Es gilt f(x, 0) = 0, x ∈ R und 

f(0, y) = 0, y ∈ R. Trotzdem ist f(x, y) in (0, 0) nicht stetig, da bei Annaherung 

langs der Geraden ( t 

, t 4 2) 

gilt 


t→0 

t t 2 

4 4 

t 2 + t4 

4 16 

t 3 

= lim 

t→0 4t 2 + t = lim 4 t→0 

aber bei der Annaherung langs (t 2 , t) gilt 

t 2 t 2 


t→0 t 4 + t = lim 1 

4 t→0 2 = 1 2 . 

1.3. Partielle Ableitungen und Gradient. 

t 

4 + t 2 = 0 

Definition 3.4. Sei D ⊆ R n oen, f : D → R und ⃗a = (a 1 , a 2 , . . . , a n ) ∈ D. 

Existiert die Ableitung der " 

partiellen\ Funktion 

x i ↦→ f(a 1 , . . . , a i−1 , x i , a i+1 , . . . , a n ) 

an der Stelle x i = a i , so nennt man diese die partielle Ableitung von f nach 

x i im Punkt ⃗a; sie wird mit 

bezeichnet. 

∂f(⃗x) 

∂x i 

∣ 

∣∣∣⃗x=⃗a 

oder 

∂f 

∂x i 

(⃗a) 

oderf xi (⃗a) 

Die Berechnung erfolgt wie fur eine Funktion einer Veranderlichen. Es gilt 

∂f(⃗x) 

∂x i 

:= lim 

t→0 

1 

t [f(x 1, . . . , x i + t, . . . , x n ) − f(x 1 , . . . , x i , . . . , x n )] = lim 

t→0 

1 

t [f(⃗x + t⃗e i) − f(⃗x)].


Bezeichnungen fur hohere partielle Ableitungen: 

f xx = ∂2 f 

∂x 2 , 

f xy = (f x ) y = ∂ ∂y 

( ) ∂f 

, . . . 

∂x 

Definition 3.5. f heit (stetig) partiell dierenzierbar, wenn alle partiellen 

Ableitungen f xi existieren (und stetig sind). 

Beispiel 3.8. f(x, y) = x 2 y 3 + y ln x, (x > 0). Dann sind die 1. partiellen 

Ableitungen: 

f x (x, y) = 2xy 3 + y 1 x , 

f y(x, y) = x 2 3y 2 + ln x 

und die 2. partiellen Ableitungen: 

f xx (x, y) = xy 3 − y x 2 , f yy(x, y) = 6x 2 y, f xy (x, y) = 6xy 2 + 1 x = f yx(x, y). 

Definition 3.6. f heit k-mal (stetig) partiell dierenzierbar, wenn alle k- 

ten partiellen Ableitungen f xi existieren (und stetig sind). 

Satz 3.1. Satz von Schwarz. Fur jede zweimal stetig partiell dierenzierbare 

Funktion f : D → R, D ⊆ R n oen, gilt 

( ) 

∂ ∂f 

= ∂ ( ) ∂f 

, 1 ≤ i, j ≤ n. 

∂x i ∂x j ∂x j ∂x i 

Definition 3.7. Ist f : D → R partiell dierenzierbar, so heit der Vektor 

der ersten partiellen Ableitungen im Punkt ⃗x Gradient von f an der Stelle 

⃗x : 

⎛ ∂f ⎞ 

∂x 1 

(⃗x) 

∂f 

∂x 

grad f(⃗x) := ⎜ 

2 

(⃗x) 

⎟ 

⎝ . ⎠ ∈ Rn . 

∂f 

∂x n 

(⃗x)


Beispiel 3.9. f(x, y, z) = e x+2y + 2x sin z + z 2 xy, 

grad f(x, y, z) = 

⎛ 

⎜ 

⎝ 

f x (x, y, z) 

f y (x, y, z) 

f z (x, y, z) 

⎞ 

⎟ 

⎠ = 

⎛ 

⎜ 

⎝ 

e x+2y + 2 sin z + z 2 y 

2e x+2y + xz 2 

2x cos z + 2zxy 

Beispiel 3.10. Man bestimme ggf. die ersten partiellen Ableitungen von f, 

den Gradienten von f sowie grad f(1, 1) von 

⎞ 

⎟ 

⎠ 

f(x, y) = 

{ 

x 2 −y 2 

, 

x 2 +y 2 fur (x, y) ≠ (0, 0), 

1 fur (x, y) = (0, 0). 

Fur die ersten partiellen Ableitungen erhalt man 

f x (x, y) = 2x(x2 +y 2 )−2x(x 2 −y 2 ) 

(x 2 +y 2 ) 2 = 4xy2 

(x 2 +y 2 ) 2 fur (x, y) ≠ (0, 0), 

f y (x, y) = −2y(x2 +y 2 )−2y(x 2 −y 2 ) 

(x 2 +y 2 ) 2 = −4x2 y 

(x 2 +y 2 ) 2 fur (x, y) ≠ (0, 0). 

Fur die partiellen Ableitungen in (0, 0) erhalt man 

[ ] 

1 

1 t 

2 

f x (0, 0) = lim [f(0 + t, 0) − f(0, 0)] = lim 

t→0 t t→0 t t − 1 = 0. 

2 

Die partielle Ableitung f y existiert dagegen in (0, 0) nicht, da die partielle Funktion 

f(0, y) in (0, 0) unstetig ist, da 

f(0, y) = 

{ 

−1, y ≠ 0, 

1, y = 0, 

bzw. aus der Denition der partiellen Ableitung ergibt sich: 

[ ] 

1 

1 −t 

2 

−2 

f y (0, 0) = lim [f(0, 0 + t) − f(0, 0)] = lim − 1 = lim 

t→0 t t→0 t t 2 t→0 t 

und dieser Grenzwert existiert nicht. Damit gilt fur den Gradienten: 

⎧ 

⎪⎨ 

grad f(x, y) = 

⎪⎩ 

Insbesondere ist grad f(1, 1) = 

( 

4xy 

(x 2 +y 2 ) 2 

( 

y 

−x 

) 

, fur (x, y) ≠ (0, 0), 

existiert nicht fur (x, y) = (0, 0). 

1 

−1 

) 

.


Definition 3.8. Es sei f : R n ⊆ D → R, eine in ⃗x ∈ D zweimal dierenzierbare 

Funktion mit den 2. partiellen Ableitungen 

( ) 

∂ ∂f 

= ∂2 f 

, i, j = 1, 2, . . . , n. 

∂x i ∂x j ∂x i ∂x j 

Dann heit die Matrix der 2. partiellen Ableitungen 

⎛ 

∂ 2 f 

∂ 

∂x 1 ∂x 1 

(⃗x) 

2 f 

∂x 1 ∂x 2 

(⃗x) . . . 

H f (⃗x) := 

⎜ 

⎝ 

∂ 2 f 

∂x 2 ∂x 1 

(⃗x) 

. 

∂ 2 f 

∂x n ∂x 1 

(⃗x) 

Hesse-Matrix von f an der Stelle ⃗x. 

∂ 2 f 

∂x 2 ∂x 2 

(⃗x) . . . 

. 

... 

∂ 2 f 

∂x n ∂x 2 

(⃗x) . . . 

∂ 2 f 

⎞ 

∂x 1 ∂x n 

(⃗x) 

∂ 2 f 

∂x 2 ∂x n 

(⃗x) 

⎟ 

. ⎠ 

∂ 2 f 

∂x n ∂x n 

(⃗x) 

1.4. Totales Differential. 

Definition 3.9. Sei D ⊆ R n oen. Eine Funktion f : D → R heit in ⃗x 0 

total differenzierbar (oder linear approximierbar), wenn es einen Vektor 

⃗a ∈ R n gibt mit 

f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ) 

(fur ⃗x nahe ⃗x 0 ) mit lim ⃗x→⃗x0 

r(⃗x, ⃗x 0 ) 

|⃗x−⃗x 0 | 

= 0 gibt. 

Satz 3.2. Ist f in ⃗x 0 ∈ D total dierenzierbar, d.h. 

dann gilt: 

f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ), 

(1) f ist stetig in ⃗x 0 ; 

(2) 1 lim 

t→0 t [f(⃗x 0 + t⃗v) − f(⃗x 0 )] = ⃗a · ⃗v, fur alle ⃗v ∈ R n , ⃗v ≠ ⃗0; 

(3) f ist partiell dierenzierbar und ⃗a eindeutig bestimmt als ⃗a = 

grad f(⃗x 0 ). 

Beweis: zu 1.: Aus der Denition der totalen Dierenzierbarkeit folgt 

lim (f(⃗x) − f(⃗x 0 )) = lim (⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )) = 0. 

⃗x→⃗x 0 ⃗x→⃗x0 

zu 2.: Sei ⃗x = ⃗x 0 + t⃗v dann ergibt sich aus der totalen Dierenzierbarkeit 


t→0 

1 

t [f(⃗x 0 + t⃗v) − f(⃗x 0 )] = lim 

t→0 

1 

t [⃗a · (t⃗v) + r(⃗x 0 + t⃗v, ⃗x 0 )] = ⃗a · ⃗v,


da 

r(⃗x 0 + t⃗v, ⃗x 0 ) 


t→0 |t⃗v| 

= 0. 

zu 3. Fur ⃗v = ⃗e i erhalt man aus 2. 

∂f 

∂x i 

(⃗x 0 ) = ⃗a · ⃗e i = a i 

(die i-te Koordinate von ⃗a.) 

□ 

Insbesondere folgt also aus der totalen Dierenzierbarkeit die Existenz der ersten 

partiellen Ableitungen und aller Richtungsableitungen im Punkt ⃗x 0 . Die Umkehrung 

gilt nur fur stetig dierenzierbare Funktionen, d.h. 

Satz 3.3. Jede einmal stetig (partiell) dierenzierbare Funktion f : D → 

R, D ⊆ R n oen, ist in allen Punkten von D total dierenzierbar. 

Beweis: Fur n = 2 : Sei (x 0 , y 0 ) ∈ D. Fur alle (x, y) aus einer hinreichend kleinen 

r-Umgebung U r (x 0 , y 0 ) ⊆ D gilt nach dem Mittelwertsatz fur Funktionen einer 

Veranderlichen: 

f(x, y) − f(x 0 , y 0 ) = f(x, y) − f(x 0 , y) + f(x 0 , y) − f(x 0 , y 0 ) 

= f x (ξ, y)(x − x 0 ) + f y (x 0 , η)(y − y 0 ) 

mit ξ zwischen x und x 0 sowie η zwischen y und y 0 . Damit ist 

( ) 

x − x 

f(x, y) = f(x 0 , y 0 ) + grad f(x 0 , y 0 ) · 

0 

+ R(x, y) 

y − y 0 

mit der Funktion 

R(x, y) = [f x (ξ, y) − f x (x 0 , y 0 )] (x − x 0 ) + [f y (x 0 , η) − f y (x 0 , y 0 )] (y − y 0 ). 

Fur diese Funktion gilt 

|R(x, y)| 

|(x, y) − (x 0 , y 0 )| ≤ |f x(ξ, y) − f x (x 0 , y 0 )| |x − x 0 | 

+ |f y(x 0 , η) − f y (x 0 , y 0 )| |y − y 0 | 

|(x, y) − (x 0 , y 0 )| 

|(x, y) − (x 0 , y 0 )| 

|x − x 0 | 

= |f x (ξ, y) − f x (x 0 , y 0 )| √ 

|x − x0 | 2 + |y − y 0 | + |f |y − y 0 | 

y(x 0 , η) − f y (x 0 , y 0 )| √ 2 |x − x0 | 2 + |y − y 0 | 2 

≤ |f x (ξ, y) − f x (x 0 , y 0 )| + |f y (x 0 , η) − f y (x 0 , y 0 )| → 0 fur (x, y) → (x 0 , y 0 ), 

da die ersten partiellen Ableitungen stetig sind. 

□


Ist f : D → R in einer Umgebung von ⃗x 0 total dierenzierbar, dann ist 

g(⃗x) := f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) 

die beste lineare Approximation von f(⃗x 0 ) nahe bei ⃗x 0 . 

Anschauliche Deutung fur n = 2 : Die " 

uber\ D ⊆ R 2 liegende Flache (der Graph) 

z = f(x, y) wird in der Nahe des Flachenpunktes (x 0 , y 0 , f(x 0 , y 0 )) durch die Ebene 

z − z 0 = z − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 ) 

⇐⇒ z − f x (x 0 , y 0 )x − f y (x 0 , y 0 )y = (f(x 0 , y 0 ) − f x (x 0 , y 0 )x 0 − f y (x 0 , y 0 )y 0 ) 

Diese Ebene heit Tangentialebene der Flache z = f(x, y) im Punkt (x 0 , y 0 , f(x 0 , y 0 )). 

Sie enthalt samtliche Flachentangenten. 

Satz 3.4. Jede einmal stetig dierenzierbare Funktion f : D → R, (D ⊆ 

R n oen) ist auf D (d.h. in allen Punkten von D) total dierenzierbar. 

z 

n 

Tangentialebene 

f(x 0 

,y 0 

) 

. 

y 

. (x0 ,y 0 ) 

n =( 

-f x 

(x 0 

,y 0 

) 

-f y 

(x 0 

,y 0 

)) 

1 

x 

z−f x 0 

, y 0 

=f x 

x 0 

, y 0 

x−x 0 

f y 

x 0 

, y 0 

y−y 0 

 

⇔−f x 

x 0 

,y 0 

x−f y 

x 0 

, y 0 

yz=f x 0 

, y 0 

−f x 

x 0 

,y 0 

x 0 

−f y 

x 0 

, y 0 

y 0 

Beispiel 3.11. In der Umgebung von (1, 1) lautet die lineare Approximation 

der einmal stetig dierenzierbaren Funktion f(x, y) = x 4 + 2x 3 y 2 + y : 

( ) 

x − 1 

f(x, y) = f(1, 1) + grad f(1, 1) · 

+ r((x, y); (1, 1)) 

y − 1 

Dementsprechend ist 

= 4 + 10(x − 1) + 5(y − 1) + r((x, y); (1, 1)). 

z = 4 + 10(x − 1) + 5(y − 1)


die Gleichung der Tangentialebene der Flache z = x 4 +2x 3 y 2 +y im Flachenpunkt 

(1, 1, 4). 

Anwendung 3.1. Fehlerrechnung und Näherungsrechnung. Es werden statt 

der wahren Werte ⃗x = (x 1 , . . . , x n ) die Naherungswerte ⃗x 0 = (x 10 , . . . , x n0 ) gemessen. 

Wie wirkt sich das auf y = f(⃗x) aus? Fur kleine |∆⃗x| = |⃗x − ⃗x 0 | ist der 

Fehler r(⃗x, ⃗x 0 ) vernachlassigbar klein, so ergibt sich " 

in erster Naherung\ fur 

y = f(⃗x) : 

∆y = f(⃗x 0 + ∆⃗x) − f(⃗x 0 ) ≈ grad f(⃗x 0 ) · ∆⃗x = 

n∑ 

j=1 

∂f 

∂x j 

(⃗x 0 )∆x j . 

Kennt man nun die Megenauigkeit von ∆x j , so erhalt man als ungefahre Fehlerschranke 

fur ∆y : 

n∑ 

|∆y| = |∆f(⃗x)| = |f(⃗x) − f(⃗x 0 )| ≈ 

∂f 

∣ (⃗x 0 ) 

∂x j 

∣ |∆x j| 

fur ⃗x nahe bei ⃗x 0 . 

Fur die Naherungrechnung bedeutet das, dass 

j=1 

f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) 

eine gute Naherung fur f(⃗x) darstellt, wenn ⃗x 0 nur nahe genug bei ⃗x liegt. 

Beispiel 3.12. f(x, y) = x y = e y ln x wird in (1, 3) angenahert durch 

f(x, y) ≈ 1 + 3(x − 1) + 0(y − 1). 

Man erhalt f(1, 02; 3, 01) ≈ 1 + 3(1, 02 − 1) = 1, 06. Der genaue Wert ist 1, 02 3,01 = 

1, 061418168 . . . . 

Bemerkung 3.2. Ausgehend von der Naherung 

∆y ≈ 

n∑ 

j=1 

∂f 

∂x j 

(⃗x 0 )∆x j 

schreibt man fur das totale Dierential einer Funktion f : D → R n , D ⊆ R n 

(oen) im Punkt ⃗x 0 auch: 

df(⃗x 0 ) = 

n∑ 

j=1 

∂f 

∂x j 

(⃗x 0 )dx j . 

Dabei sind die dx i die Dierentiale der Koordinaten x 1 , x 2 , . . . , x n . 

Beispiel 3.13. Anwendungsbeispiel: Fehlerrechnung zum Schubmodul 

Dieses Beispiel ist entnommen von: 

http://193.175.144.216/praktikumsversuche/elastizitaet.pdf


Bestimmung des Schubmoduls: Ein Draht aus Metall, dessen Torsionsmodul bestimmt 

werden soll, ist an seinem oberen Ende fest eingespannt. Sein freies unteres 

Ende ist in einem rotationssymmetrischen Korper K 1 mit dem Tragheitsmoment 

J 1 eingeklemmt. 

Dreht man nun diesen Korper aus seiner Ruhelage, so wirkt auf ihn ein Ruckstellmoment 

M aufgrund der Verdrillung des Drahtes. Dieses Ruckstellmoment 

ist bei kleiner Auslenkung proportional dem Auslenkwinkel ϕ : 

M = D ∗ ϕ, 

dabei ist das Richtmoment D ∗ durch das Material und die Abmessung des Drahtes 

gegeben: 

D ∗ = π r4 G 

2L , 

wobei r der Radius, L die Lange des Drahtes und G der Schubmodul des Materials 

sind. 

Lasst man nun den Korper aus dieser Lage los, so fuhrt er um seine Ruhelage 

Drehschwingungen durch mit der Schwingzeit: 

T 1 = 2π 

√ 

J1 

D ∗ (5) 

Daraus lasst sich der Schubmodul bestimmen, wenn das unbekannte Tragheitsmoment 

J 1 eliminiert werden kann. Dazu wird mit einem Zusatzkorper K 2 der 

Masse m 2 mit berechenbarem Tragheitsmoment die Schwingungsdauer T 2 bestimmt. 

J 2 = m 2 

2 (R2 1 + r2) 2 siehe Abb. 1. 

Bei der Verwendung anderer Zusatzkorper gilt der Steinersche Satz: 

so dass 

J 2 = m 2 

2 

[ 

(r 

2 

1 + r 2 2) + 2a 2] siehe Abb. 2, 

√ 

2L 

T 2 = 2π 

G π r (J 4 1 + J 2 ) (6) 

ist. Aus den Gleichungen (5) und der Formel fur D ∗ sowie (6) erhalt man: 

und damit ist 

T2 2 = 4π 2 2L 

G π r (J 4 1 + J 2 ), 

T1 2 = 4π 2 J 1 

D = 2L 

∗ 4π2 g π r J 4 1 

T2 2 − T1 2 = 4π 2 2L 

g π r J 4 2 = 8π L m 2 

[ 

(r 

2 

G r 4 2 1 + r2) 2 + 2a 2] 

und die Formel fur den Schubmodul G lautet 

G = 8π L m 2 

2 [(r2 1 + r 2 2) + 2a 2 ] 

(T 2 2 − T 2 1 ) r 4 .


Werte und Fehler (und wie ermittelt) 

Groe Wert W Fehler ∆W Bestimmung des Fehlers 

L 2, 15m ∆L = 3 · 10 −3 m Schatzung 

m 2 0, 487kg ∆m 2 = 100 · 10 −6 kg Genauigkeit der Waage 

r 1 2 · 10 −3 m ∆r 1 = 0, 1 · 10 −3 m Schatzung 

r 2 20 · 10 −3 m ∆r 2 = 0, 1 · 10 −3 m Schatzung 

a 40 · 10 −3 m ∆a = 0, 1 · 10 −3 m Schatzung 

T 1 2, 21s ∆T 1 = 20 · 10 −3 s Schatzung aus 10 gemessenen Perioden 

T 2 2, 534s ∆T 1 = 20 · 10 −3 s Schatzung aus 10 gemessenen Perioden 

r 0, 763 · 10 −3 m ∆r = 10, 4 · 10 −6 m Standardabweichung aus mehreren Messungen 

Der maximale Grotfehler ergibt sich nun aus 

∣ ∣ ∣ ∣ |∆G| ≤ 

∂G 

∣∣∣ ∣ ∂L ∣ · |∆L| + ∂G ∣∣∣ · |∆m 2 | + 

∂G ∣∣∣ ∂m 2 

∣ · |∆r 1 | + 

∂G ∣∣∣ 

∂r 1 

∣ · |∆r 2 | 

∂r 2 ∣ ∣ ∣ + 

∂G 

∣∣∣ ∣ ∂a ∣ · |∆a| + ∂G ∣∣∣ · |∆T 1 | + 

∂G ∣∣∣ ∂T 1 

∣ · |∆T 2 | + 

∂G 

∂T 2 

∣ ∂r ∣ · |∆r| .


Wir benotigen somit die folgenden partiellen Ableitungen: 

∂G 

∂L 

= 

8π · 

m2 

2 · (r2 1 + r 2 2 + 2a 2 ) 

(T 2 2 − T 2 1 ) · r 4 = G L ; 

∂G 

= 8π · L · 1 · 2 (r2 1 + r2 2 + 2a 2 ) 

= G ; 

∂m 2 (T2 2 − T1 2 ) · r 4 m 2 

∂G 

∂r 1 

= 

∂G 

∂r 2 

= 

∂G 

∂a 

∂G 

∂T 1 

= 

8π · L · 

m2 

2 · 2r 1 

(T 2 2 − T 2 1 ) · r 4 ; 

8π · L · 

m2 

2 · 2r 2 

(T 2 2 − T 2 1 ) · r 4 ; 

= 

8π · L · 

m2 

2 · 2 · 2a 

(T 2 2 − T 2 1 ) · r 4 ; 

8π · L · 

m2 

2 · (r2 1 + r 2 2 + 2a 2 ) · 2T 1 · r 4 

((T 2 2 − T 2 1 ) · r 4 ) 2 ; 

m2 

∂G 8π · L · 

= − · 2 (r2 1 + r2 2 + 2a 2 ) · (−2T 2 ) · r 4 

; 

∂T 2 ((T2 2 − T1 2 ) · r 4 ) 2 

∂G 

∂r 

m2 

(−4) · 8π · L · 

2 

= · (r2 1 + r2 2 + 2a 2 ) 

= (−4) · G . 

(T2 2 − T1 2 ) · r 5 r 

Setzt man nun die Zahlenwerte ein, so erhalt man die Abschatzungen fur den 

Betrag der partiellen Ableitungen. Multipliziert man diese nun mit den Werten 

fur die entsprechenden Fehler so erhalt man: 

∂G 

∣ ∂L ∣ · |∆L| = 0, 127 · N ∣ ∣ ∣∣∣ 109 m ; ∂G ∣∣∣ 

· |∆m 2 2 | = 18, 7 · 10 6 N ∂m 2 m ; 

∣ 2 ∂G ∣∣∣ 

∣ · |∆r 1 | = 10, 10 · 10 6 N ∣ ∣ ∣∣∣ 

∂r 1 m ; ∂G ∣∣∣ 

· |∆r 2 2 | = 0, 101 · 10 9 N ∂r 2 m ; 

2 ∂G 

∣ ∂a ∣ · |∆a| = 0, 404 · N ∣ ∣ ∣∣∣ 109 m ; ∂G ∣∣∣ 

· |∆T 2 1 | = 5, 2 · 10 9 N ∂T 1 m ; 

∣ 2 ∂G ∣∣∣ 

∣ · |∆T 2 | = 6 · 10 9 N ∣ ∣∣∣ 

∂T 2 m ; ∂G 

2 ∂r ∣ · |∆r| = 4, 96 · N 109 m ; 2 

Damit ist der maximale Grotfehler 

und wir erhalten 

sowie als relativen Grotfehler 

|∆G| ≤ 1, 68 · 10 10 N m 2 

G = 9, 1 · 10 10 N m 2 ± 1, 7 · 1010 N m 2 

∆G 

G 

= 18, 5%.


Der Literaturwert fur Stahl ist 8, 04 · 10 10 N m 2 . Zum Vergleich, der Literaturwert 

fur Kupfer ist 4, 55 · 10 10 N m 2 . 

Beispiel 3.14. Bestimmung der Erdbeschleunigung mit einem Kugelfallgerat. 

Dieses Beispiel ist entnommen 

http://www.fh-gelsenkirchen.de/fb02/homepages/schmiler/Vordrucke/Fehlerrechnung.pdf 

Zur Bestimmung der Erdbeschleunigung g wird eine Kugel der Masse m aus der 

Hohe h fallengelassen. Bestimmt werden die Hohe mit einem Maband sowie 

die Fallzeit mit einer Stoppuhr. Aus diesen beiden Groen kann man dann mit 

Hilfe der Beziehung 

die gesuchte Fallbeschleunigung zu 

bestimmt werden. 

h = 1 2 gt2 

g = 2h 

t 2 

Der absolute Grotfehler ergibt sich dann aus 

∣ ∣ ∣ ( 

|∆g| ≤ 

∂g ∣∣∣ 

∣∂h · ∆h + 

∂g ∣∣∣ 

∣ ∂t · ∆t = 

2 ∣∣∣ 

∣t · ∆h + 

2 ∣ − 4h ) 

· ∆t 

t 3 ∣ . 

Dabei wird eine Zahl mit zugehoriger Einheit eingesetzt. 

Um besser ersehen zu konnen, welche der beiden Messgroen den starkeren 

Einuss auf das Ergebnis ausubt, berechnet man den relativen Grotfehler: 

∣ ∣ ∆g ∣∣∣∣ 2 

∣∣∣∣ 

g ≤ t 2 

· ∆h 

∣ + − 4h 

∣ ∣ t 3 

∣∣∣ 

· ∆t 

2h 

∣ = ∆h 

∣∣∣ h ∣ + 2 ∆t 

t ∣ . 

2h 

t 2 

t 2 

Folglich wird sich ein Fehler in der Zeitmessung (Faktor 2) immer starker auswirken 

als ein Fehler bei der Bestimmung der Fallhohe (Faktor 1). Auerdem 

ergeben sich einheitslose Groen. Um die Abweichungen konkret berechnen zu 

konnen, benotigt man noch Zahlenwerte fur ∆h bzw. ∆t. Diese Abweichungen 

bzw. Messungenauigkeiten ergeben sich je nach gewahltem Messverfahren wie 

folgt: 

• Hat man eine Messreihe (z.B. 10 oder mehr verschiedene Messungen) 

fur die entsprechende Groe x, so berechnet man die Standardabweichung 

s des Mittelwerts x = 1 n ∑ 

n i=1 x i: 

√ ∑n 

i=1 

s = 

(x i − x) 

. 

n − 1 

• Hat man die entsprechende Groe nur einmal gemessen, so ist die Messungenauigkeit 

einzusetzen. Dabei liegt es im Ermessen der versuchsdruchfuhrenden 

Person, wie hoch diese Ungenauigkeit anzusetzen ist.


Bei sehr genauen Messungen kann z.B. die Halfte des kleinsten Skalenteils 

angesetzt werden, wahrend bei anderen Messungen u.U. eine 

groere Ungenauigkeit angenommen werden muss. 

• Wird die Messungen mit Hilfe eines Gerats durchgefuhrt, so gibt in der 

Regel die Hersteller die Messungenauigkeit an. 

1.5. Richtungsableitung. Die partiellen Ableitungen ∂f 

∂x j 

(⃗x) geben die " 

momentane\ 

Anderung der Funktionswerte in Richtung der Koordinatenachsen an. 

Zu jedem Vektor ⃗v ∈ R n , ⃗v ≠ ⃗0, nenne wir den Grenzwert 

1 

∂ ⃗v f(⃗x) := lim [f(⃗x + t⃗v) − f(⃗x)] 

t→0 t 

(sofern er existiert) die Ableitung von f an der Stelle ⃗x langs ⃗v. 

Definition 3.10. Ist ⃗v eine Einheitsvektor (|⃗v| = 1), dann heit ∂ ⃗v f(⃗x) = 

(⃗x) Richtungsableitung von f an der Stelle ⃗x in Richtung ⃗v. 

∂f 

∂⃗v 

Betrachtet man die Einschrankung von f langs der Geraden ⃗x + t⃗v, also 

dann gilt nach Denition 

und deshalb 

h(t) := f(⃗x + t⃗v), 

ḣ(0) := d ∣ 

∣∣∣t=0 

dt f(⃗x + t⃗v) 1 


t→0 t [f(⃗x + t⃗v) − f(⃗x)] = ∂ ⃗vf(⃗x), 

∂ ⃗v f(⃗x) > 0 ⇒ f(⃗x) nimmt in Richtung ⃗v zu. 

∂ ⃗v f(⃗x) < 0 ⇒ f(⃗x) nimmt in Richtung ⃗v ab. 

Anschauliche Deutung für n = 2. Die Schnittkurve des Graphen z = f(x, y) mit 

der zur z-Achse parallelen Ebene durch die Gerade 

( ) ( ) 

( ) 

x 0 v 1 

v 

+ t mit 1 

⃗v = , |⃗v| = 1, 

y 0 v 2 v 2 

besitzt die Parameterdarstellung 

⎛ 

⃗x(t) = 

⎜ 

⎝ 

x 0 + tv 1 

y 0 + tv 2 

f(x 0 + tv 1 , y 0 + tv 2 ) 

⎞ 

⎟ 

⎠ 

mit dem Tangentialvektor 

˙⃗x(t) = 

⎛ 

⎜ 

⎝ 

v 1 

v 2 

∂ ⃗v f(x 0 , y 0 ) 

⎞ 

⎟ 

⎠ 

im Kurvenpunkt (x 0 , y 0 , f(x 0 , y 0 )). Die Tangente hat den Anstieg ∂ ⃗v f(x 0 , y 0 ).


Satz 3.5. Fur jede auf der oenen Menge D ⊆ R n total dierenzierbaren 

Funktion f und fur jeden Vektor ⃗v ∈ R n , ⃗v ≠ ⃗0, gilt 

n∑ 

∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v = f xj (⃗x)v i . 

Mit |ṽ| = 1 ist das die Richtungsableitung von f an der Stelle ⃗x in Richtung 

⃗v. 

j=1 

(siehe Satz 3.2 Absatze 2 und 3.) 

z 

y 

f(x 0 

,y 0 

) 

grad f (x 0 

,y 0 

) 

. 

(x 0 

,y 0 

) 

v=(α 1 

,α 2 

) T 

x 

φ 

tan φ = ∂ (α1 ,α 2 ) f(x 0 ,y 0 ) = α 1 f x (x 0 ,y 0 ) + α 2 f y (x 0 ,y 0 ) 

Beispiel 3.15. Der Anstieg der Funktion f(x, y) = x 2 + y 2 im Punkt (1, 1) in 

der Richtung des (Einheits-)Vektors ⃗v = (sin α, cos α) T betragt 

( ) ( )∣ ( ) 

∣∣∣∣(1, 

sin α 2x 

sin α 

∂ ⃗v f(⃗x) = grad f(1, 1) · 

= 

· = 2(sin α + cos α). 

cos α 2y 

cos α 

1) 

1.6. Parameterdarstellungen. Man nennt {⃗x(t), t A ≤ t ≤ t B } eine Parameterdarstellung 

einer vektorwertigen Funktion. Jeder Funktionswert wird durch 

einen Wert des Parameters t bestimmt. Oder anders ausgedruckt, der Vektor ⃗x(t) 

variiert in Abhangigkeit des Parameters t. Wir betrachten daher vektorwertige, auf 

dem Intervall I ⊆ R erklarte Funktionen ⃗x : I → R n . Jede derartige Funktion besteht 

aus n Komponentenfunktionen x i : I → R (1 ≤ i ≤ n), d.h. 

⎛ 

⃗x(t) = ⎜ 

⎝ 

x 1 (t) 

x 2 (t) 

. 

x n (t) 

⎞ 

⎟ 

⎠ , t ∈ I.


Die Begrie des Grenzwerts, der Stetigkeit, der Dierenzierbarkeit werden auf die 

Komponentenfunktionen zuruckgefuhrt: 

Definition 3.11. Fur die Funktion ⃗x : I → R n gilt: 

(1) ⎛ ⎞ ⎛ ⎞ 

x 1 (t) 

c 1 

x 2 (t) 

lim ⃗x(t) = ⎜ ⎟ 

t→t 0 ⎝ . ⎠ = ⃗c = c 2 

⎜ ⎟ ⇐⇒ lim x i (t) = c i , 1 ≤ i ≤ n. 

⎝ . ⎠ t→t 0 

x n (t) 

c n 

(2) Entsprechend heit ⃗x : I → R n in t 0 ∈ I (auf I) stetig, bzw. dierenzierbar, 

wenn alle Komponentenfunktionen in t 0 ∈ I (auf I) stetig, 

bzw. dierenzierbar sind. 

(3) Die Ableitung ist ebenfalls komponentenweise zu berechnen: 

˙⃗x(t) = d 1 

⃗x(t) = lim 

dt h→0 

⎛ 

h [⃗x(t + h) − ⃗x(t)] = ⎜ 

⎝ 

ẋ 1 (t) 

ẋ 2 (t) 

. 

ẋ n (t) 

⎞ 

⎟ 

⎠ mit ẋ i(t) = d dt x i(t). 

1.7. Kettenregel. 

Satz 3.6. Kettenregel. Fur jede einmal stetig (partiell) dierenzierbare 

Funktion f : D → R, D ⊂ R n oen, und jede Parametrisierung ⃗x : R ⊇ 

[a, b] → D gilt 

d 

dt f(⃗x(t)) = d dt f(x 1(t), x 2 (t), . . . , x n (t)) 

= f x1 (⃗x(t))ẋ 1 (t) + . . . + f xn (⃗x(t))ẋ n (t) = grad f(⃗x(t)) · ˙⃗x(t). 

Beweis: Es sei ⃗x(t 0 ) = ⃗x 0 , dann ist 

da, f total dierenzierbar ist, gilt 

d 

1 

f(⃗x(t)) := lim 

dt h→0 h [f(⃗x(t 0 + h)) − f(⃗x(t 0 ))] 

1 


h→0 h [grad f(⃗x 0) · (⃗x(t 0 + h) − ⃗x(t 0 )) + r(⃗x(t 0 + h), ⃗x 0 )] 

wobei lim h→0 

r(⃗x(t 0 +h), ⃗x 0 ) 

|h| 

= 0 ist, d.h. 

1 

= grad f(⃗x 0 ) · lim 

h→0 h (⃗x(t 0 + h) − ⃗x(t 0 )) = grad f(⃗x(t 0 )) · ˙⃗x(t 0 ). 

□

2. BEDEUTUNG DES GRADIENTEN 61 

Anwendung 3.2. Die Kettenregel benotigt man immer dann, wenn neue 

Variable eingefuhrt werden und die partiellen Ableitungen in Bezug auf diese 

Veranderlichen zu berechnen sind. 

Polarkoordinaten im R 2 . Durch x = r cos ϕ, 

f(x, y), (x, y) ∈ D ⊆ R 2 , transformiert in 

F (r, ϕ) := f(r cos ϕ, r sin ϕ). 

y = r sin ϕ wird die Funktion 

Fur die partiellen Ableitungen von F ergibt sich aus der Kettenregel fur einmal 

stetig dierenzierbares f : 

d.h. ( 

und damit 

∼ 

( 

( 

F r = f x cos ϕ + f y sin ϕ, 

F ϕ = f x (−r sin ϕ) + f y (r cos ϕ), 

) ( 

F r 

= 

F ϕ 

cos ϕ sin ϕ 1 0 

−r sin ϕ r cos ϕ 0 1 

cos ϕ 

−r sin ϕ 

r cos ϕ 0 r − r sin 2 ϕ − cos ϕ sin ϕ 

0 r r sin ϕ cos ϕ 

und damit ( 

) ( 

f x 

= 

f y 

) ( 

sin ϕ 

r cos ϕ 

) 

f x 

f y 

) ( 

) 

cos ϕ sin ϕ 1 0 

∼ 

0 r r sin ϕ cos ϕ 

) ( 

) 

1 0 cos ϕ − 1 

∼ 

sin ϕ r 

1 

0 1 sin ϕ cos ϕ r 

) ( 

cos ϕ − 1 sin ϕ r 

1 

sin ϕ cos ϕ r 

2. Bedeutung des Gradienten 

) 

F r 

. 

F ϕ 

2.1. Richtung des steilsten Anstiegs. Fur eine einmal stetig dierenzierbare 

Funktion f : R n ⊇ D → R ist der Anstieg im Punkt ⃗x ∈ D in Richtung des Vektors 

⃗v mit |⃗v| = 1 gegeben durch 

∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v = |grad f(⃗x)| |⃗v| cos α = |grad f(⃗x)| cos α, 

wobei α, den von grad f(⃗x) und ⃗v eingeschlossenen Winkel bezeichnet. Dieser Anstieg 

ist am groten fur cos α = 1, d.h. α = 0. Also gilt fur grad f(⃗x) ≠ ⃗0 : 

Richtung von grad f(⃗x) = Richtung des maximalen Anstiegs der Funktion f 

in ⃗x = Richtung mit dem groten Zuwachs von f in Richtung ⃗x. 

Da f genau dann ansteigt, wenn −f abfallt, erhalt man gleichzeitig die Richtung des 

steilsten Abstiegs der Funktionswerte, namlich −grad f.

3. TAYLOR-FORMEL 62 

2.2. Gradient und Niveaumengen. Sei D ⊆ R n oen und f : D → R eine 

einmal stetig dierenzierbare Funktion, dann deniert f(⃗x) = c eine Hyperache in 

D. Fur jede parametrisierte Kurve t → ⃗x(t) auf dieser Hyperache gilt f(⃗x)(t) = 

c, t ∈ I, und mit der Kettenregel (siehe Satz 3.6) folgt 

d 

dt f(⃗x)(t) = 

n∑ 

f xj (⃗x)(t)ẋ j (t) = gradf(⃗x)(t) · ˙⃗x(t) = 0. 

j=1 

Folgerung: gradf(⃗x)(t) steht senkrecht auf ˙⃗x(t) = Tangente an die Kurve ⃗x(t). Dies 

gilt fur jede Kurve. 

Damit steht grad f(⃗x 0 ) auf allen Tangentialvektoren an die Niveaumenge 

N ⃗x0 := {x ∈ D : f(⃗x) = f(⃗x 0 ) = c.} 

Anwendung 3.3. Gesucht sei das Minimum der einmal stetig dierenzierbaren 

Funktion f(x, y) im oen Gebiet D ⊆ R n . Das Gradientenverfahren besteht 

nun darin, von einem bestimmten Startwert ⃗x 0 auszugehen, d.h. 

(1) Wahle ⃗x 0 ∈ D. 

(2) Man berechne grad f(⃗x 0 ) und berechne ⃗x 1 := ⃗x 0 − hgrad f(⃗x 0 ) mit einer 

dem Problem angepassten Schrittweite h > 0. Ist f(⃗x 1 ) > f(⃗x 0 ), so ist 

man zu weit gegangen und man versucht es deshalb noch einmal mit 1 2 h. 

(3) Ist f(⃗x 1 ) < f(⃗x 0 ), nimmt man ⃗x 1 als neuen Startwert und wiederhalt die 

Schritte 2 und 3. 

Auf diese Weise nahert man sich auf einem Streckenzug in D einer Minimalstelle 

der Funktion. Diese Stelle hangt vom gewahlten Startwert ab und muss 

nicht das globale Minimum sein. D.h. das Gradientenverfahren ermittelt ein 

lokales Minimum. 

Der Fall des lokalen Maximums geht analog. 

3. Taylor-Formel 

Wir verallgemeinern die Taylor-Formel fur Funktionen einer Veranderlichen (siehe 

Satz 1.8) auf Funktionen mehrerer Veranderlicher. Dazu betrachten wir konvexe 

Gebiete, d.h. D ist oen und mit ⃗x, ⃗y ∈ D liegt immer auch die gesamte verbindende 

Gerade ⃗x + t(⃗y − ⃗x), t ∈ [0, 1] vollstandig in D. Weiterhin sei f : R n ⊇ D → R 

k + 1-mal stetig dierenzierbar in n Variablen. Wir setzen: 

h(t) := f(⃗x 0 + t⃗v), t ∈ [0, 1] 

dann ist 

und 

1 

ḣ(0) = lim 

t→0 t (f(⃗x 0 + t⃗v) − f(⃗x 0 )) =: ∂ ⃗v f(⃗x 0 ) 

ḧ(0) = ∂ ⃗v (∂ ⃗v f))(⃗x 0 ) = ∂ 2 ⃗vf(⃗x 0 ), . . . , h (k) (0) = ∂ k ⃗v f(⃗x 0 ).


Aus der Taylor-Formel fur h : 

die 

h(t) := h(0) + ḣ(0) 

1! 

t + ḧ(0) 

2! 

t 2 + . . . h(k) (0) 

t k + h(k+1) (ξ) 

k! (k + 1)! tk+1 

Satz 3.7. Taylor-Formel für n Variable. Ist D ⊆ R n ein konvexes 

Gebiet, f k +1-mal stetig dierenzierbar, ⃗x ∈ D, dann gilt mit ⃗x+t⃗v ∈ D 

fur alle t ∈ [0, 1] : 

f(⃗x 0 + t⃗v) = f(⃗x 0 ) + 1 1! ∂ ⃗vf(⃗x 0 )t + 1 2! ∂2 ⃗vf(⃗x 0 )t 2 + . . . + 1 k! ∂k ⃗v f(⃗x 0 )t k + R k+1 (⃗x, ⃗v) 

mit dem Restglied 

R k+1 (⃗x, ⃗v) = 

und einer Zahl ξ zwischen 0 und t. 

1 

(k + 1)! ∂k+1 ⃗v 

f(⃗x 0 + ξ⃗v)t k+1 

Wir wollen uns einige Spezialfalle ansehen. Wie bereits gezeigt ist: 

∂ ⃗v f(⃗x 0 ) = grad f(⃗x 0 ) · ⃗v = 

n∑ 

f xj (⃗x 0 )v j . 

j=1 

Wir berechnen ∂ 2 ⃗v f(⃗x 0), 

∂⃗vf 2 1 

= ∂ ⃗v (∂ ⃗v f) = ∂ ⃗v (grad f · ⃗v) = lim 

t→0 

1 


t→0 t [(grad f(⃗x 0 + t⃗v) − grad f(⃗x 0 )) · ⃗v] = 

t [(grad f(⃗x 0 + t⃗v) · ⃗v) − (grad f(⃗x 0 ) · ⃗v)] 

[ 

] 

1 


t→0 t (grad f(⃗x 0 + t⃗v) − grad f(⃗x 0 )) · ⃗v 

= (grad ∂ x1 f(⃗x 0 ) · ⃗v) v 1 + (grad ∂ x2 f(⃗x 0 ) · ⃗v) v 2 + . . . + (grad ∂ xn f(⃗x 0 ) · ⃗v) v n 

= ∂ 2 x 1 

f(⃗x 0 )v 2 1 + ∂ x2 ∂ x1 f(⃗x 0 )v 2 v 1 + . . . + ∂ xn ∂ x1 f(⃗x 0 )v n v 1 + . . . + ∂ x1 ∂ xn f(⃗x 0 )v 1 v n + . . . ∂ 2 x n 

f(⃗x 0 )v 2 n 

= ⃗v T H f (⃗x 0 )⃗v, 

dabei bezeichnet H f (⃗x 0 ) die Hesse-Matrix von f an der Stelle ⃗x 0 . Kehren wir nun 

zuruck zu Taylor-Formel, so ist mit ⃗x = ⃗x 0 + t⃗v ⇐⇒ t⃗v = ⃗x − ⃗x 0 : 

∂ ⃗v f(⃗x 0 )t = grad f(⃗x 0 ) · (⃗vt) = 

und 

n∑ 

f xj (⃗x 0 )v j t = grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) = 

j=1 

n∑ 

f xj (⃗x 0 )(x j − x 0j ). 

j=1 

∂ 2 ⃗vf(⃗x 0 )t 2 = (⃗vt) T H f (⃗x 0 )(⃗vt) = (⃗x − ⃗x 0 ) T H f (⃗x 0 )(⃗x − ⃗x 0 ).


Taylor-Formel zum Entwicklungsgrad 2: Ist D ⊆ R n ein konvexes Gebiet, f 

3-mal stetig dierenzierbar, ⃗x 0 , ⃗x ∈ D : 

f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗x 0)(⃗x − ⃗x 0 ) + 1 2! (⃗x − ⃗x 0) T H f (⃗x 0 )(⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ), 

r(⃗x, ⃗x 

mit lim 0 ) 

⃗x→⃗x0 |⃗x−⃗x 0 | 2 

der Stelle ⃗x 0 . 

= 0, dabei bezeichnet H f (⃗x 0 ) die Hesse-Matrix von f an 

Bemerkung 3.3. Ist f nur 2-mal stetig dierenzierbar, so gilt unter den 

obigen Voraussetzungen: 

f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗x 0)(⃗x − ⃗x 0 ) + 1 2! (⃗x − ⃗x 0) T H f ( ⃗ ξ)(⃗x − ⃗x 0 ) 

mit ⃗ ξ = ⃗x 0 + τ(⃗x − ⃗x 0 ), fur irgendein τ ∈ [0, 1]. 

Ist f nur einmal stetig dierenzierbar, dann gilt 

f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗ ξ)(⃗x − ⃗x 0 ) 

mit ⃗ ξ = ⃗x 0 + τ(⃗x − ⃗x 0 ), fur irgendein τ ∈ [0, 1]. (Mittelwertsatz).

4. ZUSAMMENFASSUNG ABLEITUNGSBEGRIFFE FUR FUNKTIONEN MEHRERER VERANDERLICHER65 

4. Zusammenfassung Ableitungsbegriffe für Funktionen mehrerer 

Veränderlicher 

Es sei f : D → R auf der oenen Teilmenge D des R n deniert und stetig. 

Begri 

partielle Ableitung 

Denition 

1 

f xi (⃗x) = lim [f(⃗x + t⃗e 

t→0 t i) − f(⃗x)] 

f ist partiell dierenzierbar in ⃗x ∈ D, wenn alle partiellen Ableitungen von 

f in ⃗x ∈ D existieren. 

totales Dierential 

(vollstandiges Dierential) 

f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ) 

mit lim 

⃗x→⃗x0 

r(⃗x, ⃗x 0 ) 

|⃗x−⃗x 0 | 

= 0. 

Ist f einmal stetig dierenzierbar, so ist f total dierenzierbar mit ⃗a = 

grad f(⃗x 0 ) 

geometrisch: z = f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) ist die Tangentialebene an den 

Flachenpunkt (⃗x 0 , f(⃗x 0 )). Weiterhin ist z die beste lineare Approximation 

von f(⃗x) an der Stelle ⃗x 0 . 

Richtungsableitung 

1 

∂ ⃗v f(⃗x) = lim [f(⃗x + t⃗v) − f(⃗x)] , 

t→0 t 

⃗v ∈ R n , |⃗v| = 1. 

Ist f einmal stetig dierenzierbar, so ist ∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v. 

geometrisch: ∂ ⃗v f(⃗x) ist der Anstieg der Funktion f an der Stelle ⃗x in Richtung 

⃗v (⃗v ≠ ⃗0, |⃗v| = 1.) 

Bedeutungen des Gradienten: 

(1) Der Gradient ist der Vektor der ersten partiellen Ableitungen. 

(2) Der Gradient zeigt immer in Richtung des steilsten Anstiegs. 

(3) Der Gradient steht senkrecht auf den Niveauachen (Hohenlinien, Aquipotentialachen) 

f(⃗x) = c. 

Anwendungen: 

(1) Naherungsrechnung, 

(2) Fehlerrechnung, 

(3) Gradientenverfahren.

Differentialrechnung im Rn

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?