01.11.2013 Aufrufe

Differentialrechnung im Rn

Differentialrechnung im Rn

Differentialrechnung im Rn

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

KAPITEL 3<br />

<strong>Differentialrechnung</strong> für Funktionen mehrerer Veränderlicher<br />

1. Reellwertige Funktionen mehrerer reeller Veränderlicher<br />

1.1. Beschreibung von Funktionen mehrerer Veränderlicher.<br />

Definition 3.1. Unter einer reellen Funktion von n reellen Veranderlichen<br />

versteht man eine auf einer Teilmenge D ⊆ R n erklarte Funktion f : D → R<br />

mit Werten in R.<br />

Sie ordnet jedem Vektor ⃗x = (x 1 , x 2 , . . . , x n ) T ∈ D des Denitionsbereiches in<br />

eindeutiger Weise eine reelle Zahl y = f(⃗x) = f(x 1 , x 2 , . . . , x n ). Fur Funktionen in 2<br />

oder 3 Veranderlichen schreibt man ublicherweise f(x, y) bzw. f(x, y, z).<br />

Die Zuordnung ⃗x → f(x 1 , x 2 , . . . , x n ) kann gegeben sein<br />

(1) durch eine explizite Rechenvorschrift:<br />

f(x, y) = 3xy + 2x + 5y − 7,<br />

z<br />

x<br />

y<br />

z= sin x2 y 2 <br />

x 2 y 2<br />

(2) durch eine <strong>im</strong>plizite Vorschrift: z = f(x, y) mit<br />

x 2 + y 2 + z 2 = 1,<br />

(3) durch Dierential- oder Intergralgleichungen.<br />

Als besonders vorteilhaft zur Diskussion einer Funktion f : R n ⊇ D → R erweisen<br />

sich best<strong>im</strong>mte "<br />

Hilfsfunktionen\ zu betrachten, dies sind:<br />

42


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 43<br />

(1) die Niveaumengen oder Niveauhyperachen von f zum konstanten Niveau<br />

c ∈ R :<br />

z<br />

N c := {⃗x ∈ D : f(⃗x) = c}.<br />

{(x,y,c): c=f(x,y)}<br />

(x,y,f(x,y))<br />

ɛ<br />

{(x,y,z): z=f(x,y)}<br />

y<br />

(x,y) ɛ<br />

D<br />

N c<br />

={(x,y): f(x,y)=c}<br />

x<br />

(2) die "<br />

partiellen\ Funktionen von f :<br />

x i ↦→ f(a 1 , a 2 , . . . , a i−1 , x i , a i+1 , . . . , a n )<br />

mit ⃗a = (a 1 , . . . , a n ) ∈ D konstant,<br />

(3) der Graph der Funktion<br />

Γ f := {(⃗x, f(⃗x); ⃗x ∈ D} ⊆ R n+1 .<br />

Er besteht aus allen Punkten (x 1 , . . . , x n , x n+1 ) mit x n+1 = f(x 1 , . . . , x n )<br />

und kann somit als Niveauhyperache der Funktion<br />

F (x 1 , . . . , x n , x n+1 ) = x n+1 − f(x 1 , . . . , x n )<br />

zum Niveau 0 angesehen werden.<br />

Wir nennen F (x 1 , . . . , x n , x n+1 ) = 0 die <strong>im</strong>plizite und x n+1 = f(x 1 , . . . , x n )<br />

die explizite Darstellung des Graphen Γ f .<br />

Beispiel 3.1. Die Gerade 2x + 3y = 5 ist die Niveaukurve der Funktion<br />

f(x, y) = 2x + 3y zum Niveau c = 5. Die explizite Darstellung lautet y = − 2 3 x + 5 3 .<br />

Beispiel 3.2. Jeder Graph y = h(x) einer (stetigen) Funktion einer Variablen<br />

x kann als Niveaukurve F (x, y) = y − f(x) = 0 einer Funktion zweier Veranderlicher<br />

angesehen werden.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 44<br />

Beispiel 3.3. Fur n = 2 wird der Graph Γ f als Flache <strong>im</strong> R 3 veranschaulicht.<br />

D ist die Teilmenge der (x, y)-Ebene und uber (x, y) ∈ D liegt der Flachenpunkt<br />

(x, y, z) mit z = f(x, y).<br />

Die Graphen der "<br />

partiellen\ Funktionen z = f(a 1 , y) und z = f(x, a 2 ) entstehen<br />

durch Schnitt des Graphen Γ f mit den zur z-Achse parallelen Ebenen x = a 1 und<br />

y = a 2 .<br />

Uber der Niveaulinie f(x, y) = c in D liegen alle Punkte von Γ f mit derselben<br />

Hohe\ z = c. Sie ist die senkrechte Projektion der Schnittkurve der Flache z =<br />

"<br />

f(x, y) mit der Ebene z = c in der (x, y)-Ebene (Hohenlinien einer Landkarte).<br />

1.2. Grenzwerte und Stetigkeit. Begrie der anschaulichen Geometrie werden<br />

fur beliebige n ∈ N ubernommen. So wird der Abstand zweier Punkte ⃗x, ⃗y ∈ R n<br />

deniert durch<br />

∑<br />

|⃗x − ⃗y| = √ n (x i − y i ) 2 .<br />

Zu jedem festen ⃗a ∈ R n und r > 0 heit die Punktmenge<br />

r-Umgebung von ⃗a.<br />

i=1<br />

U r (⃗a) := {⃗x ∈ R n : |⃗x − ⃗a| < r}<br />

Beispiel 3.4. Fur n = 1 ist U r (a) das oene Intervall a − r < x < a + r.<br />

Fur n = 2 besteht U r (⃗a) aus allen Punkten der Kreisscheibe mit dem Mittelpunkt<br />

⃗a und dem Radius r ohne Randpunkte.<br />

Fur n = 3 ist U r (⃗a) eine Kugel mit dem Radius r um ⃗a ohne die Punkte der<br />

Kugeloberache.<br />

Definition 3.2. Sei D eine Teilmenge des R n .<br />

(1) Ein Punkt ⃗a ∈ D heit innerer Punkt von D, wenn es eine r-<br />

Umgebung von ⃗a gibt, die ganz in D enthalten ist.<br />

(2) D heit offen, wenn jeder Punkt von D ein innerer Punkt ist.<br />

(3) Ein Punkt ⃗ b ∈ R n heit Randpunkt von D, wenn jede r-Umgebung<br />

von ⃗ b sowohl mindestens einen Punkt aus D als auch mindestens<br />

einen nicht zu D gehorenden Punkt enthalt. Die Menge aller Randpunkte<br />

von D heit Rand von D und wird mit ∂D bezeichnet.<br />

(4) Eine Menge heit abgeschlossen, wenn sie alle ihre Randpunkte<br />

enthalt.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 45<br />

Definition 3.3. Sei f : R n ⊇ D → R und ⃗a ∈ D ∩ ∂D.<br />

(1) f hat den Grenzwert c ∈ R, d.h.<br />

l<strong>im</strong> f(⃗x) = c (bzw. f(⃗x) → c fur ⃗x → ⃗a),<br />

⃗x→⃗a<br />

wenn es zu jeder (beliebig kleinen) Schranke ε > 0 eine r-Umgebung<br />

U r (⃗a) gibt, so dass |f(⃗x) − c| ≤ ε fur alle ⃗x ∈ D ∩ U r (⃗a), ⃗x ≠ ⃗a, gilt.<br />

(2) f heit in ⃗a ∈ D stetig, wenn l<strong>im</strong> ⃗x→⃗a f(⃗x) = f(⃗a) gilt.<br />

(3) f heit auf D stetig, wenn f in allen ⃗a ∈ D stetig ist.<br />

Die Summe, das Produkt, der Quotient (Nenner ungleich Null) stetiger Funktionen<br />

sind stetig.<br />

z<br />

z<br />

Hier ist f(x,y) in<br />

(x 0<br />

,y 0<br />

)<br />

stetig.<br />

Hier ist f(x,y) in<br />

(x 0<br />

,y 0<br />

) nicht stetig.<br />

U ε<br />

(f(x 0<br />

,y 0<br />

))={z: |f(x 0<br />

,y 0<br />

)-z|


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 46<br />

Folglich ist f uberall stetig.<br />

Beispiel 3.6. Wo ist die Funktion<br />

{<br />

xy<br />

fur(x, y) ≠ (0, 0),<br />

x<br />

f(x, y) =<br />

2 +y 2<br />

0 fur(x, y) = (0, 0)<br />

stetig?<br />

z<br />

x<br />

y<br />

Fur (x, y) ≠ (0, 0) ist f als Quotient von stetigen Funktionen stetig. Es verbleibt<br />

f <strong>im</strong> Punkt (0, 0) zu untersuchen: Ubergang zu Polarkoordinaten: x = r cos ϕ, y =<br />

r sin ϕ, r ∈ R, ϕ ∈ [0, 2π).<br />

f(x, y) = ˜f(r, ϕ) =<br />

D.h., dass der Grenzwert<br />

r 2 cos ϕ sin ϕ<br />

r 2 cos 2 ϕ + r 2 sin 2 ϕ = cos ϕ sin ϕ = 1 2 sin(2ϕ)<br />

l<strong>im</strong> f(x, y) = l<strong>im</strong> sin(2ϕ) = sin(2ϕ)<br />

(x,y)→(0,0)<br />

r→0<br />

∀ϕ ∈ [0, 2π).<br />

nicht existiert. Oensichtlich hangt der Grenzwert nicht vom Radius, sondern<br />

vom Winkel ϕ ab. Geometrisch sind Gebilde, wo der Radius r variiert und<br />

der Winkel ϕ konstant ist, Geraden durch den Ursprung, deren Anstieg durch<br />

ϕ best<strong>im</strong>mt wird. Wir betrachten deshalb den Grenzwert entlang der Geraden<br />

y = x = t und y = 2x = 2t, mit dem Parameter t ∈ R. Dann gilt fur y = x = t :<br />

t 2<br />

l<strong>im</strong><br />

t→0 t 2 + t = 1 2 2 .<br />

Dagegen erhalt man fur y = 2x = 2t :<br />

2t 2<br />

l<strong>im</strong><br />

t→0 t 2 + 4t = 2 2 5 .<br />

Der Grenzwert ist aber, wenn er existiert eindeutig best<strong>im</strong>mt. Deshalb existiert<br />

der Grenzwert l<strong>im</strong> (x,y)→(0,0)<br />

xy<br />

x 2 +y 2<br />

l<strong>im</strong><br />

x→0<br />

nicht. Dagegen existieren die Grenzwerte<br />

f(x, 0) = 0 = l<strong>im</strong> f(0, y).<br />

y→0<br />

Bemerkung 3.1. Die Stetigkeit von z = f(x, y) in (x 0 , y 0 ) ergibt sich jedoch<br />

nicht aus der Stetigkeit der "<br />

partiellen\ Funktionen x ↦→ f(x, y 0 ) und<br />

y ↦→ f(x 0 , y). Sondern man musste nachweisen, das fur alle moglichen Kurven<br />

(x(t), y(t)) → (x 0 , y 0 ) die Funktion f(x, y) <strong>im</strong>mer den gleichen Grenzwert hat.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 47<br />

Diese Vorgehensweise ist deshalb nur gunstig, um die Unstetigkeit zu zeigen,<br />

d.h. es gibt zwei Kurven wo verschiedene Grenzwerte angenommen werden.<br />

Beispiel 3.7. Wo ist die Funktion<br />

{<br />

xy 2<br />

fur(x, y) ≠ (0, 0),<br />

f(x, y) =<br />

x 2 +y 4<br />

0 fur(x, y) = (0, 0)<br />

stetig?<br />

z = xyy/(xx+yyyy)<br />

z<br />

x<br />

y<br />

Fur (x, y) ≠ 0 ist die Funktion als Quotient stetiger Funktionen wieder stetig. Es<br />

verbleibt die Funktion in (0, 0) zu untersuchen. Es gilt f(x, 0) = 0, x ∈ R und<br />

f(0, y) = 0, y ∈ R. Trotzdem ist f(x, y) in (0, 0) nicht stetig, da bei Annaherung<br />

langs der Geraden ( t<br />

, t 4 2)<br />

gilt<br />

l<strong>im</strong><br />

t→0<br />

t t 2<br />

4 4<br />

t 2 + t4<br />

4 16<br />

t 3<br />

= l<strong>im</strong><br />

t→0 4t 2 + t = l<strong>im</strong> 4 t→0<br />

aber bei der Annaherung langs (t 2 , t) gilt<br />

t 2 t 2<br />

l<strong>im</strong><br />

t→0 t 4 + t = l<strong>im</strong> 1<br />

4 t→0 2 = 1 2 .<br />

1.3. Partielle Ableitungen und Gradient.<br />

t<br />

4 + t 2 = 0<br />

Definition 3.4. Sei D ⊆ R n oen, f : D → R und ⃗a = (a 1 , a 2 , . . . , a n ) ∈ D.<br />

Existiert die Ableitung der "<br />

partiellen\ Funktion<br />

x i ↦→ f(a 1 , . . . , a i−1 , x i , a i+1 , . . . , a n )<br />

an der Stelle x i = a i , so nennt man diese die partielle Ableitung von f nach<br />

x i <strong>im</strong> Punkt ⃗a; sie wird mit<br />

bezeichnet.<br />

∂f(⃗x)<br />

∂x i<br />

∣<br />

∣∣∣⃗x=⃗a<br />

oder<br />

∂f<br />

∂x i<br />

(⃗a)<br />

oderf xi (⃗a)<br />

Die Berechnung erfolgt wie fur eine Funktion einer Veranderlichen. Es gilt<br />

∂f(⃗x)<br />

∂x i<br />

:= l<strong>im</strong><br />

t→0<br />

1<br />

t [f(x 1, . . . , x i + t, . . . , x n ) − f(x 1 , . . . , x i , . . . , x n )] = l<strong>im</strong><br />

t→0<br />

1<br />

t [f(⃗x + t⃗e i) − f(⃗x)].


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 48<br />

Bezeichnungen fur hohere partielle Ableitungen:<br />

f xx = ∂2 f<br />

∂x 2 ,<br />

f xy = (f x ) y = ∂ ∂y<br />

( ) ∂f<br />

, . . .<br />

∂x<br />

Definition 3.5. f heit (stetig) partiell dierenzierbar, wenn alle partiellen<br />

Ableitungen f xi existieren (und stetig sind).<br />

Beispiel 3.8. f(x, y) = x 2 y 3 + y ln x, (x > 0). Dann sind die 1. partiellen<br />

Ableitungen:<br />

f x (x, y) = 2xy 3 + y 1 x ,<br />

f y(x, y) = x 2 3y 2 + ln x<br />

und die 2. partiellen Ableitungen:<br />

f xx (x, y) = xy 3 − y x 2 , f yy(x, y) = 6x 2 y, f xy (x, y) = 6xy 2 + 1 x = f yx(x, y).<br />

Definition 3.6. f heit k-mal (stetig) partiell dierenzierbar, wenn alle k-<br />

ten partiellen Ableitungen f xi existieren (und stetig sind).<br />

Satz 3.1. Satz von Schwarz. Fur jede zwe<strong>im</strong>al stetig partiell dierenzierbare<br />

Funktion f : D → R, D ⊆ R n oen, gilt<br />

( )<br />

∂ ∂f<br />

= ∂ ( ) ∂f<br />

, 1 ≤ i, j ≤ n.<br />

∂x i ∂x j ∂x j ∂x i<br />

Definition 3.7. Ist f : D → R partiell dierenzierbar, so heit der Vektor<br />

der ersten partiellen Ableitungen <strong>im</strong> Punkt ⃗x Gradient von f an der Stelle<br />

⃗x :<br />

⎛ ∂f ⎞<br />

∂x 1<br />

(⃗x)<br />

∂f<br />

∂x<br />

grad f(⃗x) := ⎜<br />

2<br />

(⃗x)<br />

⎟<br />

⎝ . ⎠ ∈ <strong>Rn</strong> .<br />

∂f<br />

∂x n<br />

(⃗x)


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 49<br />

Beispiel 3.9. f(x, y, z) = e x+2y + 2x sin z + z 2 xy,<br />

grad f(x, y, z) =<br />

⎛<br />

⎜<br />

⎝<br />

f x (x, y, z)<br />

f y (x, y, z)<br />

f z (x, y, z)<br />

⎞<br />

⎟<br />

⎠ =<br />

⎛<br />

⎜<br />

⎝<br />

e x+2y + 2 sin z + z 2 y<br />

2e x+2y + xz 2<br />

2x cos z + 2zxy<br />

Beispiel 3.10. Man best<strong>im</strong>me ggf. die ersten partiellen Ableitungen von f,<br />

den Gradienten von f sowie grad f(1, 1) von<br />

⎞<br />

⎟<br />

⎠<br />

f(x, y) =<br />

{<br />

x 2 −y 2<br />

,<br />

x 2 +y 2 fur (x, y) ≠ (0, 0),<br />

1 fur (x, y) = (0, 0).<br />

Fur die ersten partiellen Ableitungen erhalt man<br />

f x (x, y) = 2x(x2 +y 2 )−2x(x 2 −y 2 )<br />

(x 2 +y 2 ) 2 = 4xy2<br />

(x 2 +y 2 ) 2 fur (x, y) ≠ (0, 0),<br />

f y (x, y) = −2y(x2 +y 2 )−2y(x 2 −y 2 )<br />

(x 2 +y 2 ) 2 = −4x2 y<br />

(x 2 +y 2 ) 2 fur (x, y) ≠ (0, 0).<br />

Fur die partiellen Ableitungen in (0, 0) erhalt man<br />

[ ]<br />

1<br />

1 t<br />

2<br />

f x (0, 0) = l<strong>im</strong> [f(0 + t, 0) − f(0, 0)] = l<strong>im</strong><br />

t→0 t t→0 t t − 1 = 0.<br />

2<br />

Die partielle Ableitung f y existiert dagegen in (0, 0) nicht, da die partielle Funktion<br />

f(0, y) in (0, 0) unstetig ist, da<br />

f(0, y) =<br />

{<br />

−1, y ≠ 0,<br />

1, y = 0,<br />

bzw. aus der Denition der partiellen Ableitung ergibt sich:<br />

[ ]<br />

1<br />

1 −t<br />

2<br />

−2<br />

f y (0, 0) = l<strong>im</strong> [f(0, 0 + t) − f(0, 0)] = l<strong>im</strong> − 1 = l<strong>im</strong><br />

t→0 t t→0 t t 2 t→0 t<br />

und dieser Grenzwert existiert nicht. Damit gilt fur den Gradienten:<br />

⎧<br />

⎪⎨<br />

grad f(x, y) =<br />

⎪⎩<br />

Insbesondere ist grad f(1, 1) =<br />

(<br />

4xy<br />

(x 2 +y 2 ) 2<br />

(<br />

y<br />

−x<br />

)<br />

, fur (x, y) ≠ (0, 0),<br />

existiert nicht fur (x, y) = (0, 0).<br />

1<br />

−1<br />

)<br />

.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 50<br />

Definition 3.8. Es sei f : R n ⊆ D → R, eine in ⃗x ∈ D zwe<strong>im</strong>al dierenzierbare<br />

Funktion mit den 2. partiellen Ableitungen<br />

( )<br />

∂ ∂f<br />

= ∂2 f<br />

, i, j = 1, 2, . . . , n.<br />

∂x i ∂x j ∂x i ∂x j<br />

Dann heit die Matrix der 2. partiellen Ableitungen<br />

⎛<br />

∂ 2 f<br />

∂<br />

∂x 1 ∂x 1<br />

(⃗x)<br />

2 f<br />

∂x 1 ∂x 2<br />

(⃗x) . . .<br />

H f (⃗x) :=<br />

⎜<br />

⎝<br />

∂ 2 f<br />

∂x 2 ∂x 1<br />

(⃗x)<br />

.<br />

∂ 2 f<br />

∂x n ∂x 1<br />

(⃗x)<br />

Hesse-Matrix von f an der Stelle ⃗x.<br />

∂ 2 f<br />

∂x 2 ∂x 2<br />

(⃗x) . . .<br />

.<br />

...<br />

∂ 2 f<br />

∂x n ∂x 2<br />

(⃗x) . . .<br />

∂ 2 f<br />

⎞<br />

∂x 1 ∂x n<br />

(⃗x)<br />

∂ 2 f<br />

∂x 2 ∂x n<br />

(⃗x)<br />

⎟<br />

. ⎠<br />

∂ 2 f<br />

∂x n ∂x n<br />

(⃗x)<br />

1.4. Totales Differential.<br />

Definition 3.9. Sei D ⊆ R n oen. Eine Funktion f : D → R heit in ⃗x 0<br />

total differenzierbar (oder linear approx<strong>im</strong>ierbar), wenn es einen Vektor<br />

⃗a ∈ R n gibt mit<br />

f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )<br />

(fur ⃗x nahe ⃗x 0 ) mit l<strong>im</strong> ⃗x→⃗x0<br />

r(⃗x, ⃗x 0 )<br />

|⃗x−⃗x 0 |<br />

= 0 gibt.<br />

Satz 3.2. Ist f in ⃗x 0 ∈ D total dierenzierbar, d.h.<br />

dann gilt:<br />

f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ),<br />

(1) f ist stetig in ⃗x 0 ;<br />

(2) 1 l<strong>im</strong><br />

t→0 t [f(⃗x 0 + t⃗v) − f(⃗x 0 )] = ⃗a · ⃗v, fur alle ⃗v ∈ R n , ⃗v ≠ ⃗0;<br />

(3) f ist partiell dierenzierbar und ⃗a eindeutig best<strong>im</strong>mt als ⃗a =<br />

grad f(⃗x 0 ).<br />

Beweis: zu 1.: Aus der Denition der totalen Dierenzierbarkeit folgt<br />

l<strong>im</strong> (f(⃗x) − f(⃗x 0 )) = l<strong>im</strong> (⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )) = 0.<br />

⃗x→⃗x 0 ⃗x→⃗x0<br />

zu 2.: Sei ⃗x = ⃗x 0 + t⃗v dann ergibt sich aus der totalen Dierenzierbarkeit<br />

l<strong>im</strong><br />

t→0<br />

1<br />

t [f(⃗x 0 + t⃗v) − f(⃗x 0 )] = l<strong>im</strong><br />

t→0<br />

1<br />

t [⃗a · (t⃗v) + r(⃗x 0 + t⃗v, ⃗x 0 )] = ⃗a · ⃗v,


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 51<br />

da<br />

r(⃗x 0 + t⃗v, ⃗x 0 )<br />

l<strong>im</strong><br />

t→0 |t⃗v|<br />

= 0.<br />

zu 3. Fur ⃗v = ⃗e i erhalt man aus 2.<br />

∂f<br />

∂x i<br />

(⃗x 0 ) = ⃗a · ⃗e i = a i<br />

(die i-te Koordinate von ⃗a.)<br />

□<br />

Insbesondere folgt also aus der totalen Dierenzierbarkeit die Existenz der ersten<br />

partiellen Ableitungen und aller Richtungsableitungen <strong>im</strong> Punkt ⃗x 0 . Die Umkehrung<br />

gilt nur fur stetig dierenzierbare Funktionen, d.h.<br />

Satz 3.3. Jede einmal stetig (partiell) dierenzierbare Funktion f : D →<br />

R, D ⊆ R n oen, ist in allen Punkten von D total dierenzierbar.<br />

Beweis: Fur n = 2 : Sei (x 0 , y 0 ) ∈ D. Fur alle (x, y) aus einer hinreichend kleinen<br />

r-Umgebung U r (x 0 , y 0 ) ⊆ D gilt nach dem Mittelwertsatz fur Funktionen einer<br />

Veranderlichen:<br />

f(x, y) − f(x 0 , y 0 ) = f(x, y) − f(x 0 , y) + f(x 0 , y) − f(x 0 , y 0 )<br />

= f x (ξ, y)(x − x 0 ) + f y (x 0 , η)(y − y 0 )<br />

mit ξ zwischen x und x 0 sowie η zwischen y und y 0 . Damit ist<br />

( )<br />

x − x<br />

f(x, y) = f(x 0 , y 0 ) + grad f(x 0 , y 0 ) ·<br />

0<br />

+ R(x, y)<br />

y − y 0<br />

mit der Funktion<br />

R(x, y) = [f x (ξ, y) − f x (x 0 , y 0 )] (x − x 0 ) + [f y (x 0 , η) − f y (x 0 , y 0 )] (y − y 0 ).<br />

Fur diese Funktion gilt<br />

|R(x, y)|<br />

|(x, y) − (x 0 , y 0 )| ≤ |f x(ξ, y) − f x (x 0 , y 0 )| |x − x 0 |<br />

+ |f y(x 0 , η) − f y (x 0 , y 0 )| |y − y 0 |<br />

|(x, y) − (x 0 , y 0 )|<br />

|(x, y) − (x 0 , y 0 )|<br />

|x − x 0 |<br />

= |f x (ξ, y) − f x (x 0 , y 0 )| √<br />

|x − x0 | 2 + |y − y 0 | + |f |y − y 0 |<br />

y(x 0 , η) − f y (x 0 , y 0 )| √ 2 |x − x0 | 2 + |y − y 0 | 2<br />

≤ |f x (ξ, y) − f x (x 0 , y 0 )| + |f y (x 0 , η) − f y (x 0 , y 0 )| → 0 fur (x, y) → (x 0 , y 0 ),<br />

da die ersten partiellen Ableitungen stetig sind.<br />


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 52<br />

Ist f : D → R in einer Umgebung von ⃗x 0 total dierenzierbar, dann ist<br />

g(⃗x) := f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 )<br />

die beste lineare Approx<strong>im</strong>ation von f(⃗x 0 ) nahe bei ⃗x 0 .<br />

Anschauliche Deutung fur n = 2 : Die "<br />

uber\ D ⊆ R 2 liegende Flache (der Graph)<br />

z = f(x, y) wird in der Nahe des Flachenpunktes (x 0 , y 0 , f(x 0 , y 0 )) durch die Ebene<br />

z − z 0 = z − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />

⇐⇒ z − f x (x 0 , y 0 )x − f y (x 0 , y 0 )y = (f(x 0 , y 0 ) − f x (x 0 , y 0 )x 0 − f y (x 0 , y 0 )y 0 )<br />

Diese Ebene heit Tangentialebene der Flache z = f(x, y) <strong>im</strong> Punkt (x 0 , y 0 , f(x 0 , y 0 )).<br />

Sie enthalt samtliche Flachentangenten.<br />

Satz 3.4. Jede einmal stetig dierenzierbare Funktion f : D → R, (D ⊆<br />

R n oen) ist auf D (d.h. in allen Punkten von D) total dierenzierbar.<br />

z<br />

n<br />

Tangentialebene<br />

f(x 0<br />

,y 0<br />

)<br />

.<br />

y<br />

. (x0 ,y 0 )<br />

n =(<br />

-f x<br />

(x 0<br />

,y 0<br />

)<br />

-f y<br />

(x 0<br />

,y 0<br />

))<br />

1<br />

x<br />

z−f x 0<br />

, y 0<br />

=f x<br />

x 0<br />

, y 0<br />

x−x 0<br />

f y<br />

x 0<br />

, y 0<br />

y−y 0<br />

<br />

⇔−f x<br />

x 0<br />

,y 0<br />

x−f y<br />

x 0<br />

, y 0<br />

yz=f x 0<br />

, y 0<br />

−f x<br />

x 0<br />

,y 0<br />

x 0<br />

−f y<br />

x 0<br />

, y 0<br />

y 0<br />

Beispiel 3.11. In der Umgebung von (1, 1) lautet die lineare Approx<strong>im</strong>ation<br />

der einmal stetig dierenzierbaren Funktion f(x, y) = x 4 + 2x 3 y 2 + y :<br />

( )<br />

x − 1<br />

f(x, y) = f(1, 1) + grad f(1, 1) ·<br />

+ r((x, y); (1, 1))<br />

y − 1<br />

Dementsprechend ist<br />

= 4 + 10(x − 1) + 5(y − 1) + r((x, y); (1, 1)).<br />

z = 4 + 10(x − 1) + 5(y − 1)


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 53<br />

die Gleichung der Tangentialebene der Flache z = x 4 +2x 3 y 2 +y <strong>im</strong> Flachenpunkt<br />

(1, 1, 4).<br />

Anwendung 3.1. Fehlerrechnung und Näherungsrechnung. Es werden statt<br />

der wahren Werte ⃗x = (x 1 , . . . , x n ) die Naherungswerte ⃗x 0 = (x 10 , . . . , x n0 ) gemessen.<br />

Wie wirkt sich das auf y = f(⃗x) aus? Fur kleine |∆⃗x| = |⃗x − ⃗x 0 | ist der<br />

Fehler r(⃗x, ⃗x 0 ) vernachlassigbar klein, so ergibt sich "<br />

in erster Naherung\ fur<br />

y = f(⃗x) :<br />

∆y = f(⃗x 0 + ∆⃗x) − f(⃗x 0 ) ≈ grad f(⃗x 0 ) · ∆⃗x =<br />

n∑<br />

j=1<br />

∂f<br />

∂x j<br />

(⃗x 0 )∆x j .<br />

Kennt man nun die Megenauigkeit von ∆x j , so erhalt man als ungefahre Fehlerschranke<br />

fur ∆y :<br />

n∑<br />

|∆y| = |∆f(⃗x)| = |f(⃗x) − f(⃗x 0 )| ≈<br />

∂f<br />

∣ (⃗x 0 )<br />

∂x j<br />

∣ |∆x j|<br />

fur ⃗x nahe bei ⃗x 0 .<br />

Fur die Naherungrechnung bedeutet das, dass<br />

j=1<br />

f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 )<br />

eine gute Naherung fur f(⃗x) darstellt, wenn ⃗x 0 nur nahe genug bei ⃗x liegt.<br />

Beispiel 3.12. f(x, y) = x y = e y ln x wird in (1, 3) angenahert durch<br />

f(x, y) ≈ 1 + 3(x − 1) + 0(y − 1).<br />

Man erhalt f(1, 02; 3, 01) ≈ 1 + 3(1, 02 − 1) = 1, 06. Der genaue Wert ist 1, 02 3,01 =<br />

1, 061418168 . . . .<br />

Bemerkung 3.2. Ausgehend von der Naherung<br />

∆y ≈<br />

n∑<br />

j=1<br />

∂f<br />

∂x j<br />

(⃗x 0 )∆x j<br />

schreibt man fur das totale Dierential einer Funktion f : D → R n , D ⊆ R n<br />

(oen) <strong>im</strong> Punkt ⃗x 0 auch:<br />

df(⃗x 0 ) =<br />

n∑<br />

j=1<br />

∂f<br />

∂x j<br />

(⃗x 0 )dx j .<br />

Dabei sind die dx i die Dierentiale der Koordinaten x 1 , x 2 , . . . , x n .<br />

Beispiel 3.13. Anwendungsbeispiel: Fehlerrechnung zum Schubmodul<br />

Dieses Beispiel ist entnommen von:<br />

http://193.175.144.216/praktikumsversuche/elastizitaet.pdf


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 54<br />

Best<strong>im</strong>mung des Schubmoduls: Ein Draht aus Metall, dessen Torsionsmodul best<strong>im</strong>mt<br />

werden soll, ist an seinem oberen Ende fest eingespannt. Sein freies unteres<br />

Ende ist in einem rotationssymmetrischen Korper K 1 mit dem Tragheitsmoment<br />

J 1 eingeklemmt.<br />

Dreht man nun diesen Korper aus seiner Ruhelage, so wirkt auf ihn ein Ruckstellmoment<br />

M aufgrund der Verdrillung des Drahtes. Dieses Ruckstellmoment<br />

ist bei kleiner Auslenkung proportional dem Auslenkwinkel ϕ :<br />

M = D ∗ ϕ,<br />

dabei ist das Richtmoment D ∗ durch das Material und die Abmessung des Drahtes<br />

gegeben:<br />

D ∗ = π r4 G<br />

2L ,<br />

wobei r der Radius, L die Lange des Drahtes und G der Schubmodul des Materials<br />

sind.<br />

Lasst man nun den Korper aus dieser Lage los, so fuhrt er um seine Ruhelage<br />

Drehschwingungen durch mit der Schwingzeit:<br />

T 1 = 2π<br />

√<br />

J1<br />

D ∗ (5)<br />

Daraus lasst sich der Schubmodul best<strong>im</strong>men, wenn das unbekannte Tragheitsmoment<br />

J 1 el<strong>im</strong>iniert werden kann. Dazu wird mit einem Zusatzkorper K 2 der<br />

Masse m 2 mit berechenbarem Tragheitsmoment die Schwingungsdauer T 2 best<strong>im</strong>mt.<br />

J 2 = m 2<br />

2 (R2 1 + r2) 2 siehe Abb. 1.<br />

Bei der Verwendung anderer Zusatzkorper gilt der Steinersche Satz:<br />

so dass<br />

J 2 = m 2<br />

2<br />

[<br />

(r<br />

2<br />

1 + r 2 2) + 2a 2] siehe Abb. 2,<br />

√<br />

2L<br />

T 2 = 2π<br />

G π r (J 4 1 + J 2 ) (6)<br />

ist. Aus den Gleichungen (5) und der Formel fur D ∗ sowie (6) erhalt man:<br />

und damit ist<br />

T2 2 = 4π 2 2L<br />

G π r (J 4 1 + J 2 ),<br />

T1 2 = 4π 2 J 1<br />

D = 2L<br />

∗ 4π2 g π r J 4 1<br />

T2 2 − T1 2 = 4π 2 2L<br />

g π r J 4 2 = 8π L m 2<br />

[<br />

(r<br />

2<br />

G r 4 2 1 + r2) 2 + 2a 2]<br />

und die Formel fur den Schubmodul G lautet<br />

G = 8π L m 2<br />

2 [(r2 1 + r 2 2) + 2a 2 ]<br />

(T 2 2 − T 2 1 ) r 4 .


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 55<br />

Werte und Fehler (und wie ermittelt)<br />

Groe Wert W Fehler ∆W Best<strong>im</strong>mung des Fehlers<br />

L 2, 15m ∆L = 3 · 10 −3 m Schatzung<br />

m 2 0, 487kg ∆m 2 = 100 · 10 −6 kg Genauigkeit der Waage<br />

r 1 2 · 10 −3 m ∆r 1 = 0, 1 · 10 −3 m Schatzung<br />

r 2 20 · 10 −3 m ∆r 2 = 0, 1 · 10 −3 m Schatzung<br />

a 40 · 10 −3 m ∆a = 0, 1 · 10 −3 m Schatzung<br />

T 1 2, 21s ∆T 1 = 20 · 10 −3 s Schatzung aus 10 gemessenen Perioden<br />

T 2 2, 534s ∆T 1 = 20 · 10 −3 s Schatzung aus 10 gemessenen Perioden<br />

r 0, 763 · 10 −3 m ∆r = 10, 4 · 10 −6 m Standardabweichung aus mehreren Messungen<br />

Der max<strong>im</strong>ale Grotfehler ergibt sich nun aus<br />

∣ ∣ ∣ ∣ |∆G| ≤<br />

∂G<br />

∣∣∣ ∣ ∂L ∣ · |∆L| + ∂G ∣∣∣ · |∆m 2 | +<br />

∂G ∣∣∣ ∂m 2<br />

∣ · |∆r 1 | +<br />

∂G ∣∣∣<br />

∂r 1<br />

∣ · |∆r 2 |<br />

∂r 2 ∣ ∣ ∣ +<br />

∂G<br />

∣∣∣ ∣ ∂a ∣ · |∆a| + ∂G ∣∣∣ · |∆T 1 | +<br />

∂G ∣∣∣ ∂T 1<br />

∣ · |∆T 2 | +<br />

∂G<br />

∂T 2<br />

∣ ∂r ∣ · |∆r| .


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 56<br />

Wir benotigen somit die folgenden partiellen Ableitungen:<br />

∂G<br />

∂L<br />

=<br />

8π ·<br />

m2<br />

2 · (r2 1 + r 2 2 + 2a 2 )<br />

(T 2 2 − T 2 1 ) · r 4 = G L ;<br />

∂G<br />

= 8π · L · 1 · 2 (r2 1 + r2 2 + 2a 2 )<br />

= G ;<br />

∂m 2 (T2 2 − T1 2 ) · r 4 m 2<br />

∂G<br />

∂r 1<br />

=<br />

∂G<br />

∂r 2<br />

=<br />

∂G<br />

∂a<br />

∂G<br />

∂T 1<br />

=<br />

8π · L ·<br />

m2<br />

2 · 2r 1<br />

(T 2 2 − T 2 1 ) · r 4 ;<br />

8π · L ·<br />

m2<br />

2 · 2r 2<br />

(T 2 2 − T 2 1 ) · r 4 ;<br />

=<br />

8π · L ·<br />

m2<br />

2 · 2 · 2a<br />

(T 2 2 − T 2 1 ) · r 4 ;<br />

8π · L ·<br />

m2<br />

2 · (r2 1 + r 2 2 + 2a 2 ) · 2T 1 · r 4<br />

((T 2 2 − T 2 1 ) · r 4 ) 2 ;<br />

m2<br />

∂G 8π · L ·<br />

= − · 2 (r2 1 + r2 2 + 2a 2 ) · (−2T 2 ) · r 4<br />

;<br />

∂T 2 ((T2 2 − T1 2 ) · r 4 ) 2<br />

∂G<br />

∂r<br />

m2<br />

(−4) · 8π · L ·<br />

2<br />

= · (r2 1 + r2 2 + 2a 2 )<br />

= (−4) · G .<br />

(T2 2 − T1 2 ) · r 5 r<br />

Setzt man nun die Zahlenwerte ein, so erhalt man die Abschatzungen fur den<br />

Betrag der partiellen Ableitungen. Multipliziert man diese nun mit den Werten<br />

fur die entsprechenden Fehler so erhalt man:<br />

∂G<br />

∣ ∂L ∣ · |∆L| = 0, 127 · N ∣ ∣ ∣∣∣ 109 m ; ∂G ∣∣∣<br />

· |∆m 2 2 | = 18, 7 · 10 6 N ∂m 2 m ;<br />

∣ 2 ∂G ∣∣∣<br />

∣ · |∆r 1 | = 10, 10 · 10 6 N ∣ ∣ ∣∣∣<br />

∂r 1 m ; ∂G ∣∣∣<br />

· |∆r 2 2 | = 0, 101 · 10 9 N ∂r 2 m ;<br />

2 ∂G<br />

∣ ∂a ∣ · |∆a| = 0, 404 · N ∣ ∣ ∣∣∣ 109 m ; ∂G ∣∣∣<br />

· |∆T 2 1 | = 5, 2 · 10 9 N ∂T 1 m ;<br />

∣ 2 ∂G ∣∣∣<br />

∣ · |∆T 2 | = 6 · 10 9 N ∣ ∣∣∣<br />

∂T 2 m ; ∂G<br />

2 ∂r ∣ · |∆r| = 4, 96 · N 109 m ; 2<br />

Damit ist der max<strong>im</strong>ale Grotfehler<br />

und wir erhalten<br />

sowie als relativen Grotfehler<br />

|∆G| ≤ 1, 68 · 10 10 N m 2<br />

G = 9, 1 · 10 10 N m 2 ± 1, 7 · 1010 N m 2<br />

∆G<br />

G<br />

= 18, 5%.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 57<br />

Der Literaturwert fur Stahl ist 8, 04 · 10 10 N m 2 . Zum Vergleich, der Literaturwert<br />

fur Kupfer ist 4, 55 · 10 10 N m 2 .<br />

Beispiel 3.14. Best<strong>im</strong>mung der Erdbeschleunigung mit einem Kugelfallgerat.<br />

Dieses Beispiel ist entnommen<br />

http://www.fh-gelsenkirchen.de/fb02/homepages/schmiler/Vordrucke/Fehlerrechnung.pdf<br />

Zur Best<strong>im</strong>mung der Erdbeschleunigung g wird eine Kugel der Masse m aus der<br />

Hohe h fallengelassen. Best<strong>im</strong>mt werden die Hohe mit einem Maband sowie<br />

die Fallzeit mit einer Stoppuhr. Aus diesen beiden Groen kann man dann mit<br />

Hilfe der Beziehung<br />

die gesuchte Fallbeschleunigung zu<br />

best<strong>im</strong>mt werden.<br />

h = 1 2 gt2<br />

g = 2h<br />

t 2<br />

Der absolute Grotfehler ergibt sich dann aus<br />

∣ ∣ ∣ (<br />

|∆g| ≤<br />

∂g ∣∣∣<br />

∣∂h · ∆h +<br />

∂g ∣∣∣<br />

∣ ∂t · ∆t =<br />

2 ∣∣∣<br />

∣t · ∆h +<br />

2 ∣ − 4h )<br />

· ∆t<br />

t 3 ∣ .<br />

Dabei wird eine Zahl mit zugehoriger Einheit eingesetzt.<br />

Um besser ersehen zu konnen, welche der beiden Messgroen den starkeren<br />

Einuss auf das Ergebnis ausubt, berechnet man den relativen Grotfehler:<br />

∣ ∣ ∆g ∣∣∣∣ 2<br />

∣∣∣∣<br />

g ≤ t 2<br />

· ∆h<br />

∣ + − 4h<br />

∣ ∣ t 3<br />

∣∣∣<br />

· ∆t<br />

2h<br />

∣ = ∆h<br />

∣∣∣ h ∣ + 2 ∆t<br />

t ∣ .<br />

2h<br />

t 2<br />

t 2<br />

Folglich wird sich ein Fehler in der Zeitmessung (Faktor 2) <strong>im</strong>mer starker auswirken<br />

als ein Fehler bei der Best<strong>im</strong>mung der Fallhohe (Faktor 1). Auerdem<br />

ergeben sich einheitslose Groen. Um die Abweichungen konkret berechnen zu<br />

konnen, benotigt man noch Zahlenwerte fur ∆h bzw. ∆t. Diese Abweichungen<br />

bzw. Messungenauigkeiten ergeben sich je nach gewahltem Messverfahren wie<br />

folgt:<br />

• Hat man eine Messreihe (z.B. 10 oder mehr verschiedene Messungen)<br />

fur die entsprechende Groe x, so berechnet man die Standardabweichung<br />

s des Mittelwerts x = 1 n ∑<br />

n i=1 x i:<br />

√ ∑n<br />

i=1<br />

s =<br />

(x i − x)<br />

.<br />

n − 1<br />

• Hat man die entsprechende Groe nur einmal gemessen, so ist die Messungenauigkeit<br />

einzusetzen. Dabei liegt es <strong>im</strong> Ermessen der versuchsdruchfuhrenden<br />

Person, wie hoch diese Ungenauigkeit anzusetzen ist.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 58<br />

Bei sehr genauen Messungen kann z.B. die Halfte des kleinsten Skalenteils<br />

angesetzt werden, wahrend bei anderen Messungen u.U. eine<br />

groere Ungenauigkeit angenommen werden muss.<br />

• Wird die Messungen mit Hilfe eines Gerats durchgefuhrt, so gibt in der<br />

Regel die Hersteller die Messungenauigkeit an.<br />

1.5. Richtungsableitung. Die partiellen Ableitungen ∂f<br />

∂x j<br />

(⃗x) geben die "<br />

momentane\<br />

Anderung der Funktionswerte in Richtung der Koordinatenachsen an.<br />

Zu jedem Vektor ⃗v ∈ R n , ⃗v ≠ ⃗0, nenne wir den Grenzwert<br />

1<br />

∂ ⃗v f(⃗x) := l<strong>im</strong> [f(⃗x + t⃗v) − f(⃗x)]<br />

t→0 t<br />

(sofern er existiert) die Ableitung von f an der Stelle ⃗x langs ⃗v.<br />

Definition 3.10. Ist ⃗v eine Einheitsvektor (|⃗v| = 1), dann heit ∂ ⃗v f(⃗x) =<br />

(⃗x) Richtungsableitung von f an der Stelle ⃗x in Richtung ⃗v.<br />

∂f<br />

∂⃗v<br />

Betrachtet man die Einschrankung von f langs der Geraden ⃗x + t⃗v, also<br />

dann gilt nach Denition<br />

und deshalb<br />

h(t) := f(⃗x + t⃗v),<br />

ḣ(0) := d ∣<br />

∣∣∣t=0<br />

dt f(⃗x + t⃗v) 1<br />

= l<strong>im</strong><br />

t→0 t [f(⃗x + t⃗v) − f(⃗x)] = ∂ ⃗vf(⃗x),<br />

∂ ⃗v f(⃗x) > 0 ⇒ f(⃗x) n<strong>im</strong>mt in Richtung ⃗v zu.<br />

∂ ⃗v f(⃗x) < 0 ⇒ f(⃗x) n<strong>im</strong>mt in Richtung ⃗v ab.<br />

Anschauliche Deutung für n = 2. Die Schnittkurve des Graphen z = f(x, y) mit<br />

der zur z-Achse parallelen Ebene durch die Gerade<br />

( ) ( )<br />

( )<br />

x 0 v 1<br />

v<br />

+ t mit 1<br />

⃗v = , |⃗v| = 1,<br />

y 0 v 2 v 2<br />

besitzt die Parameterdarstellung<br />

⎛<br />

⃗x(t) =<br />

⎜<br />

⎝<br />

x 0 + tv 1<br />

y 0 + tv 2<br />

f(x 0 + tv 1 , y 0 + tv 2 )<br />

⎞<br />

⎟<br />

⎠<br />

mit dem Tangentialvektor<br />

˙⃗x(t) =<br />

⎛<br />

⎜<br />

⎝<br />

v 1<br />

v 2<br />

∂ ⃗v f(x 0 , y 0 )<br />

⎞<br />

⎟<br />

⎠<br />

<strong>im</strong> Kurvenpunkt (x 0 , y 0 , f(x 0 , y 0 )). Die Tangente hat den Anstieg ∂ ⃗v f(x 0 , y 0 ).


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 59<br />

Satz 3.5. Fur jede auf der oenen Menge D ⊆ R n total dierenzierbaren<br />

Funktion f und fur jeden Vektor ⃗v ∈ R n , ⃗v ≠ ⃗0, gilt<br />

n∑<br />

∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v = f xj (⃗x)v i .<br />

Mit |ṽ| = 1 ist das die Richtungsableitung von f an der Stelle ⃗x in Richtung<br />

⃗v.<br />

j=1<br />

(siehe Satz 3.2 Absatze 2 und 3.)<br />

z<br />

y<br />

f(x 0<br />

,y 0<br />

)<br />

grad f (x 0<br />

,y 0<br />

)<br />

.<br />

(x 0<br />

,y 0<br />

)<br />

v=(α 1<br />

,α 2<br />

) T<br />

x<br />

φ<br />

tan φ = ∂ (α1 ,α 2 ) f(x 0 ,y 0 ) = α 1 f x (x 0 ,y 0 ) + α 2 f y (x 0 ,y 0 )<br />

Beispiel 3.15. Der Anstieg der Funktion f(x, y) = x 2 + y 2 <strong>im</strong> Punkt (1, 1) in<br />

der Richtung des (Einheits-)Vektors ⃗v = (sin α, cos α) T betragt<br />

( ) ( )∣ ( )<br />

∣∣∣∣(1,<br />

sin α 2x<br />

sin α<br />

∂ ⃗v f(⃗x) = grad f(1, 1) ·<br />

=<br />

· = 2(sin α + cos α).<br />

cos α 2y<br />

cos α<br />

1)<br />

1.6. Parameterdarstellungen. Man nennt {⃗x(t), t A ≤ t ≤ t B } eine Parameterdarstellung<br />

einer vektorwertigen Funktion. Jeder Funktionswert wird durch<br />

einen Wert des Parameters t best<strong>im</strong>mt. Oder anders ausgedruckt, der Vektor ⃗x(t)<br />

variiert in Abhangigkeit des Parameters t. Wir betrachten daher vektorwertige, auf<br />

dem Intervall I ⊆ R erklarte Funktionen ⃗x : I → R n . Jede derartige Funktion besteht<br />

aus n Komponentenfunktionen x i : I → R (1 ≤ i ≤ n), d.h.<br />

⎛<br />

⃗x(t) = ⎜<br />

⎝<br />

x 1 (t)<br />

x 2 (t)<br />

.<br />

x n (t)<br />

⎞<br />

⎟<br />

⎠ , t ∈ I.


1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 60<br />

Die Begrie des Grenzwerts, der Stetigkeit, der Dierenzierbarkeit werden auf die<br />

Komponentenfunktionen zuruckgefuhrt:<br />

Definition 3.11. Fur die Funktion ⃗x : I → R n gilt:<br />

(1) ⎛ ⎞ ⎛ ⎞<br />

x 1 (t)<br />

c 1<br />

x 2 (t)<br />

l<strong>im</strong> ⃗x(t) = ⎜ ⎟<br />

t→t 0 ⎝ . ⎠ = ⃗c = c 2<br />

⎜ ⎟ ⇐⇒ l<strong>im</strong> x i (t) = c i , 1 ≤ i ≤ n.<br />

⎝ . ⎠ t→t 0<br />

x n (t)<br />

c n<br />

(2) Entsprechend heit ⃗x : I → R n in t 0 ∈ I (auf I) stetig, bzw. dierenzierbar,<br />

wenn alle Komponentenfunktionen in t 0 ∈ I (auf I) stetig,<br />

bzw. dierenzierbar sind.<br />

(3) Die Ableitung ist ebenfalls komponentenweise zu berechnen:<br />

˙⃗x(t) = d 1<br />

⃗x(t) = l<strong>im</strong><br />

dt h→0<br />

⎛<br />

h [⃗x(t + h) − ⃗x(t)] = ⎜<br />

⎝<br />

ẋ 1 (t)<br />

ẋ 2 (t)<br />

.<br />

ẋ n (t)<br />

⎞<br />

⎟<br />

⎠ mit ẋ i(t) = d dt x i(t).<br />

1.7. Kettenregel.<br />

Satz 3.6. Kettenregel. Fur jede einmal stetig (partiell) dierenzierbare<br />

Funktion f : D → R, D ⊂ R n oen, und jede Parametrisierung ⃗x : R ⊇<br />

[a, b] → D gilt<br />

d<br />

dt f(⃗x(t)) = d dt f(x 1(t), x 2 (t), . . . , x n (t))<br />

= f x1 (⃗x(t))ẋ 1 (t) + . . . + f xn (⃗x(t))ẋ n (t) = grad f(⃗x(t)) · ˙⃗x(t).<br />

Beweis: Es sei ⃗x(t 0 ) = ⃗x 0 , dann ist<br />

da, f total dierenzierbar ist, gilt<br />

d<br />

1<br />

f(⃗x(t)) := l<strong>im</strong><br />

dt h→0 h [f(⃗x(t 0 + h)) − f(⃗x(t 0 ))]<br />

1<br />

= l<strong>im</strong><br />

h→0 h [grad f(⃗x 0) · (⃗x(t 0 + h) − ⃗x(t 0 )) + r(⃗x(t 0 + h), ⃗x 0 )]<br />

wobei l<strong>im</strong> h→0<br />

r(⃗x(t 0 +h), ⃗x 0 )<br />

|h|<br />

= 0 ist, d.h.<br />

1<br />

= grad f(⃗x 0 ) · l<strong>im</strong><br />

h→0 h (⃗x(t 0 + h) − ⃗x(t 0 )) = grad f(⃗x(t 0 )) · ˙⃗x(t 0 ).<br />


2. BEDEUTUNG DES GRADIENTEN 61<br />

Anwendung 3.2. Die Kettenregel benotigt man <strong>im</strong>mer dann, wenn neue<br />

Variable eingefuhrt werden und die partiellen Ableitungen in Bezug auf diese<br />

Veranderlichen zu berechnen sind.<br />

Polarkoordinaten <strong>im</strong> R 2 . Durch x = r cos ϕ,<br />

f(x, y), (x, y) ∈ D ⊆ R 2 , transformiert in<br />

F (r, ϕ) := f(r cos ϕ, r sin ϕ).<br />

y = r sin ϕ wird die Funktion<br />

Fur die partiellen Ableitungen von F ergibt sich aus der Kettenregel fur einmal<br />

stetig dierenzierbares f :<br />

d.h. (<br />

und damit<br />

∼<br />

(<br />

(<br />

F r = f x cos ϕ + f y sin ϕ,<br />

F ϕ = f x (−r sin ϕ) + f y (r cos ϕ),<br />

) (<br />

F r<br />

=<br />

F ϕ<br />

cos ϕ sin ϕ 1 0<br />

−r sin ϕ r cos ϕ 0 1<br />

cos ϕ<br />

−r sin ϕ<br />

r cos ϕ 0 r − r sin 2 ϕ − cos ϕ sin ϕ<br />

0 r r sin ϕ cos ϕ<br />

und damit (<br />

) (<br />

f x<br />

=<br />

f y<br />

) (<br />

sin ϕ<br />

r cos ϕ<br />

)<br />

f x<br />

f y<br />

) (<br />

)<br />

cos ϕ sin ϕ 1 0<br />

∼<br />

0 r r sin ϕ cos ϕ<br />

) (<br />

)<br />

1 0 cos ϕ − 1<br />

∼<br />

sin ϕ r<br />

1<br />

0 1 sin ϕ cos ϕ r<br />

) (<br />

cos ϕ − 1 sin ϕ r<br />

1<br />

sin ϕ cos ϕ r<br />

2. Bedeutung des Gradienten<br />

)<br />

F r<br />

.<br />

F ϕ<br />

2.1. Richtung des steilsten Anstiegs. Fur eine einmal stetig dierenzierbare<br />

Funktion f : R n ⊇ D → R ist der Anstieg <strong>im</strong> Punkt ⃗x ∈ D in Richtung des Vektors<br />

⃗v mit |⃗v| = 1 gegeben durch<br />

∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v = |grad f(⃗x)| |⃗v| cos α = |grad f(⃗x)| cos α,<br />

wobei α, den von grad f(⃗x) und ⃗v eingeschlossenen Winkel bezeichnet. Dieser Anstieg<br />

ist am groten fur cos α = 1, d.h. α = 0. Also gilt fur grad f(⃗x) ≠ ⃗0 :<br />

Richtung von grad f(⃗x) = Richtung des max<strong>im</strong>alen Anstiegs der Funktion f<br />

in ⃗x = Richtung mit dem groten Zuwachs von f in Richtung ⃗x.<br />

Da f genau dann ansteigt, wenn −f abfallt, erhalt man gleichzeitig die Richtung des<br />

steilsten Abstiegs der Funktionswerte, namlich −grad f.


3. TAYLOR-FORMEL 62<br />

2.2. Gradient und Niveaumengen. Sei D ⊆ R n oen und f : D → R eine<br />

einmal stetig dierenzierbare Funktion, dann deniert f(⃗x) = c eine Hyperache in<br />

D. Fur jede parametrisierte Kurve t → ⃗x(t) auf dieser Hyperache gilt f(⃗x)(t) =<br />

c, t ∈ I, und mit der Kettenregel (siehe Satz 3.6) folgt<br />

d<br />

dt f(⃗x)(t) =<br />

n∑<br />

f xj (⃗x)(t)ẋ j (t) = gradf(⃗x)(t) · ˙⃗x(t) = 0.<br />

j=1<br />

Folgerung: gradf(⃗x)(t) steht senkrecht auf ˙⃗x(t) = Tangente an die Kurve ⃗x(t). Dies<br />

gilt fur jede Kurve.<br />

Damit steht grad f(⃗x 0 ) auf allen Tangentialvektoren an die Niveaumenge<br />

N ⃗x0 := {x ∈ D : f(⃗x) = f(⃗x 0 ) = c.}<br />

Anwendung 3.3. Gesucht sei das Min<strong>im</strong>um der einmal stetig dierenzierbaren<br />

Funktion f(x, y) <strong>im</strong> oen Gebiet D ⊆ R n . Das Gradientenverfahren besteht<br />

nun darin, von einem best<strong>im</strong>mten Startwert ⃗x 0 auszugehen, d.h.<br />

(1) Wahle ⃗x 0 ∈ D.<br />

(2) Man berechne grad f(⃗x 0 ) und berechne ⃗x 1 := ⃗x 0 − hgrad f(⃗x 0 ) mit einer<br />

dem Problem angepassten Schrittweite h > 0. Ist f(⃗x 1 ) > f(⃗x 0 ), so ist<br />

man zu weit gegangen und man versucht es deshalb noch einmal mit 1 2 h.<br />

(3) Ist f(⃗x 1 ) < f(⃗x 0 ), n<strong>im</strong>mt man ⃗x 1 als neuen Startwert und wiederhalt die<br />

Schritte 2 und 3.<br />

Auf diese Weise nahert man sich auf einem Streckenzug in D einer Min<strong>im</strong>alstelle<br />

der Funktion. Diese Stelle hangt vom gewahlten Startwert ab und muss<br />

nicht das globale Min<strong>im</strong>um sein. D.h. das Gradientenverfahren ermittelt ein<br />

lokales Min<strong>im</strong>um.<br />

Der Fall des lokalen Max<strong>im</strong>ums geht analog.<br />

3. Taylor-Formel<br />

Wir verallgemeinern die Taylor-Formel fur Funktionen einer Veranderlichen (siehe<br />

Satz 1.8) auf Funktionen mehrerer Veranderlicher. Dazu betrachten wir konvexe<br />

Gebiete, d.h. D ist oen und mit ⃗x, ⃗y ∈ D liegt <strong>im</strong>mer auch die gesamte verbindende<br />

Gerade ⃗x + t(⃗y − ⃗x), t ∈ [0, 1] vollstandig in D. Weiterhin sei f : R n ⊇ D → R<br />

k + 1-mal stetig dierenzierbar in n Variablen. Wir setzen:<br />

h(t) := f(⃗x 0 + t⃗v), t ∈ [0, 1]<br />

dann ist<br />

und<br />

1<br />

ḣ(0) = l<strong>im</strong><br />

t→0 t (f(⃗x 0 + t⃗v) − f(⃗x 0 )) =: ∂ ⃗v f(⃗x 0 )<br />

ḧ(0) = ∂ ⃗v (∂ ⃗v f))(⃗x 0 ) = ∂ 2 ⃗vf(⃗x 0 ), . . . , h (k) (0) = ∂ k ⃗v f(⃗x 0 ).


3. TAYLOR-FORMEL 63<br />

Aus der Taylor-Formel fur h :<br />

die<br />

h(t) := h(0) + ḣ(0)<br />

1!<br />

t + ḧ(0)<br />

2!<br />

t 2 + . . . h(k) (0)<br />

t k + h(k+1) (ξ)<br />

k! (k + 1)! tk+1<br />

Satz 3.7. Taylor-Formel für n Variable. Ist D ⊆ R n ein konvexes<br />

Gebiet, f k +1-mal stetig dierenzierbar, ⃗x ∈ D, dann gilt mit ⃗x+t⃗v ∈ D<br />

fur alle t ∈ [0, 1] :<br />

f(⃗x 0 + t⃗v) = f(⃗x 0 ) + 1 1! ∂ ⃗vf(⃗x 0 )t + 1 2! ∂2 ⃗vf(⃗x 0 )t 2 + . . . + 1 k! ∂k ⃗v f(⃗x 0 )t k + R k+1 (⃗x, ⃗v)<br />

mit dem Restglied<br />

R k+1 (⃗x, ⃗v) =<br />

und einer Zahl ξ zwischen 0 und t.<br />

1<br />

(k + 1)! ∂k+1 ⃗v<br />

f(⃗x 0 + ξ⃗v)t k+1<br />

Wir wollen uns einige Spezialfalle ansehen. Wie bereits gezeigt ist:<br />

∂ ⃗v f(⃗x 0 ) = grad f(⃗x 0 ) · ⃗v =<br />

n∑<br />

f xj (⃗x 0 )v j .<br />

j=1<br />

Wir berechnen ∂ 2 ⃗v f(⃗x 0),<br />

∂⃗vf 2 1<br />

= ∂ ⃗v (∂ ⃗v f) = ∂ ⃗v (grad f · ⃗v) = l<strong>im</strong><br />

t→0<br />

1<br />

= l<strong>im</strong><br />

t→0 t [(grad f(⃗x 0 + t⃗v) − grad f(⃗x 0 )) · ⃗v] =<br />

t [(grad f(⃗x 0 + t⃗v) · ⃗v) − (grad f(⃗x 0 ) · ⃗v)]<br />

[<br />

]<br />

1<br />

l<strong>im</strong><br />

t→0 t (grad f(⃗x 0 + t⃗v) − grad f(⃗x 0 )) · ⃗v<br />

= (grad ∂ x1 f(⃗x 0 ) · ⃗v) v 1 + (grad ∂ x2 f(⃗x 0 ) · ⃗v) v 2 + . . . + (grad ∂ xn f(⃗x 0 ) · ⃗v) v n<br />

= ∂ 2 x 1<br />

f(⃗x 0 )v 2 1 + ∂ x2 ∂ x1 f(⃗x 0 )v 2 v 1 + . . . + ∂ xn ∂ x1 f(⃗x 0 )v n v 1 + . . . + ∂ x1 ∂ xn f(⃗x 0 )v 1 v n + . . . ∂ 2 x n<br />

f(⃗x 0 )v 2 n<br />

= ⃗v T H f (⃗x 0 )⃗v,<br />

dabei bezeichnet H f (⃗x 0 ) die Hesse-Matrix von f an der Stelle ⃗x 0 . Kehren wir nun<br />

zuruck zu Taylor-Formel, so ist mit ⃗x = ⃗x 0 + t⃗v ⇐⇒ t⃗v = ⃗x − ⃗x 0 :<br />

∂ ⃗v f(⃗x 0 )t = grad f(⃗x 0 ) · (⃗vt) =<br />

und<br />

n∑<br />

f xj (⃗x 0 )v j t = grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) =<br />

j=1<br />

n∑<br />

f xj (⃗x 0 )(x j − x 0j ).<br />

j=1<br />

∂ 2 ⃗vf(⃗x 0 )t 2 = (⃗vt) T H f (⃗x 0 )(⃗vt) = (⃗x − ⃗x 0 ) T H f (⃗x 0 )(⃗x − ⃗x 0 ).


3. TAYLOR-FORMEL 64<br />

Taylor-Formel zum Entwicklungsgrad 2: Ist D ⊆ R n ein konvexes Gebiet, f<br />

3-mal stetig dierenzierbar, ⃗x 0 , ⃗x ∈ D :<br />

f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗x 0)(⃗x − ⃗x 0 ) + 1 2! (⃗x − ⃗x 0) T H f (⃗x 0 )(⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ),<br />

r(⃗x, ⃗x<br />

mit l<strong>im</strong> 0 )<br />

⃗x→⃗x0 |⃗x−⃗x 0 | 2<br />

der Stelle ⃗x 0 .<br />

= 0, dabei bezeichnet H f (⃗x 0 ) die Hesse-Matrix von f an<br />

Bemerkung 3.3. Ist f nur 2-mal stetig dierenzierbar, so gilt unter den<br />

obigen Voraussetzungen:<br />

f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗x 0)(⃗x − ⃗x 0 ) + 1 2! (⃗x − ⃗x 0) T H f ( ⃗ ξ)(⃗x − ⃗x 0 )<br />

mit ⃗ ξ = ⃗x 0 + τ(⃗x − ⃗x 0 ), fur irgendein τ ∈ [0, 1].<br />

Ist f nur einmal stetig dierenzierbar, dann gilt<br />

f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗ ξ)(⃗x − ⃗x 0 )<br />

mit ⃗ ξ = ⃗x 0 + τ(⃗x − ⃗x 0 ), fur irgendein τ ∈ [0, 1]. (Mittelwertsatz).


4. ZUSAMMENFASSUNG ABLEITUNGSBEGRIFFE FUR FUNKTIONEN MEHRERER VERANDERLICHER65<br />

4. Zusammenfassung Ableitungsbegriffe für Funktionen mehrerer<br />

Veränderlicher<br />

Es sei f : D → R auf der oenen Teilmenge D des R n deniert und stetig.<br />

Begri<br />

partielle Ableitung<br />

Denition<br />

1<br />

f xi (⃗x) = l<strong>im</strong> [f(⃗x + t⃗e<br />

t→0 t i) − f(⃗x)]<br />

f ist partiell dierenzierbar in ⃗x ∈ D, wenn alle partiellen Ableitungen von<br />

f in ⃗x ∈ D existieren.<br />

totales Dierential<br />

(vollstandiges Dierential)<br />

f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )<br />

mit l<strong>im</strong><br />

⃗x→⃗x0<br />

r(⃗x, ⃗x 0 )<br />

|⃗x−⃗x 0 |<br />

= 0.<br />

Ist f einmal stetig dierenzierbar, so ist f total dierenzierbar mit ⃗a =<br />

grad f(⃗x 0 )<br />

geometrisch: z = f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) ist die Tangentialebene an den<br />

Flachenpunkt (⃗x 0 , f(⃗x 0 )). Weiterhin ist z die beste lineare Approx<strong>im</strong>ation<br />

von f(⃗x) an der Stelle ⃗x 0 .<br />

Richtungsableitung<br />

1<br />

∂ ⃗v f(⃗x) = l<strong>im</strong> [f(⃗x + t⃗v) − f(⃗x)] ,<br />

t→0 t<br />

⃗v ∈ R n , |⃗v| = 1.<br />

Ist f einmal stetig dierenzierbar, so ist ∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v.<br />

geometrisch: ∂ ⃗v f(⃗x) ist der Anstieg der Funktion f an der Stelle ⃗x in Richtung<br />

⃗v (⃗v ≠ ⃗0, |⃗v| = 1.)<br />

Bedeutungen des Gradienten:<br />

(1) Der Gradient ist der Vektor der ersten partiellen Ableitungen.<br />

(2) Der Gradient zeigt <strong>im</strong>mer in Richtung des steilsten Anstiegs.<br />

(3) Der Gradient steht senkrecht auf den Niveauachen (Hohenlinien, Aquipotentialachen)<br />

f(⃗x) = c.<br />

Anwendungen:<br />

(1) Naherungsrechnung,<br />

(2) Fehlerrechnung,<br />

(3) Gradientenverfahren.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!