Differentialrechnung im Rn
Differentialrechnung im Rn
Differentialrechnung im Rn
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
KAPITEL 3<br />
<strong>Differentialrechnung</strong> für Funktionen mehrerer Veränderlicher<br />
1. Reellwertige Funktionen mehrerer reeller Veränderlicher<br />
1.1. Beschreibung von Funktionen mehrerer Veränderlicher.<br />
Definition 3.1. Unter einer reellen Funktion von n reellen Veranderlichen<br />
versteht man eine auf einer Teilmenge D ⊆ R n erklarte Funktion f : D → R<br />
mit Werten in R.<br />
Sie ordnet jedem Vektor ⃗x = (x 1 , x 2 , . . . , x n ) T ∈ D des Denitionsbereiches in<br />
eindeutiger Weise eine reelle Zahl y = f(⃗x) = f(x 1 , x 2 , . . . , x n ). Fur Funktionen in 2<br />
oder 3 Veranderlichen schreibt man ublicherweise f(x, y) bzw. f(x, y, z).<br />
Die Zuordnung ⃗x → f(x 1 , x 2 , . . . , x n ) kann gegeben sein<br />
(1) durch eine explizite Rechenvorschrift:<br />
f(x, y) = 3xy + 2x + 5y − 7,<br />
z<br />
x<br />
y<br />
z= sin x2 y 2 <br />
x 2 y 2<br />
(2) durch eine <strong>im</strong>plizite Vorschrift: z = f(x, y) mit<br />
x 2 + y 2 + z 2 = 1,<br />
(3) durch Dierential- oder Intergralgleichungen.<br />
Als besonders vorteilhaft zur Diskussion einer Funktion f : R n ⊇ D → R erweisen<br />
sich best<strong>im</strong>mte "<br />
Hilfsfunktionen\ zu betrachten, dies sind:<br />
42
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 43<br />
(1) die Niveaumengen oder Niveauhyperachen von f zum konstanten Niveau<br />
c ∈ R :<br />
z<br />
N c := {⃗x ∈ D : f(⃗x) = c}.<br />
{(x,y,c): c=f(x,y)}<br />
(x,y,f(x,y))<br />
ɛ<br />
{(x,y,z): z=f(x,y)}<br />
y<br />
(x,y) ɛ<br />
D<br />
N c<br />
={(x,y): f(x,y)=c}<br />
x<br />
(2) die "<br />
partiellen\ Funktionen von f :<br />
x i ↦→ f(a 1 , a 2 , . . . , a i−1 , x i , a i+1 , . . . , a n )<br />
mit ⃗a = (a 1 , . . . , a n ) ∈ D konstant,<br />
(3) der Graph der Funktion<br />
Γ f := {(⃗x, f(⃗x); ⃗x ∈ D} ⊆ R n+1 .<br />
Er besteht aus allen Punkten (x 1 , . . . , x n , x n+1 ) mit x n+1 = f(x 1 , . . . , x n )<br />
und kann somit als Niveauhyperache der Funktion<br />
F (x 1 , . . . , x n , x n+1 ) = x n+1 − f(x 1 , . . . , x n )<br />
zum Niveau 0 angesehen werden.<br />
Wir nennen F (x 1 , . . . , x n , x n+1 ) = 0 die <strong>im</strong>plizite und x n+1 = f(x 1 , . . . , x n )<br />
die explizite Darstellung des Graphen Γ f .<br />
Beispiel 3.1. Die Gerade 2x + 3y = 5 ist die Niveaukurve der Funktion<br />
f(x, y) = 2x + 3y zum Niveau c = 5. Die explizite Darstellung lautet y = − 2 3 x + 5 3 .<br />
Beispiel 3.2. Jeder Graph y = h(x) einer (stetigen) Funktion einer Variablen<br />
x kann als Niveaukurve F (x, y) = y − f(x) = 0 einer Funktion zweier Veranderlicher<br />
angesehen werden.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 44<br />
Beispiel 3.3. Fur n = 2 wird der Graph Γ f als Flache <strong>im</strong> R 3 veranschaulicht.<br />
D ist die Teilmenge der (x, y)-Ebene und uber (x, y) ∈ D liegt der Flachenpunkt<br />
(x, y, z) mit z = f(x, y).<br />
Die Graphen der "<br />
partiellen\ Funktionen z = f(a 1 , y) und z = f(x, a 2 ) entstehen<br />
durch Schnitt des Graphen Γ f mit den zur z-Achse parallelen Ebenen x = a 1 und<br />
y = a 2 .<br />
Uber der Niveaulinie f(x, y) = c in D liegen alle Punkte von Γ f mit derselben<br />
Hohe\ z = c. Sie ist die senkrechte Projektion der Schnittkurve der Flache z =<br />
"<br />
f(x, y) mit der Ebene z = c in der (x, y)-Ebene (Hohenlinien einer Landkarte).<br />
1.2. Grenzwerte und Stetigkeit. Begrie der anschaulichen Geometrie werden<br />
fur beliebige n ∈ N ubernommen. So wird der Abstand zweier Punkte ⃗x, ⃗y ∈ R n<br />
deniert durch<br />
∑<br />
|⃗x − ⃗y| = √ n (x i − y i ) 2 .<br />
Zu jedem festen ⃗a ∈ R n und r > 0 heit die Punktmenge<br />
r-Umgebung von ⃗a.<br />
i=1<br />
U r (⃗a) := {⃗x ∈ R n : |⃗x − ⃗a| < r}<br />
Beispiel 3.4. Fur n = 1 ist U r (a) das oene Intervall a − r < x < a + r.<br />
Fur n = 2 besteht U r (⃗a) aus allen Punkten der Kreisscheibe mit dem Mittelpunkt<br />
⃗a und dem Radius r ohne Randpunkte.<br />
Fur n = 3 ist U r (⃗a) eine Kugel mit dem Radius r um ⃗a ohne die Punkte der<br />
Kugeloberache.<br />
Definition 3.2. Sei D eine Teilmenge des R n .<br />
(1) Ein Punkt ⃗a ∈ D heit innerer Punkt von D, wenn es eine r-<br />
Umgebung von ⃗a gibt, die ganz in D enthalten ist.<br />
(2) D heit offen, wenn jeder Punkt von D ein innerer Punkt ist.<br />
(3) Ein Punkt ⃗ b ∈ R n heit Randpunkt von D, wenn jede r-Umgebung<br />
von ⃗ b sowohl mindestens einen Punkt aus D als auch mindestens<br />
einen nicht zu D gehorenden Punkt enthalt. Die Menge aller Randpunkte<br />
von D heit Rand von D und wird mit ∂D bezeichnet.<br />
(4) Eine Menge heit abgeschlossen, wenn sie alle ihre Randpunkte<br />
enthalt.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 45<br />
Definition 3.3. Sei f : R n ⊇ D → R und ⃗a ∈ D ∩ ∂D.<br />
(1) f hat den Grenzwert c ∈ R, d.h.<br />
l<strong>im</strong> f(⃗x) = c (bzw. f(⃗x) → c fur ⃗x → ⃗a),<br />
⃗x→⃗a<br />
wenn es zu jeder (beliebig kleinen) Schranke ε > 0 eine r-Umgebung<br />
U r (⃗a) gibt, so dass |f(⃗x) − c| ≤ ε fur alle ⃗x ∈ D ∩ U r (⃗a), ⃗x ≠ ⃗a, gilt.<br />
(2) f heit in ⃗a ∈ D stetig, wenn l<strong>im</strong> ⃗x→⃗a f(⃗x) = f(⃗a) gilt.<br />
(3) f heit auf D stetig, wenn f in allen ⃗a ∈ D stetig ist.<br />
Die Summe, das Produkt, der Quotient (Nenner ungleich Null) stetiger Funktionen<br />
sind stetig.<br />
z<br />
z<br />
Hier ist f(x,y) in<br />
(x 0<br />
,y 0<br />
)<br />
stetig.<br />
Hier ist f(x,y) in<br />
(x 0<br />
,y 0<br />
) nicht stetig.<br />
U ε<br />
(f(x 0<br />
,y 0<br />
))={z: |f(x 0<br />
,y 0<br />
)-z|
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 46<br />
Folglich ist f uberall stetig.<br />
Beispiel 3.6. Wo ist die Funktion<br />
{<br />
xy<br />
fur(x, y) ≠ (0, 0),<br />
x<br />
f(x, y) =<br />
2 +y 2<br />
0 fur(x, y) = (0, 0)<br />
stetig?<br />
z<br />
x<br />
y<br />
Fur (x, y) ≠ (0, 0) ist f als Quotient von stetigen Funktionen stetig. Es verbleibt<br />
f <strong>im</strong> Punkt (0, 0) zu untersuchen: Ubergang zu Polarkoordinaten: x = r cos ϕ, y =<br />
r sin ϕ, r ∈ R, ϕ ∈ [0, 2π).<br />
f(x, y) = ˜f(r, ϕ) =<br />
D.h., dass der Grenzwert<br />
r 2 cos ϕ sin ϕ<br />
r 2 cos 2 ϕ + r 2 sin 2 ϕ = cos ϕ sin ϕ = 1 2 sin(2ϕ)<br />
l<strong>im</strong> f(x, y) = l<strong>im</strong> sin(2ϕ) = sin(2ϕ)<br />
(x,y)→(0,0)<br />
r→0<br />
∀ϕ ∈ [0, 2π).<br />
nicht existiert. Oensichtlich hangt der Grenzwert nicht vom Radius, sondern<br />
vom Winkel ϕ ab. Geometrisch sind Gebilde, wo der Radius r variiert und<br />
der Winkel ϕ konstant ist, Geraden durch den Ursprung, deren Anstieg durch<br />
ϕ best<strong>im</strong>mt wird. Wir betrachten deshalb den Grenzwert entlang der Geraden<br />
y = x = t und y = 2x = 2t, mit dem Parameter t ∈ R. Dann gilt fur y = x = t :<br />
t 2<br />
l<strong>im</strong><br />
t→0 t 2 + t = 1 2 2 .<br />
Dagegen erhalt man fur y = 2x = 2t :<br />
2t 2<br />
l<strong>im</strong><br />
t→0 t 2 + 4t = 2 2 5 .<br />
Der Grenzwert ist aber, wenn er existiert eindeutig best<strong>im</strong>mt. Deshalb existiert<br />
der Grenzwert l<strong>im</strong> (x,y)→(0,0)<br />
xy<br />
x 2 +y 2<br />
l<strong>im</strong><br />
x→0<br />
nicht. Dagegen existieren die Grenzwerte<br />
f(x, 0) = 0 = l<strong>im</strong> f(0, y).<br />
y→0<br />
Bemerkung 3.1. Die Stetigkeit von z = f(x, y) in (x 0 , y 0 ) ergibt sich jedoch<br />
nicht aus der Stetigkeit der "<br />
partiellen\ Funktionen x ↦→ f(x, y 0 ) und<br />
y ↦→ f(x 0 , y). Sondern man musste nachweisen, das fur alle moglichen Kurven<br />
(x(t), y(t)) → (x 0 , y 0 ) die Funktion f(x, y) <strong>im</strong>mer den gleichen Grenzwert hat.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 47<br />
Diese Vorgehensweise ist deshalb nur gunstig, um die Unstetigkeit zu zeigen,<br />
d.h. es gibt zwei Kurven wo verschiedene Grenzwerte angenommen werden.<br />
Beispiel 3.7. Wo ist die Funktion<br />
{<br />
xy 2<br />
fur(x, y) ≠ (0, 0),<br />
f(x, y) =<br />
x 2 +y 4<br />
0 fur(x, y) = (0, 0)<br />
stetig?<br />
z = xyy/(xx+yyyy)<br />
z<br />
x<br />
y<br />
Fur (x, y) ≠ 0 ist die Funktion als Quotient stetiger Funktionen wieder stetig. Es<br />
verbleibt die Funktion in (0, 0) zu untersuchen. Es gilt f(x, 0) = 0, x ∈ R und<br />
f(0, y) = 0, y ∈ R. Trotzdem ist f(x, y) in (0, 0) nicht stetig, da bei Annaherung<br />
langs der Geraden ( t<br />
, t 4 2)<br />
gilt<br />
l<strong>im</strong><br />
t→0<br />
t t 2<br />
4 4<br />
t 2 + t4<br />
4 16<br />
t 3<br />
= l<strong>im</strong><br />
t→0 4t 2 + t = l<strong>im</strong> 4 t→0<br />
aber bei der Annaherung langs (t 2 , t) gilt<br />
t 2 t 2<br />
l<strong>im</strong><br />
t→0 t 4 + t = l<strong>im</strong> 1<br />
4 t→0 2 = 1 2 .<br />
1.3. Partielle Ableitungen und Gradient.<br />
t<br />
4 + t 2 = 0<br />
Definition 3.4. Sei D ⊆ R n oen, f : D → R und ⃗a = (a 1 , a 2 , . . . , a n ) ∈ D.<br />
Existiert die Ableitung der "<br />
partiellen\ Funktion<br />
x i ↦→ f(a 1 , . . . , a i−1 , x i , a i+1 , . . . , a n )<br />
an der Stelle x i = a i , so nennt man diese die partielle Ableitung von f nach<br />
x i <strong>im</strong> Punkt ⃗a; sie wird mit<br />
bezeichnet.<br />
∂f(⃗x)<br />
∂x i<br />
∣<br />
∣∣∣⃗x=⃗a<br />
oder<br />
∂f<br />
∂x i<br />
(⃗a)<br />
oderf xi (⃗a)<br />
Die Berechnung erfolgt wie fur eine Funktion einer Veranderlichen. Es gilt<br />
∂f(⃗x)<br />
∂x i<br />
:= l<strong>im</strong><br />
t→0<br />
1<br />
t [f(x 1, . . . , x i + t, . . . , x n ) − f(x 1 , . . . , x i , . . . , x n )] = l<strong>im</strong><br />
t→0<br />
1<br />
t [f(⃗x + t⃗e i) − f(⃗x)].
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 48<br />
Bezeichnungen fur hohere partielle Ableitungen:<br />
f xx = ∂2 f<br />
∂x 2 ,<br />
f xy = (f x ) y = ∂ ∂y<br />
( ) ∂f<br />
, . . .<br />
∂x<br />
Definition 3.5. f heit (stetig) partiell dierenzierbar, wenn alle partiellen<br />
Ableitungen f xi existieren (und stetig sind).<br />
Beispiel 3.8. f(x, y) = x 2 y 3 + y ln x, (x > 0). Dann sind die 1. partiellen<br />
Ableitungen:<br />
f x (x, y) = 2xy 3 + y 1 x ,<br />
f y(x, y) = x 2 3y 2 + ln x<br />
und die 2. partiellen Ableitungen:<br />
f xx (x, y) = xy 3 − y x 2 , f yy(x, y) = 6x 2 y, f xy (x, y) = 6xy 2 + 1 x = f yx(x, y).<br />
Definition 3.6. f heit k-mal (stetig) partiell dierenzierbar, wenn alle k-<br />
ten partiellen Ableitungen f xi existieren (und stetig sind).<br />
Satz 3.1. Satz von Schwarz. Fur jede zwe<strong>im</strong>al stetig partiell dierenzierbare<br />
Funktion f : D → R, D ⊆ R n oen, gilt<br />
( )<br />
∂ ∂f<br />
= ∂ ( ) ∂f<br />
, 1 ≤ i, j ≤ n.<br />
∂x i ∂x j ∂x j ∂x i<br />
Definition 3.7. Ist f : D → R partiell dierenzierbar, so heit der Vektor<br />
der ersten partiellen Ableitungen <strong>im</strong> Punkt ⃗x Gradient von f an der Stelle<br />
⃗x :<br />
⎛ ∂f ⎞<br />
∂x 1<br />
(⃗x)<br />
∂f<br />
∂x<br />
grad f(⃗x) := ⎜<br />
2<br />
(⃗x)<br />
⎟<br />
⎝ . ⎠ ∈ <strong>Rn</strong> .<br />
∂f<br />
∂x n<br />
(⃗x)
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 49<br />
Beispiel 3.9. f(x, y, z) = e x+2y + 2x sin z + z 2 xy,<br />
grad f(x, y, z) =<br />
⎛<br />
⎜<br />
⎝<br />
f x (x, y, z)<br />
f y (x, y, z)<br />
f z (x, y, z)<br />
⎞<br />
⎟<br />
⎠ =<br />
⎛<br />
⎜<br />
⎝<br />
e x+2y + 2 sin z + z 2 y<br />
2e x+2y + xz 2<br />
2x cos z + 2zxy<br />
Beispiel 3.10. Man best<strong>im</strong>me ggf. die ersten partiellen Ableitungen von f,<br />
den Gradienten von f sowie grad f(1, 1) von<br />
⎞<br />
⎟<br />
⎠<br />
f(x, y) =<br />
{<br />
x 2 −y 2<br />
,<br />
x 2 +y 2 fur (x, y) ≠ (0, 0),<br />
1 fur (x, y) = (0, 0).<br />
Fur die ersten partiellen Ableitungen erhalt man<br />
f x (x, y) = 2x(x2 +y 2 )−2x(x 2 −y 2 )<br />
(x 2 +y 2 ) 2 = 4xy2<br />
(x 2 +y 2 ) 2 fur (x, y) ≠ (0, 0),<br />
f y (x, y) = −2y(x2 +y 2 )−2y(x 2 −y 2 )<br />
(x 2 +y 2 ) 2 = −4x2 y<br />
(x 2 +y 2 ) 2 fur (x, y) ≠ (0, 0).<br />
Fur die partiellen Ableitungen in (0, 0) erhalt man<br />
[ ]<br />
1<br />
1 t<br />
2<br />
f x (0, 0) = l<strong>im</strong> [f(0 + t, 0) − f(0, 0)] = l<strong>im</strong><br />
t→0 t t→0 t t − 1 = 0.<br />
2<br />
Die partielle Ableitung f y existiert dagegen in (0, 0) nicht, da die partielle Funktion<br />
f(0, y) in (0, 0) unstetig ist, da<br />
f(0, y) =<br />
{<br />
−1, y ≠ 0,<br />
1, y = 0,<br />
bzw. aus der Denition der partiellen Ableitung ergibt sich:<br />
[ ]<br />
1<br />
1 −t<br />
2<br />
−2<br />
f y (0, 0) = l<strong>im</strong> [f(0, 0 + t) − f(0, 0)] = l<strong>im</strong> − 1 = l<strong>im</strong><br />
t→0 t t→0 t t 2 t→0 t<br />
und dieser Grenzwert existiert nicht. Damit gilt fur den Gradienten:<br />
⎧<br />
⎪⎨<br />
grad f(x, y) =<br />
⎪⎩<br />
Insbesondere ist grad f(1, 1) =<br />
(<br />
4xy<br />
(x 2 +y 2 ) 2<br />
(<br />
y<br />
−x<br />
)<br />
, fur (x, y) ≠ (0, 0),<br />
existiert nicht fur (x, y) = (0, 0).<br />
1<br />
−1<br />
)<br />
.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 50<br />
Definition 3.8. Es sei f : R n ⊆ D → R, eine in ⃗x ∈ D zwe<strong>im</strong>al dierenzierbare<br />
Funktion mit den 2. partiellen Ableitungen<br />
( )<br />
∂ ∂f<br />
= ∂2 f<br />
, i, j = 1, 2, . . . , n.<br />
∂x i ∂x j ∂x i ∂x j<br />
Dann heit die Matrix der 2. partiellen Ableitungen<br />
⎛<br />
∂ 2 f<br />
∂<br />
∂x 1 ∂x 1<br />
(⃗x)<br />
2 f<br />
∂x 1 ∂x 2<br />
(⃗x) . . .<br />
H f (⃗x) :=<br />
⎜<br />
⎝<br />
∂ 2 f<br />
∂x 2 ∂x 1<br />
(⃗x)<br />
.<br />
∂ 2 f<br />
∂x n ∂x 1<br />
(⃗x)<br />
Hesse-Matrix von f an der Stelle ⃗x.<br />
∂ 2 f<br />
∂x 2 ∂x 2<br />
(⃗x) . . .<br />
.<br />
...<br />
∂ 2 f<br />
∂x n ∂x 2<br />
(⃗x) . . .<br />
∂ 2 f<br />
⎞<br />
∂x 1 ∂x n<br />
(⃗x)<br />
∂ 2 f<br />
∂x 2 ∂x n<br />
(⃗x)<br />
⎟<br />
. ⎠<br />
∂ 2 f<br />
∂x n ∂x n<br />
(⃗x)<br />
1.4. Totales Differential.<br />
Definition 3.9. Sei D ⊆ R n oen. Eine Funktion f : D → R heit in ⃗x 0<br />
total differenzierbar (oder linear approx<strong>im</strong>ierbar), wenn es einen Vektor<br />
⃗a ∈ R n gibt mit<br />
f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )<br />
(fur ⃗x nahe ⃗x 0 ) mit l<strong>im</strong> ⃗x→⃗x0<br />
r(⃗x, ⃗x 0 )<br />
|⃗x−⃗x 0 |<br />
= 0 gibt.<br />
Satz 3.2. Ist f in ⃗x 0 ∈ D total dierenzierbar, d.h.<br />
dann gilt:<br />
f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ),<br />
(1) f ist stetig in ⃗x 0 ;<br />
(2) 1 l<strong>im</strong><br />
t→0 t [f(⃗x 0 + t⃗v) − f(⃗x 0 )] = ⃗a · ⃗v, fur alle ⃗v ∈ R n , ⃗v ≠ ⃗0;<br />
(3) f ist partiell dierenzierbar und ⃗a eindeutig best<strong>im</strong>mt als ⃗a =<br />
grad f(⃗x 0 ).<br />
Beweis: zu 1.: Aus der Denition der totalen Dierenzierbarkeit folgt<br />
l<strong>im</strong> (f(⃗x) − f(⃗x 0 )) = l<strong>im</strong> (⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )) = 0.<br />
⃗x→⃗x 0 ⃗x→⃗x0<br />
zu 2.: Sei ⃗x = ⃗x 0 + t⃗v dann ergibt sich aus der totalen Dierenzierbarkeit<br />
l<strong>im</strong><br />
t→0<br />
1<br />
t [f(⃗x 0 + t⃗v) − f(⃗x 0 )] = l<strong>im</strong><br />
t→0<br />
1<br />
t [⃗a · (t⃗v) + r(⃗x 0 + t⃗v, ⃗x 0 )] = ⃗a · ⃗v,
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 51<br />
da<br />
r(⃗x 0 + t⃗v, ⃗x 0 )<br />
l<strong>im</strong><br />
t→0 |t⃗v|<br />
= 0.<br />
zu 3. Fur ⃗v = ⃗e i erhalt man aus 2.<br />
∂f<br />
∂x i<br />
(⃗x 0 ) = ⃗a · ⃗e i = a i<br />
(die i-te Koordinate von ⃗a.)<br />
□<br />
Insbesondere folgt also aus der totalen Dierenzierbarkeit die Existenz der ersten<br />
partiellen Ableitungen und aller Richtungsableitungen <strong>im</strong> Punkt ⃗x 0 . Die Umkehrung<br />
gilt nur fur stetig dierenzierbare Funktionen, d.h.<br />
Satz 3.3. Jede einmal stetig (partiell) dierenzierbare Funktion f : D →<br />
R, D ⊆ R n oen, ist in allen Punkten von D total dierenzierbar.<br />
Beweis: Fur n = 2 : Sei (x 0 , y 0 ) ∈ D. Fur alle (x, y) aus einer hinreichend kleinen<br />
r-Umgebung U r (x 0 , y 0 ) ⊆ D gilt nach dem Mittelwertsatz fur Funktionen einer<br />
Veranderlichen:<br />
f(x, y) − f(x 0 , y 0 ) = f(x, y) − f(x 0 , y) + f(x 0 , y) − f(x 0 , y 0 )<br />
= f x (ξ, y)(x − x 0 ) + f y (x 0 , η)(y − y 0 )<br />
mit ξ zwischen x und x 0 sowie η zwischen y und y 0 . Damit ist<br />
( )<br />
x − x<br />
f(x, y) = f(x 0 , y 0 ) + grad f(x 0 , y 0 ) ·<br />
0<br />
+ R(x, y)<br />
y − y 0<br />
mit der Funktion<br />
R(x, y) = [f x (ξ, y) − f x (x 0 , y 0 )] (x − x 0 ) + [f y (x 0 , η) − f y (x 0 , y 0 )] (y − y 0 ).<br />
Fur diese Funktion gilt<br />
|R(x, y)|<br />
|(x, y) − (x 0 , y 0 )| ≤ |f x(ξ, y) − f x (x 0 , y 0 )| |x − x 0 |<br />
+ |f y(x 0 , η) − f y (x 0 , y 0 )| |y − y 0 |<br />
|(x, y) − (x 0 , y 0 )|<br />
|(x, y) − (x 0 , y 0 )|<br />
|x − x 0 |<br />
= |f x (ξ, y) − f x (x 0 , y 0 )| √<br />
|x − x0 | 2 + |y − y 0 | + |f |y − y 0 |<br />
y(x 0 , η) − f y (x 0 , y 0 )| √ 2 |x − x0 | 2 + |y − y 0 | 2<br />
≤ |f x (ξ, y) − f x (x 0 , y 0 )| + |f y (x 0 , η) − f y (x 0 , y 0 )| → 0 fur (x, y) → (x 0 , y 0 ),<br />
da die ersten partiellen Ableitungen stetig sind.<br />
□
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 52<br />
Ist f : D → R in einer Umgebung von ⃗x 0 total dierenzierbar, dann ist<br />
g(⃗x) := f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 )<br />
die beste lineare Approx<strong>im</strong>ation von f(⃗x 0 ) nahe bei ⃗x 0 .<br />
Anschauliche Deutung fur n = 2 : Die "<br />
uber\ D ⊆ R 2 liegende Flache (der Graph)<br />
z = f(x, y) wird in der Nahe des Flachenpunktes (x 0 , y 0 , f(x 0 , y 0 )) durch die Ebene<br />
z − z 0 = z − f(x 0 , y 0 ) = f x (x 0 , y 0 )(x − x 0 ) + f y (x 0 , y 0 )(y − y 0 )<br />
⇐⇒ z − f x (x 0 , y 0 )x − f y (x 0 , y 0 )y = (f(x 0 , y 0 ) − f x (x 0 , y 0 )x 0 − f y (x 0 , y 0 )y 0 )<br />
Diese Ebene heit Tangentialebene der Flache z = f(x, y) <strong>im</strong> Punkt (x 0 , y 0 , f(x 0 , y 0 )).<br />
Sie enthalt samtliche Flachentangenten.<br />
Satz 3.4. Jede einmal stetig dierenzierbare Funktion f : D → R, (D ⊆<br />
R n oen) ist auf D (d.h. in allen Punkten von D) total dierenzierbar.<br />
z<br />
n<br />
Tangentialebene<br />
f(x 0<br />
,y 0<br />
)<br />
.<br />
y<br />
. (x0 ,y 0 )<br />
n =(<br />
-f x<br />
(x 0<br />
,y 0<br />
)<br />
-f y<br />
(x 0<br />
,y 0<br />
))<br />
1<br />
x<br />
z−f x 0<br />
, y 0<br />
=f x<br />
x 0<br />
, y 0<br />
x−x 0<br />
f y<br />
x 0<br />
, y 0<br />
y−y 0<br />
<br />
⇔−f x<br />
x 0<br />
,y 0<br />
x−f y<br />
x 0<br />
, y 0<br />
yz=f x 0<br />
, y 0<br />
−f x<br />
x 0<br />
,y 0<br />
x 0<br />
−f y<br />
x 0<br />
, y 0<br />
y 0<br />
Beispiel 3.11. In der Umgebung von (1, 1) lautet die lineare Approx<strong>im</strong>ation<br />
der einmal stetig dierenzierbaren Funktion f(x, y) = x 4 + 2x 3 y 2 + y :<br />
( )<br />
x − 1<br />
f(x, y) = f(1, 1) + grad f(1, 1) ·<br />
+ r((x, y); (1, 1))<br />
y − 1<br />
Dementsprechend ist<br />
= 4 + 10(x − 1) + 5(y − 1) + r((x, y); (1, 1)).<br />
z = 4 + 10(x − 1) + 5(y − 1)
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 53<br />
die Gleichung der Tangentialebene der Flache z = x 4 +2x 3 y 2 +y <strong>im</strong> Flachenpunkt<br />
(1, 1, 4).<br />
Anwendung 3.1. Fehlerrechnung und Näherungsrechnung. Es werden statt<br />
der wahren Werte ⃗x = (x 1 , . . . , x n ) die Naherungswerte ⃗x 0 = (x 10 , . . . , x n0 ) gemessen.<br />
Wie wirkt sich das auf y = f(⃗x) aus? Fur kleine |∆⃗x| = |⃗x − ⃗x 0 | ist der<br />
Fehler r(⃗x, ⃗x 0 ) vernachlassigbar klein, so ergibt sich "<br />
in erster Naherung\ fur<br />
y = f(⃗x) :<br />
∆y = f(⃗x 0 + ∆⃗x) − f(⃗x 0 ) ≈ grad f(⃗x 0 ) · ∆⃗x =<br />
n∑<br />
j=1<br />
∂f<br />
∂x j<br />
(⃗x 0 )∆x j .<br />
Kennt man nun die Megenauigkeit von ∆x j , so erhalt man als ungefahre Fehlerschranke<br />
fur ∆y :<br />
n∑<br />
|∆y| = |∆f(⃗x)| = |f(⃗x) − f(⃗x 0 )| ≈<br />
∂f<br />
∣ (⃗x 0 )<br />
∂x j<br />
∣ |∆x j|<br />
fur ⃗x nahe bei ⃗x 0 .<br />
Fur die Naherungrechnung bedeutet das, dass<br />
j=1<br />
f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 )<br />
eine gute Naherung fur f(⃗x) darstellt, wenn ⃗x 0 nur nahe genug bei ⃗x liegt.<br />
Beispiel 3.12. f(x, y) = x y = e y ln x wird in (1, 3) angenahert durch<br />
f(x, y) ≈ 1 + 3(x − 1) + 0(y − 1).<br />
Man erhalt f(1, 02; 3, 01) ≈ 1 + 3(1, 02 − 1) = 1, 06. Der genaue Wert ist 1, 02 3,01 =<br />
1, 061418168 . . . .<br />
Bemerkung 3.2. Ausgehend von der Naherung<br />
∆y ≈<br />
n∑<br />
j=1<br />
∂f<br />
∂x j<br />
(⃗x 0 )∆x j<br />
schreibt man fur das totale Dierential einer Funktion f : D → R n , D ⊆ R n<br />
(oen) <strong>im</strong> Punkt ⃗x 0 auch:<br />
df(⃗x 0 ) =<br />
n∑<br />
j=1<br />
∂f<br />
∂x j<br />
(⃗x 0 )dx j .<br />
Dabei sind die dx i die Dierentiale der Koordinaten x 1 , x 2 , . . . , x n .<br />
Beispiel 3.13. Anwendungsbeispiel: Fehlerrechnung zum Schubmodul<br />
Dieses Beispiel ist entnommen von:<br />
http://193.175.144.216/praktikumsversuche/elastizitaet.pdf
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 54<br />
Best<strong>im</strong>mung des Schubmoduls: Ein Draht aus Metall, dessen Torsionsmodul best<strong>im</strong>mt<br />
werden soll, ist an seinem oberen Ende fest eingespannt. Sein freies unteres<br />
Ende ist in einem rotationssymmetrischen Korper K 1 mit dem Tragheitsmoment<br />
J 1 eingeklemmt.<br />
Dreht man nun diesen Korper aus seiner Ruhelage, so wirkt auf ihn ein Ruckstellmoment<br />
M aufgrund der Verdrillung des Drahtes. Dieses Ruckstellmoment<br />
ist bei kleiner Auslenkung proportional dem Auslenkwinkel ϕ :<br />
M = D ∗ ϕ,<br />
dabei ist das Richtmoment D ∗ durch das Material und die Abmessung des Drahtes<br />
gegeben:<br />
D ∗ = π r4 G<br />
2L ,<br />
wobei r der Radius, L die Lange des Drahtes und G der Schubmodul des Materials<br />
sind.<br />
Lasst man nun den Korper aus dieser Lage los, so fuhrt er um seine Ruhelage<br />
Drehschwingungen durch mit der Schwingzeit:<br />
T 1 = 2π<br />
√<br />
J1<br />
D ∗ (5)<br />
Daraus lasst sich der Schubmodul best<strong>im</strong>men, wenn das unbekannte Tragheitsmoment<br />
J 1 el<strong>im</strong>iniert werden kann. Dazu wird mit einem Zusatzkorper K 2 der<br />
Masse m 2 mit berechenbarem Tragheitsmoment die Schwingungsdauer T 2 best<strong>im</strong>mt.<br />
J 2 = m 2<br />
2 (R2 1 + r2) 2 siehe Abb. 1.<br />
Bei der Verwendung anderer Zusatzkorper gilt der Steinersche Satz:<br />
so dass<br />
J 2 = m 2<br />
2<br />
[<br />
(r<br />
2<br />
1 + r 2 2) + 2a 2] siehe Abb. 2,<br />
√<br />
2L<br />
T 2 = 2π<br />
G π r (J 4 1 + J 2 ) (6)<br />
ist. Aus den Gleichungen (5) und der Formel fur D ∗ sowie (6) erhalt man:<br />
und damit ist<br />
T2 2 = 4π 2 2L<br />
G π r (J 4 1 + J 2 ),<br />
T1 2 = 4π 2 J 1<br />
D = 2L<br />
∗ 4π2 g π r J 4 1<br />
T2 2 − T1 2 = 4π 2 2L<br />
g π r J 4 2 = 8π L m 2<br />
[<br />
(r<br />
2<br />
G r 4 2 1 + r2) 2 + 2a 2]<br />
und die Formel fur den Schubmodul G lautet<br />
G = 8π L m 2<br />
2 [(r2 1 + r 2 2) + 2a 2 ]<br />
(T 2 2 − T 2 1 ) r 4 .
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 55<br />
Werte und Fehler (und wie ermittelt)<br />
Groe Wert W Fehler ∆W Best<strong>im</strong>mung des Fehlers<br />
L 2, 15m ∆L = 3 · 10 −3 m Schatzung<br />
m 2 0, 487kg ∆m 2 = 100 · 10 −6 kg Genauigkeit der Waage<br />
r 1 2 · 10 −3 m ∆r 1 = 0, 1 · 10 −3 m Schatzung<br />
r 2 20 · 10 −3 m ∆r 2 = 0, 1 · 10 −3 m Schatzung<br />
a 40 · 10 −3 m ∆a = 0, 1 · 10 −3 m Schatzung<br />
T 1 2, 21s ∆T 1 = 20 · 10 −3 s Schatzung aus 10 gemessenen Perioden<br />
T 2 2, 534s ∆T 1 = 20 · 10 −3 s Schatzung aus 10 gemessenen Perioden<br />
r 0, 763 · 10 −3 m ∆r = 10, 4 · 10 −6 m Standardabweichung aus mehreren Messungen<br />
Der max<strong>im</strong>ale Grotfehler ergibt sich nun aus<br />
∣ ∣ ∣ ∣ |∆G| ≤<br />
∂G<br />
∣∣∣ ∣ ∂L ∣ · |∆L| + ∂G ∣∣∣ · |∆m 2 | +<br />
∂G ∣∣∣ ∂m 2<br />
∣ · |∆r 1 | +<br />
∂G ∣∣∣<br />
∂r 1<br />
∣ · |∆r 2 |<br />
∂r 2 ∣ ∣ ∣ +<br />
∂G<br />
∣∣∣ ∣ ∂a ∣ · |∆a| + ∂G ∣∣∣ · |∆T 1 | +<br />
∂G ∣∣∣ ∂T 1<br />
∣ · |∆T 2 | +<br />
∂G<br />
∂T 2<br />
∣ ∂r ∣ · |∆r| .
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 56<br />
Wir benotigen somit die folgenden partiellen Ableitungen:<br />
∂G<br />
∂L<br />
=<br />
8π ·<br />
m2<br />
2 · (r2 1 + r 2 2 + 2a 2 )<br />
(T 2 2 − T 2 1 ) · r 4 = G L ;<br />
∂G<br />
= 8π · L · 1 · 2 (r2 1 + r2 2 + 2a 2 )<br />
= G ;<br />
∂m 2 (T2 2 − T1 2 ) · r 4 m 2<br />
∂G<br />
∂r 1<br />
=<br />
∂G<br />
∂r 2<br />
=<br />
∂G<br />
∂a<br />
∂G<br />
∂T 1<br />
=<br />
8π · L ·<br />
m2<br />
2 · 2r 1<br />
(T 2 2 − T 2 1 ) · r 4 ;<br />
8π · L ·<br />
m2<br />
2 · 2r 2<br />
(T 2 2 − T 2 1 ) · r 4 ;<br />
=<br />
8π · L ·<br />
m2<br />
2 · 2 · 2a<br />
(T 2 2 − T 2 1 ) · r 4 ;<br />
8π · L ·<br />
m2<br />
2 · (r2 1 + r 2 2 + 2a 2 ) · 2T 1 · r 4<br />
((T 2 2 − T 2 1 ) · r 4 ) 2 ;<br />
m2<br />
∂G 8π · L ·<br />
= − · 2 (r2 1 + r2 2 + 2a 2 ) · (−2T 2 ) · r 4<br />
;<br />
∂T 2 ((T2 2 − T1 2 ) · r 4 ) 2<br />
∂G<br />
∂r<br />
m2<br />
(−4) · 8π · L ·<br />
2<br />
= · (r2 1 + r2 2 + 2a 2 )<br />
= (−4) · G .<br />
(T2 2 − T1 2 ) · r 5 r<br />
Setzt man nun die Zahlenwerte ein, so erhalt man die Abschatzungen fur den<br />
Betrag der partiellen Ableitungen. Multipliziert man diese nun mit den Werten<br />
fur die entsprechenden Fehler so erhalt man:<br />
∂G<br />
∣ ∂L ∣ · |∆L| = 0, 127 · N ∣ ∣ ∣∣∣ 109 m ; ∂G ∣∣∣<br />
· |∆m 2 2 | = 18, 7 · 10 6 N ∂m 2 m ;<br />
∣ 2 ∂G ∣∣∣<br />
∣ · |∆r 1 | = 10, 10 · 10 6 N ∣ ∣ ∣∣∣<br />
∂r 1 m ; ∂G ∣∣∣<br />
· |∆r 2 2 | = 0, 101 · 10 9 N ∂r 2 m ;<br />
2 ∂G<br />
∣ ∂a ∣ · |∆a| = 0, 404 · N ∣ ∣ ∣∣∣ 109 m ; ∂G ∣∣∣<br />
· |∆T 2 1 | = 5, 2 · 10 9 N ∂T 1 m ;<br />
∣ 2 ∂G ∣∣∣<br />
∣ · |∆T 2 | = 6 · 10 9 N ∣ ∣∣∣<br />
∂T 2 m ; ∂G<br />
2 ∂r ∣ · |∆r| = 4, 96 · N 109 m ; 2<br />
Damit ist der max<strong>im</strong>ale Grotfehler<br />
und wir erhalten<br />
sowie als relativen Grotfehler<br />
|∆G| ≤ 1, 68 · 10 10 N m 2<br />
G = 9, 1 · 10 10 N m 2 ± 1, 7 · 1010 N m 2<br />
∆G<br />
G<br />
= 18, 5%.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 57<br />
Der Literaturwert fur Stahl ist 8, 04 · 10 10 N m 2 . Zum Vergleich, der Literaturwert<br />
fur Kupfer ist 4, 55 · 10 10 N m 2 .<br />
Beispiel 3.14. Best<strong>im</strong>mung der Erdbeschleunigung mit einem Kugelfallgerat.<br />
Dieses Beispiel ist entnommen<br />
http://www.fh-gelsenkirchen.de/fb02/homepages/schmiler/Vordrucke/Fehlerrechnung.pdf<br />
Zur Best<strong>im</strong>mung der Erdbeschleunigung g wird eine Kugel der Masse m aus der<br />
Hohe h fallengelassen. Best<strong>im</strong>mt werden die Hohe mit einem Maband sowie<br />
die Fallzeit mit einer Stoppuhr. Aus diesen beiden Groen kann man dann mit<br />
Hilfe der Beziehung<br />
die gesuchte Fallbeschleunigung zu<br />
best<strong>im</strong>mt werden.<br />
h = 1 2 gt2<br />
g = 2h<br />
t 2<br />
Der absolute Grotfehler ergibt sich dann aus<br />
∣ ∣ ∣ (<br />
|∆g| ≤<br />
∂g ∣∣∣<br />
∣∂h · ∆h +<br />
∂g ∣∣∣<br />
∣ ∂t · ∆t =<br />
2 ∣∣∣<br />
∣t · ∆h +<br />
2 ∣ − 4h )<br />
· ∆t<br />
t 3 ∣ .<br />
Dabei wird eine Zahl mit zugehoriger Einheit eingesetzt.<br />
Um besser ersehen zu konnen, welche der beiden Messgroen den starkeren<br />
Einuss auf das Ergebnis ausubt, berechnet man den relativen Grotfehler:<br />
∣ ∣ ∆g ∣∣∣∣ 2<br />
∣∣∣∣<br />
g ≤ t 2<br />
· ∆h<br />
∣ + − 4h<br />
∣ ∣ t 3<br />
∣∣∣<br />
· ∆t<br />
2h<br />
∣ = ∆h<br />
∣∣∣ h ∣ + 2 ∆t<br />
t ∣ .<br />
2h<br />
t 2<br />
t 2<br />
Folglich wird sich ein Fehler in der Zeitmessung (Faktor 2) <strong>im</strong>mer starker auswirken<br />
als ein Fehler bei der Best<strong>im</strong>mung der Fallhohe (Faktor 1). Auerdem<br />
ergeben sich einheitslose Groen. Um die Abweichungen konkret berechnen zu<br />
konnen, benotigt man noch Zahlenwerte fur ∆h bzw. ∆t. Diese Abweichungen<br />
bzw. Messungenauigkeiten ergeben sich je nach gewahltem Messverfahren wie<br />
folgt:<br />
• Hat man eine Messreihe (z.B. 10 oder mehr verschiedene Messungen)<br />
fur die entsprechende Groe x, so berechnet man die Standardabweichung<br />
s des Mittelwerts x = 1 n ∑<br />
n i=1 x i:<br />
√ ∑n<br />
i=1<br />
s =<br />
(x i − x)<br />
.<br />
n − 1<br />
• Hat man die entsprechende Groe nur einmal gemessen, so ist die Messungenauigkeit<br />
einzusetzen. Dabei liegt es <strong>im</strong> Ermessen der versuchsdruchfuhrenden<br />
Person, wie hoch diese Ungenauigkeit anzusetzen ist.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 58<br />
Bei sehr genauen Messungen kann z.B. die Halfte des kleinsten Skalenteils<br />
angesetzt werden, wahrend bei anderen Messungen u.U. eine<br />
groere Ungenauigkeit angenommen werden muss.<br />
• Wird die Messungen mit Hilfe eines Gerats durchgefuhrt, so gibt in der<br />
Regel die Hersteller die Messungenauigkeit an.<br />
1.5. Richtungsableitung. Die partiellen Ableitungen ∂f<br />
∂x j<br />
(⃗x) geben die "<br />
momentane\<br />
Anderung der Funktionswerte in Richtung der Koordinatenachsen an.<br />
Zu jedem Vektor ⃗v ∈ R n , ⃗v ≠ ⃗0, nenne wir den Grenzwert<br />
1<br />
∂ ⃗v f(⃗x) := l<strong>im</strong> [f(⃗x + t⃗v) − f(⃗x)]<br />
t→0 t<br />
(sofern er existiert) die Ableitung von f an der Stelle ⃗x langs ⃗v.<br />
Definition 3.10. Ist ⃗v eine Einheitsvektor (|⃗v| = 1), dann heit ∂ ⃗v f(⃗x) =<br />
(⃗x) Richtungsableitung von f an der Stelle ⃗x in Richtung ⃗v.<br />
∂f<br />
∂⃗v<br />
Betrachtet man die Einschrankung von f langs der Geraden ⃗x + t⃗v, also<br />
dann gilt nach Denition<br />
und deshalb<br />
h(t) := f(⃗x + t⃗v),<br />
ḣ(0) := d ∣<br />
∣∣∣t=0<br />
dt f(⃗x + t⃗v) 1<br />
= l<strong>im</strong><br />
t→0 t [f(⃗x + t⃗v) − f(⃗x)] = ∂ ⃗vf(⃗x),<br />
∂ ⃗v f(⃗x) > 0 ⇒ f(⃗x) n<strong>im</strong>mt in Richtung ⃗v zu.<br />
∂ ⃗v f(⃗x) < 0 ⇒ f(⃗x) n<strong>im</strong>mt in Richtung ⃗v ab.<br />
Anschauliche Deutung für n = 2. Die Schnittkurve des Graphen z = f(x, y) mit<br />
der zur z-Achse parallelen Ebene durch die Gerade<br />
( ) ( )<br />
( )<br />
x 0 v 1<br />
v<br />
+ t mit 1<br />
⃗v = , |⃗v| = 1,<br />
y 0 v 2 v 2<br />
besitzt die Parameterdarstellung<br />
⎛<br />
⃗x(t) =<br />
⎜<br />
⎝<br />
x 0 + tv 1<br />
y 0 + tv 2<br />
f(x 0 + tv 1 , y 0 + tv 2 )<br />
⎞<br />
⎟<br />
⎠<br />
mit dem Tangentialvektor<br />
˙⃗x(t) =<br />
⎛<br />
⎜<br />
⎝<br />
v 1<br />
v 2<br />
∂ ⃗v f(x 0 , y 0 )<br />
⎞<br />
⎟<br />
⎠<br />
<strong>im</strong> Kurvenpunkt (x 0 , y 0 , f(x 0 , y 0 )). Die Tangente hat den Anstieg ∂ ⃗v f(x 0 , y 0 ).
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 59<br />
Satz 3.5. Fur jede auf der oenen Menge D ⊆ R n total dierenzierbaren<br />
Funktion f und fur jeden Vektor ⃗v ∈ R n , ⃗v ≠ ⃗0, gilt<br />
n∑<br />
∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v = f xj (⃗x)v i .<br />
Mit |ṽ| = 1 ist das die Richtungsableitung von f an der Stelle ⃗x in Richtung<br />
⃗v.<br />
j=1<br />
(siehe Satz 3.2 Absatze 2 und 3.)<br />
z<br />
y<br />
f(x 0<br />
,y 0<br />
)<br />
grad f (x 0<br />
,y 0<br />
)<br />
.<br />
(x 0<br />
,y 0<br />
)<br />
v=(α 1<br />
,α 2<br />
) T<br />
x<br />
φ<br />
tan φ = ∂ (α1 ,α 2 ) f(x 0 ,y 0 ) = α 1 f x (x 0 ,y 0 ) + α 2 f y (x 0 ,y 0 )<br />
Beispiel 3.15. Der Anstieg der Funktion f(x, y) = x 2 + y 2 <strong>im</strong> Punkt (1, 1) in<br />
der Richtung des (Einheits-)Vektors ⃗v = (sin α, cos α) T betragt<br />
( ) ( )∣ ( )<br />
∣∣∣∣(1,<br />
sin α 2x<br />
sin α<br />
∂ ⃗v f(⃗x) = grad f(1, 1) ·<br />
=<br />
· = 2(sin α + cos α).<br />
cos α 2y<br />
cos α<br />
1)<br />
1.6. Parameterdarstellungen. Man nennt {⃗x(t), t A ≤ t ≤ t B } eine Parameterdarstellung<br />
einer vektorwertigen Funktion. Jeder Funktionswert wird durch<br />
einen Wert des Parameters t best<strong>im</strong>mt. Oder anders ausgedruckt, der Vektor ⃗x(t)<br />
variiert in Abhangigkeit des Parameters t. Wir betrachten daher vektorwertige, auf<br />
dem Intervall I ⊆ R erklarte Funktionen ⃗x : I → R n . Jede derartige Funktion besteht<br />
aus n Komponentenfunktionen x i : I → R (1 ≤ i ≤ n), d.h.<br />
⎛<br />
⃗x(t) = ⎜<br />
⎝<br />
x 1 (t)<br />
x 2 (t)<br />
.<br />
x n (t)<br />
⎞<br />
⎟<br />
⎠ , t ∈ I.
1. REELLWERTIGE FUNKTIONEN MEHRERER REELLER VERANDERLICHER 60<br />
Die Begrie des Grenzwerts, der Stetigkeit, der Dierenzierbarkeit werden auf die<br />
Komponentenfunktionen zuruckgefuhrt:<br />
Definition 3.11. Fur die Funktion ⃗x : I → R n gilt:<br />
(1) ⎛ ⎞ ⎛ ⎞<br />
x 1 (t)<br />
c 1<br />
x 2 (t)<br />
l<strong>im</strong> ⃗x(t) = ⎜ ⎟<br />
t→t 0 ⎝ . ⎠ = ⃗c = c 2<br />
⎜ ⎟ ⇐⇒ l<strong>im</strong> x i (t) = c i , 1 ≤ i ≤ n.<br />
⎝ . ⎠ t→t 0<br />
x n (t)<br />
c n<br />
(2) Entsprechend heit ⃗x : I → R n in t 0 ∈ I (auf I) stetig, bzw. dierenzierbar,<br />
wenn alle Komponentenfunktionen in t 0 ∈ I (auf I) stetig,<br />
bzw. dierenzierbar sind.<br />
(3) Die Ableitung ist ebenfalls komponentenweise zu berechnen:<br />
˙⃗x(t) = d 1<br />
⃗x(t) = l<strong>im</strong><br />
dt h→0<br />
⎛<br />
h [⃗x(t + h) − ⃗x(t)] = ⎜<br />
⎝<br />
ẋ 1 (t)<br />
ẋ 2 (t)<br />
.<br />
ẋ n (t)<br />
⎞<br />
⎟<br />
⎠ mit ẋ i(t) = d dt x i(t).<br />
1.7. Kettenregel.<br />
Satz 3.6. Kettenregel. Fur jede einmal stetig (partiell) dierenzierbare<br />
Funktion f : D → R, D ⊂ R n oen, und jede Parametrisierung ⃗x : R ⊇<br />
[a, b] → D gilt<br />
d<br />
dt f(⃗x(t)) = d dt f(x 1(t), x 2 (t), . . . , x n (t))<br />
= f x1 (⃗x(t))ẋ 1 (t) + . . . + f xn (⃗x(t))ẋ n (t) = grad f(⃗x(t)) · ˙⃗x(t).<br />
Beweis: Es sei ⃗x(t 0 ) = ⃗x 0 , dann ist<br />
da, f total dierenzierbar ist, gilt<br />
d<br />
1<br />
f(⃗x(t)) := l<strong>im</strong><br />
dt h→0 h [f(⃗x(t 0 + h)) − f(⃗x(t 0 ))]<br />
1<br />
= l<strong>im</strong><br />
h→0 h [grad f(⃗x 0) · (⃗x(t 0 + h) − ⃗x(t 0 )) + r(⃗x(t 0 + h), ⃗x 0 )]<br />
wobei l<strong>im</strong> h→0<br />
r(⃗x(t 0 +h), ⃗x 0 )<br />
|h|<br />
= 0 ist, d.h.<br />
1<br />
= grad f(⃗x 0 ) · l<strong>im</strong><br />
h→0 h (⃗x(t 0 + h) − ⃗x(t 0 )) = grad f(⃗x(t 0 )) · ˙⃗x(t 0 ).<br />
□
2. BEDEUTUNG DES GRADIENTEN 61<br />
Anwendung 3.2. Die Kettenregel benotigt man <strong>im</strong>mer dann, wenn neue<br />
Variable eingefuhrt werden und die partiellen Ableitungen in Bezug auf diese<br />
Veranderlichen zu berechnen sind.<br />
Polarkoordinaten <strong>im</strong> R 2 . Durch x = r cos ϕ,<br />
f(x, y), (x, y) ∈ D ⊆ R 2 , transformiert in<br />
F (r, ϕ) := f(r cos ϕ, r sin ϕ).<br />
y = r sin ϕ wird die Funktion<br />
Fur die partiellen Ableitungen von F ergibt sich aus der Kettenregel fur einmal<br />
stetig dierenzierbares f :<br />
d.h. (<br />
und damit<br />
∼<br />
(<br />
(<br />
F r = f x cos ϕ + f y sin ϕ,<br />
F ϕ = f x (−r sin ϕ) + f y (r cos ϕ),<br />
) (<br />
F r<br />
=<br />
F ϕ<br />
cos ϕ sin ϕ 1 0<br />
−r sin ϕ r cos ϕ 0 1<br />
cos ϕ<br />
−r sin ϕ<br />
r cos ϕ 0 r − r sin 2 ϕ − cos ϕ sin ϕ<br />
0 r r sin ϕ cos ϕ<br />
und damit (<br />
) (<br />
f x<br />
=<br />
f y<br />
) (<br />
sin ϕ<br />
r cos ϕ<br />
)<br />
f x<br />
f y<br />
) (<br />
)<br />
cos ϕ sin ϕ 1 0<br />
∼<br />
0 r r sin ϕ cos ϕ<br />
) (<br />
)<br />
1 0 cos ϕ − 1<br />
∼<br />
sin ϕ r<br />
1<br />
0 1 sin ϕ cos ϕ r<br />
) (<br />
cos ϕ − 1 sin ϕ r<br />
1<br />
sin ϕ cos ϕ r<br />
2. Bedeutung des Gradienten<br />
)<br />
F r<br />
.<br />
F ϕ<br />
2.1. Richtung des steilsten Anstiegs. Fur eine einmal stetig dierenzierbare<br />
Funktion f : R n ⊇ D → R ist der Anstieg <strong>im</strong> Punkt ⃗x ∈ D in Richtung des Vektors<br />
⃗v mit |⃗v| = 1 gegeben durch<br />
∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v = |grad f(⃗x)| |⃗v| cos α = |grad f(⃗x)| cos α,<br />
wobei α, den von grad f(⃗x) und ⃗v eingeschlossenen Winkel bezeichnet. Dieser Anstieg<br />
ist am groten fur cos α = 1, d.h. α = 0. Also gilt fur grad f(⃗x) ≠ ⃗0 :<br />
Richtung von grad f(⃗x) = Richtung des max<strong>im</strong>alen Anstiegs der Funktion f<br />
in ⃗x = Richtung mit dem groten Zuwachs von f in Richtung ⃗x.<br />
Da f genau dann ansteigt, wenn −f abfallt, erhalt man gleichzeitig die Richtung des<br />
steilsten Abstiegs der Funktionswerte, namlich −grad f.
3. TAYLOR-FORMEL 62<br />
2.2. Gradient und Niveaumengen. Sei D ⊆ R n oen und f : D → R eine<br />
einmal stetig dierenzierbare Funktion, dann deniert f(⃗x) = c eine Hyperache in<br />
D. Fur jede parametrisierte Kurve t → ⃗x(t) auf dieser Hyperache gilt f(⃗x)(t) =<br />
c, t ∈ I, und mit der Kettenregel (siehe Satz 3.6) folgt<br />
d<br />
dt f(⃗x)(t) =<br />
n∑<br />
f xj (⃗x)(t)ẋ j (t) = gradf(⃗x)(t) · ˙⃗x(t) = 0.<br />
j=1<br />
Folgerung: gradf(⃗x)(t) steht senkrecht auf ˙⃗x(t) = Tangente an die Kurve ⃗x(t). Dies<br />
gilt fur jede Kurve.<br />
Damit steht grad f(⃗x 0 ) auf allen Tangentialvektoren an die Niveaumenge<br />
N ⃗x0 := {x ∈ D : f(⃗x) = f(⃗x 0 ) = c.}<br />
Anwendung 3.3. Gesucht sei das Min<strong>im</strong>um der einmal stetig dierenzierbaren<br />
Funktion f(x, y) <strong>im</strong> oen Gebiet D ⊆ R n . Das Gradientenverfahren besteht<br />
nun darin, von einem best<strong>im</strong>mten Startwert ⃗x 0 auszugehen, d.h.<br />
(1) Wahle ⃗x 0 ∈ D.<br />
(2) Man berechne grad f(⃗x 0 ) und berechne ⃗x 1 := ⃗x 0 − hgrad f(⃗x 0 ) mit einer<br />
dem Problem angepassten Schrittweite h > 0. Ist f(⃗x 1 ) > f(⃗x 0 ), so ist<br />
man zu weit gegangen und man versucht es deshalb noch einmal mit 1 2 h.<br />
(3) Ist f(⃗x 1 ) < f(⃗x 0 ), n<strong>im</strong>mt man ⃗x 1 als neuen Startwert und wiederhalt die<br />
Schritte 2 und 3.<br />
Auf diese Weise nahert man sich auf einem Streckenzug in D einer Min<strong>im</strong>alstelle<br />
der Funktion. Diese Stelle hangt vom gewahlten Startwert ab und muss<br />
nicht das globale Min<strong>im</strong>um sein. D.h. das Gradientenverfahren ermittelt ein<br />
lokales Min<strong>im</strong>um.<br />
Der Fall des lokalen Max<strong>im</strong>ums geht analog.<br />
3. Taylor-Formel<br />
Wir verallgemeinern die Taylor-Formel fur Funktionen einer Veranderlichen (siehe<br />
Satz 1.8) auf Funktionen mehrerer Veranderlicher. Dazu betrachten wir konvexe<br />
Gebiete, d.h. D ist oen und mit ⃗x, ⃗y ∈ D liegt <strong>im</strong>mer auch die gesamte verbindende<br />
Gerade ⃗x + t(⃗y − ⃗x), t ∈ [0, 1] vollstandig in D. Weiterhin sei f : R n ⊇ D → R<br />
k + 1-mal stetig dierenzierbar in n Variablen. Wir setzen:<br />
h(t) := f(⃗x 0 + t⃗v), t ∈ [0, 1]<br />
dann ist<br />
und<br />
1<br />
ḣ(0) = l<strong>im</strong><br />
t→0 t (f(⃗x 0 + t⃗v) − f(⃗x 0 )) =: ∂ ⃗v f(⃗x 0 )<br />
ḧ(0) = ∂ ⃗v (∂ ⃗v f))(⃗x 0 ) = ∂ 2 ⃗vf(⃗x 0 ), . . . , h (k) (0) = ∂ k ⃗v f(⃗x 0 ).
3. TAYLOR-FORMEL 63<br />
Aus der Taylor-Formel fur h :<br />
die<br />
h(t) := h(0) + ḣ(0)<br />
1!<br />
t + ḧ(0)<br />
2!<br />
t 2 + . . . h(k) (0)<br />
t k + h(k+1) (ξ)<br />
k! (k + 1)! tk+1<br />
Satz 3.7. Taylor-Formel für n Variable. Ist D ⊆ R n ein konvexes<br />
Gebiet, f k +1-mal stetig dierenzierbar, ⃗x ∈ D, dann gilt mit ⃗x+t⃗v ∈ D<br />
fur alle t ∈ [0, 1] :<br />
f(⃗x 0 + t⃗v) = f(⃗x 0 ) + 1 1! ∂ ⃗vf(⃗x 0 )t + 1 2! ∂2 ⃗vf(⃗x 0 )t 2 + . . . + 1 k! ∂k ⃗v f(⃗x 0 )t k + R k+1 (⃗x, ⃗v)<br />
mit dem Restglied<br />
R k+1 (⃗x, ⃗v) =<br />
und einer Zahl ξ zwischen 0 und t.<br />
1<br />
(k + 1)! ∂k+1 ⃗v<br />
f(⃗x 0 + ξ⃗v)t k+1<br />
Wir wollen uns einige Spezialfalle ansehen. Wie bereits gezeigt ist:<br />
∂ ⃗v f(⃗x 0 ) = grad f(⃗x 0 ) · ⃗v =<br />
n∑<br />
f xj (⃗x 0 )v j .<br />
j=1<br />
Wir berechnen ∂ 2 ⃗v f(⃗x 0),<br />
∂⃗vf 2 1<br />
= ∂ ⃗v (∂ ⃗v f) = ∂ ⃗v (grad f · ⃗v) = l<strong>im</strong><br />
t→0<br />
1<br />
= l<strong>im</strong><br />
t→0 t [(grad f(⃗x 0 + t⃗v) − grad f(⃗x 0 )) · ⃗v] =<br />
t [(grad f(⃗x 0 + t⃗v) · ⃗v) − (grad f(⃗x 0 ) · ⃗v)]<br />
[<br />
]<br />
1<br />
l<strong>im</strong><br />
t→0 t (grad f(⃗x 0 + t⃗v) − grad f(⃗x 0 )) · ⃗v<br />
= (grad ∂ x1 f(⃗x 0 ) · ⃗v) v 1 + (grad ∂ x2 f(⃗x 0 ) · ⃗v) v 2 + . . . + (grad ∂ xn f(⃗x 0 ) · ⃗v) v n<br />
= ∂ 2 x 1<br />
f(⃗x 0 )v 2 1 + ∂ x2 ∂ x1 f(⃗x 0 )v 2 v 1 + . . . + ∂ xn ∂ x1 f(⃗x 0 )v n v 1 + . . . + ∂ x1 ∂ xn f(⃗x 0 )v 1 v n + . . . ∂ 2 x n<br />
f(⃗x 0 )v 2 n<br />
= ⃗v T H f (⃗x 0 )⃗v,<br />
dabei bezeichnet H f (⃗x 0 ) die Hesse-Matrix von f an der Stelle ⃗x 0 . Kehren wir nun<br />
zuruck zu Taylor-Formel, so ist mit ⃗x = ⃗x 0 + t⃗v ⇐⇒ t⃗v = ⃗x − ⃗x 0 :<br />
∂ ⃗v f(⃗x 0 )t = grad f(⃗x 0 ) · (⃗vt) =<br />
und<br />
n∑<br />
f xj (⃗x 0 )v j t = grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) =<br />
j=1<br />
n∑<br />
f xj (⃗x 0 )(x j − x 0j ).<br />
j=1<br />
∂ 2 ⃗vf(⃗x 0 )t 2 = (⃗vt) T H f (⃗x 0 )(⃗vt) = (⃗x − ⃗x 0 ) T H f (⃗x 0 )(⃗x − ⃗x 0 ).
3. TAYLOR-FORMEL 64<br />
Taylor-Formel zum Entwicklungsgrad 2: Ist D ⊆ R n ein konvexes Gebiet, f<br />
3-mal stetig dierenzierbar, ⃗x 0 , ⃗x ∈ D :<br />
f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗x 0)(⃗x − ⃗x 0 ) + 1 2! (⃗x − ⃗x 0) T H f (⃗x 0 )(⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 ),<br />
r(⃗x, ⃗x<br />
mit l<strong>im</strong> 0 )<br />
⃗x→⃗x0 |⃗x−⃗x 0 | 2<br />
der Stelle ⃗x 0 .<br />
= 0, dabei bezeichnet H f (⃗x 0 ) die Hesse-Matrix von f an<br />
Bemerkung 3.3. Ist f nur 2-mal stetig dierenzierbar, so gilt unter den<br />
obigen Voraussetzungen:<br />
f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗x 0)(⃗x − ⃗x 0 ) + 1 2! (⃗x − ⃗x 0) T H f ( ⃗ ξ)(⃗x − ⃗x 0 )<br />
mit ⃗ ξ = ⃗x 0 + τ(⃗x − ⃗x 0 ), fur irgendein τ ∈ [0, 1].<br />
Ist f nur einmal stetig dierenzierbar, dann gilt<br />
f(⃗x) = f(⃗x 0 ) + 1 1! grad f(⃗ ξ)(⃗x − ⃗x 0 )<br />
mit ⃗ ξ = ⃗x 0 + τ(⃗x − ⃗x 0 ), fur irgendein τ ∈ [0, 1]. (Mittelwertsatz).
4. ZUSAMMENFASSUNG ABLEITUNGSBEGRIFFE FUR FUNKTIONEN MEHRERER VERANDERLICHER65<br />
4. Zusammenfassung Ableitungsbegriffe für Funktionen mehrerer<br />
Veränderlicher<br />
Es sei f : D → R auf der oenen Teilmenge D des R n deniert und stetig.<br />
Begri<br />
partielle Ableitung<br />
Denition<br />
1<br />
f xi (⃗x) = l<strong>im</strong> [f(⃗x + t⃗e<br />
t→0 t i) − f(⃗x)]<br />
f ist partiell dierenzierbar in ⃗x ∈ D, wenn alle partiellen Ableitungen von<br />
f in ⃗x ∈ D existieren.<br />
totales Dierential<br />
(vollstandiges Dierential)<br />
f(⃗x) = f(⃗x 0 ) + ⃗a · (⃗x − ⃗x 0 ) + r(⃗x, ⃗x 0 )<br />
mit l<strong>im</strong><br />
⃗x→⃗x0<br />
r(⃗x, ⃗x 0 )<br />
|⃗x−⃗x 0 |<br />
= 0.<br />
Ist f einmal stetig dierenzierbar, so ist f total dierenzierbar mit ⃗a =<br />
grad f(⃗x 0 )<br />
geometrisch: z = f(⃗x 0 ) + grad f(⃗x 0 ) · (⃗x − ⃗x 0 ) ist die Tangentialebene an den<br />
Flachenpunkt (⃗x 0 , f(⃗x 0 )). Weiterhin ist z die beste lineare Approx<strong>im</strong>ation<br />
von f(⃗x) an der Stelle ⃗x 0 .<br />
Richtungsableitung<br />
1<br />
∂ ⃗v f(⃗x) = l<strong>im</strong> [f(⃗x + t⃗v) − f(⃗x)] ,<br />
t→0 t<br />
⃗v ∈ R n , |⃗v| = 1.<br />
Ist f einmal stetig dierenzierbar, so ist ∂ ⃗v f(⃗x) = grad f(⃗x) · ⃗v.<br />
geometrisch: ∂ ⃗v f(⃗x) ist der Anstieg der Funktion f an der Stelle ⃗x in Richtung<br />
⃗v (⃗v ≠ ⃗0, |⃗v| = 1.)<br />
Bedeutungen des Gradienten:<br />
(1) Der Gradient ist der Vektor der ersten partiellen Ableitungen.<br />
(2) Der Gradient zeigt <strong>im</strong>mer in Richtung des steilsten Anstiegs.<br />
(3) Der Gradient steht senkrecht auf den Niveauachen (Hohenlinien, Aquipotentialachen)<br />
f(⃗x) = c.<br />
Anwendungen:<br />
(1) Naherungsrechnung,<br />
(2) Fehlerrechnung,<br />
(3) Gradientenverfahren.