disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald
disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald
disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4.5. Bellman-Prinzip<br />
genannt. 6<br />
Zusammen mit den Endbedingungen entsteht eine Evolutionsgleichung, deren<br />
globale Lösbarkeit, wie im Satz gefordert, im Allgemeinen nicht gesichert ist.<br />
Satz 4.7 Hinreichende Bedingung.<br />
Wenn es auf [t 0 , T ] × R n eine reelle, stetig differenzierbare Funktion V (t, x) gibt, die<br />
die Hamilton-Jacobi-Bellman-Gleichung<br />
erfüllt, und wenn die durch<br />
−V t (t, x) = max<br />
u∈Ω H(x, u, V x(t, x), t), (4.9)<br />
V (T, x T ) = q(x(T ))<br />
û(t, x) = arg max<br />
u∈Ω H(x, u, V x(t, x), t) (4.10)<br />
bestimmte (closed-loop) Steuerung zulässig ist, dann ist die entsprechende open-loop<br />
Steuerung u ∗ (·) mit der zugehörigen Zustandstrajektorie x ∗ (·) eine optimale Lösung<br />
von (4.1).<br />
Beweis:<br />
Die linke Seite von (4.9) ist unabhängig von u, daher kann diese Gleichung auch in<br />
der Form<br />
max [V t(t, x) + H(x, u, V x (t, x), t)] = 0 (4.11)<br />
u∈Ω<br />
dargestellt werden. Wir nehmen die zulässige Steuerung u ∗ (·) und wählen eine<br />
beliebige (und auf [t 0 , T ] zulässige) Steuerung u − (·).<br />
Seien x ∗ (·) und x − (·) die jeweils eindeutigen Zustandstrajektorien, die durch u ∗ (·)<br />
beziehungsweise u − (·) auf dem Intervall [t 0 , T ] erzeugt werden, so dass x ∗ (t 0 ) =<br />
x − (t 0 ) = x 0 gilt. Dann folgt aus (4.10) und (4.11):<br />
0 =V t (t, x ∗ ) + H(x ∗ (t), u ∗ (t), V ∗<br />
x (t, x ∗ ), t) ≥<br />
V t (t, x − ) + H(x − (t), u − (t), V x (t, x − ), t).<br />
Mit der Definition der Hamiltonfunktion H = g +V x ·f und unter Berücksichtigung<br />
von<br />
dV (t, x) ∂V (t, x) ∂V (t, x)<br />
= + f(t, x, u)<br />
dt ∂t ∂x<br />
6 Der Name bezieht sich auf William Rowan Hamilton (1805-1865), der zur Entwicklung der<br />
Variationsrechnung wesentliche Ergebnisse beitrug, auf Carl Gustav Jacobi (1804-1851), der in der<br />
Variationsrechnung weitreichende Beiträge zur Theorie der hinreichenden Bedingungen geleistet<br />
hat und auf Richard Bellman (1920-1984), der die dynamische Programmierung auf den Weg<br />
brachte. Eigentlich stammt diese Gleichung von Constantin Carathéodory (1873-1950), dessen<br />
Name nicht erwähnt wurde.<br />
69