31.01.2014 Aufrufe

disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald

disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald

disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

4.5. Bellman-Prinzip<br />

genannt. 6<br />

Zusammen mit den Endbedingungen entsteht eine Evolutionsgleichung, deren<br />

globale Lösbarkeit, wie im Satz gefordert, im Allgemeinen nicht gesichert ist.<br />

Satz 4.7 Hinreichende Bedingung.<br />

Wenn es auf [t 0 , T ] × R n eine reelle, stetig differenzierbare Funktion V (t, x) gibt, die<br />

die Hamilton-Jacobi-Bellman-Gleichung<br />

erfüllt, und wenn die durch<br />

−V t (t, x) = max<br />

u∈Ω H(x, u, V x(t, x), t), (4.9)<br />

V (T, x T ) = q(x(T ))<br />

û(t, x) = arg max<br />

u∈Ω H(x, u, V x(t, x), t) (4.10)<br />

bestimmte (closed-loop) Steuerung zulässig ist, dann ist die entsprechende open-loop<br />

Steuerung u ∗ (·) mit der zugehörigen Zustandstrajektorie x ∗ (·) eine optimale Lösung<br />

von (4.1).<br />

Beweis:<br />

Die linke Seite von (4.9) ist unabhängig von u, daher kann diese Gleichung auch in<br />

der Form<br />

max [V t(t, x) + H(x, u, V x (t, x), t)] = 0 (4.11)<br />

u∈Ω<br />

dargestellt werden. Wir nehmen die zulässige Steuerung u ∗ (·) und wählen eine<br />

beliebige (und auf [t 0 , T ] zulässige) Steuerung u − (·).<br />

Seien x ∗ (·) und x − (·) die jeweils eindeutigen Zustandstrajektorien, die durch u ∗ (·)<br />

beziehungsweise u − (·) auf dem Intervall [t 0 , T ] erzeugt werden, so dass x ∗ (t 0 ) =<br />

x − (t 0 ) = x 0 gilt. Dann folgt aus (4.10) und (4.11):<br />

0 =V t (t, x ∗ ) + H(x ∗ (t), u ∗ (t), V ∗<br />

x (t, x ∗ ), t) ≥<br />

V t (t, x − ) + H(x − (t), u − (t), V x (t, x − ), t).<br />

Mit der Definition der Hamiltonfunktion H = g +V x ·f und unter Berücksichtigung<br />

von<br />

dV (t, x) ∂V (t, x) ∂V (t, x)<br />

= + f(t, x, u)<br />

dt ∂t ∂x<br />

6 Der Name bezieht sich auf William Rowan Hamilton (1805-1865), der zur Entwicklung der<br />

Variationsrechnung wesentliche Ergebnisse beitrug, auf Carl Gustav Jacobi (1804-1851), der in der<br />

Variationsrechnung weitreichende Beiträge zur Theorie der hinreichenden Bedingungen geleistet<br />

hat und auf Richard Bellman (1920-1984), der die dynamische Programmierung auf den Weg<br />

brachte. Eigentlich stammt diese Gleichung von Constantin Carathéodory (1873-1950), dessen<br />

Name nicht erwähnt wurde.<br />

69

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!