disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald
disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald
disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
4.5. Bellman-Prinzip<br />
Beweis:<br />
Wir betrachten die Gleichung (4.14):<br />
∂S(t, v)<br />
−<br />
∂t<br />
diese ist äquivalent zu:<br />
∂S(t, v)<br />
−<br />
∂t<br />
Es folgt aus (4.13):<br />
= H(x ∗ (t, v), v, λ(t, v), t) − ∂H(x∗ (t, v), v, λ(t, v), t)<br />
x ∗ (t, v),<br />
∂x<br />
= g(t, x ∗ (t, v), v)+λ(t, v)·f(t, x ∗ (t, v), v)− ∂H(x∗ (t, v), v, λ(t, v), t)<br />
x ∗ (t, v).<br />
∂x<br />
∂S(t, v)<br />
−<br />
∂t<br />
= g(t, x ∗ (t, v), v) + λ(t, v) · ẋ ∗ (t, v) + ˙λ(t, v) · x ∗ (t, v).<br />
Wir integrieren diese Gleichung auf [t, t 1 ] und erhalten:<br />
−S(t 1 , v) + S(t, v) =<br />
∫ t 1<br />
Aus dem vorigen Unterkapitel folgt<br />
t<br />
g(t, x ∗ (t), v) dt + λ(t 1 , v) · x ∗ (t 1 , v) − λ(t, v) · x ∗ (t, v).<br />
∫ t 1<br />
t<br />
g(t, x(t, v), v) dt = W (t, x, v) − q(x ∗ (t 1 , v)) = W (t, x, v) − q(x ∗ (t 1 )).<br />
Mit Hilfe der Transversalitätsbedingung erhalten wir:<br />
−S(t 1 , v) = ∂q(x∗ (t 1 ))<br />
· x ∗ (t 1 , v) − q(x ∗ (t 1 ))<br />
∂x<br />
= λ(t 1 , v) · x ∗ (t 1 , v) − q(x ∗ (t 1 )).<br />
Es folgt:<br />
oder<br />
S(t, v) = W (t, x, v) − λ(t, v) · x(t, v)<br />
W (t, x, v) = S(t, v) + λ(t, v) · x ∗ (t, v).<br />
Da die Steuerung stückweise konstant gewählt wird, erhalten wir<br />
û(t, x) = û(t 0 , x 0 ) = arg max<br />
v∈Ω W (t 0, x 0 , v).<br />
Durch x(t 0 , v) = x(t 0 ) = x 0 und bei einem gegebenen x 0 erhalten wir:<br />
{<br />
û(t 0 , x 0 ) = u ∗ (t 0 ) = arg max S(t0 , v) + λ(t 0 , v) · x(t 0 ) } .<br />
v∈Ω<br />
75