disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald

31.01.2014 Aufrufe
4. Grundlagen der Optimalsteuerung Trotz vieler Untersuchungen ist die Theorie der hinreichenden Bedingungen für spezielle Optimalsteuerungsprobleme (unter anderem, für die Aufgaben mit stückweise konstante Steuerungen) noch nicht abgeschlossen. Gabasov und Kirillova haben in ihren Arbeiten studiert ( [8]), dass das Pontrjaginsche Maximumprinzip für die in u stetigen Prozesse auf Prozesse mit stückweise konstanten Steuerungen im Allgemeinen nicht übertragbar ist. Für stückweise konstante Steuerfunktionen gilt das Maximumprinzip nur approximativ (Quasimaximumprinzip). Gabasov und Kirillova zeigten z.B., dass die Differenz zwischen dem Maximum der Hamilton-Funktion und dem Wert der Hamilton-Funktion für die optimale Steuerung u ∗ (t) kleiner ε gemacht werden kann und dass dieser Abstand nach Null strebt, falls die Länge der Steuerintervalle h genügend klein gewählt worden ist. Bei den Steuerintervallen fester Länge gilt das nicht. Trotzdem wenden in der Regel viele Autoren das Pontrjaginsche Maximumprinzip auch in den Aufgaben mit stückweise konstanten Steuerungen, obwohl die notwendigen Bedingungen in solchen Fällen nicht gesichert sind. 4.5. Bellman-Prinzip Eine zentrale Methode der Dynamischen Programmierung ist das Bellman-Prinzip. Dynamische Programmierung kann dann erfolgreich eingesetzt werden, wenn das Optimierungsproblem aus vielen gleichartigen Teilproblemen besteht, und eine optimale Lösung des Problems sich aus optimalen Lösungen der Teilprobleme zusammensetzt. Das Verfahren der dynamischen Programmierung besteht darin, zuerst die optimalen Lösungen der kleinsten Teilprobleme direkt zu berechnen, und diese dann geeignet zu einer Lösung eines nächstgrößeren Teilproblems zusammenzusetzen. Diese Idee wurde 1957 von Bellman formuliert. 5 In der Steuerungstheorie kann man das Prinzip der dynamischen Programmierung einsetzen, um eine Gleichung herzuleiten (Hamilton-Jacobi-Bellman-Gleichung), deren Lösung den optimalen Wert der Steuerung ergibt. Die Argumentation ist dabei folgende: Wenn das Problem zeitabhängig ist, kann man den optimalen Wert des Zielfunktionals zu einem bestimmten Zeitpunkt betrachten. Zu untersuchen ist also eine Gleichung für die optimale Lösung, die das Zielfunktional auch zu einem späteren Zeitpunkt optimal erhält. Diese Überlegung führt zur Hamilton-Jacobi-Bellman- Gleichung. Damit kann man das Problem in Zeitschritte einteilen, anstatt es auf einmal lösen zu müssen. 5 Richard Bellman (1920-1984), amerikanischer Mathematiker und Physiker, Erfinder der Dynamischen Programmierung. Nach ihm sind mehrere Algorithmen und Methoden der Diskreten Optimierung und benachbarter Gebiete benannt worden, z.B. der Algorithmus von Bellman und Ford und das Optimalitätsprinzip. 66

4.5. Bellman-Prinzip Auf dieser Basis lässt sich eine notwendige und hinreichende Bedingung konstruieren. 4.5.1. Eine notwendige und hinreichende Optimalitätsbedingung für die Aufgaben mit stückweise stetigen Steuerungen Wir betrachten das Optimalsteuerungsproblem (4.1) und definieren eine Wertefunktion V (t, x t ) : [t 0 , T ] × R n → R gemäß ∫ T V (t, x t ) = max u(·) g(τ, x(τ), u(τ))dτ + q(x(T )), (4.7) t wobei u(·) : [t, T ] → R m zulässig auf [t, T ] und x(·) die zugehörige Trajektorie mit x(t) = x t ∈ R n ist. V (t, x t ) gibt den optimalen Wert des Zielfunktionals ausgehend vom Zeitpunkt t ∈ [t 0 , T ] und dem Ausgangspunkt x t ∈ R n an, also den maximalen Wert des Zielfunktionals für das zum Zeitpunkt t verbleibende Zeitintervall [t, T ] und für den Startpunkt x t . Dabei gilt auch x(T ) = x T ∈ R n . Bei folgenden Überlegungen werden wir zwei unterschiedliche Formen von Steuerungen betrachten. In der Optimalsteuerung ist es üblich, Steuerungen als Funktionen von der Zeit t (und häufig vom in der Regel festen Anfangszustand x 0 ) zu betrachten. Diese Steuerungen nennen wir open-loop-Form (offene Schleife) und werden im Weiteren optimale Steuerung in solcher Form als u ∗ (·) bezeichnen. Diese Form hat einen Nachteil: Falls sich das System von der optimalen Trajektorie wegentwickelt, würde die Steuerung nicht optimal. Die closed-loop-Form oder Rückkopplungsform u(t, x t ) beschreibt eine Abhängigkeit der Steuerfunktionen von der Zeit t und auch vom gegenwärtigen Zustand x(t) = x t ∈ R n . Wir bezeichnen die closed-loop optimale Steuerung û(t, x t ). Bei deterministischen optimalen Steuerungsproblemen ist diese Unterscheidung nicht von einer großer Bedeutung, weil man das optimale x = x(t, x 0 ) in die Rückkopplungslösung einsetzen kann und so eine äquivalente Lösung in offener Schleife erhalten kann. Eine optimale closed-loop-Lösung kann daher immer in eine optimale open-loop- Lösung in offener Schleife umgeformt werden und umgekehrt. Einfachheitshalber werden wir in folgenden Sätzen V (t, x t ) als V (t, x) und u(t, x t ) als u(t, x) bezeichnen. Die Hamiltonfunktion H ist für das Problem (4.1) gemäß H(t, x, u, V x (t, x)) = g(t, x, u) + V x (t, x) · f(t, x, u). erklärt. Nun können wir das Bellman-Prinzip formulieren. 67

Seite 1 und 2: Anwendungen der Optimalsteuerung in

Seite 3: »Nach unserer bisherigen Erfahrung

Seite 6 und 7: Inhaltsverzeichnis 4. Grundlagen de

Seite 8 und 9: Inhaltsverzeichnis 8

Seite 10 und 11: Abbildungsverzeichnis 5.2. Stückwe

Seite 12 und 13: Abbildungsverzeichnis 12

Seite 14 und 15: 1. Einleitung Änderungen in den Me

Seite 16 und 17: 1. Einleitung Abbildung 1.1.: Entwi

Seite 18 und 19: 1. Einleitung verschiedene Vorgehen

Seite 20 und 21: 2. Biologische, ökologische und wi









Seite 38 und 39: 3. Mathematische Modelle in der Bio






Seite 50 und 51: 4. Grundlagen der Optimalsteuerung
















Seite 84 und 85: 5. Numerische Methoden für verschi
















Seite 116 und 117: 6. Zusammenfassung und Ausblick in

Seite 118 und 119: 6. Zusammenfassung und Ausblick die

Seite 120 und 121: Literaturverzeichnis [15] M. Herman

Seite 122 und 123: Literaturverzeichnis [54] http://ww

Seite 125 und 126: ANHANG A DIRCOL A.1. Programm 1. Ha

Seite 127 und 128: A.1. Programm 1. Hauptprogramm user

Seite 129 und 130: A.1. Programm 1. Hauptprogramm user

Seite 131 und 132: A.2. Programm 2. Programm DATDIM *

Seite 133 und 134: A.3. Programm 3. Programm DATLIM 0

Seite 135 und 136: A.3. Programm 3. Programm DATLIM *

Seite 137 und 138: ANHANG B OC-ODE B.1. Programm 1. Be

Seite 139 und 140: B.1. Programm 1. Berechnung mit st



Seite 145 und 146: ANHANG C MATLAB-Programme C.1. Prog

Seite 147 und 148: C.2. Programm 2. Berechnung der Adj

Seite 149 und 150: C.4. Programm 4. Das Integral-Maxim

Seite 151 und 152: C.6. Programm 6. Newton-Methode fü

Seite 153 und 154: Danksagung An dieser Stelle möchte

Seite 155: Versicherung Hiermit erkläre ich,

steuerung

optimale

steuerungen

ostsee

modelle

population

entwicklung

programm

modell

optimalsteuerung

greifswald

ub-ed.ub.uni-greifswald.de

disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald

disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald ... Mehr anzeigen disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald

Template löschen?

Als Template speichern ?

disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald disser1.pdf (2006 KB) - Ernst-Moritz-Arndt-Universität Greifswald