MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno

MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno

von karstenpinno.de Mehr von diesem Publisher

01.12.2012 Aufrufe

MINIPROJEKT–OPTIMAL CONTROL LÖSUNG VON OC-PROBLEMEN DURCH REIHENENTWICKLUNG Lehrstuhl für Systemtheorie und Regelungstechnik Institut für Elektro- und Informationstechnik Otto-von-Guericke-Universität Magdeburg RENÉ KELLING STK105-S KARSTEN PINNO STK105-S ALEXANDER ZINSER STK205-S 28. Januar 2009

MINIPROJEKT–OPTIMAL CONTROL

LÖSUNG VON OC-PROBLEMEN DURCH

REIHENENTWICKLUNG

Lehrstuhl für Systemtheorie und Regelungstechnik

Institut für Elektro- und Informationstechnik

Otto-von-Guericke-Universität

Magdeburg

RENÉ KELLING STK105-S

KARSTEN PINNO STK105-S

ALEXANDER ZINSER STK205-S

28. Januar 2009

Inhaltsverzeichnis

Inhaltsverzeichnis 2

1 Optimal Control-Problem und Anwendung der Methode 3

2 Reglerdesign an speziellem Beispiel 4

2.1 Approximation der Zielfunktion und des Feedbacks . . . . . . . . . . . . . . . . . . . . . . . 4

2.2 Vergleich von linearem und nichtlinearem Feedback für spezielle q und a . . . . . . . . . . . 6

2.3 Simulationen für verschiedene Anfangsbedingungen und Variation von q . . . . . . . . . . . . 7

1 Optimal Control-Problem und Anwendung der Methode 3

1 Optimal Control-Problem und Anwendung der Methode

Die folgende Methode wird angewendet, um eine Näherungslösung des optimalen Inputs eines OC-Problems

zu erhalten. Somit wird umgangen, dass die Hamilton-Jacobi-Bellmann-Gleichung analytisch gelöst werden

muss, was in den wenigsten Fällen möglich ist. (partielle Differentialgleichung) Im Folgenden wird das Problem

beschrieben:

Betrachtet wird ein OC-Problem mit der folgenden nichlinearen Dynamik:

˙x = Ax+Bu+f(x,u) = F(x,u) (1)

Das Performanceintegral (2) stellt die Kostenfunktion dar. Es soll ein Feedback u∗(x) gefunden werden, welches

dieses Integral minimiert. Bei Anfangsbedingungen x0 nahe des Ursprungs wird das System stabilisiert.

J(x0,u) =

�∞

0

� x T Qx+2x T Nu+u T Ru+g(x,u) � dt (2)

Dabei sind f(x,u) und g(x,u) Potenzreihen zweiter bzw. dritter Ordnung und A,B,Q,N,R reale Matrizen mit

folgenden Eigenschaften:

� Q N

N T R

Q ≥ 0 (3)

R ≥ 0 (4)

�

≥ 0 (5)

In [Luk69] wird gezeigt, dass das Integral unter Verwendung eines stabilisierenden Feedbacks nahe des Ursprungs

konvergiert. Das Haupttheorem 1.1 postuliert die Existenz eines optimalen, stabilisierenden Feedbacks,

welches Gleichung (6) löst.

Fu(x0,u∗(x0))Jx(x0,u∗)+Gu(x0,u∗(x0)) = 0 (6)

Zunächst wird das „truncated System“(TS) mit den Eigenschaften f(x,u) = 0 und g(x,u) = 0 gelöst. Das

bedeutet, dass die Terme höherer Ordnung zunächst vernachlässigt werden. Mittels Gleichung (7) lässt sich

P∗ berechnen, sodass das stabilisierende Feedback des TS D∗ nach Gleichung (8) berechnet werden kann.

0 =

�

Q − NR −1 � �

N + P∗ A − BR −1 N ∗�

�

+ A − BR −1 N ∗� ∗ �

P∗ − P∗ BR −1 B ∗�

P∗

D∗ = −R −1 (N ∗ + B ∗ P∗) (8)

u∗ = D∗x (9)

J(x) = x T P∗x (10)

Ausgehend vom TS kann nun das Feedback durch nichtlineare Terme erweitert werden. Für analytische

J(x,u∗(x)) und F(x,u∗(x)) nahe des Ursprungs können u∗(x), J∗(x) und F∗(x) als Potenzreihe entwickelt

werden. Nun können die Terme höherer Ordnung für J (k) (x) und u∗ (k) (x) mit Hilfe der Gleichungen (13) und

(14) bestimmt werden.

u∗(x) = u (1)

∗ (x)+u (2)

∗ (x)+... (11)

J∗(x) = J (2) (x)+J (3) (x)+... (12)

(7)

A∗xJ (m)

m−1

x (x) = −

2 Reglerdesign an speziellem Beispiel 4

∑

k=3

m−1

−

∑

k=2

u∗ (k) (x) = − 1

2 R−1

�

[m−1/2]

− ∑

k=2

Bu∗ (m−k+1) (x) · J (k)

x (x)

f (m−k+1) (x,u∗) · J (k)

x (x)

u∗ (k) (x) · Ru∗ (m−k) (x) − u∗ (m/2) (x) · Ru∗ (m/2) (x)

−g (m) (x,u∗) (13)

B ∗ J (k+1)

x (x)+

k−1

∑

j=1

(fu) ∗( j) J

(k− j+1)

x

(x)+gu (k) (x,u∗)

Die Stabilität des geschlossenen Kreises Laut Theorem 1.1 existiert für das gegebene Problem ein

eindeutiges und stabilisierendes Feedback. Dies zeigt sich auch am Zeitverlauf des geschlossenen Kreises

(Abbildung 2). Bei steigender Ordnung der Potenzreihe und des dazu entwickelten Inputs vergrößert sich der

stabile Bereich um den Ursprung.

Einschränkungen und Nachteil der Methode Das System muss stabilisierbar sein. Dazu muss eine Matrix

D existieren, sodass gilt: A+BD ist stabil. Eine Matrix heißt stabil, wenn der Realteil aller Eigenwerte

echt negativ ist. Außerdem müssen die Nichtlinearitäten der Dynamik und des Performanceintegrals in der

Nähe des Ursprungs analytisch und differenzierbar sein. Wenn nicht der Ursprung, sondern eine andere Ruhelage

stabilisiert werden soll, kann dieses Problem durch eine Koordinatentransformation umgestaltet werden,

sodass der Ursprung als neue Ruhelage mit einem solchen Feedback optimal geregelt wird.

Probleme bei der Erweiterung zu einem MIMO-System

• Aufwendiges Gleichungssystem zur Berechnung von J (k) mittels Ansatz (13)

• Berechnung von P∗ für das TS ist nichtlineares Gleichungssystem (7)

• Aufwendige Reihenentwicklung für Funktionen mehrerer Veränderlicher

2 Reglerdesign an speziellem Beispiel

2.1 Approximation der Zielfunktion und des Feedbacks

OC-Problem (Zielfunktion und Dynamik)

J(x(.),u(.)) =

Reihenentwicklung der Nichtlineartität der Zielfunktion

Daraus ergibt sich:

cosh(x) =

�∞

0

�

(14)

�

q cosh(x(t)) − q+ 1

2 u2 �

(t) dt (15)

˙x = ax+u (16)

∞

∑

n=0

x 2n

(2n)!

≈ 1+ x2

2

x4 x6

+ + +... (17)

24 720

Löse „truncated System“

J(x(.),u(.)) =

Unter der Bedingung, dass q ≥ 0:

2 Reglerdesign an speziellem Beispiel 5

=

�∞

0

�∞

0

�

⎛

q

∞

∑

n=0

x 2n

(2n)!

1

− q+

2 u2 �

(t) dt (18)

⎜

⎜q

⎜

⎝2

x2 + 1

2 u2 + q x4

⎟

x6 x8 ⎟

+ q + q ⎟dt

(19)

24 720 40320⎠

� ��

g(x, ✁ u)

Q = q

2

(20)

N = 0 (21)

R = 1

2

(22)

A = a (23)

B = 1 (24)

⎞

(25)

Q = q

≥ 0 (26)

2

R = 1

≥ 0 (27)

�

2

Q N

NT � �

=

≥ 0 (28)

R

� q

2 0

0 1

2

Somit sind alle Forderungen an die Matrizen (hier: Skalare) erfüllt. Aus N = 0 vereinfacht sich Gleichung

(7) stark:

Q+P∗A+A ∗ P∗ − P∗

q

�

BR −1 B ∗�

P∗ = 0 (29)

2 + 2aP∗ − 2P 2 ∗ = 0 (30)

P∗ = a

2 ±

�

a2 4

Theorem 1.2 ( [Luk69]) fordert, dass P∗ positiv definit sei. Aus diesem Grund entfällt die zweite Lösung

unter der Bedingung, dass g > 0 angenommen wird.

Somit lässt sich D∗ bestimmen:

�

= −2P∗ = −a − � a2 + q (32)

D∗ = −R −1� ✚ ✚N ∗ + B ∗ P∗

Als Eingang für das vereinfachte System ergibt sich:

�

u∗ = D∗x = −a − � a2 �

+ q x = u (1)

∗ (x) (33)

+ q

4

Die Zielfunktion kann nun mit Hilfe der Lösung von (31) ermittelt werden:

J(.) = x T ��

a2 q

P∗x = +

4 4

(31)

x 2 = J (2)

∗ (x) (34)

2 Reglerdesign an speziellem Beispiel 6

Bestimmung der Terme höherer Ordnung (vgl. [Luk69] S.94)

Durch Lösen der Gleichungen (13) und (14) lassen sich J∗ und u∗ sukzessive neu bestimmen.

J (3) (x) = 0 (35)

u (2)

∗ (x) = 0

J

(36)

(4) q

(x) =

96 � a2 + q x4

(37)

u (3)

q

∗ (x) = −

24 � a2 + q x3

(38)

J (5) (x) = 0 (39)

u (4)

∗ (x) = 0 (40)

J (6) 1

(x) =

6 � a2 �

q 1 q

−

+ q 720 288

2

a2 �

x

+ q

6

(41)

u (5)

�

1 q 1 q

∗ (x) = −�

−

a2 + q 720 288

2

a2 �

x

+ q

5

(42)

Somit ergibt sich als Feedback für eine Entwicklung bis zur 5. Ordnung:

�

u∗(x) = −a − � a2 �

+ q x −

q

24 � a 2 + q x3 −

�

1 q 1

� −

a2 + q 720 288

q 2

a 2 + q

2.2 Vergleich von linearem und nichtlinearem Feedback für spezielle q und a

ax + u(x)

1000

800

600

400

200

0

−200

−400

−600

−800

right hand side vs. x

rhs(x)

steady states

−1000

−25 −20 −15 −10 −5 0

state x

5 10 15 20 25

Abbildung 1: Rechte Seite(43) als Funktion des Zustands x

�

x 5

(43)

x

15

10

5

2 Reglerdesign an speziellem Beispiel 7

open loop

lin. feedback

high order feedback

0

0 0.1 0.2 0.3 0.4 0.5

time t

Abbildung 2: Vergleich open loop und closed loop

Man erkennt leicht, dass das ungeregelte System instabil ist. Durch die lineare Regelung wird es stabilisiert.

2.3 Simulationen für verschiedene Anfangsbedingungen und Variation von q

Anfangsbedingungen Die folgende Abbildung stellt den Einfluss der Anfangsbedingung x0 auf die Lösung

des geregelten Systems dar.

x

10

8

6

4

2

0

−2

−4

−6

−8

Closed Loop mit verschiedenen Anfangsbedingungen

−10

−5

−1

−0.5

0

0.5

1

5

10

−10

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35

time t

Abbildung 3: Einfluss der Anfangsbedingung x0

Literatur 8

Parameterstudie q Abbildung 4 zeigt, dass bei höheren Werten von q das System den Ursprung schneller

erreicht.

Literatur

x

10

8

6

4

2

0

Parameterstudie für q

q=20

q=200

q=2000

−2

0 0.1 0.2 0.3 0.4 0.5

time t

Abbildung 4: Einfluss des Parameters q auf die Dynamik des Systems

[Luk69] D.L. Lukes. Optimal regulation of nonlinear dynamical systems. In SIAM J. Contr., volume 7(1),

pages 75–100. 1969.

MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno

MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno ... Mehr anzeigen MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno

Template löschen?

Als Template speichern ?

MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno MINIPROJEKT–OPTIMAL CONTROL - Karsten Pinno