Konvexe Mengen und Funktionen - Heinrich-Heine-Universität ...
Konvexe Mengen und Funktionen - Heinrich-Heine-Universität ...
Konvexe Mengen und Funktionen - Heinrich-Heine-Universität ...
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
<strong>Konvexe</strong> <strong>Mengen</strong> <strong>und</strong><br />
<strong>Funktionen</strong><br />
von Corinna Alber<br />
Seminararbeit<br />
Leiter: Prof. Jarre<br />
im Rahmen des Seminars Optimierung III<br />
am Lehrstuhl für Mathematische Optimierung<br />
an der <strong>Heinrich</strong>-<strong>Heine</strong>-<strong>Universität</strong> Düsseldorf
INHALTSVERZEICHNIS 1<br />
Inhaltsverzeichnis<br />
1 Einleitung 2<br />
2 <strong>Konvexe</strong> <strong>Mengen</strong> 3<br />
3 Projektion 6<br />
4 Trennung 8<br />
5 <strong>Konvexe</strong> Funktion 11<br />
6 Fazit 14<br />
Literaturverzeichnis 14
1 EINLEITUNG 2<br />
1 Einleitung<br />
Die mathematische Optimierung ist eine junge Disziplin der angewandten Mathematik.<br />
Industrie, Wirtschaft <strong>und</strong> Verwaltung benötigen sie, um spezifische<br />
auf sie zugeschnittene Probleme zu lösen, welche sich oft als konvexe Probleme<br />
darstellen lassen. Diese lassen sich dann als Minimierung einer konvexen<br />
Zielfunktion mit konvexen Nebenbedingungen formulieren. In der Mathematik<br />
gehören die konvexen <strong>Mengen</strong> <strong>und</strong> <strong>Funktionen</strong> zu den sehr gut untersuchten<br />
Strukturen, weshalb diese Probleme relativ leicht gelöst werden können. Daher<br />
lohnt es sich hier besonders, die Struktur konvexer <strong>Mengen</strong> <strong>und</strong> konvexer <strong>Funktionen</strong><br />
herauszuarbeiten <strong>und</strong> in die Problemlösung einfließen zu lassen. Diese<br />
Informationen über ”Konvexität”können mittels verschiedener Methoden aus<br />
der Analysis, Geometrie <strong>und</strong> anderen Teilwissenschaften der Mathematik, die<br />
hier jedoch ausgeblendet werden sollen gewonnen werden.<br />
Die starken Voraussetzungen, die an konvexe Probleme gestellt werden, erwirken<br />
die mannigfachen Möglichkeiten, diese zu analysieren <strong>und</strong> darauf aufbauend<br />
zu relativ schnellen <strong>und</strong> einfachen Algorithmen zu gelangen, welche Zeit <strong>und</strong><br />
Kosten sparen. Der Spezialfall der linearen Optimierung ist in der Problemstellung<br />
enthalten <strong>und</strong> kann aufgr<strong>und</strong> seiner besonders starken Anforderungen sehr<br />
bequem bearbeitet werden.
2 KONVEXE MENGEN 3<br />
2 <strong>Konvexe</strong> <strong>Mengen</strong><br />
Definition 2.1 Eine Konvexkombination ist ein Vektor x der Form<br />
x = ∑ n<br />
∑ i=1 α ix i mit endlich vielen Vektoren x 1 , . . .,x n ∈ IR n <strong>und</strong> α i ≥ 0<br />
n<br />
i=1 α i = 1.<br />
Beispiel 2.1 <strong>Konvexe</strong> <strong>Mengen</strong> sind z.B. die leere Menge, die offene <strong>und</strong> abgeschlossene<br />
Einheitskugel im IR n <strong>und</strong> Polyeder im IR n .<br />
Abbildung 1: Beispiele für konvexe <strong>Mengen</strong><br />
Satz 2.1 Eine Menge C ⊂ IR n ist genau dann konvex, wenn sie alle Konvexkombinationen<br />
von Punkten aus C enthält.<br />
Beweis<br />
⇐ Enthält eine Menge C alle Konvexkombinationen ihrer Punkte, so auch diejenigen<br />
Punkte z ∈ C, die mit n = 2, λ ∈ [0,1] <strong>und</strong> x, y ∈ C durch z = λx+(1−λ)y<br />
dargestellt werden können.<br />
⇒ Offenbar enthält eine konvexe Menge alle Konvexkombinationen z aus n=2<br />
Vektoren x, y ∈ C für alle λ ∈ [0, 1] z = λx + (1 − λ)y.<br />
Gelte also die Aussage für n=k.<br />
Sei<br />
∑k+1<br />
x = α i x i =<br />
i=1<br />
k∑<br />
α i x i + α k+1 x k+1 = (1 − α k+1 )<br />
i=1<br />
k∑<br />
i=1<br />
α i x i<br />
1 − α k+1<br />
+ α k+1 x k+1<br />
so ist dies eine Konvexkombination der beiden Punkten ∑ k α i x i<br />
i=1 1−α k+1<br />
, x k+1 ∈ C<br />
mit λ = α k+1 ∈ [0, 1] .<br />
□<br />
Definition 2.2 Eine nichtleere Teilmenge K ⊂ IR n heißt Kegel, wenn mit<br />
x ∈ K auch {αx | α > 0} ⊂ K ist.<br />
Lemma 2.1 Ein Kegel ist genau dann konvex, wenn K + K ⊂ K.<br />
Beweis<br />
⇐ Angenommen, K ist nicht konvex, dann gibt es a, b ∈ K, λ ∈ (0, 1), sodass<br />
z = λx + (1 − λ)y /∈ K. Jedoch λx, (1 − λ)y ∈ K, da K ein Kegel ist. Daher<br />
auch z = λx + (1 − λ)y ∈ K + K ⊂ K.<br />
⇒ Seien x, y ∈ K. Dann gilt auch 1 2<br />
(x + y) ∈ K. z = x + y ∈ K + K, damit<br />
auch z = 1 2 (x + y) + 1 1<br />
2<br />
(x + y) = 2 ·<br />
2 (x + y) ∈ K. Insgesamt: K + K ⊂ K. □
2 KONVEXE MENGEN 4<br />
Lemma 2.2 Sei (C j ) j∈J eine Familie konvexer <strong>Mengen</strong> mit einer beliebigen<br />
Indexmenge J, dann ist auch C:= ⋂ j∈J C j konvex.<br />
Beweis<br />
Für alle j ∈ J seien x, y ∈ C j <strong>und</strong> λ ∈ [0, 1]. Dann ist z = λx + (1 − λ)y ∈ C j<br />
∀j ∈ J. Somit gilt ebenso z = λx + (1 − λ)y ∈ C.<br />
□<br />
Abbildung 2: Vereinigungen <strong>und</strong> Komplemente konvexer <strong>Mengen</strong><br />
Beispiel 2.2 Die Differenz zweier konvexer <strong>Mengen</strong> ist nicht mehr konvex.<br />
Ebenso ist die Vereinigung konvexer <strong>Mengen</strong> nicht mehr konvex.<br />
Lemma 2.3 C i ⊂ IR n i<br />
C i ≠ ∅ i = 1, . . .,k. Dann ist die Produktmenge<br />
C := C 1 × . . . × C k ⊂ IR n 1<br />
× . . . × IR n k<br />
genau dann konvex, wenn die <strong>Mengen</strong><br />
C i i = 1, . . .,k konvex sind.<br />
Beweis<br />
⇐ Zu x = (x 1 , . . .,x k ), y = (y 1 , . . .,y k ) ∈ C <strong>und</strong> λ ∈ [0, 1] ist z = λx+(1 −λ)y<br />
= (z 1 , . . .,z k ) ∈ C, da x i , y i ∈ C i ∀i = 1, . . .,k <strong>und</strong> somit ebenfalls<br />
z i = λx i + (1 − λ)y i ∈ C i ∀i = 1, . . .,k.<br />
□<br />
Lemma 2.4 Sei C ⊂ IR n konvex, dann sind auch das Innere int C <strong>und</strong> der<br />
Abschluss cl C konvex<br />
X<br />
<br />
z <br />
(1- )<br />
<br />
y<br />
1-<br />
Abbildung 3: das Innere einer konvexen Menge ist konvex<br />
Beweis<br />
Seien x, y ∈ int C. Wir müssen zeigen, dass auch jede Konvexkombination dieser<br />
beiden Punkte im Inneren von C liegt. Sei also für λ ∈ (0, 1) z = λx + (1 − λ)y<br />
bestimmt. Da x ∈ int C, gibt es ein δ > 0 mit B(x, δ) ⊂ C. Der Strahlensatz
2 KONVEXE MENGEN 5<br />
( )<br />
<strong>und</strong> die Konvexität besagen nun, dass auch B z, δ ‖z−y‖<br />
‖x−y‖<br />
⊂ C also z ∈ C.<br />
Seien nun x, y ∈ cl C. Sei z = λx + (1 − λ)y eine Konvexkombination beider<br />
Punkte mit einem λ ∈ (0, 1). Da x, y ∈ cl C existieren Folgen { x (k)} , { y (k)} in C<br />
mit x (k) → x, y (k) → x. Damit folgt z (k) := λx (k) + (1 − λ)y (k) ∈ C ∀k ∈ IN aus<br />
der Konvexität <strong>und</strong> ist daher z ein Häufungspunkt der Menge C, also z ∈ cl C.<br />
□<br />
Lemma 1.2 besagt, dass beliebige Schnitte konvexer <strong>Mengen</strong> wiederum konvex<br />
sind. Dies rechtfertigt folgende Definition:<br />
Definition 2.3 Die konvexe Hülle co A einer Menge A ⊂ IR n ist die kleinste<br />
konvexe Menge, die A umfasst.<br />
coA =<br />
⋂<br />
C<br />
Ckonvex<br />
C⊃A<br />
Beispiel 2.3 Im Falle einer konvexen Menge A ⊂ IR n gilt offenbar co(A)=A.<br />
Damit gilt für eine beliebige Menge B ⊂ IR n co(co(B))=co(B).<br />
Für beliebige <strong>Mengen</strong> C,D ⊂ IR n mit C ⊂ D gilt weiter co C ⊂ co D.<br />
Lemma 2.5 Für A ⊂ IR n ist<br />
coA = {x ∈ IR n |x ist Konvexkombination von Punkten in A} .<br />
Beweis<br />
Sei B = {x ∈ IR n |x ist Konvexkombination von Punkten in A}, dann ist B konvex<br />
<strong>und</strong> offensichtlich B ⊃ A. Für alle konvexen <strong>Mengen</strong> C mit C ⊃ B folgt<br />
damit C = co C ⊃ co B ⊃ co A.<br />
Sei nun eine konvexe Menge C ⊃ A. Da B alle Konvexkombinationen von<br />
Punkten aus A enthält, gilt auch C ⊃ B. Folglich gilt mit der speziellen Wahl<br />
C=co A auch coA ⊃ B.<br />
□
3 PROJEKTION 6<br />
3 Projektion<br />
An dieser Stelle geben wir drei Sätze aus Kapitel 1.2 des Buches [1] noch ein<br />
Mal an, verzichten aber auf den Beweis.<br />
Satz 3.1 Sei C ⊂ IR n eine nichtleere <strong>und</strong> konvexe Menge <strong>und</strong> f : C → IR<br />
strikt konvex. Falls eine Lösung des Problems<br />
existiert, so ist sie eindeutig bestimmt.<br />
ohne Beweis<br />
min f(x)<br />
x∈C<br />
Satz 3.2 Sei C ⊂ IR n eine abgeschlossene Menge <strong>und</strong> f : C → IR stetig. Wenn<br />
entweder C beschränkt ist oder lim ‖x‖→∞ f(x) = +∞ gilt, dann hat<br />
eine Lösung.<br />
ohne Beweis<br />
min f(x)<br />
x∈C<br />
Sei C ⊂ IR n eine nichtleere, abgeschlossene <strong>und</strong> konvexe Menge. Für ein festes<br />
z ∈ IR n definieren wir das Projektionsproblem(P) durch:<br />
min<br />
x∈C ‖x − z‖2 2<br />
Satz 3.3 Sei C ⊂ IR n konvex <strong>und</strong> f : IR n → IR konvex. Wenn f in ˆx ∈ C<br />
richtungsdifferenzierbar ist, dann sind folgende Aussagen äquivalent:<br />
(i) ˆx ist Lösung von (P)<br />
(ii) f ′ (x, x − ˆx) ≥ 0 ∀x ∈ C<br />
ohne Beweis<br />
Sei f : IR n → IR n , f(x) := ‖x − z‖ 2 2 . Es gilt f(x) = ‖x − z‖2 = 〈x − z, x − z〉<br />
= 〈x, x〉 − 2 〈x, z〉 + 〈z, z〉 = ‖x‖ 2 − 2 〈x, z〉 + ‖z‖ 2 ≥ ‖x‖ 2 − 2 ‖x‖ ‖z‖ + ‖z‖ 2<br />
= (‖x‖ − ‖z‖) 2 =: g(‖x‖.<br />
Es gilt lim ‖x‖→∞ g (x) = +∞ <strong>und</strong> g (‖x‖) ≤ f (x). Daher folgt lim ‖x‖→∞ f(x) =<br />
+∞.<br />
Weiter ist f zweimal differenzierbar mit ∇f(x) = 2(x − z) <strong>und</strong> Hf(x) = 2I.<br />
Hf(x) ist positiv definit <strong>und</strong> daher f(x) streng <strong>und</strong> damit auch strikt konvex.<br />
Nach 2.1 <strong>und</strong> 2.2 hat (P) eine Lösung, die eindeutig ist.<br />
Die eindeutige Lösung des Problems (P) kann man wie folgt charakterisieren:<br />
Satz 3.4 Sei C ⊂ IR n eine nichtleere, abgeschlossene <strong>und</strong> konvexe Menge.<br />
Dann löst ˆx ∈ C das Problem (P) genau dann, wenn<br />
〈z − ˆx, x − ˆx〉 ≤ 0 ∀x ∈ C
3 PROJEKTION 7<br />
Beweis<br />
Nach Satz 3.3 ist ˆx ∈ C genau dann Lösung des Problems(P), wenn<br />
〈∇f(ˆx), x − ˆx〉 ≥ 0 ∀x ∈ C. Wegen ∇f(ˆx) = 2(ˆx − z) folgt die Aussage:<br />
〈∇f(ˆx), x − ˆx〉 = 〈2(ˆx − z), x − ˆx〉 = −2 〈z − ˆx, x − ˆx〉<br />
Wir fassen zusammen: das Problem(P)<br />
□<br />
min<br />
x∈C ‖x − z‖2 2<br />
mit z ∈ IR n <strong>und</strong> C ⊂ IR n eine nichtleere, abgeschlossene <strong>und</strong> konvexe Menge<br />
hat genau eine Lösung <strong>und</strong> diese wird bestimmt durch<br />
〈z − ˆx, x − ˆx〉 ≤ 0 ∀x ∈ C.<br />
Die drei Bedingungen C ⊂ IR n eine nichtleere, abgeschlossene <strong>und</strong> konvexe<br />
Menge können bei Benutzung dieser drei Sätze nicht abgeschwächt werden. Die<br />
Konvexität wurde bei den Sätzen 3.1 <strong>und</strong> 3.3, die Abgeschlossenheit bei Satz<br />
3.2 <strong>und</strong> die Existenz von zulässigen Punkten wurde in 3.1 <strong>und</strong> 3.3 benutzt.
4 TRENNUNG 8<br />
4 Trennung<br />
Definition 4.1 Für s ≠ 0 ∈ IR n <strong>und</strong> r ∈ IR. Sei H s,r = {x ∈ IR n | 〈s, x〉 = r}.<br />
Seien C 1 , C 2 ⊂ IR n .<br />
H s,r bzw. s trennt C 1 <strong>und</strong> C 2 , falls<br />
〈s, y〉 ≤ r ≤ 〈s, x〉 ∀y ∈ C 1 , x ∈ C 2<br />
H s,r bzw. s trennt C 1 <strong>und</strong> C 2 strikt, falls<br />
sup y∈C1 〈s, y〉 ≨ inf x∈C2 〈s, x〉<br />
trennende Hyperebene:<br />
keine trennende Hyperebene:<br />
Abbildung 4: Beispiele für trennende Hyperebenen<br />
Satz 4.1 Sei C ⊂ IR n eine nichtleere, abgeschlossene <strong>und</strong> konvexe Menge, x /∈<br />
C, dann gibt es eine Hyperebene, die C <strong>und</strong> {x} strikt trennt. Es gibt also einen<br />
Vektor 0 ≠ s ∈ IR n mit<br />
sup 〈s, y〉 ≨ 〈s, x〉<br />
y∈C<br />
Beweis<br />
Nach Satz 3.3 erfüllt die Lösung ˆx des Problems (P)<br />
〈x − ˆx, y − ˆx〉 ≤ 0 ∀y ∈ C<br />
Mit s := x − ˆx ≠ 0 also y − ˆx = y − x + s folgt<br />
Daraus folgt<br />
〈s, y − x + s〉 = 〈s, y〉 − 〈s, x〉 + ‖s‖ ≤ 0 ∀y ∈ C<br />
〈s, x〉 − ‖s‖ 2 ≥ 〈s, y〉 ∀y ∈ C<br />
Daraus folgt wegen s ≠ 0 die Behauptung.<br />
Der Ausdruck sup y∈C 〈s, y〉 ≨ 〈s, x〉 ist äquivalent zur strikten Trennung, da<br />
mit folgender Wahl von r gilt:
4 TRENNUNG 9<br />
<strong>und</strong><br />
r := 1 2<br />
(<br />
〈s, x〉 = 1 2 〈s, x〉 + 1 2 〈s, x〉 ≩ 1 2<br />
〈s, x〉 + sup 〈s, y〉<br />
y∈C<br />
(<br />
)<br />
〈s, x〉 + sup 〈s, y〉<br />
y∈C<br />
)<br />
= r<br />
sup<br />
y∈C<br />
〈s, y〉 = 1 2 sup<br />
y∈C<br />
〈s, y〉 + 1 2 sup<br />
y∈C<br />
〈s, y〉 ≨ 1 2 sup 〈s, y〉 + 1 〈s, x〉 = r.<br />
y∈C 2<br />
Insgesamt also<br />
sup 〈s, y〉 ≨ 〈s, x〉<br />
y∈C<br />
□<br />
Definition 4.2 Sei C ⊂ IR n , so ist der Rand bd C von C die Menge<br />
bd C = cl C \ int C.<br />
Abbildung 5: Rand der konvexen Menge<br />
Definition 4.3 Sei C ⊂ IR n <strong>und</strong> x ∈ bd C ein Randpunkt. Dann heißt die<br />
Hyperebene H r,s Stützhyperebene von C in x, falls<br />
〈s, x〉 = r ≥ 〈s, y〉 ∀y ∈ C<br />
gilt. Weiter heißt die Stützhyperebene trivial, falls C ⊂ H r,s bzw<br />
gilt.<br />
〈s, x〉 = r = 〈s, y〉 ∀y ∈ C
4 TRENNUNG 10<br />
aber nicht:<br />
Abbildung 6: Beispiele für Stützhyperebenen<br />
Lemma 4.1 Sei C ⊂ IR n , C ≠ IR n eine nichtleere <strong>und</strong> konvexe Menge mit<br />
int C ≠ ∅ <strong>und</strong> x ∈ bd C, dann gibt es eine nicht triviale Stützhyperebene in x.<br />
Beweis<br />
Wäre cl C = IR n , so wäre C ⊃ int C = int (cl C) = int IR n = IR n . Also ist<br />
cl C ≠ IR n . Folglich gibt es zu x ∈ bd C eine Folge { x (k)} → x mit x (k) /∈ cl C.<br />
Für jedes k ∈ IN gibt es also nach (3.1) ein s (k) mit<br />
〈<br />
s (k) , x (k)〉 ≩<br />
〈<br />
s (k) , y<br />
〉<br />
∀y ∈ cl C ⊃ C<br />
〈 〉 〈 〉<br />
s<br />
∥<br />
(k)<br />
∥s (k)∥ ∥ , s (k)<br />
x(k) ≩ ∥<br />
∥s (k)∥ ∥ , y ∀y ∈ cl C.<br />
Mit t (k) = s(k)<br />
‖s (k) ‖ also ∥ ∥ t<br />
(k) ∥ ∥ = 1 folgt<br />
〈<br />
t (k) , x (k)〉 〈 〉<br />
≩ t (k) , y ∀y ∈ cl C.<br />
Die Menge {x ∈ IR n | ‖x‖ = 1} ist beschränkt <strong>und</strong> abgeschlossen, daher hat die<br />
Folge t (k) eine Teilfolge k j <strong>und</strong> ein t ∈ IR mit t (k j) → t ‖t‖ = 1.<br />
Mit r := 〈t, x〉 folgt 〈t, x〉 = r ≥ 〈t, y〉 ∀y ∈ C. Wegen ‖t‖ = 1 ist weiterhin<br />
t ≠ 0 <strong>und</strong> int C ≠ ∅; die Stützhyperebene H t,r folglich nicht trivial.<br />
□<br />
Die Bedingung int C ≠ ∅ ist offenbar notwendig für die Existenz der nichttrivialen<br />
Stützhyperebenen, wenn man folgendes Beispiel betrachtet: C sei ein<br />
Geradenstück <strong>und</strong> x keiner der beiden Randpunkte.<br />
Abbildung 7: Beispiel triviale Stützhyperebene<br />
Nicht-triviale Stützhyperebenen durch einen relativ inneren Punkt müssen also<br />
nicht existieren wenn die Menge kein Inneres hat.
5 KONVEXE FUNKTION 11<br />
5 <strong>Konvexe</strong> Funktion<br />
Definition 5.1 Eine Funktion f : IR n → IR, die nicht identisch +∞ ist, heißt<br />
konvex, wenn gilt:<br />
f((1 − λ)x + λy) ≤ (1 − λ)f(x) + λf(y) ∀ x, y ∈ IR n , λ ∈ (0, 1)<br />
Die Menge der konvexen <strong>Funktionen</strong> f : IR n → IR wird mit Conv IR n bezeichnet.<br />
Für eine Funktion f : IR n → IR heißt die Menge<br />
Definitionsbereich von f.<br />
domf := {x ∈ IR n | |f(x)| ≨ +∞}<br />
Definition 5.2 Für eine Funktion f : IR n → IR mit dom f ≠ ∅ ist der Epigraph<br />
von f die Menge<br />
epi f := {(x, r) ∈ IR n × IR | r ≥ f(x)} .<br />
Zu r ∈ IR definiert man die Niveaumengen von f mit<br />
N(f, r) := {x ∈ IR n | f(x) ≤ r} .<br />
Auch für nicht konvexe <strong>Funktionen</strong> gilt (x, r) ∈ epi f genau dann, wenn<br />
x ∈ N(f, r).<br />
Lemma 5.1 Die Funktion f : IR n → IR ist konvex, genau dann, wenn ihr<br />
Epigraph konvex ist.<br />
Beweis<br />
⇒ Seien x = ( x 1<br />
) (<br />
x 2<br />
, y =<br />
y1<br />
)<br />
y 2<br />
∈ epi(f) <strong>und</strong> λ ∈ [0, 1] mit x1 , y 1 ∈ IR n <strong>und</strong><br />
x 2 , y 2 ∈ IR.<br />
( )<br />
( )<br />
z1<br />
λx1 + (1 − λ)y 1<br />
z = := λx + (1 − λ)y =<br />
.<br />
z 2 λx 2 + (1 − λ)y 2<br />
Dann gilt:<br />
z 2 = λx 2 + (1 − λ)y 2 ≥ λf(x 1 ) + (1 − λ)f(y 1 ) ≥ f(λx 1 + (1 − λ)y 1 ) = z 1 also<br />
z ∈ epi f.<br />
⇐ Sei also epi f konvex <strong>und</strong> ( ) (<br />
f(x)<br />
x , f(y)<br />
)<br />
y ∈ epi f <strong>und</strong> λ ∈ [0, 1] so gewählt,<br />
dass f(λx + (1 − λ)y) ≩ λf(x) + (1 − λ)f(y), f also nicht konvex. Dann folgt:<br />
λ ( ) (<br />
x<br />
f(x) + (1 − λ) y<br />
) (<br />
f(y) = λx+(1−λ)y<br />
λf(x)+(1−λ)y)<br />
/∈ epi f, daher wäre dann epi f nicht<br />
konvex.<br />
□<br />
Bei einer konvexen Funktion f ∈ IR n sind die Niveaumengen stets konvex,<br />
dagegen muss eine Funktion, deren Niveaumengen konvex sind nicht unbedingt<br />
selbst konvex sein, wie man anhand des Beispiels f(x) = lnx leicht erkennt.<br />
Hierbei fasst man f ∈ Conv IR n auf, indem man sie auf x ≤ 0 auf f (x) = ∞<br />
setzt.
5 KONVEXE FUNKTION 12<br />
2.303<br />
4<br />
2<br />
0<br />
ln( x)<br />
2<br />
4<br />
4.605<br />
6<br />
0 2 4 6 8 10<br />
0.01 x<br />
10<br />
Abbildung 8: Beispiel für eine nicht-konvexe Funktion mit konvexen Niveaumengen<br />
Satz 5.1 (Ungleichung von Jensen)<br />
Sei f ∈ Conv IR n eine konvexe Funktion, k ∈ IN, x i ∈ IR, i = 1, . . .,k <strong>und</strong><br />
x = ∑ k<br />
i=1 α ix i eine Konvexkombination. Dann gilt<br />
f(x) ≤<br />
k∑<br />
α i f(x i )<br />
i=1<br />
Beweis<br />
Offenbar gilt die Aussage für k=0, 1, 2.<br />
Gelte die Aussage also für k=n.<br />
Dann folgt aus der Konvexität von f <strong>und</strong> der Voraussetzung:<br />
∑k+1<br />
f(x) = f( α i x i ) = f(<br />
i=1<br />
= f((1 − α k+1 )<br />
≤ (1 − α k+1 )f(<br />
≤ (1 − α k+1 )<br />
k∑<br />
i=1<br />
k∑<br />
i=1<br />
k∑<br />
i=1<br />
k∑<br />
α i x i + α k+1 x k+1 )<br />
i=1<br />
α i<br />
1 − α k+1<br />
x i + α k+1 x k+1 )<br />
α i<br />
1 − α k+1<br />
x i ) + α k+1 f(x k+1 ))<br />
α i<br />
1 − α k+1<br />
f(x i ) + α k+1 f(x k+1 ))<br />
≤<br />
k∑<br />
∑k+1<br />
α i f(x i ) + α k+1 f(x k+1 )) = α i f(x i )<br />
i=1<br />
i=1<br />
□
5 KONVEXE FUNKTION 13<br />
Lemma 5.2 Sind f 1 , . . .f m ∈ Conv IR n , t 1 , . . .t m ∈ R + . Gilt ⋂ m<br />
i=1 domf i ≠ ∅,<br />
dann ist auch die Funktion f := ∑ m<br />
i+1 t if i konvex.<br />
Beweis<br />
Aufgr<strong>und</strong> der Bedingung ⋂ m<br />
i=1 domf i ≠ ∅ gibt es ein x ∈ IR n mit<br />
f(x) = ∑ m<br />
i+1 t if i (x) ≨ ∞ <strong>und</strong> es gilt:<br />
f(λx + (1 − λ)y) =<br />
m∑<br />
t i f i (λx + (1 − λ)y)<br />
i+1<br />
f ist also konvex.<br />
m∑<br />
≤ t i λf i (x) + t i (1 − λ)f i (y) = λf(x) + (1 − λ)f(y)<br />
i+1<br />
□<br />
Lemma 5.3 Sei J eine beliebige Indexmenge, {f j } j∈J<br />
eine Familie von <strong>Funktionen</strong><br />
f i ∈ Conv IR n . Gibt es ein x ∈ IR n mit sup j∈J f j (x) ≨ +∞, dann ist<br />
die Funktion f := sup j∈J f j konvex.<br />
Beweis<br />
Nach (1.2) <strong>und</strong> (4.1) ist epif = ∩ j∈J epif j als Schnitt konvexer <strong>Mengen</strong> wieder<br />
konvex <strong>und</strong> aufgr<strong>und</strong> der Existenz von x ∈ IR n mit sup j∈J f j (x) ≨ +∞<br />
nichtleer. Aus (4.1) folgt wiederum die Konvexität von f.<br />
□
6 FAZIT 14<br />
6 Fazit<br />
Im Kapitel ”<br />
konvexe <strong>Mengen</strong>“ wurden konvexe <strong>Mengen</strong> <strong>und</strong> Kegel untersucht.<br />
Besonderes Augenmerk wurde auf konvexitäts-erhaltende Abbildungen gelegt,<br />
wie sie das Produkt <strong>und</strong> der beliebige Schnitt ist. Weiter sind das Innere <strong>und</strong><br />
der Abschluss konvexer <strong>Mengen</strong> wieder konvex.<br />
Das Kapitel ”<br />
Projektion“ betraute sich mit dem Problem (P)<br />
min<br />
x∈C ‖x − z‖2 2<br />
mit einer abgeschlossenen <strong>und</strong> konvexen Menge C. Dieses Problem hat eine<br />
Lösung <strong>und</strong> diese ist eindeutig. Um sie zu finden, betrachtet man ein äquivalentes<br />
<strong>und</strong> ebenfalls konvexes Problem, welches jedoch leichter zu lösen ist, obwohl es<br />
in semiinfiniter Formulierung vorliegt:<br />
〈z − ˆx, x − ˆx〉 ≤ 0 ∀x ∈ C.<br />
Im Kapitel ”<br />
Trennung“ wurde betrachtet, in welcher Lage zwei konvexe <strong>Mengen</strong><br />
zueinander liegen können. Das Kriterium war jeweils, ob eine trennende oder<br />
strikt trennende Hyperebene existiert. Einen Spezialfall hiervon erhält man,<br />
indem eine der beiden <strong>Mengen</strong> Randpunkt der anderen ist. In diesem Falle<br />
existieren keine strikt trennenden Hyperebenen. Die trennenden Hyperebenen<br />
nennen sich dann Stützhyperebenen. Diese nennen sich trivial, wenn die Menge<br />
vollständig in ihnen enthalten ist.<br />
Das Kapitel ”<br />
<strong>Konvexe</strong> Funktion“ behandelte <strong>Funktionen</strong> f : IR n → IR mit<br />
dom(f) ≠ IR n . Als Charakteristika wurden der Epigraph <strong>und</strong> die eng mit ihm<br />
verb<strong>und</strong>enen Niveaumengen eingeführt. Es wurden konvexitätserhaltende Operationen<br />
auf konvexen <strong>Funktionen</strong> wie die nicht-negative Summenbildung <strong>und</strong><br />
das Supremum konvexer <strong>Funktionen</strong> betrachtet.<br />
Diese Hilfsmittel können dabei helfen, für Probleme der konvexen Optimierung<br />
schnelle <strong>und</strong> effiziente Löser zu finden <strong>und</strong> deren Konvergenz zu beweisen.<br />
Literatur<br />
[1] Alt w.; Numerische Verfahren der konvexen, nichtglatten Optimierung;<br />
Teubner Verlag Wiesbaden, 2004