Partielle Differentialgleichungen 2 - am Institut fÃ¼r Mathematik der ...

Partielle 

Differentialgleichungen 2 

Vorlesungsskript 

Sommersemester 2009 

Bernd Schmidt ∗ 

Version vom 3. September 2009 

∗ 

Zentrum Mathematik, Technische Universität München, Boltzmannstr. 3, 85747 

Garching, schmidt@ma.tum.de 

1

Inhaltsverzeichnis 

1 Einleitung 3 

2 Lineare Evolutionsgleichungen 5 

2.1 Analytische Vorbereitungen . . . . . . . . . . . . . . . . . . . . . 5 

2.1.1 Das Bochner-Integral . . . . . . . . . . . . . . . . . . . . . 5 

2.1.2 Zeitabhängige Sobolevräume . . . . . . . . . . . . . . . . . 11 

2.2 Lineare parabolische Gleichungen . . . . . . . . . . . . . . . . . . 16 

2.2.1 Die Konvektions-Diffusions-Gleichung . . . . . . . . . . . . 16 

2.2.2 Das abstrakte Evolutionsproblem . . . . . . . . . . . . . . 18 

2.2.3 Anwendung auf die Konvektions-Diffusions-Gleichung . . . 26 

2.3 Lineare hyperbolische Gleichungen . . . . . . . . . . . . . . . . . 28 

2.4 Lineare hyperbolische Systeme erster Ordnung . . . . . . . . . . . 36 

3 Die Navier-Stokes-Gleichungen 45 

4 Distributionen 46 

4.1 Definition und grundlegende Eigenschaften . . . . . . . . . . . . . 46 

4.2 Faltung und Fundamentallösungen . . . . . . . . . . . . . . . . . 52 

4.3 Temperierte Distributionen . . . . . . . . . . . . . . . . . . . . . . 61 

4.4 Der Satz von Malgrange-Ehrenpreis . . . . . . . . . . . . . . . . . 69 

4.5 Sobolevräume und Fouriertransformation . . . . . . . . . . . . . . 73 

4.6 Distributionen aus funktionalanalytischer Sicht . . . . . . . . . . . 77 

5 Variationsmethoden für vektorwertige Probleme 81 

5.1 Euler-Lagrange-Gleichung . . . . . . . . . . . . . . . . . . . . . . 81 

5.2 Die direkte Methode . . . . . . . . . . . . . . . . . . . . . . . . . 84 

5.3 Polykonvexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

5.4 Quasikonvexität . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 

5.5 Relaxation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 

5.6 Young-Maße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 

5.7 Mikrostrukturen und Laminate . . . . . . . . . . . . . . . . . . . 117 

2

Kapitel 1 

Einleitung 

Für eine allgemeine Einleitung in das Gebiet der partiellen Differentialgleichungen 

verweise ich auf das Skript ‘Partielle Differentialgleichungen’ vom Wintersemester 

08/09 ([Sch 09], im Folgenden zitiert als ‘Skript PDG 1’). Obwohl als 

Folgeveranstaltung an die PDG 1 vom Wintersemester konzipiert, können Sie 

aber auch direkt in die Vorlesung PDG 2 einsteigen, wenn Sie etwas Vorwissen 

über Sobolev-Räume und elliptische Gleichungen besitzen. Die wesentlichen Voraussetzungen 

finden Sie etwa im Skript PDG 1, Kapitel 4.1, 4.3, 4.4, 5.1, 5.2, 

5.3. 

Überblick 

Im Kapitel 2 beschäftigen wir uns mit den linearen Evolutionsgleichungen, insbesondere 

parabolischen und hyperbolischen Gleichungen zweiter Ordnung und 

hyperbolischen Systemen erster Ordnung. Ähnlich wie im Skript PDG 1, Kapitel 5 

formulieren wir diese Gleichungen zunächst in einem geeigneten schwachen Sinne. 

Als nächstes konstruieren wir approximative Lösungen, indem wir gewöhnliche 

Differentialgleichungen lösen (‘Galerkin-Verfahren’), und folgern daraus durch 

Kompaktheitsschlüsse die Existenz schwacher Lösungen. Dass diese Lösungen 

unter geeigneten Voraussetzungen wirklich klassische Lösungen sind, zeigt man 

schließlich durch Regularitätsresultate, die wir zumindest für die parabolischen 

Gleichungen ansprechen werden. 

Im folgenden Kapitel 3 untersuchen wir als berühmtes Beispiel einer nichtlinearen 

Evolutionsgleichung das System der Navier-Stokes-Gleichungen. Wieder 

konstruieren wir schwache Lösungen indem wir zunächst approximative Lösungen 

finden und dann zum Limes übergehen. Hierbei zeigt sich, warum nicht-lineare 

Gleichungen oft so schwierig zu lösen sind: Approximationen in schwachen Topologien 

kommutieren i.A. nicht mit nicht-linearen Ausdrücken. Im Gegensatz zu 

Kapitel 2 diskretisieren wir hier auch die Zeit und erhalten die gesuchte Lösung 

schließlich im Limes infinitesimaler Zeitschritte. 

Distributionen, die man als ‘verallgemeinerte Funktionen’ interpretieren kann, 

3

sind ein unverzichtbares Hilfsmittel in der modernen Analysis. Ihre hervorstechendste 

Eigenschaft ist, dass man sie (als Distributionen) unendlich oft differenzieren 

kann – natürlich in einem geeignet schwachen Sinne. Jede L 1 loc -Funktion 

aber auch jedes Borelmaß ist ein Distribution und wir werden insbesondere die 

Frage klären, was −∆Φ = δ für die Fundamentallösung des Laplace-Operators 

wirklich bedeutet. Im Wesentlichen geht es in diesem Kapitel darum, Operationen, 

die auf Funktionenräumen schon bekannt sind (schwache Ableitung, Faltung, 

Fouriertransformation, ...) konsistent auf die große Klasse der Distributionen zu 

erweitern. Als Anwendung untersuchen wir allgemeine lineare Differentialoperatoren 

mit konstanten Koeffizienten. 

Im letzten Kapitel 5 wenden wir uns wie gegen Ende im Skript PDG 1 variationellen 

Methoden zu. Im Unterschied zum letzten Semester beprechen wir 

hier jedoch vektorwertige Probleme, die z.B. in der mathematischen Elastizitätstheorie 

auftreten. Der vektorwertige Fall stellt sich nun als wesentlich schwieriger 

als der skalare Fall heraus; es treten völlig neue Phänomene auf wie etwa der 

Begriff der Quasikonvexität. Wir entwickeln die Theorie bis zur Einführung von 

Young-Maßen und deren Zusammenhang zu Mikrostrukturen. 

Literatur: Die wesentlichen Quellen für Kapitel 2 sind das Vorlesungsskript von 

Brokate [Br 07b] sowie die PDG-Bücher von Wloka [Wl] und Evans [Ev]. Das 

Kapitel 3 besteht im Wesentlichen aus Kap. 3, §2 und §4 des Buches [Te] über 

die Navier-Stokes-Gleichungen. Das Kapitel 4 über Distributionen stützt sich auf 

das Buch von Folland [Fo], eine PDE-Vorlesung von D. Hoff sowie das Funktionalanalysisbuch 

von Werner [We]. Das letzte Kapitel 5 schließlich folgt in Teilen 

Evans [Ev] und dem Vorlesungsskript von Müller [Mü]. 

Vielen Dank an alle, die mich auf Fehler in früheren Versionen dieses Skripts 

aufmerksam gemacht haben, insbesondere an Herrn Stephan Bogendörfer und 

Herrn Thomas Roche. 

4

Kapitel 2 

Lineare Evolutionsgleichungen 

2.1 Analytische Vorbereitungen 

2.1.1 Das Bochner-Integral 

Unser erstes Ziel ist es, Banachraum-wertige Funktionen integrieren zu können. 

Im Folgenden sei [a, b] ein reelles Intervall (versehen mit dem Lebesgue-Maß) und 

X ein beliebiger Banachraum. 1 

Definition 2.1 (i) Eine Funktion f : [a, b] → X heißt einfach, wenn es eine 

Darstellung der Form 

n∑ 

f(t) = χ Ai (t)x i , 

i=1 

mit x i ∈ X, A i messbar, i = 1, . . .,n, gibt. Hier bezeichnet χ A die charakteristische 

Funktion einer Menge A. 

(ii) Das Bochner-Integral einer einfachen Funktion f(t) = ∑ n 

i=1 χ A i 

(t)x i ist 

definiert durch 

∫ b 

n∑ 

f(t) dt := |A i |x i . 

a 

Bemerkung 2.2 (i) Es ist leicht zu sehen, dass diese Definition nicht von der 

Wahl der A i abhängt; ∫ f dt ist also wohldefiniert. 

Ω 

(ii) Ebenfalls einfach einzusehen ist, dass f ↦→ ∫ b 

f(t) dt linear ist und es gilt 

a ∫ b 

∫ b 

∥ f(t) dt 

∥ ≤ ‖f(t)‖ dt 

a 

1 Es ist nicht schwer zu sehen, dass man im Folgenden statt Funktionen f : [a, b] → X 

allgemeiner Funktionen f : Ω → X, wobei (Ω, A, µ) ein vollständiger σ-endlicher Maßraum ist, 

zulassen könnte. 

5 

i=1 

a

für alle einfachen f. 

Die folgende Definition ist darauf zugeschnitten, den Integralbegriff auf allgemeine 

Funktionen zu übertragen: 

Definition 2.3 Eine Funktion heißt stark messbar 2 (auch Bochner-messbar), wenn 

es eine Folge (f n ) einfacher Funktionen gibt mit 

f n → f fast überall. 

Lemma 2.4 Es sei (f n ) eine Folge einfacher Funktionen f n → f fast überall. 

Dann ist t ↦→ ‖f n (t) − f(t)‖ eine messbare numerische Funktion. 

Beweis. Das folgt direkt aus 

‖f n (t) − f(t)‖ = lim 

m→∞ ‖f n(t) − f m (t)‖ 

fast überall. 

□ 

Definition 2.5 (Das Bochner Integral) Es sei f : [a, b] → X eine Funktion, 

so dass es eine Folge (f n ) einfacher Funktionen gebe mit 

f n → f fast überall und 

∫ b 

a 

‖f n − f‖ dt → 0. 

Dann heißt f Bochner-integrierbar und das Bochner-Integral von f ist definiert 

durch 

∫ b 

a 

f(t) dt := lim 

n→∞ 

∫ b 

a 

f n (t) dt. 

Wir müssen überprüfen, dass ∫ b 

f dt wohldefiniert ist: Erstens konvergiert 

∫ 

fn in der Tat, denn nach Bemerkung 2.2(ii) ist 

a 

∫ 

∥ 

∫ 

f n − 

∥ ∫ ∥∥∥ 

f m ≤ 

∫ 

‖f n − f m ‖ ≤ 

∫ 

‖f n − f‖ + 

‖f m − f‖ → 0 

mit m, n → ∞. Zweitens ist dieser Limes unabhängig von der approximierenden 

Folge (f n ). Ist nämlich (g n ) eine weitere Folge einfacher Funktionen mit g n → f 

fast überall und ∫ ‖g n − f‖ → 0, dann folgt 

∫ ∫ ∥ ∫ ∫ ∫ 

∥∥∥ ∥ f n − g n ≤ ‖f n − g n ‖ ≤ ‖f n − f‖ + ‖g n − f‖ → 0. 

Schließlich zeigt die Wahl f n = f ∀ n, falls f einfach ist, dass unsere Definition 

mit der früheren Definition 2.1(ii) kompatibel ist. 

2 Betrachtet man allgemeinere Maßräume wie in der vorigen Fußnote beschrieben, so spricht 

man genauer von µ-stark messbaren Funktionen 

6

Satz 2.6 (Eigenschaften des Bochner-Integrals) (i) Die Abbildung f ↦→ 

∫ b 

f dt ist linear auf dem Vektorraum der Bochner-integrierbaren Funktionen. 

a 

(ii) f : [a, b] → X ist Bochner-integrierbar genau dann, wenn f stark messbar 

und t ↦→ ‖f(t)‖ integrierbar ist. 

(iii) Ist f Bochner-integrierbar, so gilt 

∫ b 

∫ b 

∥ f(t) dt 

∥ ≤ ‖f(t)‖ dt. 

a 

(iv) Ist T : X → Y ein linearer beschränkter Operator zwischen den Banachräumen 

X und Y , f : [a, b] → X Bochner-integrierbar, so ist auch 

Tf : [a, b] → Y Bochner-integrierbar und es gilt 

∫ ∫ 

Tf = T f. 

Beweis. (i) Klar. 

(ii) Teil 1: Ist (f n ) eine Folge einfacher Funktionen mit f n → f fast überall 

und ∫ ‖f n − f‖ → 0, dann ist insbesondere f stark messbar und t ↦→ ‖f(t)‖ als 

fast überall punktweiser Limes von t ↦→ ‖f n ‖ messbar. Des Weiteren ist 

∫ ∫ ∫ 

‖f‖ ≤ ‖f n − f‖ + ‖f n ‖ < ∞. 

(ii) Teil 2 & (iii): Sei (f n ) eine Folge einfacher Funktionen mit f n → f fast 

überall, ε > 0 beliebig. Setze 

{ 

f n (t), falls ‖f n (t)‖ ≤ (1 + ε)‖f(t)‖, 

g n (t) := 

0 sonst. 

Ist nun t ↦→ ‖f(t)‖ integrierbar, so ist insbesondere {t : ‖f n (t)‖ ≤ (1 + ε)‖f(t)‖} 

messbar und daher g n = f n χ {‖fn(t)‖≤(1+ε)‖f(t)‖} einfach. Es gilt g n → f fast überall 

und 

‖g n − f‖ ≤ ‖g n ‖ + ‖f‖ ≤ (2 + ε)‖f‖. 

Der Satz von der majorisierten Konvergenz impliziert nun 

∫ 

‖g n − f‖ → 0. 

Das aber zeigt, dass f Bochner-integrierbar ist, was den Beweis von (ii) vollendet. 

Aus ‖g n ‖ ≤ (1 + ε)‖f‖, ∫ g n → ∫ f und Bemerkung 2.2(ii) erhalten wir zudem 

∫ 

∫ ∥ ∫ 

∫ 

∥ f 

∥ = lim ∥∥∥ n ∥ g n ≤ lim sup ‖g n ‖ ≤ (1 + ε) ‖f‖. 

n 

7 

a

∫ 

Da ε > 0 beliebig war, folgt (iii). 

(iv) Sei (f n ) eine Folge einfacher Funktionen mit f n → f fast überall und 

∫ 

‖fn − f‖ → 0. Es ist einfach zu sehen, dass 

∫ 

Tf n = T 

f n 

∀ n ∈ N 

ist. Nun ist aber auch Tf n einfach und es gilt Tf n → Tf fast überall und ∫ ‖Tf n − 

Tf‖ ≤ ∫ ‖T ‖‖f n − f‖ → 0, weil T stetig ist. Es folgt 

∫ ∫ ∫ ∫ ∫ 

Tf = lim Tf n = lim T f n = T lim f n = T f. 

□ 

Die starke Messbarkeit einer Funktion ist oft nicht leicht direkt aus der Definition 

ersichtlich. Glücklicherweise gibt es ein starkes Kriterium. 

Definition 2.7 (i) Man sagt, eine Funktion f : [a, b] → X habe fast separables 

Bild, wenn es eine Nullmenge N ⊂ [a, b] gibt, so dass 

{f(t) : t ∈ [a, b] \ N} 

separabel ist (d.h. eine abzählbare dichte Teilmenge besitzt). 

(ii) Eine Funktion f : [a, b] → X heißt schwach messbar, wenn für jedes x ′ ∈ X ′ 

(= Dualraum von X) die Abbildung 

t ↦→ x ′ (f(t)) 

(als numerische Funktion auf [a, b]) messbar ist. 

Satz 2.8 (Satz von Pettis) Eine Funktion f : [a, b] → X ist genau dann stark 

messbar, wenn sie schwach messbar ist und fast separables Bild hat. 

Beweis. Übungsaufgabe. (Eine Anleitung finden Sie auf dem ersten Übungsblatt.) 

□ 

Wir definieren nun die L p -Räume Banachraum-wertiger Funktionen. 

Definition 2.9 Setze 

{ 

∫ 

L p (a, b; X) = [f] : f : [a, b] → X ist Bochner-messbar und 

L ∞ (a, b; X) = 

für 1 ≤ p < ∞, 

{ 

} 

‖f‖ p < ∞ 

[f] : f : [a, b] → X ist Bochner-messbar und ess sup ‖f(t)‖ < ∞ 

t∈[a,b] 

für p = ∞, 

wobei [f] die Äquivalenzklasse von f für die Äquivalenzrelation “Gleichheit fast 

überall” bezeichnet. 

8 

}

Wie auch für skalarwertige Funktionen üblich werden wir in Zukunft nicht 

zwischen f und [f] unterscheiden. Beachte, dass L 1 (a, b; X) gerade der Raum der 

Bochner-integrierbaren Funktionen ist. 

Satz 2.10 L p (a, b; X) ist ein Banachraum bezüglich 

{ (∫ 

‖f(t)‖ 

‖f‖ L p (a,b;X) := 

p dt ) 1 p 

, 1 ≤ p < ∞, 

ess sup t∈[a,b] ‖f(t)‖, p = ∞. 

Beweis. Es ist leicht zu sehen, dass L p (a, b; X) ein normierter Raum ist. Die 

Vollständigkeit folgt nun daraus, dass jede absolut konvergente Reihe konvergiert: 

Seien f 1 , f 2 , . . . ∈ L p ([a, b]; X) mit 

∑ 

‖f i ‖ L p ([a,b];X) = ∑ ‖g i ‖ L p ([a,b]) < ∞, g i(t) := ‖f i (t)‖ X . 

i 

i 

Da L p ([a, b]) vollständig ist, gibt es eine Funktion g ∈ L p ([a, b]) mit 

g(t) = ∑ i 

g i (t) < ∞ ∀ t /∈ N 0 , 

N 0 eine geeignete Nullmenge (Konvergenz in L p ([a, b]) und punktweise fast überall, 

da g i ≥ 0). Insbesondere ist ∑ i ‖f i(t)‖ X < ∞ fast überall, so dass ein f(t) 

existiert mit ∑ 

f i (t) = f(t) ∀ t /∈ N 0 

i 

(Konvergenz in X), denn auch X ist vollständig. f hat fast separables Bild, da 

{ 

} 

∞⋃ 

∞⋃ 

f(t) : t ∈ [a, b] \ N j ⊂ span {f i (t) : t ∈ [a, b] \ N i } 

j=0 

gilt, und {f i (t) : t ∈ [a, b]\N i } separabel ist für eine geeignete Nullmenge N i . Des 

Weiteren ist f schwach messbar, weil für alle x ′ ∈ X ′ außerhalb einer Nullmenge 

x ′ (f(t)) = lim n x ′ ( ∑ n 

i=1 f i(t)) gilt. Nach dem Satz von Pettis ist also f in der Tat 

stark messbar. 

Es ergibt sich 

∥ n∑ ∥ ∥∥ 

∞∑ ∥ ∥ ∥ ∞∑ 

∥ 

i=1 

f i − f∥ 

∥ 

L p (a,b;X) 

= 

∥∥ 

i=n+1 

f i (·) 

∥ 

X 

∥ 

i=1 

∥ 

L p (a,b) 

∥ ∥∥∥∥ ≤ 

∥ i → 0 

i=n+1g 

L p (a,b) 

mit n → ∞. 

□ 

Satz 2.11 Der Raum der stetigen Funktionen C([a, b]; X) liegt dicht in L p (a, b; X) 

für 1 ≤ p < ∞. 

9

Ein möglicher Beweis dieses Satzes benutzt den Satz von Lusin, der auch für 

Banachraum-wertige Funktionen mit fast separablem Bild gültig ist. Wir führen 

den Beweis, indem wir die aus der Maßtheorie bekannte Tatsache ausnutzen, dass 

C([a, b]) dicht liegt in L p (a, b). 

Beweis. Es ist leicht zu sehen, dass in der Tat C([a, b]; X) ⊂ L p (a, b; X) gilt, da 

stetige Funktionen auf dem kompakten Intervall [a, b] gleichmäßig stetig sind. 

Jede einfache Funktion ist durch stetige Funktionen approximierbar: Ist f = 

χ A x, wobei o.B.d.A. x ≠ 0 sei, und ε > 0, so wähle eine stetige Funktion f ε ′ : 

[a, b] → R mit ‖f ε ′ −χ A ‖ L p ([a,b]) ≤ 

ε . Dann ist f ‖x‖ ε := f εx ′ ∈ C([a, b]; X) mit ‖f ε − 

χ A x‖ L p (a,b;X) ≤ ε. Ist nun allgemein f = ∑ n 

i=1 χ A i 

x i einfach und ε > 0, so wähle 

f ε,i ∈ C([a, b]; X) mit ‖f ε,i −χ Ai x i ‖ L p (a,b;X) ≤ ε wie gerade beschrieben. Dann ist 

n 

f ε := ∑ i f ε,i ∈ C([a, b]; X) mit ‖f ε − f‖ L p (a,b;X) ≤ ∑ i ‖f ε,i − χ Ai x i ‖ L p (a,b;X) ≤ ε. 

Es bleibt zu zeigen, dass die einfachen Funktionen dicht in L p (a, b; X) liegen. 

Sei also f ∈ L p (a, b; X). Wähle einfache Funktionen f n mit f n → f fast überall 

und ∫ ‖f n − f‖ → 0. Wie im Beweis von Satz 2.6 gezeigt, dürfen wir annehmen, 

dass ‖f n ‖ ≤ 2‖f‖ fast überall gilt. Dann aber gilt ‖f n − f‖ p ≤ 3 p ‖f‖ p und 

‖f 

∫ n −f‖ p → 0 fast überall, nach dem Satz von der majorisierten Konvergenz also 

‖fn − f‖ p → 0. 

□ 

Zum Schluss dieses Abschnitts stellen wir noch einige nützliche Eigenschaften 

des Bochner-Integrals zusammen, deren Beweise Übungsaufgaben sind. 

Bemerkung 2.12 1. Konvergiert f n gegen f in L p (a, b; X), so gibt es eine 

punktweise fast überall gegen f konvergente Teilfolge. 

2. Hauptsatz der Differential- und Integralrechnung: Ist f ∈ C 1 ([a, b], X), a ≤ 

s ≤ t ≤ b, so gilt 

f(t) = f(s) + 

∫ t 

s 

f ′ (τ) dτ. 

3. Satz von der majorisierten Konvergenz: Gilt f n → f punktweise fast überall 

für Bochner-integrierbare f n und gibt es eine integrierbare numerische 

Funktion g : [a, b] → R mit 

‖f n (t)‖ ≤ g(t) fast überall für alle n ∈ N, 

so ist auch f Bochner-integrierbar mit 

∫ ∫ 

f n → 

f. 

4. Ist ζ ∈ Cc ∞(−ε, ε), u ∈ L1 (a, b; X), so ist ζ ∗ u ∈ C ∞ (a + ε, b − ε; X) mit 

d n 

(ζ ∗ u) = ( dn ζ) ∗ u, n ∈ N. 

dt n dt n 

5. Ist X separabel, 1 ≤ p < ∞, so ist auch L p (a, b; X) separabel. 

10

2.1.2 Zeitabhängige Sobolevräume 

Definition 2.13 (i) Es sei X ֒→ Y , u ∈ L 1 (0, T; X). v ∈ L 1 (0, T; Y ) heißt 

schwache Ableitung von u, wenn 

∫ T 

0 

∫ T 

ϕ ′ (t) u(t) dt = − ϕ(t) v(t) dt 

0 

für alle Testfunktionen ϕ ∈ Cc ∞ (0, T) erfüllt ist. (Beachte: Dies ist als Gleichung 

in Y zu interpretieren, wobei die rechte Seite gemäß der Einbettung 

X ֒→ Y als Element von Y aufgefasst wird. Ist X = Y , so ist immer die 

identische Einbettung gemeint.) 

(ii) W 1,p (0, T; X) ist der Raum 

W 1,p (0, T; X) := {u ∈ L p (0, T; X) : u ′ existiert und liegt in L p (0, T; X)} 

versehen mit der Norm 

⎧( ⎨ ∫ ) 1 

T 

‖u‖ W 1,p (0,T;X) = 0 ‖u‖p + ‖u ′ ‖ p p 

, 1 ≤ p < ∞, 

⎩ 

ess sup t∈[0,T] (‖u(t)‖ + ‖u ′ (t)‖), p = ∞. 

Es ist nicht schwer zu sehen, dass die schwache Ableitung – wenn sie existiert 

– eindeutig definiert ist und dass W 1,p (0, T; X) ein Banachraum ist. 

Satz 2.14 Sei u ∈ W 1,p (0, T; X), 1 ≤ p ≤ ∞. Dann gelten: 

(i) u ∈ C([0, T]; X) (Genauer: Es gibt einen stetigen Repräsentanten.) 

(ii) Für 0 ≤ s ≤ t ≤ T ist 

u(t) = u(s) + 

∫ t 

s 

u ′ (τ) dτ. 

(iii) Es gibt eine von u unabhängige Konstante C, so dass 

max 

t∈[0,T] ‖u(t)‖ ≤ C‖u‖ W 1,p (0,T;X). 

Beweis. Setze u durch 0 auf (−∞, 0) ∪ (T, ∞) fort. Bezeichnet η ε den skalierten 

Standard-Glättungskern auf R, so sei 

u ε := η ε ∗ u. 

11

Nach Bemerkung 2.12,4 ist u ε C ∞ -glatt. Wie im skalaren Fall (vgl. Skript PDG 

1) sieht man, dass u ′ ε = η ε ∗ u ′ auf (ε, T − ε) gilt: 

u ′ ε(t) = 

∫ T 

= − 

= 

0 

∫ T 

0 

∫ T 

0 

dη ε 

(t − s)u(s) ds 

dt 

dη ε 

(t − s)u(s) ds 

ds 

η ε (t − s)u ′ (s) ds 

= (η ε ∗ u ′ )(t), 

wobei wir im ersten Schritt Bemerkung 2.12,4 benutzt haben. Mit Hilfe von Satz 

2.11 ergibt sich außerdem 3 – genau wie im skalaren Fall – 

u ε → u in L p (0, T; X), u ′ ε → u ′ in L p loc 

(0, T; X). (2.1) 

Da u ε glatt ist, können wir nach Bemerkung 2.12,2 schreiben 

u ε (t) = u ε (s) + 

∫ t 

s 

u ′ ε (τ) dτ. 

Durch Übergang zu einer Teilfolge (wieder mit u ε bezeichnet) erhalten wir u ε → u 

fast überall und damit 

u(t) = u(s) + 

∫ t 

s 

u ′ (τ) dτ 

für fast alle 0 < s ≤ t < T. Da die Abbildung (s, t) ↦→ ∫ t 

s u′ ε (τ) dτ stetig ist, 

folgen daraus (i) und (ii). 

Aus (ii) folgt nun ‖u(t)‖ ≤ ‖u(s)‖+ ∫ t 

s ‖u′ (τ)‖ dτ und daraus durch Integration 

über s: 

T ‖u(t)‖ ≤ ‖u‖ L 1 (0,T,X) + T ‖u ′ ‖ L 1 (0,T,X). 

(iii) folgt nun aus der Hölderschen Ungleichung. 

□ 

In den Anwendungen ist besonders der Fall Y = X ′ von Bedeutung. Genauer: 

Satz 2.15 Es seien V ein reflexiver Banachraum und H ein Hilbertraum über 

R. j : V ֒→ H sei eine dichte Einbettung von V in H (d.h. j : V → H ist linear, 

stetig und injektiv mit j(V ) dicht in H). Dann definiert 

〈j ∗ h, v〉 V = (h, jv) H ∀ v ∈ V (2.2) 

eine dichte Einbettung j ∗ : H ֒→ V ′ mit ‖j ∗ ‖ L(H,V ′ ) ≤ ‖j‖ L(V,H) . 

3 Natürlich ist in Analogie zum skalaren Fall f ∈ L p loc 

(0, T; X) genau dann, wenn f ∈ 

L p (t 1 , t 2 ; X) für alle 0 < t 1 < t 2 < T, und eine Folge (f k ) konvergiert in L p loc 

(0, T; X) gegen f, 

wenn alle Einschränkungen f k | [t1,t 2] auf kompakte Teilintervalle [t 1 , t 2 ] ⊂ (0, T) in L p (t 1 , t 2 ; X) 

gegen f| [t1,t 2]konvergieren. 

12

Hier und in Zukunft schreiben wir die Wirkung v ′ (v) eines linearen Funktionals 

v ′ ∈ V ′ auf einen Vektor v ∈ V meist als 〈v ′ , v〉 V , was den bilinearen Charakter 

dieses Ausdrucks betont. 

Bemerkung 2.16 j ∗ ist die adjungierte Abbildung von j : V → H, wenn man 

H mit H ′ gemäß dem Rieszschen Darstellungssatz identifiziert. 

Beweis. Die rechte Seite von (2.2) ist linear in v mit 

|(h, jv) H | ≤ ‖h‖ H ‖jv‖ H ≤ ‖h‖ H ‖j‖ L(V,H) ‖v‖ V , 

so dass j ∗ h in V ′ liegt mit ‖j ∗ h‖ V ′ ≤ ‖j‖ L(V,H) ‖h‖ H . Da die rechte Seite von (2.2) 

auch linear in h ist, zeigt dies j ∗ ∈ L(H, V ′ ) mit ‖j ∗ ‖ L(H,V ′ ) ≤ ‖j‖ L(V,H) . 

Ist j ∗ h = 0, so gilt (h, jv) H = 0 für alle v ∈ V und damit h = 0, da j(V ) 

dicht liegt in H. Dies zeigt, dass j ∗ injektiv ist. 

Es bleibt zu zeigen, dass j ∗ (H) dicht liegt in V ′ . Nach dem Satz von Hahn- 

Banach genügt es dazu nachzuweisen, dass v ′′ (j ∗ h) = 0 ∀ h ∈ H für v ′′ ∈ V ′′ nur 

für v ′′ = 0 gelten kann. (Wäre j ∗ (H) nicht dicht in V ′ , so gäbe es ein v ′′ ∈ V ′′ \{0}, 

welches auf j ∗ (H) verschwindet.) Sei also v ′′ ∈ V ′′ mit v ′′ (j ∗ h) = 0 ∀ h ∈ H. Da 

V reflexiv ist, gibt es ein v ∈ V mit v ′′ (v ′ ) = 〈v ′ , v〉 V für alle v ′ ∈ V ′ . Es folgt 

0 = v ′′ (j ∗ h) = 〈j ∗ h, v〉 V = (h, jv) H ∀ h ∈ H. 

Also ist jv = 0 und damit auch v = 0, da j injektiv ist. Dann aber ist auch 

v ′′ = 0. 

□ 

Korollar 2.17 Unter den Voraussetzungen von Satz 2.15 gilt: 

J := j ∗ ◦ j : V ֒→ V ′ 

ist eine dichte Einbettung von V in V ′ mit 

〈Jv, w〉 V = 〈Jw, v〉 V ∀ v, w ∈ V. 

Beweis. Dass J : V ֒→ V ′ eine dichte Einbettung ist, folgt direkt aus Satz 2.15. 

Die Behauptung ergibt sich daher aus 

〈Jv, w〉 V = 〈j ∗ j v, w〉 V = (jv, jw) H = (jw, jv) H = 〈j ∗ j w, v〉 V = 〈Jw, v〉 V . 

Definition 2.18 Unter den Voraussetzungen von Satz 2.15 nennt man V 

H j∗ 

֒→ V ′ (oder einfach (V, H, V ′ )) einen Gelfandschen Dreier oder auch ein 

Evolutionstripel. 

□ 

j 

֒→ 

13

Ein Gelfandscher Dreier induziert die dichten Einbettungen 

(Übungsaufgabe). 

L p (0, T; V ) ֒→ L p (0, T; H) ֒→ L p (0, T; V ′ ) 

Beispiel: Sei U ⊂ R n offen und beschränkt, V = H0 1(U), H = L2 (U). (Nach einer 

Übung in PDG 1 ist V ′ = (H0 1(U))′ = H −1 (U).) Sei j die kanonische Einbettung 

H0(U) 1 ֒→ L 2 (U). Es gilt 

∫ 

〈j ∗ h, v〉 H 1 

0 (U) = (h, jv) L 2 (U) = h v ∀v ∈ H0 1 (U). 

Der Rieszsche Darstellungssatz für H0 1 liefert ein w ∈ H0, 1 so dass 

∫ 

〈j ∗ h, v〉 H 1 

0 (U) = ∇w · ∇v ∀v ∈ H0 1 (U). 

U 

Diese beiden Gleichungen zeigen nun, dass w gerade die schwache Lösung des 

elliptischen Problems 

U 

−∆w = h in U, 

w = 0 auf ∂U 

ist. 

Lemma 2.19 Es sei V ֒→ j 

H ֒→ j∗ 

V ′ ein Gelfandscher Dreier, u ∈ L 2 (0, T; V ), 

w ∈ L 2 (0, T, V ′ ). Dann ist w die schwache Ableitung von u genau dann, wenn 

gilt. 

∫ T 

(ju(t), jv(t)) H ϕ ′ (t) dt = − 

∫ T 

0 

0 

〈w(t), v〉 V ϕ(t) ∀ v ∈ V, ϕ ∈ C ∞ c 

(0, T) 

Beweis. Es ist u ′ = w genau dann, wenn 

〈 ∫ T 

〉〈∫ T 

〉 

J u(t)ϕ ′ (t) dt, v = − w(t)ϕ(t) dt, v 

0 

nach Satz 2.6(iv) also genau dann, wenn 

V 

0 

V 

∀ v ∈ V, ϕ ∈ C ∞ c (0, T), 

∫ T 

0 

∫ T 

〈Ju(t)ϕ ′ (t), v〉 V 

dt = − 

0 

〈w(t)ϕ(t), v〉 V 

dt ∀ v ∈ V, ϕ ∈ Cc ∞ (0, T). □ 

Satz 2.20 Sei V ֒→ j 

H ֒→ j∗ 

V ′ ein Gelfandscher Dreier, W := {u ∈ L 2 (0, T; V ) : 

u ′ ∈ L 2 (0, T; V ′ )}. Dann gilt: 

14

(i) W ⊂ C([0, T]; H). D.h. ist u ∈ W, so ist ju : [0, T] → H eine stetige 

Funktion (nach Abänderung auf einer Nullmenge). 

(ii) Für alle u, v ∈ W ist die Abbildung t ↦→ (ju(t), jv(t)) H absolut stetig mit 

Ableitung 

d 

dt (ju(t), jv(t)) H = 〈u ′ (t), v(t)〉 V + 〈v ′ (t), u(t)〉 V 

für fast alle t. Insbesondere ist also 

(ju(t), jv(t)) H = (ju(s), jv(s)) H + 

für alle 0 ≤ s ≤ t ≤ T. 

(iii) Es gibt eine nur von T abhängige Konstante C, so dass 

∫ t 

s 

〈u ′ (τ), v(τ)〉 V + 〈v ′ (τ), u(τ)〉 V dτ 

max ‖ju‖ H ≤ C ( ‖u‖ L 2 (0,T;V ) + ‖u ′ ‖ L 2 (0,T;V )) ′ . 

t∈[0,T] 

Beweis. Setze u durch 0 auf (−∞, 0) ∪ (T, ∞) fort und definiere 

⎧ 

⎪⎨ (η ε ∗ u)(ε), falls t ∈ [0, ε), 

u ε (t) := (η ε ∗ u)(t), falls t ∈ [ε, T − ε], 

⎪⎩ 

(η ε ∗ u)(T − ε), falls t ∈ (T − ε, T], 

ähnlich wie im Beweis von Satz 2.14. 

(i) Da die u ε stetig und stückweise glatt sind mit 

gilt 

d 

dt ‖ju ε(t) − ju δ (t)‖ 2 H = 2(ju ′ ε(t) − ju ′ δ(t), ju ε (t) − ju δ (t)) H , 

∫ t 

‖ju ε (t)−ju δ (t)‖ 2 H = ‖ju ε(s)−ju δ (s)‖ 2 H +2 〈Ju ′ ε (τ)−Ju′ δ (τ), u ε(τ)−u δ (τ)〉 V dτ 

für ε, δ > 0, s, t ∈ [0, T]. Entlang einer geeigneten Teilfolge ε k konvergiert u εk 

fast überall gegen u. Durch geeignete Wahl von s ∈ (0, T) erhalten wir also 

u εk (s) → u(s) in V und damit 

lim sup ‖ju εk (t) − ju εm (t)‖ 2 H 

k,m→∞ 

≤ 2 lim sup 

k,m→∞ 

∫ t 

s 

s 

‖Ju ′ ε k 

(τ) − Ju ′ ε m 

(τ)‖ V ′‖u εk (τ) − u εm (τ)‖ V dτ. 

15

Wie im Beweis von Satz 2.14 ergibt sich Ju ′ ε = η ε ∗ u ′ auf (ε, T − ε) (und 

Ju ′ ε = 0 auf [0, ε) ∪ (T − ε, T]). Es folgt Ju′ ε → u′ in L 2 (0, T; V ′ ). Zusammen mit 

u ε → u in L 2 (0, T; V ) folgt schließlich 

lim sup 

k,m→∞ 

max ‖ju ε k 

(t) − ju εm (t)‖ 2 H = 0. 

t∈[0,T] 

(ju εk ) ist also eine Cauchy-Folge im Banachraum C([0, T]; H). Wegen u εk → u 

fast überall ist daher in der Tat u fast überall gleich einer stetigen Funktion. 

(ii) Ähnlich wie in (i) ist 

(ju ε (t), jv ε (t)) H = (ju ε (s), jv ε (s)) H + 

∫ t 

Mit ε k → 0 folgt für fast alle 0 < s < t < T 

(ju(t), jv(t)) H = (ju(s), jv(s)) H + 

s 

∫ t 

s 

〈Ju ′ ε (τ), v ε(τ)〉 V + 〈Jv ′ ε (τ), u ε(τ)〉 V dτ. 

〈u ′ (τ), v(τ)〉 V + 〈v ′ (τ), u(τ)〉 V dτ, 

wobei t ↦→ 〈u ′ (t), v(t)〉 V +〈v ′ (t), u(t)〉 V in L 1 (0, T) liegt. Da nach (i) ju und jv als 

stetig angenommen werden dürfen und das Integral auf der rechten Seite stetig 

von (s, t) anhängt, gilt diese Gleichung für alle 0 ≤ s ≤ t ≤ T. Dies zeigt (ii). 

(iii) Nach (ii) ist insbesondere 

∫ t 

‖ju(t)‖ 2 H = ‖ju(s)‖2 H + 2 〈u ′ (τ), u(τ)〉 V dτ 

s 

( 

) 

≤ C‖u(s)‖ 2 V + C ‖u ′ ‖ 2 L 2 (0,T,V ′ ) + ‖u‖2 L 2 (0,T,V ) . 

Integration über s liefert die Behauptung. 

□ 

2.2 Lineare parabolische Gleichungen 

2.2.1 Die Konvektions-Diffusions-Gleichung 

Es sei U ⊂ R n ein beschränktes Gebiet. Wir untersuchen die allgemeine Konvektions- 

Diffusions-Gleichung 

⎧ 

⎪⎨ ∂ t u + Lu = f in U T = U × (0, T], 

u = 0 auf ∂U × (0, T], 

(2.3) 

⎪⎩ 

u = u 0 auf U × {0}, 

wobei L in Divergenzform gegeben sei durch 

Lu = − ∑ i,j 

∂ j (a ij ∂ i u) + ∑ i 

b i ∂ i u + c u. 

16

Beachte, dass ∂ i , ∂ j für die räumlichen Ableitungen ∂ xi , ∂ xj steht. 

Die Koeffizienten a ij , b i und c sind hier Funktionen von x und t. Fixiert man 

t und betrachtet L als Operator auf Funktionen in x, so nennt man – wie im 

Skript PDG 1 definiert – L gleichmäßig elliptisch, wenn ein von x unabhängiges 

θ > 0 existiert, so dass ∑ i,j a ijξ i ξ j ≥ θ|ξ| 2 ∀ ξ ∈ R n \ {0}. 

Definition 2.21 Gibt es ein von (x, t) unabhängiges θ > 0, so dass 

∑ 

a ij ξ i ξ j ≥ θ|ξ| 2 ∀ ξ ∈ R n \ {0}, 

so nennt man ∂ t + L gleichmäßig parabolisch. 

i,j 

Physikalische Motivation Physikalisch beschreibt diese Gleichung z.B. die 

Konzentration eines chemischen Stoffes in in einem fließenden Trägermedium (etwa 

Tinte in Wasser). Es gibt natürlich auch andere – nicht nur physikalische – 

Interpretationen. Dabei besagt die Gleichung, dass die zeitliche Änderung von 

u gleich −Lu + f ist. Am einfachsten erkennt man, welche Effekte beschrieben 

werden, wenn man die Terme in −Lu + f extra betrachtet. 

Diffusion: Der Term ∑ i,j ∂ j(a ij ∂ i u) = div(A T ∇u) ergibt sich daraus, dass 

das System versucht, Konzentrationsunterschiede auszugleichen. Betrachtet man 

wie in den physikalischen Motivationen zur Laplace-Gleichung und zur Wärmeleitungsgleichung 

im Skript PDG 1 ein kleines Testvolumen und untersucht, wie sich 

die Konzentration des betrachteten Stoffes pro Zeiteinheit ändert, so liefert die 

Annahme, dass dies proportional zu ∇u geschieht einen Oberflächenterm A∇u. 

Ist der Raum homogen, so ist einfach A = Id und wir erhalten div ∇u = ∆u. Im 

Allgemeinen ist das zu Grunde liegende Medium jedoch inhomogen. 

Beachte, dass wir o.B.d.A. A als symmetrisch voraussetzen dürfen. Da wir 

allerdings immer voraussetzen wollen, dass sich Konzentrationsunterschiede ausgleichen 

und sich nicht etwa verstärken, nehmen wir zudem an, dass A positiv 

definit ist. 

Transport: Der Term ∑ i b i∂ i u beschreibt den Transport eines Stoffes durch 

ein Medium, welches sich mit der Geschwindigkeit b bewegt, s. Skript PDG 1. 

Man nennt diesen Anteil der Bewegung auch Konvektion. 

Quellen und Senken: Die Terme cu und f schließlich beschreiben Quellen 

und Senken des betrachteten Stoffes, d.h. die Rate, mit der die Konzentration 

ab- oder zunimmt. Auch dies ist im Skript PDG 1 erläutert. Im Unterschied zu 

f = f(x, t) hängt der Term cu = c(x, t)u(x, t) auch von der Lösung u selbst 

ab. Wir betrachten hier der Einfachheit halber nur lineare Abhängigkeiten von 

u. Die Erzeugungs- bzw. Vernichtungsrate ist also proportional zur momentanen 

Konzentration. Das ist z.B. – unter geeigneten Voraussetzungen – sicher eine 

vernünftige Annahme an biologische Populationsmodelle. In der Theorie der sogenannten 

Reaktions-Diffusions-Gleichungen betrachtet man auch allgemeinere 

Rückkopplungen f(x, t, u) auf die zeitliche Änderung des Systems. 

17

Wie für elliptische Probleme (vgl. Skript PDG 1) versuchen wir, eine schwache 

Formulierung des Problems zu finden, die wir mit funktionalanalytischen Mitteln 

lösen können. Die Idee ist dabei, t zunächst festzuhalten und in Analogie zur 

elliptischen Theorie Lu und f als Funktionale auf V := H0 1 (U) aufzufassen. Das 

legt dann nahe, Funktionen u mit ∂ t u ∈ (H0 1(U))′ zu suchen. Wir testen also (2.3) 

mit (zunächst Cc ∞ -glatten) Funktionen v und integrieren partiell nach x, um 

〈∂ t u, v〉 V + B(u, v, t) = 〈f, v〉 V (2.4) 

zu erhalten. Hier ist B(·, ·, t) die Bilinearform 

∫ 

∑ 

B(u, v, t) = a ij ∂ i u ∂ j v + ∑ 

U i,j 

i 

b i ∂ i u v + c u v dx. (2.5) 

(vgl. Kap. 5 im Skript PDG 1). 

Indem wir H = L 2 (U) setzen und fordern, dass (2.4) für alle v ∈ V = H 1 0 gilt, 

gelangen wir zu dem folgenden abstrakten Evolutionsproblem: Gesucht ist 

u ∈ W := {w ∈ L 2 (0, T; V ) : w ′ ∈ L 2 (0, T; V ′ )} 

mit 

{ 

〈u ′ (t), v〉 V + B(u(t), v, t) = 〈f(t), v〉 V ∀v ∈ V f.f.a. t, 

u(0) = u 0 ∈ H. 

(2.6) 

Beachte: Die Bedingung u(0) = u 0 ist sinnvoll nach Satz 2.20(i). 

Definition 2.22 Man nennt (2.6) die zu (2.3) gehörige Variationsgleichung. Eine 

Lösung von (2.6) heißt schwache Lösung von (2.3). 

2.2.2 Das abstrakte Evolutionsproblem 

Das grundlegende abstrakte Resultat ist wie folgt. 


H ֒→ j∗ 

V ′ ein Evolutionstripel, V ein separabler ∞-dimensionaler 

Banachraum. Des Weiteren sei B : V × V × (0, T] → R eine Abbildung, 

so dass B(·, ·, t) bilinear ist für jedes t, t ↦→ B(v, w, t) messbar für alle v, w ∈ V 

und so dass Konstanten c V , c H , C V > 0 existieren mit 

(Stetigkeit) und 

|B(v, w, t)| ≤ C V ‖v‖ V ‖w‖ V ∀ v, w ∈ V, t ∈ (0, T] 

|B(v, v, t)| ≥ c V ‖v‖ 2 V − c H‖jv‖ 2 H 

∀ v ∈ V, t ∈ (0, T] 

18

(“schwache Form der Koerzivität”). Sei schließlich u 0 ∈ H, f ∈ L 2 (0, T; V ′ ). 

Dann gibt es genau eine Lösung u ∈ W der Variationsgleichung 

{ 

〈u ′ (t), v〉 V + B(u(t), v, t) = 〈f(t), v〉 V ∀v ∈ V f.f.a. t, 

(2.7) 

ju(0) = u 0 ∈ H. 

Es gilt 

max ‖ju(t)‖ H + ‖u‖ L 2 (0,T;V ) + ‖u ′ ‖ L 2 (0,T;V ′ ) ≤ C ( ‖u 0 ‖ H + ‖f‖ L 2 (0,T;V )) ′ . 

t∈[0,T] 

für eine nur von T abhängende Konstante C. 

Das abstrakte Evolutionsproblem ist also wohlgestellt. 

Der Beweis erfolgt in mehreren Schritten und wird mit dem Galerkin-Verfahren, 

d.h. durch endlich-dimensionale Approximationen, geführt. Wir nehmen für 

den Rest dieses Abschnittes an, dass die Voraussetzungen von Satz 2.23 erfüllt 

sind. 

Lemma 2.24 Es existiert eine Folge (w n ) ⊂ V , so dass 

dim V n = n und V = ⋃ n∈NV n . 

für V n := span{w 1 , . . .,w n } gilt. 

Beweis. Sei {z 1 , z 2 , . . .} eine dichte Teilmenge von V . Definiere die Teilmenge 

{w 1 , w 2 , . . .} von {z 1 , z 2 , . . .} durch 

z i ∈ {w 1 , w 2 , . . .} : ⇐⇒ z i /∈ span{z 1 , . . .,z i−1 }. 

Dann sind die w i linear unabhängig mit span{w 1 , w 2 , . . .} = span{z 1 , z 2 , . . .} und 

daher V = ⋃ n∈N V n. Insbesondere ist #{w 1 , w 2 , . . .} = ∞. 

□ 

Sei nun P n die Orthogonalprojektion auf den (endlichdimensionalen und daher 

abgeschlossenen) Unterraum jV n von H. Nach Lemma 2.24 ist dann P n h → h 

für alle h ∈ H. (Man sagt “P n konvergiert stark gegen Id”.) 

Wir suchen Lösungen 

u n (t) = 

n∑ 

c nk (t)w k , c nk : [0, T] → R, (2.8) 

k=1 

der Galerkin-Gleichungen 

{ 

(ju ′ n (t), jv) H + B(u n (t), v, t) = 〈f(t), v〉 V ∀ v ∈ V n f.f.a. t, 

ju n (0) = P n u 0 ∈ H. 

(2.9) 

19

Unter Verwendung von (2.8) schreibt sich dies als 

⎧∑ n 

⎪⎨ k=1 c′ nk (t)(jw k, jw i ) H + ∑ n 

k=1 c nk(t)B(w k , w i , t) = 〈f(t), w i 〉 V , 

1 ≤ i ≤ n f.f.a. t, (2.10) 

⎪⎩ 

c nk (0) = α nk 

mit j −1 P n u 0 = ∑ n 

k=1 α nkw k . 

Da V n = span{w 1 , . . .,w n } ist, beschreiben die Galerkin-Gleichungen gerade 

das “auf V n projizierte Problem”. 

Satz 2.25 Die Galerkin-Gleichungen (2.9) haben eine eindeutige Lösung u n ∈ 

W 1,2 (0, T; V n ). D.h. es existieren eindeutig bestimmte c n1 , . . .,c nn ∈ W 1,2 (0, T), 

so dass (2.10) gilt. 

Beweis. Da (w 1 , . . ., w n ) linear unabhängig ist, ist auch (jw 1 , . . .,jw n ) linear 

unabhängig, denn j ist injektiv. Die Matrix 

M := ((jw k , jw i ) H ) ik 

ist daher invertierbar. (Denn: Mx = 0 =⇒ ∑ i (jw k, jw i ) H x i = (jw k , ∑ i x ijw i ) H 

= 0 für alle k, so dass ∑ i x ijw i = 0 =⇒ x 1 = . . . = x n = 0.) Daher ist (2.10) 

äquivalent zu 

{ 

c ′ n(t) + M −1 ˜B(t)cn (t) = M −1 ˜f(t) f.f.a. t 

(2.11) 

c n (0) = α n 

mit ˜B(t) = (B(w k , w i , t)) ik 

∈ L ∞ (0, T; R n×n ) nach Voraussetzung und ˜f(t) = 

(〈f(t), w i 〉 V ) i=1,...,n ∈ L 2 (0, T; R n ), da 

| ˜f i (t)| = |〈f(t), w i 〉 V | ≤ ‖f(t)‖ V ′‖w i ‖ V . 

Nach dem Satz von Picard-Lindelöf existiert nun eine eindeutig bestimmte 

absolut stetige Funktion c n : [0, T] → R n , die (2.11) fast überall erfüllt. Mit 

˜f ∈ L 2 ist dann in der Tat c n ∈ W 1,2 (0, T; R n ) die gesuchte Lösung. □ 

Die zweite wichtige Zutat im Beweis von Satz 2.23 ist die folgende Energieabschätzung, 

die es uns erlauben wird, zum Limes der u n für n → ∞ überzugehen. 

Satz 2.26 Es gibt eine von n unabängige Konstante C > 0, so dass 

max ‖ju n(t)‖ H + ‖u n ‖ L 2 (0,T;V ) ≤ C ( ) 

‖u 0 ‖ H + ‖f‖ L 2 (0,T;V ′ ) . 

t∈[0,T] 

Beweis. Mit v = u n (t) in (2.9) ergibt sich 

(ju ′ n(t), ju n (t)) H + B(u n (t), u n (t), t) = 〈f(t), u n (t)〉 V f.f.a. t. 

20

Nach Satz 2.25 ist t ↦→ ju n (t) ∈ W 1,2 (0, T; j(V n )) (mit dim j(V n ) = n < ∞), so 

dass gilt 

Es ist also 

∫ t 

‖ju n (t)‖ 2 H = ‖ju n (0)‖ 2 d 

H + 

0 ds (ju n(s), ju n (s)) H ds 

∫ t 

= ‖ju n (0)‖ 2 H + 2 (ju ′ n (s), ju n(s)) H ds. 

∫ t 

∫ t 

‖ju n (t)‖ 2 H + 2 B(u n (s), u n (s), s) ds = ‖P n u 0 ‖ 2 H + 2 〈f(s), u n (s)〉 V ds. 

0 

Unter Beachtung der “Koerzivitätsannahme” an B folgt nun 

∫ t 

‖ju n (t)‖ 2 H + 2c V ‖u n (s)‖ 2 V ds 

≤ ‖u 0 ‖ 2 H + 2c H 

0 

∫ t 

0 

0 

∫ t 

‖ju n (s)‖ 2 H ds + 2 ‖f(s)‖ V ′‖u n (s)‖ V ds. 

Mit Hilfe der Ungleichung ‖f(s)‖ V ′‖u n (s)‖ V ≤ 1 

2c V 

‖f(s)‖ 2 V ′+ c V 

2 

‖u n (s)‖ 2 V erhalten 

wir 

‖ju n (t)‖ 2 H + c V 

∫ t 

≤ ‖u 0 ‖ 2 H + 2c H 

∫ t 

Insbesondere ist dann sicher 

‖ju n (t)‖ 2 H ≤ ‖u 0‖ 2 H + 1 

c V 

∫ T 

0 

0 

‖u n (s)‖ 2 V ds 

‖ju n (s)‖ 2 H ds + 1 

c V 

∫ t 

0 

‖f(s)‖ 2 V ′ ds + 2c H 

0 

0 

0 

‖f(s)‖ 2 V ′ ds. (2.12) 

∫ t 

0 

‖ju n (s)‖ 2 H ds. 

Aus der Gronwallschen Ungleichung 4 ergibt sich nun 

( 

‖ju n (t)‖ 2 H ≤ ‖u 0 ‖ 2 H + 1 ) (1 

‖f‖ 2 L 

c 2 (0,T;V ′ ) + 2cH te ) 2c Ht 

V 

und daher 

‖ju n (t)‖ 2 H ≤ C 

( 

) 

‖u 0 ‖ 2 H + ‖f‖ 2 L 2 (0,T;V ′ ) 

(2.13) 

4 Zur Erinnerung: Ist g ∈ L 1 (0, T) mit 0 ≤ g(t) ≤ C 1 

∫ t 

0 g(s)ds + C 2 für fast alle t, so gilt 

g(t) ≤ C 2 (1 + C 1 te C1t ) fast überall auf [0, T]. 

21

mit C = C(T). Dies in die rechte Seite von (2.12) eingesetzt liefert 

∫ T 

c V ‖u n (s)‖ 2 V ds 

0 

≤ ‖u 0 ‖ 2 H + 2c HTC 

( 

) 

‖u 0 ‖ 2 H + ‖f‖2 L 2 (0,T;V ′ ) + 1 ‖f‖ 2 L 

c 2 (0,T;V ′ ) , 

V 

so dass für (ein vergrößertes) C = C(T) auch 

‖u n ‖ 2 L 2 (0,T;V ) ≤ C (‖u 0 ‖ 2 H + ‖f‖2 L 2 (0,T;V ′ ) 

) 

(2.14) 

gilt. Die Behauptung folgt nun aus (2.13) und (2.14). 

Zur Vorbereitung auf den wesentlichen Kompaktheitsschluss in Lemma 2.28 

halten wir fest: 

Lemma 2.27 Der Raum L 2 (0, T; V ) ist reflexiv. 

Der Beweis dieses Lemmas in voller Allgemeinheit ist recht lang, so dass wir 

uns hier auf den für unsere Anwendungen ausreichenden Fall beschränken, dass V 

ein Hilbertraum ist. Das Problem ist das folgende: Wie im skalaren Fall ist es nicht 

schwer zu sehen, dass für beliebige Banachräume L q (0, T, V ′ ) ⊂ (L p (0, T; V )) ′ gilt, 

wenn 1 ≤ p < ∞ und 1+ 1 = 1 ist. Die Schwierigkeit besteht nun darin, dass diese 

p q 

Inklusion i.A. nicht surjektiv ist. Im Beweis der Surjektivität für skalare Funktionen 

benutzt man den Satz von Radon-Nikodym, der für allgemeine Banachräume 

nicht mehr gültig ist. Glücklicherweise stimmt er jedoch in unserer Situation, was 

sich z.B. daraus ergibt, dass wir V als reflexiv vorausgesetzt haben. 5 Der Beweis 

der Surjektivität ist dann ganz analog zum skalaren Fall. 

Beweis für Hilberträume V . Ist V ein Hilbertraum mit Skalarprodukt (·, ·) V , so 

ist nicht schwer zu sehen, dass L 2 (0, T; V ) ein Hilbertraum mit Skalarprodukt 

□ 

(x, y) L 2 (0,T;V ) = 

∫ T 

ist. Hilberträume sind aber immer reflexiv. 

0 

(x(t), y(t)) V dt 

□ 

Lemma 2.28 Es gibt eine Teilfolge von (u n ) (wieder mit (u n ) bezeichnet) und 

ein u ∈ L 2 (0, T; V ), so dass 

u n ⇀ u in L 2 (0, T; V ). 

5 Banachräume, in denen der Satz von Radon-Nikodym gilt, nennt man Banachräume mit 

der Radon-Nikodym-Eigenschaft. Beispiele sind reflexive Räume oder separable Dualräume – 

beide Bedingungen sind in unserem Fall erfüllt. Einzelheiten finden sich z.B. in [DU]. 

22

Der schwache Limes u erfüllt die Gleichung 

− (u 0 , jv) H ϕ(0) − 

= 

∫ T 

0 

∫ T 

0 

〈f(t), v〉 V ϕ(t) dt 

〈Ju(t), v〉 V ϕ ′ (t) dt + 

für alle v ∈ V , ϕ ∈ C 1 ([0, T]) mit ϕ(T) = 0. 

∫ T 

0 

B(u(t), v, t)ϕ(t) dt 

Beweis. Nach Satz 2.26 und Lemma 2.27 ist (u n ) beschränkt im reflexiven Raum 

L 2 (0, T; V ). Es existiert also eine Teilfolge, die wir wieder mit (u n ) bezeichnen, 

und ein u ∈ L 2 (0, T; V ), so dass u n ⇀ u in L 2 (0, T; V ). 

Ist nun v ∈ V i , so folgt aus der Galerkin-Gleichung (2.9) 

∫ T 

0 

(ju ′ n (t), jv) Hϕ(t) dt + 

∫ T 

für n ≥ i. Partielle Integration liefert 

− (ju n (0), jv) H ϕ(0) − 

= 

∫ T 

0 

〈f(t), v〉 V ϕ(t) dt. 

∫ T 

0 

0 

B(u n (t), v, t)ϕ(t) dt = 

〈Ju n (t), v〉 V ϕ ′ (t) dt + 

∫ T 

0 

∫ T 

0 


B(u n (t), v, t)ϕ(t) dt 

Wegen ju n (0) = P n u 0 → u 0 in H, konvergiert der erste Term in diesem Ausdruck 

gegen −(u 0 , jv) H ϕ(0). Für den zweiten Term erhalten wir 

∫ T 

0 

〈Ju n (t), v〉 V ϕ ′ (t) dt → 

∫ T 

0 

〈Ju(t), v〉 V ϕ ′ (t) dt, 

denn es gilt u n ⇀ u in L 2 (0, T; V ) und die Abbildung z ↦→ ∫ T 

〈Jz(t), v〉 0 V ϕ ′ (t) dt 

ist ein stetiges lineares Funktional auf L 2 (0, T; V ): Die Linearität ist klar und die 

Stetigkeit folgt aus 

∫ T 

∫ T 

∣ 〈Jz(t), v〉 V ϕ ′ (t) dt 

∣ ≤ ‖J‖ L(V,V ′ )‖z(t)‖ V ‖v‖ V |ϕ ′ (t)| dt 

0 

0 

≤ ‖J‖ L(V,V ′ )‖v‖ V ‖ϕ ′ ‖ L 2 (0,T)‖z‖ L 2 (0,T;V ). 

Aus den Stetigkeitsannahmen an B ergibt sich ganz analog, dass der dritte Term 

gegen 

∫ T 

0 


23

strebt. Damit ist 

− (u 0 , jv) H ϕ(0) − 

= 

∫ T 

0 

∫ T 

0 


〈Ju(t), v〉 V ϕ ′ (t) dt + 

∫ T 

0 


für alle v ∈ V i bewiesen. Da i beliebig war und ⋃ n V n = V ist, zeigt nun ein 

Standard-Approximationsargument, dass diese Gleichung für alle v ∈ V gilt. □ 

Bevor wir nun endlich den Satz 2.23 beweisen, halten wir noch die folgende 

Beobachtung fest: 

Lemma 2.29 Durch 

〈b(t), v〉 V = B(u(t), v, t) ∀ v ∈ V, t ∈ (0, T) 

wird eine Funktion b ∈ L 2 (0, T; V ′ ) definiert mit 

‖b‖ L 2 (0,T;V ′ ) ≤ C V ‖u‖ L 2 (0,T;V ). 

Beweis. Für alle t ist der Ausdruck B(u(t), v, t) linear in v ∈ V mit 

|B(u(t), v, t)| ≤ C V ‖u(t)‖ V ‖v‖ V , 

was b(t) ∈ V ′ mit ‖b(t)‖ V ′ ≤ C V ‖u(t)‖ V zeigt. 

Die Abbildung t ↦→ b(t) ist stark messbar: Wähle einfache z n mit z n → u fast 

überall. Dann gilt B(z n (t), v, t) → B(u(t), v, t) für alle v ∈ V fast überall. Ist nun 

z n = ∑ N n 

i=1 ζ niχ Ani , ζ ni ∈ V , so ist B(z n (t), v, t) = ∑ N n 

i=1 χ A ni 

(t)B(ζ ni , v, t) und 

also messbar. Dies zeigt, dass t ↦→ B(u(t), v, t) eine messbare Funktion ist. Aus 

der Definition von b und der Reflexivität von V folgt nun, dass b : [0, T] → V ′ 

schwach messbar ist. Nach Voraussetzung ist jedoch V ′ separabel, so dass nach 

dem Satz von Pettis b tatsächlich stark messbar ist. 

Wegen 

∫ T 

0 

‖b(t)‖ 2 V ′ dt ≤ C2 V 

∫ T 

0 

‖u(t)‖ 2 V dt 

folgt schließlich b ∈ L 2 (0, T; V ′ ) mit ‖b‖ L 2 (0,T;V ′ ) ≤ C V ‖u‖ L 2 (0,T;V ). 

Beweis von Satz 2.23. 

1. Existenz. Nach den Lemmas 2.28 und 2.29 ist für alle ϕ ∈ C ∞ c 

− 

∫ T 

0 

(ju(t), jv) H ϕ ′ (t) dt + 

so dass nach Lemma 2.19 

∫ T 

0 

〈b(t), v〉 V ϕ(t) dt = 

u ′ = −b + f ∈ L 2 (0, T; V ′ ) 

24 

∫ T 

0 

(0, T) 

〈f(t), v〉 V ϕ(t) dt, 

□

gilt. Testen mit Elementen aus V zeigt, dass die Variationsgleichung 

〈u ′ (t), v〉 V + B(u(t), v, t) = 〈f(t), v〉 V ∀ v ∈ V f.f.a. t 

erfüllt ist. 

Setzt man nun −b + f = u ′ in die Formel aus Lemma 2.28 ein, so hat man 

−(u 0 , jv) H ϕ(0) − 

∫ T 

0 

〈Ju(t), v〉 V ϕ ′ (t) dt = 

∫ T 

0 

〈u ′ (t), v〉 V ϕ(t) dt 

für alle v ∈ V , ϕ ∈ C 1 ([0, T]) mit ϕ(T) = 0. Andererseits erhalten wir aus Satz 

2.20(ii) angewandt auf u und ϕv 

−(ju(0), jv) H ϕ(0) = 

∫ T 

0 

〈u ′ (t), ϕ(t)v〉 V + 〈ϕ ′ (t)Jv, u(t)〉 V dt. 

Aus den letzten beiden Gleichungen und Korollar 2.17 folgt aber 

(u 0 − ju(0), jv) H = 0 ∀ v ∈ V 

und damit schließlich ju(0) = u 0 . 

2. Eindeutigkeit und stetige Abhängigkeit von den Daten. Mit Satz 2.20(ii) 

und der Variationsgleichung folgt für jede Lösung u 

1 

2 (ju(t), ju(t)) H − 1 2 (u 0, u 0 ) H = 

∫ t 

= − 

〈u ′ (s), u(s)〉 V ds 

0 

∫ t 

Wie im Beweis von Satz 2.26 ergibt sich nun 

0 

B(u(s), u(s), s) ds + 

∫ t 

∫ 

1 

t 

∫ t 

2 ‖ju(t)‖2 H + c V ‖u(s)‖ 2 V ds − c H ‖ju(s)‖ 2 ds 

≤ 1 2 ‖u 0‖ 2 H + c V 

2 

0 

∫ t 

0 

‖u(s)‖ 2 V ds + 1 

2c V 

∫ t 

0 

0 

0 

‖f(s)‖ 2 V ′ ds 

〈f(s), u(s)〉 V ds. 

aus den Koerzivitätseigenschaften von B und aus dieser Ungleichung – genau wie 

im Beweis von Satz 2.26 – 

( 

) 

max ‖ju(t)‖ 2 H ≤ C ‖u 0 ‖ 2 H + ‖f‖ 2 L 

t 

2 (0,T;V ′ ) 

und 

‖u‖ 2 L 2 (0,T;V ) ≤ C (‖u 0 ‖ 2 H + ‖f‖2 L 2 (0,T;V ′ ) 

Aus der Variationsgleichung folgt schließlich 

|〈u ′ (t), v〉 V | ≤ C V ‖u(t)‖ V ‖v‖ V + ‖f(t)‖ V ′‖v‖ V ∀ v f.f.a. t, 

) 

. 

25

insbesondere also 

‖u ′ (t)‖ V ′ ≤ C V ‖u(t)‖ V + ‖f(t)‖ V ′ f.f.a. t. 

Mit Hilfe der schon bewiesenen Abschätzungen erhalten wir 

‖u ′ ‖ L 2 (0,T;V ′ ) ≤ C ( ‖u‖ L 2 (0,T;V ) + ‖f‖ L 2 (0,T;V ′ )) 

≤ C 

( 

‖u0 ‖ H + ‖f‖ L 2 (0,T;V ′ )) 

. 

Damit ist nun 

max ‖ju(t)‖ H + ‖u‖ L 2 (0,T;V ) + ‖u ′ ‖ L 2 (0,T;V ′ ) ≤ C ( ) 

‖u 0 ‖ H + ‖f‖ L 2 (0,T;V ′ ) 

t∈[0,T] 

gezeigt. 

Die Eindeutigkeit ist nun eine einfache Folgerung aus dieser Abschätzung: 

Die Differenz zweier Lösungen ist eine Lösung des abstrakten Evolutionsproblems 

zum Startwert 0 und mit rechter Seite 0 und verschwindet damit nach der eben 

bewiesenen Ungleichung. 

□ 

Bemerkung 2.30 1. Lemma 2.29 zeigt, dass es einen linearen stetigen Operator 

A : L 2 (0, T; V ) → L 2 (0, T; V ′ ) gibt, so dass 

〈(Aw)(t), v〉 V = B(w(t), v, t) ∀v ∈ V, f.f.a. t. 

Mit diesem Operator lässt sich die Variationsgleichung in der Form 

u ′ + Au = f 

als Gleichung in L 2 (0, T; V ′ ) schreiben. 

2. Unter geeigneten Glattheitsannahmen an t ↦→ B(v, w, t), den Startwert u 0 

und die rechte Seite f kann man Regularitätsresultate von der Form u ∈ 

W k,2 (0, T; V ), u ′ ∈ W k,2 (0, T; V ′ ) für die schwache Lösung u von (2.7) 

beweisen. Wir gehen hier nicht näher darauf ein. (Mehr dazu etwa in [Wl].) 

2.2.3 Anwendung auf die Konvektions-Diffusions-Gleichung 

Gemäß Definition 2.22 suchen wir schwache Lösungen der Konvektions-Diffusions- 

Gleichung (2.3). 

Satz 2.31 Es seien U ⊂ R n offen und beschränkt, a ij , b i , c ∈ L ∞ (U) und ∂ t + L 

mit 

∂ t u + Lu = ∂ t u − ∑ i,j 

∂ j (a ij ∂ i u) + ∑ i 

b i ∂ i u + c u 

26

gleichmäßig parabolisch. Des Weiteren seien u 0 ∈ L 2 (U), f ∈ L 2 (U T ). Dann hat 

die Konvektions-Diffusions-Gleichung 

⎧ 

⎪⎨ ∂ t u + Lu = f in U T = U, 

u = 0 auf ∂U × (0, T), 

⎪⎩ 

u = u 0 auf U × {0}, 

eine eindeutige schwache Lösung u ∈ W. 

Beweis. Betrachte den Gelfandschen Dreier H0 1(U) ֒→ L2 (U) ֒→ (H0 1(U))′ mit 

der Inklusionsabbildung jv = v. Die Behauptung ist nach Satz 2.23 gezeigt, 

wenn wir überprüft haben, dass die Bilinearform B aus (2.5) und die Daten f 

die Voraussetzungen von Satz 2.23 erfüllen. 

Die Stetigkeits- und Koerzivitätsbedingungen ergeben sich wie bei den elliptischen 

Gleichungen (vgl. Skript PDG 1, Kap. 5). Zur Erinnnerung: Da alle 

Koeffizienten beschränkt sind, folgt 

|B(v, w, t)| ≤ C ( ) 

‖∇v‖ L 2 (U)‖∇w‖ L 2 (U) + ‖∇v‖ L 2 (U)‖w‖ L 2 (U) + ‖v‖ L 2 (U)‖w‖ L 2 (U) 

≤ ‖v‖ H 1 

0 

(U)‖w‖ H 1 

0 (U) 

mit Hilfe der Poincaréschen Ungleichung. Des Weiteren ist wegen der gleichmäßigen 

Parabolizität für ein θ > 0 

|B(v, v, t)| ≥ θ‖∇v‖ 2 L 2 (U) − C‖∇v‖ L 2 (U)‖v‖ L 2 (U) − C‖v‖ 2 L 2 (U) 

≥ θ‖∇v‖ 2 L 2 (U) − θ 2 ‖∇v‖2 L 2 (U) − C′ ‖v‖ 2 L 2 (U) − C‖v‖2 L 2 (U) 

= θ 2 ‖v‖2 H 1 0 (U) − C′′ ‖v‖ 2 L 2 (U) . 

Dass f den Voraussetzungen von Satz 2.23 genügt, ergibt sich aus f(t) := f(·, t) ∈ 

L 2 (U) für fast alle t, ∫ T 

0 ‖f(t)‖2 L 2 (U) dt = ‖f‖2 L 2 (U T ) < ∞, sowie L2 (0, T, L 2 (U)) ֒→ 

L 2 (0, T, (H0(U)) 1 ′ ). 

□ 

Beachte, dass hier der in Bemerkung 2.30,1 definierte Operator A : L 2 (0, T; V ) → 

L 2 (0, T; V ′ ) gerade gleich L : L 2 (0, T; H0(U)) 1 → L 2 (0, T; H −1 (U)) ist. Es gilt also 

∂ t + Lu = f 

in L 2 (0, T; H −1 

0 (U). 

Wir erwähnen noch die folgenden Regularitätsresultate, die wir allerdings 

nicht beweisen werden. (Ein Beweis findet sich z.B. in [Ev]). 

Satz 2.32 Es seien die Voraussetzungen von Satz 2.31 erfüllt. Des Weiteren 

sollen die Daten den Regularitätsannahmen 

u 0 ∈ H 2m+1 (U), 

d k f 

dt k ∈ L2 (0, T; H 2m−2k (U)), 

27 

k = 0, . . ., m

genügen. Gelten darüberhinaus die Kompatibilitätsbedingungen 

⎧ 

u 0 ∈ H0 1 

⎪⎨ 

(U), 

u 1 := f(0) − Lu 0 ∈ H0(U), 

1 

. 

⎪⎩ 

u m := dm−1 f 

(0) − Lu 

dt m−1 m−1 ∈ H0 1(U), 

so gilt für die schwache Lösung u der Konvektions-Diffusions-Gleichung (2.3) 

d k u 

dt k ∈ L2 (0, T; H 2m+2−2k (U)), k = 0, . . .,m + 1. 

Insbesondere ist dann nach den Sobolevschen Einbettungssätzen – ähnlich wie 

für die elliptischen Gleichungen, vgl. Skript PDG 1 – u eine klassische Lösung, 

wenn m hinreichend groß ist. 

Korollar 2.33 Gilt unter den Voraussetzungen von Satz 2.31 u 0 ∈ C ∞ (U), f ∈ 

C ∞ (U T ) und sind die Kompatibilitätsbedingungen aus Satz 2.32 für jedes m ∈ N 

erfüllt, so gilt für die schwache Lösung u der Konvektions-Diffusions-Gleichung 

(2.3) u ∈ C ∞ (U T ). 

Bemerkung 2.34 1. Ist die Lösung u ∈ C ∞ (U T ), so kann man sich leicht 

überlegen, dass die Kompatibilitätsbedingungen aus Satz 2.32 erfüllt sein 

müssen. Die erste Bedingung besagt gerade, dass u 0 auf ∂U veschwinden 

muss, da ja u dort für alle positiven Zeiten gleich 0 sein muss. Das gleiche 

Argument angewendet auf ∂ t u zeigt, dass 0 = ∂ t u 0 = f(0) − Lu 0 gelten 

muss, u.s.w. 

2. Ohne die Kompatibilitätsbedingungen erhält man immer noch innere Abschätzungen 

an u. 

2.3 Lineare hyperbolische Gleichungen 

Es sei wieder U ⊂ R n ein beschränktes Gebiet. Wir untersuchen nun die verallgemeinerte 

Wellengleichung 

⎧ 

⎪⎨ ∂ tt u + Lu = f in U T = U × (0, T], 

u = 0 auf ∂U × (0, T], 

(2.15) 

⎪⎩ 

u = u 0 , ∂ t u = u 1 auf U × {0}, 

wobei L genau wie zuvor in Divergenzform gegeben sei durch 

Lu = − ∑ i,j 

∂ j (a ij ∂ i u) + ∑ i 

b i ∂ i u + c u. 

28

Definition 2.35 Existiert ein von (x, t) unabhängiges θ > 0, so dass 

∑ 

a ij ξ i ξ j ≥ θ|ξ| 2 ∀ ξ ∈ R n \ {0} 

i,j 

gilt, so nennt man ∂ tt + L gleichmäßig hyperbolisch. 

Für die physikalische Motivation verweisen wir auf die Motivation der Wellengleichung 

im Skript PDG 1. Beachte, dass nun ein Cauchy-Problem zweiter 

Ordnung gelöst werden muss, so dass wir zur Zeit t = 0 die Werte für u und u ′ 

vorgeben müssen. 

Das Vorgehen ist ganz analog zur Herangehensweise an die parabolischen 

Probleme. Wir versuchen wieder, eine schwache Formulierung des Problems zu 

finden, indem wir t zunächst festzuhalten und in Analogie zur elliptischen Theorie 

Lu und f als Funktionale auf V := H0(U) 1 aufzufassen. Das führt nun dazu, 

dass wir Funktionen u mit ∂ tt u ∈ (H0 1(U))′ suchen. Wir testen also (2.15) mit 

(zunächst Cc ∞ -glatten) Funktionen v und integrieren partiell nach x, um 

〈∂ tt u, v〉 V + B(u, v, t) = 〈f, v〉 V (2.16) 

zu erhalten. Hier ist B(·, ·, t) die zu L gehörige Bilinearform, vgl. (2.5). 

Indem wir H = L 2 (U) setzen und fordern, dass (2.16) für alle v ∈ V = H 1 0 

gilt, gelangen wir zu dem folgenden abstrakten Evolutionsproblem, das wir nun 

untersuchen werden. 


H ֒→ j∗ 

V ′ ein Evolutionstripel, V ein separabler ∞-dimensionaler 

Banachraum. Des Weiteren sei B : V × V × (0, T] → R eine Abbildung, 

so dass B(·, ·, t) bilinear ist für jedes t und so dass Konstanten c V , c H , C V > 0 

existieren mit 

(Stetigkeit) und 

|B(v, w, t)| ≤ C V ‖v‖ V ‖w‖ V ∀ v, w ∈ V, t ∈ (0, T] 

B(v, v, t) ≥ c V ‖v‖ 2 V − c H ‖jv‖ 2 H ∀ v ∈ V, t ∈ (0, T] 

(“Koerzivität”). Wir nehmen zusätzlich an, dass B(·, ·, t) symmetrisch ist, d.h. 

es ist 

B(v, w, t) = B(w, v, t) ∀ v, w ∈ V, t ∈ (0, T] 

und dass t ↦→ B(v, w, t) C 1 ist mit 

∣ ∂B ∣∣∣ 

∣ ∂t (v, w, t) ≤ ˜C V ‖v‖ V ‖w‖ V ∀ v, w ∈ V, t ∈ (0, T] 

29

für eine Konstante ˜C V . Sei schließlich u 0 ∈ V , u 1 ∈ H, f ∈ L 2 (0, T; H). Dann 

gibt es genau eine Lösung u ∈ ˜W := {w ∈ L 2 (0, T; V ) : w ′ ∈ L 2 (0, T; H), w ′′ ∈ 

L 2 (0, T; V ′ )} der Variationsgleichung 

{ 

〈u ′′ (t), v〉 V + B(u(t), v, t) = (f(t), jv) H ∀v ∈ V f.f.a. t, 

(2.17) 

u(0) = u 0 , u ′ (0) = u 1 . 

Es gilt 

max (‖u(t)‖ V + ‖u ′ (t)‖ H ) + ‖u ′′ ‖ L 2 (0,T;V ′ ) ≤ C ( ) 

‖u 0 ‖ V + ‖u 1 ‖ H + ‖f‖ L 2 (0,T;H) 

t∈[0,T] 

für eine nur von T abhängende Konstante C. 

Bemerkung 2.37 1. Beachte, dass für Elemente w aus ˜W insbesondere jw, 

w ′ ∈ L 2 (0, T; H) sowie j ∗ w ′ , w ′′ ∈ L 2 (0, T; V ′ ) ist, so dass jw ∈ C([0, T]; H) 

sowie j ∗ w ′ ∈ C([0, T]; V ′ ) gilt. Die Bedingungen u(0) = u 0 und u ′ (0) = u 1 

sind also sinnvoll zu interpretieren. (Man kann sogar zeigen, dass w ∈ 

C([0, T]; V ) sowie w ′ ∈ C([0, T]; H) gilt.) 

2. Wie im parabolischen Fall ergibt sich daraus nun ein Wohlgestelltheitsresultat 

für die ursprünglich gegebene Gleichung (2.15). Beachte jedoch, dass 

wir hier nur den Fall, dass L formal selbstadjungiert ist, behandeln. Mit 

etwas mehr Arbeit erhält man aber ein entsprechendes Resultat auch für 

allgemeine b ≢ 0. 

Wir nehmen für den Rest dieses Abschnittes an, dass die Voraussetzungen 

von Satz 2.36 erfüllt sind. 

Wie in Abschnitt 2.2 sei (w n ) ⊂ V eine Folge linear unabhängiger Elemente 

aus V , so dass V = ⋃ n∈N V n gilt für V n := span{w 1 , . . .,w n }. Wähle Folgen 

(u 0n ), (u 1n ) mit u 0n , u 1n ∈ V n , etwa 

u 0n = 

n∑ 

i=1 

α (0) 

nk w k, u 1n = 

n∑ 

i=1 

α (1) 

nk w k, 

so dass u 0n → u 0 in V und ju 1n → u 1 in H. Wir suchen Lösungen u n von der 

Form 

n∑ 

u n (t) = c nk (t)w k , c nk : [0, T] → R, 

k=1 

der Galerkin-Gleichungen 

{ 

(ju ′′ n (t), jw i) H + B(u n (t), w i , t) = (f(t), jw i ) H , 1 ≤ i ≤ n f.f.a. t, 

u n (0) = u 0n , u ′ n(0) = u 1n . 

(2.18) 

30

Satz 2.38 Die Galerkin-Gleichungen (2.18) haben eine eindeutige Lösung u n ∈ 

W 2,2 (0, T; V n ). Es gibt eine von n unabhängige Konstante C > 0, so dass 

max 

t∈[0,T] (‖ju′ n(t)‖ H + ‖u n (t)‖ V ) ≤ C ( ) 

‖u 0n ‖ V + ‖ju 1n ‖ H + ‖f‖ L 2 (0,T;H) . 

Beweis. Die Existenz und Eindeutigkeit ergibt sich ganz ähnlich wie im parabolischen 

Fall aus dem Satz von Picard-Lindelöf, nun angewandt auf eine lineare 

Gleichung zweiter Ordnung. 

Um die Abschätzung für u n zu beweisen, multiplizieren wir die Galerkin- 

Gleichung (2.18) mit c ′ ni (t) und summieren über i = 1, . . ., n. Das führt auf 

(ju ′′ n(t), ju ′ n(t)) H + B(u n (t), u ′ n(t), t) = (f(t), ju ′ n(t)) H . 

Da B(·, ·, t) als symmetrisch vorausgesetzt ist, impliziert dies 

d ( 

‖ju 

′ 

dt n (t)‖ 2 H + B(u n(t), u n (t), t) ) − ∂B 

∂t (u n(t), u n (t), t) = 2(f(t), ju ′ n (t)) H. 

Integration von 0 bis t ergibt nun 

‖ju ′ n (t)‖2 H + c V ‖u n (t)‖ 2 V ≤ c H‖ju n (t)‖ 2 H + ‖ju 1n‖ 2 H + C V ‖u 0n ‖ V 

∫ t 

∫ t 

+ ˜C V ‖u n (s)‖ 2 V ds + 2 ‖f(s)‖ H ‖ju ′ n (s)‖ H ds, 

0 

wobei wir die Stetigkeit und die “Koerzivitätseigenschaft” von B ausgenutzt haben. 

Dies zeigt 

) 

‖ju ′ n (t)‖2 H + ‖u n(t)‖ 2 V ≤ C‖ju n(t)‖ 2 H 

(‖u + C 0n ‖ 2 V + ‖ju 1n‖ 2 H + ‖f‖2 L 2 (0,T;H) 

+ C 

∫ t 

0 

0 

‖ju ′ n (s)‖2 H + ‖u n(s)‖ 2 V ds. (2.19) 

Um darauf nun die Gronwallsche Ungleichung anwenden zu können, müssen wir 

noch ‖ju n (t)‖ 2 H abschätzen. In der Tat kann dieser Term wegen 

∫ t 

(∫ t 

‖ju n (t)‖ H ≤ ‖ju 0n ‖ H + 

und somit 

0 

‖ju ′ n(s)‖ H ds ≤ ‖ju 0n ‖ H + T 1 2 

∫ t 

‖ju n (t)‖ 2 H ≤ 2‖ju 0n‖ 2 H + 2T ‖ju ′ n (s)‖2 H ds 

0 

0 

‖ju ′ n(s)‖ 2 H ds 

in die übrigen Terme auf der rechten Seite von (2.19) absorbiert werden. Die 

Gronwallsche Ungleichung liefert dann 

( 

) 

‖ju ′ n(t)‖ 2 H + ‖u n (t)‖ 2 V ≤ C ‖u 0n ‖ 2 V + ‖ju 1n ‖ 2 H + ‖f‖ 2 L 2 (0,T;H) . 

31 

)1 

2 

□

Lemma 2.39 Sei u n die eindeutige Lösung der Galerkin-Gleichungen (2.18). 

Es gibt eine Teilfolge (wieder mit (u n ) bezeichnet) und ein u ∈ L 2 (0, T; V ) mit 

u ′ ∈ L 2 (0, T; H) und u(0) = u 0 , so dass 

Es gilt 

und 

u n ⇀ u in L 2 (0, T; V ) 

und ju ′ n ⇀ u ′ in L 2 (0, T; H). 

ess sup (‖u ′ (t)‖ H + ‖u(t)‖ V ) ≤ C ( ) 

‖u 0 ‖ V + ‖u 1 ‖ H + ‖f‖ L 2 (0,T;H) 

t∈[0,T] 

∫ T 

(−u ′ (t), jv) H ϕ ′ (t) dt + 

0 

∫ T 

= 

0 

∫ T 

0 


(f(t), jv) H ϕ(t) dt + (u 1 , jv) H ϕ(0) 

für alle ϕ ∈ C 1 ([0, T]) mit ϕ(T) = 0 und v ∈ V . 

Beweis. Da L 2 (0, T; V ) und L 2 (0, T; H) reflexiv sind (s. Lemma 2.27) gibt es 

u ∈ L 2 (0, T; V ) und w ∈ L 2 (0, T; H), so dass für eine geeignete Teilfolge (u n ) gilt 

u n ⇀ u in L 2 (0, T; V ) und ju ′ n ⇀ w in L 2 (0, T; H), 

denn nach Satz 2.38 ist ‖u n (t)‖ L 2 (0,T;V ) + ‖ju ′ n (t)‖ L 2 (0,T;H) ≤ C. Insbesondere ist 

also für alle ϕ ∈ C ∞ c ([0, T]) und v ∈ V 

∫ T 

0 

∫ T 

(ju(t), jv) H ϕ ′ (t) dt = lim (ju n (t), jv) H ϕ ′ (t) dt 

n 

0 

(∫ T 

) 

= − lim (ju ′ n (t), jv) n 

Hϕ(t) dt 

= − 

∫ T 

0 

0 

(w(t), jv) H ϕ(t) dt. 

Ähnlich wie in Lemma 2.19 ist daher w = u ′ . Damit ist Satz 2.20(ii) anwendbar, 

so dass für alle ϕ ∈ C 1 ([0, T]) mit ϕ(T) = 0 und v ∈ V gilt 

− (ju(0), jv) H ϕ(0) − 

= 

∫ T 

0 

∫ T 

(ju(t), jv) H ϕ ′ (t) dt 

∫ T 

= lim (ju n (t), jv) H ϕ ′ (t) dt 

n 

0 

= lim 

n 

(−(ju 0n , jv) H ϕ(0) − 

= −(ju 0 , jv) H ϕ(0) − 

0 

∫ T 

0 

(u ′ (t), jv) H ϕ(t) dt 

∫ T 

0 

) 

(ju ′ n (t), jv) Hϕ(t) dt 

(u ′ (t), jv) H ϕ(t) dt, 

32

insbesondere also u(0) = u 0 . Dies zeigt die erste Behauptung. 

Tatsächlich gilt nach Satz 2.38 sogar 

max (‖ju ′ n (t)‖ H + ‖u n (t)‖ V ) ≤ C ( ‖u 0n ‖ V + ‖ju 1n ‖ H + ‖f‖ L (0,T;H)) 2 , 

t∈[0,T] 

wobei die rechte Seite gegen C(‖u 0 ‖ V + ‖u 1 ‖ H + ‖f‖ L 2 (0,T;H)) konvergiert. Da 

{v ∈ L 2 (0, T; X) : ess sup t ‖v(t)‖ X ≤ C} eine abgeschlossene konvexe Teilmenge 

in L 2 (0, T; X) ist (X = V oder X = H), gilt für die schwachen Limites u und u ′ 

sogar 

ess sup (‖u ′ (t)‖ H + ‖u(t)‖ V ) ≤ C ( ‖u 0 ‖ V + ‖u 1 ‖ H + ‖f‖ L (0,T;H)) 2 . 

t∈[0,T] 

Ist schließlich v ∈ V i , so erhalten wir aus der Galerkin-Gleichung für alle 

ϕ ∈ C 1 ([0, T]) mit ϕ(T) = 0 

∫ T 

0 

(ju ′′ n (t), jv) Hϕ(t) + B(u n (t), v, t)ϕ(t) dt = 

wenn n ≥ i. Partielle Integration ergibt 

∫ T 

0 

(f(t), jv) H ϕ(t) dt, 

∫ T 

(−ju ′ n (t), jv) Hϕ ′ (t) + B(u n (t), v, t)ϕ(t) dt 

0 

∫ T 

= 

0 

(f(t), jv) H ϕ(t) dt + (ju 1n , jv) H ϕ(0). 

Ganz analog zum parabolischen Fall (s. Lemma 2.28) ergibt sich nun durch Übergang 

zum Limes n → ∞ 

∫ T 

(−u ′ (t), jv) H ϕ ′ (t) dt + 

0 

∫ T 

= 

0 

∫ T 

0 


(f(t), jv) H ϕ(t) dt + (u 1 , jv) H ϕ(0). 

Wir können nun die Existenzaussage und die stetige Abhängigkeit von den 

Daten in Satz 2.36 beweisen. 

Beweis von Satz 2.36, Teil 1. Wir zeigen, dass u aus Lemma 2.39 eine Lösung 

der Variationsgleichung ist, die der behaupteten Stetigkeitsabschätzung genügt. 

Nach Lemma 2.39 gilt 

∫ T 

0 

(−u ′ (t), jv) H ϕ ′ (t) dt + 

∫ T 

0 

〈b(t), v〉 V ϕ(t) dt = 

∫ T 

0 

(f(t), jv) H ϕ(t) dt 

□ 

33

für alle ϕ ∈ C 1 ([0, T]) mit ϕ(0) = ϕ(T) = 0 und v ∈ V , wobei b wie in Lemma 

2.29 definiert ist. Dies zeigt nach Lemma 2.19 

so dass in der Tat u ∈ ˜W und 

u ′′ + b = j ∗ f in L 2 (0, T; V ′ ), 

〈u ′′ (t), v〉 + B(u, v, t) = (f(t), jv) H ∀ v ∈ V f.f.a t 

gilt. 

Für die Existenz bleibt zu zeigen, dass u ′ (0) = u 1 ist. Sei ϕ ∈ C 1 ([0, T]) mit 

ϕ(T) = 0, v ∈ V . Ähnlich wie im Beweis von Satz 2.20(ii) sieht man, dass 

(u ′ (t), jv) H ϕ(t) = (u ′ (s), jv) H ϕ(s) + 

∫ t 

s 

〈u ′′ (τ), v〉 V ϕ(τ) + (u ′ (τ), jv) H ϕ ′ (τ) dτ 

für fast alle 0 < s < t < T gilt. Die rechte Seite dieser Gleichung ist stetig in s 

und t. Da aber j ∗ u ′ ∈ W 1,2 (0, T; V ′ ) ⊂ C([0, T]; V ′ ) gilt, ist auch die linke Seite 

stetig in s und t. Die Gleichung gilt also für alle 0 ≤ s ≤ t ≤ T und insbesondere 

ist 

(u ′ (0), jv) H ϕ(0) = − 

= 

∫ T 

0 

∫ T 

0 

〈u ′′ (τ), v〉 V ϕ(τ) + (u ′ (τ), jv) H ϕ ′ (τ) dτ 

(B(u(τ), v, τ) − (f(τ), jv) H ) ϕ(τ) − (u ′ (τ), jv) H ϕ ′ (τ) dτ 

= (u 1 , jv) H ϕ(0) 

nach der Variationsgleichung und Lemma 2.39. Es folgt u ′ (0) = u 1 . 

Für die stetige Abhängigkeit von u 0 , u 1 und f bleibt nach Lemma 2.39 zu 

zeigen, dass 

‖u ′′ ‖ L 2 (0,T;V ′ ) ≤ C ( ) 

‖u 0 ‖ V + ‖u 1 ‖ H + ‖f‖ L 2 (0,T;H) 

gilt. Dies folgt aber ganz analog wie die Abschätzung für u ′ im parabolischen Fall 

aus der Variationsgleichung und den schon bewiesenen Abschätzungen. □ 

Wir kommen nun zur Eindeutigkeit. Die Schwierigkeit liegt hier bei den hyperbolischen 

Gleichungen darin, dass wir die Variationsgleichung nicht mit u ′ (t) 

testen dürfen, da dies zwar in H, womöglich aber nicht in V liegt. 

Lemma 2.40 Sei u eine Lösung der Variationsgleichung (2.17) mit u 0 = 0, 

u 1 = 0 und f = 0. Ist 

{∫ s 

u(τ) dτ, für 0 ≤ t ≤ s, 

v(t) := 

t 

0, für s ≤ t ≤ T, 

so liegt die Abbildung t ↦→ v(t) in W 1,2 (0, T; V ) für jedes s und es gilt 

( ∫ s 

) 

‖ju(s)‖ 2 H + ‖v(0)‖2 V ≤ C ‖jv(0)‖ 2 H + ‖v(t)‖ 2 V dt . 

34 

0

Beweis. Klar, dass v und v ′ in L 2 (0, T, V ) liegen mit 

{ 

v ′ −u(t), für 0 ≤ t ≤ s, 

(t) := 

0, für s ≤ t ≤ T. 

Aus der Variationsgleichung folgt 

∫ s 

0 

〈u ′′ (t), v(t)〉 V + B(u(t), v(t), t) dt = 0. 

Wegen u ′ (0) = 0 und v(s) = 0 ergibt sich daraus mit partieller Integration 

∫ s 

0 

(u ′ (t), ju(t)) H − B(v ′ (t), v(t), t) dt = 0, 

wobei wir v ′ (t) = −u(t) ausgenutzt haben. Unter Ausnutzung von d B(v(t), v(t), t) = 

dt 

2B(v ′ (t), v(t), t) + ∂B (v(t), v(t), t) ergibt Aufintegrieren 

∂t 

∫ s 

‖ju(s)‖ 2 H + B(v(0), v(0), 0) = −1 ∂B 

(v(t), v(t), t) dt 

2 ∂t 

und damit 

‖ju(s)‖ 2 H + c V ‖v(0)‖ 2 V ≤ c H ‖v(0)‖ 2 H + ˜C V 

2 

0 

∫ s 

0 

‖v(t)‖ 2 V dt. 

□ 

Beweis von Satz 2.36, Teil 2. Um den Beweis von Satz 2.36 abzuschließen, 

nehmen wir an, u sei eine Lösung der Variationsgleichung (2.17) mit u 0 = 0, 

u 1 = 0 und f = 0 und müssen zeigen, dass u = 0 ist. 

Setze 

w(t) := 

∫ t 

0 

u(τ) dτ. 

Nach Lemma 2.40 ist dann wegen v(t) = w(s) − w(t) für t ≤ s 

( ∫ s 

) 

‖ju(s)‖ 2 H + ‖w(s)‖ 2 V ≤ C ‖jw(s)‖ 2 H + ‖w(s) − w(t)‖ 2 V dt . 

Mit ‖jw(s)‖ H ≤ ∫ s 

‖ju(t)‖ 0 H ≤ T 1 2 

2‖w(t)‖ 2 V folgt daher 

‖ju(s)‖ 2 H + ‖w(s)‖2 V ≤ ˜C 

∫ s 

0 

0 

(∫ s )1 

0 ‖ju(t)‖2 2 

H und ‖w(s)−w(t)‖ 2 V ≤ 2‖w(s)‖2 V + 

‖w(t)‖ 2 V + ‖ju(t)‖2 H dt + ˜Cs‖w(s)‖ 2 V 

für eine Konstante ˜C = ˜C(T). Für s ≤ ˜T := 1 ist damit ˜C 

‖ju(s)‖ 2 H + ‖w(s)‖ 2 V ≤ 2 ˜C 

∫ s 

0 

2 

‖w(t)‖ 2 V + ‖ju(t)‖ 2 H dt 

und daher nach der Gronwallschen Ungleichung u ≡ 0 auf [0, ˜T]. Dieses Argument 

lässt sich nun für [ ˜T, 2 ˜T], [2 ˜T, 3 ˜T], . . . iterieren. 

□ 

35

Bemerkung 2.41 Unter geeigneten Voraussetzungen an die Koeffizienten von 

L und die Daten u 0 , u 1 und f und unter Kompatibilitätsannahmen an u 0 , u 1 und 

f lassen sich Regularitätsresultate für die Lösung von (2.15) beweisen, vgl. etwa 

[Ev]. 

2.4 Lineare hyperbolische Systeme erster Ordnung 

Im letzten Abschnitt des Kapitels betrachten wir Systeme von PDG der Form 

{ 

∂ t u + ∑ n 

j=1 B j ∂ j u = f in R n × (0, T], 

(2.20) 

u = 0 auf R n × {0}. 

Die gesuchte Funktion u ist hier die vektorielle Größe u : R n × [0, T] → R m . 

u 0 : R n → R m bezeichnet den gegebenen Startwert und f : R n × [0, T] → R m die 

rechte Seite. Die Koeffizienten sind gegeben durch n Matrix-wertige Abbildungen 

B j : R n × [0, T] → R m×m . 

Definition 2.42 Für x, ξ ∈ R n , t ≥ 0 setze 

B(x, t; ξ) := 

n∑ 

ξ j B j (x, t). 

j=1 

(i) Das System von PDG (2.20) heißt hyperbolisch, wenn B(x, t; ξ) diagonalisierbar 

ist für alle x, ξ ∈ R n , t ≥ 0. 

Ist (2.20) hyperbolisch, so bezeichnen wir mit 

λ k (x, t; ξ) bzw. r k (x, t; ξ), k = 1, . . .,m, 

die Eigenwerte und die zugehörigen Eigenvektoren von B(x, t; ξ). 

(ii) (2.20) heißt symmetrisches hyperbolisches System erster Ordnung, wenn die 

B j (x, t) symmetrisch sind für alle (x, t) und j. (Dann ist auch B(x, t; ξ) 

symmetrisch und insbesondere diagonalisierbar.) 

Beispiel: Es seien alle B j konstant und f ≡ 0. Spezielle Lösungen von (2.20) sind 

von der Form wandernder Wellen 

u(x, t) = v(ξ · x − ct), v : R → R m , ξ ∈ R n mit |ξ| = 1, c ∈ R. 

Ein solcher Ansatz beschreibt gerade Wellen mit Wellenprofil v, die sich mit 

Geschwindigkeit c in Richtung ξ ausbreiten. 

36

Einsetzen in (2.20) zeigt, dass u eine Lösung genau dann ist, wenn 

−cv ′ + ∑ j 

B j v ′ ξ j = 0 

gilt, d.h. wenn v ′ ein Eigenvektor von B(ξ) mit Eigenwert c ist. Ist das System hyperbolisch, 

erhalten wir für jedes ξ und jedes eindimensionale Profil φ ∈ C 1 (R; R) 

also m verschiedene wandernde Wellen 

(x, t) ↦→ φ(ξ · x − λ k (ξ)t)r k (ξ), 

k = 1, . . .,m. 

Wir werden der Einfachheit halber nur symmetrische Systeme betrachten. 

Durch Testen mit glatten Funktionen gelangt man wieder zum Begriff der schwachen 

Lösungen. Im Folgenden bezeichne (·, ·) das Skalarprodukt auf L 2 (R n ; R m ). 

Definition 2.43 Für beschränkte B j definieren wir durch 

∫ 

B(u, v, t) := 

R n j=1 

n∑ 

(B j (x, t) ∂ j u(x)) · v(x) dx 

eine Bilinearform B(·, ·, t) auf H 1 (R n ; R m ). 

u ∈ L 2 (0, T; H 1 (R n ; R m )) mit u ′ ∈ L 2 (0, T; L 2 (R n ; R m )) heißt schwache Lösung 

von (2.20), wenn 

{ 

(u ′ (t), v) + B(u(t), v, t) = (f(t), v) ∀ v ∈ L 2 (R n ; R m ) f.f.a. t ∈ [0, T], 

u(0) = u 0 . 

Beachte, dass die Bedingung u(0) = u 0 sinnvoll interpretiert werden kann. 

Ziel dieses Abschnitts ist der folgende Satz: 

Satz 2.44 Seien B j ∈ C 2 (R n × [0, T]; R m×m ) symmetrisch mit 

‖B j ‖ W 2,∞ (R n ×[0,T]) < ∞ für j = 1, . . ., n. 

Weiter sei u 0 ∈ H 1 (R n ; R m ), f ∈ H 1 (R n × (0, T); R m ). Dann gibt es genau eine 

schwache Lösung u von (2.20). u erfüllt die Abschätzungen 

( 

ess sup ‖u(t)‖L 2 (0,T;H 1 (R n ;R m )) + ‖u ′ (t)‖ L 2 (0,T;L 2 (R n ;R ))) 

m 

0≤t≤T 

≤ C ( ) 

‖u 0 ‖ H 1 (R n ;R m ) + ‖f‖ H 1 (R n ×(0,T);R m ) 

für ein C = C(T). 

37

Wir beweisen diesen Satz mit der vanishing viscosity-Methode: Dazu führen 

wir einen Extraterm ε∆u in die Gleichungen ein, die wir daraufhin mit schon 

bekannten Resultaten lösen können. Im Grenzfall ε → 0 hoffen wir dann, Lösungen 

des Ausgangsproblems zu finden. (Im anschließenden Kapitel 3 werden wir 

sehen, dass ∆u unter geeigneten Voraussetzungen tatsächlich als physikalische 

Viskosität interpretiert werden kann.) Beachte, dass, obwohl ε klein ist, die PDG 

durch den Term ε∆u erheblich beeinflusst wird, da wir mit einem Term höherer 

Ordnung (hier zweite Ableitungen) stören. Man spricht auch von einer singulären 

Störung. 

Satz 2.45 Für jedes ε > 0 gibt es eine eindeutige (schwache) Lösung u ε ∈ 

L 2 (0, T; H 1 (R n , R m )) mit u ′ ε ∈ L 2 (0, T; L 2 (R n , R m )) von 

{ 

∂ t u ε − ε∆u ε + ∑ j B j ∂ j u ε = f in R n × (0, T), 

(2.21) 

u ε (·, 0) = u 0ε := η ε ∗ u 0 auf R n × {0}, 

η ε der skalierte Standard-Glättungskern. Es gilt 

u ε ∈ L 2 (0, T; H 3 (R n )), ∂ t u ε ∈ L 2 (0, T; H 1 (R n )). 

(Es ist klar, wie schwache Lösungen hier zu verstehen sind.) 

Da wir im vorigen Abschnitt die Regularitätsresultate für parabolische Gleichungen 

zwar angesprochen, aber nicht bewiesen haben, beweisen wir zunächst 

das folgende Lemma. Beachte, dass die Existenz einer eindeutigen (schwachen) 

Lösung des folgenden Evolutionsproblems direkt aus Satz 2.23 folgt.) 

Lemma 2.46 Sei v 0 ∈ H 1 (R n ), g ∈ L 2 (R n × (0, T)) sowie v = v ε die eindeutige 

schwache Lösung von 

{ 

∂ t v − ε∆v = g in R n × (0, T), 

v(·, 0) = v 0 auf R n × {0}. 

Es gilt v ∈ L 2 (0, T; H 2 (R n )), ∂ t v ∈ L 2 (0, T; L 2 (R n )), und es gibt eine nur von T 

abhängende Konstante C, so dass gilt 

( 

ess sup ‖v(t)‖ 2 H 1 (R n ) ≤ C ‖v 0 ‖ 2 H + 1 ∫ t 

) 

‖g(s)‖ 2 1 L 

t∈[0,T] 

ε 

ds . 2 

Liegt v 0 in H 2 (R n ) und g in L 2 (0, T; H 1 (R n )), so gilt 

v ∈ L 2 (0, T; H 3 (R n )), ∂ t v ∈ L 2 (0, T; H 1 (R n )). 

Ist sogar v 0 ∈ H 3 (R n ) und g ∈ L 2 (0, T; H 2 (R n )) mit g ′ ∈ L 2 (0, T; L 2 (R n )), so gilt 

∂ t v ∈ L 2 (0, T; H 2 (R n )), ∂ 2 t v ∈ L2 (0, T; L 2 (R n )). 

0 

38

Beweis. Es sei zunächst v 0 ∈ Cc ∞ (R n ), g ∈ Cc ∞ (R n × [0, T)). Dann gibt es eine 

klassische Lösung v des Problems definiert durch 

∫ 

∫ t 

∫ 

v(ε 1 2 x, t) = Φ(x − y, t)v 0 (ε −1 2 y) dy + Φ(x − y, t − s)g(ε −1 2 y, s) dy ds, 

R n 0 R n 

wobei Φ(x, t) = (4πt) − n 2 e − x2 

4t die Fundamentallösung der Wärmeleitungsgleichung 

ist (vgl. Skript PDG 1, Korollar 2.26). Es ist nicht schwer zu sehen, dass v 

mit allen Ableitungen exponentiell schnell gegen 0 konvergiert für |x| → ∞. (Das 

ergibt sich wie im Skript PDG 1, da ∂ α v unter dem Integral differenziert werden 

darf und ∂t k v = ε k ∆ k v ist.) 

Wir dürfen also mit v und ∂ t v testen. Es folgt (teste mit v) 

so dass 

d 

dt 

∫ ∫ 

v 2 dx ≤ ∂ t (v 2 ) + 2ε|∇v| 2 dx = 2 

R n R∫ 

n ∫ ∫ 

∫ 

v ∂ t v − εv ∆v dx 

R n 

= 2 v g dx ≤ 

R n v 2 dx + 

R n g 2 dx, 

R n 

∫ t 

∫ t 

‖v(t)‖ 2 L ≤ ‖v 0‖ 2 2 L + ‖g(s)‖ 2 2 L ds + ‖v(s)‖ 2 2 L ds. 2 

Nach der Gronwallschen Ungleichung erhalten wir daraus 

( ∫ t 

) 

‖v(t)‖ 2 L ≤ C ‖v 2 0 ‖ 2 L + ‖g(s)‖ 2 2 L ds . 2 

0 

Testen mit ∂ t v ergibt 

∫ 

2(∂ t v) 2 + ε d ∫ ∫ 

|∇v| 2 dx ≤ 2(∂ t v) 2 + 2ε∇v · ∂ t ∇v dx 

R dt 

n R n R∫ 

n ∫ 

= 2 ∂ t v (∂ t v − ε∆v) dx = 2 ∂ t v g dx 

∫ 

R n ∫ 

R n 

≤ (∂ t v) 2 dx + g 2 dx, 

R n R n 

so dass 

‖∇v(t)‖ 2 L ≤ ‖∇v 0‖ 2 2 L + 1 ‖g(s)‖ 2 2 L 

ε 

ds 2 0 

gilt. Beachte, dass die letzte Abschätzung dann auch 

∫ T 

( 

‖∂ t v(t)‖ 2 L ≤ C ‖∇v 2 0 ‖ 2 L + 1 ∫ T 

) 

‖g(s)‖ 2 2 L 

ε 

ds 2 

0 

zeigt. Zusammengefasst haben wir 

‖v(t)‖ 2 L ∞ (0,T;H 1 (R n )) + ‖∂ tv‖ 2 L 2 (0,T;L 2 (R n )) ≤ C (‖v 0 ‖ 2 H 1 + 1 ε ‖g‖2 L 2 (R n ×(0,T)) 

0 

∫ t 

0 

0 

) 

39

ewiesen. 

Für allgemeine v 0 und g approximiere nun v 0k → v 0 in H 1 bzw. g k → g 

in L 2 mit k → ∞. Nach den gerade gezeigten Ungleichungen konvergieren die 

entsprechenden Lösungen dann (nach Übergang zu einer Teilfolge) gegen eine 

Lösung mit Startbedingung v 0 und rechter Seite g, die ebenfalls der zu zeigenden 

Abschätzung genügt. Beachte, dass wegen ε∆v k = −g k + ∂ t v k auch 

∑ 

∫ 

(∂ ij v k ) 2 = − 

∑ ∫ 

∂ i v k ∂ ijj v k = ∑ ∫ ∫ 

∂ ii v k ∂ jj v k = (∆v k ) 2 

R n R n R n R n 

1≤i,j≤n 

1≤i,j≤n 

1≤i,j≤n 

beschränkt in L 2 (0, T) ist, so dass tatsächlich v k ⇀ v in L 2 (0, T; H 2 (R n )) konvergiert. 

Ist nun v 0 ∈ H 2 , g ∈ L 2 (0, T; H 1 ), so erhalten wir – zunächst für glatte v 0 und 

g –, dass ∂ i v der Gleichung 

{ 

∂ t (∂ i v) − ε∆(∂ i v) = ∂ i g in R n × (0, T), 

(∂ i v)(·, 0) = ∂ i v 0 auf R n × {0} 

genügt. Wie eben folgt durch Approximation dann ∂ i v ∈ L 2 (0, T; H 2 (R n )), ∂ t (∂ i v) ∈ 

L 2 (0, T; L 2 (R n )), also v ∈ L 2 (0, T; H 3 (R n )), ∂ t v ∈ L 2 (0, T; H 1 (R n )). 

Falls sogar v 0 ∈ H 3 (R n ) und g ∈ L 2 (0, T; H 2 (R n )) mit g ′ ∈ L 2 (0, T; L 2 (R n )) 

gilt, so zeigt ein ähnliches Argument, dass ∆v ∈ L 2 (0, T; H 2 (R n )), ∂ t (∆v) ∈ 

L 2 (0, T; L 2 (R n )) und damit ∂ t v = g − ε∆v ∈ L 2 (0, T; H 2 (R n )) und ∂t 2v = ∂ t(g − 

ε∆v) ∈ L 2 (0, T; L 2 (R n )) gilt. 

□ 

Beweis von Satz 2.45. Setze X = L ∞ (0, T; H 1 (R n , R m )). Für jedes v ∈ X gibt 

es nach Lemma 2.46 eine Lösung F(v) := u ∈ X des Problems 

{ 

∂ t u − ε∆u = − ∑ j B j ∂ j v + f in R n × (0, T), 

so dass 

u(·, 0) = u 0ε := η ε ∗ u 0 auf R n × {0}, 

‖F(v 1 ) − F(v 2 )‖ 2 X = ‖F(v 1 − v 2 )‖ 2 X 

≤ C ε 

∫ T 

ist, da u := F(v 1 ) − F(v 2 ) die Gleichung 

{ 

∂ t u − ε∆u = − ∑ j B j ∂ j (v 1 − v 2 ) 

0 

‖∇(v 1 − v 2 )‖ 2 CT 

L2 dt ≤ 

ε ‖v 1 − v 2 ‖ 2 X 

in R n × (0, T), 

u(·, 0) = 0 auf R n × {0} 

löst. Ist also T ≤ ˜T mit ˜T = ε , so ist F eine Kontraktion auf X. Aus dem 

2C 

Banachschen Fixpunktsatz folgt dann, dass F einen Fixpunkt u ε hat. 

40

Für allgemeines T > ˜T zerlegen wir das Intervall [0, T] = [0, ˜T] ∪ [ ˜T, 2 ˜T] ∪ 

. . . ∪ [⌊ T˜T ⌋ ˜T, T] und iterieren das Argument auf den einzelnen Intervallen. 

Mit u ε ∈ X schließlich ist ∑ j B j∂ j u ε ∈ L 2 (R n × (0, T)), so dass nach Lemma 

2.46 u ε ∈ L 2 (0, T; H 2 (R n )) gilt. Dann aber ist sogar ∑ j B j∂ j u ε ∈ L 2 (0, T; H 1 (R n )) 

und aus Lemma 2.46 ergibt sich u ε ∈ L 2 (0, T; H 3 (R n )), u ′ ε ∈ L2 (0, T; H 1 (R n )). □ 

Um gleich zum Limes ε → 0 verschwindender Viskosität übergehen zu können, 

müssen wir zunächst wieder ‘a priori-Abschätzungen’ an die approximativen 

Lösungen beweisen. 

Satz 2.47 Sei u ε die Lösung von (2.21) aus Satz 2.45. Es existiert eine von ε 

unabhängige Konstante C, so dass 

( 

‖uε (t)‖ H 1 (R n ) + ‖u ′ ε (t)‖ ) ( ) 

L 2 (R n ) ≤ C ‖u0 ‖ H 1 (R n ) + ‖f‖ H 1 (R n ×(0,T)) . 

max 

0≤t≤T 

Beweis. Es gilt 

( 

d ( ) 

‖uε (t)‖ 2 L = 

dt 

2 2(uε (t), u ′ ε (t)) = 2 u ε (t), f(t) + ε∆u ε (t) − ∑ j 

B j (t)∂ j u ε (t) 

) 

für fast alle t, wobei 2|(u ε (t), f(t))| ≤ ‖u ε (t)‖ 2 L 

+‖f(t)‖ 2 2 L 

ist, 2(u 2 ε (t), ε∆u ε (t)) = 

−ε‖∇u ε (t)‖ L 2 ≤ 0 sowie 2|(u ε (t), ∑ j B j(t)∂ j u ε (t))| ≤ C‖u ε (t)‖ 2 L 

. Hierbei ergibt 

2 

sich die letzte Abschätzung aus 

( 

v, ∑ ) 

B j ∂ j v = ∑ ∫ 

(B j ∂ j v) · v = ∑ ∫ 

1( (Bj ∂ j v) · v + (∂ j v) · (B j v) ) 

j 

j R n j R 2 n 

= 1 ∑ 

∫ 

( 

∂ j (Bj v) · v ) − 1 ∑ 

∫ ( ) ∂Bj 

v · v 

2 R 2 

n R ∂x n j 

j 

mit ∫ R n ∂ j ((B j v) · v) = 0 für v ∈ C ∞ c (Rn ; R n ) und Approximation. (Beachte, dass 

wir hier auch B j = B T j ausgenutzt haben.) 

Damit ist aber 

∫ t 

∫ t 

‖u ε (t)‖ 2 L ≤ ‖u 0ε‖ 2 2 L + ‖f(s)‖ 2 2 L ds + C ‖u 2 ε (s)‖ 2 L ds. 2 

Die Gronwallsche Ungleichung ergibt nun 

‖u ε (t)‖ 2 L 2 ≤ C ( 

wobei ‖u 0ε ‖ L 2 ≤ ‖u 0 ‖ L 2 ist. 

0 

‖u 0ε ‖ 2 L 2 + ∫ t 

0 

j 

0 

‖f(s)‖ 2 L 2 ds ) 

, 

41

Die nächste Abschätzung erhalten wir durch Differentiation der Gleichung 

(2.21) nach x k : 

{ 

∂ t (∂ k u ε ) − ε∆(∂ k u ε ) + ∑ j B j∂ j (∂ k u ε ) = ∂ k f − ∑ j (∂ kB j )∂ j u ε in R n × (0, T), 

∂ k u ε (·, 0) = ∂ k u 0ε := η ε ∗ ∂ k u 0 auf R n × {0}, 

(Beachte, dass u ε ∈ L 2 (0, T; H 3 (R n )), ∂ t u ε ∈ L 2 (0, T; H 1 (R n )) und insbesondere 

u ε ∈ C([0, T]; H 1 (R n )) gilt.) Das gleiche Argument wie eben liefert nun 

( ∫ t 

∫ t 

) 

‖∂ k u ε (t)‖ 2 L ≤ C ‖∂ 2 k u 0ε ‖ 2 L + ‖∂ 2 k f(s)‖ 2 L ds + ‖∇u 2 ε (t)‖ 2 L ds . 2 

0 

(Die linke Seite der PDG für ∂ k u ε ist wie die linke Seite der PDG für u ε , nur die 

Daten ändern sich: Aus der rechten Seite f wird ∂ k f − ∑ j (∂ kB j )∂ j u ε und aus 

der Anfangsbedingung u 0ε wird ∂ k u 0ε .) Summation über k und eine abermalige 

Anwendung der Gronwallschen Ungleichung ergibt 

‖∇u ε (t)‖ 2 L 2 ≤ C ( 

‖∇u 0ε ‖ 2 L 2 + ∫ t 

0 

0 

‖∇f(s)‖ 2 L 2 ds ) 

. 

wobei ‖∇u 0ε ‖ L 2 ≤ ‖∇u 0 ‖ L 2 ist. 

Um schließlich ∂ t u ε abzuschätzen, nehmen wir zunächst an, dass f glatt ist, 

so dass nach Satz 2.45 für g = f − ∑ j B j∂ j u ε gilt g ∈ L 2 (0, T; H 2 (R n )) und g ′ ∈ 

L 2 (0, T; L 2 (R n )). Nach (2.21) und Lemma 2.46 ist dann ∂ t u ε ∈ L 2 (0, T; H 2 (R n )) 

und ∂t 2 u ε ∈ L 2 (0, T; L 2 (R n )) und wir dürfen (2.21) nach t differenzieren: 

{ 

∂ t (∂ t u ε ) − ε∆(∂ t u ε ) + ∑ j B j∂ j (∂ t u ε ) = ∂ t f − ∑ j (∂ tB j )∂ j u ε in R n × (0, T), 

∂ t u ε (·, 0) = ε∆u 0ε − ∑ j B j(0)∂ j u 0ε + f(0) auf R n × {0}. 

(Beachte, dass ∂ t u ε , ∆u ε , ∑ j B j∂ j u ε , f ∈ C([0, T]; L 2 (R n )).) Wie zuvor erhalten 

wir daraus 

(∥ ∥∥∥∥ 

‖∂ t u ε (t)‖ 2 L ≤ C ε∆u 2 0ε − ∑ 2 

B j (0)∂ j u 0ε + f(0) 

∥ 

j 

L 

∫ 2 

t 

∫ ) 

t 

+ ‖∂ t f(s)‖ 2 L ds + ‖∇u 2 ε (t)‖ 2 L ds 2 

≤ C 

( 

0 

ε 2 ‖∆u 0ε ‖ 2 L 2 + ‖∇u 0ε‖ 2 L 2 + ‖f(0)‖2 L 2 

+ 

∫ t 

nach den schon gezeigten Abschätzungen für ∇u ε . 

0 

∫ ) 

t 

‖∂ t f(s)‖ 2 L ds + ‖f(s)‖ 2 2 L ds 2 

42 

0 

0

Nun ist ‖∆u 0ε ‖ 2 L 

= ‖ ∑ 2 j (∂ jη ε ) ∗ ∂ j u 0 ‖ 2 L 

≤ C ‖∇u 2 ε 2 0 ‖ 2 L 

und ‖f(0)‖ 2 2 L 

≤ 2 

C‖f‖ 2 H 1 (R n ×(0,T)) 

nach dem Spursatz. Es folgt 

( ∫ t 

) 

‖∂ t u ε (t)‖ 2 L ≤ C ‖∇u 2 0 ‖ 2 L + ‖∂ 2 t f(s)‖ 2 L + 2 ‖f(s)‖2 L ds . 2 

Zusammen mit den schon gezeigten Abschätzungen ergibt sich die Behauptung. 

□ 

Wir können nun das Hauptergebnis dieses Abschnitts über die Existenz und 

Eindeutigkeit schwacher Lösungen von symmetrischen hyperbolischen Systemen 

beweisen. 

Beweis von Satz 2.44. Sei u ε die Lösung von (2.21) aus Satz 2.45. Nach Satz 

2.47 existiert u ∈ L 2 (0, T, H 1 (R n ; R m )) mit u ′ ∈ L 2 (0, T, L 2 (R n ; R m )), so dass 

(für eine Teilfolge) 

u ε ⇀ u in L 2 (0, T, H 1 (R n ; R m )) und u ′ ε ⇀ u ′ in L 2 (0, T, L 2 (R n ; R m )). 

Nach Satz 2.47 erfüllt dann u die Abschätzung 

( ) ( ) 

ess sup ‖u(t)‖H 1 (R n ) + ‖u ′ (t)‖ L 2 (R n ) ≤ C ‖u0 ‖ H 1 (R n ) + ‖f‖ H 1 (R n ×(0,T)) , 

0≤t≤T 

denn die Menge der Funktionen, die dieser Abschätzung genügen, ist konvex und 

abgeschlossen bezüglich starker Konvergenz. 

Sei nun ϕ ∈ C 1 ([0, T]) mit ϕ(T) = 0, v ∈ H 1 (R n ; R m ). Dann ist 

∫ T 

0 

∫ T 

= 

0 

n∑ 

(u ′ ε (t), v)ϕ(t) + ε (∂ i u ε (t), ∂ i v)ϕ(t) + B(u ε (t), v, t)ϕ(t) dt 

0 

(f(t), v)ϕ(t) dt. 

Partielle Integration liefert nun 

− 

= 

∫ T 

0 

∫ T 

0 

(u ε (t), v)ϕ ′ (t) + ε 

i=1 

n∑ 

(∂ i u ε (t), ∂ i v)ϕ(t) + B(u ε (t), v, t)ϕ(t) dt 

i=1 

(f(t), v)ϕ(t) dt + (u ε0 , v)ϕ(0). 

Im Limes ε → 0 ergibt sich aus den beiden letzten Gleichungen 

bzw. 

− 

∫ T 

0 

∫ T 

0 

(u ′ (t), v)ϕ(t) + B(u(t), v, t)ϕ(t) dt = 

(u(t), v)ϕ ′ (t) + B(u(t), v, t)ϕ(t) dt = 

∫ T 

0 

∫ T 

0 

(f(t), v)ϕ(t) dt. (2.22) 

(f(t), v)ϕ(t) dt + (u 0 , v)ϕ(0). 

43

Integriert man ∫ T 

0 (u′ (t), v)ϕ(t) dt in (2.22) partiell, so zeigt ein Vergleich dieser 

beiden Gleichungen, dass in der Tat u(0) = u 0 ist. Des Weiteren erhalten wir aus 

(2.22) 

(u ′ (t), v) + B(u(t), v, t) = (f(t), v) (2.23) 

für fast alle t. Es gibt also eine Nullmenge N ⊂ [0, T], so dass (2.23) für alle 

t /∈ N und alle v aus einer abzählbaren dichten Teilmenge von H 1 (R n ; R m ) gilt. 

Aus Stetigkeitsgünden gilt dann (2.23) sogar für alle v ∈ H 1 (R n ; R m ) und t ∈ 

[0, T] \ N. 

Es bleibt, die Eindeutigkeit der Lösung zu begründen. Die Differenz u zweier 

Lösungen ist eine Lösung zu den Daten u 0 = 0 und f = 0, so dass inbesondere 

(u ′ (t), u(t)) + B(u(t), u(t), t) = 0 f.f.a. t ∈ [0, T] 

gilt. Wie im Beweis von Satz 2.47 folgt daraus 

1 d 

2 dt ‖u(t)‖ L 2 ≤ C‖u(t)‖ L 2 

fast überall, so dass nach der Gronwallschen Ungleichung u = 0 ist fast überall. 

□ 

44

Kapitel 3 

Die Navier-Stokes-Gleichungen 

Dieses Kapitel lässt noch etwas auf sich warten. Sie finden jedoch, was in dieser 

VL über Navier-Stokes-Gleichungen besprochen wurde im Wesentlichen in [Te, 

Kap. 3, §2 und §4]. 

45

Kapitel 4 

Distributionen 

Distributionen sind ‘verallgemeinerte Funktionen’. Während wir bisher Funktionen 

und ihre Ableitungen untersucht haben, werden wir den Gegenstand unserer 

Untersuchungen nun wesentlich verallgemeinern. Schon in der Theorie der Sobolevräume 

(vgl. Skript PDG 1) haben wir gesehen, dass es von großem Nutzen sein 

kann, auch nicht-glatte Funktionen in einem verallgemeinerten Sinne zu differenzieren. 

So ist etwa im schwachen Sinne f : R → R, f(x) = |x|, differenzierbar 

mit 

{ 

f ′ −1, x < 0, 

(x) := 

1, x > 0. 

f ′′ ist nun jedoch noch nicht einmal im schwachen Sinne mehr definiert: Es kann 

keine L 1 ′′ 

loc-Funktion g geben, so dass f = g ist, denn g müsste gleich 0 auf 

(−∞, 0) und auf (0, ∞) sein, somit g = 0 fast überall. f ′ ist aber nicht konstant. 

Um auch solche Funktionen noch differenzieren zu können, müssen wir die 

Klasse der Funktionen geeignet verallgemeinern: Wir werden die Menge der Distributionen 

D einführen, deren Elemente wir als ‘verallgemeinerte Funktionen’ 

verstehen. Es wird sich herausstellen, dass f ′′ tatsächlich sinnvoll zu definieren 

ist, allerdings nicht als Funktion auf R. 

Die wohl wichtigste Eigenschaft einer Distribution ist, dass sie unendlich oft 

differenzierbar ist. Aber auch andere auf Funktionen definierte Operationen haben 

eine natürliche Entsprechung auf den verallgemeinerten Funktionen, die wir 

im Folgenden untersuchen werden. 

4.1 Definition und grundlegende Eigenschaften 

Ausgangspunkt für die Definition einer verallgemeinerten Funktion auf Ω ⊂ R n 

(offen) ist die Beobachtung, dass f ∈ L 1 loc (Ω) durch die Werte 

∫ 

fϕ, ϕ ∈ D(Ω) := Cc ∞ (Ω) 

Ω 

46

eindeutig festgelegt wird. (In der Distributionentheorie wird der Raum der Testfunktionen 

Cc ∞ (Ω) meist mit D(Ω) bezeichnet.) 

Beachte, dass ϕ ↦→ ∫ fϕ eine lineare Abbildung von D(Ω) in den Skalarenkörper 

K (K = R oder C) ist. Wir definieren nun die Menge der Distributionen 

als die Menge der linearen Abbildungen, die einer (sehr milden) Stetigkeitsbedingung 

genügen. 

Definition 4.1 Sei Ω ⊂ R n offen. Eine Distribution auf Ω ist eine lineare Abbildung 

T : D(Ω) → K, so dass gilt: Für jede kompakte Teilmenge K von Ω 

existieren C K > 0 und N K ∈ N 0 , so dass 

∑ 

|Tϕ| ≤ C K ‖∂ α ϕ‖ L ∞ (K) ∀ϕ ∈ D(Ω) mit supp ϕ ⊂ K 

|α|≤N K 

gilt. (Gibt es ein kleinstes N K , welches für alle Kompakta in Ω funktioniert, so 

heißt N K die Ordnung von T.) Die Menge der Distributionen auf Ω wird mit 

D ′ (Ω) bezeichnet. 

Beispiele: 

1. Jede L 1 loc -Funktion f induziert eine Distribution T f gemäß T f ϕ := ∫ Ω fϕ. 

Die Linearität dieser Abbildung ist klar. Außerdem gilt 

|Tϕ| ≤ ‖f‖ L 1 (K)‖ϕ‖ L ∞ (K) 

für alle ϕ ∈ D(Ω) mit supp ϕ ⊂ K. Insbesondere ist T f von nullter Ordnung. 

Wir werden in Zukunft einfach f statt T f schreiben. 

2. Jedes Borelmaß µ mit |µ|(K) < ∞ für kompakte K ⊂ Ω ist eine Distribution 

nullter Ordnung gemäß ϕ ↦→ ∫ ϕ dµ, denn 

(Dies verallgemeinert 1.) 

|Tϕ| ≤ |µ|(K)‖ϕ‖ L ∞ (K). 

3. Ist x ∈ Ω, so definiert T : D(Ω) → K, Tϕ := ϕ(x) eine Distribution. Dies ist 

in der Tat gerade T = δ x , wobei δ x das Diracmaß im Punkte x bezeichnet: 

{ 

1, x ∈ A, 

δ x (A) = 

0, x /∈ A. 

Nach 2. ist δ x ∈ D ′ (Ω). Speziell für x = 0 schreibt man auch oft einfach δ 

statt δ 0 . 

4. Ist Ω = (0, 1) ⊂ R, T : D(Ω) → K definiert durch Tϕ = ∑ ∞ d k ϕ 

k=2 

ist T ∈ D ′ (Ω). T ist jedoch nicht von endlicher Ordnung. 

47 

dx k ( 1 k 

), so

Definition 4.2 Es seien ϕ, ϕ 1 , ϕ 2 , . . . ∈ D(Ω). Wir sagen (ϕ k ) konvergiert in D(Ω) 

gegen ϕ, wenn es ein Kompaktum K ⊂ Ω gibt, so dass supp ϕ k ⊂ K gilt für alle 

k ∈ N und ∂ α ϕ k → ∂ α ϕ gleichmäßig auf Ω konvergiert für jeden Multiindex α. 

Beachte: Dies definiert eine äußerst starke Konvergenz auf D. Eine Folge konvergiert 

nur dann, wenn es ein Kompaktum gibt, außerhalb dessen alle Funktionen 

verschwinden, und wenn alle Ableitungen gleichmäßig konvergieren. 

Satz 4.3 Eine lineare Abbildung T : D(Ω) → K ist genau dann eine Distribution, 

wenn gilt 

ϕ k → ϕ in D(Ω) =⇒ Tϕ k → Tϕ in K. 

Da die Konvergenz in D(Ω) sehr stark ist, zeigt dieser Satz, dass die Stetigkeitsbedingung 

für Distributionen eine sehr schwache Bedingung ist. 

Beweis. Sei T ∈ D ′ (Ω), ϕ k → ϕ in D(Ω). Nach Definition existiert ein Kompaktum 

K ⊂ Ω, so dass supp ϕ k ⊂ K ist für alle k und ∂ α ϕ k → ∂ α ϕ gleichmäßig auf 

Ω konvergiert für jedes α. Dann aber ist auch supp ϕ ⊂ K und 

∑ 

|Tϕ k − Tϕ| ≤ C K 

|α|≤N K 

‖∂ α (ϕ k − ϕ)‖ L ∞ (K) → 0. 

Ist nun umgekehrt T /∈ D ′ (Ω), so gibt es ein Kompaktum K ⊂ Ω, so dass zu 

jedem k ∈ N eine Testfunktion ϕ k ∈ D(Ω) mit supp ϕ k ⊂ K und 

|Tϕ k | ≥ k ∑ 

‖∂ α ϕ k ‖ L ∞ 

|α|≤k 

existiert. Nach Multiplikation mit einem geeignetem Skalar können wir o.B.d.A. 

|Tϕ k | = 1 für alle k annehmen. Dann aber folgt ∂ α ϕ k → 0 gleichmäßig für jedes 

α und damit ϕ k → 0 in D(Ω). Wegen |Tϕ k | = 1 für alle k gilt jedoch nicht 

Tϕ k → 0 = T0. 

□ 

Definition 4.4 Wir sagen eine Folge von Distributionen T n konvergiert in D ′ (Ω) 

gegen eine Distribution T, wenn T n ϕ → Tϕ in K konvergiert für alle ϕ ∈ D(Ω). 

Beispiel: Ist η ε , ε > 0, der skalierte Standardglättungskern, so gilt η ε → δ in 

D ′ (R n ) mit ε → 0. (Beachte η ε (ϕ) = ∫ η ε (x)ϕ(x) dx = η ε ∗ ϕ(0) → ϕ(0) für 

ϕ ∈ D(R n ).) 

Um die Definition der Ableitung einer Distribution zu motivieren, überlegen 

wir zunächst, wie die Ableitung ∂ α einer (schwach) differenzierbaren Funktion 

f : Ω → K als Distribution wirkt: Für alle ϕ ∈ D(Ω) ist 

∫ 

∫ 

∂ α f ϕ = (−1) |α| f ∂ α ϕ. 

Wir definieren daher: 

Ω 

48 

Ω

Definition 4.5 Ist T ∈ D ′ (Ω), α ein Multiindex, so wird durch 

∂ α T(ϕ) := (−1) |α| T(∂ α ϕ) 

∀ ϕ ∈ D(Ω) 

eine Distribution ∂ α T definiert. 

Beachte, dass ϕ k → ϕ in D(Ω) impliziert ∂ α ϕ k → ∂ α ϕ in D(Ω), so dass die 

Ableitung ∂ α T tatsächlich wohldefiniert ist. Ist u ∈ C m (Ω) oder u ∈ W m,1 

loc (Ω), 

|α| = m, so ist die distributionelle Ableitung offenbar gerade die klassische bzw. 

schwache Ableitung von u. 

Beispiele: 

1. Die Heavysidefunktion H : R → R, 

H(x) = 

{ 

1, x > 0, 

0, x < 0, 

ist lokal integrierbar und also eine Distribution auf R. Für Testfunktionen 

ϕ ist 

∫ 

∫ ∞ 

H ′ (ϕ) = − H(x)ϕ ′ (x) dx = − ϕ ′ (x) dx = ϕ(0) = δ(ϕ). 

R 

Dies zeigt H ′ = δ. 

2. Die Ableitungen der Deltadistribution sind gerade die Auswertungsfunktionale 

der Ableitungen: Für Testfunktionen ϕ ist 

∂ α δ(ϕ) = (−1) |α| δ(∂ α ϕ) = (−1) |α| ∂ α ϕ(0). 

3. Sei T = log | · |. Dann ist T ∈ L 1 loc (R) und also eine Distribution. Der 

kanonische Kandidat für die Ableitung ist x ↦→ 1 . Dies ist jedoch nicht lokal 

x 

integrierbar und somit nicht offensichtlich als Distribution zu interpretieren. 

Andererseits muss die distributionelle Ableitung ja existieren. Was also ist 

T ′ 

Sei ϕ ∈ D(R). Partielle Integration liefert 

∫ 

T ′ (ϕ) = −T(ϕ ′ ) = − log |x| ϕ ′ (x) dx 

R 

∫ 

∫ 

= − log |x| ϕ ′ (x) dx + log ε ϕ(ε) − log ε ϕ(−ε) + 

{|x|≤ε} 

0 

{|x|>ε} 

ϕ(x) 

x dx 

für ε > 0. Nun ist ∫ {|x|≤ε} log |x| ϕ′ (x) dx → 0 wegen log | · | ∈ L 1 loc und 

log ε (ϕ(ε) − ϕ(−ε)) = 2ε log ε ϕ(ε)−ϕ(−ε) 

2ε 

T ′ ϕ(x) 

(ϕ) = lim 

εց0 

∫{|x|>ε} x dx. 

→ 0 · ϕ ′ (0) = 0 für ε → 0. Es folgt 

49

Man schreibt T ′ = HW 1 x und nennt HW 1 x den Hauptwert1 von 1 x . 

Definition 4.6 Es sei U ⊂ Ω offen. 

(i) Sind S, T ∈ D ′ (Ω), so ist S = T auf U, wenn Sϕ = Tϕ gilt für alle ϕ ∈ 

D(Ω) mit supp ϕ ⊂ U. 

(ii) Der Träger einer Distribution T ∈ D ′ (Ω) ist definiert als 

supp T := Ω \ ⋃ {U ⊂ Ω : U ist offen und T = 0 auf U}. 

Es ist nicht schwer zu zeigen, dass T = S auf einer offenen Menge U ⊂ Ω 

genau dann gilt, wenn es zu jedem x ∈ U eine Umgebung U(x) gibt, so dass 

T = S auf U(x) ist. Dies impliziert insbesondere, dass supp T = Ω \U gilt, wobei 

U die größte offene Menge ist, auf der T = 0 gilt. 

Beispiel: supp δ = {0}. 

Setze E ′ (Ω) := {T ∈ D ′ (Ω) : supp T ist kompakt}. Ist T ∈ E ′ (Ω), wähle 

ψ ∈ D(Ω) mit ψ ≡ 1 auf einer Umgebung von supp T. Dann ist Tϕ = T(ψϕ) für 

alle ϕ ∈ D(Ω) und somit 

∑ 

|Tϕ| ≤ C K ‖∂ α (ψϕ)‖ L ∞ (K) 

|α|≤N K 

für K = supp ψ. Mit Hilfe der Leibniz-Regel folgt nun 

|Tϕ| ≤ C ∑ 

|α|≤N K 

‖∂ α ϕ‖ L ∞ (K); 

T ist also von endlicher Ordnung. 

Gemäß ϕ ↦→ T(ψϕ) können wir T zu einer Abbildung T : E(Ω) := C ∞ (Ω) → 

K fortsetzen. Diese Fortsetzung ist unabhängig von der speziellen Wahl von ψ. 

Unter der Bedingung, dass 

Tϕ = 0 für alle ϕ ∈ E(Ω) mit supp ϕ ∩ supp T = ∅ 

gilt, ist die Fortsetzung sogar eindeutig, denn ist ˜T eine weitere Fortsetzung, die 

dieser Bedingung genügt, so gilt 

˜Tϕ = ˜T(ψϕ) + ˜T((1 − ψ)ϕ) = ˜T(ψϕ) = T(ψϕ) = Tϕ ∀ϕ ∈ E(Ω). 

Die Menge der Distributionen ist zwar offensichtlich ein Vektorraum, das Produkt 

zweier Distributionen kann jedoch im Allgemeinen nicht sinnvoll definiert 

werden. Die Multiplikation einer Distribution mit einer glatten Funktion ist aber 

1 englisch: PV 1 x der principal value of 1 x 

50

möglich. Zur Motivation betrachten wir wieder f ∈ L 1 loc (Ω). Ist ψ ∈ C∞ (Ω), so 

gilt 

∫ ∫ 

(ψf)ϕ = f(ψϕ) ∀ ϕ ∈ D(Ω). 

Wir definieren daher 

Ω Ω 

Definition 4.7 Ist ψ ∈ C ∞ (Ω), T ∈ D ′ (Ω), so wird durch 

(ψT)(ϕ) = T(ψϕ) 

∀ ϕ ∈ D(Ω) 

eine Distribution ψT ∈ D ′ (Ω) definiert. 

Beachte, dass dies wohldefiniert ist: Mit der Leibniz-Regel sieht man, dass 

ϕ k → ϕ in D(Ω) ψϕ k → ψϕ in D(Ω) impliziert. 

Lemma 4.8 (Produktregel) Ist ψ ∈ C ∞ (Ω), T ∈ D ′ (Ω), so ist 

Beweis. Für ϕ ∈ D(Ω) ist 

∂ i (ψT) = (∂ i ψ)T + ψ(∂ i T). 

∂ i (ψT)(ϕ) = −ψT(∂ i ϕ) = −T(ψ ∂ i ϕ) = −T(∂ i (ψϕ) − (∂ i ψ)ϕ) 

= (∂ i T)(ψϕ) + T((∂ i ψ)ϕ) = ψ∂ i T(ϕ) + (∂ i ψ)T(ϕ). 

□ 

Dieses Schema wird uns nun beim Aufbau der Distributionentheorie immer 

wieder begegnen. Motiviert durch schon bekannte Operationen auf gewöhnlichen 

Funktionen definieren wir Operationen ‘durch Dualität’, indem wir die Operationen 

durch ihr Wirken auf Testfunktionen beschreiben. Die Beweise von Aussagen 

über Distributionen benutzen dann typischer Weise gerade die entsprechenden 

(schon bekannten) Aussagen über Testfunktionen. 

Bevor wir die Theorie mit dieser Methode weiter ausbauen, untersuchen wir 

noch den Zusammenhang von distributionellen und klassischen Ableitungen. 

Satz 4.9 Es seien u, ∂ α u ∈ C(Ω) für alle |α| ≤ k, wobei ∂ α u die distributionelle 

Ableitung bezeichnet. Dann ist u ∈ C k (Ω). 

Beweis. O.B.d.A. ist |α| = 1, etwa α = e j , e j der j-te Einheitsvektor. Der allgemeine 

Fall ergibt sich hieraus durch Induktion. Zu x 0 ∈ Ω beliebig betrachte das 

Segment K = [x 0 − t 0 e j , x 0 + t 0 e j ], wobei t 0 > 0 so klein sei, dass K ⊂ Ω ist. 

Sei η ε der skalierte Standardglättungskern. Dann gilt für u ε := η ε ∗ u auf einer 

Umgebung von K für hinreichend kleine ε 

∫ 

∂ j u ε (x) = (∂ j η ε ) ∗ u(x) = (∂ j η ε )(x − y)u(y) dy 

∫ ∫ 

∂ηε 

= − (x − y)u(y) dy = η ε (x − y)∂ j u(y) dy, 

∂y j 

51

denn η ε (x − ·) ∈ D(Ω). Dies zeigt ∂ j u ε = η ε ∗ ∂ j u in einer Umgebung von K und 

somit 

u ε (x 0 + te j ) = u ε (x 0 ) + 

∫ t 

0 

(η ε ∗ ∂ j u)(x 0 + se j ) ds 

für |t| < t 0 . Da u ε → u und η ε ∗ ∂ j u → ∂ j u gleichmäßig auf K konvergieren für 

ε → 0, folgt 

u(x 0 + te j ) = u(x 0 ) + 

Daraus folgt nun die Behauptung. 

∫ t 

0 

∂ j u(x 0 + se j ) ds. 

□ 

4.2 Faltung und Fundamentallösungen 

Im folgenden vorbereitenden Lemma fassen wir einige (zum Teil schon bekannte) 

Aussagen über die Faltung zweier Testfunktionen zusammen. 

Lemma 4.10 Es seien ϕ, χ, ψ ∈ D(R n ). Dann gilt 

(i) ϕ ∗ ψ = ψ ∗ ϕ ∈ D(R n ), 

(ii) ∂ α (ϕ ∗ ψ) = (∂ α ϕ) ∗ ψ = ϕ ∗ (∂ α ψ), 

(iii) supp(ϕ ∗ ψ) ⊂ supp ϕ + supp ψ, 

(iv) (ϕ ∗ χ) ∗ ψ = ϕ ∗ (χ ∗ ψ) und 

(v) ∫ R n (ϕ ∗ ψ)χ = ∫ R n ψ(χ ∗ ˇϕ), wobei ˇϕ(x) := ϕ(−x). 

Beweis. (ii) und die Tatsache, dass ϕ, ψ ∈ D(R n ) =⇒ ϕ ∗ ψ = ψ ∗ ϕ ∈ C ∞ (R n ) 

gilt, sind bereits bekannt (vgl. Skript PDG 1). 

Es kann 

∫ 

∫ 

ϕ ∗ ψ(x) = ϕ(x − y)ψ(y) dy = ϕ(x − y)ψ(y) dy ≠ 0 

R n supp ψ 

nur dann sein, wenn ein y ∈ supp ψ existiert, so dass x − y ∈ supp ϕ ist, wenn 

also x ∈ supp ψ + supp ϕ gilt. Dies zeigt (iii), da supp ψ + supp ϕ kompakt ist, 

und beendet auch den Beweis von (i). 

(iv) ergibt sich aus 

∫ ∫ 

(ϕ ∗ χ) ∗ ψ(x) = ϕ(x − y − z)χ(z) dz ψ(y) dy 

∫ ∫ 

= ϕ(x − y)χ(z)ψ(y − z) dz dy 

∫ 

= ϕ(x − y)(χ ∗ ψ)(y) dy 

= ϕ ∗ (χ ∗ ψ)(x), 

52

wobei wir die Substitution y → y − z und (i) ausgenutzt haben. Beachte dabei, 

dass alle beteiligten Funktionen kompakten Träger haben. 

Die Formel aus (v) schließlich folgt aus 

∫ 

∫ ∫ 

(ϕ ∗ ψ)(x)χ(x) dx = ϕ(x − y)ψ(y) dy χ(x) dx 

∫ ∫ 

∫ 

= ˇϕ(y − x)χ(x) dxψ(y) dy = ψ(y)(χ ∗ ˇϕ)(y) dy. 

Durch Lemma 4.10(v) motiviert definieren wir: 

□ 

Definition 4.11 Es sei ϕ ∈ D(R n ), T ∈ D ′ (R n ). Die Faltung von ϕ und T ist 

definiert durch ϕ ∗ T ∈ D ′ (R n ), 

ϕ ∗ T(χ) := T(χ ∗ ˇϕ) ∀ χ ∈ D(R n ). 

(Beachte χ, ϕ ∈ D(R n ) =⇒ χ ∗ ˇϕ ∈ D(R n ).) Dies ist in der Tat wohldefiniert, 

denn wenn χ k → χ in D(R n ), dann gibt es einerseits ein Kompaktum K, so dass 

supp χ k ⊂ K gilt für alle k, so dass supp χ k ∗ ˇϕ ⊂ ˜K := K + supp ˇϕ gilt, und 

andererseits ist 

‖∂ α (χ k ∗ ˇϕ) − ∂ α (χ ∗ ˇϕ)‖ L ∞ = ‖(∂ α χ k − ∂ α χ) ∗ ˇϕ‖ L ∞ 

≤ ‖ˇϕ‖ L 1‖∂ α χ k − ∂ α χ‖ L ∞ → 0 

nach der Youngschen Ungleichung, so dass also χ k ∗ ˇϕ → χ ∗ ˇϕ in D(R n ) gilt. 

Beispiel: Die Diracdistribution δ ist neutral bezüglich der Faltung: Für alle ϕ, χ ∈ 

D(R n ) gilt 

∫ 

∫ 

ϕ ∗ δ(χ) = δ(χ ∗ ˇϕ) = χ ∗ ˇϕ(0) = ˇϕ(0 − y)χ(y) dy = ϕ(y)χ(y) dy, 

d.h. als Distribution ist ϕ ∗ δ = ϕ. 

Lemma 4.12 Es seien ϕ, ψ ∈ D(R n ), T ∈ D ′ (R n ). Dann gilt 

(i) ∂ α (ϕ ∗ T) = (∂ α ϕ) ∗ T = ϕ ∗ (∂ α T). 

(ii) ϕ ∗ (ψ ∗ T) = (ϕ ∗ ψ) ∗ T. 

Beweis. (i) Für alle χ ∈ D(R n ) gilt 

∂ α (ϕ ∗ T)(χ) = (−1) |α| ϕ ∗ T(∂ α χ) = (−1) |α| T((∂ α χ) ∗ ˇϕ) 

{ 

(−1) |α| T(∂ α (χ ∗ ˇϕ)) = ∂ α T(χ ∗ ˇϕ) = ϕ ∗ ∂ α T(χ) bzw. 

= 

(−1) |α| ̂ 

T(χ ∗ (∂ α ˇϕ)) = T(χ ∗ ( ∂ α ϕ)) = (∂ α ϕ) ∗ T(χ). 

53

(ii) Beachte zunächst, dass 

∫ 

∫ 

ˇϕ ∗ ˇψ(x) = ˇϕ(x − y) ˇψ(y) dy = ϕ(−x + y)ψ(−y) dy 

∫ 

̂ 

= ϕ(−x − y)ψ(y) dy = ϕ ∗ ψ(x) 

gilt. Damit ergibt sich nun für alle χ ∈ D(R n ) 

ϕ ∗ (ψ ∗ T)(χ) = ψ ∗ T(χ ∗ ˇϕ) = T((χ ∗ ˇϕ) ∗ ˇψ) 

̂ 

= T(χ ∗ ( ϕ ∗ ψ)) = (ϕ ∗ ψ) ∗ T(χ). 

Bevor wir weitere Operationen auf D einführen, besprechen wir eine wichtige 

Anwendung. 

Definition 4.13 Es sei L ein linearer partieller Differentialoperator mit konstanten 

Koeffizienten. Eine Fundamentallösung von L ist eine Distribution E ∈ 

D ′ (R n ) mit LE = δ. 

Fundamentallösungen sind deshalb so nützlich, weil man aus ihnen auch Lösungen 

für allgemeinere rechte Seiten f konstruieren kann: 

Satz 4.14 Es sei L ein linearer partieller Differentialoperator mit konstanten 

Koeffizienten, E eine Fundamentallösung von L, f ∈ D(R n ). Dann ist u := f ∗E 

eine Lösung von Lu = f. 

Beweis. Da L konstante Koeffizienten hat, gilt 

Lu = L(f ∗ E) = f ∗ (LE) = f ∗ δ = f. 

Wir werden gleich sehen, dass die Faltung einer Testfunktion mit einer Distribution 

immer eine glatte Funktion ist(!). Wir haben also tatsächlich eine klassische 

Lösung von Lu = f gefunden. 

Beispiel: Im Skript PDG 1 hatten wir die (L 1 loc -)Funktion 

{ 

− 

1 

log |x|, n = 2, 

2π 

Φ(x) := 

1 

n(n−2)ω n 

|x| 2−n , n ≥ 3, 

die Fundamentallösung des Laplace-Operators −∆ genannt (vgl. Skript PDG 1, 

Definition 2.13). In der Tat gilt 

−∆Φ = δ. 

54 

□ 

□

Dies beweist man entweder durch Nachrechnen oder indem man ausnutzt, dass 

für u ∈ C 2 (U), U ⊂ R n offen und beschränkt, die Darstellungsformel 

∫ 

∫ 

u(x) = − Φ(y − x)∆u(y) dy + Φ(y − x)∂ ν u(y) − u(y)∂ ν Φ(x − y) dS(y) 

U 

∂U 

gilt (vgl. Skript PDG 1, Gleichung (2.9)). Ist u ∈ D(R n ) und wählt man U, so 

dass supp u ⊂ U gilt, ergibt sich 

∫ 

u(x) = − Φ(y − x)∆u(y) dy. 

R n 

Das aber zeigt 

d.h. −∆Φ = δ. 

∫ 

δ(u) = u(0) = − 

Φ∆u = −∆Φ(u), 

Für das schon angekündigte Regularitätsresultat für ϕ∗T benötigen wir noch 

eine Vorbereitung. Der Verschiebungsoperator τ h , h ∈ R n , ist auf L 1 loc -Funktionen 

definiert durch (τ h f)(x) := f(x − h). Motiviert durch 

∫ 

∫ 

(τ h f)(x)ϕ(x) dx = f(x − h)ϕ(x) dx 

∫ 

∫ 

= f(x)ϕ(x + h) dx = f(x)(τ −h ϕ)(x) dx 

für Testfunktionen ϕ definieren wir: 

Definition 4.15 Es sei h ∈ R n , T ∈ D ′ (R n ). Dann definiert 

(τ h T)(ϕ) = T(τ −h ϕ) ∀ ϕ ∈ D(R n ) 

die um h translatierte Distribution τ h T ∈ D ′ (R n ). 

Beachte wieder, dass dies wohldefiniert ist, da ϕ k → ϕ in D(R n ) τ −h ϕ k → τ −h ϕ 

in D(R n ) impliziert. 

Satz 4.16 Es sei ϕ ∈ D(R n ), T ∈ D ′ (R n ). Dann ist ϕ ∗ T ∈ C ∞ (R n ) mit 

ϕ ∗ T(x) = T(τ x ˇϕ). 

In Worten: ϕ∗T ist eine glatte Funktion, deren Wert an einer Stelle x sich dadurch 

ergibt, dass man T als Funktional auf die Testfunktion y ↦→ ϕ(−y −x) anwendet. 

Beweis. Setze f(x) := T(τ x ˇϕ). Dies definiert eine stetige Funktion f : R n → K, 

da x n → x in R n =⇒ τ xn ˇϕ → τ x ˇϕ in D. 

55

Es seien nun ψ ∈ D(R n ) und K ⊂ R n kompakt, so dass supp ψ −supp ϕ ⊂ K. 

Dann gilt 

∫ 

∑ 

ψ ∗ ˇϕ(y) = ψ(x)ˇϕ(y − x) dx = lim h n ψ(hk)ˇϕ(y − hk). 

hց0 

k∈Z n 

Dies ergibt sich daraus, dass die Summe im letzten Term eine Riemannsumme 

für das zu berechnende Integral ist. Sie entsteht hier dadurch, dass man auf 

allen Quadern der Form kh + [0, h) n , k ∈ Z n , den Integranden durch seinen 

Wert bei hk ersetzt. Der Fehler, den man bei dieser Approximation macht, lässt 

sich gleichmäßig in y durch Ch beschränken, da der Gradient des Integranden 

gleichmäßig in y beschränkt ist. Dies zeigt, dass die betrachtete Riemannsumme 

sogar gleichmäßig in y konvergiert. Genauso ergibt sich 

∫ 

∂ α (ψ ∗ ˇϕ)(y) = 

∑ 

ψ(x) ∂ α ˇϕ(y − x) dx = lim h n ψ(hk) ∂ α ˇϕ(y − hk) 

hց0 

k∈Z n 

gleichmäßig in y für jeden Multiindex α. Da außerdem ∑ k∈Z n h n ψ(hk) ∂ α ˇϕ(y − 

hk) = 0 ist für y /∈ K, haben wir nun bewiesen, dass 

∑ 

k∈Z n h n ψ(hk) τ hk ˇϕ → ψ ∗ ˇϕ 

in D(R n ) konvergiert. 

Weil f stetig ist, können wir auch ∫ fψ durch eine Riemannsumme approximieren. 

Aus der Stetigkeit von T ergibt sich dann 

∫ 

∑ 

∑ 

f ψ = lim h n ψ(hk)f(kh) = lim h n ψ(hk)T(τ kh ˇϕ) 

hց0 hց0 

k∈Z n k∈Z 

( 

) 

n 

∑ 

= T lim h n ψ(hk)τ kh ˇϕ = T(ψ ∗ ˇϕ) = ϕ ∗ T(ψ). 

hց0 

k∈Z n 

Da ψ beliebig war, folgt daraus f = ϕ ∗ T. 

Damit ist nun gezeigt, dass ϕ ∗ T eine stetige Funktion ist, die der Formel 

ϕ ∗ T = f genügt. Daraus können wir aber unmittelbar folgern, dass ϕ ∗ T ∈ C ∞ 

gilt, indem wir bemerken, dass das gleiche Argument angewendet auf ∂ α ϕ zeigt, 

dass ∂ α (ϕ ∗ T) = (∂ α ϕ) ∗ T stetig ist für alle α. 

□ 

Korollar 4.17 D(R n ) ist dicht in D ′ (R n ). 

Beweis. Es sei T ∈ D ′ (R n ). Wähle χ ∈ D(R n ) mit χ ≡ 1 auf B 1 (0) und setze 

χ k (x) := χ( x). Ist nun η k 1 der skalierte Standardglättungskern, so gilt 

k 

D(R n ) ∋ ϕ k := χ k (η 1 ∗ T) → T in D ′ (R n ) : 

k 

56

Als Distributionen wirken die ϕ k auf Testfunktionen ψ gemäß 

denn supp ψ ∗ η 1 

k 

ϕ k (ψ) = (η 1 ∗ T)(χ k ψ) = (η 1 ∗ T)(ψ) (für k groß genug) 

k 

k 

) → Tψ, 

= T(ψ ∗ ˇη 1 

k 

) = T(ψ ∗ η 1 

k 

⊂ supp ψ + B 1 (0) für alle k ∈ N und 

∂ α (ψ ∗ η 1) = (∂ α ψ) ∗ η 1 

k 

k 

gleichmäßig für alle α, so dass ψ ∗ η 1 

k 

→ ψ in D. 

→ ∂ α ψ 

□ 

Korollar 4.18 Ist T ∈ D ′ (R n ) mit ∇T = 0, so ist T eine konstante Funktion. 

Beweis. Sei wieder η 1 

k 

der skalierte Standardglättungskern. Es gilt 

∂ j (η 1 ∗ T) = η 1 ∗ (∂ j T) = 0, 

k 

k 

j = 1, . . .,n, 

(s. Lemma 4.12) so dass η 1 ∗ T = c k für eine geeignete Konstante c k ist. Wie im 

k 

vorigen Beweis gezeigt gilt ψ ∗ η 1 → ψ in D für jede Testfunktion ψ. Es folgt 

k 

∫ 

c k ψ = η 1 ∗ T(ψ) → Tψ 

k 

für alle ψ ∈ D(R n ) und damit T = lim k c k . (Dieser Limes existiert: Betrachte ψ 

mit ∫ ψ = 1.) 

□ 

Tatsächlich lässt sich die Faltung noch unter wesentlich schwächeren Voraussetzungen 

definieren. Dazu benötigen wir noch zwei Vorbereitungen. Für f ∈ 

L 1 loc (Rn ), ϕ ∈ D(R n ) gilt 

∫ ∫ 

∫ 

∫ 

ˇf ϕ = f(−x) ϕ(x) dx = f(x) ϕ(−x) dx = f ˇϕ. 

Dies motiviert: 

Definition 4.19 Ist T ∈ D ′ (R n ), so wird durch 

gespiegelte Distribution Ť ∈ D′ (R n ) definiert. 

Ťϕ = T ˇϕ die am Ursprung 

Es ist leicht einzusehen, dass dies wohldefiniert ist. 

Lemma 4.20 Ist ϕ ∈ D(R n ) und T ∈ E ′ (R n ), so gilt ϕ ∗ T ∈ D(R n ) mit 

ϕ ∗ T(x) = T(τ x ˇϕ) und supp ϕ ∗ T ⊂ supp ϕ + supp T. 

57

Beweis. Nach Satz 4.16 genügt es, supp ϕ ∗ T ⊂ supp ϕ + supp T zu zeigen: Ist 

x ∈ R n mit ϕ ∗ T(x) = T(τ x ˇϕ) ≠ 0, so ist supp T ∩ supp τ x ˇϕ = supp T ∩ (x − 

supp ϕ) ≠ ∅, d.h. x ∈ supp T + supp ϕ. Da supp T + supp ϕ kompakt ist, folgt 

daraus die Behauptung. 

□ 

Wir können nun sogar die Faltung zwischen zwei Distributionen definieren, 

wenn nur eine von ihnen kompakten Träger hat. Zur Motivation der Definition 

beachte, dass für ϕ ∈ D(R n ), T ∈ D ′ (R n ) 

definiert war. 

ϕ ∗ T(ψ) = T(ψ ∗ ˇϕ) ∀ ψ ∈ D(R n ) 

Definition 4.21 Es sei S ∈ E ′ (R n ), T ∈ D ′ (R n ). Dann wird durch 

eine Distribution S ∈ D ′ (R n ) definiert. 

S ∗ T(ψ) = T(ψ ∗ Š) ∀ ψ ∈ D(Rn ) 

Beachte, dass nach Lemma 4.20 ψ ∗ Š ∈ D(Rn ) gilt, so dass S ∗ T wirklich ein 

lineares Funktional auf D(R n ) ist. Um einzusehen, dass S ∗ T eine Distribution 

ist, muss noch die Stetigkeitsbedingung überprüft werden. Sei dazu K ⊂ R n 

kompakt, ˜K := K − supp S. Für alle ϕ ∈ D(R n ) mit supp ϕ ⊂ K gilt dann 

∑ 

|S ∗ T(ϕ)| = |T(ϕ ∗ Š)| ≤ C ˜K(T) ‖∂ α (ϕ ∗ Š)‖ L ∞ ( ˜K) , 

wobei 

|α|≤N ˜K(T) 

‖∂ α (ϕ ∗ Š)‖ L ∞ = ‖(∂α ϕ) ∗ Š‖ L ∞ = sup 

Zusammengefasst ergibt sich 

≤ C ˜K−K (Š) 

∑ 

x∈ ˜K 

|β|≤N ˜K−K (Š) 

= C ˜K−K (Š) ∑ 

|S ∗ T(ϕ)| ≤ C ∑ 

|β|≤N ˜K−K (Š) 

|α|≤N 

|Š(τ ̂ 

x∂ α ϕ)| 

‖∂y β (τ ̂ 

x∂ α ϕ(y))‖ L ∞ 

‖∂ β ∂ α ϕ‖ L ∞. 

‖∂ α ϕ‖ L ∞. 

für hinreichend großes C > 0 und N = N ˜K(T) + N ˜K−K (Š). 

Beispiel: Es ist δ ∈ E ′ (R n ); somit ist δ ∗ T für alle T ∈ D ′ (R n ) erklärt. Da für 

Testfunktionen ϕ 

gilt, ist δ ∗ T = T. 

(δ ∗ T)ϕ = T(ϕ ∗ ˇδ) = T(ϕ ∗ δ) = Tϕ 

58

Lemma 4.22 Sei S ∈ E ′ (R n ), T ∈ D ′ (R n ). Für alle Multiindizes α gilt 

∂ α (S ∗ T) = (∂ α S) ∗ T = S ∗ (∂ α T). 

Beweis. Für ϕ ∈ D(R n ) ist nach Lemma 4.12 

∂ α (S ∗ T)(ϕ) = (−1) |α| S ∗ T(∂ α ϕ) = (−1) |α| T((∂ α ϕ) ∗ 

{ Š) 

(−1) |α| T(∂ α (ϕ ∗ Š)) = ∂α T(ϕ ∗ Š) = (S ∗ ∂α T)(ϕ) bzw. 

= 

(−1) |α| ̂ 

T(ϕ ∗ (∂ α Š)) = T(ϕ ∗ ( ∂ α S)) = ((∂ α S) ∗ T)(ϕ). 

(Beachte ∂ α Ťϕ = (−1) |α| Ť(∂ α ϕ) = (−1) |α| ̂ 

T( ∂ α ϕ) = T(∂ α ˇϕ) = (−1) |α| ∂ α T(ˇϕ) = 

̂ 

(−1) |α| ∂ α Tϕ.) 

Beispiel: Ist S ∈ E ′ (R n ), so gilt S ∗ δ = S, denn für Testfunktionen ϕ ist 

S ∗ δ(ϕ) = δ(ϕ ∗ Š) = ϕ ∗ Š(0) = Š(τ 0 ˇϕ) = S(ϕ). 

(Dies ergibt sich aus der schon bekannten Tatsache δ ∗ S = S in Verbindung mit 

der folgenden Bemerkung.) 

Bemerkung 4.23 1. Ohne Beweis bemerken wir, dass S ∗ T = T ∗ S für alle 

S, T ∈ E ′ (R n ) gilt. 

2. Ist L ein linearer partieller Differentialoperator mit konstanten Koeffizienten 

und mit Fundamentallösung E, so gilt sogar für alle S ∈ E ′ (R n ), dass 

u := S ∗ E eine Lösung von 

Lu = S 

im Distributionensinne ist (vgl. Satz 4.14): Es ist Lu = S∗(LE) = S∗δ = S. 

Lemma 4.24 Sei S ∈ E ′ (R n ), ϕ ∈ C ∞ (R n ) ⊂ D ′ (R n ). Dann ist S∗ϕ ∈ C ∞ (R n ). 

Beweis. Sei R > 0 beliebig. Wähle χ ∈ D(R n ) mit χ ≡ 1 auf B R (0)+supp Š. Für 

ψ ∈ D(R n ) mit supp ψ ⊂ B R (0) gilt dann 

S ∗ ϕ(ψ) = ϕ(ψ ∗ 

∫R Š) = ϕ(χ · ψ ∗ Š) = χ(x)ϕ(x)(ψ ∗ Š)(x) dx 

n 

= ψ ∗ Š(χϕ) = Š((χϕ) ∗ ˇψ) = Š( ˇψ ∗ 

̂ 

χϕ) = 

̂ 

χϕ ∗ Š( ˇψ) = 

̂ 

χϕ ∗ Š(ψ). 

̂ 

Dies zeigt, dass S ∗ ϕ = χϕ ∗ Š ist. ̂ 

Nun ist aber χϕ ∈ D(R n ) und Š ∈ D′ (R n ), 

̂ 

so dass χϕ ∗ Š C∞ -glatt ist nach Satz 4.16. 

□ 

Wir kommen nun zu einer wichtigen Anwendung der Theorie. 

□ 

59

Definition 4.25 Es sei L ein linearer partieller Differentialoperator mit C ∞ - 

glatten Koeffizienten auf Ω ⊂ R n offen. L heißt hypoelliptisch auf Ω ′ ⊂ Ω offen, 

wenn 

T ∈ D ′ (Ω ′ ), LT ∈ C ∞ (Ω ′ ) =⇒ T ∈ C ∞ (Ω ′ ) 

gilt. 

Hypoelliptische Operatoren haben also eine besonders gutartige Regularitätstheorie: 

Wenn die Daten glatt sind und T eine (nur) distributionelle Lösung ist, so 

ist T automatisch eine glatte Funktion. Der Name ‘hypoelliptisch’ kommt daher, 

dass elliptische Operatoren tatsächlich hypoelliptisch im oben definierten Sinne 

sind. (Für elliptische Operatoren zweiter Ordnung wurde das im Skript PDG 1, 

Kap. 5 gezeigt.) Allerdings ist nicht jeder partieller Differentialoperator hypoelliptisch 

selbst wenn er sogar konstante Koeffizienten hat: Betrachte etwa ∂ x1 auf 

R n , n ≥ 2. 


Koeffizienten, der eine Fundamentallösung E mit E ∈ C ∞ (R n \ {0}) besitze. 

Dann ist L hypoelliptisch auf allen Ω ⊂ R n offen. 

Beispiel: Die Fundamentallösung des Laplace-Operators ∆ ist glatt auf R n \ {0} 

und ∆ damit hypoelliptisch. 

Beweis. Sei u ∈ D ′ (Ω), Lu = f ∈ C ∞ (Ω). 

Wir betrachten zunächst den Fall f = 0. Fixiere x 0 ∈ Ω, ε > 0 und χ ∈ D(Ω), 

so dass B ε (x 0 ) ⊂ Ω und χ ≡ 1 auf B ε (x 0 ). Dann ist χu ∈ E ′ (Ω) und 

χu = (χu) ∗ δ = (χu) ∗ (LE) = L(χu) ∗ E. 

Wähle ψ ∈ C ∞ (R n ) mit ψ(x) = ψ(|x|), so dass 

{ 

0 für |x| ≤ ε 4 

ψ(x) = 

, 

1 für |x| ≥ ε 2 

gilt. Damit können wir 

χu = L(χu) ∗ (ψE) + L(χu) ∗ ((1 − ψ)E) 

schreiben. Da nun L(χu) ∈ E ′ (R n ) und ψE ∈ C ∞ (R n ) ist, ist der erste Summand 

nach Lemma 4.24 C ∞ -glatt. 

Wir beenden den Beweis im Falle f = 0, indem wir zeigen, dass der zweite 

Summand auf B ε (x 0) verschwindet. Damit ist dann ja u ∈ C ∞ (B ε (x 0)) nachgewiesen, 

und somit u in der Umgebung eines beliebigen Punktes als glatt erkannt. 

4 4 

Sei ϕ ∈ D(B ε (x 0)). Es ist 

4 

L(χu) ∗ ((1 − ψ)E)(ϕ) = (1 − ψ)E(ϕ ∗ 

̂ 

L(χu)), 

60

wobei 

̂ 

̂ 

supp(ϕ ∗ L(χu)) ⊂ supp ϕ + supp L(χu) ⊂ supp ϕ − supp L(χu) 

⊂ B ε 

4 (x 0) + (R n \ B ε (−x 0 )), 

weil L(χu) = f = 0 auf B ε (x 0 ) ist. Somit ist 

̂ 

supp(ϕ ∗ L(χu)) ⊂ R n \ B3ε(0). 

4 

(Beachte |x 1 − x 0 | ≤ ε, |x 4 2 + x 0 | ≥ ε =⇒ |x 1 + x 2 | ≥ |x 2 + x 0 | − |x 1 − x 0 | ≥ 3ε.) 

4 

Andererseits ist supp(1 − ψ)E ⊂ B ε(0), so dass sich in der Tat 

2 

L(χu) ∗ ((1 − ψ)E)(ϕ) = 0 

ergibt. 

Ist nun allgemein Lu = f ∈ C ∞ (Ω), so wählen wir wieder χ ∈ D(Ω) und 

ε > 0, so dass B ε (x 0 ) ⊂ Ω und χ ≡ 1 auf B ε (x 0 ). Setzt man u 0 = (χf) ∗ E ∈ C ∞ 

(Satz 4.16), so folgt 

Lu 0 = (χf) ∗ (LE) = (χf) ∗ δ = χf = f auf B ε (x 0 ). 

Damit ist L(u − u 0 ) = 0 auf B ε (x 0 ) und nach dem schon behandelten Fall folgt 

u − u 0 ∈ C ∞ (B ε (x 0 )) und damit auch u ∈ C ∞ (B ε (x 0 )). 

□ 

4.3 Temperierte Distributionen 

Unter anderem weil bei der Behandlung linearer PDG mit konstanten Koeffizienten 

die Fouriertransformation ein so nützliches Hilfsmittel ist, würde man 

gerne die Fouriertransformierte einer allgemeinen Distribution definieren. Das ist 

in der Tat für eine große Klasse von Distributionen, die wir nun untersuchen werden, 

möglich: Die sogenannten temperierten Distributionen. Die Schwierigkeit für 

allgemeine Distributionen rührt daher, dass der Raum der Testfunktionen nicht 

abgeschlossen bezüglich der Fouriertransformation ist, so dass man die Fouriertransformation 

nicht einfach ‘durch Dualität’ auf Distributionen übertragen kann. 

Jedoch ist ˆϕ(ξ) für ϕ ∈ D(R n ) immer noch ‘schnell fallend’ für |ξ| → ∞. Diese 

Beobachtung führt zur Definition eines neuen Raumes S der schnell fallenden 

glatten Funktionen, der insbesondere die Testfunktionen enthält. Temperierte 

Distributionen sind dann gerade die stetigen Linearformen auf S. Sehr grob gesprochen 

handelt es sich hierbei um solche Distributionen, die bei ∞ nicht zu 

schnell anwachsen. 

Definition 4.27 

(i) Der Schwarz-Raum S ist definiert durch 

S := {ϕ ∈ C ∞ (R n ) : ‖ϕ‖ N < ∞ ∀ N ∈ N}, 

61

wobei ‖ · ‖ N die Norm 

bezeichnet. 

‖ϕ‖ := max sup |x α ∂ β ϕ(x)| 

|α|,|β|≤N x∈R n 

(ii) Eine Folge (ϕ j ) ⊂ S von Schwarz-Funktionen konvergiert in S gegen ϕ ∈ 

S, wenn ‖ϕ j − ϕ‖ N → 0 für alle N ∈ N. 

Beispiele: 

1. Offenbar ist D(R n ) ⊂ S. Die Funktion x ↦→ e −x2 aber liegt in S, jedoch 

nicht in D(R n ). 

2. Gilt ϕ k → ϕ in D(R n ), so gilt auch ϕ k → ϕ in S. (Der Beweis ist einfach.) 

Bemerkung 4.28 S is ein lokalkonvexer Raum, dessen Topologie von der Familie 

der Normen (‖·‖ N ) N∈N induziert wird. Es gibt eine Metrik, die diese Topologie 

erzeugt. (Übung.) 

(i) Ist ϕ ∈ S, so ist auch x ↦→ x α ∂ β ϕ(x) ∈ S für alle Multiin- 

Lemma 4.29 

dizes α, β. 

(ii) Für jeden Sobolevraum W k,p (R n ) mit k ∈ N 0 und 1 ≤ p ≤ ∞ gilt S ⊂ 

W k,p (R n ) und es gibt eine Konstante C = C(k, p, n) und ein N = N(k, p, n), 

so dass 

‖ϕ‖ W k,p (R n ) ≤ C‖ϕ‖ N ∀ ϕ ∈ S. 

(iii) ϕ, ψ ∈ S =⇒ ϕ ∗ ψ ∈ S. 

(iv) ϕ, ψ ∈ S =⇒ ϕψ ∈ S. 

Beweis. (i) und (iv) sind einfach (Leibniz-Regel!). 

(ii) Seien ϕ ∈ S und α ein Multiindex mit |α| ≤ k. Es gilt 

∫ ∫ ∫ 

|∂ α ϕ| p ≤ |∂ α ϕ| p + |∂ α ϕ| p 

R n B 1 (0) 

R n \B 1 (0) 

∫ 

≤ |B 1 (0)| sup |∂ α ϕ(x)| p + |x| −n−1 |x| n+1 |∂ α ϕ(x)| p dx 

≤ C‖ϕ‖ p k + 

x∈B 1 (0) 

R n \B 1 (0) 

sup |x| n+1 |∂ α ϕ| p · 

x∈R n \B 1 (0) 

≤ C‖ϕ‖ p k + C‖ϕ‖p max{k,n+1} 

≤ C‖ϕ‖ p max{k,n+1} . 

Daraus ergibt sich die Behauptung. 

62 

∫ 

R n \B 1 (0) 

|x| −n−1 dx

(iii) Beachte, dass ϕ ∗ψ(x) = ∫ ϕ(x −y)ψ(y) dy definiert und C ∞ -glatt ist, da 

ψ ∈ L 1 (R n ) und ∂ α ϕ ∈ L ∞ (R n ) für jeden Mutiindex α ist. (Insbesondere ergeben 

sich Ableitungen von ϕ ∗ ψ durch Differentiation unter dem Integral.) 

Nun ist für hinreichend großes N ∈ N 

∫ 

|x α ∂ β (ϕ ∗ ψ)(x)| = 

∣ ((x − y) + y) α ∂ β ϕ(x − y)ψ(y) dy 

∣ 

∑ 

( α = 

(x − y) 

∣ γ)∫ 

α−γ ∂ β ϕ(x − y) y γ ψ(y) dy 

∣ 

γ≤α 

∑ 

≤ C‖ϕ‖ N ‖y γ ψ(y)‖ L 1 

γ≤α 

≤ C‖ϕ‖ N ‖ψ‖ N 

nach (i) und (ii). Daraus folgt nun die Behauptung. 

Eine wichtige Eigenschaft des Schwarz-Raumes ist seine Invarianz unter Fouriertransformation. 

Wegen S ⊂ L 1 ist die Fouriertransformierte einer Schwarz- 

Funktion ϕ ∈ S gegeben durch 

Fϕ(ξ) = ˆϕ(ξ) = 1 

(2π) n 2 

∫ 

R n e −ix·ξ ϕ(x) dx. 

Wir stellen einige (teils schon bekannte) Tatsachen über die Fouriertransformation 

auf S zusammen: 

Lemma 4.30 Es seien ϕ, ϕ k , ψ ∈ S, k = 1, 2, . . ., α ein Multiindex und h ∈ R n . 

Dann gilt 

(i) ̂∂ α ϕ(ξ) = (iξ) α ˆϕ(ξ) und ∂ α ˆϕ(x) = ̂ (−ix) α ϕ(ξ), 

(iia) ̂τ h ϕ(ξ) = e −ih·ξ ˆϕ(ξ) und τ h ˆϕ(ξ) = êih·x ϕ(ξ), 

(iib) ̂ϕ λ (ξ) = λ n ˆϕ(λξ) für ϕ λ (x) := ϕ(λx), 

(iic) ˆϕ = ˇϕ, 

(iii) ˆϕ ∈ S, 

(iv) ϕ k → ϕ in S =⇒ ˆϕ k → ˆϕ in S, 

(v) ̂ϕ ∗ ψ = (2π) n 2 ˆϕ ˆψ. 

Beweis. (ii) und (v) sind schon bekannt 

Auch (i) folgt aus schon bekannten Eigenschaften der Fouriertransformation 

auf L 1 : Die erste Gleichung ergibt sich aus ∂ β ϕ ∈ S ⊂ L 1 für alle Multiindizes β; 

63 

□

für die zweite Gleichung beachte, dass (−ix) β ϕ ∈ S ⊂ L 1 für alle Multiindizes β 

gilt, so dass in der Tat ˆϕ differenzierbar ist mit ∂ α ˆϕ(x) = (−ix) ̂α 

ϕ(ξ). 

(iii) & (iv): Wie eben begründet ist ϕ C ∞ -glatt mit 

|ξ β ∂ γ ˆϕ(ξ)| = | ∂ ̂β 

(x γ ϕ)(ξ)| ≤ 1 ∫ 

|∂ β (x γ ϕ)| dx 

(2π) n 2 

= 1 ‖∂ β (x γ ϕ)‖ 

(2π) n L 1 ≤ C‖∂ β (x γ ϕ)‖Ñ 

2 

für hinreichend großes Ñ ∈ N nach Lemma 4.29(ii). Nach Vergrößerung von Ñ 

ergibt sich mit Hilfe der Leibniz-Regel 

|ξ β ∂ γ ˆϕ(ξ)| ≤ C‖ϕ‖Ñ. 

Dies zeigt, dass es zu jedem N ∈ N ein Ñ ∈ N und eine Konstante C gibt, so 

dass 

‖ˆϕ‖ N ≤ C‖ϕ‖Ñ ∀ϕ ∈ S. 

Das beendet den Beweis von (iii) und zeigt außerdem (iv). 

□ 

Wir erinnern hier noch an die Tatsache, dass F : S → S sich zu einer linearen 

Isometrie F : L 2 (R n ) → L 2 (R n ) fortsetzt. 

Wie in der Theorie der Fouriertransformation üblich betrachten wir komplexwertige 

Funktionen. 

Definition 4.31 Eine lineare Abbildung T : S → C ist eine temperierte Distribution 

(man schreibt T ∈ S ′ ), wenn 

ϕ k → ϕ in S =⇒ Tϕ k → Tϕ in C. 

Wegen D(R n ) ⊂ S und ϕ k → ϕ in D(R n ) =⇒ ϕ k → ϕ in S gilt S ′ ⊂ D ′ (R n ). 

Satz 4.32 Es sei T : S → C eine lineare Abbildung. T ist genau dann eine 

temperierte Distribution, wenn C > 0 und N ∈ N existieren, so dass 

|Tϕ| ≤ C‖ϕ‖ N 

∀ ϕ ∈ S 

gilt. 

Beweis. Dass die Bedingung hinreichend für T ∈ S ′ ist, ist klar. 

Um die Notwendigkeit zu beweisen, nehmen wir an, es gäbe zu jedem k ∈ N 

ein ϕ k ∈ S, so dass 

|Tϕ| > k‖ϕ k ‖ k 

gilt. O.B.d.A. ist zudem Tϕ k = 1 für alle k. (Multipliziere mit geeigneten Skalaren.) 

Für jedes k 0 ∈ N ist dann aber 

1 > k‖ϕ k ‖ k ≥ k‖ϕ k ‖ k0 ∀ k ≥ k 0 , 

64

so dass lim k→∞ ‖ϕ k ‖ k0 = 0. Dies zeigt ϕ k → 0 in S. Jedoch konvergiert Tϕ k = 1 

nicht gegen 0. 

□ 

Beispiele: 

1. L p ⊂ S ′ für alle 1 ≤ p ≤ ∞, nicht jedoch L p loc 

, wie 4. zeigen wird. 

2. Alle Polynome liegen in S ′ : Für ϕ ∈ S, p ein Polynom gilt | ∫ p ϕ| ≤ 

‖pϕ‖ L 1 ≤ C‖ϕ‖ N für hinreichend großes N. 

3. Endliche Maße µ sind temperierte Distributionen gemäß ϕ ↦→ ∫ ϕ dµ, denn 

es gilt 

∣∫ 

∣∣∣ ϕ dµ 

∣ ≤ |µ|(Rn )‖ϕ‖ L ∞. 

4. Die Funktion x ↦→ e x2 liegt nicht in S ′ (aber in D ′ (R n )). (Übung.) 

Definition 4.33 Eine Folge von temperierten Distributionen T n konvergiert in S ′ 

gegen T ∈ S ′ , wenn T n ϕ in C gegen Tϕ konvergiert für alle ϕ ∈ S. 

Genau wie für D ′ definiert man die Ableitungen ∂ α T, die Reflektion Ť und 

die Verschiebung τ h T für T ∈ S. (Wegen S ′ ⊂ D ′ (R n ) sind diese Distributionen 

als Elemente von D ′ (R n ) schon definiert.) Man muss sich davon überzugen, dass 

diese Ausdrücke als Elemente von S ′ wohldefiniert sind. Das ist aber einfach. 

Die Multiplikation mit glatten Funktionen ist jedoch i.A. nicht wohldefiniert. 

(Z.B. ist 1 ∈ L ∞ ⊂ S ′ aber e x2 = e x2 · 1 /∈ S ′ .) 

Lemma 4.34 Es sei ϕ ∈ C ∞ , so dass jede Ableitung ∂ α ϕ höchstens polynomiell 

divergiert: Es gibt Konstanten C = C(α), N = N(α), so dass 

Dann ist ϕT wohldefiniert. 

|∂ α ϕ(x)| ≤ C(1 + |x| N ) ∀ x ∈ R n . 

Beweis. Für ψ ∈ S und Multiindizes α und β ist 

|x α ∂ β (ϕψ)(x)| = 

∑ ( ) 

β ∣ xα ∂ γ ϕ(x)∂ β−γ ψ(x) 

γ 

∣ 

γ≤β 

≤ ∑ ( β 

C(γ)(1 + |x| 

γ) 

N(γ) )|x α ∂ γ ψ(x)| 

γ≤β 

≤ C‖ψ‖ N 

für C und N (nur von α, β abhängend) groß genug. Dies zeigt ϕψ ∈ S und 

ψ k → ψ in S =⇒ ϕψ k → ϕψ in S. 

□ 

Beispiel: Insbesondere darf man temperierte Distributionen also mit Polynomen 

und Funktionen der Form x ↦→ e ia·x , a ∈ R n , multiplizieren. 

65

Definition 4.35 Sei ϕ ∈ S, T ∈ S ′ . Durch 

ϕ ∗ T(ψ) = T(ψ ∗ ˇϕ) 

∀ ψ ∈ S 

wird eine temperierte Distribution definiert. 

Beachte, dass nach Lemma 4.29 ψ ∗ ˇϕ ∈ S gilt und dass, wenn ϕ kompakten 

Träger hat, diese Definition mit der früheren Definition für ϕ ∗ T übereinstimmt. 

Um die Wohldefiniertheit zu begründen, muss man noch zeigen, dass ψ k → ψ in 

S impliziert, dass auch ψ k ∗ ˇϕ → ψ ∗ ˇϕ in S konvergiert: 

Nach Lemma 4.30(v) ist 

̂ψ k ∗ ˇϕ = (2π) n 2 ˆψk ˆˇϕ → (2π) n 2 ˆψ ˆˇϕ = ̂ψ ∗ ˇϕ in S, 

wobei der zweite Schritt wie im Beweis von Lemma 4.34 folgt. Mit Lemma 4.30(iv) 

und (iii) erhalten wir nun 

ψ k ∗ ˇϕ → ψ ∗ ˇϕ in S. 

□ 

Wir kommen nun zur Fouriertransformation für temperierte Distributionen. 

Für ϕ, ψ ∈ S gilt ∫ ˆϕψ = ∫ ϕ ˆψ, denn die Fouriertransformation ist eine L 2 - 

Isometrie, so dass 

∫ ∫ ∫ ∫ 

ˆϕψ = ˆϕψ = ˆϕˆψ = ˇϕ ˇˆψ 

∫ 

= ϕ ˆψ, 

wobei wir im dritten Schritt ausgenutzt haben, dass 

ˆχ(ξ) = 1 ∫ 

e ix·ξ χ(x) dx = ˇˆχ(x) 

(2π) n 2 

für alle χ ∈ S gilt. Dadurch motiviert definieren wir: 

Definition 4.36 Ist T ∈ S ′ , so wird durch 

ˆTϕ := T ˆϕ ∀ ϕ ∈ S 

die Fouriertransformierte FT := ˆT ∈ S ′ definiert. 

Dies ist wohldefiniert nach Lemma 4.30(iii) und (iv). 

Satz 4.37 Die Abbildung F : S ′ → S ′ ist linear und stetig. Für ϕ ∈ S, T ∈ S ′ , 

Multiindizes α und h ∈ R n gilt 

(i) ̂∂ α T = (iξ) α ˆT und ∂ 

α ˆT = ̂ (−ix)α T, 

66

(ii) ̂τ h T = e −ih·ξ ˆT und τh ˆT = ê ih·x T, 

(iii) ˆT = Ť 

(iv) ̂ϕ ∗ T = (2π) n 2 ˆϕ ˆT. 

Beweis. Die Stetigkeit von F ist klar. 

(i) Aus den entsprechenden Eigenschaften für Schwarz-Funktionen folgt 

sowie 

̂∂ α Tψ = ∂ α T ˆψ = (−1) |α| T(∂ α ˆψ) = (−1) |α| T( ̂ (−ix) α ψ) 

= (−1) |α| ˆT((−ix) α ψ) = (iξ) α ˆTψ 

∂ α ˆTψ = (−1) 

|α| ˆT(∂ α ψ) = (−1) |α| T(̂∂ α ψ) = (−1) |α| T((iξ) α ˆψ) 

= (−iξ) |α| T( ˆψ) = ̂ (−iξ) |α| Tψ 

für Schwarz-Funktionen ψ. 

(ii) Dies folgt nach dem gleichen Schema aus den entsprechenden Eigenschaften 

für Schwarz-Funktionen. 

(iii) Für Schwarz-Funktionen ψ gilt ˆTψ = T ˆψ = T ˇψ = Ťψ. 

(iv) Wegen 

ˆŤ = T gilt 

̂ϕ ∗ Tψ = ϕ ∗ T ˆψ = T( ˆψ ∗ ˇϕ) = ˆŤ( ̂ˆψ ∗ ˇϕ) = (2π) 

n 

2 ˆŤ( ˆψ ˆˇϕ) = (2π) n 2 ˇˆT( ˇψ ˇˆϕ) 

= (2π) ˇˆT(̂ 

n 

2 ψ ˆϕ) = (2π) n n 

2 ˆT(ψ ˆϕ) = (2π) 2 ˆϕ ˆT(ψ) 

für Schwarz-Funktionen ψ. 

Beispiele: 

□ 

1. ˆδ = 1 

(2π) n 2 , denn 

ˆδϕ = δ(ˆϕ) = 1 

(2π) n 2 

2. ˆ1 = (2π) n 2 δ, denn nach 1. gilt 

∫ 

∫ 

e −i0·x ϕ(x) dx = 

R n 

R n 1 

(2π) n 2 

ˆ1 = (2π) n 2 ˆδ = (2π) 

n 

2 ˇδ = (2π) 

n 

2 δ. 

ϕ(x) dx ∀ ϕ ∈ S. 

Mit Fouriermethoden lässt sich der Satz von Liouville (vgl. Skript PDG 1) 

wesentlich verallgemeinern. Zur Vorbereitung benötigen wir den folgenden Satz, 

der die Distributionen mit einpunktigem Träger charakterisiert. 

67

Satz 4.38 Es sei T eine Distribution mit supp T = {0}. Dann gibt es ein N ∈ N 

und Zahlen c α für alle Multiindizes |α| ≤ N, so dass 

T = ∑ 

c α ∂ α δ 

ist. 

Beweis. Hausaufgabe. 

|α|≤N 

Satz 4.39 (Verallgemeinerter Satz von Liouville) Es sei L = ∑ |α|≤k a α∂ α 

ein linearer partieller Differentialoperator mit konstanten Koeffizienten. Mit p(ξ) := 

∑ 

|α|≤k a αξ α werde das Symbol von L bezeichnet. 

Ist nun p(iξ) ≠ 0 für alle ξ ∈ R n \ {0}, so ist jede distributionelle Lösung der 

PDG 

LT = 0 mit T ∈ S ′ 

ein Polynom. 

Beweis. Wegen LT = 0 ist 

0 = ̂LT = ∑ 

a α ̂∂α T = ∑ 

a α (iξ) α ˆT = p(iξ) ˆT 

|α|≤k 

|α|≤k 

und somit supp ˆT = {0}, so dass nach Satz 4.38 

ˆT = ∑ 

c α ∂ α δ 

für geeignete N ∈ N und c α ∈ C gilt. 

Dann aber ist 

T = ∑ 

|α|≤N 

|α|≤N 

c α̂ 

(iξ) αˆδ ∑ 

= 

|α|≤N 

c α (−iξ) α (2π) − n 2 . 

Korollar 4.40 (Satz von Liouville für harmonische Funktionen) Ist T ∈ 

L ∞ (R n ) mit ∆T = 0 (im Distributionensinne), so ist T konstant. 

Beweis. Für das zum Laplace-Operator gehörige Symbol p ist p(iξ) = −ξ 2 ≠ 0, 

wenn ξ ≠ 0 ist. Nach Satz 4.39 ist T also ein Polynom. Da T zudem als beschränkt 

vorausgesetzt ist, muss T konstant sein. 

□ 

□ 

68

4.4 Der Satz von Malgrange-Ehrenpreis 

Wie wir in Abschnitt 4.2 gesehen haben, sind Fundamentallösungen ein wesentliches 

Hilfsmittel, um lineare PDG mit konstanten Koeffizienten zu untersuchen. 

Es stellt sich also ganz natürlich die Frage, ob man die Existenz von Fundamentallösungen 

garantieren kann. 

Der Satz von Malgrange-Ehrenpreis, den wir in diesem Abschnitt beweisen 

werden, besagt gerade, dass das tatsächlich immer möglich ist. Es ist instruktiv, 

eine Formel für die Fundamentallösung heuristisch herzuleiten. 

Heuristik: Sei L ein linearer partieller Differentialoperator mit konstanten Koeffizienten, 

dessen Symbol mit p(ξ) bezeichnet werde. Wie im Beweis von Satz 4.39 

gezeigt ist dann ̂LT = p(iξ) ˆT für temperierte Distributionen T. Es folgt 

LE = δ ⇐⇒ p(iξ)Ê = ̂LE = ˆδ = 1 

(2π) n 2 

⇐⇒ Eϕ = 1 ∫ 

(2π) n 2 

R n 

⇐⇒ Ê = 1 

(2π) n 2 p(iξ) 

ˆϕ(−ξ) 

p(iξ) dξ ∀ ϕ ∈ D(Rn ). 

Problematisch ist hier jedoch, dass p(iξ) i.A. Nullstellen hat, so dass dieses Integral 

womöglich nicht konvergiert. (Es gibt jedoch interessante Fälle, in denen 

p(iξ) ≠ 0 ist, wie etwa für den Helmholtz-Operator L = −∆ + c für c > 0 mit 

p(iξ) = ξ 2 + c. Hier lässt sich E tatsächlich in dieser Weise definieren.) 

Die grundlegende Idee zum Beweis der Existenz von Fundamentallösungen 

ist nun, die Nullstellen von p(iξ) beim Integrieren durch einen Umweg in C n zu 

vermeiden. Wir benötigen zur Vorbereitung drei kleine Lemmas. 

Lemma 4.41 Ist f ∈ L 1 (R n ) mit kompaktem Träger, so lässt sich ˆf zu einer 

holomorphen Funktion auf C n fortsetzen. Ist sogar f ∈ C ∞ c (Rn ), dann ist 

sup |ξ α ˆf(ξ)| ≤ C 

|Im ξ|≤M 

für eine von M > 0 abhängende Konstante C. 

Insbesondere ist also für Testfunktionen f die Abbildung 

R n ∋ ζ ↦→ 

sup | ˆf(ζ + iη)| 

{η∈R n :|η|≤M} 

schnell fallend für |ζ| → ∞ (d.h. schneller als jede Potenz |ζ| −N ). 

Beweis. Es ist 

ˆf(ξ) = 1 ∫ 

e −iξ·x f(x) dx. 

(2π) n 2 R n 

Da ξ ↦→ e −ix·ξ holomorph auf C n ist und f kompakten Träger hat, können wir 

beliebig oft unter dem Integral komplex differenzieren. 

69

Ist f zudem C ∞ -glatt, so gilt für |Imξ| ≤ M 

∣ ∫ 

∣ ∣∣∣ 

|ξ α 1 

∣∣∣ 

ˆf(ξ)| = (iξ) α e −iξ·x f(x) dx 

(2π) n ∣ = (−1) |α| ∫ 

∂xe α −iξ·x f(x) dx 

2 

R n (2π) n ∣ 

2 

R ∣ n = 

1 

∣∣∣ 

∣ e 

(2π) n 2 

∫R −iξ·x ∂x α f(x) dx ≤ eRM 

‖∂ α f‖ n (2π) n L 1 

2 

wenn supp f ⊂ B R (0). 

□ 

Es sei im Folgenden L = ∑ |α|≤k a α∂ α ein linearer partieller Differentialoperator 

mit konstanten Koeffizienten und Symbol p(ξ) := ∑ |α|≤k a αξ α , das wir als 

Polynom auf C n auffassen. Nach eventueller Drehung des Koordinatensystems 

dürfen wir annehmen, dass 

p(ξ) = ξ k n + Terme von niedrigerer Ordnung in ξ n . 

Wir setzen ξ ′ = (ξ 1 , . . .,ξ n−1 ) und schreiben p ξ ′ für die Polynome p ξ ′(z) = 

p(iξ ′ , iz) auf C. Die zugehörigen Nullstellen λ 1 (ξ ′ ), . . .,λ k (ξ ′ ) seien so geordnet, 

dass 

{ 

Im λ i (ξ ′ ) < Im λ j (ξ ′ ) 

oder 

i ≤ j ⇐⇒ 

Im λ i (ξ ′ ) = Im λ j (ξ ′ ) und Reλ i (ξ ′ ) ≤ Reλ j (ξ ′ ). 

Da die Koeffizienten von p ξ ′ stetig von ξ ′ abhängen, lässt sich mit ein wenig 

Funktionentheorie nun recht einfach begründen, dass die Abbildungen ξ ′ ↦→ λ i (ξ ′ ) 

stetig sind. (Das folgt aus dem Satz von Rouché, s. etwa [FL].) 

Lemma 4.42 Es gibt eine messbare Funktion φ : R n−1 → [−k, k], so dass 

|φ(ξ ′ ) − Im λ j (ξ ′ )| ≥ 1 

∀ξ ′ ∈ R n−1 ∀j ∈ {1, . . .,k}. 

Beweis. Betrachte die k + 1 Intervalle 

[−k − 1, −k + 1), [−k + 1, −k + 3), . . .,[k − 1, k + 1) 

Für jedes ξ ′ enthält mindestens eines davon keinen der Punkte Im λ 1 (ξ ′ ), . . ., 

Im λ k (ξ ′ ). Setzt man also 

V m := {ξ ′ : Im λ j (ξ ′ ) /∈ [2m − k − 1, 2m − k + 1) ∀j}, m = 0, 1, . . ., k, 

so ist ⋃ m V m = R n−1 . Da die λ j stetig sind, sieht man außerdem leicht, dass die 

Mengen V m messbar sind. Dann aber wird durch 

φ(ξ ′ ) := 2m − k für ξ ′ ∈ V m \ 

eine Funktion mit den gesuchten Eigenschaften definiert. 

□ 

Als letzte Vorbereitung benötigen wir die folgende elementare Abschätzung. 

70 

m−1 

⋃ 

µ=1 

V µ

Lemma 4.43 Es sei g(z) = a k z k + . . . + a 1 z + a 0 ein komplexes Polynom mit 

|a k | = 1 und Nullstellen λ 1 , . . .,λ k . Dann gilt 

|g(0)| ≥ (min 

j 

|λ j |) k . 

Beweis. Wegen g(z) = a k (z − λ 1 ) · . . . · (z − λ n ) ist 

|g(0)| = |a k · λ 1 · . . . · λ k | ≥ (min 

j 

|λ j |) k . 

Satz 4.44 (Satz von Malgrange-Ehrenpreis) Jeder lineare partielle Differentialoperator 

mit konstanten Koeffizienten hat eine Fundamentallösung. 

Beweis. Mit den Bezeichnungen wie zuvor definieren wir E durch 

Eϕ := 1 

(2π) n 2 

∫R n−1 ∫ 

R+iφ(ξ ′ ) 

ˆϕ(−ξ) 

p(iξ) dξ n dξ ′ 

für ϕ ∈ D(R n ), wobei ˆϕ gemäß Lemma 4.41 auf C n fortgesetzt ist. Lemma 4.43 

angewandt auf g(z) = p(iξ ′ , i(ξ n + z)) = p ξ ′(ξ n + z) zeigt 

Es folgt 

|Eϕ| ≤ C 

≤ C 

≤ C 

∫R n−1 ∫ 

R+iφ(ξ ′ ) 

∫ ∫R n−1 

sup 

|p(iξ)| ≥ 1 für ξ n ∈ R + iφ(ξ ′ ). 

(1 + |ξ|) −n−1 (1 + |ξ|) n+1 | ˆϕ(ξ)| dξ n dξ ′ 

(1 + |ξ|) −n−1 dξ n dξ ′ · sup 

R+iφ(ξ ′ ) 

∑ 

|ξ α ˆϕ(ξ)| 

{ξ:|Im ξ|≤k} 

|α|≤n+1 

Wie im Beweis von Lemma 4.41 lässt sich damit 

|Eϕ| ≤ C ∑ 

‖∂ α ϕ‖ L 1 ≤ C ∑ 

|α|≤n+1 

{ξ:|Im ξ|≤k} 

|α|≤n+1 

‖∂ α ϕ‖ L ∞ 

|(1 + |ξ|) n+1 ˆϕ(ξ)| 

schließen. Dies zeigt, dass E tatsächlich eine Distribution ist. 

Wir müssen nun noch nachrechnen, dass E wirklich eine Fundamentallösung 

von L ist. Es gilt 

LE(ϕ) = E(L ′ ϕ) ∀ ϕ ∈ D(R n ), 

□ 

71

wenn L ′ der ‘adjungierte Operator’ L ′ = ∑ |α|≤k (−1)|α| a α ∂ α mit Symbol p ′ (ξ) = 

∑ 

|α|≤k (−1)|α| a α ξ α = p(−ξ) ist. Daher ist für Testfunktionen ϕ 

LE(ϕ) = 1 

(2π) n 2 

∫R n−1 ∫ 

R+iφ(ξ ′ ) 

̂L ′ ϕ(−ξ) 

p(iξ) 

Dabei ist ̂L ′ ϕ(−ξ) = p ′ (i(−ξ))ˆϕ(−ξ) = p(iξ)ˆϕ(−ξ), so dass 

LE(ϕ) = 1 

(2π) n 2 

∫R n−1 ∫ 

R+iφ(ξ ′ ) 

dξ n dξ ′ . 

ˆϕ(−ξ) dξ n dξ ′ 

gilt. Nun ist z ↦→ ˆϕ(−ξ ′ , −z) nach Lemma 4.41 holomorph und schnell fallend für 

|z| → ∞ mit |Im z| ≤ k. Nach dem Cauchyschen Integralsatz ist dann 

∫ 

∫ 

ˆϕ(−ξ ′ , −z) dz = ˆϕ(−ξ ′ , −z) dz 

R+iφ(ξ ′ ) 

R 

und damit schließlich 

LE(ϕ) = 1 

(2π) n 2 

∫ 

R n ˆϕ(−ξ) dξ = ϕ(0) = δ(ϕ). 

□ 

Korollar 4.45 Es sei L ein linearer partieller Differentialoperator mit konstanten 

Koeffizienten, ϕ ∈ D(R n ). Dann existiert eine C ∞ -glatte Lösung von 

Lu = ϕ. 

Beweis. Setze u = ϕ ∗ E für eine Fundamentallösung E. 

Wir können nun auch den Satz 4.26 leicht verallgemeinern. 

□ 


Koeffizienten. Die folgenden Aussagen sind äquivalent: 

(i) Es gibt eine Fundamentallösung, die glatt auf R n \ {0} ist. 

(ii) Jede Fundamentallösung ist glatt auf R n \ {0}. 

(iii) L ist hypoelliptisch. 

Beweis. (ii) =⇒ (i): Dies folgt aus der Existenz von Fundamentallösungen, s. 

Satz 4.44. 

(i) =⇒ (iii): Dies ist gerade die Aussage von Satz 4.26. 

(iii) =⇒ (ii): Ist E eine Fundamentallösung, so ist LE = 0 auf R n \ {0} und 

damit E ∈ C ∞ (R n \ {0}). 

□ 

72

4.5 Sobolevräume und Fouriertransformation 

Im Skript PDG 1 haben wir insbesondere die Sobolveräume 

H k = H k (R n ) = {u ∈ L 2 : ∂ α u ∈ L 2 ∀ |α| ≤ k} 

untersucht. In diesem Abschnitt werden wir H s für beliebige s ∈ R definieren. Insbesondere 

wird sich daraus auch die schon im Skript PDG 1 verwendete Schreibweise 

H −1 für den Dualraum von H 1 erklären. Dazu benötigen wir zunächst eine 

Charakterisierung von H k , die nicht ausnutzt, dass k ∈ N ist. Der Einfachheit 

halber beschränken wir uns hier im Wesentlichen auf Funktionen, die auf ganz 

R n definiert sind. 

Satz 4.47 Sei u ∈ L 2 . Es gilt u ∈ H k genau dann, wenn ξ ↦→ (1+|ξ| 2 ) k 2û(ξ) ∈ L 2 

ist. Die Norm 

u ↦→ ‖(1 + |ξ| 2 ) k 2û‖L 2 

ist äquivalent zur H k -Norm. 

Beweis. Aus der Formel von Plancherel ergibt sich 

∑ 

‖∂ α u‖ 2 L = ∑ 

‖̂∂ α u‖ 2 2 L = ∑ ∫ 

‖ξ α û‖ 2 2 L = 2 

|α|≤k 

|α|≤k 

|α|≤k 

(mit ‖T ‖ L 2 = ∞ für T ∈ S ′ \ L 2 ). Nun gilt einerseits 

∑ 

|ξ α | 2 ≤ C(1 + |ξ| 2 ) k 

|α|≤k 

R n ⎛ 

(Fallunterscheidung, ob |ξ α | ≤ 1 oder > 1), andererseits 

⎝ ∑ 

|α|≤k 

|ξ α | 2 ⎞ 

⎠ |û(ξ)| 2 dξ 

(1 + |ξ| 2 ) k ≤ 2 k (1 + |ξ| 2k ) = C(1 + (|ξ 1 | 2 + . . . |ξ n | 2 ) k ) ≤ C ∑ 

|ξ α | 2 , 

|α|≤k 

d.h. c(1+|ξ| 2 ) k ≤ ∑ |α|≤k |ξα | 2 ≤ C(1+|ξ| 2 ) k für geeignete c, C > 0. Daraus folgt 

c‖(1 + |ξ| 2 ) k 2û‖ 

2 

L 2 ≤ ‖u‖2 H k ≤ C‖(1 + |ξ| 2 ) k 2û‖ 

2 

L 2. 

Dies motiviert die folgende Definition: 

□ 

Definition 4.48 Für s ∈ R setze 

H s := H s (R n ) 

:= {f ∈ S ′ (R n ) : ˆf ∈ L 1 loc(R n ) mit ‖f‖ s := ‖(1 + |ξ| 2 ) s 2 ˆf‖L 2 < ∞}. 

73

(Ist g eine Funktion mit (1 + |ξ| 2 ) s 2g ∈ L 2 , dann ist gϕ ∈ L 1 für ϕ ∈ S, so dass g 

via ϕ ↦→ ∫ gϕ als temperierte Distribution aufgefasst werden kann. Ein solches g 

lässt sich also immer als g = ˆf für ein f ∈ S ′ schreiben.) 

Bemerkung 4.49 1. Es gilt H s ⊂ H s′ für s > s ′ . 

2. Nach Satz 4.47 stimmt diese Definition mit der früheren Definition für 

s ∈ N überein (bis auf den Übergang zu einer äquivalenten Norm). 

3. H s ist ein Hilbertraum bezüglich 

∫ 

〈f, g〉 s = (1 + |ξ| 2 ) s ˆf(ξ)¯ĝ(ξ) dξ. 

Der nächste Satz zeigt, dass (H s ) ′ in kanonischer Weise isomorph zu H −s ist. 

Satz 4.50 Sei s ∈ R. Die Abbildung 

∫ 

Φ : H −s → (H s ) ′ mit (Φg)(f) := ( ˆf, ĝ) L 2 = 

ˆf¯ĝ 

ist ein antilinearer isometrischer Isomorphismus. 

Beweis. Zunächst beachte, dass f ∈ H s , g ∈ H −s 

ˆf¯ĝ = (1 + |ξ| 2 ) s 2 ˆf · (1 + |ξ| 2 ) − s 2 ¯ĝ ∈ L2 · L 2 ⊂ L 1 

impliziert, so dass f ↦→ ∫ ˆf¯ĝ ein stetiges Funktional Φg auf H s definiert mit 

∫ 

∣ 

ˆf¯ĝ 

∣ ≤ ‖(1 + |ξ|2 ) s 2 ˆf‖L 2‖(1 + |ξ| 2 ) − s 2 ¯ĝ‖L 2 = ‖f‖ s ‖g‖ −s . 

Da in dieser Ungleichung Gleichheit gilt, wenn ˆf = (1 + |ξ| 2 ) −s ĝ ist, folgt, dass 

Φ eine antilineare Isometrie ist. 

Es bleibt zu begründen, dass Φ surjektiv ist. Sei dazu 〈·, ˜g〉 s ∈ (H s ) ′ , ˜g ∈ H s . 

Dann ist (1 + |ξ| 2 ) sˆ˜g ∈ S ′ und indem wir g = F −1 ((1 + |ξ| 2 ) sˆ˜g) setzen, erhalten 

wir g ∈ S ′ mit ĝ = (1 + |ξ| 2 ) sˆ˜g. Es folgt 

∫ ∫ 

(Φg)(f) = ˆf¯ĝ = (1 + |ξ| 2 ) s ˆf¯ˆ˜g = 〈f, ˜g〉 s . 

für f ∈ H s . 

□ 

Satz 4.51 Sei s ∈ R, k ∈ N. Dann ist f ∈ H s genau dann, wenn ∂ α f ∈ H s−k 

ist für alle |α| ≤ k. Die Normen 

⎛ ⎞ 1 

‖f‖ s und ⎝ ∑ 

2 

‖∂ α f‖ 2 ⎠ 

s−k 

|α|≤k 

sind äquivalent. 

74

Beweis. Das geht ähnlich wie der Beweis von Satz 4.47. 

Beispiele: 

1. Es gilt S ⊂ H s für alle s ∈ R. Umgekehrt impliziert der Sobolevsche Einbettungssatz 

(s. Skript PDG 1 und Satz 4.52 unten), dass ⋂ s∈R Hs ⊂ C ∞ . 

√ 

2 sinx 

2. Sei f : R → R gegeben durch f(x) = . Dann ist ˆf = χ 

π x (−1,1) und 

damit f ∈ H s für alle s. Beachte aber, dass f nicht in S liegt. 

3. Im R n gilt ˆδ = 1 

‖δ‖ 2 s = 1 

(2π) n 2 

(2π) n 2 

∫ 

. Damit ist 

(1 + |ξ| 2 ) s dξ = |∂B 1(0)| 

R n (2π) n 2 

∫ ∞ 

genau dann, wenn 2s + n − 1 < −1, also wenn s < − n 2 ist. 

0 

(1 + r 2 ) s r n−1 dr < ∞ 

Der Sobolevsche Einbettungssatz für die Räume H s lautet wir folgt. 

Satz 4.52 Für s > k + n 2 gilt Hs ֒→ C k . 

Für s ∈ N haben wir diesen Satz schon im Skript PDG 1 bewiesen. In der 

Tat ist der folgende Beweis für allgemeine s mit Hilfe der Fouriertransformation 

sogar einfacher (funktioniert aber nicht in der allgemeinen Form für W k,p , p ≠ 2). 

Beweis. Wegen F −1 : L 1 (R n ) → C(R n ) mit ‖F −1 g‖ L ∞ ≤ ‖g‖ L 1, genügt es zu 

zeigen, dass für alle Multiindizes α mit |α| ≤ k gilt 

da 

f ∈ H s =⇒ ̂∂ α f ∈ L 1 mit ‖̂∂ α f‖ L 1 ≤ C‖f‖ s . 

Dies sieht man wie folgt: 

∫ 

|ξ α ˆf(ξ)| dξ ≤ C 

∫ 

∫ 

= C 

≤ C‖f‖ s 

(∫ 

∫ ∞ 

0 

(1 + |ξ| 2 ) k 2 | ˆf(ξ)| dξ 

(1 + |ξ| 2 ) s 2 | ˆf(ξ)| · (1 + |ξ| 2 ) k−s 

2 dξ 

(1 + |ξ| 2 ) k−s dξ 

(1 + r 2 ) k−s r n−1 dr < ∞ 

)1 

2 

≤ C‖f‖s , 

ist für 2(k − s) + n − 1 < −1 ⇐⇒ s > k + n. 

□ 

2 

Im Skript PDG 1 haben wir auch die Spurabbildung für Sobolev-Funktionen 

untersucht. Dabei stellte sich heraus, dass W 1,p -Funktionen auf (hinreichend gutartigen) 

Mengen der Kodimension 1 immer noch als L p -Funktionen wohldefiniert 

sind. Es ist nun interessant, die Spurabbildung auf H s näher zu betrachten. Der 

Einfachheit halber beschränken wir uns hier auf die Restriktion auf eine Hyperebene. 

Der folgende Satz zeigt, dass man pro Dimension in der Tat nur eine halbe 

Differenzierbarkeitsordnung verliert. 

75 

□

Satz 4.53 Seien k ∈ N und s ∈ R mit s > k . Es gibt eine stetige lineare 

2 

Spurabbildung T : H s (R n ) → H s− k 2(R n−k ) mit 

(Tf)(y) = f(y, 0) ∀ y ∈ R n−k ∀ f ∈ S. 

Der Beweis benötigt das folgende Dichtheitsresultat, das von eigenständigem 

Interesse ist: 

Lemma 4.54 Für alle s ∈ R ist S dicht in H s . 

Beweis. Ist f ∈ H s , so ist (1 + |ξ| 2 ) s 2 ˆf ∈ L 2 und zu ε > 0 existiert ein ψ ∈ D mit 

‖(1 + |ξ| 2 ) s 2 ˆf − ψ‖L 2 < ε. Dann ist aber auch ϕ = (1 + |ξ| 2 ) − s 2ψ ∈ D ⊂ S und 

somit F −1 ϕ ∈ S mit 

‖f − F −1 ϕ‖ s = ‖(1 + |ξ| 2 ) s 2 ˆf − (1 + |ξ| 2 ) s 2 ϕ‖L 2 = ‖(1 + |ξ| 2 ) s 2 ˆf − ψ‖L 2 < ε. 

Beweis von Satz 4.53. Definiere T : S(R n ) → S(R n−k ) durch (Tf)(y) = f(y, 0). 

Dann ist 

∫ 

1 

( 

e iη·y ̂Tf(η) dη = Tf(y) = f(y, 0) = F −1 Ff ) (y, 0) 

(2π) n−k 

2 R n−k = 1 ∫ 

e i(y,0)·(η,ζ) ˆf(η, ζ) d(η, ζ) 

(2π) n 2 

R n ( 

) 

1 

= e 

∫R iη·y 1 

ˆf(η, ζ) dζ dη. 

n−k (2π) k 2 

∫R k 

(2π) n−k 

2 

Fouriertransformation auf R n−k liefert 

Es folgt 

|̂Tf(η)| 2 = 1 

(2π) k (∫ 

≤ 1 

(2π) k ∫ 

̂Tf(η) = 1 

(2π) k 2 

∫ 

R k ˆf(η, ζ) dζ. 

) 2 

ˆf(η, ζ)(1 + |η| 2 + |ζ| 2 ) s 2 · (1 + |η| 2 + |ζ| 2 ) − s 2 dζ 

R k ∫ 

| ˆf(η, ζ)| 2 (1 + |η| 2 + |ζ| 2 ) s dζ (1 + |η| 2 + |ζ| 2 ) −s dζ. 

R k R k 

Mit 1 + |η| 2 =: a 2 und der Substitution t = r errechnet sich das letzte Integral 

a 

zu ∫ ∞ 

∫ ∞ 

C (a 2 + r 2 ) −s r k−1 dr = Ca k−2s (1 + t 2 ) −s t k−1 dt = Ca k−2s , 

0 

0 

□ 

76

denn es ist −2s + k − 1 < −1 wegen s > k . Wir haben demnach 

2 

∫ 

|̂Tf(η)| 2 ≤ C(1 + |η| 2 ) k−2s 

2 | ˆf(η, ζ)| 2 (1 + |η| 2 + |ζ| 2 ) s dζ 

R k 

und also 

∫ 

(1 + |η| 2 ) s− k 2 |̂Tf(η)| 2 ≤ C ˆf(η, ζ)(1 + |η| 2 + |ζ| 2 ) s dζ. 

R k 

Daraus ergibt sich durch Integration nach η 

‖Tf‖ s− 

k 

2 

≤ C‖f‖ s . 

Nach Lemma 4.54 lässt sich T nun (eindeutig) zu einer stetigen Abbildung T : 

H s (R n ) → H s− k 2(R n−k ) fortsetzen. 

□ 

Wir erwähnen noch, wie man H s -Distributionen auf allgemeineren Gebieten 

Ω erklärt. Beachte, dass f ↦→ ϕf ein stetiger Operator auf allen H s ist für ϕ ∈ S. 

Für Ω ⊂ R n offen setzt man 

H s loc (Ω) := {T ∈ D′ (Ω) : ∀ U ⊂⊂ Ω ∃f ∈ H s (R n ) mit T = S auf U}. 

Es gilt dann T ∈ H s loc (Ω) ⇐⇒ ϕT ∈ Hs (R n ) ∀ ϕ ∈ D(Ω). 

Wie für natürliche Exponenten definiert man 

H s 0 (Ω) := C∞ c (Ω) 

(Abschluss in der H s -Norm). 

Ist schließlich ∂Ω hinreichend gutartig (z.B. Lipschitz), so kann man auch 

H s (Ω) durch Einschränkung auf Ω definieren. 

4.6 Distributionen aus funktionalanalytischer Sicht 

Zum Schluss dieses Kapitels gehen wir noch kurz auf die funktionalanalytische 

Sicht auf die Theorie der Distributionen ein. Dabei setzen wir einige Resultate aus 

der Theorie der lokalkonvexen Räume als bekannt voraus. Beweise dazu finden 

sich etwa in [We]. 

Zur Erinnerung: Ein topologischer Vektorraum X (also ein Vektorraum, der 

mit einer Topologie versehen ist, bezüglich der die Skalarmultiplikation und die 

Vektoraddition stetig sind) ist ein lokalkonvexer Raum, wenn es eine Familie P 

von Halbnormen gibt, so dass 

{ 

{x ∈ X : p(x) < ε ∀ p ∈ F } : F ⊂ P endlich, ε > 0 

} 

eine Nullumgebungsbasis ist. Umgekehrt induziert jede Familie P von Halbnormen 

auf einem Vektorraum X eine lokalkonvexe Topologie auf X. 

Beispiele: 

77

1. Sei Ω ⊂ R n offen, K ⊂ Ω kompakt. Setze 

und 

D K (Ω) := {ϕ ∈ D(Ω) : supp ϕ ⊂ K} 

P = {p α : α ein Multiindex}, p α (ϕ) = ‖∂ α ϕ‖ ∞ . 

Dann erzeugt P eine lokalkonvexe Topologie τ K auf D K (Ω). 

2. Betrachte nun D(Ω). Es sei τ K die in 1. definierte Topologie auf D K (Ω). 

Setze dann 

P := { p Halbnorm auf D(Ω) : P |DK (Ω) ist stetig bzgl. τ K 

} 

. 

Dies erzeugt eine lokalkonvexe Topologie τ auf D(Ω). 

Wir erinnern noch an die folgenden beiden allgemeinen Tatsachen über lokalkonvexe 

Räume: 

Lemma 4.55 Es sei X ein von P erzeugter lokalkonvexer Raum. 

(i) Alle p ∈ P sind stetig. 

(ii) Ist P ⊂ Q ⊂ {q stetige Halbnorm auf X}, so erzeugt Q die gleiche lokalkonvexe 

Topologie wie P. 

(iii) Sei q eine Halbnorm auf X. Dann gilt 

q stetig ⇐⇒ ∃ p 1 , . . .,p N ∈ P, C > 0 mit q ≤ C max 

1≤i≤N p i. 

Lemma 4.56 Es sei X ein von P erzeugter lokalkonvexer Raum, T ein lineares 

Funktional auf X. Dann sind äquivalent: 

(i) T ist stetig. 

(ii) T ist stetig bei 0. 

(iii) Es gibt p 1 , . . .,p N ∈ P, C > 0, so dass für alle x ∈ X 

gilt. 

|Tx| ≤ C max 

1≤i≤N p i(x) 

Wie bei Banachräumen bezeichnet man die Menge der stetigen Funktionale 

auf X mit X ′ . Für die oben eingeführten lokalkonvexen Räume D K (Ω) und D(Ω) 

mit Topologien τ K bzw. τ ergibt sich nun 

Lemma 4.57 (i) Die Relativtopologie von τ auf D K (Ω) ist τ K . 

78

(ii) Ein lineares Funktional T auf D(Ω) ist genau dann stetig, wenn die Restriktionen 

T |DK (Ω) auf D K (Ω) stetig sind für alle K ⊂ Ω kompakt. 

Beweis. (i) Das folgt ‘relativ leicht’ aus Lemma 4.55(ii). 

(ii) Dass die Bedingung notwendig ist, folgt aus (i). Die Umkehrung ergibt sich 

aus den Lemmas 4.56 und 4.55: Für jedes K gibt es Halbnormen p 1 , . . .,p N , C > 0 

mit |Tϕ| ≤ C max 1≤i≤N p i (ϕ) für alle ϕ ∈ D K (Ω). Damit ist aber ϕ ↦→ |Tϕ| eine 

stetige Halbnorm auf allen D K (Ω). Nach Konstruktion von τ ist daher T stetig 

auf D(Ω). 

□ 

Satz 4.58 Es seien ϕ, ϕ 1 , ϕ 2 , . . . ∈ D(Ω). Dann sind äquivalent: 

(i) ϕ m → ϕ bezüglich τ. 

(ii) Es gibt eine kompakte Menge K ⊂ Ω, so dass supp ϕ, supp ϕ m ⊂ K für alle 

m gilt und 

∂ α ϕ m → ∂ α ϕ 

gleichmäßig konvergiert für alle Multiindizes α. 

(iii) Es gibt eine kompakte Menge K ⊂ Ω, so dass ϕ, ϕ m ∈ D K (Ω) für alle m 

gilt und ϕ m → ϕ bezüglich τ K konvergiert. 

Dieser Satz zeigt, dass die in Definition 4.2 definierte Konvergenz auf D(Ω) 

gerade die Konvergenz im lokalkonvexen Raum (D(Ω), τ) ist. 

Beweis. (ii) ⇐⇒ (iii) ist klar und (iii) =⇒ (i) ergibt sich direkt aus Lemma 

4.57(i). Es bleibt (i) =⇒ (iii) zu beweisen. Dazu wiederum genügt es zu zeigen, 

dass K ⊂ Ω kompakt mit ϕ, ϕ m ∈ D K (Ω) für alle m existiert. 

Um einen Widerspruch herzuleiten, nehmen wir an, ein solches K gebe es 

nicht. Wähle kompakte Mengen K 1 ⊂ K 2 ⊂ . . . ⊂ Ω mit ⋃ m K m = Ω (etwa 

K m = {x ∈ Ω : dist(x, ∂Ω) ≥ m −1 , |x| ≤ m}). Dann gibt es eine Teilfolge (wieder 

mit m indiziert), so dass ϕ m ∈ D Km (Ω) \ D Km−1 (Ω) ist. Wähle x m ∈ K m \ K m−1 

mit |ϕ m (x m )| = c m ≠ 0. 

Da für alle c > 0, y ∈ Ω die Abbildung ϕ ↦→ c|ϕ(y)| eine stetige Halbnorm 

auf D(Ω) ist, ist auch 

c −1 

m |ϕ(x m )| 

p(ϕ) := ∑ m 

eine stetige Halbnorm auf D(Ω). (Beachte, dass für jede kompakte Menge K ⊂ Ω 

ein m mit K ⊂ K m existiert, diese Summe also endlich auf D K (Ω) ist. Da die 

Einschränkung von p auf D K (Ω) offenbar stetig ist, ergibt sich die Stetigkeit auf 

D(Ω) direkt aus der Konstruktion der Topologie auf D(Ω).) 

Nun ist aber ϕ m − ϕ → 0 =⇒ p(ϕ m − ϕ) → 0 im Widerspruch zu 

p(ϕ m − ϕ) ≥ c −1 

m |ϕ m (x m ) − ϕ(x m )| = c −1 

m |ϕ m (x m )| = 1 

79

für hinreichend großes m. 

Wir können nun den Raum der Distributionen D ′ (Ω) als den funktionalanalytischen 

Dualraum des lokalkonvexen Raums D(Ω) identifizieren. 

Satz 4.59 Es sei T ein lineares Funktional auf D(Ω). Dann sind äquivalent: 

(i) T ist stetig. (D.h. T ∈ D ′ (Ω) im funktionalanalytischen Sinne.) 

(ii) Für alle kompakte K ⊂ Ω existieren C > 0, N ∈ N mit 

|Tϕ| ≤ C ∑ 

‖∂ α ϕ‖ ∞ . 

|α|≤N 

(D.h. T ∈ D ′ (Ω) im PDG-Sinne, s. Definition 4.1.) 

(iii) ϕ k → 0 in D(Ω) impliziert Tϕ k → 0. 

Beweis. (ii) ⇐⇒ (iii) haben wir schon in Satz 4.3 gezeigt. 

(i) =⇒ (iii) ist klar. 

(iii) =⇒ (i): Nach (iii) ist T folgenstetig, insbesondere auf jedem D K (Ω), 

K ⊂ Ω kompakt. Die Topologie auf D K (Ω) ist jedoch metrisierbar, da von einer 

abzählbaren Familie von Halbnormen induziert (Übung). Daher ist T |DK (Ω) stetig. 

Mit Lemma 4.57 folgt nun, dass T stetig ist. 

□ 

□ 

80

Kapitel 5 

Variationsmethoden für 

vektorwertige Probleme 

Im letzten Kapitel widmen wir uns wieder einer besonderen Klasse nicht-linearer 

Probleme: Wir untersuchen Funktionale auf (Teilmengen von) Funktionenräumen 

auf die Existenz von Minimierern. Unter geeigneten Voraussetzungen erfüllen 

diese Minimierer eine PDG, die sich aus dem betrachteten Funktional ableitet, 

die Euler-Lagrange-Gleichung. 

Im Skript PDG 1, Kap. 5.4 hatten wir uns bereits mit Problemen dieser Art 

beschäftigt. Dort war I ein Funktional von der Form 

∫ 

I(u) = f(x, u(x), Du(x)) 

U 

auf einer Teilmenge des Sobolevraums W 1,p (U), U ⊂ R n offen, zu minimieren. 

Im Unterschied hierzu wollen wir nun vektorwertige Probleme untersuchen, d.h. 

Funktionale auf (Teilmengen von) W 1,p (U; R m ). Wie im Skript PDG 1 wollen wir 

Minimierer mit der sog. direkten Methode finden. 

Es stellt sich nun heraus, dass die Situation für vektorwertige Probleme wesentlich 

komplizierter ist als im skalaren Fall. Die skalaren Ergebnisse lassen sich 

zwar unschwer auf den allgemeinen Fall übertragen. Doch dies führt in den Anwendungen 

zu viel zu starken Voraussetzungen. Im Falle der dreidimensionalen 

Elastizitätstheorie werden wir sehen, dass man tatsächlich neue Konzepte 

benötigt, um physikalisch relevante Probleme behandeln zu können. 

5.1 Euler-Lagrange-Gleichung 

Wir untersuchen zunächst den Zusammenhang zwischen Minimierern und der 

Euler-Lagrange-Gleichung, der fast völlig analog zum skalaren Fall verläuft (vgl. 

Skript PDG 1). 

81

Es sei U ⊂ R n offen und beschränkt und 

f : U × R m × R m×n → R ∪ {∞}, 

(x, y, z) = (x 1 , . . .,x n , y, z 11 , z 12 , . . .,z mn ) ↦→ f(x, y, z) 

eine glatte Funktion. Betrachte das Funktional 

∫ 

I(u) = f(x, u(x), Du(x)) dx. 

Erfüllt f die Wachstumsbedingung 

U 

|f(x, y, z)| ≤ C (1 + |y| p + |z| p ) , 

für ein 1 ≤ p < ∞, so ist es natürlich, den Sobolevraum W 1,p (U) (oder einen Teilraum 

davon) als Definitionsbereich von I anzunehmen. Da wir auch Randwertprobleme 

betrachten wollen, nehmen wir an, dass ∂U C 1 -glatt 1 ist und betrachten 

I auf 

A = A g := {u ∈ W 1,p (U; R m ) : u = g auf ∂U im Spursinne} 

= {u ∈ W 1,p (U) : u − g ∈ W 1,p 

0 (U; R m )}, 

wobei g eine gegebene Funktion in W 1,p (U; R m ) sei. 

Es sei nun u eine Minimalstelle von I. Ist dann v ∈ W 1,p 

0 (U; R m ), so ist auch 

u + tv = g auf ∂U für t ∈ R und die Funktion 

t ↦→ i(t) := I(u + tv) 

nimmt bei t = 0 ein Minimum an. Wenn also i differenzierbar ist, muss i ′ (0) = 0 

gelten. Um dies nachzuweisen, nehmen wir zusätzlich an, dass f die Wachstumsbedingungen 

|D y f(x, y, z)|, |D z f(x, y, z)| ≤ C ( 1 + |y| p−1 + |z| p−1) 

für x ∈ U, y ∈ R m , z ∈ R m×n erfüllt. Dann ist nach der Youngschen Ungleichung 

(also ab ≤ ap 

+ bq für a, b ≥ 0, 1 + 1 = 1) 

p q p q ∣ d 

∣∣∣ 

∣dt f(x, u(x) + tv(x), Du(x) + tDv(x)) 

= |D y f(x, u(x) + tv(x), Du(x) + tDv(x)) v(x) 

+ D z f(x, u(x) + tv(x), Du(x) + tDv(x))Dv(x)| 

≤ C(1 + |u(x) + tv(x)| p−1 + |Du(x) + tDv(x)| p−1 )(|v(x)| + |Dv(x)|) 

≤ C(1 + |u(x) + tv(x)| p + |Du(x) + tDv(x)| p ) + C(|v(x)| p + |Dv(x)| p ) 

≤ C(1 + |u(x)| p + |Du(x)| p ) + C(|v(x)| p + |Dv(x)| p ) 

1 Es würde auch reichen anzunehmen, dass U einen Lipschitz-Rand hat. 

82

für |t| ≤ 1. Die letzte Funktion ist unabhängig von t ∈ (−1, 1) und integrierbar. 

Wir dürfen also unter dem Integral differenzieren und erhalten 

∫ 

0 = i ′ d 

(0) = 

U dt∣ f(x, u(x) + tv(x), Du(x) + tDv(x)) dx 

t=0 

∫ n∑ 

m∑ n∑ 

= ∂ yi f(x, u(x), Du(x))v i (x) + ∂ zij f(x, u(x), Du(x))∂ j v i (x) dx. 

U 

i=1 

Durch diese Rechnung und partielle Integration motiviert definieren wir: 

Definition 5.1 Wir sagen u ∈ A ist eine schwache Lösung des Randwertproblems 

i=1 

j=1 

− div(D z f(x, u(x), Du(x)) + D y f(x, u(x), Du(x)) = 0 in U, 

u = g auf ∂U. 

wenn 

∫ 

D y f(x, u(x), Du(x)) · v(x) + D z f(x, u(x), Du(x)) : Dv(x) dx = 0 

U 

für alle v ∈ W 1,p 

0 (U; R m ). 

Hier ist D z f als m × n Matrix mit den Einträgen ∂ zij f zu verstehen. (Das Skalarprodukt 

im Matrizenraum wird oft mit einem Doppelpunkt bezeichnet. Für 

A = (a ij ), B = (b ij ) ∈ R m×n ist A : B := ∑ m ∑ n 

i=1 j=1 a ij b ij = Spur(A T B).) In 

Indexschreibweise entspricht das den m Gleichungen 

− ∑ j 

∂ j ∂ zi jf(x, u(x), Du(x)) + ∂ yi f(x, u(x), Du(x)) = 0 für i = 1, . . ., m. 

Unsere Rechnung von oben zeigt dann: 

Satz 5.2 Es sei f : U × R m × R m×n → R eine glatte Funktion, die den Wachstumsbedingungen 

|f(x, y, z)| ≤ C (1 + |y| p + |z| p ), 

|D y f(x, y, z)|, |D z f(x, y, z)| ≤ C ( 1 + |y| p−1 + |z| p−1) 

für alle x ∈ U, y ∈ R m , z ∈ R m×n genügt. Ist dann I(u) = min v∈A I(v), so ist u 

eine schwache Lösung des Randwertproblems 

− div(D z f(x, u(x), Du(x)) + D y f(x, u(x), Du(x)) = 0 in U, 

u = g auf ∂U. 

Bemerkung 5.3 Die PDG 

− div(D z f(x, u(x), Du(x)) + D y f(x, u(x), Du(x)) = 0 

heißt die zum Funktional I gehörige Euler-Lagrange-Gleichung. Diese Gleichung 

ist eine PDG in Divergenzform. 

83

Beispiel: Ein genuin vektorwertiges variationelles Problem ist das Auffinden von 

Deformationen kleiner Energie in der dreidimensionalen Elastizitätstheorie. Es sei 

U ⊂ R 3 ein elastischer Körper, U ⊂ R 3 offen und beschränkt. Ordnet man jedem 

Punkt x aus U einen Punkt y(x) ∈ R 3 zu, so wird dadurch eine Deformation y 

definiert. Die zur Deformation y nötige Energie, die aus den lokalen Verzerrungen 

herrührt, ist für sog. hyperelastische Materialien durch ein Integralfunktional von 

der Form 

∫ 

E(y) = W(x, Dy(x)) dx 

U 

gegeben. Hierbei ist W die gespeicherte Energiedichte, die im Falle homogener 

Materialien nicht explizit von x abhängt. Die Abhängigkeit von y dutch den Deformationsgradienten 

Dy erklärt sich dadurch, dass Dy gerade die lokalen Verzerrungen 

des Körpers misst, die die elastische Energie speichern. Ein Minimierer 

von E in der Klasse A beschreibt dann die energetisch günstigste Konfiguration, 

die die vorgegebenen Randwerte realisiert. 

5.2 Die direkte Methode 

Mit der direkten Methode der Variationsrechnung lässt sich unter geeigneten Voraussetzungen 

die Existenz von Minimierern bestimmter Funktionale ‘direkt’ zeigen, 

ohne die zugehörigen Euler-Lagrange-Gleichungen zu untersuchen. Wir wiederholen 

zunächst das allgemeine Prinzip, das schon im Skript PDG 1 vorgestellt 

wurde. 

Es sei I : X → R ein Funktional auf einem metrischen (oder auch nur topologischen) 

Raum X. Ist I nach unten beschränkt, so kann man eine Minimalfolge 

(u n ) betrachten, d.h. eine Folge (u n ) mit 

lim I(u n) = inf I(v). 

n→∞ v∈X 

Nun würde man gerne folgern, dass (u n ) (oder auch nur eine Teilfolge) gegen 

ein u ∈ X konvergiert. Im Allgemeinen ist jedoch die Annahme, dass etwa X 

kompakt ist, viel zu stark. Da auf Minimalfolgen die Werte I(u n ) beschränkt 

sind, genügt es vielmehr zu fordern, dass die Niveaumengen {v : I(v) ≤ c}, 

c ∈ R, relativ kompakt (bzw. relativ folgenkompakt) sind. Ist dies gewährleistet, 

können wir in der Tat u n → u annehmen. 

Nun möchten wir noch u als Minimierer von I identifizieren. Ohne jede Voraussetzung 

an I ist das sicher falsch. Ist aber I unterhalbstetig (bzw. unterhalbfolgenstetig), 

so ist 

inf I(v) = lim I(u n) = lim inf I(u n ) ≥ I(u) ≥ inf I(v) 

v∈X n n 

v∈X 

und damit tatsächlich I(u) = inf v∈X I(v). 

84

Sei wieder f : U × R m × R m×n → R glatt, U ⊂ R n offen mit C 1 - (oder 

Lipschitz-)Rand, und I das Funktional 

∫ 

I(u) = f(x, u(x), Du(x)) dx 

U 

auf dem Raum A = A g = {u ∈ W 1,p (U) : u = g im Spursinne} der zulässigen 

Funktionen. Genau wie im skalaren Fall (vgl. Skript PDG 1), ergeben sich die nötigen 

Kompaktheitseigenschaften der Niveaumengen aus Koerzivitätsannahmen an 

f. 

Lemma 5.4 Erfüllt f die Wachstumsbedingung 

f(x, y, z) ≥ c 1 |z| p − c 2 

für geeignete Konstanten c 1 > 0, c 2 ∈ R, p ∈ (1, ∞), so ist {v ∈ A : I(v) ≤ c} 

schwach relativ folgenkompakt für jedes c ∈ R. 

Beachte, dass unter dieser Wachstumsbedingung I auf A wohldefiniert ist, 

wenn man den Wert I(u) = +∞ zulässt. 

Beweis. Ist v ∈ A mit I(v) ≤ c, so gilt 

∫ 

∫ 

c 1 |Dv(x)| p dx ≤ f(x, v(x), Dv(x)) + c 2 dx = I(v) + c 2 |U| ≤ c + c 2 |U|. 

U 

U 

Nach der Poincaréschen Ungleichung ist dann auch 

‖v‖ L p ≤ ‖v − g‖ L p + ‖g‖ L p ≤ C‖D(v − g)‖ L p + ‖g‖ L p 

≤ C(‖Dv‖ L p + ‖Dg‖ L p) + ‖g‖ L p. 

beschränkt. 

Ist daher (u k ) eine Folge in {v ∈ A : I(u) ≤ c}, so ist (u k ) beschränkt in 

W 1,p (U). Da L p reflexiv ist, existieren also u, v 1 , . . .v n ∈ L p (U), so dass u kj ⇀ u 

und ∂ i u kj ⇀ v i für eine geeignete Teilfolge u kj . Da für ϕ ∈ C ∞ c (U) gilt ∫ v i ϕ = 

lim j 

∫ 

∂i u kj ϕ = − lim j 

∫ 

ukj ∂ i ϕ = − ∫ u ∂ i ϕ, ist tatsächlich v i = ∂ i u und es gilt 

u kj ⇀ u, Du kj ⇀ Du in L p . 

Weil die Spurabbildung stetig ist, ist auch u = g auf ∂U, so dass u ∈ A gilt. □ 

Auch die Unterhalbstetigkeit kann man wie im skalaren Fall folgern, wenn f 

konvex ist. Wir werden jedoch gleich im Anschluss an den folgenden Satz sehen, 

dass im vektorwertigen Fall die Annahme f sei konvex für wichtige Anwendungen 

zu restriktiv ist. 

85

Lemma 5.5 Es sei f : U ×R m ×R m×n → R eine glatte, nach unten beschränkte 

Funktion, so dass 

z ↦→ f(x, y, z) 

konvex ist für alle x ∈ U, y ∈ R m . Dann ist I schwach unterhalbfolgenstetig auf 

W 1,p (U; R m ). 

Beweis. Es sei (u k ) eine Folge mit u k ⇀ u in W 1,p (U; R m ), d.h. u k ⇀ u in 

L p (U; R m ) und Du k ⇀ Du in L p (U; R m×n ). Es ist zu zeigen, dass m := lim inf k→∞ 

I(u k ) ≥ I(u). Nach Übergang zu einer Teilfolge (wieder mit (u k ) bezeichnet) 

können wir annehmen, dass m = lim k→∞ I(u k ) ist. 

Aus dem Satz von Rellich-Kondrachov folgt u k → u stark in L p . Indem wir 

zu einer Teilfolge (wieder mit (u k ) bezeichnet) übergehen, können wir außerdem 

u k → u fast überall annehmen. 

Nach dem Satz von Egorov 2 existiert nun zu jedem j ∈ N eine Menge A j , so 

dass 

u k → u gleichmäßig auf A j und |U \ A j | ≤ j −1 . 

Dabei können wir natürlich A j so wählen, dass A j+1 ⊃ A j . Wähle nun noch 

Mengen B j := {x ∈ U : |u(x)|+|Du(x)| ≤ j} und beachte, dass lim j→∞ |U \B j | = 

0, da |u| + |Du| integrierbar ist. Dann aber ist auch lim j→∞ |U \ (A j ∩ B j )| = 0. 

Da f nach unten beschränkt ist, können wir nach Addition mit einer geeigneten 

Konstanten annehmen, dass f ≥ 0 gilt. Aus der Konvexität von f in z 

erhalten wir für jedes j: 

∫ 

∫ 

I(u k ) = f(x, u k , Du k ) dx ≥ f(x, u k , Du k ) dx 

U 

A j ∩B 

∫ 

j 

≥ f(x, u k , Du) + D z f(x, u k , Du) · (Du k − Du) dx. 

A j ∩B j 

Auf A j ∩B j konvergieren nun f(x, u k , Du) und D z f(x, u k , Du) gleichmäßig gegen 

f(x, u, Du) bzw. D z f(x, u, Du). Da zudem Du k schwach gegen Du konvergiert, 

ergibt sich 

∫ 

m = lim I(u k ) ≥ f(x, u, Du) dx. 

k→∞ 

A j ∩B j 

Da f ≥ 0 vorausgesetzt ist, folgt nun mit monotoner Konvergenz (wegen 

A j+1 ∩ B j+1 ⊃ A j ∩ B j ) 

∫ 

m ≥ lim f(x, u, Du) dx = I(u). 

j→∞ 

A j ∩B j 

2 Der Satz von Egorov besagt: Ist U ⊂ R n messbar mit |U| < ∞ und f k eine Funktionenfolge 

mit f k → f fast überall, so gibt es zu jedem ε > 0 eine Menge A ε mit |U \ A ε | ≤ ε, so dass 

f k → f gleichmäßig auf A ε konvergiert. (Dieser Satz wird in der Maßtheorie bewiesen.) 

86 

□

Korollar 5.6 Es sei f : U × R m × R m×n → R eine glatte Funktion, die die 

Wachstumsbedingung 

f(x, y, z) ≥ c 1 |z| p − c 2 

für geeignete Konstanten c 1 > 0, c 2 ∈ R, p ∈ (1, ∞) erfülle, so dass 

z ↦→ f(x, y, z) 

konvex ist für alle x ∈ U, y ∈ R m . Dann existiert ein u ∈ A mit 

I(u) = inf 

v∈A I(v). 

Beweis. Das folgt mit der direkten Methode aus Lemma 5.4 und Lemma 5.5. □ 

Insbesondere ist der Minimierer nach Satz 5.2 eine schwache Lösung der 

Euler-Lagrange-Gleichungen unter geeigneten Wachstumsbedingungen an f und 

D (y,z) f. 

Beispiel: Um einzusehen, dass Konvexität i.A. eine zu starke Annahme ist, betrachten 

wir wieder das Energiefunktional 

∫ 

E(y) = W(Dy) 

aus dem vorigen Beispiel. Liegen in der Ausgangslage (der sog. Referenzkonfiguration) 

keine internen Verspannungen vor, so wird man nach geeigneter Normierung 

annehmen dürfen, dass W ≥ 0 ist und W(F) = 0 ist, wenn F die Einheitsmatrix 

F = Id ist. Da reine Drehungen keine elastische Energie kosten sollten, sollte W 

sogar auf ganz SO(3) verschwinden. Wäre nun W konvex, so wäre 

⎛⎛ 

⎞⎞ 

⎛⎛ 

⎞⎞ 

⎛⎛ 

⎞⎞ 

0 0 0 

0 ≤ W ⎝⎝0 0 0⎠⎠ ≤ 1 −1 0 0 

2 W ⎝⎝ 

0 −1 0⎠⎠ + 1 1 0 0 

2 W ⎝⎝0 1 0⎠⎠ ≤ 0. 

0 0 1 

0 0 1 

0 0 1 

Das ist aber unphysikalisch: Man kann einen dreidimensionalen elastischen Körper 

nicht auf einen eindimensionalen Strich zusammenpressen, ohne dem System 

Energie zuzuführen. (Im Gegenteil: Eine solche Deformation sollte sogar unendlich 

viel Energie kosten.) 

U 

5.3 Polykonvexität 

In diesem Abschnitt werden wir das eben angesprochene Dilemma lösen, indem 

wir Integranden zulassen, die nicht mehr konvex sein müssen. Um die direkte Methode 

zur Auffindung von Minimierern anwenden zu können, müssen wir jedoch 

sicherstellen, das die betrachteten Funktionale noch unterhalbstetig sind. Als geeignete 

Klasse von Integranden werden sich die sog. polykonvexen Funktionen 

87

herausstellen. Diese Funktionen führen einerseits zu unterhalbstetigen Funktionalen, 

andererseits lassen sich mit ihnen Energiefunktionale modellieren, die auch 

physikalisch sinnvoll sind. 

Im folgenden Abschnitt werden wir sehen, dass diese Klasse der guten Integranden 

noch erweitert werden kann. Im Allgemeinen kann es jedoch sehr schwierig 

sein zu entscheiden, ob die direkte Methode anwendbar ist. Polykonvexität 

(gemeinsam mit geeigneten Wachstumsbedingungen) liefert hier ein wichtiges hinreichendes 

Kriterium. 

Wir erinnern zunächst an den Begriff der Kofaktormatrix aus der linearen 

Algebra. Ist A eine r×r Matrix und bezeichnet man mit A(i, j) die (r−1)×(r−1) 

Matrix, die dadurch entsteht, dass man die i-te Zeile und die j-te Spalte in A 

streicht, so ist die Kofaktormatrix cof A definiert als die r × r Matrix mit den 

Einträgen 

(cof A) ij = (−1) i+j det A(i, j). 

In der linearen Algebra zeigt man, dass 

det A Id = A T cof A = A(cof A) T (5.1) 

gilt. Beachte, dass cof A ist gerade die Ableitung von det A nach den Einträgen 

von A ist: Nach (5.1) gilt 

n∑ 

det A δ ij = a ki (cof A) kj (5.2) 

k=1 

für alle i, j ∈ {1, . . .r}. Setzt man i = j = m in (5.2), so ergibt sich 

∂ det A 

= ∂ n∑ 

a km (cof A) km = (cof A) lm . (5.3) 

∂a lm ∂a lm 

k=1 

Das wesentliche Hilfsresultat ist nun, dass die Kofaktormatrix einer Jakobimatrix 

divergenzfrei ist: 

Lemma 5.7 Es sei u : U → R n , U ⊂ R n offen, glatt. Dann gilt 

div(cof Du) = 0, 

wobei die Divergenz zeilenweise zu nehmen ist, also 

n∑ 

∂ j ((cof Du) ij ) = 0 für i = 1, . . ., n. 

j=1 

Beweis. Wendet man (5.2) auf A = Du an und bildet die Divergenz, so ergibt 

sich 

∑ 

∂ j (det Du δ ij ) = ∑ ( n∑ 

) 

∂ j ∂ i u k (cof Du) kj 

j 

j k=1 

88

Mit Hilfe von (5.3) folgt daraus 

∑ 

j,l,mδ ij (cof Du) lm ∂ j ∂ m u l = ∑ j,k 

∂ i ∂ j u k (cof Du) kj + ∑ j,k 

∂ i u k ∂ j ((cof Du) kj ) 

Führt man hier auf der linken Seite die Summation über j aus, so erhält man 

gerade die erste Summe auf der linken Seite. Damit ist 

∑ 

∂ i u k ∂ j ((cof Du) kj ) = 0, 

d.h. 

j,k 

Du div(cof Du)) = 0 

gezeigt. Für alle x 0 , für die Du(x 0 ) nicht singulär ist, folgt nun div(cof Du))(x 0 ) = 

0. 

Ist det Du(x 0 ) = 0, so betrachte die Abbildung u ε (x) := u(x)+εx. Hinreichend 

klein gewählt ist ε > 0 kein Eigenwert von Du(x 0 ), so dass Du ε (x 0 ) = Du(x 0 ) + 

ε Id nicht singulär ist. Wie oben gezeigt folgt daher div(cof Du ε )(x 0 )) = 0. Im 

Grenzwert ε → 0 ergibt sich daraus div(cof Du)(x 0 )) = 0. 

□ 

Ein analoges Resultat gilt für die Minoren von Jakobimatrizen. Zur Erinnerung: 

Ist F eine m×n Matrix, so wird die Determinante einer quadratischen Teilmatrix 

von F ein Minor von F genannt. Im Folgenden bezeichnen wir für festes 

r ≤ min{m, n} und feste 1 ≤ i 1 

mit S(F) = S i 1 ,...,ir (F) die r × r Submatrix 

j 1 ,...,jr 

⎛ ⎞ 

f i1 j 1 

· · · f i1 j r 

⎜ ⎟ 

S(F) = ⎝ . . ⎠ 

f irj 1 

· · · f irj r 

für Matrizen F = (f ij ) ∈ R m×n sowie mit M(F) = M i 1 ,...,ir (F) den r-Minor 

j 1 ,...,jr 

M(F) = det S(F). 

Korollar 5.8 Es seien u : U → R m , U ⊂ R n offen, glatt und 1 ≤ i 1 

. . . 

r∑ 

t=1 

∂ jt ((cof S i 1 ,...,ir (Du)) isj t 

) = 0 

j 1 ,...,jr 

für s = 1, . . .,r. 

Beweis. Dies folgt indem man Lemma 5.7 lokal auf die Abbildung anwendet, die 

sich dadurch ergibt dass man 

(u i1 (x), . . . , u ir (x)) 

89

als Funktion von (x j1 , . . ., x jr ) auffasst, wobei die übrigen Koordinaten fix sind. 

□ 

Eine wichtige Konsequenz dieser Beobachtung ist, dass die Minoren von Jakobimatrizen 

schwach stetig sind. 

Satz 5.9 Es sei r 

W 1,p (U; R m ) mit 

u (k) ⇀ u in W 1,p (U; R m ), 

dann gilt für alle r-Minoren M 

M(Du (k) ) ⇀ M(Du) in L p r (U; R m ). 

Beweis. Der Beweis erfolgt durch Induktion über r. Dabei ist der Fall r = 1 klar, 

da die 1-Minoren einer Matrix gerade deren Einträge sind. 

Betrachte nun den r-Minor M(F) = M i 1 ,...,ir (F). Ist w ∈ C ∞ (U; R m ), so gilt 

j 1 ,...,jr 

nach (5.1) 

M(Dw) = 

Nach Korollar 5.8 ist 

r∑ 

∂ js w it (cof S(Dw)) itj s 

für t = 1, . . ., r. 

s=1 

r∑ 

w it ∂ js (cof S(Dw)) itj s 

= 0, 

s=1 

so dass M(Dw) als Ableitung geschrieben werden kann: 

M(Dw) = 

r∑ 

∂ js (w it (cof S(Dw)) itj s 

) für t = 1, . . .,r. (5.4) 

s=1 

Für ϕ ∈ C ∞ c (U) ergibt sich daraus 

∫ 

U 

∫ 

M(Dw) ϕ = − 

U 

r∑ 

w it (cof S(Dw)) itj s 

∂ js ϕ für t = 1, . . ., r. (5.5) 

s=1 

Da die Terme M(Dw) und w it (cof S(Dw)) itj s 

aus r-fachen Produkten von Einträgen 

in w und Dw bestehen, zeigt ein Standard-Approximationsargument (benutze 

die allgemeine Hölder-Ungleichung), dass (5.5) für alle w ∈ W 1,p , p ≥ r, 

gilt. 

Nun konvergiert u (k) ⇀ u schwach in W 1,p (U; R m ) und damit wegen p ≥ r 

auch in W 1,r (U; R m ). Nach dem Satz von Rellich-Kondrachov konvergiert u (k) → 

u (stark) in L q (U) für 1 ≤ q < r ∗ = nr . Außerdem gilt nach Induktionsannahme 

n−r 

90

cof S(Du (k) ) ⇀ cof S(Du) in L p 

r−1 (U) und damit auch in L 

r 

r−1 (U), da die Einträge 

von cof S(F) ja gerade (r − 1)-Minoren von F sind. Dann aber konvergiert 

u (k) 

i t 

(cof S(Du (k) )) itj s 

⇀ u it (cof S(Du)) itj s 

schwach in L˜q für 1 ≤ ˜q < n für alle i n−1 t, j s , denn es ist r−1 

r 

Hilfe von (5.5) für w = u (k) bzw. w = u folgt nun 

lim 

k 

∫ 

U 

M(Du (k) ) ϕ = − lim 

k 

∫ 

= − 

U 

∫ 

U 

r∑ 

s=1 

u (k) 

i t 

(cof S(Du (k) )) itj s 

∂ js ϕ 

r∑ 

∫ 

u it (cof S(Du)) itj s 

∂ js ϕ = 

s=1 

U 

+ n−r 

rn 

M(Du) ϕ. 

= n−1 

n . Mit 

(5.6) 

Dies zeigt, dass M(Du (k) ) gegen M(Du) im Distributionensinne konvergiert, 

sogar wenn nur p ≥ r vorausgesetzt ist. Da nun Du (k) eine beschränkte Folge 

in W 1,p ist, ist M(Du (k) ) beschränkt in L p r. Ist nun p > r, so ergibt sich aus 

der Reflexivität von L p r , dass jede Teilfolge von M(Du (k) ) eine in L p r schwach 

konvergente Teilfolge besitzt. Nach (5.6) muss dieser Limes M(Du) sein. Dann 

aber konvergiert die gesamte Folge M(Du (k) ) gegen M(Du). 

□ 

Bemerkung 5.10 Dieser Satz gilt auch für p = ∞, wenn man die schwache 

durch schwach*-Konvergenz ersetzt. Das folgt unmittelbar aus der Version für 

p < ∞ und der Beobachtung, dass M(Du (k) ) in L ∞ beschränkt ist, wenn u (k) 

schwach*-konvergiert in W 1,∞ . 

Korollar 5.11 Sind u, v ∈ W 1,p (U; R m ) mit u − v ∈ W 1,p 

0 (U; R m ) für ein p ≥ r, 

so gilt 

∫ ∫ 

M(Du) = M(Dv) 

für alle r-Minoren M. 

U 

Beweis. Nach Approximation von u und u − v dürfen wir o.B.d.A. u ∈ C ∞ (U) 

und u − v ∈ Cc ∞ (U) annehmen. Wie im Beweis von Satz 5.9 gezeigt gilt 

M(Dw) = 

r∑ 

∂ js (w it (cof S(Dw)) itj s 

) 

s=1 

U 

für t = 1, . . .,r 

(s. Gleichung (5.4)) für glatte Funktionen w. Insbesondere für w = u und w = v 

ergibt sich damit 

∫ ∫ 

M(Du) = u it (cof S(Du)) itj s 

ν js 

U 

∫∂U 

∫ 

= v it (cof S(Dv)) itj s 

ν js = M(Dv), 

∂U 

91 

U

wenn ν die äußere Normale an ∂U bezeichnet. 

Eine Funktion f : R m×n → R mit dieser Eigenschaft, dass ∫ f(Du) nur von 

U 

den Werten von u auf dem Rand ∂U abhängt, nennt man Null-Lagrangefunktion. 

Definition 5.12 (i) Ist F ∈ R m×n , so bezeichne M(F) den aus allen Minoren 

von F bestehenden Vektor der Dimension d(m, n) = ∑ min{m,n} 

) 

r=1 . 

( m 

)( n 

r r 

(ii) Eine Funktion f : R m×n → R∪{∞} heißt polykonvex, wenn es eine konvexe 

Funktion g : R d(m,n) → R ∪ {∞} gibt, so dass 

□ 

f(F) = g(M(F)) 

∀F ∈ R m×n 

gilt. 

Insbesondere ist jede konvexe Funktion polykonvex. Die Umkehrung davon 

gilt nicht, wenn m, n ≥ 2 ist wie das Beispiel des Minors 

F = (f ij ) ↦→ f 11 f 22 − f 12 f 21 

zeigt. Diese Funktion ist sogar affin im ersten 2-Minor, aber sicherlich nicht konvex 

auf {f 11 = f 22 = 0, f 12 = f 21 }. 

Beispiel: Eine Energiedichte W in der Elastizitätstheorie, die zu starke Kompressionen 

energetisch bestraft ist z.B. 

{ 

1 

W(F) = |F | 2 t 

+ ψ(det F), mit ψ(t) = 

, t > 0, 

∞, t ≤ 0. 

Dieses W ist polykonvex. 

Wir kommen nun zum wesentlichen Unterhalbstetigkeitsresultat für Integranden, 

die polykonvex in Du sind: 

Satz 5.13 Es sei f : U × R m × R m×n → R eine glatte, nach unten beschränkte 

Funktion, so dass für fast alle x ∈ U und alle y ∈ R m , z ∈ R m×n 

f(x, y, z) = g(x, y, M(z)) 

für eine geeignete (glatte) Funktion g gilt, die konvex in z sei. Dann ist I schwach 

unterhalbfolgenstetig auf W 1,p (U; R m ) für p > n. 

Der Beweis verläuft ähnlich wie der Beweis von Lemma 5.5. 

Beweis. Es sei (u k ) eine Folge mit u k ⇀ u in W 1,p (U; R m ). Es ist zu zeigen, 

dass lim inf k→∞ I(u k ) ≥ I(u) gilt. Genau wie im Beweis von Lemma 5.5 sieht 

man, dass wir annehmen dürfen, dass lim inf k→∞ I(u k ) = lim k→∞ I(u k ) gilt, dass 

u k → u stark in L p und fast überall konvergiert und dass f ≥ 0 ist. 

92

Wir definieren die Mengen A j und B j genau wie im Beweis von Lemma 5.5. 

Aus der Polykonvexität von f in z erhalten wir für jedes j: 

∫ 

∫ 

I(u k ) = f(x, u k , Du k ) dx ≥ f(x, u k , Du k ) dx 

U 

A j ∩B 

∫ 

j 

= g(x, u k , M(Du k )) dx 

A j ∩B 

∫ 

j 

≥ g(x, u k , M(Du)) 

A j ∩B j 

+ D M(z) g(x, u k , M(Du)) · (M(Du k ) − M(Du)) dx. 

Wie im Beweis von Lemma 5.5 ergibt sich daraus nun 

lim k) ≥ 

k→∞ 

∫ 

g(x, u, M(Du)) dx = 

A j ∩B j 

∫ 

f(x, u, Du) dx 

A j ∩B j 

und mit monotoner Konvergenz schließlich 

∫ 

lim I(u k) ≥ lim f(x, u, Du) dx = I(u). 

k→∞ j→∞ 

A j ∩B j 

Korollar 5.14 Erfüllt f : U×R m ×R m×n → R zusätzlich zu den Voraussetzungen 

von Satz 5.13 die die Wachstumsbedingung 

□ 

f(x, y, z) ≥ c 1 |z| p − c 2 

für geeignete Konstanten c 1 > 0, c 2 ∈ R, p > n, so existiert ein u ∈ A mit 

I(u) = inf 

v∈A I(v). 

Beweis. Das folgt mit der direkten Methode aus Lemma 5.4 und Satz 5.13. 

Als Anwendung der Tatsache, dass Determinanten Null-Lagrangefunktionen 

sind (vgl. Korollar 5.11), geben wir hier einen Beweis des Brouwerschen Fixpunktsatzes. 

Satz 5.15 (Brouwerscher Fixpunktsatz) Jede stetige Abbildung der abgeschlossenen 

Einheitskugel B 1 (0) in sich hat einen Fixpunkt. 

Der Beweis ergibt sich leicht aus dem folgenden Lemma. 

Lemma 5.16 Es gibt keine stetige Abbildung w : B 1 (0) → ∂B 1 (0) mit w(x) = x 

für alle x ∈ ∂B 1 (0). 

93 

□

Beweis von Satz 5.15. Es sei u : B 1 (0) → B 1 (0) eine stetige Funktion ohne 

Fixpunkt. Für x ∈ B 1 (0) definiere w(x) als den Schnittpunkt des Strahles, der 

von u(x) ausgeht und durch den Punkt x führt, mit ∂B 1 (0). Dies definiert eine 

stetige Abbildung w : B 1 (0) → ∂B 1 (0) mit w(x) = x für alle x ∈ ∂B 1 (0) im 

Widerspruch zu Lemma 5.16. 

□ 

Beweis von Lemma 5.16. Wir führen die Annahme, es gäbe ein solches w zum 

Widerspruch. 

Sei zunächst w als glatt angenommen. Ist v die identische Abbildung v(x) = x, 

so folgt aus Korollar 5.11 

∫ ∫ 

det Dw = det Dv = |B 1 (0)| ≠ 0, (5.7) 

B 1 (0) 

B 1 (0) 

denn es gilt w = v auf ∂B 1 (0). Andererseits ist |w| 2 ≡ 1, so dass ∂ i w · w = 0 für 

alle i gilt und damit (Dw) T w = 0. Wegen w ≠ 0 ist Null also ein Eigenwert von 

Dw und somit det Dw ≡ 0 auf B 1 (0), im Widerspruch zu (5.7). 

Ist nun w nur als stetig vorausgesetzt, so setzen wir w gemäß w(x) = x auf 

R n \ B 1 (0) fort. Ist η ε der skalierte Standard-Glättungskern, so ist ˜w := η ε ∗ w 

glatt und ≠ 0 für ε hinreichend klein. (Beachte u ε → u gleichmäßig für ε → 0.) 

Für ε < 1 gilt auf ∂B 2 (0) außerdem 

∫ 

∫ 

˜w(x) = η ε (y)(x − y) dy = x − y η ε (y) dy = x, 

da η ε symmetrisch ist. Damit erfüllt nun die Abbildung 

˜w : B 1 (0) → B 1 (0), ˜w(x) := ˜w(2x) 

| ˜w(2x)| , 

erstens ˜w ∈ C ∞ (B 1 (0)), zweitens ˜w(B 1 (0)) = ∂B 1 (0) und drittens ˜w(x) = x für 

x ∈ ∂B 1 (0) im Widerspruch zum schon behandelten Fall. 

□ 

5.4 Quasikonvexität 

Obgleich polykonvexe Integranden viele interessante Beispiele von Funktionalen 

liefern, ist es aus theoretischen Gründen sehr nützlich einen weiteren, allgemeineren 

Konvexitätsbegriff für Funktionen, die auf Matrizen definiert sind, zu untersuchen: 

Die Quasikonvexität. Wir lassen uns dabei von der Frage leiten, für 

welche Funktionen f das Integralfunktional 

∫ 

I(u) = f(Du) 

unterhalbfolgenstetig auf W 1,p (U; R m ) ist. Der Einfachheit halber betrachten wir 

in diesem Abschnitt nur solche Integranden f, die nicht explizit von x oder u 

abhängen. 

U 

94

Definition 5.17 Eine Funktion f : R m×n → R heißt quasikonvex, wenn für eine 

beschränkte offene Menge U ⊂ R n mit |∂U| = 0 gilt 

∫ 

− f(F + Dϕ(x)) dx ≥ f(F) ∀ ϕ ∈ W 1,∞ 

0 (U; R m ). 

U 

Bemerkung 5.18 1. Wir betrachten hier nur R-wertige Funktionen. Will 

man auch +∞ als Wert von f zulassen, so muss man im Folgenden ein 

paar zusätzliche technische Detail beachten. 

2. Im R-wertigen Fall kann man sogar auf die Voraussetzung |∂U| = 0 verzichten. 

(Übung.) 

3. Gilt die definierende Ungleichung für eine beschränkte offene Menge U mit 

|∂U| = 0, so gilt sie automatisch für alle solchen Teilmengen von R n . Dies 

ergibt sich direkt aus dem folgenden Lemma. 

Im Hinblick auf spätere Anwendungen beweisen wir die Unabhängigkeit von 

U in einer etwas allgemeineren Fassung. 

Lemma 5.19 Für f ∈ L 1 loc (Rm×n ) und U ⊂ R n offen und beschränkt mit |∂U| = 

0 setze 

∫ 

Qf(F, U) := inf 

ϕ∈W 1,∞ (U;R m ) 

− f(F + Dϕ). 

Dann ist Qf(F, U) unabhängig von U. 

Beachte, dass Qf(·, U) = f ist, wenn f quasikonvex ist. 

Beweis. Es seien U, V ⊂ R n offen und beschränkt mit |∂U| = |∂V | = 0. Nach 

dem Überdeckungssatz von Vitali 3 gibt es eine höchstens abzählbare Familie von 

paarweise disjunkten Mengen a j V + b j ⊂ U, a j > 0 und b j ∈ R n , so dass 

∣ U \ ⋃ (a j V + b j ) 

∣ = 0 

j 

ist. 

Ist nun ϕ ∈ W 1,∞ 

0 (V ; R m ), so definiert 

{ ( ) 

x−bj 

aj ϕ 

a 

ψ(x) := 

j 

für x ∈ a j V + b j , 

0 für x /∈ ⋃ j a jV + b j 

3 Der Überdeckungssatz von Vitali: Es sei U ⊂ R n beschränkt und offen sowie C eine Familie 

von abgeschlossenen Teilmengen von U. Es gebe 1. eine Konstante M > 1, so dass zu jedem 

C ∈ C ein x ∈ U und ein r > 0 existiert mit B r (x) ⊂ C ⊂ B Mr (x). 2. sei für fast alle x ∈ U 

inf{diamC : C ∈ C mit x ∈ C} = 0. Dann gibt es eine höchstens abzählbare Familie (C j ) von 

∣ 

paarweise disjunkten Mengen aus C mit ∣U \ ⋃ j C j∣ = 0. 

In unserer Situation ist dieser Satz für C = {aV +b : a > 0, b ∈ R n , aV +b ⊂ U} zu verwenden. 

95 

U

ein Element von W 1,∞ 

0 (U; R m ). Da |∂V | = 0 vorausgesetzt ist, können wir abschätzen 

∫ 

|U|Qf(F, U) ≤ f(F + Dψ) = ∑ ∫ ( ( )) x − bj 

f F + Dϕ 

U 

j a j V +b j 

a j 

= ∑ ∫ ( ( )) x − bj 

f F + Dϕ 

j a j V +b j 

a j 

= ∑ ∫ 

∫ 

a n j f (F + Dϕ (x)) = |U|− f (F + Dϕ (x)) . 

j V 

V 

Dies zeigt Qf(F, U) ≤ Qf(F, V ); die Umkehrung ergibt sich analog. 

Wir benötigen noch einen weiteren Konvexitätsbegriff: 

Definition 5.20 Eine Funktion f : R m×n → R heißt Rang-1-konvex, wenn f 

entlang jeder ‘Rang-1-Geraden’ konvex ist, d.h. wenn die Abbildung 

R ∋ t ↦→ f(tA + (1 − t)B) 

konvex ist, wann immer Rang(A − B) = 1 ist. 

Der folgende Satz klärt die Zusammenhänge der verschiedenen Konvexitätsbegriffe. 

Satz 5.21 Es sei f : R m×n → R eine Abbildung. Dann gilt 

f konvex =⇒ f polykonvex =⇒ f quasikonvex =⇒ f Rang-1-konvex. 

Bemerkung 5.22 1. Da eine Rang-1-konvexe Funktion insbesondere separat 

konvex, d.h. konvex in jedem Eintrag, wenn die übrigen Argumente festgehalten 

sind, ist f in jedem Falle stetig. 

2. Ist m = 1 oder n = 1, so fallen all diese Konvexitätsbegriffe zusammen. 

(Klar, dass in diesem Fall f konvex ist genau dann, wenn f Rang-1-konvex 

ist.) Im Allgemeinen sind die Umkehrungen in Satz 5.21 jedoch falsch; dazu 

später mehr. 

Beweis. Dass Konvexität Polykonvexität impliziert, haben wir bereits im vorigen 

Abschnitt bemerkt. 

Sei nun f als polykonvex vorausgesetzt, so dass es eine konvexe Funktion 

g : R d(m,n) → R gibt mit f(F) = g(M(F)) für alle F ∈ R m×n . Mit Hilfe der 

Jensenschen Ungleichung 4 ergibt sich für F ∈ R m×n , ϕ ∈ W 1,∞ 

0 (U; R m ), U ⊂ R n 

4 Die Jensensche Ungleichung: Es sei ϕ : U → R d eine integrierbare Abbildung, U ⊂ R n , und 

g : V → R, V ⊂ R d offen, eine konvexe Funktion mit ϕ(U) ⊂ V , so dass auch g ◦ϕ integrierbar 

sei. Dann gilt 

∫ 

− g(ϕ(x))dx ≥ g 

U 

( ∫ 

− 

U 

) 

ϕ(x)dx . 

∫ 

Beweis: Schreibe g = sup i∈I g i als Supremum über affine Funktionen g i . Dann ist − 

∫ ∫ g ◦ ϕ ≥ 

− gi ◦ ϕ = g i (− ϕ) für alle i. Nun bilde das Supremum über i ∈ I. 

96 

□

offen, 

∫ 

− 

U 

∫ 

f(F + Dϕ) = − 

g(M(F + Dϕ)) 

U( 

∫ ) 

≥ g − M(F + Dϕ) = g(M(F)) = f(F), 

U 

wobei wir im vorletzten Schritt Korollar 5.11 ausgenutzt haben. 

Um die letzte Implikation zu zeigen, müssen wir begründen, dass für A, B, F ∈ 

R m×n mit Rang(A − B) = 1 und F = λA + (1 − λ)B, λ ∈ (0, 1), die Ungleichung 

f(F) ≤ λf(A) + (1 − λ)f(B) 

erfüllt ist, wenn f quasikonvex ist. Da Rang(A − B) = 1 ist, gibt es Vektoren 

a ∈ R m , e ∈ R n mit |e| = 1, so dass 5 A − B = a ⊗ e und damit 

A = F + (1 − λ)a ⊗ e und 

B = F − λa ⊗ e 

gilt. Nach einer Drehung des Koordinatensystem können wir o.B.d.A. annehmen, 

dass e = e 1 ist. 

Es sei z ∈ W 1,∞ (R; R) die 1-periodische Sägezahnfunktion mit 

{ 

z(0) = 0, z ′ 1 − λ für t ∈ (0, λ), 

(t) = 

−λ für t ∈ (λ, 1). 

Auf dem Quader Q = (0, 1) n betrachten wir die Funktionen 

u k (x) = Fx + a z(kx { } 

1) 

z(kx1 ) 

, v k (x) = Fx + a min , dist(x, ∂Q) . 

k 

k 

Dann liegt die Funktion x ↦→ v k (x) − Fx in W 1,∞ 

0 , so dass 

∫ 

f(F) ≤ − f(Dv k ) ∀ k 

Q 

gilt. Nun ist aber v k = u k bis auf eine im Limes k → ∞ verschwindende Randschicht, 

so dass 

∫ ∫ 

lim − f(Dv k ) = lim − f(Du k ) = λf(A) + (1 − λ)f(B) 

k 

Q 

k 

Q 

ist. Um die letzte Gleichung einzusehen, beachte, dass (für jedes k) Du k = A auf 

einer Menge vom Maße λ und Du k = B auf einer Menge vom Maße 1 − λ ist. □ 

5 Für a ∈ R m , b ∈ R n bezeichnet a ⊗ b die m × n Matrix ab T = (a i b j ) ij . 

97

Bemerkung 5.23 Die Umkehrungen der ersten beiden Implikationen in Satz 

5.21 sind falsch wann immer m, n ≥ 2 ist. Die Umkehrung der dritten ist falsch 

für m ≥ 3, n ≥ 2. Die Frage, ob möglicherweise Quaiskonvexität aus Rang-1- 

Konvexität folgt für m = 2, n ≥ 2 ist offen. Das folgende Beispiel von Alibert, 

Dacorogna und Marcellini zeigt, dass man selbst explizit gegenenen Funktionen 

nicht so einfach ansehen kann, ob sie quasikonvex sind. 

Beispiel: Es sei m = n = 2, 

Dann gibt es ein ε > 0, so dass gilt 

f(F) = |F | 4 − γ|F | 2 det F. 

f konvex ⇐⇒ |γ| ≤ 4 3√ 

2, 

f polykonvex ⇐⇒ |γ| ≤ 2, 

f quasikonvex ⇐⇒ |γ| ≤ 2 + ε, 

f Rang-1-konvex ⇐⇒ |γ| ≤ 4 √ 

3 

. 

Es ist offen, ob ε = 4 √ 

3 

− 2 ist. (Mehr dazu findet man etwa [Da].) 

Der wesentliche Zusammenhang zwischen der Unterhalbstetigkeit des Funktionals 

I(u) = ∫ f(Du) und der Quasikonvexität von f ist Inhalt des folgenden 

Satzes. 

Satz 5.24 Es sei f : R m×n → R stetig. 

(i) I ist schwach*-unterhalbfolgenstetig (σ ∗ uhfs) auf W 1,∞ (U; R m ) genau dann, 

wenn f quasikonvex ist. 

(ii) Gilt im Falle p ∈ (1, ∞) zudem 

0 ≤ f(F) ≤ C(1 + |F | p ) ∀ F ∈ R m×n , 

so ist I schwach-unterhalbfolgenstetig (σuhfs) auf W 1,p (U; R m ) genau dann, 

wenn f quasikonvex ist. 

Wir werden hier nur (i) beweisen. 

Beweis. Sei Q = (0, 1) n und ϕ ∈ W 1,∞ 

0 (Q; R m ). Setze ϕ periodisch zu einer auf 

ganz R n definierten Funktion fort und definiere u k ∈ W 1∞ (U; R m ) durch 

u k (x) := Fx + 1 k ϕ(kx). 

Es ist nicht schwer zu sehen, dass dann u ∗ k ⇀ u in W 1,∞ (U; R m ) für u(x) = Fx 

gilt und 

∫ 

∫ 

f(Du k ) → |U| f(F + Dϕ) 

U 

Q 

98

konvergiert. (Übung.) Ist nun I unterhalbstetig, so folgt 

f(F) = 1 

∫ ∫ 

1 

I(u) ≤ lim inf 

|U| k→∞ |U| I(u 1 

k) = lim inf f(Du k ) ≤ 

k→∞ |U| 

U 

Q 

f(F + Dϕ). 

Dies zeigt aber, dass f quasikonvex ist. 

Sei nun umgekehrt f als quasikonvex vorausgesetzt und u k ∗ ⇀ u in W 1,∞ (U; R m ). 

1. Fall: u(x) = Fx + c ist affin. Wähle U ′ ⊂⊂ U und eine Abschneidefunktion 

θ ∈ C ∞ c (U) mit θ ≡ 1 auf U ′ und setze 

v k = u + θ(u k − u). 

Da u k gleichmäßig gegen u konvergiert, gibt es eine von U ′ unabhängige Konstante 

C > 0, so dass 

|Dv k | ≤ |Du| + |Dθ| · |u k − u| + |θ| · |Du k − Du| ≤ C 

ist für hinreichend große k ≥ k 0 , wobei k 0 von U ′ abhängt. Da f stetig ist, ergibt 

sich nun mit M = sup{|f(F)| : |F | ≤ 2C} 

(∫ ∫ 

) 

lim inf I(u k) ≥ lim inf f(Dv k ) + f(Du k ) − f(Dv k ) 

k→∞ 

k→∞ 

U 

U\U ′ 

≥ |U|f(F) − 2M|U \ U ′ |, 

wobei wir v k − u ∈ W 1,∞ 

0 (U; R m ) und die Quasikonvexität von f ausgenutzt 

haben. Da U ′ ⊂⊂ U beliebig war, folgt daraus nun die Behauptung. 

2. Fall: u ist stückweise affin. lim inf I(u k ) ≥ I(u) folgt hier unmittelbar aus Fall 

1 angewandt auf die Mengen, auf denen u affin ist. 

3. Fall: u ist eine allgemeine W 1,∞ -Funktion. Es sei U ′′ ⊂⊂ U ′ ⊂⊂ U. Indem 

wir u zunächst durch Faltung mit Glättungkernen durch eine glatte Funktion v 

approximieren, dann für eine Abschneidefunktion θ ∈ C ∞ c (U ′ ) mit θ ≡ 1 auf U ′′ 

die Funktion 

θv + (1 − θ)u 

konstruieren und diese schließlich auf auf U ′′ mit Hilfe einer feinen Triangulisierung 

durch ihre stückweise affine Interpolation ersetzen, erhalten wir eine Folge 

v j von Approximationen an u, so dass 1. v j stückweise affin in U ′′ ist, 2. v j ≡ u 

auf U \ U ′ und 3. Dv j → Du konvergiert mit j → ∞ stark in L p für alle p < ∞ 

und schwach* in L ∞ . 

Setze 

u j,k : u k + v j − u. 

99

Dann ist |Du j,k | ≤ C und u ∗ j,k ⇀ v j in W 1,∞ mit k → ∞. Es folgt 

∫ 

∫ 

lim lim inf f(Du j,k ) ≥ lim f(Du j,k ) (nach Fall 2) 

j→∞ k→∞ 

U ′′ j→∞ 

∫ 

U ′′ 

= f(Du) (majorisierte Konvergenz) 

U 

∫ 

′′ 

≥ f(Du) − C|U \ U ′′ |. 

U 

(Beachte, dass o.B.d.A. Dv j → Du fast überall.) Da außerdem (majorisierte 

Konvergenz) 

∫ 

∫ 

lim sup |f(Du j,k ) − f(Du k )| ≤ lim sup ω(|Du j,k − Du k |) 

j→∞ k 

j→∞ k U 

U 

= lim ω(|Dv j − Du|) = 0 

j→∞ 

∫U 

gilt, wenn ω den Stetigkeitsmodul von f bezeichnet, folgt nun 

∫ 

∫ 

lim inf f(Du k ) ≥ lim lim inf f(Du j,k ) − C|U \ U ′′ | 

k→∞ 

U 

j→∞ k→∞ 

∫ 

U ′′ 

≥ f(Du) − 2C|U \ U ′′ |. 

Da U ′′ ⊂⊂ U beliebig war, ergibt sich daraus die Behauptung. 

U 

□ 

Korollar 5.25 Sei p ∈ (1, ∞), g ∈ W 1,p (U), U ⊂ R n offen und beschränkt. 

f : R m×n → R sei quasikonvex und erfülle die Wachstumsbedingung 

c 1 |F | p − c 2 ≤ f(F) ≤ c 2 + c 2 |F | p 

∀F ∈ R m×n 

für geeignete Konstanten c 1 , c 2 > 0. Dann nimmt I auf A g = {v ∈ W 1,p (U; R m ) : 

u − g ∈ W 1,p 

0 (U; R m )} sein Minimum an. 

Beweis. Das folgt mit der direkten Methode aus Lemma 5.4 und Satz 5.24, wenn 

man o.B.d.A. f ≥ 0 annimmt. 

□ 

5.5 Relaxation 

Wir untersuchen nun Integralfunktionale, deren Integranden nicht einmal quasikonvex 

sind. Im Allgemeinen nehmen diese Funktional ihr Minimum nicht an. 

Obgleich das auf den ersten Blick pathologisch erscheint, werden wir sehen, dass 

gerade die Nicht-Existenz von Minimierern ein Indikator für interessante physikalische 

Phänomene wie etwa die Ausbildung von Mikrostrukturen in Materialien 

darstellen kann. 

100

Beispiel: Betrachte das eindimensionale Variationsproblem 

Minimiere I(w) = 

∫ 1 

0 

f(w(x)) dx unter der Nebenbedingung 

∫ 1 

0 

w(x) dx = α. 

Ist f ≥ 0 eine Funktion mit mehr als einem Minimierer, etwa f(z 1 ) = f(z 2 ) = 0, 

so kann ein solches Funktional als Modell für ein physikalisches System dienen, 

dass sich bevorzugt (also mit geringer Energie) in den ‘Phasen’ w = z 1 oder 

w = z 2 aufhält, wobei der Mittelwert ∫ 1 

w = α festgelegt ist, so dass sich das 

0 

System i.A. nicht ausschließlich in ‘Phase z 1 ’ bzw. ‘Phase z 2 ’ aufhalten kann. 

Mit Hilfe der Jensenschen Ungleichung sieht man, dass 

∫ ∫ (∫ ) 

f(w) ≥ f ∗∗ (w) ≥ f ∗∗ w = f ∗∗ (α) 

nach unten abgeschätzt werden kann, wobei f ∗∗ die konvexe Einhüllende von f 

bezeichne. Diese Abschätzung ist in der Tat scharf, denn zu ε > 0 kann man 

w 1 , w 2 ∈ R und λ ∈ [0, 1] wählen mit 

α = λw 1 + (1 − λ)w 2 , f ∗∗ (α) ≥ λf(w 1 ) + (1 − λ)f(w 2 ) − ε, 

so dass für 

gilt 

∫ 

w(x) = 

{ 

w 1 , x ∈ (0, λ), 

w 2 , x ∈ (λ, 1), 

f(w) = λf(w 1 ) + (1 − λ)f(w 2 ) = f ∗∗ (α) + ε. 

Ist man also nur am Minimalwert des Problems interessiert, so kann man das 

Funktional I(w) = ∫ f(w) durch das analytisch gutartigere ‘relaxierte’ Funktional 

I rel (w) := ∫ f ∗∗ (w) ersetzen. 

Für w = y ′ lässt sich dieses Funktional als ein elastisches Energiefunktional 

I(y) = ∫ 1 

0 f(y′ ) für einen (eindimensionalen) elastischen Stab interpretieren. 

‘Bevorzugte Phasen’ von f sind dann Deformationen minimaler Energie. Beachte 

dass hier die Nebenbedingung ∫ y ′ = α gerade die Randbedingung y(1)−y(0) = α 

ist. Es wird also die Frage untersucht, welche Energie nötig ist, um den Stab auseinanderzuziehen 

bzw. zusammenzudrücken. 

Ziel dieses Abschnitts ist es, die in diesem Beispiel beschriebene Vorgehensweise 

auf vektorwertige Probleme zu verallgemeinern. 

Definition 5.26 Zu f : R m×n → R definieren wir die quasikonvexe Einhüllende 

f qk : R m×n → [−∞, ∞) als die größte quasikonvexe Funktion, die kleiner oder 

gleich f ist. 

101

Es ist leicht zu sehen, dass das Supremum quasikonvexer Funktionen wieder 

quasikonvex ist, so dass f qk wohldefiniert ist und 

f qk = sup{g ≤ f : g ist quasikonvex} 

gilt. Beachte, dass f qk R-wertig oder identisch −∞ ist. 

Satz 5.27 Ist f ∈ L 1 loc (Rm×n ), so gilt für jede beschränkte offene Menge U ⊂ R n 

mit |∂U| = 0 

∫ 

f qk (F) = inf 

ϕ∈W 1,∞ 

0 (U;R m ) 

− f(F + ∇ϕ). 

U 

Beweis. Mit der Notation aus Lemma 5.19 ist f qk = Qf(·, U) zu zeigen, wobei 

wir nach Lemma 5.19 schon wissen, dass Qf(·, U) nicht von U abhängt. Nun ist 

einerseits 

Qf(·, U) ≥ Qf qk (·, U) = f qk . 

Um andererseits Qf(·, U) ≤ f qk nachzuweisen, genügt es wegen Qf(·, U) ≤ f zu 

zeigen, dass Qf(·, U) quasikonvex ist. 

Dazu dürfen wir o.B.d.A. Qf(·, U) > −∞ annehmen, denn gibt es ein G ∈ 

R m×n mit Qf(G, U) = −∞, dann ist Qf(·, U) ≡ −∞: Zu F ∈ R m×n wähle 

ψ ∈ W 1,∞ 

0 (U, R m ) mit F + Dψ ≡ G auf einer Teilmenge U ′ ⊂⊂ U. Dann aber ist 

|U|Qf(F, U) ≤ ∫ ∫ 

f(F + Dψ) + inf 

U\U ′ ϕ∈W 

1,∞ 

0 (U;R m ) 

f(G + Dϕ) = −∞. 

U ′ 

Sei nun ψ ∈ W 1,∞ 

0 stückweise affin: Es gebe endlich viele paarweise disjunkte 

offene Mengen U i , auf denen ψ affin sei, mit 

∣ U \ ⋃ ∣ ∣∣∣∣ 

U i = 0. 

i 

Zu ε > 0 wähle ϕ i ∈ W 1,∞ 

0 (U i ; R m ), so dass 

∫ 

Qf(F + Dψ, U i ) ≥ − f(F + Dψ + Dϕ i ) − ε. 

U i 

Für ϕ := ψ+ ∑ i ϕ i ∈ W 1,∞ 

0 (U, R m ), wobei die ϕ durch Null auf ganz U fortgesetzt 

wurden, ist 

∫ 

Qf(F + Dψ, U) = ∑ |U i |Qf(F + Dψ, U i ) 

U i 

∫ 

≥ f(F + Dϕ) − ε|U| ≥ (Qf(F, U) − ε) |U|. 

U 

Da ε beliebig war, ergibt sich 

∫ 

− Qf(F + Dψ, U) ≥ Qf(F, U). (5.8) 

U 

102

Da diese Ungleich nur für alle stückweise affinen ψ gezeigt ist, können wir 

noch nicht unmittelbar folgern, dass Qf(·, U) quasikonvex ist. Eine Inspektion 

des Beweises von Satz 5.21 (insbesondere der Implikation ‘quasikonvex =⇒ 

Rang-1-konvex’) zeigt jedoch, dass die Gültigkeit von (5.8) für alle stückweise 

affinen ψ schon ausreicht, um zu schließen, dass Qf(·, U) Rang-1-konvex ist. 

Damit aber ist Qf(·, U) separat konvex und insbesondere stetig. Nun erhält 

man, dass (5.8) tatsächlich für alle ψ ∈ W 1,∞ 

0 (U; R m ) gilt durch ein Standard- 

Approximationsargument. 

□ 

Wir können nun das Hauptergebnis dieses Paragraphen über die Relaxierung 

von Integralfunktionalen I(u) = ∫ f(Du(x)) dx formulieren. 

U 

Satz 5.28 Es seien U ⊂ R n offen und beschränkt mit C 1 -Rand und 1 

f erfülle eine p-Wachstumsbedingung der Form 

c 1 |F | − c 2 ≤ f(F) ≤ c 2 (1 + |F | p ). 

Dann gilt für das relaxierte Funktional I rel (u) := ∫ U fqk (Du(x)) dx: 

inf I = min I rel . 

A g A g 

Des Weiteren ist ū ein Minimierer von I rel genau dann, wenn ū (W 1,p -schwacher) 

Häufungspunkt einer minimierenden Folge für I ist. 

Dreh- und Angelpunkt zum Beweis dieses Satzes ist das folgende Lemma, das 

in Verbindung mit Satz 5.24 zeigt, dass I rel die (W 1,p -schwach-) unterhalbstetige 

Einhüllende von I ist. 

Lemma 5.29 Unter den Voraussetzungen von Satz 5.28 gilt: Ist u ∈ W 1,p , so 

gibt es eine Folge (u k ) mit u k − u ∈ W 1,p 

0 und 

u k ⇀ u in W 1,p 

sowie I(u k ) → I rel (u). 

Beweis. Wähle U j ′′ ⊂⊂ U j ′ ⊂⊂ U mit |U \ U j ′′ | → 0 für j → ∞. Ähnlich wie im 

Beweis von Satz 5.24 konstruieren wir v j , so dass v j stückweise affin auf U j ′′ und 

gleich u auf U \ U j ′ ist. Wir dürfen zudem annehmen, dass Dv j → Du in L p (U) 

konvergiert. 

Es seien U j,i ⊂ U j ′′ disjunkte offene Mengen mit |U j ′′ \ ⋃ i U j,i| = 0, auf denen 

v j affin ist. Wähle ε j → 0, ϕ j,i ∈ W 1,∞ 

0 (U i ) (durch 0 auf U fortgesetzt), so dass 

auf U j,i gilt 

∫ 

f qk (Dv j ) ≥ − f(Dv j + Dϕ j,i ) − ε j 

U j,i 

(vgl. Satz 5.27). Dann ist ϕ j := ∑ i ϕ j,i ∈ W 1,∞ 

0 (U) und 

∫ 

f qk (Dv j ) = ∑ ∫ ∫ 

|U j,i |− f qk (Dv j ) ≥ f(Dv j + Dϕ j ) − ε j |U|. (5.9) 

U j 

′′ 

i U j,i U j 

′′ 

103

Setze nun u j := v j + ϕ j . Offensichtlich ist u j − u ∈ W 1,p 

0 . Des Weiteren ist 

wegen Dv j → Du in L p 

∫ 

∫ 

lim f qk (Dv j ) = lim f 

j→∞ 

U j 

′′ 

j→∞ 

∫U 

qk (Dv j ) = f qk (Du) = I rel (u). (5.10) 

U 

Wegen (5.9) und da ϕ j auf U \ U j ′′ verschwindet, folgt nun aus der Wachstumsbedingung 

an f, dass 

∫ ∫ 

c 1 ‖u j ‖ p L p (U) − c 2|U| ≤ I(u j ) = 

U ′′ 

j 

f(Du j ) + 

U\U ′′ 

j 

f(Dv j ) ≤ C 

ist. Nach Übergang zu einer Teilfolge folgt daher u j ⇀ w für ein w ∈ W 1,p . Nun 

gilt nach (5.9) und (5.10) 

∫ ∫ 

lim sup I(u j ) = lim sup f(Du j ) + f(Dv j ) ≤ I rel (u). 

j→∞ 

j→∞ 

U ′′ 

j 

Andererseits ist nach Satz 5.24 auch 

lim inf 

j→∞ 

I(u j) ≥ lim inf 

j→∞ 

U\U ′′ 

j 

Irel (u j ) ≥ I rel (w). 

Es bleibt also nur noch u 

∫ 

= w zu zeigen. 

∫ 

Dazu genügt es, lim j χDuj = lim j χDvj für χ in einer dichten Teilmenge 

von L p′ , 1 + 1 = 1, nachzuweisen. Indem wir die Mengen U 

p p ′ 

j,i gegebenenfalls 

in mehrere Mengen zerteilen, dürfen wir o.B.d.A. annehmen, dass jedes U j,i 

höchstens einen Durchmesser vom Betrag 1 hat und dass (U j j+1,i) i eine Verfeinerung 

von (U j,i ) i ist für alle j. Eine geeignete dichte Teilmenge von L p ist dann z.B. 

durch die Menge derjenigen Funktionen χ gegeben, für die ein j = j(χ) existiert, 

so dass χ konstant auf den U j,i ist. Für ein solches χ ist nämlich 

∫ ∫ 

χDu j = χDv j + ∑ ∫ ∫ 

χDϕ j,i = χDv j ∀ j ≥ j(χ). 

i U j,i 

Beweis von Satz 5.28. Offensichtlich ist inf Ag I ≥ inf Ag I rel und nach Lemma 5.29 

auch umgekehrt inf Ag I ≤ inf Ag I rel . Nach Korollar 5.25 ist außerdem inf Ag I rel = 

min Ag I rel , so dass inf Ag I = min Ag I rel gezeigt ist. 

Ist nun ū Häufungspunkt einer I-minimierenden Folge (u k ), so gilt nach Satz 

5.24 

I rel (ū) ≤ lim inf 

k→∞ 

Irel (u k ) ≤ lim inf 

k→∞ 

I(u k) = inf 

A g 

I = min 

A g 

I rel . 

□ 

104

Ist umgekehrt ū als Minimierer von I rel vorausgesetzt, so können wir nach Lemma 

5.29 eine Folge (u k ) ⊂ A g wählen, so dass 

u k ⇀ ū in W 1,p sowie I(u k ) → I rel (ū) = min I rel = inf I 

A g 

A g 

gilt, so dass ū Häufungspunkt der I-minimierenden Folge (u k ) ist. 

□ 

Bemerkung 5.30 1. Man nenn I rel die Relaxierung von I. Analoge Ergebnisse 

gelten auch für Funktionale der Form 

∫ 

I(u) = f(x, u(x), Du(x)) dx. 

Hier wird das relaxierte Funktional durch 

∫ 

I rel (u) = f qk (x, u(x), Du(x)) dx 

U 

U 

definiert, wobei f qk als die Quasikonvexifizierung der Funktion F ↦→ f(x, u, F) 

für feste x ∈ U und u ∈ R m definiert wird. 

2. Der wichtige Punkt ist, dass I rel – im Gegensatz zu I – sein Minimum 

immer annimmt. Minimierern von I rel entsprechen schwache Häufungspunkte 

von I-minimierenden Folgen. In diesen Folgen stecken jedoch unter 

Umständen wesentliche Informationen über das zugrunde liegende physikalische 

Problem, die durch den Übergang zu I rel verlorengehen, s. das folgende 

Beispiel. 

Beispiel: Betrachte das Funktional 

I(u) = 

∫ 1 

0 

((u ′ ) 2 − 1) 2 + u 2 

auf W 1,4 

0 . Das relaxierte Funktional ist gegeben durch 

I rel = 

∫ 1 

0 

f ∗∗ (u ′ ) + u 2 , 

wobei f ∗∗ die Konvexifizierung von f(v) = (v 2 − 1) 2 ist, also 

{ 

f ∗∗ (v 2 − 1) 2 für |v| ≥ 1, 

(v) = 

0 für |v| ≤ 1. 

Nun ist ū ≡ 0 ein Minimierer von I rel mit I rel (ū) = 0, das Minimum von I 

wird jedoch nicht angenommen. (I(u) = 0 =⇒ ∫ u 2 = 0 =⇒ u ≡ 0 =⇒ 

∫ 

((u ′ ) 2 − 1) 2 = 1 > 0.) 

105

Physikalisch von Interesse sind nun solche u mit möglichst geringem I(u), also 

gerade die minimierenden Folgen. Ein Beispiel einer minimierenden Folge ist 

u k (x) = φ(kx) φ(kx), mit φ(x) = 1 ∣ ∣∣∣ 

k 

2 − x − ⌊x⌋ − 1 2∣ . 

Die Wahl einer minimierenden Folge ist jedoch nicht eindeutig. Trotzdem aber 

kann man hoffen, universelle Eigenschaften dieser Folgen zu identifizieren. In unserem 

Beispiel etwa gilt für jede minimierende Folge u k → 0 in L 2 . Darüberhinaus 

würden wir erwarten, dass 

• u ′ k ≈ ±1 sein muss, 

• der Wechsel zwischen u ′ k ≈ −1 und u′ k ≈ +1 mit größerem k immer schneller 

wird und 

• im Mittel genauso oft u ′ k ≈ −1 wie u′ k ≈ +1 gilt. 

Wie man diese Aussagen präzise fassen kann, darauf werden wir im nächsten 

Abschnitt eingehen. 

5.6 Young-Maße 

Bei Young-Maßen handelt es sich eigentlich um eine Familie von Maßen ν = 

(ν x ) x∈Ω , Ω ⊂ R n eine messbare Menge. Ist w k : Ω → R d eine Folge messbarer 

Funktionen, so erzeugt (w k ) das Young-Maß ν = (ν x ), wobei jedes ν x ein (Sub-) 

Wahrscheinlichkeitsmaß auf R d ist, wenn für alle x 0 ∈ Ω gilt: 

ν x0 (dy) ist ‘die Wahrscheinlichkeit für w k (x) ∈ dy im Limes k → ∞ 

für x nahe x 0 ’. 

Young-Maße liefern also eine Werte-Satistik von w k (x) für späte Folgenglieder. 

Wir werden dies im Folgenden präzisieren. Mit dieser Interpretation lassen sich 

die Vermutungen über das universelle Verhalten von u ′ k aus dem letzten Beispiel 

des vorigen Abschnitts umformulieren zu der Aussage: 

Für große k ist u ′ k (x) mit hoher Wahrscheinlichkeit nahe ±1. Dabei 

sollte u ′ k ≈ −1 genauso wahrscheinlich wie u′ k ≈ +1 sein und zwar 

unabhängig vom betrachteten Punkt x. 

Zur Konstruktion von Young-Maßen benötigen wir eine technische Vorbereitung. 

Es sei 

C 0 (R d ) := {f ∈ C(R d ) : lim f(x) = 0} = C c (R d ) 

|x|→∞ 

106

der – mit der sup-Norm versehene – Raum der im Unendlichen verschwindenden 

stetigen Funktionen. (Allgemeiner definiert man C 0 (U) auch für Teilmengen U 

von R d als den Abschluss der stetigen Funktionen mit kompaktem Träger in U 

bezüglich der sup-Norm.) Wir bezeichnen den Raum der signierten Radonmaße 

endlicher Masse auf R d mit M(R d ). Nach dem Rieszschen Darstellungssatz ist 

M(R d ) isometrisch isomorph zum Dualraum von C 0 (R d ), wobei ein Maß µ gemäß 

∫ 

C 0 (R d ) ∋ f ↦→ 〈µ, f〉 = f(x)µ(dx) 

R d 

als Funktional auf C 0 (R d ) wirkt. Ist Ω ⊂ R n messbar, so ist der Raum L 1 (Ω; C 0 (R d )) 

wie in Definition 2.9 definiert. Es stellt sich nun heraus, dass der Dualraum von 

L 1 (Ω; C 0 (R d )) gerade durch den Raum L ∞ w ∗(Ω; M(Rd )) der schwach*-messbaren 

wesentlich beschränkten Funktionen mit Werten in M(R d ) gegeben ist. 6 Ist ν ∈ 

L ∞ w ∗(Ω; M(Rd )), so schreiben wir meist ν x für ν(x) ∈ M(R d ). 

Satz 5.31 (Haupsatz für Young-Maße) Es sei Ω ⊂ R n messbar mit |Ω| < ∞ 

und w k : Ω → R d eine Folge messbarer Funktionen. Dann gibt es eine Teilfolge 

(w kj ) und ein ν ∈ L ∞ w ∗(Ω; M(Rd )), so dass 

(i) ν x ≥ 0 und ‖ν x ‖ M(R d ) = ∫ R d dν x ≤ 1 für fast alle x ist. 

(ii) Für alle f ∈ C 0 (R d ) gilt 

f(w kj ) ∗ ⇀ ¯f 

in L ∞ (Ω), 

wobei ¯f gegeben ist durch 

∫ 

¯f(x) := 〈ν x , f〉 = f(y) dν x (y). 

R d 

(iii) Es sei K ⊂ R d kompkt. Dann gilt 

dist(w kj , K) → 0 d.M.n. =⇒ supp ν x ⊂ K f.f.a. x. 

Hierbei steht ‘d.M.n.’ für Konvergenz ‘dem Maße nach”. 7 

(iv) Es ist ‖ν x ‖ = 1 f.f.a x genau dann, wenn 

lim sup |{|w kj | ≥ M}| = 0 

M→∞ 

gilt, wenn also keine Masse nach ∞ entkommt. 

j 

6 Einen Beweis findet man etwa in [Ed, S. 588f]. Beachte, dass M(R d ) weder separabel noch 

reflexiv ist, so dass die in Kapitel 2 angesprochenen Resultate (s. die Bemerkung nach Lemma 

2.27) nicht anwendbar sind. In der Tat sind Funktionale auf L 1 (Ω; C 0 (R d )) i.A. nicht stark 

messbar. 

7 Seien v, v 1 , v 2 , . . . : Ω → R messbar, Ω ⊂ R n messbar mit |Ω| < ∞. Man sagt die Folge v k 

konvergiert dem Maße nach gegen v, wenn lim k→∞ |{x : |v k (x)−v(x)| ≥ ε}| = 0 gilt für alle ε > 

0. (Das entspricht dem Begriff der stochastischen Konvergenz in der Wahrscheinlichkeitstheorie.) 

107

(v) Sei ‖ν x ‖ = 1 f.f.a x, f ∈ C(R d ) und A ⊂ Ω messbar. Ist dann 

(f(w kj )) relativ schwach folgenkompakt in L 1 (A), 

so folgt 

f(w kj ) ⇀ ¯f 

in L 1 (A). 

(vi) Gilt ‖ν x ‖ = 1 f.f.a x, so stimmt in (iii) auch die umgekehrte Implikation 

‘⇐=’. 

Definition 5.32 Die Abbildung ν : Ω → M(R d ) ist das von (w kj ) erzeugte 

Young-Maß. 

Bemerkung 5.33 1. Der zentrale Punkt ist (ii): Das Young-Maß verschlüsselt 

die schwach*-Limites aller nicht-linearer Funktionen der w kj . Zur Erinnerung: 

In einer Hausaufgabe wurde gezeigt, dass schwache Limites nicht mit 

nicht-linearen Operationen kommutieren. Selbst wenn der schwach*-Limes 

der Folge (w kj ) existiert und bekannt ist, so kann man daraus allein also 

keine Rückschlüsse auf die Werte der schwach*-Grenzwerte von f(w kj ) 

gwinnen. 

2. Eine (technisch etwas kompliziertere) Version dieses Satzes gilt auch für 

|Ω| = ∞. 

3. Gilt ∫ Φ(|w Ω k|) ≤ C für ein Φ : [0, ∞) → R mit Φ(t) → ∞ für t → ∞, so 

ist lim M→∞ sup k |{|w k | ≥ M}| = 0: Zu ε > 0 wähle M ε , so dass Φ(t) ≥ ε −1 

für t > M ε gilt. Dann ist 

∫ 

sup 

k 

|{|w k | ≥ M}| ≤ sup ε 

k 

{|w k |≥M} 

Φ(|w k |) ≤ Cε ∀ M ≥ M ε . 

4. Aus (v) ergibt sich: Ist (w k ) beschränkt in L p und f ∈ C(R d ) mit |f(y)| ≤ 

C(1 + |y| q ), q < p, dann gilt 

f(w kj ) ⇀ ¯f in L p q . 

Das folgt aus der Tatsache, dass f(w kj ) beschränkt in L p q 

ist: Einerseits 

impliziert dies, dass f(w kj ) relativ schwach folgenkompakt in L 1 ist, so dass 

nach (v) f(w kj ) ⇀ ¯f in L 1 gilt. Andererseits erhält man daraus, dass jede 

Teilfolge eine in L p q konvergente Teilfolge besitzt. Zusammen ergibt sich die 

Behauptung. 

Für p > 1, f = id zeigt dies 

w kj ⇀ w in L p , w(x) = 〈ν x , id〉. 

108

Beweis. (i) & (ii) Setze W k (x) := δ wk (x). Dann ist ‖W k (x)‖ M = 1 für alle x 

und x ↦→ 〈W k (x), f〉 = f(w k (x)) messbar für alle f ∈ C 0 . Damit ist (W k ) als 

Folge in L ∞ w ∗(Ω; M(Rd )) = (L 1 (Ω; C 0 (R d ))) ′ erkannt mit ‖W k ‖ L ∞ 

w ∗ (Ω;M) = 1. Da 

nun L 1 (Ω; C 0 (R d )) separabel ist, ist die schwach*-Topologie auf beschränkten 

Teilmengen von L ∞ w ∗(Ω; M(Rd )) metrisierbar und wir erhalten aus dem Satz von 

Alaoglu eine konvergente Teilfolge W ∗ kj ⇀ ν mit ‖ν‖ L ∞ 

w ∗ (Ω;M) ≤ 1. 

Für ϕ ∈ L 1 (Ω), f ∈ C 0 (R d ) betrachte die Funktion ϕ ⊗ f ∈ L 1 (Ω; C 0 (R d )), 

definiert durch ϕ ⊗ f(x) = ϕ(x)f ∈ C 0 (R d ). Es gilt 

∫ 

∫ 

∫ 

ϕ(x)f(w kj (x)) dx = ϕ(x)〈W kj (x), f〉 dx = 〈W kj (x), ϕ ⊗ f〉 dx 

Ω 

∫Ω 

∫ 

Ω 

→ 〈ν x , ϕ ⊗ f〉 dx = ϕ(x)〈ν x , f〉 dx 

für j → ∞, was (ii) zeigt. 

Des Weiteren zeigt diese Rechnung 

∫ 

ϕ(x)〈ν x , f〉 dx ≥ 0 ∀ ϕ ≥ 0 ∀ f ≥ 0. 

Ω 

Ω 

Dann aber gilt 〈ν x , f〉 ≥ 0 f.f.a x für alle f ≥ 0. Da C 0 separabel ist, ergibt sich 

daraus 〈ν x , f〉 ≥ 0 für alle f ≥ 0 f.f.a x und damit auch ν x ≥ 0 f.f.a. x, was den 

Beweis von (i) beendet. 

(iii) Wir müssen 〈ν x , f〉 = 0 für alle f ∈ C 0 (R d \ K) nachweisen. Zu f ∈ 

C 0 (R d \ K) und ε > 0 wähle C ε > 0, so dass 

|f(y)| ≤ ε + C ε dist(y, K) 

ist. (Das ist möglich, da f(y) → 0 geht für |y| → ∞.) Dann aber folgt 

Ω 

(|f| − ε) + (w kj ) ≤ C ε dist(w kj , K) → 0 

d.M.n. 

und (|f| − ε) + (w kj ) ∗ ⇀ (|f| − ε) + , so dass 

〈ν x , (|f| − ε) + 〉 = (|f| − ε) + (x) = 0 f.f.a. x 

gilt. Da ε > 0 beliebig war, folgt daraus nun mit monotoner Konvergenz 〈ν x , |f|〉 = 

0 und somit 〈ν x , f〉 = 0 f.f.a. x. 

(iv) Es gilt ‖ν x ‖ M ≤ 1 fast überall. Daher ist ‖ν x ‖ M = 1 f.f.a. x genau dann, 

wenn ∫ ‖ν Ω x‖ M = |Ω| ist. 

Definiere θ m ∈ C 0 (R d ), m ∈ N, durch 

⎧ 

⎪⎨ 1, |y| ≤ m, 

θ m (y) := 1 + m − |y|, m ≤ |y| ≤ m + 1, (5.11) 

⎪⎩ 

0, |y| ≥ m + 1. 

109

Dann ist einerseits 

∫ ∫ 

θ m (w kj ) = 

lim 

j→∞ 

Ω 

Ω 

∫ ∫ 

〈ν x , θ m 〉 und lim 〈ν x , θ m 〉 = ‖ν x ‖ M , 

m→∞ 

Ω 

Ω 

wobei letzteres aus θ m ր 1 und einer zweimaligen Anwendung des Satzes von 

der monotonen Konvergenz folgt. Andererseits ist 

∫ { 

≥ |{|w kj | ≤ m}| = |Ω| − |{|w kj | > m}|, 

θ m (w kj ) 

≤ |{|w kj | ≤ m + 1}| = |Ω| − |{|w kj | > m + 1}|, 

Ω 

so dass sich 

|Ω| − sup |{|w kj | > m}| ≤ lim θ m (w kj ) ≤ |Ω| − lim inf 

j 

j→∞ 

∫Ω 

|{|w k j 

| > m + 1}| 

j→∞ 

ergibt. 

Ist also lim m→∞ sup j |{|w kj | > m}| = 0, so erhalten wir tatsächlich 

∫ ∫ 

|Ω| ≤ lim lim θ m (w kj ) = ‖ν x ‖ M . 

m→∞ j→∞ 

Ist nun umgekehrt ∫ Ω ‖ν x‖ M = |Ω|, dann schließen wir 

Ω 

Ω 

lim lim inf |{|w k j 

| > m + 1}| = 0. (5.12) 

m→∞ j→∞ 

Da auch jede Telfolge von (w kj ) das Young-Maß ν generiert, bleibt diese Aussage 

auch für alle Teilfolgen von (w kj ) richtig. Das zeigt, dass sogar 

lim sup |{|w kj | > m + 1}| = 0 

m→∞ 

j 

gilt: Wäre dies nicht der Fall, so gäbe es ein ε > 0, natürliche Zahlen m 1 < m 2 < 

. . . und Indizes j(m 1 ), j(m 2 ), . . . mit 

|{|w kj(mi ) | > m i + 1}| ≥ ε ∀ i. 

Da für endlich viele Folgenglieder w k1 , w k2 , . . ., w kN stets 

lim 

sup 

m→∞ j=1,...,N 

|{|w kj | > m + 1}| = 0 

ist, gilt j(m i ) → ∞ mit m i → ∞. Ggf. nach Übergang zu einer weiteren Teilfolge 

ist dann i ↦→ j(m i ) streng monoton in i und wir erhalten eine Teilfolge (w kj (m i )) i 

von (w kj ) j mit 

lim inf 

i→∞ |{|w k j(mi ) | > m + 1}| ≥ ε ∀ m > 0 

im Widerspruch zu (5.12). 

110

(v) Sei f(w kj ) relativ schwach folgenkompakt in L 1 (A). Mit Hilfe des Satzes 

von Dunford-Pettis 8 sieht man leicht, dass dies genau dann der Fall ist, wenn 

sowohl f + (w kj ) als auch f − (w kj ) relativ schwach folgenkompakt in L 1 (A) sind. 

Wir können also o.B.d.A. f ≥ 0 voraussetzen. Setze f m := θ m f ∈ C c (R d ), wobei 

θ m wie in (5.11) definiert ist. 

Wir zeigen zunächst, dass für alle ϕ ∈ L ∞ (A) 

∫ ∫ 

lim 

m→∞ 

A 

ϕf m (w kj ) = 

gleichmäßig in j gilt: Da f ≥ 0 ist, gilt 

∫ 

∣ ϕ ( f m (w kj ) − f(w kj ) )∣ ∫ 

∣∣ ≤ C 

A 

∫ 

∫ 

≤ C f(w kj ) + C 

≤ C sup 

j 

{f(w kj )≥M} 

∫ 

{f(w kj )≥M} 

A 

ϕf(w kj ) (5.13) 

{|w kj |≥m} 

f(w kj ) 

{|w kj |≥m,f(w kj ) 0. Nun ist (f(w kj )) nach dem Satz von Dunford-Pettis gleichgradig integrierbar 

auf A, so dass zu ε > 0 ein M existiert mit C sup j 

∫{f(w kj )≥M} f(w k j 

) < ε 2 . 

Wählt man nun m – unabhängig von j – hinreichend groß, so wird nach der schon 

bewiesenen Aussage (iv) auch CM sup j |{|w kj | ≥ m}| < ε . Dies zeigt die Behauptung. 

2 

Nun gilt für f m ∈ C c (R d ) nach (ii) 

∫ ∫ 

ϕf m (w kj ) = ϕ〈ν x , f m 〉. 

lim 

j→∞ 

A 

lim 

j→∞ 

A 

Mit Hilfe der gleichmäßigen Konvergenz in (5.13) folgt daraus dann 

∫ 

∫ ∫ 

ϕf(w kj ) = lim ϕ〈ν x , f m 〉 = ϕ〈ν x , f〉, 

m→∞ 

A 

wobei sich die letzte Gleichheit aus dem Satz von der monotonen Konvergenz 

ergibt, indem man ∫ A ϕ〈ν x, f m 〉 = ∫ {ϕ

Ist supp ν x ⊂ K f.f.a. x, so ist auch 〈ν x , f〉 = 0 f.f.a. x. Mit f ∈ L ∞ ∩ C folgt 

andererseits aus (v), dass f(w kj ) ⇀ ¯f in L 1 konvergiert, so dass insbesondere 

∫ 

f(wkj ) → 0 gilt. Dann aber ist für alle ε > 0 

|{dist(w kj , K) ≥ ε}| ≤ 1 ε 

∫ 

{dist(w kj ,K)≥ε} 

f(w kj ) → 0. 

Beispiele: 

□ 

1. Sei h : R → R 1-periodisch mit 

{ 

a, 0 ≤ x < λ, 

h(x) = 

b, λ ≤ x < 1, 

a, b ∈ R, λ ∈ [0, 1]. 

Definiere w k : [0, 1] → R durch w k (x) := h(kx). Dann gilt w ∗ k ⇀ w in 

L ∞ (0, 1) mit w ≡ λa + (1 − λ)b (Übung) und genauso konvergiert f(w k ) 

schwach* gegen die Konstante Funktion λf(a)+(1 −λ)f(b) in L ∞ (0, 1) für 

alle f : R → R. Dies zeigt, dass (w k ) das Young-Maß (ν x ) mit 

ν x = λδ a + (1 − λ)δ b 

∀ x 

generiert. Beachte, dass ν x hier nicht von x abhängt. Man sagt in diesem 

Fall, das Young-Maß ν ist homogen. 

2. Allgemeiner sei h ∈ L 1 loc (Rn ) periodisch mit Einheitszelle [0, 1] n , d.h. f(x + 

z) = f(x) für alle z ∈ Z. Definiere w k : [0, 1] n → R durch w k (x) := h(kx). 

Dann gilt für alle f ∈ C 0 (R) (Übung) 

∫ 

f(w k ) ⇀ ∗ const. = f(h(z)) dz in L ∞ ([0, 1] n ). 

[0,1] n 

(w k ) generiert also das homogene Young-Maß ν, wobei ν x das Bildmaß des 

Lebesgue-Maßes auf [0, 1] n unter der Abbildung h ist: 

ν x (A) = |(h| [0,1] n) −1 (A)| = |[0, 1] n ∩ h −1 (A)| 

∀x. 

3. Wir können nun insbesondere die eingangs gestellten Fragen nach universellen 

Eigenschaften von minimierenden Folgen des Funktionals 

I(u) = 

∫ 1 

0 

((u ′ ) 2 − 1) 2 + u 2 , u ∈ W 1,4 

0 

rigoros beantworten. Sei (u k ) eine solche minimierende Folge, w k := u ′ k . 

Dann gibt es eine Teilfolge (w kj ) die ein Young-Maß ν induziert. Da (w k ) 

112

eschränkt in L 4 ist, gilt ‖ν x ‖ M = 1 f.f.a. x (s. Bemerkung 5.33,3 mit 

Φ(t) = t 4 ). 

Zu ε > 0 wähle nun δ > 0, so dass (x 2 −1) 2 < δ =⇒ max{|x−1|, |x+1|} < 

ε. Dann gilt 

|{dist(w kj , {−1, 1}) ≥ ε}| ≤ |{(w 2 k j 

− 1) 2 ≥ δ}| 

≤ 1 δ 

∫ 1 

0 

(w 2 k j 

− 1) 2 ≤ 1 δ I(u k j 

) → 0 

mit j → ∞. Dann aber folgt aus Satz 5.31(iii) supp ν x ⊂ {−1, 1} f.f.a. x. 

Zusammenfassend können wir festhalten, dass es λ(x) ∈ [0, 1] gibt, so dass 

ν x = λ(x)δ −1 + (1 − λ(x))δ 1 

ist. 

Aus Bemerkung 5.33,4 folgt nun 

u ′ k j 

= w kj ⇀ w in L 4 

mit 

∫ 

w(x) = 〈ν x , id〉 = y dν x (y) = −λ(x) + (1 − λ(x)) = 1 − 2λ(x). 

R 

Andererseits gilt wegen I(u k ) → 0 auch u kj → 0 in L 2 und somit 

∫ ∫ 

wϕ = lim 

u kj ϕ ′ = 0 

j→∞ 

∫ 

w kj ϕ = lim 

j→∞ 

∫ 

u ′ k j 

ϕ = − lim 

j→∞ 

für ϕ ∈ Cc ∞ (0, 1). Es muss also w ≡ 0 sein, d.h. λ(x) = 1 2 

(w kj ) generiert also das homogene Young-Maß 

f.f.a. x. 

ν x = 1 2 (δ −1 + δ 1 ) f.f.a. x. 

Da ν dadurch eindeutig gegeben ist, wird ν sogar von der ganzen Folge (u ′ k ) 

erzeugt. 

Bevor wir uns weiteren Anwendungen zuwenden, wollen wir noch präzisieren, 

in welchem Sinne ein von (w k ) erzeugtes Young-Maß als Werte-Statistik von w k (x) 

für große k aufzufassen ist. Sei Ω ⊂ R n offen, so dass B δ (x) ⊂ Ω für hinreichend 

kleine δ > 0 ist. Durch 

∫ 

〈ν (k) 

x,δ , f〉 = − f(w k (z)) dz 

B δ (x) 

113

wird dann ein lineares Funktional auf C 0 (R d ), also ein Maß ν (k) 

x,δ auf Rd definiert, 

das “die Wahrscheinlichkeit misst, dass w k (z) in dy liegt für z ∈ B δ (x)”: 

ν (k) 

x,δ (A) = − ∫ 

B δ (x) 

χ A (w k (z)) dz = 

1 

|B δ (x)| |{z ∈ B δ(x) : w k (z) ∈ A}|, 

d.h. ν (k) 

x,δ ist das Bildmaß der Gleichverteilung auf B δ(x) unter w k . 

Korollar 5.34 Es gilt 

lim lim 

δց0 k→∞ ν(k) x,δ = ν x 

in der schwach*-Topologie auf M(R d ) für fast alle x ∈ Ω. 

Beweis. Für f ∈ C 0 (R d ) gilt f(w k ) ⇀ ∗ ¯f mit ¯f(z) = 〈ν z , f〉, so dass 

∫ 

lim 

k→∞ 〈ν(k) x,δ 

, f〉 = lim − f(w k (z)) dz = − 〈ν z , f〉 dz. 

k→∞ 

∫B δ (x) 

B δ (x) 

Dies zeigt 

ν (k) 

x,δ 

∫ 

∗ 

⇀ ν x,δ für 〈ν x,δ , f〉 = − 

B δ (x) 

〈ν z , f〉 dz. 

Für festes f ∈ C 0 (R d ) ist nun fast jedes x ∈ Ω ein Lebesgue-Punkt von ¯f, so 

dass 

∫ 

lim 〈ν x,δ, f〉 = lim − 〈ν z , f〉 dz = 〈ν x , f〉 

δց0 δց0 

B δ (x) 

für fast alle x folgt. Damit gilt aber auch 

lim 〈ν x,δ, f〉 = 〈ν x , f〉 

δց0 

auf einer abzählbar dichten Teilmenge von C 0 (R d ) für alle x ∈ Ω \ N, N eine 

geeignete Nullmenge. Da nun ‖ν x,δ ‖ M ≤ 1 ist für alle δ und x, so dass jede 

Teilfolge konvergente Teilfolgen besitzt, zeigt dies, dass für x /∈ N tatsächlich 

ν x,δ ∗ ⇀ ν x mit δ ց 0 

gilt. 

□ 

Bemerkung 5.35 Gemäß dieser Interpretation des Young-Maßes als Werte- 

Statistik kann man erwarten, dass starke Konvergenz voliegt, wenn jedes ν x bei 

einem einzigen Wert konzentriert ist. Tatsächlich gilt: 

Beweis: Übung. 

w k → w d.M.n ⇐⇒ ν x = δ w(x) f.f.a. x. 

114

Zur Anwendung von Young-Maßen auf Integralfunktionale geben wir zunächst 

die folgenden beiden Sätze (ohne Beweis) an. 

Satz 5.36 w k : Ω → R d generiere das Young-Maß ν. Es sei f : Ω × R d → R 

stetig und nach unten beschränkt. Dann gilt 

∫ 

∫ ∫ 

lim inf f(x, w k (x)) dx ≥ f(x, y) dν x (y) dx. 

k→∞ 

Ω 

Ω R d 

Ist (f(·, w k (·))) k schwach relativ folgenkompakt in L 1 (Ω), so gilt sogar 

f(·, w k (·)) ⇀ ¯f in L 1 (Ω), ¯f(x) = 

∫R d f(x, y) dν x (y). 

Satz 5.37 Es seien u k : Ω → R d , v k : Ω → R d′ Funktionenfolgen, so dass 

u k → u fast überall konvergiere und (v k ) das Young-Maß ν generiere. Dann 

erzeugt (u k , v k ) : Ω → R d+d′ das Young-Maß x ↦→ δ u(x) ⊗ ν x . 

Wir untersuchen nun die Unterhalbstetigkeit des Funktionals 

∫ 

I(u) = f(x, u(x), Du(x)) dx 

Ω 

auf W 1,p (Ω; R m ), p > 1. Gilt u k ⇀ u in W 1,p , so gibt es eine Teilfolge (wieder mit 

u k bezeichnet), so dass u k → u fast überall konvergiert und (Du k ) ein Young-Maß 

ν erzeugt. Nach Satz 5.37 erzeugt dann (u k , Du k ) das Young-Maß δ u(x) ⊗ ν x . 

Nach Satz 5.36 wiederum gilt dann für stetiges nach unten beschränktes f 

∫ 

∫ ∫ 

lim inf f(x, u k (x), Du k (x)) dx ≥ f(x, y, z) dδ u(x) ⊗ ν x (y, z) dx 

k→∞ 

Ω 

∫Ω 

∫ 

∫R m R m×n 

= f(x, u(x), z) dν x (z) dx. 

Ω R m×n 

Unterhalbstetigkeit für I ergäbe sich also, wenn wir 

∫ 

R m×n g(z) dν x (z) ≥ g(〈ν x , id〉) (5.14) 

mit g = f(x, u(x), ·) abschätzen könnten. (Beachte 〈ν x , id〉 = Du(x).) Im Folgenden 

werden wir sehen, dass das gerade für quasikonvexe Funktionen richtig 

ist. 

Dazu müssen wir die von Gradienten induzierten Young-Maße genauer untersuchen. 

Wir setzen im Folgenden voraus, dass Ω ⊂ R n offen und beschränkt mit 

C 1 -Rand (oder auch nur Lipschitz-Rand) ist. 

115

Definition 5.38 ν ∈ L ∞ w ∗(Ω; M(Rd )) heißt W 1,p -Gradienten-Young-Maß (oder 

kurz W 1,p -GYM), wenn es eine Folge (u k ) ⊂ W 1,p (Ω; R m ) gibt, so dass 

u k ⇀ u in W 1,p (Ω; R m ) (bzw. “ ∗ ⇀” falls p = ∞) 

und 

gelten. 

δ Duk ∗ ⇀ ν in L ∞ w ∗(Ω; M(Rd )) 

Die folgenden Sätze, die wir wieder ohne Beweis angeben, liefern eine vollständige 

Charakterisierung der GYMs: 

Satz 5.39 ν ∈ L ∞ w ∗(Ω; M(Rd )) ist ein W 1,∞ -GYM genau dann, wenn ν x ≥ 0 f.ü. 

ist und es eine kompakte Menge K und ein u ∈ W 1,∞ (Ω; R m ) gibt, so dass gilt: 

(i) supp ν x ⊂ K f.f.a. x, 

(ii) 〈ν x , id〉 = Du(x) f.f.a. x und 

(iii) 〈ν x , f〉 ≥ f(〈ν x , id〉) f.f.a. x für alle quasikonvexen Funktionen f : R m×n → 

R. 

Die Version für p < ∞ dieses Satzes lautet 

Satz 5.40 ν ∈ L ∞ w ∗(Ω; M(Rd )) ist ein W 1,p -GYM, p < ∞, genau dann, wenn 

ν x ≥ 0 f.ü. ist und es ein u ∈ W 1,p (Ω; R m ) gibt, so dass gilt: 

(i) ∫ ∫ 

|F | p dν 

Ω R m×n x (F) dx < ∞, 

(ii) 〈ν x , id〉 = Du(x) f.f.a. x und 

(iii) 〈ν x , f〉 ≥ f(〈ν x , id〉) f.f.a. x für alle quasikonvexen Funktionen f : R m×n → 

R, die einer Wachstumsbedingung der Form |f(F)| ≤ C(1+|F | p ) genügen. 

Dieser Satz zeigt insbesondere, dass (5.14) tatsächlich für alle quasikonvexen 

Funktionen g unter geeigneten Wachstumsvoraussetzungen gilt. 

GYMs verhalten sich also in gewisser Hinsicht ‘dual’ zu den quasikonvexen 

Funktionen: Während quasikonvexe Funktionen die Jensensche Ungleichung für 

alle Gradientenfelder erfüllen, erfüllen die Gradienten-Young-Maße die Jensensche 

Ungleichung für alle quasikonvexen Funktionen. 

Wie wir zu Beginn dieses Abschnitts gesehen haben, liefern die Young-Maße 

aber gerade auch dann wertvolle Informationen, wenn die Integranden nicht quasikonvex 

sind und ein Minimierer im Allgemeinen nicht angenommen wird. Ähnlich 

wie man für manche Differentialgleichungen, die keine klassische Lösung besitzen, 

immer noch ‘schwache Lösungen’ konstruieren kann, kann auch der Definitionsbereich 

eines Integralfunktionals geeignet erweitert werden, so dass ‘verallgemeinerte 

Minimierer’ existieren. 

116

Betrachte das Funktional 

∫ 

I(u) = f(Du) 

Ω 

auf 

A = {u ∈ W 1,p (Ω; R m ) : u − g ∈ W 1,p 

0 }. 

Wir setzen I zu einem Funktional J auf die Menge 

Y := {ν : Ω → M(R m×n ) : ν ist W 1,p -GYM mit 〈ν x , id〉 = Du für ein u ∈ A} 

gemäß 

∫ 

J(ν) = 

Ω 

〈ν x , f〉 dx 

fort. Es gilt dann der folgende Satz (o. Beweis): 

Satz 5.41 Sei p > 1, f stetig mit c 1 |F | p −c 2 ≤ f(F) ≤ c 2 (1+|F | p ) für geeignete 

Konstanten c 1 , c 2 > 0. Dann gilt 

inf 

A I = min 

Y J. 

Die Minimierer von J sind gerade die von den minimierenden Folgen erzeugten 

GYMs. 

Insbesondere hat I einen Minimierer in A genau dann, wenn ein Minimierer 

ν von J existiert, so dass ν x ein Dirac-Maß ist f.f.a. x. 

5.7 Mikrostrukturen und Laminate 

In Satz 5.21 haben wir gesehen, dass Quasikonvexität Rang-1-Konvexität impliziert. 

Die wesentliche Konstruktion im Beweis dafür war eine Feinschichtung 

von Lagen mit Deformationsgradient A bzw. B, Rang(A − B) = 1, so dass die 

resultierende gemittelte Deformation λA+(1−λ)B ergab. Iteriert man diese Konstruktion, 

so gelangt man zum Begriff des Laminats. Dabei handelt es sich um 

diejenigen homogenen GYMs (also Maße), die durch Deformationen solcher Art 

induziert werden. (Mehr Einzelheiten hierzu, insbesondere die exakte Definition 

von Laminaten, findet man in [Mü].) 

Die interessante Frage ist nun, ob tatsächlich alle GYMs auf diese Weise 

entstehen. Wie wir im letzten Abschnitt bemerkt haben, sind die GYMs gerade 

die verallgemeinerten Minimierer von Integralfunktionalen, die von Gradienten 

abhängen. Sie verschlüsseln die Mikrostrukturen, die von den minimierenden 

Funktionenfolgen dieser Funktionale erzeugt werden. Unsere Frage lautet also: 

Sind alle Mikrostrukturen Laminate 

117

Es stellt sich nun heraus, dass – ähnlich wie GYMs die dualen Objekte zu den 

quasikonvexen Funktionen sind – die Laminate dual zu den Rang-1-konvexen 

Funktionen sind. (Ein Wahrscheinlichkeitsmaß mit kompaktem Träger ist genau 

dann ein Laminat, wenn die Jensensche Ungleichung für alle Rang-1-konvexen 

Funktionen erfüllt ist.) Daraus ergibt sich schließlich, dass unsere Frage äquivalent 

zu der schon früher erörterten Frage 

Gilt Quasikonvexität =⇒ Rang-1-Konvexität 

ist. 

Die Vermutung von Morrey aus dem Jahre 1952, dass das nicht stimmt, wurde 

erst 1993 von Šverák bewiesen. Zum Schluss dieser Vorlesung geben wir hier 

seinen Beweis wieder. In Anwendung auf die mathematische Theorie der Materialwissenschaften 

bedeutet dies, dass es Mikrostrukturen gibt, die komplizierter 

sind als selbst auf verschiedensten Skalen beliebig verschachtelte Materialschichtungen. 

Satz 5.42 Es sei m ≥ 3, n ≥ 2. Dann gibt es eine Rang-1-konvexe Funktion 

f : R m×n → R, die nicht quasikonvex ist. 

Wir benötigen die folgende nützliche Charakterisierung der Quasikonvexität. 

Lemma 5.43 f : R m×n → R ist quasikonvex genau dann, wenn 

∫ 

f(F + Dϕ(x)) dx ≥ f(F) 

Q 

für alle ϕ ∈ W 1,∞ (R n ), die Q = (0, 1) n -periodisch sind, gilt. 

Direkt aus der Definition 5.17 ergibt sich, dass diese Bedingung hinreichend 

für die Quasikonvexität von f ist. 

Ist nun umgekehrt f als quasikonvex vorausgesetzt, so wähle Abschneidefunktionen 

θ k ∈ Cc ∞(Rn ) mit 0 ≤ θ k ≤ 1, θ k ≡ 1 auf (−k + 1, k − 1) n , θ k ≡ 0 auf 

R n \ (−k, k) n und |Dθ k | ≤ C. Für ϕ k = θ k ϕ folgt dann 

∫ 

∫ 

(2k) n f(F + Dϕ) = f(F + Dϕ) 

Q 

(−k,k) 

∫ 

n 

≥ f(F + Dϕ k ) − Ck n−1 ≥ (2k) n f(F) − Ck n−1 . 

(−k,k) n 

Teilt man durch (2k) n und lässt k → ∞ gehen, so erhält man die Behauptung. 

□ 

Beweis von Satz 5.42. O.B.d.A. sei m = 3 und n = 2. Betrachte die (0, 1) 2 - 

periodische Funktion u : R 2 → R 3 mit 

u(x) = 1 

2π 

⎛ 

⎝ 

⎞ 

sin 2πx 

sin 2πy ⎠. 

sin 2π(x + y) 

118

Es gilt 

so dass 

⎛ 

cos 2πx 0 

⎞ 

Du(x) = ⎝ 0 cos 2πy ⎠ , 

cos 2π(x + y) cos 2π(x + y) 

⎧⎛ 

⎞ ⎫ 

⎨ r 0 ⎬ 

L := span{Du(x) : x ∈ R 2 } = ⎝0 s⎠ : r, s, t ∈ R 

⎩ 

⎭ 

t t 

ist. Beachte, dass die einzigen Rang-1-Geraden in L die Geraden von der Form 

F + Ra ⊗ b mit 

⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 

1 0 0 0 0 0 

a ⊗ b = ⎝0 0⎠ , ⎝0 1⎠ oder ⎝0 0⎠ 

0 0 0 0 1 1 

sind. 

Betrachte nun die Funktion g : L → R mit 

⎛ ⎞ 

r 0 

g ⎝0 s⎠ = −rst. 

t t 

Offenbar ist g Rang-1-affin auf L. Außerdem gilt 

∫ ∫ 

g(Du) = − cos 2πx cos 2πy cos 2π(x + y) 

(0,1) 2 (0,1) 2 

= 

∫ 1 ∫ 1 

0 

0 

− cos 2 2πx cos 2 2πy + cos 2πx sin 2πx cos 2πy sin 2πy 

= − 1 2 · 1 

2 + 0 = −1 4 < 0 = g(0). 

Der Beweis ist hier jedoch noch nicht beendet, da g ja nur auf L definiert ist. 

Wir konstruieren nun auf ganz R 3×2 eine Rang-1-konvexe Funktion, die auf L 

nahe bei g liegt: Es sei P die orthogonale Projektion von R 3×2 auf L. Setze 

f ε,k (F) = g(PF) + ε ( |F | 2 + |F | 4) + k|F − PF| 2 . 

Wir überlegen uns zunächst, dass für jedes ε > 0 ein k(ε) > 0 existiert, so 

dass f ε,k Rang-1-konvex ist: Wäre dies nicht der Fall, so gäbe es ε > 0, so dass 

kein f ε,k , k ∈ N Rang-1-konvex ist. Da die f ε,k glatte Funktionen sind, bedeutet 

das, dass es zu jedem k ∈ N Matrizen F k ∈ R 3×2 und Vektoren a k ∈ R 3 , b k ∈ R 2 

mit |a k | = |b k | = 1 existieren, so dass 

D 2 f ε,k (F k )(a k ⊗ b k , a k ⊗ b k ) ≤ 0. (5.15) 

119

Nun ist 

D 2 f ε,k (F)(X, X) (5.16) 

= D 2 g(PF)(PX, PX) + 2ε|X| 2 + ε ( 4|F | 2 |X| 2 + 8|F : X| 2) + k|X − PX| 2 . 

(5.17) 

Da g(PF) kubisch in F ist, skaliert D 2 g(PF) linear in F. Aus (5.15) und (5.16) 

ergibt sich damit, dass |F k | ≤ C beschränkt ist. (Beachte |a k ⊗b k | = |a k |·|b k | = 1.) 

Nach Übergang zu Teilfolgen (wieder mit k indiziert) erhalten wir 

F k → F, a k → a, b k → b. 

Im Limes k → ∞ folgt dann aber aus (5.15) und (5.16) 

D 2 g(PF)(Pa ⊗ b, Pa ⊗ b) + 2ε + j|a ⊗ b − Pa ⊗ b| 2 ≤ 0 ∀ j > 0. 

Daher ist Pa ⊗ b = a ⊗ b, also a ⊗ b ∈ L. Die Abbildung t ↦→ g(PF + tPa ⊗ b) 

ist also Rang-1-affin, so dass D 2 g(PF)(Pa⊗b, Pa⊗b) = 0 ist. Zusammengefasst 

ergibt sich der Widerspruch 2ε ≤ 0. 

Wir können also ε > 0 so klein wählen, dass 

∫ ∫ 

f ε,k(ε) (Du) = g(Du) + ε ( |Du| 2 + |Du| 4) < 0 = f ε,k(ε) (0), 

Q 

Q 

f ε,k(ε) aber Rang-1-konvex ist. 

□ 

120

Literaturverzeichnis 

[Br 07b] M. Brokate: Partielle Differentialgleichungen II. Vorlesungsskript TU 

München 2007. (http://www-m6.ma.tum.de/∼brokate/pde ss07.pdf) 

[Da] B. Dacorogna: Direct Methods in the Calculus of Variations. Second edition. 

Springer-Verlag, Berlin · Heidelberg · New York 2008. 

[DU] J. Diestel, J. J. Uhl: Vector Measures. American Mathematical Society, 

Providence, RI 1977. 

[Ed] R. E. Edwards: Functional Analysis. Holt, Rinehart and Winston, New 

York, 1965. 

[Ev] L. C. Evans: Partial Differential Equations. Graduate Studies in Mathematics 

19. American Mathematical Society, Providence, RI, 1998. 

[FL] W. Fischer, I. Lieb: Funktionentheorie. Vieweg, Braunschweig · Wiesbaden, 

1988. 

[Fo] G. B. Folland: Introduction to Partial Differential Equations. Princeton 

University Press, Princeton, NJ 1995. 

[Mü] S. Müller: Variational models for microstructure and phase 

transitions. Lecture notes MPI MIS Leipzig 1998. 

(http://www.mis.mpg.de/preprints/ln/lecturenote-0298.pdf) 

[Sch 09] B. Schmidt: Partielle Differentialgleichungen. Vorlesungsskript 

TU München 2009. (http://wwwm7.ma.tum.de/foswiki/pub/M7/Analysis/PDE08/April 

21.pdf) 

[Te] R. Temam: Navier Stokes Equations. Theory and numerical analysis. Elsevier, 

Amsterdam · New York · Oxford 1974. 

[We] D. Werner: Funktionalanalysis. Springer-Verlag, Berlin · Heidelberg · New 

York 2000. 

[Wl] J. Wloka: Partielle Differentialgleichungen. Teubner, Stuttgart, 1982. 

121

Partielle Differentialgleichungen 2 - am Institut fÃ¼r Mathematik der ...

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

Template löschen?

Als Template speichern?