Fymm IIb luentojen betaversio
Fymm IIb luentojen betaversio
Fymm IIb luentojen betaversio
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
1<br />
Fysiikan matemaattiset menetelmät<br />
Luentomuistiinpanot 2013<br />
19. huhtikuuta 2013
2<br />
Sisältö<br />
1 Johdanto 3<br />
2 Variaatiolaskenta 3<br />
2.1 Kertausta: Funktion ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
2.2 Funktionaalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2.3 Eulerin yhtälö . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />
2.3.1 Yleistys monen funktion funktionaaliin . . . . . . . . . . . . . . . . . . . . . . . 8<br />
2.3.2 Yleistys monen muuttujan funktioihin . . . . . . . . . . . . . . . . . . . . . . . 9<br />
2.4 Sidottu (Ehdollinen) variaatioprobleema . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />
2.5 Isoperimetrinen ongelma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />
2.6 Toinen variaatio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />
2.7 Funktionaaliderivaatta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
2.8 Ritzin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />
3 Sturm-Liouville-Teoria 17<br />
3.1 Perusominaisuudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
3.1.1 Erikoisfunktiot ja Sturm-Liouville yhtälöt . . . . . . . . . . . . . . . . . . . . . 18<br />
3.1.2 Yksinkertainen esimerkki S-L ongelmasta . . . . . . . . . . . . . . . . . . . . . 19<br />
3.2 Itseadjungoidut operaattorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />
3.3 Sturmin ja Liouvillen lause . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />
3.4 S-L operaattorin Greenin funktio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />
3.5 Sturm-Liouville -ongelma variaatio-ongelmana . . . . . . . . . . . . . . . . . . . . . . . 29<br />
3.6 Rayleighin ja Ritzin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />
3.6.1 Esimerkki: Patarummun säveltaajuus . . . . . . . . . . . . . . . . . . . . . . . . 31<br />
4 Hilbertavaruuksista 32<br />
4.1 Vektori-, normi- ja sisätuloavaruudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
4.2 Gram-Schmidt ja projektio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />
4.3 Hilbert avaruudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />
4.4 Aliavaruudet ja separoituvuus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />
4.5 Hilbertin avaruuden jatkuvat funktionaalit . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />
5 Operaattorit 46<br />
5.1 Perusominaisuudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />
5.2 Adjungoitu operaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />
5.3 Hermiittiset ja unitaariset operaattorit, projektio . . . . . . . . . . . . . . . . . . . . . 50<br />
6 Spektraaliteoriaa 52<br />
6.1 Ominaisvektorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />
6.2 Rajoitetun operaattorin spektri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />
6.3 Hermiittisen operaattorin spektri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />
6.4 Spektraaliesitys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />
6.5 Rajoittamattomat operaattorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60<br />
6.6 Adjungoitu operaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />
6.7 Käänteisoperaattorin yleistys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />
6.8 Itseadjungoidun operaattorin spetkristä . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />
6.9 Yhteys kvanttimekaniikkaan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />
6.10 Paikkaoperaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />
6.11 Diracin merkintätapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />
6.12 Impulssioperaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3<br />
1 Johdanto<br />
FyMM <strong>IIb</strong>:n sisältö jakaantuu kolmeen pääaiheeseen. Kurssi jatkaa siitä mihin FyMM IIa päättyi,<br />
eli syventää erikoisfunktioiden takana olevaa teoriaa. Aluksi tosin tehdään poikkeama variaatiolaskentaan.<br />
Variaatiolaskenta on erittäin hyödyllinen matematiikan ala. Monet käytännön ongelmat voidaan<br />
ratkaista sen avulla. Fyysikon näkökulmasta erityisen tärkeää on klassisen mekaniikan modernimpi<br />
Lagrangen esitys, joka perustuu siihen että tarkasteltavan systeemin dynamiikka kiteytetään vaikutusintegraaliin<br />
S = ∫ dtL(q, ˙q, t), missä q(t) kuvaa systeemin vapausasteita. Liikeyhtälöt johdetaan sen<br />
jälkeen variaatiolaskennan kautta etsimällä vaikutusintegraalin minimi, eli soveltamalla Mapertuisin<br />
periaatetta<br />
δS = 0 . (1.1)<br />
Tarkasteltava systeemi voi olla mikä tahansa: tasolla vierivä sylinteri, sähkömagneettinen kenttä lähteineen,<br />
painovoimakenttä Einsteinin yleisessä suhteellisuusteoriassa, hiukkasfysiikan Standardimalli,<br />
säieteoria. Useimmat fysiikan teoriat rakennetaan lähtien liikkeelle Mapertuisin periaatteesta, niinpä<br />
(1.1) on – vain osittain leikillisesti sanoen – Kaiken Teoria (TOE) (kunhan vain aktio S on tunnetaan).<br />
Variaatiolaskennan jälkeen siirrytään Sturm-Liouville ongelman analysointiin. Lähes kaikki toisen asteen<br />
differentiaaliyhtälöt voidaan kirjoittaa ns. Sturm-Liouville -muodossa. Yhtälöiden ohella tärkeitä<br />
ovat myös reunaehdot. Jos ne ovat tiettyä tyyppiä, kyseessä on Sturm-Liouville -ongelma, jonka ratkaisut<br />
muodostavat ortogonaalisen kannan reunaehdot toteuttavien funktioiden avaruudessa. FyMM<br />
IIa:lla erikoisfunktioille hieman yllättäen löydetyt samankaltaiset ominaisuudet heijastavat tätä yleisempää<br />
teoriaa.<br />
Kurssin viimeinen teema – Hilbert-avaruudet, operaattorit ja spektraaliteoria – suuntaa sovelluksiin<br />
kvanttifysiikassa. Kvanttimekaniikassa kutakin havaittavaa suuretta vastaa Hermiittinen operaattori.<br />
Aaltofunktioiden avaruudessa ne palautuvat yleisesti differentiaalioperaattoreiksi. Niiden ominaisarvot<br />
vastaavat mahdollisia mittaustuloksia ja muodostavat ns. spektrin. Aaltofunktioiden avaruudella taas<br />
on ominaisuuksia (esim. sisätulo ja siihen pohjautuva normi, joilla muotoillaan kvanttimekaniikan<br />
todennäköisyystulkinta) joiden perusteella se on erityinen vektoriavaruus, ns. Hilbert-avaruus. Nämä<br />
käsitteet esitellään kurssin viimeisessä osassa.<br />
2 Variaatiolaskenta<br />
2.1 Kertausta: Funktion ääriarvot<br />
Määritelmä 2.1 Olkoon f(x 1 , x 2 , .., x n ) ∈ C 2 (Ω), Ω ⊂ R n ja x 0 = (x 0 1 , x0 2 , ..., x0 n) ∈ Ω. Sanomme,<br />
että f(x 0 ) on lokaali maksimi (minimi), jos on olemassa avoin ympäristö U x 0 s.e. f(x) ≤ f(x 0 )<br />
(f(x) ≥ f(x 0 )) kaikilla x ∈ U x 0 \ {x 0 }.<br />
Yleisesti maksimeja ja minimejä kutsutaan ääriarvoiksi ja pisteitä, joissa ne saavutetaan ääriarvokohdiksi<br />
tai ääriarvopisteiksi. Välttämätön ehto lokaalille ääriarvolle saadaan funktion Taylor-kehitelmästä<br />
pisteen ympäristössä:<br />
f(x 0 + h) = f(x 0 ) +<br />
n∑<br />
i=1<br />
∂f<br />
x i<br />
∣ ∣∣∣x<br />
0h i + 1 2<br />
n∑<br />
i,j=1<br />
Olkoon f(x 0 ) lokaali maksimi, h = (0, .., 0, h i , 0, .., 0) ja oletetaan ∂f<br />
∂x i<br />
∂ 2 ∣<br />
f ∣∣∣x<br />
h i h j + . . . (2.1)<br />
∂x i ∂x j 0<br />
> 0 ( < 0). Tällöin<br />
f(x 0 + h) ≈ f(x 0 ) + ∂f ∣ ∣∣∣x<br />
· h i > f(x 0 ), kun h i > 0 ( < 0),<br />
∂x i 0
4<br />
eli f(x 0 ) ei olekaan maksimi, mikä on ristiriidassa oletuksen kanssa. Vastaavasti päätellään minimin<br />
tapauksessa, että täytyy siis olla:<br />
( ) ∂f<br />
f(x 0 ) ääriarvo =⇒<br />
= 0 kaikilla i = 1, . . . , n. (2.2)<br />
∂x i x=x 0<br />
Pisteitä, joissa kaikki osittaisderivaatat häviävät kutsutaan stationaarisiksi pisteiksi tai kriittisiksi pisteiksi,<br />
mutta ne eivät välttämättä ole ääriarvokohtia vaan pisteen laatu on selvitettävä toisista osittasiderivaatoista.<br />
Suoraviivainen tapa selvittää pisteen laatu on neliömuotojen<br />
A(h) =<br />
n∑<br />
A ij h i h j<br />
i,j=1<br />
tutkiminen. Jos A(h) ≠ 0, kun h ≠ ¯0, niin neliömuoto on definiitti, muuten sitä kutsutaan indefiniitiksi<br />
(Huom. A(¯0) = 0 kaikilla neliömuodoilla). Seuraavan lauseen todistus ohitetaan.<br />
Lause 2.1 Stationaarinen piste x 0 on maksimi (minimi), jos<br />
D(h) :=<br />
n∑<br />
i,j=1<br />
∂ 2 ∣<br />
f ∣∣∣x<br />
h i h j (2.3)<br />
∂x i ∂x j 0<br />
on negatiivinen (positiivinen) definiitti muoto. Jos muoto on indefiniitti, niin kyseessä on ns. satulapiste.<br />
Jos x 0 on satulapiste, niin f saa jokaisessa sen ympäristö sekä f(x 0 ):aa suurempia, että pienempiä<br />
arvoja kuten seuraavassa esimerkissä.<br />
Esimerkki 2.1 Olkoon f(x, y) = x 2 − y 2 ja Ω = R 2 . Nyt<br />
∂f ∂f<br />
= 2x ja<br />
∂x ∂y<br />
= −2y eli (0,0) on stationaarinen.<br />
Kuitenkin D(h) = 2(h 2 1 − h2 2 ) on indefiniitti eli f(0, 0) ei ole ääriarvo, kuten ei kuulukaan.<br />
Olemme edellä olettaneet, että tarkasteltava funktio on vähintään kaksi kertaa derivoituva, joten lausetta<br />
2.1 ei voi soveltaa alueen reunapisteissä, eikä pisteissä, joissa funktio ei ole derivoituva ja tähän<br />
liittyviä ongelmia valaiskoon seuraavat esimerkit:<br />
Esimerkki 2.2 Olkoon f(x, y) = √ x 2 + y 2 ja Ω = R 2 .<br />
Selvästikin f(x, y) ≥ 0 kaikilla (x, y) ∈ R 2 , joten ilmeisesti minimi on f(0, 0) = 0. Kuitenkin<br />
∂f<br />
∂x =<br />
x ∂f<br />
√ ja<br />
x 2 + y2 ∂y =<br />
y<br />
√<br />
x 2 + y 2 ,<br />
joten derivaattoja ei ole olemassa pisteessä (0, 0). Emme siis voi päätellä pisteen laatua muuten, kuin<br />
tietämällä että f on origoa lukuunottamatta aidosti positiivinen.<br />
Esimerkki 2.3 Olkoon f(x, y) = x 2 − y 2 ja Ω = {¯x ∈ R 2 : |¯x| ≤ 1}.<br />
Napakoordinaateissa f(x, y) = r 2 (cos 2 (θ) − sin 2 (θ)) = r 2 cos(2θ), joten<br />
päätellään:<br />
Maksimit: r = 1, θ = 0, π, jolloin f(1, 0) = f(−1, 0) = 1.<br />
Minimit: r = 1, θ = π/2, 2π/3, jolloin f(0, 1) = f(0, −1) = −1.<br />
Kuitenkin esim. ∂f<br />
∣<br />
(1,0)<br />
= 2 ≠ 0 jne.<br />
∂x<br />
|f| ≤ 1 joukossa Ω. Tästä
5<br />
Esimerkin 2.2 kaltaisiin tilanteisiin ei ole systemaattista menetelmää, jolla pisteiden laatu selvitetään,<br />
vaan ne on tarkastettava tapauskohtaisesti, kuten esimerkissä tehtiin. Esimerkissä 2.3 ongelmana oli<br />
maksimin saaminen alueen reunalla, mutta tämä voidaan välttää seuraavilla menetelmillä.<br />
Sidotut ääriarvot<br />
Etsitään funktion f(x 1 , x 2 , . . . , x n ) ääriarvot sidosehdoilla (m < n)<br />
ϕ 1 (x 1 , x 2 , . . . , x n ) = 0<br />
ϕ 2 (x 1 , x 2 , . . . , x n ) = 0<br />
.<br />
ϕ m (x 1 , x 2 , . . . , x n ) = 0.<br />
Yksi mahdollisuus on ratkaista sidosehdoista m muuttujaa m-n:n jäljelle jäävän muuttujan funktioina.<br />
Voi esimerkiksi ratkaista m ensimmäistä x 1 = x 1 (x m+1 , . . . , x n ), . . ., x m = x m (x m+1 , . . . , x n ), ja etsiä<br />
funktion<br />
g(x m+1 , ..., x n ) := f(x 1 (x m+1 , ..., x n ), ..., x m (x m+1 , ..., x n ), x m+1 , ..., x n )<br />
ääriarvot, jolloin sidosehdot on automaattisesti huomioitu.<br />
Esimerkki 2.4 funktion f(x, y) = x 2 + y 2 ääriarvot sidosehdolla<br />
ϕ(x, y) = x + y − 1 = 0. Eli suoran y = 1 − x suurin ja pienin etäisyys origosta.<br />
Ratkaistaan y = 1 − x ja sijoitetaan: f(x, 1 − x) = x 2 + (1 − x) 2 = 2x 2 − 2x + 1 = g(x). g:n kuvaaja<br />
ylöspäin aukeava paraabeli eli ei maksimia, mutta yksi minimi: g ′ (x) = 4x−2 = 0 ⇐⇒ x = 1/2, jolloin<br />
y = 1 − 1/2 = 1/2. Minimi saavutetaan siis pisteessä (1/2, 1/2) ja sen arvo on f(1/2, 1/2) = 1/2.<br />
Yhtälöiden kääntäminen voi olla työlästä tai käytännössä mahdotonta yksinkertaisillakin sidosehdoilla,<br />
joten usein on kätevämpi käyttää Lagrangen kertoimia:<br />
Määritellään<br />
Φ(x 1 , . . . , x n , λ 1 , . . . , λ m ) = f(x 1 , . . . , x n ) +<br />
ja etsitään Φ:n ääriarvot, i = 1, . . . , n, j = 1, . . . , m:<br />
∂Φ<br />
∂x i<br />
= ∂f<br />
∂x i<br />
+<br />
m∑<br />
j=1<br />
m∑<br />
λ i ϕ i (x 1 , x 2 , . . . , x n ),<br />
i=1<br />
λ j<br />
∂ϕ j<br />
∂x i<br />
= 0<br />
∂Φ<br />
∂λ j<br />
= ϕ j (x 1 , x 2 , . . . , x n ) = 0 (2.4)<br />
Sidokset siis muuttavat hieman stationaarisehtoa 2.2 ja yhtälöt 2.4 antavat alkuperäiset sidosehdot.<br />
Esimerkki 2.5 Jatkoa esimerkkiin 2.4<br />
Φ(x, y, λ) = x 2 + y 2 + λ(x + y − 1), (x,y) stationaarinen:<br />
Lisäksi ∂Φ/∂λ = x + y − 1 = 0 =⇒ x = y = 1/2.<br />
∂Φ<br />
∂x = 2x + λ = 0<br />
}<br />
∂Φ<br />
∂y = 2y + λ = 0 =⇒ x = y
6<br />
2.2 Funktionaalit<br />
Funktionaalilla (funktio funktiosta) tarkoitetaan kuvausta jostain funktioluokasta M reaaliluvuille.<br />
Merkitään F : M → R ja F:n arvoa hakasuluilla F[y]. Yleensä funktioluokka M 1 on<br />
Esimerkkejä:<br />
K := ”kompaktikantajaiset funktiot”<br />
C k := ”(paloittain) k kertaa jatkuvasti derivoituvat funktiot”<br />
L p (Ω) := ”p-integroituvat funktiot Ω:ssa, Ω ⊂ R n ”<br />
S := ”nopeasti häviävät funktiot”<br />
• Distribuutiot eli lineaariset funktionaalit, kuten δ-funktio:<br />
• F : L p ([a, b]) → R,<br />
• ”Funktionaalin Taylor-sarja”<br />
F [y] =<br />
δ x0 : y ↦→ y(x 0 ) =<br />
F [y] = ∫ b<br />
a [y(x)]p dx<br />
∞∑<br />
n=0<br />
1<br />
n!<br />
∫ b<br />
a<br />
· · ·<br />
∫ b<br />
a<br />
∫ ∞<br />
−∞<br />
δ(x − x 0 )y(x)dx<br />
dx 1 · · · dx n K n (x 1 , . . . , x n )y(x 1 ) · · · y(x n ) (2.5)<br />
Ylläoleva funktionaalin esitys 2.5 on itseasiassa varsin yleinen, jos ydinfunktioiksi K n sallitaan myös<br />
distribuutiot.<br />
Esimerkki 2.6 F [y] = ∫ ∞<br />
−∞ [y′ (x)] 2 dx, y ∈ K voidaan esittää<br />
F [y] =<br />
∫ ∞ ∫ ∞<br />
−∞<br />
−∞<br />
kun valitaan K 2 (x 1 , x 2 ) = −δ ′′ (x 1 − x 2 ). Perustelu:<br />
=⇒<br />
= −<br />
∫ ∞<br />
−∞<br />
∫ ∞ ∫ ∞<br />
dx 1 dx 2 K 2 (x 1 , x 2 )y(x 1 )y(x 2 ),<br />
dx 1 δ(x 1 − x 2 )y(x 1 ) = y ′′ (x 2 )<br />
−∞ −∞<br />
∫ ∞<br />
−∞<br />
/ ∞<br />
= −<br />
−∞<br />
=<br />
dx 1 dx 2 (−δ ′′ (x 1 − x 2 ))y(x 1 )y(x 2 )<br />
dx 2 y ′′ (x 2 )y(x 2 )<br />
dx 2 y ′ (x 2 )y(x 2 )<br />
} {{ }<br />
∫ ∞<br />
−∞<br />
=0<br />
dx 2 [y ′ (x 2 )] 2 .<br />
Variaatiolaskennassa tutkitaan funktionaaleja, jotka ovat muotoa<br />
J[y] =<br />
∫ b<br />
a<br />
∫ ∞<br />
+ dx 2 [y ′ (x 2 )] 2<br />
−∞<br />
ja perusongelma kuuluu: Mitkä ovat funktionaalin J ääriarvot joukossa<br />
{<br />
y ∈ C 2 ([a, b]) : y(a) = y a , y(b) = y b kiinteät } ?<br />
f(y(x), y ′ (x), x)dx (2.6)<br />
1 Kts. S:n määritelmää jossain???
7<br />
2.3 Eulerin yhtälö<br />
Johdamme välttämättömän ehdon funktionaalin J (2.6) ääriarvolle ts. löydämme ne y = y(x), joille<br />
J[y] on stationaarinen.<br />
Määritelmä 2.2 J[y] on stationaarinen, jos sen muutos häviää ensimmäisessä kertaluvussa, kun<br />
muutetaan y → y(x) + η(x), missä η on y:n ”pieni” variaatio ja η(a) = η(b) = 0. Toisin sanoen<br />
J[y] stationaarinen ⇔ δJ := J[y + η] − J[y] = 0 + O(η 2 ) kaikilla η.<br />
Apulause 2.1 Jos y on jatkuva ja ∫ b<br />
a<br />
η(x)y(x)dx = 0 kaikilla jatkuvilla η, niin y(x) = 0 kaikilla<br />
x ∈ [a, b].<br />
Todistus 2.1 Oletetaan y(x 0 ) ≠ 0, jossakin x 0 ∈ [a, b]. y on jatkuva, joten on olemassa ɛ s.e. y(x) ei<br />
vaihda merkkiä kun x ∈ [x 0 −ɛ, x 0 +ɛ]. Valitaan η(x) = (x−x 0 +ɛ) 2 (x−x 0 −ɛ) 2 , kun x ∈ [x 0 −ɛ, x 0 +ɛ]<br />
ja η(x) = 0 muuten. Nyt<br />
∫ b<br />
∫ x0 +ɛ<br />
{ > 0 , jos y(x0 ) > 0<br />
η(x)y(x)dx = η(x)y(x)dx =<br />
< 0 , jos y(x 0 ) < 0 ,<br />
a<br />
x 0 −ɛ<br />
josta seuraa ristiriita. On siis oltava y(x) = 0 kaikilla x ∈ [a, b].<br />
Olettaen f sopivan monesti derivoituvaksi voimme laskea J:n variaation f:n Taylor-kehitelmän avulla:<br />
J[y + η] =<br />
=<br />
∫ b<br />
a<br />
∫ b<br />
f(y + η, y ′ + η ′ , x)dx<br />
f(y, y ′ , x)dx<br />
a<br />
} {{ }<br />
=J[y]<br />
∫ b<br />
∂f<br />
+<br />
a ∂y η + ∂f<br />
∂y ′ η′ dx + O(η 2 )<br />
Osittaisintegroidaan viimeinen termi (sijoitus häviää, koska η(a) = η(b) = 0):<br />
∫ b<br />
/<br />
∂f<br />
b ∫<br />
∂f b<br />
a ∂y ′ η′ dx =<br />
a<br />
∂y ′ η − η d<br />
∫<br />
∂f<br />
b<br />
a dx ∂y ′ dx = − η d ∂f<br />
dx , josta<br />
a dx ∂y ′<br />
∫ b<br />
( ∂f<br />
δJ = J[y + η] − J[y] = η<br />
a ∂y − d )<br />
∂f<br />
dx ∂y ′ dx = 0<br />
Jotta tämä pätisi kaikilla variaatioilla η, yo. apulauseesta seuraa Eulerin yhtälö:<br />
∂f<br />
∂y − d<br />
dx<br />
Esimerkki 2.7 Lyhin tason pisteet (a, y a ) ja (b, y b ) yhdistävä käyrä.<br />
Pituuselementti: ds = √ dx 2 + dy 2 = √ 1 + (y ′ ) 2 dx. Käyrän pituus on<br />
∫ (b,yb )<br />
∫ b<br />
∂f<br />
∂y ′ = 0. (2.7)<br />
√<br />
J[y] = ds = 1 + (y ′ ) 2 dx , jolle Euler:<br />
(a,y a) a } {{ }<br />
f(y,y ′ ,x)<br />
∂f<br />
∂y − d ∂f<br />
dx ∂y ′ = − d ∂f<br />
dx ∂y ′ = 0<br />
=⇒ d y ′<br />
√<br />
dx 1 + (y ′ ) = 0 2<br />
=⇒<br />
y ′<br />
√<br />
1 + (y ′ ) 2 = C = vakio<br />
=⇒<br />
dy<br />
dx = α = vakio<br />
=⇒ y = αx + β Suora!
8<br />
Vakiot α ja β määräytyvät ehdoista y(a) = y a ja y(b) = y b . On selvää, että ääriarvo on minimi eikä<br />
maksimi.<br />
Jos varioitava integrandi ei riipu eksplisiittisesti x:stä, Eulerin yhtälö redusoituu ensimmäisen asteen<br />
yhtälöksi (Beltramin identiteetti):<br />
df<br />
dx<br />
=<br />
Euler<br />
{}}{<br />
=<br />
Koska oletuksen mukaan ∂f/∂x = 0, saadaan:<br />
d<br />
dx<br />
=<br />
(<br />
f − y ′ ∂f<br />
∂y ′ )<br />
∂f<br />
∂x + ∂f<br />
∂y y′ + ∂f<br />
∂y ′ y′′<br />
∂f<br />
∂x + d ∂f<br />
y′<br />
dx ∂y ′ + ∂f<br />
∂f<br />
∂x + d (<br />
y ′ ∂f )<br />
dx ∂y ′ .<br />
= 0<br />
joka on ensimmäisen kertaluvun DY y(x):lle (f annettu).<br />
Esimerkki 2.8 Pienimmän pinta-alan pyörähdyskappale.<br />
A[y]<br />
= 2π<br />
∂y ′ y′′<br />
eli f − y ′ ∂f<br />
∂y ′ = C = vakio, (2.8)<br />
∫ b<br />
a<br />
y √ 1 + (y ′ ) 2 dx , jolloin<br />
δA = 0 =⇒ f − y ′ ∂f<br />
∂y ′ = C<br />
⇐⇒<br />
y ′<br />
y √ 1 + (y ′ ) 2 − y ′ y √<br />
1 + (y ′ ) = 2<br />
⇐⇒ y ′ = 1 C<br />
√<br />
y 2 − C 2 separoituu<br />
=⇒ cosh −1 ( y C ) = (x − C 2)/C<br />
⇐⇒ y = C · cosh( x − C 2<br />
C<br />
) ”katenoidi”.<br />
y<br />
√<br />
1 + (y ′ ) 2 = C<br />
Taas C ja C 2 määräytyvät reunaehdoista ja on selvää, että kyseessä on minimi eikä maksimi.<br />
2.3.1 Yleistys monen funktion funktionaaliin<br />
Tutkittava funktionaali on nyt:<br />
ehdolla<br />
J = J[y 1 , y 2 , . . . , y n ] =<br />
∫ b<br />
a<br />
f(y 1 , . . . , y n , y ′ 1, . . . , y ′ n, x)dx, (2.9)<br />
y i (a) = y ia<br />
y i (b) = y ib<br />
kiinnitetyt, i = 1,...,n .<br />
Varioidaan y i (x) → y i (x) + η i (x) (η i (a) = η i (b) = 0), jolloin:<br />
∫ b n∑<br />
( ∂f<br />
δJ = η i (x) − d ∂f<br />
∂y i dx<br />
a<br />
i=1<br />
=⇒ ∂f − d<br />
∂y i dx<br />
∂f<br />
∂y ′ i<br />
∂y ′ i<br />
)<br />
dx = 0<br />
= 0 i = 1,...,n. (2.10)
9<br />
Yhtälöiden 2.10 (Euler-Lagrange yhtälöt) tärkeä sovellus: Lagrangen mekaniikka.<br />
Massapiste (massa m, paikka ⃗r(t)) liikkuu potentiaalissa V (⃗r). Sillä on liike-energia 1 2 m ˙⃗r 2 , ( ˙⃗r = d⃗r<br />
dt ) ja<br />
potentiaalienergia V (⃗r).<br />
Pienimmän vaikutuksen periaate: Massapisteen rata ⃗r(t), t ∈ [t a , t b ] minimoi (tarkemmin stationarisoi)<br />
vaikutusfunktionaalin S, joka määritellään Lagrangen funktion L aikaintegraalina:<br />
S =<br />
∫ tb<br />
(T − V ) dt. (2.11)<br />
t a<br />
} {{ }<br />
Oletetaan, että massapiste liikkuu vapaasti potentiaalissa V (⃗r). Tällöin:<br />
∫ tb<br />
( )<br />
1<br />
S =<br />
2 m ˙⃗r 2 − V (⃗r) dx , ja Euler-Lagrange:<br />
t a<br />
:=L<br />
δS = 0 ⇐⇒ 1 2 m d dt (2 ˙⃗r) + ∇V (⃗r) = 0<br />
⇐⇒ m¨⃗r = −∇V (⃗r) = ⃗ F (Newton!)<br />
Esimerkki 2.9 (1-ul.) harmoninen värähtelijä.<br />
∫ tb<br />
( 1<br />
S =<br />
t a<br />
2 mẋ2 − 1 )<br />
2 x2 dt<br />
δS = 0 ⇐⇒ mẍ = −kx , merk. k/m =ω 2<br />
⇐⇒<br />
⇐⇒<br />
ẍ = −ω 2 x<br />
A ja B määrätään ehdoista x(t a ) = x a , x(t b ) = x b .<br />
x(t) = A · sin(ωt) + B · cos(ωt)<br />
2.3.2 Yleistys monen muuttujan funktioihin<br />
Olkoon nyt y(¯x) : R n → R, y x1 := ∂y/∂x 1 jne. Nyt 1-ulotteiselle tapaukselle analoginen variaatioongelma<br />
on löytää funktionaalin<br />
∫<br />
J[y] = d n xf(y, y x1 , . . . , y xn , ¯x) , Ω ⊂ R n (2.12)<br />
Ω<br />
ääriarvot, kun y| ∂Ω (x) = y 0 (x), ts. y:n arvot alueen reunalla on kiinitetty. Varioidaan kuten aiemmin<br />
y(¯x) → y(¯x) + η(¯x), missä η(¯x) = 0, kun ¯x ∈ ∂Ω.<br />
∫<br />
J[y + η] = d n xf(y + η, y x1 + η x1 , . . . , y xn + η xn , ¯x)<br />
=<br />
Ω<br />
∫ (<br />
)<br />
J[y] + d n ∂f<br />
n∑<br />
x<br />
∂y η + ∂f<br />
η x1 + O(η 2 )<br />
∂y xi<br />
Osittaisintegroidaan summa-termiä ja käytetään divergenssiteoreemaa:<br />
=<br />
=<br />
∫<br />
∫<br />
∫<br />
Ω<br />
Ω<br />
∂Ω<br />
d n x<br />
d n x<br />
d ¯S ·<br />
n∑<br />
i=1<br />
n∑<br />
i=1<br />
(<br />
Ω<br />
∂f<br />
∂y xi<br />
η x1<br />
∂<br />
∂x 1<br />
( ∂f<br />
∂y xi<br />
η<br />
η<br />
n∑<br />
i=1<br />
)<br />
)<br />
∂f<br />
ê xi −<br />
∂y xi<br />
i=1<br />
∫ (<br />
− d n x η<br />
Ω<br />
∫ (<br />
Ω<br />
d n x<br />
η<br />
n∑<br />
i=1<br />
n∑<br />
i=1<br />
( ) )<br />
∂ ∂f<br />
∂x i ∂y xi<br />
( ) ) ∂ ∂f<br />
.<br />
∂x i ∂y xi
10<br />
Näistä ensimmäinen termi on 0, sillä η(¯x) ≡ 0 reunalla, joten<br />
∫ ( (<br />
J[y + η] − J[y] = d n ∂f<br />
n∑<br />
( ) ))<br />
x η<br />
∂y − ∂ ∂f<br />
∂x i ∂y xi<br />
= 0<br />
Ω<br />
⇐⇒<br />
∂f n∑<br />
∂y −<br />
i=1<br />
i=1<br />
( )<br />
∂ ∂f<br />
∂x i ∂(∂y/∂x i )<br />
Luonnollisesti tulos yleistyy monen funktion funktionaalille. Tällöin Eulerin yhtälöt ovat<br />
∂f<br />
∂y k<br />
−<br />
i=1<br />
kaikilla k = 1, . . . , n, jos<br />
∫<br />
J = J[y 1 , . . . , y k ] =<br />
= 0. (2.13)<br />
n∑<br />
(<br />
)<br />
∂ ∂f<br />
= 0 (2.14)<br />
∂x i ∂(∂y k /∂x i )<br />
Ω<br />
d n xf(y 1 , . . . , y k , . . . , ∂y l<br />
∂x m<br />
, . . . , ¯x),<br />
missä käydään läpi kaikkien funktioiden kaikki osittaisderivaatat.<br />
Esimerkki 2.10 Skalaarikenttä minkowski-avaruudessa.<br />
x 0 = ct, x 1 = x, x 2 = y ja x 3 = z sekä vaikutus<br />
∫ ( ( ) )<br />
S = dtd 3 1 ∂ϕ 2<br />
x<br />
− 1 2c ∂t 2 (∇ϕ)2 − 1 2 m2 ϕ 2 .<br />
Jolloin:<br />
δS = 0<br />
⇐⇒ −m 2 ϕ − 1 ∂ ∂ϕ<br />
c 2 ∂t ∂t + ∂2 ϕ<br />
∂x 2 + ∂2 ϕ<br />
∂y 2 + ∂2 ϕ<br />
∂z 2 = 0<br />
⇐⇒ ( 1 ∂ 2<br />
c 2 ∂t 2 − ∆)ϕ + m2 ϕ = 0 (Klein-Gordon-yhtälö!)<br />
2.4 Sidottu (Ehdollinen) variaatioprobleema<br />
Etsittävä funktionaalin (taas käydään läpi kaikki osittaisderivaatat ja x ∈ R n )<br />
∫<br />
J[y] = d n xf(y 1 , . . . , y k , . . . , ∂y l<br />
, . . . , ¯x) (2.15)<br />
∂x m<br />
stationaariset arvot ehtojen (k = 1, . . . , K)<br />
Ω<br />
ϕ k (y j , ∂y j<br />
∂x i<br />
, ¯x) := ϕ k (y 1 , . . . , y n , . . . , ∂y l<br />
∂x m<br />
, . . . , ¯x) = 0 (2.16)<br />
valitessa. Ehtoja 2.16 kutsutaan holonomisiksi, jos ϕ ei riipu y i :n derivaatoista (muuten ne ovat eiholonomisia).<br />
Taas ratkaisu löytyy Lagrangen kertojien avulla ts. tutkimalla funktionaalia<br />
∫<br />
K[y] =<br />
Ω<br />
d n x<br />
(<br />
f +<br />
K∑<br />
k=1<br />
λ k (¯x)ϕ k (y j , ∂y j<br />
∂x i<br />
, ¯x)<br />
)<br />
. (2.17)
11<br />
Stationaaristen arvojen selvittämiseksi varioidaan funktiot y j ja λ k , jolloin Euler-Lagrange yhtälöt ovat<br />
(merk. g = f + ∑ λ k ϕ k )<br />
∂g<br />
∂y j<br />
−<br />
∂g<br />
∂λ k<br />
−<br />
⇐⇒<br />
n∑<br />
i=1<br />
n∑<br />
i=1<br />
∂<br />
∂x i<br />
∂<br />
∂x i<br />
Esimerkki 2.11 Sylinteri kaltevalla tasolla.<br />
∂g<br />
∂(∂y j /∂x i )<br />
∂g<br />
∂(∂λ k /∂x i )<br />
= 0 , kaikilla j sekä<br />
= 0 , kaikilla k<br />
ϕ k (y j , ∂y j<br />
∂x i<br />
, x i ) = 0 , kaikilla k<br />
Kappaleella massa m, hitausmomentti I, x-taso pinnan suuntainen (x etäisyys huipulta) ja α pinnan<br />
ja vaakatason välinen kulma:<br />
T = 1 2 mẋ2 + 1 2 I ˙θ 2<br />
V = mg(l − x)sin(α),<br />
missä l on levyn pituus ja α kulma. Sidosehtona tietysti vierimisehto ẋ = R ˙θ. On siis minimoitava<br />
S =<br />
=<br />
∫ t1<br />
∫ t1 (<br />
t 0<br />
Ldt = T − V + λ(t)(ẋ − R ˙θ)<br />
)<br />
dt<br />
t 0<br />
( 1<br />
2 mẋ2 + 1 2 I ˙θ 2 − mg(l − x)sin(α) + λ(t)(ẋ − R ˙θ)<br />
∫ t1<br />
jolle Euler-Lagrange yhtälöt ovat<br />
t 0<br />
d<br />
dt<br />
( ∂L<br />
∂ẋ<br />
d<br />
dt<br />
d<br />
dt<br />
)<br />
− ∂L<br />
Nyt 2.19 ⇒ ˙λ = I/R¨θ, sijoitetaan yhtälöön 2.18, jolloin<br />
)<br />
dt,<br />
∂x = mẍ + ˙λ − mgsin(α) = 0 (2.18)<br />
( ) ∂L<br />
∂ ˙θ<br />
− ∂L<br />
∂θ = I ¨θ − R ˙λ = 0 (2.19)<br />
( ) ∂L<br />
∂ ˙λ<br />
− ∂L<br />
∂λ = R ˙θ − ẋ = 0. (2.20)<br />
mẍ + I/R¨θ − mgsin(α) = 0.<br />
2.20:sta seuraa ¨θ = ẍ/R ja sijoittamalla tämä saatuun yhtälöön saadaan<br />
missä integroimisvakiot määrätään alkuehdoista.<br />
2.5 Isoperimetrinen ongelma<br />
(m + I/R 2 )ẍ = mgsin(α)<br />
=⇒ x(t) = 1 mgsin(α)<br />
2 m + I/R 2 t2 + v 0 t + x 0 ,<br />
Vastaa sidottua variaatio-ongelmaa, mutta sidosehtona on toinen funktionaali. Toisin sanoen, mitkä<br />
ovat funktionaalin<br />
J[y] =<br />
∫ b<br />
a<br />
dxf(y, y ′ , x) (2.21)
12<br />
ääriarvot, kun vaaditaan, että<br />
K[y] =<br />
∫ b<br />
a<br />
dxg(y ′ , y, x) = C = vakio. (2.22)<br />
Tämä(kin!) ratkeaa kätevimmin Lagrangen kertojien avulla, tosin nyt kerroin on luku eikä funktio.<br />
Etsittävä funktionaalin<br />
L λ [y] = J[y] + λ(K[y] − C) (2.23)<br />
stationaariset pisteet. Eulerin yhtälöt tälle ovat:<br />
∂(f + λg)<br />
− d<br />
∂y dx<br />
∂(f + λg)<br />
∂y ′ = 0<br />
∂L λ<br />
∂λ = K[y] − C = 0<br />
Esimerkki 2.12 Yhdistettävä pisteet (a, 0) ja (b, 0) annetun pituisella käyrällä (y ≥ 0) s.e. käyrän ja<br />
x-akselin rajoittama pinta-ala on mahdollisimman suuri.<br />
Nyt 2.21, 2.22 ja 2.23 ovat vastaavasti<br />
Jolloin Eulerin yhtälöstä<br />
J[y] =<br />
K[y] =<br />
L λ [y] =<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
y(x)dx<br />
( )<br />
λ d y ′<br />
√ = 1<br />
dx 1 + (y ′ ) 2<br />
=⇒<br />
√<br />
1 + (y ′ ) 2 dx = l<br />
y ′<br />
√<br />
1 + (y ′ ) 2 = λ−1 (x − C 1 )<br />
y(x) + λ √ 1 + (y ′ ) 2 dx − λl.<br />
⇐⇒ dy<br />
dx = ± x − C<br />
√ 1<br />
λ 2 − (x − C 1 ) = ± d √<br />
λ 2 dx<br />
2 − (x − C 1 ) 2<br />
=⇒ y − C 2 = ± √ λ 2 − (x − C 1 ) 2<br />
=⇒ (x − C 1 ) 2 + (y − C 2 ) 2 = λ 2 (2.24)<br />
2.24 on ympyrän yhtälö. Lisäki y(a) = y(b) = 0, joten (muutaman välivaiheen jälkeen)<br />
C 1 = a + b<br />
√<br />
ja C 2 = − λ<br />
2<br />
2 (b − a)2<br />
− .<br />
4<br />
Lisäksi λ määräytyy ehdosta<br />
∫ b<br />
dx<br />
K[y] = λ √<br />
λ 2 − (x − C 1 ) 2<br />
= λ<br />
a<br />
∫ (b−a)/2λ<br />
−(b−a)/2λ<br />
sij. t = (x − C 1 )/λ<br />
( )<br />
dt<br />
(b − a)<br />
√ = 1 − t 2 2λsin−1 = l. (2.25)<br />
2λ
13<br />
2.6 Toinen variaatio<br />
Tässä luvussa johdamme välttämättömän ehdon sille, että funktionaalin<br />
J[y] =<br />
∫ b<br />
a<br />
f(y, y ′ , x)dx (2.26)<br />
stationaarinen piste y 0 = y 0 (x) (ts. Eulerin yhtälön ratkaisu) on minimi tai maksimi. Oletetaan,<br />
että f:n toiset osittaisderivaatat y:n ja y’:n suhteen ovat jatkuvia. Lasketaan J pisteessä y = y(x) =<br />
y 0 (x) + αη(x), missä α on ”pieni” ja η(a) = η(b) = 0:<br />
J[y 0 + αη]<br />
∫ b<br />
( ∂f<br />
= J[y 0 ] + α<br />
a ∂y − d )<br />
∂f<br />
dx ∂y ′ η(x)dx<br />
y=y } {{ } 0<br />
=0 (Euler)<br />
+ 1 ∫ b<br />
( ∂ 2 )<br />
f<br />
2 α2 a ∂y 2 η2 (x) + 2 ∂2 f<br />
∂y∂y ′ η(x)η′ (x) +<br />
∂2 f<br />
∂(y ′ ) 2 (η′ (x)) 2 dx<br />
y=y<br />
} {{ 0<br />
}<br />
δ 2 J<br />
+ O(α 3 ).<br />
Huomataan 2ηη ′ = (η 2 ) ′ ja osittaisintegroidaan δ 2 J:n keskimmäinen termi jolloin saadaan ”toinen<br />
variaatio”<br />
∫ b<br />
(<br />
δ 2 J = α2 ∂ 2 f<br />
2 a ∂y 2 − d ∂ 2 ) (<br />
f<br />
∂<br />
dx ∂y∂y ′ η 2 2 )<br />
f<br />
+<br />
y=y } {{ } 0<br />
∂(y ′ ) 2 (η ′ ) 2 dx.<br />
y=y } {{ } 0<br />
=:S(x)<br />
=:R(x)<br />
Jos nyt oletamme, että y 0 antaa J:n minimin, tällöin tietysti δ 2 J ≥ 0 kaikilla η(x). Väitämme, että<br />
tällöin on välttämättä oltava R(x) ≥ 0, a < x < b.<br />
Tehdään vastaoletus: löytyy x = c ∈ (a, b) s.e. R(c) < 0. Koska R on jatkuva, on olemassa δ s.e.<br />
R(x) < 0 kaikilla c − δ ≤ x ≤ c + δ. Valitaan ɛ s.e. 0 < ɛ < δ ja määritellään<br />
η(x) = (x − (c − ɛ)) 2 (x − (c + ɛ)) 2 , x ∈ [c − ɛ, c + ɛ] , 0 muuten.<br />
Valitsemalla ɛ tarpeeksi pieneksi saamme<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
S(x)η 2 (x)dx ≈ S(c)<br />
R(x)(η ′ ) 2 (x)dx ≈ R(c)<br />
∫ c+ɛ<br />
c−ɛ<br />
∫ c+ɛ<br />
Valitsemalla ɛ riittävän pieneksi (ɛ 9
14<br />
2.7 Funktionaaliderivaatta<br />
Variaatiolaskenta voidaan muotoilla tavallista differentiaalilaskentaa vastaavaan muotoon funktionaaleille<br />
F [y], joiden määrittelyjouko on funktioavaruus S (nopeasti häviävät funktiot) tai K (kompaktin<br />
kantajan funktiot). Määritellään tätä varten δ-jono:<br />
Määritelmä 2.3 Funktiot δ 1 (x), δ 2 (x),... muodostavat δ-jonon jos<br />
1)<br />
∫ ∞<br />
2) lim<br />
n→∞<br />
dxδ n (x) = 1<br />
−∞<br />
∫ ∞<br />
−∞<br />
∀ n ∈ N<br />
dxf(x)δ n (x) = f(0)<br />
, kun f ∈ K tai f ∈ S<br />
δ-jonoja on useita, esimerkiksi<br />
⎧<br />
⎨ 0 , x < −(2n) −1<br />
1) δ n (x) = n , −(2n) −1 ≤ x ≤ (2n) −1<br />
⎩<br />
0 , (2n) −1 < x<br />
2) δ n (x) = √ n e −n2 x 2<br />
π<br />
3) δ n (x) = sin(nx)<br />
πx<br />
4) δ n (x) = n 1<br />
π 1 + n 2 x 2 .<br />
Haluamme tietää kuinka paljon F [y] muuttuu, kun y(x) muutetaan hieman x = x ′ :n ympäristössä.<br />
Tavanomaiselle tapaukselle analogisesti määritellään funktionaaliderivaatta:<br />
Määritelmä 2.4 (Funktionaaliderivaatta)<br />
Ja tästä heti muutama esimerkki:<br />
δF<br />
δy(x ′ ) = lim lim 1 (<br />
F [y + ɛδn (x − x ′ )] − F [y] ) (2.30)<br />
n→∞ ɛ→0 ɛ<br />
Esimerkki 2.13<br />
F 1 [y] =<br />
F 1 [y + ɛδ n (x − x ′ )] =<br />
=<br />
∫ ∞<br />
−∞<br />
∫ ∞<br />
dx[y(x)] p + ɛp<br />
−∞<br />
∫ ∞<br />
−∞<br />
∫ ∞<br />
dx[y(x)] p p ≥ 1<br />
dx[y(x) + ɛδ n (x − x ′ )] p<br />
−∞<br />
dxy p−1 (x)δ n (x − x ′ ) + O(ɛ 2 ),<br />
joten<br />
(<br />
F1 [y + ɛδ n (x − x ′ )<br />
)] − F 1 [y]<br />
ɛ<br />
=⇒ δF 1<br />
δy(x ′ )<br />
−→<br />
ɛ→0<br />
∫ ∞<br />
p dxy p−1 (x)δ n (x − x ′ )<br />
−∞<br />
−→<br />
n→∞ pyp−1 (x ′ )<br />
= py p−1 (x ′ )
15<br />
Esimerkki 2.14<br />
F 1 [y + ɛδ n (x − x ′ )] − F 1 [y]<br />
ɛ<br />
F 2 [y] =<br />
−→<br />
ɛ→0<br />
−→<br />
n→∞<br />
∫ ∞<br />
p<br />
−∞<br />
∫ ∞<br />
−∞<br />
dx[y ′ (x)] p p ≥ 1<br />
dx[y ′ (x)] p−1 δ ′ n(x − x ′ )<br />
∫ ∞<br />
p dx[y ′ (x)] p−1 δ ′ (x − x ′ )<br />
−∞<br />
= −p d<br />
dx [y′ (x)] p−1 ∣<br />
∣∣∣x=x<br />
′<br />
= −p(p − 1)[y ′ (x ′ )] p−2 y ′′ (x ′ )<br />
Huomaa (mm. yo. esimerkeissä), että käytännössä voidaan käyttää<br />
δF<br />
δy(x ′ ) = lim<br />
ɛ→0<br />
F [y + ɛδ(x − x ′ )] − F [y]<br />
, (2.31)<br />
ɛ<br />
kunhan sovitaan, että F [y(x) + ɛδ(x − x ′ )] kehitetään vain 1. kertaluvun tarkkuudella ɛ:n suhteen.<br />
Luonnollinen kysymys: milloin δJ/δy = 0, kun J on kuten 2.26:ssa ja miten se on tulkittava?<br />
J[y] =<br />
=⇒ δJ<br />
δy(x ′ )<br />
=<br />
=<br />
∫ ∞<br />
−∞<br />
∫ ∞<br />
−∞<br />
f(y, y ′ , x)dx<br />
dx<br />
( ∂f<br />
∂y − d<br />
dx<br />
[ ∂f<br />
∂y δ(x − x′ ) + ∂f<br />
∂y ′ δ′ (x − x ′ )<br />
∂f<br />
∂y ′ )x=x ′<br />
Eli ehto δF/δy = 0 on ekvivalentti aiemmin saadun Eulerin yhtälön kanssa, kuten tietysti kuuluukin.<br />
2.8 Ritzin menetelmä<br />
Menetelmä variaatio-ongelman<br />
∫<br />
J[y] =<br />
Ω<br />
d n xf(y, y x1 , . . . , y xn , ¯x) , Ω ⊂ R n (2.32)<br />
likimääräiselle ratkaisemiselle, s.o. menetelmä etsiä Eulerin osittaisdifferentiaaliyhtälön<br />
∂f<br />
n∑<br />
( )<br />
∂y − ∂ ∂f<br />
= 0 (2.33)<br />
∂x i ∂(∂y/∂x i )<br />
likimääräinen ratkaisu, kun y| ∂Ω = g on annettu. Ritzin menetelmä:<br />
i=1<br />
1) Etsitään N riippumatonta ratkaisua ϕ 1 , . . . , ϕ N , jotka toteuttavat ϕ i | ∂Ω = g kaikilla i = 1, . . . , N.<br />
2) Ratkaisuyrite: u N (x) = ∑ N<br />
i=1 a iϕ i (x).<br />
3) Lasketaan J[u] = j(a 1 , a 2 , . . . , a n ).<br />
4) Etsitään funktion j stationaariset pisteet (ā 1 , ā 2 , . . . , ā N ) luvun 2.1 menetelmin (myös min. max.<br />
tarkastelu).<br />
5) Likim. ratkaisu on ū N (x) = ∑ N<br />
i=1 āiϕ i (x) ja J[ū N ] = j(ā 1 , ā 2 , . . . , ā N )<br />
Esimerkki 2.15 Poisson yhtälö (ρ annettu).<br />
Ratkaistaan<br />
∆u = ρ(x, y) (2.34)<br />
]
16<br />
likimääräisesti yksikköneliössä Ω = (0, 1) × (0, 1), kun u(x, y) = 0 reunalla. Huomataan, että 2.34 on<br />
Eulerin yhtälö funktionaalille<br />
∫ 1 ∫ (<br />
1<br />
(∂u ) 2 ( ) ∂u 2<br />
J[u] = dxdy + + 2ρ(x, y)u(x, y))<br />
∂x ∂y<br />
Euler :<br />
Yritefunktioiksi ϕ i voidaan valita esim.<br />
0<br />
0<br />
∂ ∂f<br />
+ ∂ ∂f<br />
− ∂f<br />
∂x ∂u x ∂y ∂u y ∂u = 2u xx + 2u yy − 2ρ(x, y) = 0<br />
ϕ 1 (x, y) = xy(1 − x)(1 − y) , (selvästi ϕ| ∂Ω = 0)<br />
0<br />
ϕ 2 (x, y) = xϕ 1 (x, y) , ϕ 3 (x, y) = yϕ 1 (x, y)<br />
ϕ 4 (x, y) = x 2 ϕ 1 (x, y) , ϕ 5 (x, y) = y 2 ϕ 1 (x, y)<br />
ϕ 6 (x, y) = xyϕ 1 (x, y)<br />
0<br />
i,j<br />
jne. jne.<br />
niin pitkälle kuin sielu sietää. Nyt yrite on u N (x, y) = ∑ N<br />
i=1 a iϕ i (x) ja<br />
⎛<br />
∫ 1 ∫ 1<br />
N∑<br />
(<br />
J[u N ] = dxdy ⎝ ∂ϕi ∂ϕ j<br />
a i a j<br />
∂x ∂x + ∂ϕ )<br />
i ∂ϕ j<br />
+ 2<br />
∂y ∂y<br />
missä<br />
=<br />
N∑<br />
N∑<br />
A ij a i a j + 2 b i a i = j(a 1 , a 2 , . . . , a N ),<br />
i,j<br />
A ij =<br />
b i =<br />
Etsitään j:n stationaariset pisteet:<br />
∫ 1 ∫ 1<br />
0 0<br />
∫ 1 ∫ 1<br />
0<br />
0<br />
∂j<br />
∂a i<br />
=<br />
i<br />
( ∂ϕi ∂ϕ j<br />
dxdy<br />
∂x ∂x + ∂ϕ i<br />
∂y<br />
⎞<br />
N∑<br />
a i ϕ i ρ⎠<br />
i<br />
)<br />
∂ϕ j<br />
= A ji (2.35)<br />
∂y<br />
dxdyρ(x, y)ϕ i (x, y) (2.36)<br />
N∑<br />
(A ij a j + A ji a j ) + 2b i<br />
j<br />
⎛<br />
= 2 ⎝b i +<br />
kun A ij :t ja b i :t kerätään matriiseiksi. Ratkaisu on siis<br />
ū(x, y) =<br />
N∑<br />
j<br />
A ij a j<br />
⎞<br />
⎠ = 0<br />
⇐⇒ Aa = −b, (2.37)<br />
ā = −A −1 b ts. a i = −<br />
N∑<br />
(A −1 ) ij b j (2.38)<br />
j=1<br />
N∑<br />
ā i ϕ i (x, y) (2.39)<br />
i=1<br />
Matriisien alkioiden laskeminen ja matriisin kääntäminen onnistuu helposti tietokoneella.
17<br />
3 Sturm-Liouville-Teoria<br />
3.1 Perusominaisuudet<br />
Yleinen Sturm-Liouville (S-L) yhtälö 2<br />
(<br />
d<br />
p(x) du(x) )<br />
+ (−q(x) + λw(x)) u(x) = 0, a ≤ x ≤ b. (3.1)<br />
dx dx<br />
Sallitaan myös arvot a = −∞, b = ∞. Lisäksi kerroinfunktioilta vaaditaan<br />
1) p(x),q(x),w(x) reaalisia.<br />
2) q ja w vähintään jatkuvia.<br />
3) p jatkuvasti derivoituva ja p(x) ≠ 0, x ∈ (a, b) sekä p(x) > 0. (Tarvittaessa yhtälö kerrotaan -1:llä.)<br />
4) w(x) > 0 x ∈ [a, b]. (Tarvittaessa λ → −λ.)<br />
Lisäksi<br />
jos a ≠ −∞, b ≠ ∞ ja p(a) ≠ 0 ≠ p(b), niin kyseessä on säännöllinen S-L ongelma.<br />
Jos p(a) = 0 ja/tai p(b) = 0, S-L ongelma on singulaarinen, samoin jos a = −∞ ja/tai b = ∞.<br />
(3.1):n lisäksi asetetaan homogeeniset reunaehdot:<br />
Säännöllinen S-L:<br />
Singulaarinen S-L:<br />
A 1 u(a) + A 2 u ′ (a) = 0 (A 1 , A 2 ) ≠ (0, 0) (3.2)<br />
B 1 u(b) + B 2 u ′ (b) = 0 (B 1 , B 2 ) ≠ (0, 0) (3.3)<br />
p(a) ≠ 0, p(b) = 0 : (3.2) sekä |u(b)| < ∞ (3.4)<br />
p(a) = 0, p(b) ≠ 0 : (3.3) sekä |u(b)| < ∞ (3.5)<br />
p(a) = 0, p(b) = 0 : |u(x)| < ∞, a < x < b. (3.6)<br />
Osoittautuu, että S-L yhtälöllä 3.1 on tilanteen mukaisilla reunaehdoilla nollasta eroavia ratkaisuja<br />
vain tietyillä λ = λ k . Näitä kutsutaan Sturm-Liouville-operaattorin<br />
L := − d<br />
dx p(x) d + q(x) (3.7)<br />
dx<br />
ominaisarvoiksi (engl. eigenvalues). Vastaavat ratkaisut u k ovat (vakiokerrointa vaille) ominaisarvoja<br />
vastaavat ominaisfunktiot (engl. eigenfunctions). Huomaa, että myös vakiolla kerrottu u k ratkaisee<br />
S-L:n:<br />
Lu = λ k wu k =⇒ LCu = λ k wCu k .<br />
On hyödyllistä huomata, että mikä tahansa 2-kertaluvun DY voidaan muuttaa S-L-yhtälöksi, toisin<br />
sanoen mikä tahansa operaattori<br />
L = a 2 (x) d2<br />
dx 2 + a 1(x) d<br />
dx + a 0(x) (3.8)<br />
2 q:n etumerkki Cronströmin kirjan mukainen. Esimerkiksi Arfken ja Weber käyttää +-etumerkkiä.
18<br />
voidaan kirjoittaa muodossa L = ϕ(x)L. Kuinka?<br />
ϕ(x)L = −ϕ(x)p(x) d2<br />
dx 2 − ϕ(x)p′ (x) d<br />
dx + ϕ(x)q(x)<br />
=⇒ p′ (x)<br />
p(x) = a 1(x)<br />
a 2 (x)<br />
(∫ x<br />
=⇒ p(x) = exp<br />
=⇒ ϕ(x) = − a 2(x)<br />
p(x) = −a 2(x)exp<br />
a 1 (x ′ )<br />
)<br />
x 0<br />
a 2 (x ′ ) dx′ ( ∫ x<br />
−<br />
a 1 (x ′ )<br />
)<br />
x 0<br />
a 2 (x ′ ) dx′<br />
=⇒ q(x) = a 0(x)<br />
ϕ(x) = −a 0(x)<br />
a 2 (x) exp (∫ x<br />
x 0<br />
a 1 (x ′ )<br />
a 2 (x ′ ) dx′ )<br />
3.1.1 Erikoisfunktiot ja Sturm-Liouville yhtälöt<br />
Legendren polynomit<br />
Legendren liittofunktiot<br />
− d [<br />
(1 − x 2 ) dP ]<br />
l(x)<br />
= l(l + 1)P l (x) (3.9)<br />
dx<br />
dx<br />
a = −1, b = 1, p(x) = 1 − x 2 , q(x) = 0, w(x) = 1, λ = l(l + 1)<br />
− d<br />
dx<br />
[(1 − x 2 ) dP l<br />
m<br />
dx<br />
]<br />
(x)<br />
+ m<br />
1 − x 2 P l<br />
m (x) = l(l + 1)Pl m (x) (3.10)<br />
a = −1, b = 1, p(x) = 1 − x 2 , q(x) = m2<br />
, w(x) = 1, λ = l(l + 1)<br />
1 − x2 Besselin funktiot (R > 0 J ν :n 0-kohta, ξ = x/R ∈ [0, 1])<br />
[<br />
d<br />
ξ dJ ]<br />
ν(ξR)<br />
+ ν2<br />
dξ dξ ξ J ν(ξR) = R 2 ξJ ν (ξR) (3.11)<br />
Laguerren polynomit<br />
Laguerren liittopolynomit<br />
Hermiten polynomit<br />
a = 0, b = 1, p(ξ) = ξ, q(ξ) = ν2<br />
, w(ξ) = ξ, λ = R2<br />
ξ<br />
− d [<br />
xe −x dL ]<br />
n<br />
= ne −x L n (x) (3.12)<br />
dx dx<br />
a = 0, b = ∞, p(x) = xe −x , q(x) = 0, w(x) = e −x , λ = n<br />
− d (<br />
)<br />
x k+1 e −x dLk l<br />
= x k e −x nL k<br />
dx dx<br />
n(x) (3.13)<br />
a = 0, b = ∞, p(x) = x k+1 e −x , q(x) = 0, w(x) = x k e −x , λ = n<br />
− d [<br />
e dH ]<br />
−x2 n<br />
= 2ne −x2 H n (x) (3.14)<br />
dx dx<br />
a = −∞, b = ∞, p(x) = e −x2 , q(x) = 0, w(x) = e −x2 , λ = 2n
19<br />
3.1.2 Yksinkertainen esimerkki S-L ongelmasta<br />
d 2 u<br />
+ λu = 0 (3.15)<br />
dx2 Eli S-L yhtälö, missä p(x) = 1, q(x) = 0, w(x) = 1. Asetetaan vielä reunaehdot u(0) = u(π) = 0. Millä<br />
λ:n arvoilla löydetään 0:sta eroavia ratkaisuja? (3.15):n yleinen ratkaisu on<br />
jolloin reunaehdoista seuraa<br />
u(x) = C 1 e √ −λx + C 2 e −√ −λx ,<br />
C 1 + C 2 = 0 (x = 0)<br />
e √ −λπ C 1 + e −√ −λπ C 2 = 0 (x = π)<br />
Yhtälöparilla on 0:sta eroavia ratkaisuja vain jos kerroindeterminantti on nolla<br />
1 1<br />
∣ e √ −λπ<br />
e −√ −λπ ∣ = e√ −λπ − e −√−λπ = 0<br />
⇐⇒ e 2√ −λπ = 1<br />
=⇒ 2 √ −λπ = 2nπi , n ∈ Z<br />
=⇒ λ n = n 2<br />
Vastaavat ominaisfunktiot (merk. C 1 = C/(2i) (⇒ C 2 = −C/(2i)) ovat<br />
u n = C 2i<br />
(<br />
e inx − e −inx) = Csin(x) (3.16)<br />
Lisäksi huomataan, että n = 0, u 0 ei ole ratkaisu ja -n ja n antavat saman λ n :n, jota vastaavat u n ja<br />
u −n = −u n eivät ole lineaarisesti riippumattomat, eli ratkaisu:<br />
Huomioita:<br />
• Ominaisarvot reaalisia.<br />
Ominaisarvot λ n = n 2<br />
Ominaisfunktiot u n = sin(nx)<br />
• Ominaisarvot alhaalta, muttei ylhäältä rajoitettuja<br />
, n ∈ N<br />
• Jokaista ominaisarvoa vastaa yksi ominaisfunktio. Jos useampia lin. riippumattomia,<br />
niin ominaisarvo on degeneroitunut.<br />
• u n :llä n-1 nollakohtaa välillä (a, b).<br />
• u n+1 :llä täsmälleen yksi nollakohta u n :n kahden peräkkäisen 0-kohdan välillä.<br />
• Eri ominaisarvoihin liittyvät ominaisfunktiot ortogonaalisia (L 2 :ssa), ts. m ≠ n ⇒<br />
∫ b<br />
a u n(x)u m (x)dx = 0 (w(x)=1).<br />
• Ominaisfunktiot u n , n = 1, 2, . . . muodostavat täydellisen funktiojoukon (FyMM Ib).<br />
”Mikä tahansa” F voidaan kehittää F (x) = ∑ a k u k (x) (Fourier’n sinisarja).
20<br />
3.2 Itseadjungoidut operaattorit<br />
Kompleksiarvoisille funktioille voidaan määritellä skalaaritulo eli sisätulo<br />
〈f|g〉 =<br />
∫ b<br />
a<br />
f ∗ (x)g(x)dx (3.17)<br />
Nyt jokaiselle lineaariselle operaattorille A voidaan määritellä adjungoitu operaattori A † , jolle<br />
kaikille annetut reunaehdot toteuttaville f ja g.<br />
Esimerkki 3.1 A = d<br />
dx<br />
, reunaehdot f(a) = f(b) = 0.<br />
〈f|Ag〉 =<br />
〈f|Ag〉 = 〈A † f|g〉 (3.18)<br />
∫ b<br />
a<br />
/ b<br />
a<br />
f ∗ (x) dg(x)<br />
dx<br />
dx<br />
= f ∗ g −<br />
} {{ }<br />
0<br />
∫ b<br />
a<br />
df ∗ (x)<br />
dx<br />
g(x)dx<br />
= −〈 df<br />
dx |g〉 =⇒ A† = − d<br />
dx<br />
Esimerkki 3.2 A = d2<br />
dx 2 , reunaehdot f(a) = f(b) = 0.<br />
〈f|Ag〉 =<br />
∫ b<br />
a<br />
/ b<br />
a<br />
f ∗ (x) d2 g(x)<br />
dx 2 dx<br />
= f ∗ dg −<br />
dx<br />
} {{ }<br />
0<br />
/ b<br />
df ∗<br />
= −<br />
a<br />
dx g<br />
} {{ }<br />
0<br />
∫ b<br />
a<br />
∫ b<br />
+<br />
a<br />
df ∗ (x)<br />
dx<br />
= 〈Af|g〉 =⇒ A † = A<br />
dg(x)<br />
dx<br />
dx<br />
d 2 f ∗ (x)<br />
dx 2 g(x)dx<br />
Operaattori A, jolle A † = A, kuten yo. esimerkissä on itseadjungoitu eli hermiittinen. Matemaatikot<br />
tosin tekevät eron näiden käsitteiden välillä liittyen operaattoreiden määrittelyjoukkoihin (palataan<br />
myöhemmin). S-L-operaattorille (3.1) (p(x),q(x) reaalisia) pätee<br />
〈Lu|v〉 − 〈u|Lv〉 =<br />
ja lisäksi ”Lagrangen identiteetti” (FyMM IIa):<br />
Yhdistämällä nämä saadaan<br />
Reunaehdot:<br />
∫ b<br />
v(Lu) ∗ − u ∗ (Lv) = vLu ∗ − u ∗ Lv = d<br />
dx<br />
〈Lu|v〉 − 〈u|Lv〉 = −<br />
a<br />
/ a<br />
b<br />
v(Lu) ∗ − u ∗ (Lv)dx. (3.19)<br />
[<br />
)]<br />
−p(x)<br />
(v du∗ dv<br />
− u∗ . (3.20)<br />
dx dx<br />
)<br />
p(x)<br />
(v du∗ dv<br />
− u∗ . (3.21)<br />
dx dx
21<br />
1) Säännöllinen S-L ongelma<br />
A 1 u ∗ (a) + A 2 u ′ (a) ∗ = 0<br />
A 1 v(a) + A 2 v ′ (a) = 0.<br />
Olkoon ensin A 2 ≠ 0, jolloin u ′ (a) ∗ = −A 1 /A 2 u ∗ (a) ja v ′ (a) = −A 1 /A 2 v(a) ja<br />
v(a)u ′ (a) ∗ − u(a) ∗ v ′ (a) = − A 1<br />
A 2<br />
(v(a)u(a) ∗ −u(a) ∗ v(a)) = 0.<br />
Jos taas A 2 = 0, A 1 ≠ 0, niin reunaehto on u(a) = v(a) = 0 jolloin<br />
Vastaavalla tavalla päätellään, että<br />
2) Singulaarinen S-L ongelma<br />
v(a)u ′ (a) ∗ −u(a) ∗ v ′ (a) = 0. (3.22)<br />
v(b)u ′ (b) ∗ − u(b) ∗ v ′ (b) = 0. (3.23)<br />
• p(b) = 0, jolloin 3.2:sta seuraa<br />
/ a )<br />
− p(x)<br />
(v du∗ dv<br />
− u∗ = 0 · (v(b)u ′ (b) ∗ − u(b) ∗ v ′ (b)) − p(a) · 0 = 0.<br />
b<br />
dx dx<br />
• p(a) = 0, jolloin 3.3:sta seuraa<br />
/ a )<br />
− p(x)<br />
(v du∗ dv<br />
− u∗ = 0 · p(b) − 0 · (v(a)u ′ (a) ∗ − u(a) ∗ v ′ (a)) = 0.<br />
b<br />
dx dx<br />
• p(a) = p(b) = 0, jolloin sijoitustermi on triviaalisti 0.<br />
Kaikissa tapauksissa siis<br />
〈Lu|v〉 = 〈u|Lv〉, (3.24)<br />
eli S-L-operaattori on itseadjungoitu luvun alussa annetuilla reunaehdoilla. Huomaa, että muilla reunaehdoilla<br />
näin ei välttämättä ole. Lopuksi vielä pari huomiota, jotka ovat osa Sturmin-Liouvillen<br />
lausetta (seuraava kappale).<br />
Lause 3.1 Itseadjungoidun differentiaalioperaattorin ominaisarvot ovat reaalisia<br />
Todistus 3.1 Olkoon ϕ ominaisfunktio, jolloin<br />
mistä väite tietysti seuraa.<br />
Lϕ = λwϕ<br />
(3.24) =⇒ 〈Lϕ|ϕ〉 − 〈ϕ|Lϕ〉 = 0<br />
=⇒ λ ∗ 〈wϕ|ϕ〉 − λ〈ϕ|wϕ〉 = 0<br />
=⇒ (λ ∗ − λ)<br />
∫ b<br />
a<br />
dxw(x)|ϕ(x)| 2 = 0<br />
w(x) > 0 =⇒ λ ∗ − λ = 0, (3.25)<br />
Lause 3.2 Kahteen erisuureen ominaisarvoon liittyvät ominaisfunktiot ovat (tietyssä mielessä) ortogonaaliset.
22<br />
Todistus 3.2 Olkoon ϕ 1 ja ϕ 2 kahteen erisuureen ominaisarvoon λ 1 ja λ 2 liittyvät ominaisfunktiot.<br />
Nyt (vrt. edellisen lauseen todistus)<br />
λ 1 ≠ λ 2 =⇒<br />
〈Lϕ 1 |ϕ 2 〉 − 〈ϕ 1 |Lϕ 2 〉 = 0<br />
=⇒(λ 1 − λ 2 )<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
dxw(x)ϕ 1 (x) ∗ ϕ 2 (x) = 0<br />
dxw(x)ϕ 1 (x) ∗ ϕ 2 (x) = 0<br />
eli<br />
〈 √ wϕ 1 | √ wϕ 2 〉 = 0. (3.26)<br />
Tyypillisempää on muuttaa Hilbert-avaruuden 3 L 2 [a, b] sisätuloa S-L ongelmaan sopivampaan muotoon<br />
(f|g) :=<br />
∫ b<br />
a<br />
dxw(x)f(x) ∗ g(x), (3.27)<br />
jolloin ominaisfunktiot ovat ortogonaalisia perinteisessä mielessä, kun ne tulkitaan painotetun L 2 -<br />
avaruuden alkioiksi, missä kaava (3.27) määrää sisätulon.<br />
3.3 Sturmin ja Liouvillen lause<br />
Lause 3.3 (Sturm & Liouville) Säännöllisen Sturm-Liouville-yhtälön Lu = λwu ratkaisuilla on<br />
ainakin seuraavat ominaisuudet:<br />
1. Ratkaisuja on olemassa (vain) kun λ = λ k , missä λ k , k = 1, 2, 3, . . . on ääretön jono reaalisia<br />
ominaisarvoja (λ k < λ k+1 ) ja λ k → ∞, kun k → ∞.<br />
2. Jokaista ominaisarvoa vastaa vakiokerrointa vaille yksikäsitteinen ratkaisu u k (”ominaisfunktio”).<br />
3. Ominaisfunktiot ovat ortogonaalisia sisätulon (3.27) suhteen.<br />
4. Ominaisfunktiolla u n on täsmälleen n 0-kohtaa välillä [a,b]. Ominaisfunktion u n+1 jokainen 0-<br />
kohta on kahden u n :n peräkkäisen 0-kohdan välissä.<br />
5. Ominaisfunktioiden joukko muodostaa kannan avaruuteen L 2 ([a, b]) eli jos f ∈ L 2 ([a, b]) ts. f on<br />
neliöintegroituva kyseisellä välillä ja<br />
a k = (u k|f)<br />
(u k |u k ) = ∫ b<br />
a dxw(x)u k(x)f(x)<br />
∫ b<br />
a dxw(x)(u k(x)) 2 ,<br />
niin<br />
∫ b<br />
lim<br />
N→∞ a<br />
∫ b<br />
a<br />
N dx<br />
∣ f(x) − ∑<br />
a k u k (x)<br />
∣<br />
k=1<br />
∞ dx<br />
∣ f(x) − ∑<br />
a k u k (x)<br />
∣<br />
k=1<br />
2<br />
2<br />
=0, eli<br />
=0.<br />
Siis f ja yo. sarjakehitelmä ovat sama funktio L 2 -mielessä.<br />
3 Näistä lisää myöhemmin
23<br />
Lauseen tarkka todistus löytyy oppikirjoista (Esim. N. Young: An Introduction to Hilber Space, Cambridge<br />
University Press, 1988).<br />
FyMM I:llä esitetty Parsevalin kaava Fourier-sarjoille yleistyy Sturmin-Liouvillen lauseen avulla myös<br />
S-L yhtälön ominaisfunktioille:<br />
(f|f) =<br />
=<br />
=<br />
=<br />
∫ b<br />
a<br />
dxw(x)|f(x)| 2<br />
∞∑<br />
a ∗ k a l<br />
k,l=1<br />
∫ b<br />
a<br />
∞∑<br />
(u k |u k )|a k | 2<br />
k=1<br />
dxw(x)u ∗ k u l<br />
∞∑<br />
||u k || 2 |a k | 2 , (3.28)<br />
k=1<br />
missä on otettu käyttöön myös sisätulon (·|·) määräämä normi.<br />
Pyritään tässä todistamaan 0-kohtien olemassaolo, eli 1-kohta, niin 4-kohta seuraa todistuksesta itsestään.<br />
Kohdat 2 ja 3 todistimme jo aiemmin. Tätä varten muutetaan S-L yhtälö Lu = λwu sijoituksella<br />
z(x) = √ p(x)u(x) muotoon<br />
d 2 z(x)<br />
dx 2 + (Q(x) + λR(x)) z(x) = 0, missä (3.29)<br />
Q(x) = 1 (<br />
(p ′<br />
4p(x) 2 (x)) 2 − 2p(x)p ′ (x) − 4p(x)q(x) )<br />
ja<br />
R(x) = w(x)<br />
p(x) . (3.30)<br />
Huomaa, että kerroinfunktioille asetetuista ehdoista seuraa, että Q ja R hyvin määriteltyjä ja jatkuvia<br />
sekä lisäksi R(x) ≥ 0. Cronströmin ($ 6.4.1-2) todistuksen rakenne:<br />
1. Kiinnitetään λ ∈ C ja ratkaistaan 3.29 alkuehtona z(a) = 0, z ′ (a) = 1, josta saadaan ratkaisu<br />
z(λ, x) (Diff.yhtälöiden olemassaolo- ja yksikäsitteisyyslause).<br />
2. Osoitetaan, että kiinteällä x z(λ, x) on λ:n kokonainen funktio (ei napoja tai muita singulariteettejä).<br />
3. Huomataan, että jos λ on ominaisarvo, niin z(λ, b) = 0.<br />
4. Funktioteoriasta tuttu lause: Nollasta eroavalla kokonaisella funktiolla on korkeintaa numeroituva<br />
määrä 0-kohtia. Lisäksi ∞ on ainoa mahdollinen kasautumispiste. Eli jos ominaisarvoja on<br />
ääretön määrä, niin ne voidaan järjestää jonoon s.e. |λ k | → ∞.<br />
5. Tiedetään jo, että λ k ∈ R, joten osoitetaan että on olemassa ¯λ s.e. ¯λ < λ n kaikilla n, jolloin<br />
λ 1 < λ 2 < λ 3 < . . ., kun ominaisarvot numeroidaan sopivasti.<br />
Todistetaan tässä sama tulos käyttämättä funktioteoriaa (ja huomataan samalla tapa laskea ominaisarvoja<br />
numeerisesti). Todistetaan ensin muutama aputulos.<br />
Lause 3.4 (1. nollakohtalause) Olkoot y(x) ja Y(x) differentiaaliyhtälöiden<br />
d 2 y(x)<br />
dx 2 + q(x)y(x) = 0 ja<br />
d 2 Y (x)<br />
dx 2 + Q(x)Y (x) = 0<br />
ratkaisuja. Jos nyt a ja b (a < b) ovat kaksi ratkaiun Y 0-kohtaa (Y (a) = Y (b) = 0) ja kaikilla<br />
x ∈ [a, b] pätee q(x) ≥ Q(x) eikä yhtäsuuruus päde identtisesti, niin tällöin ratkaisulla y on vähintään<br />
yksi 0-kohta välillä [a, b].
24<br />
Todistus 3.3 Tehdään vastaoletus y(x) ≠ 0 välillä [a,b], eli voidaan jakaa y:llä ja pätee<br />
[<br />
d Y (<br />
yY ′ − y ′ Y )] ∣ ∣∣x<br />
dx y<br />
∣<br />
= Y ′2 + Y }{{} Y ′′ − y′′<br />
Y 2 + y′2<br />
y y<br />
−QY }{{}<br />
2 Y 2 − 2 y′ ∣∣∣x<br />
y Y Y ′<br />
) 2 ∣<br />
= Y 2 (q − Q) +<br />
(Y ′ − y′ ∣∣∣x<br />
y Y<br />
q<br />
Oletuksen mukaan q(x) − Q(x) ≤ 0 joten yo. derivaatta on epänegatiivinen, ja koska q(x) = Q(x) ei<br />
päde identtisesti, niin ainakin jollain välillä se on aidosti positiivinen. Nyt integroimalla a:sta b:hen<br />
saadaan<br />
0 <<br />
∫ b<br />
a<br />
/ b<br />
=<br />
a<br />
dx d<br />
dx<br />
[ Y (x)<br />
y(x)<br />
[ Y (x)<br />
y(x)<br />
(<br />
y(x)Y ′ (x) − y ′ (x)Y (x) )]<br />
(<br />
y(x)Y ′ (x) − y ′ (x)Y (x) )] = 0,<br />
koska Y (a) = Y (b) = 0, mikä on tietysti ristiriita ja täytyy olla y(x) = 0 jossakin välin pisteessä.<br />
Lause 3.5 (2. nollakohtalause) Jokaisella differentiaaliyhtälön<br />
d 2 y(x)<br />
dx 2 + f(x)y(x) = 0<br />
ratkaisulla on välillä a ≤ x < ∞ äärettömän monta nollakohtaa, mikäli f on jatkuva ja f(x) ≥ m 2 > 0<br />
jollakin m tällä välillä. Lisäksi kahden peräkkäisen nollakohdan välinen etäisyys on korkeintaan π/m.<br />
Toisaalta, jos f(x) ≤ −m 2 < 0 jollakin m tällä välillä, niin jokaisella ratkaisulla on korkeintaan yksi<br />
nollakohta samalla välillä.<br />
Todistus 3.4 f(x) ≥ m 2 . Verrataan yhtälöitä y ′′ + fy = 0 ja Y ′′ + m 2 Y = 0, joista jälkimmäisen<br />
ratkaisu on Y (x) = sin(m(x − δ)). Y:n nollakohdat ovat pisteissä x k = δ + kπ m<br />
, k ∈ Z. Koska oletuksen<br />
mukaan f(x) ≥ m 2 on yhtälön y ′′ +fy = 0 ratkaisulla 1. nollakohtalauseen mukaan 1 nollakohta välillä<br />
[x k , x k+1 ] (k valittu s.e. x k ≥ a), toinen välillä [x k+1 , x k+2 ] jne., eli äärettömän monta nollakohtaa.<br />
Lisäksi kahden peräkkäisen nollakohdan väli < π/m, sillä muuten δ:n sopivalla valinnalla voitaisiin<br />
konstruoida tilanne, jossa y:n nollakohdista yksikään ei osuisi välille [x n , x n+1 ] jollakin n.<br />
f(x) ≤ −m 2 . Verrataan yhtälöitä y ′′ + fy = 0 ja Y ′′ − m 2 Y = 0. Jos ensimmäisen yhtälön ratkaisulla<br />
olisi 2 nollakohtaa x 1 ja x 2 (x 1 < x 2 ), niin 1. nollakohtalauseen mukaan jälkimmäisen yhtälön jokaisella<br />
ratkaisulla olisi ainakin yksi nollakohta välillä [x 1 , x 2 ]. Kuitenkaan esimerkiksi funktiolla Y (x) = e mx ,<br />
joka ratkaisee jälkimmäisen yhtälön, ei ole nollakohtaa millään reaaliluvulla, eikä siis myöskään välillä<br />
[x 1 , x 2 ]. y:llä voi siis olla korkeintaan yksi nollakohta.<br />
Palataan taas S-L yhtälön pariin, joka oltiin jo muutettu muotoon (3.29), missä R ja Q jatkuvia ja R<br />
epänegatiivinen. Jatketaan R ja Q (jatkuvasti) alueeseen x > b kaavoilla<br />
R(x) = R(b) ja Q(x) = Q(b) , kun x > b.<br />
Nyt differentiaaliyhtälöiden olemassaolo- ja yksikäsitteisyyslauseen mukaan yhtälöllä (3.29) on jokaisella<br />
λ välillä [a,B] B > b yksikäsitteinen ratkaisu z(λ, x), joka toteuttaa ehdot z(a) = 0, z ′ (a) = 1.<br />
Koska Q ja R ovat jatkuvia ja siten rajoitettuja, löytyy aina ¯λ s.e. Q(x) + ¯λR(x) ≤ −m 2 < 0 välillä
25<br />
[a,B]. 2. nollakohtalauseen mukaan ratkaisuilla z(λ, x) ei ole toista nollakohtaa (z(λ, a) = 0) kun λ ≤ ¯λ,<br />
joten ei löydy ¯λ:a pienempiä ominaisarvoja. Toisaalta löydetään myös ¯λ, jolle<br />
( ) π 2<br />
Q(x) + ¯λR(x) ≥ > 0.<br />
B − a<br />
2. nollakohtalauseen nojalla z(¯λ, x):llä on väh. yksi nollakohta x0 välillä [a,B], aluksi välillä [b,B]. Kun<br />
λ kasvaa x 0 lähestyy b:tä ylhäältä ja kun λ = λ 1 , x 0 = b. Nyt λ 1 on ominaisarvo ja z(λ 1 , x) on sitä<br />
vastaava ominaisfunktio, jolla on nollakohdat a:ssa ja b:ssä (muttei niiden välissä). Annetaan λ:n kasvaa<br />
edelleen. z(λ, x):n 3. nollakohta lähestyy x = b:tä, ja kun λ = λ 2 z(λ 2 , b) = 0. Nyt z 2 (x) := z(λ 2 , x)<br />
on ominaisfunktio, jolla on yksi nollakohta välillä [a,b]. Jatkamalla iterointia saadaan ääretön määrä<br />
ominaisarvoja ja -funktioita. Nyt λ k :t ovat S-L yhtälön ominaisarvot ja funktiot u k = z(λ k , x)/ √ p(x)<br />
niitä vastaavat ominaisfunktiot.<br />
Ominaisarvojen löytäminen ”shooting-metodilla”.<br />
Arvataan jokin λ ja integroidaan numeerisesti diff.yhtälöä (3.29) alueeseen x > b jatketuilla Q ja R ja<br />
alkuarvoilla z(a)=0, z’(a)=1. Muutetaan λ:aa kunnes 0-kohta osuu b:hen (merkitään tätä λ:aa ˆλ:lla.<br />
Tarkastetaan, kuinka monta nollakohtaa zˆλ:lla on välillä (a,b). Jos zˆλ:lla oli n nollakohtaa, niin löysimme<br />
(n+1):nnen ominaisfunktion. Nyt voidaan pienentää λ:aa ja etsiä n:s,(n-1):s,(n-2):s,... ja ensimmäinen<br />
ominaisfunktio. Tämän jälkeen voidaan kasvattaa λ:aa ja etsiä korkeampia ominaisfunktioita<br />
niin paljon kuin tarvitsee.<br />
Huomautus 3.1 Sturmin ja Liouvillen lause ei päde yleisesti singulaarisille S-L ongelmille! Esimerkiksi<br />
periodisilla reunaehdoilla ei voi olettaa, että Sturmin Liouvillen lauseen tulokset olisivat voimassa.<br />
Yllä olevasta huomautuksesta vielä esimerkki, eli vastaesimerkki sille, että Sturmin Liouvillen lause<br />
yleistyisi koskemaan myös singulaarisia ongelmia.<br />
Esimerkki 3.3 Tutkitaan yhtälöä<br />
(<br />
d<br />
x 2 du )<br />
+ λu = 0 (3.31)<br />
dx dx<br />
välillä x ∈ [0, 1], eli a = 0 ja b = 1. Koska p(a) = 0, yhtälö on singulaarinen. Otetaan vielä reunaehdoiksi<br />
u(b) = 0 ja |u(0)| < ∞. Nyt<br />
(3.31) ⇐⇒ x 2 u ′′ + 2xu ′ + λu = 0<br />
Yrite u(x) = x n =⇒p(p − 1) + 2p + λ = p 2 + p + λ = 0<br />
=⇒p = − 1 2 ± √<br />
1<br />
4 − λ<br />
λ ≠ 1 4 . p − = − 1 2 − √ 1/4 − λ ja p + = − 1 2 + √ 1/4 − λ erisuuret. Yleinen ratkaisu on<br />
ja reunaehdosta u(1) = 0 saadaan<br />
u(x) = C 1 x p −<br />
+ C 2 x p +<br />
C 1 + C 2 = 0 ⇐⇒ C 1 = −C 2 .<br />
Ratkaisu on siis u(x) = C(x p −<br />
−x p +<br />
). Kuitenkin jos λ < 1/4, niin p − < 0, joten x → 0 ⇒ u(x) → ±∞.<br />
Toisaalta jos λ > 1/4, niin Re(p − ) = Re(p + ) = −1/2, joten |u(x)| ≈ 1/ √ x → ∞, kun x → 0. Ei siis<br />
löydy reunaehtoja toteuttavia ratkaisuja jos λ ≠ 1/4.<br />
λ = 1 4 . Toinen ratkaisu on u 1(x) = √ 1<br />
x<br />
ja toinen saadaan vakion varioinnilla:<br />
u(x) = C(x)/ √ x ⇒ C(x) = ln(x).
26<br />
Yleinen ratkaisu on siis u(x) = 1 √ x<br />
(C 1 + C 2 ln(x)). Lisäksi reunaehto<br />
u(1) = C 1<br />
√<br />
1<br />
= 0 ⇒ C 1 = 0,<br />
eli<br />
u(x) = Cln(x)/ √ x , joten |u(x)| −→ ∞ , kun x → 0.<br />
Yhtälöllä ei siis ole ominaisarvoja eikä -funktioita.<br />
Kuitenkin koska L on itseadjungoitu, aina pätee: Jos ominaisarvo on olemassa, se on reaalinen ja<br />
erisuuria ominaisarvoja vastaavat ominaisfunktioit ovat ortogonaalisia.<br />
Esimerkki 3.4 Periodiset reunaehdot.<br />
Tutkitaan yhtälöä<br />
välillä x ∈ [0, π], reunaehdoilla<br />
d 2 u<br />
+ λu = 0 (3.32)<br />
dx2 u(0) = u(π) (3.33)<br />
u ′ (0) = u ′ (π). (3.34)<br />
Merk. α = √ −λ, jolloin yleinen ratkaisu on u(x) = C 1 e αx + C 2 e −αx . Reunaehdot:<br />
(3.33) =⇒ C 1 + C 2 = C 1 e απ + C 2 e −απ<br />
(3.34) =⇒ α(C 1 − C 2 ) = α(C 1 e απ − C 2 e −απ )<br />
α = 0 kelpaa ja tätä vastaava ominaisfunktio on u ≡ C = vakio. Oletetaan sitten, että α ≠ 0 ja jaetaan<br />
se pois toisesta reunaehdosta:<br />
(3.33) =⇒ C 1 (1 − e απ ) + C 2<br />
(<br />
1 − e<br />
−απ ) = 0<br />
(3.34) =⇒ C 1 (1 − e απ ) − C 2<br />
(<br />
1 − e<br />
−απ ) = 0<br />
Jotta olisi nollasta eroava ((C 1 , C 2 ) ≠ ¯0) ratkaisu, ryhmän determinantin on oltava nolla, eli<br />
−2 (1 − e απ ) ( 1 − e −απ) = 0<br />
⇐⇒ e ±απ = 1<br />
⇐⇒ απ = 2nπi<br />
n ∈ Z<br />
=⇒ λ n = −α 2 n = 4n 2 .<br />
Ominaisarvoa λ = 4n 2 vastaa kaksi riippumatonta ominaisfunktiota<br />
u n+ = e 2nix ja u n− = e −2nix<br />
tai reaaliset<br />
u (1)<br />
n = cos(2nx) ja u (2)<br />
n = sin(2nx)<br />
Edellisessä esimerkissä ominaisarvot n ≠ 0 olivat kahdesti degeneroituneet. Monelle singulaariselle S-L<br />
ongelmalle ja sekareunaehto-ongelmalle voidaan kuitenkin johtaa Sturmin Liouvillen lauseen kaltaisia<br />
tuloksia mm. variaatiolaskennan keinoin (Katso esim. R. Courant, D. Hilbert: Methods of Mathematical<br />
Physics, vol.1, luku 6)
27<br />
3.4 S-L operaattorin Greenin funktio<br />
Seuraavaksi tavoitteena on löytää yleiselle S-L operaattorille Greenin funktio. Aputuloksena tarvitsemme<br />
aluksi ominaisfunktiokehitelmän δ-funktiolle. Olkoon f ∈ L 2 ([a, b]), jolloin<br />
f(x) =<br />
∞∑<br />
a n ϕ n (3.35)<br />
n=1<br />
L x ϕ n (x) = λ n w(x)ϕ n (x) (3.36)<br />
a n = (ϕ n, f)<br />
(ϕ k , ϕ k ) := ∫ b<br />
a dxw(x)ϕ k(x)f(x)<br />
∫ b<br />
a dxw(x)ϕ k(x) 2 (3.37)<br />
Sijoittamalla a n :n lauseke(3.37) f:n sarjakehitelmään (3.35) ja vaihtamalla summauksen ja integroinnin<br />
järjestystä saamme<br />
∫ b<br />
∞∑ ϕ n (y)ϕ n (x)<br />
f(x) = dyw(y)<br />
f(y), (3.38)<br />
(ϕ n , ϕ n )<br />
mistä päättelemme<br />
a<br />
n=1<br />
∞∑ ϕ n (y)ϕ n (x)<br />
δ(x − y) = w(y)<br />
(ϕ<br />
n=1 n , ϕ n )<br />
(3.39)<br />
∞∑ ϕ n (y)ϕ n (x)<br />
= w(x)<br />
(ϕ<br />
n=1 n , ϕ n )<br />
(3.40)<br />
= √ ∞∑ ϕ n (y)ϕ n (x)<br />
w(x)w(y)<br />
.<br />
(ϕ n , ϕ n )<br />
(3.41)<br />
Kaksi alinta yhtälöä seuraavat δ-funktion ominaisuudesta f(x)δ(x − y) = f(y)δ(x − y).<br />
Sturm-Liouville -operaattorin Greenin funktio. Muistellaan aluksi että epähomogeenisen differentiaaliyhtälön<br />
L x u(x) = f(x) (3.42)<br />
erikoisratkaisu löydettiin etsimällä ensin operaattorin Greenin funktio G joka toteuttaa<br />
n=1<br />
L x G(x, y) = δ(x − y) . (3.43)<br />
Sen jälkeen erikoisratkaisu u E (x) saatiin kaavasta<br />
∫<br />
u E (x) = dy G(x, y)f(y) . (3.44)<br />
(Lisäksi täytyy tarkistaa että u E (x) toteuttaa siltä vaaditut reunaehdot, ratkaisua voitiin "säätää"muuttamalla<br />
Greenin funktiota käyttämällä homogeenisen yhtälön ratkaisuja.)<br />
Olkoon nyt L x Sturm-Liouville differentiaalioperaattori<br />
L x = − d<br />
dx<br />
[<br />
p(x) d<br />
dx<br />
]<br />
+ q(x) . (3.45)<br />
Etsitään epähomogeenisen differentiaaliyhtälön ratkaisu u E joka toteuttaa S-L reunaehdot<br />
A 1 u E (a) + A 2 u ′ E(a) = 0 (3.46)<br />
B 1 u E (b) + B 2 u ′ E(b) = 0 . (3.47)
28<br />
Muistetaan ensin että myös L x :n ominaisfunktiot ϕ k (x),<br />
L x ϕ k (x) = λw(x)ϕ k (x) (3.48)<br />
toteuttavat nämä reunaehdot.<br />
Arvataan että oikea Greenin funktio on muotoa<br />
G(x, y) = ∑ k<br />
1 ϕ k (x)ϕ k (y)<br />
λ k (ϕ k , ϕ k )<br />
. (3.49)<br />
Yksi perustelu tälle arvaukselle löytyy luentokalvoista. Tässä tyydymme vain tarkistamaan että arvaus<br />
on OK. Ensin joitakin kommentteja:<br />
1. Kaavassa (3.49) summataan yli kaikkien ominaisfunktioiden ja -arvojen.<br />
2. (3.49) on hyvin määritelty vain jos kaikki ominaisarvot λ k ≠ 0.<br />
3. Normitustekijä (ϕ k , ϕ k ) = ∫ dx w(x)ϕ ∗ k (x)ϕ k(x) sisällytetään kaavaan jos ϕ k ei ole vielä normitettu<br />
siten että (ϕ k , ϕ k ) = 1.<br />
Nyt sitten tarkistus:<br />
L x G(x, y) = ∑ k<br />
= w(x) ∑ k<br />
1 (L x ϕ k (x))ϕ k (y)<br />
λ k (ϕ k , ϕ k )<br />
ϕ k (x)ϕ k (y)<br />
(ϕ k , ϕ k )<br />
= δ(x − y) , (3.50)<br />
siis (3.49) totetuttaa ehdon (3.43). Edelleen, koska ominaisfunktiot ϕ k toteuttavat S-L reunaehdot<br />
(3.46), seuraa helposti<br />
A 1 G(a, y) + A 2 ∂ x G(a, y) = 0 (3.51)<br />
B 1 G(b, y) + B 2 ∂ x G(b, y) = 0 . (3.52)<br />
Siispä erikoisratkaisu u E (x) = ∫ dy G(x, y)f(y) toteuttaa myös S-L reunaehdot. Esim:<br />
∫<br />
A 1 u E (a) + A 2 u ′ E(a) = dy (A 1 G(a, y) + A 2 ∂ x G(a, y))f(y) = 0 . (3.53)<br />
Mitä sitten tapahtuu jos jokin ominaisarvoista häviää, λ k = 0? (Käytetään vastaavasta ominaisfunktiosta<br />
merkintää ϕ 0 ja ominaisarvosta merkintää λ 0 . Näistä käytetään usein nimitystä nollamoodi (engl.<br />
zero mode.) Huomaa että S-L teoriassa on korkeintaan yksi nollamoodi, sillä S-L reunaehdoilla ominaisarvot<br />
ja -funktiot eivät ole degeneroituneita.) Kokeillaan onnistuisiko yksinkertainen muokkaus, eli<br />
kävisikö<br />
Ḡ(x, y) = ∑ 1 (L x ϕ k (x))ϕ k (y)<br />
(3.54)<br />
λ k (ϕ k , ϕ k )<br />
λ k ≠0<br />
Greenin funktioksi. (Summaan sisältyvät siis kaikki ominaismoodit paitsi nollamoodi.) Kokeillaan toteuttaako<br />
u(x) = ∫ dy Ḡ(x, y)f(y) epähomogeenisen yhtälön:<br />
∫<br />
L x u(x) = = dy L x Ḡ(x, y)f(y) = ∑ ∫<br />
1<br />
dy (L xϕ k (x))ϕ k (y)<br />
f(y)<br />
λ k (ϕ k , ϕ k )<br />
λ k ≠0<br />
= w(x) ∑ ∫<br />
dy ϕ ∫<br />
∫<br />
k(x)ϕ k (y)<br />
f(y) = dy δ(x − y)f(y) − dy w(x)ϕ 0(x)ϕ 0 (y)<br />
f(y)<br />
(ϕ k , ϕ k )<br />
(ϕ 0 , ϕ 0 )<br />
λ k ≠0<br />
= f(x) − w(x)ϕ 0(x)<br />
(ϕ 0 , ϕ 0 ) 〈ϕ 0|f〉 , (3.55)
29<br />
missä<br />
∫<br />
〈ϕ 0 |f〉 =<br />
dy ϕ 0 (y)f(y) . (3.56)<br />
(Huom. 〈f|g〉 on eri integraali kuin (f, g), jälkimmäinen sisältää painofunktion w.) Tulos kertoo sen<br />
että (3.54) käy Greenin funktioksi nollamooditapauksessa vain jos epähomogeenisen yhtälön lähteen<br />
projektio nollamoodille (3.56) on nolla.<br />
3.5 Sturm-Liouville -ongelma variaatio-ongelmana<br />
Esitämme seuraavaksi miten Sturm-Liouville -ongelmaa voi lähestyä variaatiolaskennan kautta. Ideana<br />
on ensinnäkin löytää funktionaali jota varioimalla S-L ongelman differentiaaliyhtälö saadaan Eulerin<br />
yhtälönä. Toisaalta tiedämme että ongelman ratkaisufunktiot muodostavat ortonormaalin kannan painotetun<br />
sisätulon suhteen. Kanta voidaan edelleen ortonormittaa, jolloin normeeraus voidaan tulkita<br />
sidosehtona. Koska normeeraus sisältää integraalin, se voidaan tulkita globaalina sidosehtona. Näin<br />
päädytään isoperimetriseen ongelmaan. Funktionaali jonka variaatio johtaa S-L yhtälöön on<br />
J S−L [y] =<br />
∫ b<br />
a<br />
dx ( p(x)(y ′ (x)) 2 + q(x)y(x) 2) . (3.57)<br />
Ominaisfunktioden ortonormitus painoten sisätulon kanssa taas johtaa ehtoon<br />
K[y] =<br />
Otetaan käyttöön Lagrangen kertoja λ ja etsitään funktionaalin<br />
L λ [y] =<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
dxw(x)(y(x)) 2 = 1. (3.58)<br />
(<br />
p(x)(y ′ (x)) 2 + (q(x) − λw(x))y(x) 2) + λ<br />
ääriarvot. Tälle funktionaalille Eulerin yhtälön on<br />
(<br />
d<br />
p(x) dy(x) )<br />
+ (q(x) − λw(x))y(x) = 0, (3.59)<br />
dx dx<br />
eli Sturm-Liouville yhtälö kuten edellä todettiin. Lisäksi λ on ominaisarvo ja K[y] = 1 on ominaisfunktion<br />
normitusehto. Nyt on kuitenkin oltava tarkkana reunaehtojen kanssa. Varioidaan y → y + η<br />
ja tutkitaan termin<br />
muutosta.<br />
δ<br />
∫ b<br />
a<br />
dxp(x)(y ′ (x)) 2 = 2<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
p(x)(y ′ (x)) 2<br />
dxp(x)y ′ (x)η ′ (x)<br />
/ b<br />
= 2 p(x)y(x)η(x) − 2<br />
a<br />
∫ b<br />
a<br />
dxη(x) d (<br />
p(x)y ′ (x) ) .<br />
dx<br />
Eulerin yhtälö ääriarvon ehtona pitää siis paikkansa vain jos p(a)y ′ (a)η(a) = p(b)y ′ (b)η(b) = 0. Singulaariselle<br />
ongelmalla p(a) ja/tai p(b) = 0, jolloin η(a) ja/tai η(b) voivat olla mielivaltaisia. Säännölliselle<br />
ongelmalle (p = a tai b) y(p) = 0 ⇒ η(p) = 0 ja y ′ (p) = 0 ⇒ η(p) voi olla mielivaltainen. Kuitenkin<br />
yleiselle homog. reunaehdolle<br />
A 1 y(p) + A 2 y ′ (p) = 0<br />
myös variaatio toteuttaa tämän eikä sijoitustermi välttämättä häviä. Kun S-L yhtälöä halutaan käsitellä<br />
variaatio-ongelman Eulerin yhtälönä on siis rajoituttava reunaehtoihin<br />
p(a)y(a)y ′ (a) = p(b)y(b)y ′ (b) = 0. (3.60)
30<br />
Oletamme jatkossa, että reunaehdot ovat voimassa 4 .<br />
Funktiot u k , jotka stationarisoivat J S−L [y]:n ovat siis S-L ongelman ominaisfunktiot, eli toteuttavat<br />
− d (<br />
p(x) du )<br />
k(x)<br />
+ q(x)u k (x) = λ k w(x)u k (x) ja<br />
dx dx<br />
∫ b<br />
a<br />
dxw(x)u m (x)u n (x) = δ nm .<br />
Ominaisfunktiot muodostavat täydellisen funktiojoukon, joten voidaan kehittää<br />
y(x) = ∑ k<br />
=⇒ J[y] = ∑ k,l<br />
= ∑ k<br />
a k u k (x)<br />
∫ b<br />
a k λ l a l dxw(x)u k (x)u l (x)<br />
a<br />
λ k a 2 k (3.61)<br />
ja<br />
K[y] = ∑ k<br />
a 2 k = 1 (3.62)<br />
Olkoon λ 0 pienin ominaisarvo (λ k ≥ λ 0 kaikilla k). Jos λ 0 ei ole degeneroitunut J[y] saavuttaa globaalin<br />
miniminsä λ 0 , kun y(x) = u 0 (x) (a 2 0 = 1)5 . Voidaan siis kirjoittaa<br />
λ 0 = inf u∈D(L)<br />
J[u]<br />
K[u] ,<br />
missä D(u) on joukko funktioita joille vastaava S-L operaattori L on hyvin määritelty. Huom! funktioluokan<br />
yleien alkio u ei ole ominaisfunktio, joten K[u] ≠ 1 yleensä. Pienintä ominaisarvoa voidaan yrittää<br />
etsiä rajoittumalla sopiviin yritefunktiohin u(α 1 , . . . , α p ) jotka riippuvat parametreista α 1 , . . . , α p<br />
ja jotka toteuttavat vaaditut reunaehdot, ja varioimalla parametrejä. Tätä likiarvomenetelmää kutsutaan<br />
Rayleighin ja Ritzin menetelmäksi. Samantapaista menetelmää käytetään kvanttimekaniikassa<br />
Hamilton-operaattorin pienimmän ominaiarvon (eli systeemin perustilan energian) etsintään.<br />
3.6 Rayleighin ja Ritzin menetelmä<br />
Etsitään pienimmälle ominaisarvolle λ 0 likiarvoa aloittamalla parametreista (α 1 , . . . , α p ) riippuvasta<br />
yritteestä u(α 1 , . . . , α p ). Lasketaan ensin<br />
J[u(α 1 , . . . , α p )] = F (α 1 , . . . , α p )<br />
K[u(α 1 , . . . , α p )] = G(α 1 , . . . , α p )<br />
, sekä<br />
ja minimoidaan tämän jälkeen F (α 1 , . . . , α p ) ehdolla G(α 1 , . . . , α p ) = 1. Otetaan käyttöön Lagrangen<br />
kerroin λ. Eulerin yhtälöt ovat:<br />
Ratkaisu antaa ylärajan miniarvolle.<br />
∂<br />
∂a j<br />
(F (α 1 , . . . , α p ) + λG(α 1 , . . . , α p )) = 0 (3.63)<br />
G(α 1 , . . . , α p ) − 1 = 0 (3.64)<br />
4 Periaatteessa pintatermi voitaisiin hävitää myös ehdolla p(a)y(a)y ′ (a) − p(b)y(b)y ′ (b) = 0. Tämän ehdon ongelma<br />
on se että se on oleellisesti periodinen reunaehto, jonka ominaisarvot saattavat olla degeneroituneita kuten yllä näimme.<br />
S-L ongelmassahan asetettiin reunaehdot erikseen päätepisteissä x = a, b, joten siksi teemme samantapaisen rajoituksen<br />
variaatio-ongelman reunaehtoihin.<br />
5 Jos λ 0 olisi deneroitunut ja sitä vastaa ominaisfunktiot u (1)<br />
0 , u(2) 0 , . . . , u(N) 0 , niin mikä tahansa näiden lineaarikombinaatio<br />
minimoi J:n.
31<br />
3.6.1 Esimerkki: Patarummun säveltaajuus<br />
Orkesterin patarummut ovat rumpuja jotka on suunniteltu niin että värisevän kalvon perustaajuus (eli<br />
matalin ominaistaajuus) vahvistuu siten että rummun äänessä erottuu selvä säveltaajuus. Patarummut<br />
viritetään eri taajuuksiin ja orkesteripartituurissa ne nuotinnetaan sävelinä kuten muut instrumentit.<br />
Rumpukalvo on kiekon muotoinen ja kiinni reunoistaan. Sen värähtelyjä kuvaa siten 2+1 ulotteinen<br />
aaltoyhtälö joka on luontevaa ratkaista napakoordinaateissa, Dirichlet’n reunaehdolla u(R, φ) = 0<br />
missä R on rumpukalvon säde. Kuten <strong>Fymm</strong> IIa:lla opittiin, yhtälön separointi johtaa radiaaliselle<br />
osalle Besselin yhtälöön<br />
y ′′ + 1 x + λy = 0 ,<br />
missä x = r/R on uudelleen skaalattu radiaalinen koordinaatti. Reunaehdot ovat nyt y(1) = 0 ja y(x)<br />
säännöllinen origossa (muuten kalvo repeää). Ominaisarvo λ = R 2 ω 2 /v 2 missä v on äänen nopeus<br />
kalvolla, ja ω = 2πf missä f on kuultava taajuus. <strong>Fymm</strong> IIa:lla opimme toki ratkaisemaan Besselin<br />
yhtälön ja sen ominaisarvot eksaktisti, mutta seuraavaksi harjoittelemme Rayleighin ja Ritzin menetelmää.<br />
Kirjoitetaan ensin Besselin yhtälö standardissa S-L muodossa:<br />
− d<br />
dx<br />
(<br />
x dy<br />
dx<br />
)<br />
= λxy .<br />
Näin ollen p(x) = x, q(x) = 0 ja w(x) = x. Etsitään seuraavaksi sopiva yritefunktio. Kalvon värähdellessä<br />
sen profiili vaihtelee x = 0:ssa maksimipoikkeaman ja minimipoikkeaman välillä. Profiilin<br />
Taylor-sarja ääripoikkeamalla on<br />
y(x) = y(0) + 1 2 y′′ (0)x 2 + 1 4! y′′′′ (0)x 4 + · · · ,<br />
parittomat termit häviävät sillä ääriprofiili on parillinen funktio. Näin motivoimme R-R menetelmän<br />
yritefunktioiksi neljännen asteen parilliset polynomit<br />
y(x) = a + bx 2 + cx 4 .<br />
Vaadimme nyt että ne myös toteuttavat annetut reunaehdot. Ehdosta y(1) = 0 seuraa relaatio a+b+c =<br />
0. Valitaan riippumattomiksi parametreiksi b, c. Lasketaan seuraavaksi<br />
ja<br />
J[y] =<br />
K[y] =<br />
∫ 1<br />
0<br />
∫ 1<br />
0<br />
dx xy ′2 = b 2 + 8 3 bc + 22 = F (b, c)<br />
dx xy 2 = 1 6 b2 + 5<br />
12 bc + 4 15 c2 = G(b, c) .<br />
Etsitään nyt funktionaalin J[y] + λK[y] = F (b, c) + λG(b, c) stationääriset pisteet:<br />
ja<br />
0 = ∂ ∂b (F + λG) = (2 + 1 3 λ)b + (8 3 + 5<br />
12 λ)c<br />
0 = ∂ ∂c (F + λG) = (8 3 + 5 12 λ)b + (4 + 8 15 λ)c .<br />
Eliminoimalla b ja c saadaan yhtälö<br />
3λ 2 − 128λ + 640 = 0 ,<br />
jonka pienin juuri on<br />
λ = 1 3 (64 − √ 2176) ≈ 5, 7841 ,
32<br />
joka ei ole kovin kaukana eksaktista ratkaisusta 5, 7832.<br />
Lopetamme tämän kappaleen pienellä lisätarkastelulla. Olkoon L Sturm-Liouville-operaattori (3.7). Mitkä ovat funktionaalin<br />
F RR [u] = N[u]<br />
D[u]<br />
(3.65)<br />
stationaariset pisteet, kun<br />
∫ b<br />
N[u] = dxu(x)Lu(x)<br />
a<br />
∫ b<br />
=<br />
a<br />
−<br />
dx<br />
[p(x)(u ′ (x)) 2 + q(x)u(x) 2]<br />
(<br />
p(b)u ′ (b)u(b) − p(a)u ′ (a)u(a)<br />
)<br />
(3.66)<br />
ja<br />
∫ b<br />
D[u] = dxw(x)u(x) 2 . (3.67)<br />
a<br />
Olkoon λ n L-operaattorin ominaisarvot ja ϕ n niitä vastaavat normitetut ( ∫ b<br />
a dxw(x)ϕ n(x) 2 = 1) ominaisfunktiot (n ∈ N). Tällöin siis<br />
Lϕ n(x) = λ nw(x)ϕ n(x)<br />
∫ b<br />
dxw(x)ϕ n(x)ϕ m(x) = δ nm.<br />
a<br />
ja<br />
Jos kyseessä on säännöllinen ongelma, niin ϕ n : n ∈ N on täydellinen ja voidaan kirjoittaa<br />
∞∑<br />
u(x) = a nϕ n(x), (3.68)<br />
n=1<br />
joten<br />
∞∑ ∞∑<br />
∫ b<br />
N[u] =<br />
a ma n dxϕ m(x)Lϕ m(x)<br />
n=1 m=1<br />
a<br />
∞∑ ∞∑<br />
=<br />
a ma nλ nδ mn<br />
n=1 m=1<br />
=<br />
∞∑<br />
λ na 2 n (3.69)<br />
n=1<br />
ja<br />
sekä<br />
Stationaariset pisteet:<br />
eli<br />
∞∑<br />
D[u] = a 2 n (3.70)<br />
n=1<br />
F RR [u] = N[u] ∑ ∞n=1<br />
D[u] = λ na 2 n<br />
∑ ∞n=1 a 2 =: f RR (a 1 , a 2 , . . .). (3.71)<br />
n<br />
∂f RR<br />
∂a i<br />
= 2λ ia i<br />
∑ ∞n=1 a 2 n<br />
2a i<br />
− F RR [u] ∑ ∞n=1 a 2 = 0<br />
n<br />
∑ ∞n=1<br />
λ na 2 n<br />
λ i = F RR [u] = ∑ ∞n=1 a 2 . (3.72)<br />
n<br />
Ratkaisu: a n = 0, kun n ≠ i ja a i mielivaltainen sekä u(x) = a i ϕ i (x). Lisäksi F [a i ϕ i ] = λ i riippumatta a i :n arvosta. Minimin F [a 1 ϕ 1 ] = λ 1 antava<br />
ϕ 1 on vakiokerrointa vaille yksikäsitteinen ja muut ratkaisut ovat satulapisteitä. Kuitenkin funktiot a nϕ n on funktionaalin F RR minimejä avaruudessa<br />
{<br />
F n = u(x) :<br />
∫ b<br />
a<br />
}<br />
dxw(x)u(x)ϕ k (x) = 0, k = 1, 2, . . . , n − 1<br />
(3.73)<br />
4 Hilbertavaruuksista<br />
4.1 Vektori-, normi- ja sisätuloavaruudet<br />
Tästä eteenpäin skalaarikunta on K = C tai R. Määritellään, että joukko V on (K-kertoiminen)<br />
vektoriavaruus, jos jokaista paria ¯v, ū ∈ V vastaa kolmas alkio ū + ¯v, sekä jokaista paria ū ∈ V ja<br />
a ∈ K vastaa kolmas alkio aū ∈ V s.e.<br />
1. ū + ¯v = ¯v + ū<br />
2. ū + (¯v + ¯w) = (ū + ¯v) + ¯w<br />
3. a(ū + ¯v) = aū + a¯v
33<br />
4. (a + b)ū = aū + bū<br />
5. a(bū) = (ab)ū<br />
6. 1ū = ū<br />
7. ∃ ¯0 s.e. ū + ¯0 = ū ∀ ū ∈ V<br />
8. ∃ − ū s.e. ū + (−ū) = 0.<br />
Näistä seuraa tutut vektoreiden laskulait, kuten 0 · ū = ¯0 ja −1 · ū = −ū jne. Vektorit ¯v 1 , ¯v 2 , . . . , ¯v N<br />
ovat lineaarisesti riippumattomat, jos ∑ N<br />
n=1 a n¯v n = ¯0 jos ja vain jos a 1 = a 2 = . . . = a N = 0. Huom.<br />
jos yksikin ¯v n = ¯0, niin vektorit eivät ole lin. riippumattomia. Joukko {u 1 , u 2 , . . .} virittää V :n, jos<br />
jokainen ū ∈ V voidaan lausua muodossa<br />
ū = ∑ k<br />
a k ū k . (4.1)<br />
Jos {u 1 , u 2 , . . .} on lisäksi lineaarisesti riippumaton, niin sen vektorit muodostavat avaruuden V kannan.<br />
Kannassa on aina sama määrä vektoreita ja tätä määrää kutsutaan V :n dimensioksi dim(V ).<br />
Esimerkki 4.1 K n := n tai C n<br />
¯x = (x 1 , x 2 , . . . , x n ) x i ∈ K<br />
¯x + ȳ = (x 1 + y 1 , x 2 + y 2 , . . . , x n + y n )<br />
a¯x = (ax 1 , ax 2 , . . . , ax n )<br />
¯0 = (0, 0, . . . , 0)<br />
−¯x = (−x 1 , −x 2 , . . . , −x n )<br />
Kanta = {ē 1 , ē 2 , . . . , e¯<br />
n } , missä<br />
ē i = (0, . . . , 0, }{{} 1 , 0, . . . , 0).<br />
i:s<br />
Huom. dim(K n ) = n ja myös n = ∞ on mielekäs!<br />
Esimerkki 4.2 V = funktiot f : A → C, A ⊂ C<br />
(f + g)(z) = f(z) + g(z)<br />
(af)(z) = af(z), a ∈ C<br />
¯0(z) = 0 ∀ z ∈ A<br />
(−f)(z) = −f(z)<br />
Huom. dim(V ) = ∞, lisäksi V :llä ei ole luonnollista kantaa.<br />
Esimerkki 4.3 V = astetta n-1 olevat polynomit P : A → C, A ⊂ C<br />
n−1<br />
∑<br />
P (z) = a k z k<br />
k=0<br />
Laskutoimitukset kuten edellisessä esimerkissä, mutta nyt dim(V ) = n. Eräs kanta on {1, z, z 2 , . . . , z n−1 }.<br />
Vektoriavaruus on normitettu, eli normiavaruus, jos on lisäksi olemassa kuvaus ‖·‖ : V → R s.e.<br />
1. ‖¯v‖ ≥ 0 ∀ ¯v ∈ V<br />
2. ‖¯v‖ = 0 ⇐⇒ ¯v = ¯0
34<br />
3. ‖¯v + ū‖ ≤ ‖¯v‖ + ‖ū‖ (”kolmioepäyhtälö”, ∆ − ey.)<br />
4. ‖a¯v‖ = |a| ‖¯v‖<br />
Esimerkki 4.4 Esimerkiksi K n (esimerkki 4.1) varustettuna normilla<br />
∑<br />
‖x‖ = ‖(x 1 , x 2 , . . . , x n )‖ = √ n |x k | 2 (4.2)<br />
ja polynomien avaruus V (esimerkki 4.3) varustettuna normilla<br />
ovat normiavaruuksia. Tarkista!<br />
Normi määrää avaruuteen myös etäisyyden eli metriikan<br />
k=1<br />
‖f‖ = sup |f(x)| (4.3)<br />
x∈A<br />
d(ū, ¯v) = ‖u − v‖ . (4.4)<br />
Metriikka puolestaan määrää suppenemisen: Sanomme, että jono ¯v 1 , ¯v 2 , . . . suppenee kohti ¯v ∈ V jos<br />
ja merkitsemme<br />
lim ‖¯v n − v‖ = 0 (4.5)<br />
n→∞<br />
Määritelmä 4.1 (Cauchyn jono) Jono (¯v n ) ∞ n=1 on Caychyn jono, jos<br />
¯v = lim<br />
n→∞ ¯v n (4.6)<br />
‖¯v n − ¯v m ‖ −→ 0, kun n, m → ∞<br />
Huomataan, että jokainen suppeneva jono on Cauchyn jono, sillä<br />
‖¯v n − ¯v m ‖ = ‖(¯v n − ¯v) + (¯v − ¯v m )‖ ≤ ‖¯v n − ¯v‖ + ‖¯v − ¯v m ‖ → 0, mutta päinvastainen ei ole välttämättä<br />
voimassa kaikissa vektoriavaruuksissa. Tätä varten määritellään täydelliset normitetut vektoriavaruudet<br />
eli Banachin avaruudet.<br />
Määritelmä 4.2 Normitettu vektoriavaruus on täydellinen, jos jokainen Cauchyn jono suppenee eli<br />
lim ‖¯v n − ¯v m ‖ = 0 =⇒ ∃ ¯v ∈ V s.e.<br />
n,m→∞<br />
lim ¯v n = ¯v<br />
n→∞<br />
Vektoriavaruuteen V saadaan vielä enemmän rakennetta, jos siinä on määritelty sisätulo eli skalaaritulo.<br />
Määritelmä 4.3 (Skalaaritulo) Kuvaus V ∗ V → C, (ū, ¯v) ↦→ 〈ū|¯v〉 on skalaaritulo, jos<br />
1. 〈ū|ū〉 ∈ R ja 〈ū|ū〉 ≥ 0 ∀ ū ∈ V .<br />
2. 〈ū|ū〉 = 0 ⇐⇒ ū = ¯0.<br />
3. 〈ū|¯v〉 = 〈¯v|ū〉 ∗ .<br />
4. 〈ū|¯v + ¯w〉 = 〈ū|¯v〉 + 〈ū| ¯w〉<br />
5. 〈ū|a¯v〉 = a〈ū|ū〉
35<br />
Esimerkiksi ”pistetulo” C n ∗ C n → C.<br />
x · y := 〈(x 1 , . . . , x n )|(y 1 , . . . , y n )〉 =<br />
n∑<br />
x ∗ i y i (4.7)<br />
on sisätulo. Vektoriavaruutta, jossa on määritelty sisätulo kutsutaan sisätuloavaruudeksi.<br />
Lause 4.1 (Schwarzin epäyhtälö) Sisätuloavaruudessa pätee aina<br />
ja yhtäsuuruus pätee vain jos vektorit ovat lin. riippuvia.<br />
i=1<br />
|〈ū|¯v〉| 2 ≤ 〈ū|ū〉〈¯v|¯v〉 (4.8)<br />
Todistus 4.1 Koska väite pätee kun ¯v = ¯0 (0 = 0), niin riittää tutkia tapaus ¯v ≠ ¯0, jolloin erityisesti<br />
〈¯v|¯v〉 > 0. Olkoon<br />
¯w = ū − 〈¯v|ū〉<br />
〈¯v|¯v〉 ¯v.<br />
Nyt sisätulon 1. ominaisuuden nojalla<br />
mistä väite tietysti seuraa.<br />
〈 ¯w| ¯w〉 = 〈ū|ū〉 − 〈ū|¯v〉〈¯v|ū〉<br />
〈¯v|¯v〉<br />
= 〈ū|ū〉 − |〈ū|¯v〉|2<br />
〈¯v|¯v〉<br />
≥ 0,<br />
− 〈¯v|ū〉〈ū|¯v〉<br />
〈¯v|¯v〉<br />
Schwarzin epäyhtälön avulla saadaan todistettua tärkeä tulos:<br />
Lause 4.2 Sisätuloavaruus on normiavaruus, kun normiksi otetaan<br />
Todistus 4.2 Muut ominaisuudet ilmeisiä, paitsi kolmioepäyhtälö:<br />
mistä väite seuraa ottamalla neliöjuuri.<br />
+ |〈ū|¯v〉|2 〈¯v|¯v〉<br />
〈¯v|¯v〉 2<br />
‖ū‖ = √ 〈ū|ū〉. (4.9)<br />
‖ū + ¯v‖ 2 = 〈ū + ¯v|ū + ¯v〉<br />
= 〈ū|ū〉 + 〈ū|¯v〉 + 〈¯v|ū〉 + 〈¯v|¯v〉<br />
= ‖ū‖ 2 + ‖¯v‖ 2 + 2Re(〈ū|¯v〉)<br />
≤ ‖ū‖ 2 + ‖¯v‖ 2 + 2|〈ū|¯v〉|<br />
Schwarz → ≤ ‖ū‖ 2 + ‖¯v‖ 2 + 2 ‖ū‖ ‖¯v‖<br />
= (‖ū‖ + ‖¯v‖) 2 ,<br />
Hilbertin avaruudet ovat täydellisiä sisätuloavaruuksia. Esimerkiksi C n ja R n ovat Hilbertin avaruuksia<br />
sisätulona pistetulo (4.7).<br />
Esimerkki 4.5 (l 2 ) Jonot x = (x 1 , x 2 , . . .), x i ∈ C, joille<br />
Sisätulo:<br />
∞∑<br />
|x i | 2 < ∞.<br />
i=1<br />
∞∑<br />
〈x|y〉 = x ∗ i y i (4.10)<br />
i=1
36<br />
Normi:<br />
Kantana {e i : i ∈ N}, missä<br />
‖x‖ =<br />
∞∑<br />
|x i | 2 (4.11)<br />
i=1<br />
e i = (0, . . . , 0, }{{} 1 , 0, . . .)<br />
i:s<br />
Esimerkki 4.6 (L 2 (a, b)) Funktiot [a, b] → C, joille<br />
Sisätulo:<br />
Normi:<br />
∫ b<br />
a<br />
〈f|g〉 =<br />
‖f‖ =<br />
dx|f(x)| 2 < ∞.<br />
∫ b<br />
a<br />
∫ b<br />
a<br />
dxf(x) ∗ g(x) (4.12)<br />
dx|f(x)| 2 (4.13)<br />
Koska on oltava ‖f − g‖ = 0 ⇔ f = g, niin on samaistettava funktiot joilla ∫ b<br />
a dx|f(x) − g(x)|2 = 0<br />
t.s. f(x) = g(x) melkein kaikkialla. Eräs avaruuden L 2 kanta on trigonometriset funktiot (todistus<br />
epätriviaali).<br />
Huomautus 4.1 l p - ja L p -avaruudet voidaan määritellä vastaavasti myös, kun p ≠ 2. Tällöin avaruuksissa<br />
ei ole sisätuloa, mutta ne ovat Banach avaruuksina varsin käyttökelpoisia.<br />
4.2 Gram-Schmidt ja projektio<br />
Olkoon V sisätuloavaruus ja {¯v 1 , ¯v 2 , . . .} joukko lineaarisesti riippumattomia vektoreita. Voimme rakentaa<br />
niistä ortonormitetun joukon<br />
{ē 1 , ē 2 , . . .}, joille 〈ē i |ē j 〉 = δ ij seuraavasti:<br />
Valitaan<br />
ē 1 = ¯v 1<br />
‖¯v 1 ‖ (⇒ 〈ē 1|ē 1 〉 = 1).<br />
Nyt<br />
ja k 2 määrätään ehdosta<br />
e 2 = k 2 (¯v − 〈ē 1 |¯v 2 〉ē 1 ) toteuttaa<br />
⎛<br />
⎞<br />
〈ē 1 |ē 2 〉 = k 2<br />
⎝〈ē 1 |¯v 2 〉 − 〈ē 1 |¯v 2 〉 〈ē 1 |ē 1 〉 ⎠ = 0<br />
} {{ }<br />
=1<br />
1 = 〈ē 2 |ē 2 〉 = |k 2 | 2 ( ‖ ¯v 2 ‖ 2 − |〈ē 1 |¯v 2 〉| 2) .<br />
Jatketaan induktiivisesti: Olkoon ē 1 , . . . , ē n jo rakennettu. Asetetaan<br />
)<br />
n∑<br />
ē n+1 = k n+1<br />
(¯v n+1 − 〈ē i |¯v n+1 〉ē i , (4.14)<br />
joka toteuttaa 〈ē n+1 |ē i 〉 = 0, i = 1, 2, . . . , n ja k n+1 määrätään ehdosta<br />
〈ē n+1 |ē n+1 〉 = 1. (4.15)<br />
Jatkamalla näin saadaan ortonormitettu jono.<br />
i=1
37<br />
Olkoon nyt ē 1 , ē 2 , . . . , ē n ortonormitettu (o.n.) joukko V:n alkioita. Vektoreiden virittämä aliavaruus<br />
L koostuu kaikista vektoreista ū ∈ V , jotka ovat muotoa<br />
ū =<br />
n∑<br />
a i ē i . (4.16)<br />
i=1<br />
Approksimointiongelma: Olkoon ¯v ∈ V annettu. Mikä L:n vektori ū approksimoi ¯v:tä parhaiten, s.o.<br />
mille ū ‖ū − ¯v‖ saa miniminsä?<br />
Kirjoitetaan u = ∑ n<br />
i=1 a iē i ja muodostetaan<br />
F (a 1 , a 2 , . . . , a n ) = ‖ū − ¯v‖ 2<br />
= 〈ū − ¯v|ū − ¯v〉<br />
n∑<br />
= ‖¯v‖ 2 − (a ∗ i 〈ē i |¯v〉 + a i 〈¯v|ē i 〉) +<br />
i=1<br />
Kirjoitetaan a j = b j + ic j , missä b j , c j ∈ R, jolloin<br />
F = ‖¯v‖ 2 +<br />
n∑<br />
|a i | 2 (4.17)<br />
n∑ [<br />
b<br />
2<br />
j + c 2 j − (b j − ic j )〈ē i |¯v〉 − (b j + ic j )〈¯v|ē i 〉 ] , (4.18)<br />
j=1<br />
i=1<br />
jonka stationaariset pisteet:<br />
sekä<br />
∂F<br />
∂b j<br />
= 2b j − (〈ē j |¯v〉 + 〈¯v|ē j 〉)<br />
= 2(b j − Re(〈ē j |¯v〉)) = 0<br />
=⇒ b j = Re(〈ē j |¯v〉),<br />
∂F<br />
∂c j<br />
= 2c j + i(〈ē j |¯v〉 − 〈¯v|ē j 〉)<br />
= 2(c j − Im(〈ē j |¯v〉)) = 0<br />
=⇒ c j = Im(〈ē j |¯v〉).<br />
Nyt siis a j = 〈ē j |¯v〉 eli paras approksimaatio on<br />
n∑<br />
¯v L = 〈ē j |¯v〉ē j . (4.19)<br />
j=1<br />
Voidaan myös määritellä projektio-operaattori P L kaavalla<br />
n∑<br />
P L¯v = ¯v L = 〈ē i |¯v〉ē i , (4.20)<br />
joka on ¯v : n projektio aliavaruudelle L. Kuvaus todellakin on projektio, sillä kaikilla v pätee<br />
PL¯v 2 = P L¯v L<br />
n∑ n∑<br />
= 〈ē i | 〈ē j |¯v〉ē j 〉ē i<br />
=<br />
i=1<br />
i=1<br />
j=1<br />
n∑<br />
〈ē i |¯v〉ē i<br />
i=1<br />
= ¯v L ,
38<br />
eli P 2 L = P L. Määritellään sitten ¯v ⊥ = ¯v − ¯v L , ”¯v:n L:ää vastaan kohtisuora komponentti”, jolle<br />
Lisäksi, jos ū ∈ L, niin ū = ∑ n<br />
j=1 u jē j ja<br />
P L¯v ⊥ = P L¯v − P L¯v L = ¯v L − ¯v L = ¯0.<br />
〈¯v ⊥ |ū〉 =<br />
=<br />
n∑<br />
u i 〈¯v ⊥ |ē i 〉<br />
i=1<br />
n∑<br />
u i<br />
(〈¯v|ē i 〉 −<br />
i=1<br />
= 0,<br />
eli ¯v ⊥ on kohtisuorassa jokaista ū ∈ L kohtaan, erityisesti<br />
Lisäksi tästä seuraa<br />
eli (Besselin epäyhtälö)<br />
)<br />
n∑<br />
〈ē k |¯v〉 ∗ δ kj<br />
k=1<br />
〈¯v ⊥ |¯v L 〉 = 0. (4.21)<br />
‖¯v‖ 2 = ‖¯v ⊥ + ¯v L ‖ 2 = ‖¯v L ‖ 2 + ‖¯v ⊥ ‖ 2 ≥ ‖¯v L ‖ 2<br />
‖¯v‖ 2 ≥<br />
n∑<br />
|〈ē i |¯v〉| 2 . (4.22)<br />
i=1<br />
Otetaan ilman todistusta käyttöön tulos: Separoituvalla 6 Hilbertin avaruudella H on numeroituva<br />
kanta, joka voidaan olettaa ortonormaaliksi. Tällöin jokainen ¯v ∈ H voidaan lausua muodossa<br />
¯v = ∑ k<br />
v k ē k . (4.23)<br />
Nyt<br />
〈ē j |¯v〉 = ∑ k<br />
v k 〈ē j |ē k 〉 = v j<br />
eli<br />
¯v = ∑ k<br />
〈ē k |¯v〉ē k . (4.24)<br />
Lisäksi<br />
‖¯v‖ 2 = ∑ k,l<br />
v ∗ k v l〈ē k |ē l 〉 = ∑ k<br />
|v k | 2<br />
eli<br />
‖¯v‖ 2 = ∑ k<br />
|〈ē k |¯v〉| 2 , (4.25)<br />
joka tunnetaan Parsevalin kaavana.<br />
Huom. Esimerkiksi l 2 , L 2 , C n ja R n ovat separoituvia.<br />
Huom. Erikoistapauksena saamme Parsevalin kaavan Fourier-sarjoille (vrt. FyMM Ib).<br />
6 Avaruus on separoituva jos siihen sisältyy numeroituva tiheä joukko. Esim. R on separoituva, sillä Q on tiheä ja<br />
numeroituva.
39<br />
4.3 Hilbert avaruudet<br />
Kertausta:<br />
– V on C-kertoiminen vektoriavaruus<br />
– Normi: kuvaus ‖·‖ : V → R, jolle<br />
1. ‖u‖ ≥ 0, ‖u‖ = 0 ⇔ u = ¯0.<br />
2. ‖au‖ = |a| ‖u‖, a ∈ C<br />
3. ‖u + v‖ ≤ ‖u‖ + ‖v‖<br />
– Suppeneminen: u n → u ⇔ ‖u n − u‖ → 0<br />
– Cauchyn jono: ‖u n − u m ‖ → 0, n, m → ∞<br />
– Banach-avaruus: Normiavaruus, jonka jokainen Cauchyn jono myös suppenee. (Täydellinen normiavaruus)<br />
– Sisätulo: kuvaus V × V → C, jolle<br />
1. 〈u|v〉 = 〈v|u〉 ∗<br />
2. 〈u|av + bw〉 = a〈u|v〉 + b〈u|w〉<br />
3. 〈u|u〉 ≥ 0, 〈u|u〉 = 0 ⇔ u = ¯0<br />
– Sisätuloavaruus on normiavaruus: ‖u‖ = √ 〈u|u〉<br />
– Hilbert avaruus: Täydellinen sisätuloavaruus.<br />
Lisäksi palautetaan mieleen funktion jatkuvuus<br />
Määritelmä 4.4 Funktio f : V → C on jatkuva (pisteessä u) jos<br />
tai<br />
u n → u =⇒ f(u n ) → f(u) (4.26)<br />
∀ ɛ ∃ δ s.e. ‖u − v‖ < δ =⇒ |f(u) − f(v)| < ɛ. (4.27)<br />
Funktio on jatkuva joukossa A, jos se on jatkuva jokaisessa joukon pisteessä.<br />
Kuvausta ϕ : V → C sanotaan (lineeariseksi) funktionaaliksi, jos se on sekä jatkuva että lineaarinen.<br />
Toisin sanoen ϕ on jatkuva ja ϕ(au + bv) = aϕ(u) + bϕ(v). (Lineaariset) Funktionaalit muodostavat<br />
myös vektoriavaruuden, duaaliavaruuden V ∗ , kun määritellään<br />
(ϕ + ψ)(u) = ϕ(u) + ψ(u)<br />
(aϕ)(u) = aϕ(u)<br />
¯0(u) = 0 ∀ u ∈ V
40<br />
Määritelmä 4.5 Kuvaus ϕ on rajoitettu jos on olemassa M > 0 s.e.<br />
|ϕ(u)| ≤ M ‖u‖ ∀ u ∈ V (4.28)<br />
Lause 4.3 Olkoon V Banach avaruus. Lineaarinen funktionaali ϕ : V → C on jatkuva jos ja vain jos<br />
se on rajoitettu.<br />
Todistus 4.3 ”⇒”. Koska ϕ on jatkuva, se on jatkuva erityisesti origossa. On siis olemassa δ s.e.<br />
|ϕ(u)| < 1, kun ‖u‖ < δ. Olkoon ¯0 ≠ u ∈ V ja δ kuten edellä, jolloin<br />
( )∣ |ϕ(u)| =<br />
2 ‖u‖ δu ∣∣∣<br />
∣ ϕ < 2 ‖u‖ · 1,<br />
δ 2 ‖u‖ δ<br />
sillä<br />
∥ ∥∥∥ δu<br />
2 ‖u‖ ∥ = δ 2 < δ.<br />
M:ksi voidaan siis valita esimerksi 2/δ.<br />
”⇐”. Olkoon ɛ > 0. Jos |ϕ(u)| ≤ M ‖u‖ ∀u ∈ V , niin<br />
joten ϕ on jatkuva.<br />
‖u − v‖ < ɛ M ⇒ |ϕ(u) − ϕ(v)| = |ϕ(u − v)| ≤ M ‖u − v‖ < M · ɛ<br />
M = ɛ,<br />
Esimerkki 4.7 V = l 1 eli jonot (x 1 , x 2 , . . .), joille<br />
‖x‖ =<br />
∞∑<br />
|x k | < ∞. (4.29)<br />
Olkoon c = (c 1 , c 2 , . . .) jono kompleksilukuja ja ϕ c : l 1 → C määritelty kaavalla<br />
k=1<br />
ϕ c (x) =<br />
∞∑<br />
c k x k . (4.30)<br />
ϕ c on selvästi lineaarinen. Jos |c k | < K kaikilla i, niin ϕ c on rajoitettu, sillä<br />
|ϕ c (x)| ≤<br />
k=1<br />
k=1<br />
∞∑<br />
∞∑<br />
|c k x k | ≤ K |x k | = K ‖x‖ .<br />
ϕ on siis jatkuva jos c on rajoitettu. Osoitetaan vielä, että muussa tapauksessa ϕ c ei ole jatkuva. Jos<br />
|c i | ei ole ylhäältä rajoitettu on olemassa osajono (c ij ) ∞ j=1 s.e. |c i j<br />
| → ∞, kun i j → ∞. Käytetään<br />
jatkuvuuden jonomääritelmää, ja muodostetaan jono (x (j) ) ⊂ l 1 , missä<br />
Nyt ∥ ∥x (j)∥ ∥ = 1/|c ij | → 0, koska |c ij | → ∞, mutta<br />
k=1<br />
x (j) = (0, 0, . . . , 0, 1/c ij , 0 . . .).<br />
} {{ }<br />
i j :s<br />
ϕ c (x (j) ) =<br />
∞∑<br />
i=1<br />
c i x (j)<br />
i<br />
= c ij · 1/c ij = 1<br />
kaikilla i, mikä on ristiriita, sillä jatkuvuuden nojalla pitäisi ϕ(x (j) ) → 0 = ϕ x (¯0), koska x (j) → ¯0.
41<br />
Lause 4.4 (Suunnikassääntö) Hilbert avaruudessa pätee<br />
Todistus 4.4 Suora lasku:<br />
‖u + v‖ 2 + ‖u − v‖ 2 = 2 ‖u‖ 2 + 2 ‖v‖ 2<br />
‖u + v‖ 2 + ‖u − v‖ 2 = 〈u + v|u + v〉 + 〈u − v|u − v〉<br />
= 2 ‖u‖ 2 + 2 ‖v‖ 2 + 〈u|v〉 + 〈v|u〉 − 〈u|v〉 − 〈v|u〉<br />
= 2 ‖u‖ 2 + 2 ‖v‖ 2 .<br />
Tästä seuraa mm. ‖u + v‖ 2 ≤ 2 ‖u‖ 2 + 2 ‖v‖ 2 . Suunnikassäännön avulla on myös helppo osoittaa, ettei<br />
jokin normi ole sisätulon määräämä ts. että jokin Banach avaruus ei ole Hilbert avaruus. Esim l p - ja<br />
L p -avaruudet eivät ole Hilbert-avaruuksia, kun p ≠ 2.<br />
Eräs tärkeä Hilbertin avaruus on L 2 (Ω), missä Ω ⊂ R n ja<br />
∫<br />
f ∈ L 2 (Ω) ⇐⇒ ‖f‖ 2 := d n x|f(x)| 2 < ∞.<br />
Sisätulo on<br />
∫<br />
〈f|g〉 =<br />
Ω<br />
Ω<br />
d n xf(x) ∗ g(x).<br />
Samaistetaan f ja g jos ‖f − g‖ = 0 (”f = g melkein kaikkialla”). Seuraava lause on osa Riesz-Fischerin<br />
lauseesta.<br />
Lause 4.5 (Riesz-Fischer, p = 2.)<br />
Jos f 1 , f 2 , . . . on Cauchyn jono L 2 (Ω):ssa, niin on olemassa f ∈ L 2 (Ω) jolle ‖f n − f‖ → 0, kun n → ∞<br />
Todistuksen pääpiirteet. (f n ) Cauchyn jono, joten voidaan siirtyä osajonoon (f nk ), jolle<br />
‖f nk − f nk −1‖ < 2 −n .<br />
Indeksöidään osajono uudelleen, merk. (f k ). Muodostetaan sitten<br />
ja koska<br />
‖h‖ ≤<br />
h(x) =<br />
∞∑<br />
|f k (x) − f k−1 (x)|<br />
k=1<br />
∞∑<br />
‖f k (x) − f k−1 (x)‖ ≤<br />
k=1<br />
∞∑<br />
2 −n = 1<br />
on h 2 integroituva ja tällöin |h(x)| < ∞ melkein kaikkialla. Määritellään<br />
{<br />
fn (x) − f<br />
g n (x) =<br />
n−1 (x), kun |h(x)| < ∞<br />
0 , kun |h(x)| = ∞ .<br />
Nyt haluttu f on ∑ n g n. Näin määritelty f kuuluu L 2 :een, sillä<br />
∥ ∞∑ ∥∥∥∥ ∞∑<br />
‖f‖ =<br />
g n ≤<br />
|g n |<br />
= ‖h‖ (4.31)<br />
∥ ∥ ∥<br />
n=1<br />
n=1<br />
k=1<br />
ja h ∈ L 2 . Lisäksi<br />
‖f − f n ‖ =<br />
∥<br />
∥<br />
∞∑ ∥∥∥∥ ∞∑<br />
∞∑<br />
g k ≤ ‖g k ‖ < 2 −k = 2 −n → 0.<br />
k=n+1<br />
k=n+1 k=n+1
42<br />
4.4 Aliavaruudet ja separoituvuus<br />
Vektoriavaruuden V vektorialiavaruus on mikä tahansa joukko W ⊂ V , jonka alkioille pätee u, v ∈<br />
W ⇒ αu + βv ∈ W kaikilla α, β ∈ C. Hilbert avaruudessa määritellään: Hilbertin avaruuden H<br />
aliavaruus H ′ on H:n vektorialiavaruus, joka on lisäksi joukkona suljettu, t.s. jos u n ∈ H ′ ∀ n ja<br />
‖u n − u‖ → 0, niin u ∈ H ′ . Jos W on H:n vektorialiavaruus, sen sulkeuma W on pienin H:n aliavaruus,<br />
joka sisältää W :n. Oleellisesti W saadaan lisäämällä W :hen kaikkien W :n alkioista muodostettujen<br />
suppenevien jonojen raja-arvot. Olkoon K H:n mielivaltainen osajoukko. K:n generoima<br />
vektorialivaruus L(K) on<br />
{ n∑<br />
}<br />
L(K) = α i u i : α i ∈ C, u i ∈ K . (4.32)<br />
i=1<br />
Vastaavasti K:n generoima H:n aliavaruus on L(K).<br />
Kuten aiemmin todettin (ilman todistusta), jos H on separoituva on olemassa numeroituva joukko<br />
K = {u 1 , u 2 , . . .} ⊂ H s.e. H = L(K). Jos H on separoituva, niin lähtien vektoreista u i voimme<br />
Gram-Schmidtin menetelmää käyttäen ja jättäen pois lineaarisesti riippuvia vektoreita muodostaa<br />
ortonormitetun joukon {e 1 , e 2 , . . .} (〈e i |e j 〉 = δ ij ) ja tällöin<br />
H = L(K) ⇐⇒ H = L({e 1 , e 2 , . . .})<br />
eli separoituvalla Hilbert avaruudella on numeroituva ortonormaali kanta.<br />
Lause 4.6 Jos H on separoituva Hilbert avaruus ja {e 1 , e 2 , . . .} on o.n. kanta, niin jokainen u ∈ H<br />
voidaan esittää yksikäsitteisesti muodossa<br />
u =<br />
∞∑<br />
c i e i , (4.33)<br />
i=1<br />
missä c i = 〈e i |u〉.<br />
Lauseen todistamiseksi ensin kaksi aputulosta.<br />
Apulause 4.1 Hilbert avaruuden sisätulo on jatkuva, t.s. kaikilla u ∈ H pätee<br />
lim v n = v =⇒ lim 〈u|v n〉 = 〈u|v〉.<br />
n→∞ n→∞<br />
Todistus 4.5 |〈u|v n 〉−〈u|v〉| = |〈u|v n −v〉| ≤ ‖u‖ ‖v n − v‖ → 0, missä epäyhtälö on Cauchy-Schwarzin<br />
epäyhtälö (4.8). Oikeastaan pelkkä Cauchy-Schwarzin epäyhtälö riittää kun huomaa että sisätulo on<br />
rajoitettu funktionaali.<br />
Apulause 4.2 Jos {e 1 , e 2 , . . .} on Hilbert avaruuden H o.n. kanta ja 〈v|e k 〉 = 0 kaikilla k, niin v = ¯0<br />
Todistus 4.6 Koska H = L({e 1 , e 2 , . . .}), niin v = lim n→∞ v n , missä v n = ∑ N n<br />
i=1 v n,ie i . Lisäksi<br />
〈v|e k 〉 = 0 ∀ k =⇒ 〈v|v n 〉 = 0.<br />
Nyt aputuloksen 4.1 mukaan<br />
eli v = ¯0.<br />
‖v‖ 2 = 〈v|v〉 = lim<br />
n→∞ 〈v|v n〉 = 0
43<br />
Todistus 4.7 (Lauseen 4.6 todistus) Besselin epäyhtälön mukaan<br />
N∑<br />
|〈e n |u〉| 2 ≤ ‖u‖ 2<br />
n=1<br />
∀ N ∈ N<br />
eli sarja ∑ k |〈e n|u〉| 2 suppenee. Määritellään nyt<br />
jolloin (u n ) on Cauchyn jono, sillä<br />
u N =<br />
‖u N − u M ‖ 2 =<br />
N∑<br />
〈e n |u〉e n ,<br />
n=1<br />
N∑<br />
n=M+1<br />
|〈e n |u〉| 2 −→ 0<br />
osana suppenevan sarjan häntää. Koska H on täydellinen on olemassa u ′ , jolle u n → u ′ . Nyt aputuloksen<br />
4.1 mukaan<br />
Kuitenkin 〈e k |u N 〉 = 〈e k |u〉, kun N ≥ k, joten<br />
〈e k |u − u ′ 〉 = 〈e k |u〉 − 〈e k |u ′ 〉<br />
= 〈e k |u ′ 〉 − lim<br />
N→∞ 〈e k|u N 〉.<br />
lim 〈e k|u N 〉 = 〈e k |u〉 ja 〈e k |u − u ′ 〉 = 0.<br />
N→∞<br />
Koska tämä pätee kaikilla k ∈ N on aputuloksen 4.2 mukaan oltava u − u ′ = ¯0 eli<br />
mikä kuuluikin todistaa.<br />
u = u ′ =<br />
∞∑<br />
〈e n |u〉e n , (4.34)<br />
n=1<br />
Voidaan osoittaa, että esimerkiksi L 2 ([a, b]), L 2 (R) ja L 2 (R n ) ovat separoituvia.<br />
Todistuksn idea. Weierstrassin approksimaatiolauseen mukaan jokaista f ∈ L 2 ([a, b]) voidaan approksimoida<br />
mielivaltaisen tarkasti polynomeilla. Eli kaikilla f ∈ L 2 ([a, b]) on olemassa polynomi<br />
P s.e. ‖f − P ‖ < ɛ. Pätee siis L 2 ([a, b]) = L({1, x, x 2 , . . .}). Monomien joukkoon voi soveltaa Gram-<br />
Schmidtiä tai o.n. kannan voi rakentaa vaikka suoraan Legendren polynomeista. Vastaavasti L 2 (R) =<br />
L({ϕ 0 , ϕ 1 , . . .}, missä<br />
ϕ n (x) =<br />
1<br />
√<br />
2 n n! √ π H n(x)exp<br />
) (− x2<br />
2<br />
ja H n on Hermiten n:s polynomi. Tästä seuraa myös L 2 (R d ):n separoituvuus:<br />
ϕ n1 n 2···n d<br />
(x 1 , x 2 , . . . , x d ) = ϕ n1 (x 1 )ϕ n2 (x 2 ) · · · ϕ nd (x d )<br />
Jotta saisimme todistettua vielä Plancherelin kaavan separoituvissa Hilbert avaruuksissa todistetaan<br />
ensin skalaaritulon jatkuvuus kahden muuttujan funktiona.<br />
Apulause 4.3 Jos u n → u ja v n → v, niin<br />
〈v n |u n 〉 −→ 〈v|u〉
44<br />
Todistus 4.8<br />
|〈v n |u n 〉 − 〈v|u〉| = |〈v n |u n 〉 − 〈v|u n 〉 + 〈v|u n 〉 − 〈v|u〉|<br />
≤ |〈v n |u n 〉 − 〈v|u n 〉| + |〈v|u n 〉 − 〈v|u〉|<br />
≤ ‖u n ‖ ‖v n − v‖ + ‖u n − u‖ ‖v‖<br />
−→ 0,<br />
kun n → ∞.<br />
Lause 4.7 (Plancherel) Olkoon {e 1 , e 2 , . . .} Hilbertin avaruuden H o.n. kanta. Tällöin kaikilla u, v ∈<br />
H pätee<br />
∞∑<br />
〈u|v〉 = 〈u|e n 〉〈e n |v〉. (4.35)<br />
n=1<br />
Todistus 4.9 Määritellään<br />
Nyt apulauseen 4.3 mukaan<br />
u n =<br />
v n =<br />
n∑<br />
〈e i |u〉e i (−→ u) ja<br />
i=1<br />
n∑<br />
〈e i |v〉e i (−→ v).<br />
i=1<br />
〈u|v〉 = lim 〈u n|v n 〉<br />
n→∞<br />
n∑ n∑<br />
= lim 〈u|e i 〉〈e i |e j 〉〈e j |v〉<br />
n→∞<br />
= lim<br />
n→∞<br />
=<br />
i=1 j=1<br />
n∑<br />
〈u|e i 〉〈e i |v〉<br />
i=1<br />
∞∑<br />
〈u|e i 〉〈e i |v〉.<br />
Huom. erikoistapaus u = v, jolloin ‖u‖ = ∑ i |〈e i|u〉| 2 (Parseval).<br />
i=1<br />
Kertauksena u, v ∈ H ovat ortogonaalisia (u⊥v) jos 〈u|v〉 = 0. Olkoon V H:n aliavaruus, sen ortogonaalinen<br />
komplementti on<br />
V ⊥ = {u : u⊥v ∀ v ∈ V } . (4.36)<br />
Myös V ⊥ on H:n aliavaruus:<br />
Se on vektoriavaruus, koska<br />
u, u ′ ∈ V ⊥ =⇒ 〈au + bu ′ |v〉 = a ∗ 〈u|v〉 + b ∗ 〈u ′ |v〉 = 0 + 0 = 0<br />
kaikilla v ∈ V eli au + bu ′ ∈ V ⊥ . Lisäksi se on suljettu, sillä jos u n ∈ V ⊥ ja u n → u, niin<br />
〈u|v〉 = lim<br />
n→∞ 〈u n|v〉 = lim<br />
n→∞ 0 = 0<br />
eli u ∈ V ⊥ .<br />
Huom. V ∩ V ⊥ = {¯0}, sillä jos v ∈ V ∩ V ⊥ , niin 〈v|v〉 = 0 eli v = ¯0.<br />
Lause 4.8 Jos V on Hilbert avaruuden H aliavararuus, niin jokainen u ∈ H voidaan yksikäsitteisesti<br />
hajoittaa muotoon u = u ′ + u ′′ , missä u ′ ∈ V ja u ′′ ∈ V ⊥ .
45<br />
Todistus 4.10 (Olemme jo todistaneet lauseen äärellisulotteisen aliavaruuden tapauksessa ja nyt tehdään<br />
se yleisesti.) Olkoon u ∈ H annettu, merkitään<br />
d = inf {‖u − v‖ : v ∈ V } (4.37)<br />
Olkoon (v n ) jokin V:n jono jolle ‖u − v n ‖ → d. (v n ) on Cauchyn jono, sillä suunnikassäänön mukaan<br />
‖u − v m ‖ 2 + ‖u − v n ‖ 2 =<br />
∥ u − 1 2 (v n + v m ) + 1 2 (v 2<br />
n − v m )<br />
∥<br />
+<br />
∥ u − 1 2 (v n + v m ) − 1 2 (v 2<br />
n − v m )<br />
∥<br />
= 2<br />
∥ u − 1 2 (v 2<br />
n + v m )<br />
∥ + 2<br />
1<br />
∥2 (v n − v m )<br />
∥<br />
2<br />
,<br />
joten<br />
‖v n − v m ‖ 2 = 2 ‖u − v n ‖ 2 + 2 ‖u − v m ‖ 2 − 4<br />
∥ u − 1 2 (v n + v m )<br />
∥<br />
2<br />
joka lähestyy nollaa, kun n, m → ∞, sillä<br />
‖u − v n ‖ 2 −→ d 2<br />
‖u − v m ‖ 2 −→ d 2<br />
∥ u − 1 2 (v 2<br />
n + v m )<br />
∥ −→ d 2 .<br />
V on suljettu joten on olemassa u ′ ∈ V s.e. v n → u ′ . Määritellän u ′′ = u − u ′ (‖u ′′ ‖ = d). Osoitetaan,<br />
että u ′′ ∈ V ⊥ . Olkoon v ∈ V ja v 0 = v/ ‖v‖. Koska V on vektoriavaruus ja u ′ , v 0 ∈ V , niin u ′ +<br />
〈v 0 |u ′′ 〉v 0 ∈ V . Tällöin<br />
d 2 ≤ ∥ ∥ u − (u ′ + 〈v 0 |u ′′ 〉v 0 ) ∥ ∥ 2<br />
= ∥ ∥u ′′ − 〈v 0 |u ′′ 〉v 0<br />
∥ ∥<br />
2<br />
= ∥ ∥u ′′∥ ∥ 2 − |〈v 0 |u ′′ 〉| 2<br />
= d 2 − |〈v 0 |u ′′ 〉| 2 .<br />
Tämä on mahdollista vain jos 〈v 0 |u ′′ 〉 = 0 eli 〈v|u ′′ 〉 = 0, joten u ′′ ∈ V ⊥ ja u = u ′ − u ′′ on haluttu<br />
esitys. Lisäksi esitys on yksikäsitteinen: Oletetaan, että on olemassa u ′ , v ′ ∈ V ja u ′′ , v ′′ ∈ V ⊥ s.e.<br />
u = u ′ + u ′′ = v ′ + v ′′ . Tällöin<br />
u<br />
} ′ {{<br />
− v<br />
}<br />
′ =<br />
}<br />
u ′′ {{<br />
− v ′′<br />
}<br />
∈V ∈V ⊥<br />
eli u ′ − v ′ = u ′′ − v ′′ = ¯0, sillä V ∩ V ⊥ = {¯0}.<br />
Seuraus 4.1 (V ⊥ ) ⊥ = V .<br />
Todistus 4.11 ”⊇”. Jos v ∈ V , niin 〈v|u〉 = 0 ∀ u ∈ V ⊥ ⇒ v ∈ (V ⊥ ) ⊥ ⇒ V ⊆ (V ⊥ ) ⊥ .<br />
”⊆”. Olkoon v ∈ (V ⊥ ) ⊥ . v = v ′ + v ′′ joillakin v ′ ∈ V, v ′′ ∈ V ⊥ . Edellisen kohdan mukaan v ′ ∈ V ⊆<br />
(V ⊥ ) ⊥ , joten v ′′ = v − v ′ ∈ (V ⊥ ) ⊥ sekä (V ⊥ ) joten v ′′ = ¯0 ja siis v ∈ V eli (V ⊥ ) ⊥ ⊆ V .<br />
Nyt V ⊆ (V ⊥ ) ⊥ & (V ⊥ ) ⊥ ⊆ V =⇒ (V ⊥ ) ⊥ = V .
46<br />
4.5 Hilbertin avaruuden jatkuvat funktionaalit<br />
Olemme jo kahdesti (4.8 ja 4.1) osoittaneet, että kuvaus u ↦→ 〈v|u〉 on jatkuva kaikilla v ∈ H ja<br />
lisäksi se on määritelmänsä mukaan lineaarinen. Seuraava lause osoittaa että kaikki Hilbert avaruuden<br />
jatkuvat funktionaalit ovat tätä muotoa.<br />
Lause 4.9 (Rieszin esityslause) Jos ϕ on Hilbert avaruuden jatkuva funktionaali, niin on olemassa<br />
yksikäsitteinen vektori v ∈ H s.e. ϕ(u) = 〈v|u〉 ∀ u ∈ H.<br />
Todistus. Olkoon V = Ker(ϕ) := {x ∈ H : ϕ(x) = 0}, joka on H:n aliavaruus: x, y ∈ V ⇒ ϕ(ax+by) =<br />
aϕ(x) + bϕ(y) = 0. Lisäksi V on ϕ:n jatkuvuuden nojalla suljettu.<br />
Jos V = H, niin ϕ(u) = 0 ∀ u ∈ H ja voidaan valita v = ¯0. Tämä on yksikäsitteinen, sillä 〈v|u〉 =<br />
0 ∀ u ∈ H vain kun v = ¯0.<br />
Jos V ≠ H, niin on olemassa ¯0 ≠ w ∈ H \ V , joka voidaan esittää w = w ′ + w ′′ , missä w ′ ∈ V ja<br />
w ′′ ∈ V ⊥ . Huomataan<br />
joten mielivaltaiselle u ∈ H voidaan kirjoittaa<br />
ϕ(w ′′ ) = ϕ(w − w ′ ) = ϕ(w) − ϕ(w ′ ) = ϕ(w) ≠ 0,<br />
u = u − ϕ(u)<br />
ϕ(w ′′ ) w′′ + ϕ(u)<br />
ϕ(w<br />
} {{ }<br />
′′ ) w′′ . (4.38)<br />
} {{ }<br />
∈V<br />
∈V ⊥<br />
Olkoon nyt v = ϕ(w ′′ ) ∗<br />
w′′<br />
‖w ′′ ‖ 2<br />
∈ V ⊥ , jolloin<br />
〈v|u〉 = ϕ(w′′ )<br />
‖w ′′ ‖ 2 〈w′′ | ϕ(u)<br />
ϕ(w ′′ ) w′′ 〉<br />
= ϕ(u)<br />
‖w ′′ ‖ 2 〈w′′ |w ′′ 〉<br />
= ϕ(u). (4.39)<br />
Lisäksi löydetty v on yksikäsitteinen, sillä jos 〈v|u〉 = 〈v ′ |u〉 ∀ u ∈ H, niin valitsemalla u = v − v ′<br />
saadaan ‖v − v ′ ‖ 2 = 0 eli v − v ′ = ¯0.<br />
Rieszin esityslause sanoo siis, että on olemassa 1-1 vastaavuus H:n ja sen duaalin H ∗ välillä (ϕ ↔ v).<br />
5 Operaattorit<br />
5.1 Perusominaisuudet<br />
Olkoon V normitettu vektoriavaruus. Operaattori A on lineaarinen kuvaus A : V → V , u ↦→ Au ja<br />
A(αu + βv) = αAu + βAv.<br />
Lisäksi operaattori A on jatkuva jos u n → u ⇒ Au n → Au t.s. ∀ ɛ > 0 ∃ δ > 0 s.e. ‖u − v‖ < δ ⇒<br />
‖Au − Av‖ < ɛ.<br />
Operaattori on rajoitettu jos on olemassa K > 0 s.e. ‖Au‖ ≤ K ‖u‖ kaikilla u ∈ V ja aivan kuten<br />
funktionaaleilla nämä kaksi ovat yhtäpitäviä ominaisuuksia.<br />
Lause 5.1 A on rajoitettu ⇐⇒ A on jatkuva.<br />
Todistus 5.1 ”⇒”. Olkoon ɛ > 0. Nyt<br />
‖u − v‖ < ɛ K ⇒ ‖Au − Av‖ = ‖A(u − v)‖ < ɛ K K = ɛ.
47<br />
”⇐”. Jos A ei olisi rajoitettu pitäisi jokaiselle K > 0 löytyä u K s.e ‖Au K ‖ ≥ K ‖u K ‖. Määritellään<br />
jolloin<br />
w K =<br />
‖Aw K ‖ ≥<br />
u K<br />
K ‖u K ‖ ⇒ ‖w K‖ = 1 K ,<br />
1<br />
K ‖u K ‖ K ‖u K‖ = 1.<br />
Kun K → ∞, niin w K → ¯0, mutta ‖Aw K ‖ → 1 ≠ 0, mikä on ristiriidassa jatkuvuuden kanssa, joten<br />
A:n täytyy olla rajoitettu.<br />
Määritellään rajoitetun operaattorin normi:<br />
Pätee<br />
‖A‖ = sup ‖Au‖ . (5.1)<br />
‖u‖≤1<br />
( )∥ ‖Au‖ = ‖u‖<br />
u ∥∥∥<br />
∥ A ≤ ‖u‖ ‖A‖ ,<br />
‖u‖<br />
joten A on rajoitettu (eli jatkuva) jos ja vain jos sen normi on äärellinen.<br />
Esimerkki 5.1 V = l 2 eli jonot x = (x 1 , x 2 , . . .), joille<br />
Määritellään siirto-operaattorit S − ja S + :<br />
Nyt<br />
‖x‖ 2 =<br />
∞∑<br />
|x i | 2 < ∞<br />
i=1<br />
S + (x 1 , x 2 , x 3 , x 4 , . . .) = (0, x 1 , x 2 , x 3 , . . .) (5.2)<br />
S − (x 1 , x 2 , x 3 , x 4 , . . .) = (x 2 , x 3 , x 4 , . . .) (5.3)<br />
‖S + x‖ 2 = 0 +<br />
‖S − x‖ 2 =<br />
∞∑<br />
|x n | 2 = ‖x‖ 2<br />
n=1<br />
∞∑<br />
|x n | 2 = ‖x‖ 2 − |x 1 | ≤ ‖x‖ 2 ,<br />
n=2<br />
joten molemmat ovat rajoitettuja. Ilmeisesti ‖S + ‖ = 1, mutta myös ‖S − ‖ = 1, sillä esimerkiksi<br />
‖S − (0, 1, 0, 0, . . .)‖ = ‖(1, 0, 0, . . .)‖ = 1 = ‖(0, 1, 0, 0, . . .)‖ .<br />
Operaattoreiden A : V → V ja B : V → V tulo määritellään kaavalla (AB)u = A(Bu). Määritelmästä<br />
seuraa A(BC) = (AB)C (”assosiatiivisuus”). Ilmeisesti pätee id V A = Aid V = A, A 2 = AA, A k =<br />
AA k−1 = A k−1 A (sovitaan A 0 = id V ).<br />
Jos A on rajoitettu ja löytyy rajoitettu operaattori A −1 s.e. AA −1 = A −1 A = id V (Huom. molempien<br />
on oltava voimassa!), niin A −1 on A:n käänteisoperaattori. Jos käänteisoperaattori on olemassa, se on<br />
yksikäsitteinen, sillä jos BA = A −1 A = id V , niin BA = BAA −1 = A −1 AA −1 = A −1 .<br />
Esimerkki 5.2 Jatkoa esimerkkiin 5.1. Kaikilla x ∈ l 2 pätee<br />
S − S + x = S − S + (x 1 , x 2 , x 3 , x 4 , . . .)<br />
= S − (0, x 1 , x 2 , x 3 , . . .)<br />
= (x 1 , x 2 , x 3 , x 4 , . . .)<br />
= x<br />
⇒ S − S + = id l 2.
48<br />
Mutta<br />
S + S − x = S + S − (x 1 , x 2 , x 3 , x 4 )<br />
= S + (x 2 , x 3 , x 4 , x 5 , . . .)<br />
= (0, x 2 , x 3 , x 4 , . . .)<br />
≠ x<br />
⇒ S + S − ≠ id l 2.<br />
S + ja S − eivät siis ole toistensa käänteisoperaattoreita.<br />
Lause 5.2 (Neumannin sarja) Jos V on Banach avaruus ja A V :n operaattori s.e. ‖A‖ < 1, niin<br />
id V − A:lla on käänteisoperaattori<br />
∞∑<br />
(id V − A) −1 = A n . (5.4)<br />
Todistus 5.2 Kaikilla x ∈ V pätee<br />
∥<br />
∥A k ∥<br />
x∥ ≤ ‖A‖ ∥A k−1 ∥ x∥ ≤ ‖A‖ 2 ∥A k−2 x∥ ≤ . . . ≤ ‖A‖ k ‖x‖ ,<br />
joten A k on rajoitettu ja ∥ ∥A k∥ ∥ ≤ ‖A‖ k . Huomataan, että vektorit u n = (id V + A + A 2 + . . . + A n )x<br />
muodostavat Cauchyn jonon (n ≥ m):<br />
n=0<br />
‖u n − u m ‖ = ∥ ∥(A m+1 + A m+2 + . . . + A n )x ∥ ∥<br />
= (‖A‖ m+1 + ‖A‖ m+2 + . . . + ‖A‖ n ) ‖x‖<br />
≤ ‖A‖m+1<br />
1 − ‖A‖ ‖x‖<br />
−→ 0.<br />
Koska V on täydellinen, on olemassa u ∈ V s.e. u n → u. Määritellään operaattori T : V → V kaavalla<br />
T x = u, joka on lineearinen ja<br />
M∑<br />
(T − A n )x = u − u M → ¯0.<br />
Voimme siis kirjoittaa<br />
Lisäksi nähdään<br />
eli T = (id V − A) −1 .<br />
5.2 Adjungoitu operaattori<br />
n=0<br />
T =<br />
∞∑<br />
A n .<br />
n=0<br />
(id V − A)T = id V + A + A 2 + . . . − A − A 2 − . . .<br />
= id V<br />
= T (id V − A)<br />
Olkoon H Hilbert avaruus ja A : H → H rajoitettu operaattori H:lla. Operaattorin adjungoitu operaattori<br />
A † : H → H määritellään yhtälön<br />
〈u|Av〉 = 〈A † u|v〉 ∀ u, v ∈ H (5.5)
49<br />
avulla. Määritelmä on mielekäs, sillä kun u on annettu, funktionaali ϕ u (v) = 〈u|Av〉 on selvästi lineaarinen<br />
ja lisäksi jatkuva, koska<br />
|ϕ u (v)| = |〈u|Av〉| ≤ ‖u‖ ‖Av‖ ≤ ‖u‖ ‖A‖ ‖v‖ =: K ‖v‖ .<br />
Rieszin esityslauseen nojalla on olemassa yksikäsitteinen vektori A † u ∈ H s.e. ϕ u (v) = 〈A † u|v〉. Lisäksi<br />
A † on lineaarinen:<br />
〈A † (au + bw)|v〉 = 〈au + bw|Av〉<br />
= a ∗ 〈u|Av〉 + b ∗ 〈w|Av〉<br />
= a ∗ 〈A † u|v〉 + b ∗ 〈A † w|v〉<br />
= 〈aA † u + bA † w|v〉.<br />
Sekä jatkuva:<br />
∥<br />
∥A † u∥ 2 = 〈A † u|A † u〉<br />
= 〈u|AA † u〉<br />
∥<br />
(Schwarz) → ≤ ‖u‖ ∥AA † u∥<br />
∥<br />
≤ ‖u‖ ‖A‖ ∥A † u∥<br />
∥<br />
⇒ ∥A † u∥ ≤ ‖A‖ ‖u‖ .<br />
Esimerkki 5.3 (l 2 :n siirto-operaattoreiden adjungaatit)<br />
S + (x 1 , x 2 , x 3 , x 4 , . . .) = (0, x 1 , x 2 , x 3 , . . .)<br />
S − (x 1 , x 2 , x 3 , x 4 , . . .) = (x 2 , x 3 , x 4 , . . .).<br />
Huomataan, että pätee<br />
〈y|S + x〉 =<br />
〈S − y|x〉 =<br />
∞∑<br />
yi ∗ (S + x) i =<br />
i=1<br />
∞∑<br />
(S − y) ∗ i x i =<br />
∞∑<br />
i=1<br />
i=1<br />
i=1<br />
y ∗ i+1x i<br />
∞∑<br />
yi+1x ∗ i ,<br />
joten S − = S † + . Ilmeisesti myös S + = S † − (itse asiassa aina pätee (A† ) † = A).<br />
Esimerkki 5.4 Olkoon H = L 2 (X) ja α : X → C rajoitettu (|α(x)| ≤ M ∀ x ∈ X). Määritellään<br />
kertomisoperaattori A α kaavalla (A α f)(x) = α(x)f(x). Se on rajoitettu:<br />
∫<br />
∫<br />
‖A α f‖ 2 = dx |α(x)| 2 |f(x)| 2 ≤ M 2 dx|f(x)| 2 = M 2 ‖f‖ 2 .<br />
X } {{ }<br />
X<br />
≤M 2<br />
Lisäksi kaikilla f, g ∈ L 2 (X) pätee<br />
∫<br />
∫<br />
〈f|A α g〉 = dxf(x) ∗ α(x)g(x) =<br />
eli (A † αf)(x) = α(x) ∗ f(x).<br />
X<br />
X<br />
dx(f(x)α(x) ∗ ) ∗ g(x) = 〈α ∗ f|g〉
50<br />
Operaattorin A matriisielementti vektoreiden u ja v välillä on 〈u|Av〉. Jos H on separoituva ja<br />
{e i : i ∈ N} on sen o.n. kanta, voidaan kirjoittaa<br />
∞∑<br />
Ae j = e i a ij<br />
missä a ij on matriisielementti 〈e i |Ae j 〉. Jos taas<br />
u =<br />
i=1<br />
∞∑<br />
u i e i ja v =<br />
i=1<br />
niin (vrt. vektori-matriisitoimituksiin A · v ja u ∗ · A · v)<br />
ja<br />
Operaattoritulolle<br />
Av =<br />
∞∑<br />
v i Ae i =<br />
i=1<br />
∞∑<br />
j=1 i=1<br />
〈u|Av〉 =<br />
∞∑<br />
v i e i ,<br />
i=1<br />
∞∑<br />
v i a ji e j =<br />
∞∑<br />
j=1 i=1<br />
(<br />
∞∑ ∑ ∞<br />
)<br />
a ji v i e j (5.6)<br />
j=1<br />
i=1<br />
〈e i |ABe j 〉 = 〈A † e i |Be j 〉<br />
∞∑<br />
(Parseval) → = 〈A † e i |e k 〉〈e k |Be j 〉<br />
=<br />
=<br />
k=1<br />
∞∑<br />
u ∗ ja ji v i . (5.7)<br />
∞∑<br />
〈e i |Ae k 〉〈e k |Be j 〉<br />
k=1<br />
∞∑<br />
a ik b kj (5.8)<br />
k=1<br />
= (AB) ij<br />
Annetussa kannassa voidaan siis operaattoria kuvata (yl. ∞×∞) matriisilla. Adjungoidun operaattorin<br />
matriisi:<br />
a ij = 〈e i |Ae j 〉 = 〈A † e i |e j 〉 = 〈e j |A † e i 〉 ∗ = (a † ji )∗<br />
(<br />
)<br />
eli adjungoidun operaattorin matriisi on siis operaattorin matriisin hermiittinen konjugaatti (M † ) ij = (M) ∗ ji .<br />
5.3 Hermiittiset ja unitaariset operaattorit, projektio<br />
Operaattori on hermiittinen jos A † = A. Tästä seuraa<br />
Separoituvassa Hilbert avaruudessa ({e i } o.n. kanta)<br />
〈u|Av〉 = 〈A † u|v〉 = 〈Au|v〉. (5.9)<br />
a ij = 〈e i |Ae j 〉 = 〈Ae i |e j 〉 = 〈e j |Ae i 〉 ∗ = a ∗ ji,<br />
toisin sanoen hermiittisen operaattorin matriisi on hermiittinen (matriisi on hermiittinen jos M ij =<br />
M ∗ ji ).<br />
Aikaisemmin todistimme: Jos M on Hilbert avaruuden H aliavaruus niin kaikilla u ∈ H on yksikäsitteinen<br />
hajoitelma u = u ′ + u ′′ , missä u ′ ∈ M ja u ′′ ∈ M ⊥ . Määrittelemme projektio-operaattorin:<br />
P M : H → H, P M u = u ′<br />
ja kutsumme u ′ :a vektorin u kohtisuoraksi projektioksi aliavaruudelle M.
51<br />
Lause 5.3 Jokaiselle aliavaruudelle M projektio-operaattori P M on rajoitettu, hermiittinen ja toteuttaa<br />
P 2 M = P M. Kääntäen jokainen yhtälön P 2 = P toteuttava hermiittinen operaattori on projektio jollekin<br />
H:n aliavaruudelle.<br />
Todistus 5.3 P M on hermiittinen:<br />
P M on rajoitettu:<br />
eli ‖P M ‖ 2 ≤ 1.P 2 M = P M:<br />
〈u|P M v〉 = 〈u|v ′ 〉 = 〈u ′ + u ′′ |v ′ 〉 = 〈u ′ |v ′ 〉 = 〈u ′ |v ′ + v ′′ 〉 = 〈P M u|v〉.<br />
‖P M u‖ 2 = ∥ ∥ u<br />
′ ∥ ∥ 2 ≤ ∥ ∥ u<br />
′ ∥ ∥ 2 + ∥ ∥u ′′∥ ∥ 2 = ∥ ∥u ′ + u ′′∥ ∥ 2 = ‖u‖ 2 .<br />
P 2 Mu = P M u ′ = u ′ = P M u ∀ u ∈ H ⇒ P 2 M = P M .<br />
Käänteinen puoli: Olkoon P † = P = P 2 . P on rajoitettu, koska<br />
‖P u‖ 2 = |〈P u|P u〉| = |〈u|P 2 u〉| = |〈u|P u〉| ≤ ‖u‖ ‖P u‖<br />
eli ‖P u‖ ≤ ‖u‖. P projektio-operaattori: Olkoon M = {u : u = P u}. M on vektoriavaruus, sillä<br />
u = P u & v = P v ⇒ P (au + bv) = aP u + bP v = au + bv. Lisäksi M on suljettu: jos u n → u ja<br />
P u n = u n , niin<br />
u = lim u n = lim P u n =<br />
n→∞ n→∞ }{{} P u.<br />
P jva.<br />
M on siis H:n aliavaruus. Olkoon v ∈ H, määritellään<br />
Nyt v ′′ ∈ M ⊥ , sillä jos w ∈ M, niin<br />
Siis P on projektio M:lle.<br />
U : H → H on unitaarinen, jos<br />
v ′ = P v<br />
v ′′ = (id H − P )v = v − v ′ .<br />
〈v ′′ |w〉 = 〈v − P v|w〉<br />
= 〈v|w〉 − 〈P v|w〉<br />
= 〈v|w〉 − 〈v|P w〉<br />
= 〈v|w〉 − 〈v|w〉<br />
= 0.<br />
ja U −1 on olemassa. Suoraan määritelmästä seuraa:<br />
joten<br />
Lisäksi<br />
〈Uu|Uv〉 = 〈u|v〉 ∀ u, v ∈ H (5.10)<br />
〈U † Uu|v〉 = 〈u|v〉 ∀ u, v ∈ H,<br />
U † U = id H eli U −1 = U † .<br />
‖Uu‖ 2 = 〈Uu|Uu〉 = 〈u|u〉 = ‖u‖ 2 (5.11)<br />
eli U on isometrinen (säilyttää normin). Kääntäen jokainen isometrinen operaattori S on unitaarinen:<br />
〈S(u + v)|S(u + v)〉 − i〈S(u + iv)|S(u + iv)〉<br />
= 〈u + v|u + v〉 − i〈u + iv|u + iv〉. (5.12)
52<br />
Purkamalla sisätulot auki ja käyttämällä isometrisyyttä uudelleen saadaan:<br />
Pätee siis<br />
Oikea puoli = 〈u|u〉 + 〈u|v〉 + 〈v|u〉 + 〈v|v〉<br />
− i〈u|u〉 + 〈u|v〉 − 〈v|u〉 − i〈v|v〉<br />
= (1 − i)〈u|v〉 + (1 − i)〈v|v〉 + 2〈u|v〉.<br />
Vasen puoli = 〈Su|Su〉 + 〈Su|Sv〉 + 〈Sv|Su〉 + 〈Su|Sv〉<br />
− i〈Su|Su〉 + 〈Su|Sv〉 − 〈Sv|Su〉 − i〈Sv|Sv〉<br />
= (1 − i)〈Su|Su〉 + (1 − i)〈Sv|Sv〉 + 2〈Su|Sv〉<br />
(S isom. →) = (1 − i)〈u|u〉 + (1 − i)〈v|v〉 + 2〈Su|Sv〉.<br />
5.12 ⇐⇒ 2〈Su|Sv〉 = 2〈u|v〉<br />
jakamalla tämä 2:lla saadaan 〈Su|Sv〉 = 〈u|v〉 eli S on unitaarinen.<br />
Olkoon nyt H separoituva, {e k } o.n. kanta sekä U unitaarinen operaattori H:lla. Tällöin myös vektorit<br />
e ′ i = Ue i muodostavat o.n. kannan, sillä<br />
〈e ′ i|e ′ j〉 = 〈Ue i |Ue j 〉 = 〈e i |e j 〉 = δ ij .<br />
Kääntäen jos {e ′ k } ja {e k} ovat kaksi o.n. kantaa ja määritellään operaattori U s.e. Ue i = e ′ i ∀ i ∈ N,<br />
niin U on unitaarinen: Olkoon<br />
∞∑<br />
∞∑<br />
u = u i e i ja v = v i e i .<br />
Tällöin<br />
i=1<br />
i=1<br />
i=1<br />
∞∑ ∞∑<br />
〈Uu|Uv〉 = 〈 u i Ue i | v j Ue j 〉 =<br />
=<br />
j=1<br />
∞∑<br />
u ∗ i v j δ ij =<br />
i,j=1<br />
∞∑<br />
u ∗ i v j 〈e ′ i|e ′ j〉<br />
i,j=1<br />
∞∑<br />
u ∗ i v i = 〈u|v〉<br />
i=1<br />
eli U on unitaarinen.<br />
6 Spektraaliteoriaa<br />
6.1 Ominaisvektorit<br />
Määritelmä 6.1 α ∈ C on rajoitetun operaattorin A : H → H ominaisarvo, jos on olemassa ¯0 ≠ u ∈<br />
H s.e. Au = αu. Tällöin u on operaattorin A ominaisvektori.<br />
Huom. Au = αu → A(βu) = α(βu). Monikäsitteisyyttä voidaan rajoittaa vaatimalla esimerkiksi<br />
‖u‖ 2 = 1. Voi olla myös v ≠ βu, jolle Av = αv. Tällöin ominaisarvo on degeneroitunut.<br />
Lause 6.1 Hermiittisen operaattorin ominaisarvot ovat reaalisia ja erisuuria ominaisarvoja vastaavat<br />
ominaisvektorit ovat ortogonaalisia. (vrt. Sturm-Liouville)<br />
Todistus 6.1 Olkoon α ja u s.e. Au = αu. Nyt<br />
ja koska 〈u|u〉 ≠ 0 (u ≠ ¯0) on oltava α = α ∗ .<br />
Jos lisäksi Av = βv, α ≠ β, niin<br />
α〈u|u〉 = 〈u|Au〉 = 〈A † u|u〉 = 〈Au|u〉 = α ∗ 〈u|u〉<br />
β〈u|v〉 = 〈u|Av〉 = 〈A † u|v〉 = α〈u|v〉<br />
eli (α − β)〈u|v〉 = 0, ja koska α ≠ β on oltava 〈u|v〉 = 0.
53<br />
Sanomme, että operaattori A on täydellinen, jos sen ominaisvektorit muodostavat täydellisen o.n.<br />
joukon, eli mielivaltainen u ∈ H voidaan esittää<br />
u = ∑ α<br />
c α u α , (6.1)<br />
missä Au α = αu α .<br />
Esimerkki 6.1 (Projektio-operaattorin täydellisyys) Projektioille P 2 = P , joten jos P u = αu,<br />
niin<br />
αu = P u = P 2 u = αP u = α 2 u.<br />
Tällöin siis α 2 = α eli α = 1 tai 0. P projisoi jollekin aliavaruudelle M:<br />
u ∈ M =⇒ P u = u (ominaisarvo 1)<br />
u ∈ M 2 =⇒ P u = 0 (ominaisarvo 0).<br />
Todistimme aiemmin, että mikä tahansa u ∈ H voidaan esittää u = u ′ + u ′′ , missä u ′ ∈ M ja u ′′ ∈<br />
M ⊥ . Erityisesti nämä ovat P M :n ominaisvektoreita ja ortogonaalisia, joten projektio-operaattorit ovat<br />
täydellisiä.<br />
Lause 6.2 Unitaarisen operaattorin ominaisarvot ovat muotoa α = e ia , missä a ∈ R, ja erisuuria<br />
ominaisarvoja vastaavat ominaisvektorit ovat ortogonaalisia.<br />
Todistus 6.2 Jos Uu = αu, niin<br />
eli |α| = 1 t.s. α = e ia , jollakin a ∈ R.<br />
Olkoon lisäksi Uv = βv, α ≠ β. Tällöin<br />
Lisäksi<br />
eli U † u = α −1 u = α ∗ u (|α| = 1). Pätee siis<br />
ja koska α ≠ β on oltava 〈u|v〉 = 0.<br />
6.2 Rajoitetun operaattorin spektri<br />
‖u‖ = ‖Uu‖ = ‖αu‖ = |a| ‖u‖ ,<br />
β〈u|v〉 = 〈u|Uv〉 = 〈U † u|v〉.<br />
U † U = id H =⇒ u = U † Uu = αU † u,<br />
β〈u|v〉 = 〈α ∗ u|v〉<br />
⇐⇒ (α − β)〈u|v〉 = 0,<br />
Äärellisulotteisessa sisätuloavaruudessa (dim(V ) = n) on kannan valinnan jälkeen ”operaattori ⇔ n×n<br />
matriisi”. (Äärellisulotteisella) Matriisilla on aina ominaisarvoja: det(M − λI) on n:nnen asteen yhtälö<br />
λ:lle ja algebran peruslauseen mukaan sillä on aina juuri(a). Ääretönulotteisessa avaruudessa tilanne<br />
on monimutkaisempi.<br />
Esimerkki 6.2 H = l 2 . Tutkitaan Siirto-operaattoreita S + , S − : l 2 → l 2<br />
S + (x 1 , x 2 , x 3 , . . .) = (0, x 1 , x 2 , . . .) (6.2)<br />
S − (x 1 , x 2 , x 3 , . . .) = (x 2 , x 3 , x 4 , . . .) (6.3)<br />
Jos (0, x 1 , x 2 , . . .) = S + (x 1 , x 2 , . . .) = α(x 1 , x 2 , . . .), niin on oltava αx 1 = 0.
54<br />
Jos x 1 = 0, niin x 2 = 0, joten x 3 = 0, joten x 4 = 0 jne. x i = 0 ∀ i ∈ N. ¯0 ei kuitenkaan kelpaa<br />
ominaisvektoriksi.<br />
Jos taas α = 0, niin x 1 = αx 2 = 0, x 2 = αx 3 = 0 jne. a i = αx i+1 = 0 ∀ i ∈ N. ¯0 ei kuitenkaan kelpaa<br />
ominaisvektoriksi, joten S + :lla ei ole ominaisvektoreita!<br />
Jos (x 2 , x 3 , . . .) = S − (x 1 , x 2 , . . .) = α(x 1 , x 2 , . . .), niin on oltava<br />
x 2 = αx 1<br />
x 3 = αx 2 = α 2 x 1<br />
x 4 = αx 3 = α 3 x 1<br />
.<br />
x i = αx i−1 = α i−1 x 1 ,<br />
joten ominais vektori on muotoa x = x 1 (1, α, α 2 , . . .). Lisäksi jotta<br />
‖x‖ 2 = |x 1 | 2<br />
∞ ∑<br />
n=0<br />
|α| 2n < ∞,<br />
on oltava |α| < 1. Jokainen α ∈ C, jolle |α| < 1 on siis ominaisarvo! Huomaa ero (vaikka S − = S † + )!<br />
Esimerkki 6.3 H = L 2 ([a, b])<br />
Määritellään operaattori X : L 2 → L 2 :<br />
Huomataan:<br />
‖Xf‖ 2 =<br />
∫ b<br />
a<br />
(Xf)(x) = xf(x) (6.4)<br />
∫ b<br />
x 2 |f(x)| 2 ≤ M 2 |f(x)| 2 = M 2 ‖f‖ 2 ,<br />
missä M = max{|a|, |b|}, joten X on rajoitettu. Lisäksi X on myös hermiittinen (Tarkista!). X:n<br />
ominaisfunktio toteuttaisi<br />
xf λ (x) = λf λ (x) m.k. x ∈ [a, b],<br />
joten täytyy olla f λ (x) = 0 m.k. x ∈ [a, b], mutta ¯0 ei käy ominaisvektoriksi. (Toisaalta distribuutio<br />
f λ (x) = δ(x − λ) kävisi, muttei kuulu L 2 :een)<br />
Tarvitaan siis uusi käsite spektri, joka yleistää ominaisarvot ja ottaisi huomioon edellisen esimerkin<br />
kaltaiset tilanteet. Huomataan, että jos λ on A:n ominaisarvo, niin (A − λid H ) −1 ei ole olemassa: Jos<br />
(A − λid H ) −1 olisi olemassa ja Au = λu, niin<br />
u = (A − λid H ) −1 (A − λid H )u = (A − λid H ) −1¯0 = ¯0.<br />
Määritelmä 6.2 λ ∈ C on operaattorin A säännöllinen arvo (engl. regular value) jos (A − λid H ) −1<br />
on olemassa ja rajoitettu.<br />
Määritelmä 6.3 Operaattorin A spektri on joukko<br />
a<br />
∑<br />
(A) = {λ ∈ C : λ ei ole A:n säännöllinen arvo} (6.5)<br />
Ainakin A:n kaikki ominaisarvot kuuluvat spektriin. ominaisarvot = ”pistespektri”, muut spektrin piteet<br />
= ”jatkuva spektri”.
55<br />
Esimerkki 6.4 (jatkoa esimerkkiin 6.3) Tarkastellaan siis L 2 :n operaattoria (Xf)(x) = xf(x).<br />
Jos λ /∈ [a, b] (siis Im(λ) ≠ 0 tai Im(λ) = 0 ja λ < a tai λ > b) niin x − λ ≠ 0 kaikilla x ∈ [a, b] ja<br />
sillä voidaan jakaa:<br />
Lisäksi käänteisoperaattori on rajoitettu:<br />
∥<br />
∥(A − λid L 2) −1 f ∥ ∫ b<br />
2 =<br />
a<br />
((X − λid L 2)f)(x) = (x − λ)f(x)<br />
=⇒ ((X − λid L 2) −1 f)(x) = 1<br />
x − λ f(x)<br />
dx<br />
|x − λ| 2 |f(x)|2 ≤ 1 ∫ b<br />
d 2 dx|f(x)| 2 = 1 d 2 ‖f‖2 ,<br />
missä 0 < d = inf x∈[a,b] |x − λ| = ”λ:n etäisyys janasta [a,b]”. Jokainen λ /∈ [a, b] on siis X:n säännöllinen<br />
arvo. Jos taas λ ∈ [a, b], niin (X − λid L ) −1 ei ole rajoitettu (Osoita!), joten<br />
∑<br />
(A) = {λ : a ≤ λ ≤ b} = [a, b].<br />
a<br />
Lause 6.3 Olkoon A Hilbert avaruuden rajoitettu operaattori. Tällöin<br />
1. λ ∈ ∑ (A) ⇒ |λ| ≤ ‖A‖.<br />
2. A:n säännöllisten arvojen joukko on avoin.<br />
3. ∑ (A) on C:n kompakti osajoukko.<br />
Todistus 6.3 (1) Olkoon λ s.e. |λ| > ‖A‖. Operaattorin A/λ normi on tällöin < 1, joten<br />
(id H − 1 λ A)−1 =<br />
∞∑<br />
( ) A n<br />
λ<br />
on olemassa ja rajoitettu. (A − λid H ) = λ(A/λ − id H ), joten (A − λid H ) −1 = −1/λ(id H − A/λ) −1 on<br />
olemassa ja λ on säännöllinen. Siis jos λ ∈ ∑ (A) on oltava λ ≤ ‖A‖.<br />
(2) Olkoon λ 0 säännöllinen arvo ja λ ∈ C. Muodostetaan<br />
jolle<br />
Tällöin on olemassa ja rajoitettu<br />
n=0<br />
B = id H − (A − λ 0 id H ) −1 (A − λid H )<br />
= (A − λ 0 id H ) −1 [(A − λ 0 id H ) − (A − λid H )]<br />
= (A − λ 0 id H ) −1 (λ − λ 0 )id H ,<br />
‖B‖ = |λ − λ 0 | ∥ ∥(A − λ 0 id H ) −1∥ ∥ < 1<br />
1<br />
kun |λ − λ 0 | <<br />
‖(A − λ 0 id H ) −1 ‖ .<br />
(id H − B) −1 = [(A − λ 0 id H )(A − λid H )] −1<br />
= (A − λid H ) −1 (A − λ 0 id H ),<br />
joten myös λ on säännöllinen. On siis olemassa λ 0 :n ympäristö, jossa kaikki λ:t ovat säännöllisiä,<br />
joten säännöllisten arvojen joukko on avoin.<br />
(3) ∑ (A) on (1)-kohdan nojalla rajoitettu ja (2)-kohdan nojalla suljettu (avoimen joukon komplementtina),<br />
joten se on Heine-Borelin lauseen nojalla kompakti.
56<br />
6.3 Hermiittisen operaattorin spektri<br />
Lause 6.4 Rajoitetun hermiittisen operaattorin spektri on reaalinen.<br />
Todistus 6.4 Olkoon λ = a + ib, b ≠ 0 ja<br />
V = {(A − λid H )u : u ∈ H} . (6.6)<br />
Osoitetaan ensin että V on H:n aliavaruus. V on selvästi vektorialiavaruus, joten riittää osoittaa, että<br />
se on suljettu. Olkoon v n = (A−λid H )u n → v jono V:n vektoreita. On osoitettava, että v ∈ V . Kaikilla<br />
w ∈ H pätee:<br />
joten<br />
‖(A − id H )w‖ 2 = 〈(A − id H )w|(A − id H )w〉<br />
= ‖Aw‖ 2 + |λ| 2 ‖w‖ 2 − λ〈Aw|w〉 − λ ∗ 〈w|Aw〉<br />
= ‖Aw‖ 2 + |λ| 2 ‖w‖ 2 − (λ + λ ∗ )〈w|Aw〉<br />
} {{ }<br />
2a<br />
= ‖Aw‖ 2 + (a 2 + b 2 ) ‖w‖ 2 − a (〈w|Aw〉 + 〈Aw|w〉)<br />
= ‖(A − aid H )w‖ 2 + b 2 ‖w‖ 2<br />
=⇒ ‖w‖ 2 = 1 b 2 (<br />
‖(A − λid H )w‖ 2 − ‖(A − aid H )w‖ 2)<br />
≤ 1 b 2 ‖(A − λid H)w‖ 2<br />
⇐⇒ ‖w‖ ≤ 1<br />
|b| ‖(A − λid H)w‖ , (6.7)<br />
‖u n − u m ‖ ≤ 1<br />
|b| ‖(A − λid H)(u n − u m )‖ = 1<br />
|b| ‖v n − v m ‖ −→ 0,<br />
koska (v n ) on suppeneva (erityisesti Cauhcy) jono. Myös u n on siis Cauchyn jono, joten se on myös<br />
suppeneva (H täydellinen) eli on olemassa lim n u n = u. Mutta A − λid H on jatkuva operaattori, joten<br />
siis v ∈ V .<br />
Olkoon nyt w ∈ V ⊥ eli<br />
(A − λid H )u = lim<br />
n→∞ (A − λid H)u n = lim<br />
n→∞ v n = v<br />
〈(A − λid H )u|w〉 = 〈u|(A − λ ∗ id h )w〉 = 0 ∀ u ∈ H.<br />
Valinnalla u = (A − λ ∗ id H )w seuraa Aw = λ ∗ w. Jos w ≠ ¯0 on siis λ ∗ = a − ib, b ≠ 0 A:n ominaisarvo.<br />
Mutta A † = A ja kaikki ominaisarvot ovat reaalisia, joten w = ¯0 on ainoa mahdollisuus. On siis<br />
V ⊥ = {¯0} eli V = H.<br />
Olemme siis osoittaneet, että jokainen v ∈ H voidaan kirjoittaa v = (A − λid H )u, jollakin u ∈ H.<br />
Tässä u on yksikäsitteinen, sillä jos (A − λid H )u 1 = (A − λid H )u 2 , niin A(u 1 − u 2 ) = λ(u 1 − u 2 ).<br />
Koska λ /∈ R, se ei voi olla ominaisarvo, joten on oltava u 1 − u 2 = ¯0 eli u 1 = u 2 .<br />
Koska yo. u on yksikäsitteinen, voidaan määritellä operaattori B kaavalla Bv = u. Ilmeisesti B(A −<br />
λid H ) = (A − λid H )B = id H , joten B = (A − λid H ) −1 ja todistuksen alkuosan (6.7) mukaan se on<br />
rajoitettu, joten λ on säännöllinen arvo. Pätee siis ∑ (A) ⊂ R.<br />
6.4 Spektraaliesitys<br />
Kvanttimekaniikkaa tunteville on varmaankin avuksi tarkastella ensiksi pienenä alkumotivaationa kvanttimekaanisen<br />
systeemin Hamiltonin operaattoria H. Olkoon systeemillä ominaisenergiat E n , n = 0, . . ..
57<br />
Oletetaan että kaikkien mahdollinen degeneraatioaste on sama, eli kutakin energian ominaisarvoa vastaa<br />
K ominaistilaa |n k 〉:<br />
H|n k 〉 = E n |n k 〉 , k = 1, . . . , K ,<br />
jotka ovat ortogonaaleja,<br />
〈n k |m l 〉 = δ n,m δ k,l .<br />
Energian ominaistilat muodostavat ortonormaalin kannan jossa systeemin tilat |ψ〉 voidaan esittää,<br />
missä kertoimet<br />
|ψ〉 =<br />
∞∑<br />
n=0 k=1<br />
K∑<br />
c nk |n k 〉 ,<br />
c nk = 〈n k |ψ〉 .<br />
Koska tilat |n k 〉 muodostavat ortonormaalin kannan, pätee täydellisyysrelaatio<br />
Voimme nyt kirjoittaa<br />
H = id H id =<br />
Määritelemällä operaattori<br />
∞∑<br />
voidaan siis kirjoittaa H muodossa<br />
K∑<br />
id =<br />
∞∑<br />
n=0 k=1 m=0 l=1<br />
∞∑<br />
n=0 k=1<br />
K∑<br />
|n k 〉〈n k | .<br />
K∑<br />
|n k 〉〈n k |H|m l 〉〈m l | =<br />
P n ≡<br />
H =<br />
K∑<br />
|n k 〉〈n k |<br />
k=1<br />
∞∑<br />
E n P n ,<br />
n=0<br />
∞∑<br />
n=0<br />
E n<br />
K ∑<br />
k=1<br />
|n k 〉〈n k |<br />
tämä on Hamiltonin operaattorin ns. spektraalihajotelma eli spektraaliesitys. On helppo tarkistaa että<br />
P n on projektio-operaattori ominaisarvoa E n vastaavaan (K-ulottaiseen) ominaisavaruuteen, jonka<br />
virittävät tilat {n k }, =˛1 . . . K.<br />
Siirrymme nyt takaisin matematiikkaan ja johdamme spektraaliesityksen yleisemmin hermiittisille ja<br />
täydellisille operaattoreille A. Aiheen täsmällinen esitys on varsin tekninen, joten tyydymme tässä<br />
vain luonnostelemaan teoriaa. Aloitetaan yksinkertaisesta tapauksesta: A : H → H hermiittinen,<br />
täydellinen ja H separoituva. A:n ominaisvektoreista voidaan rakentaa kanta {e nk }<br />
Ae nk = λ n e nk , k = 1, 2, . . . , K n ,<br />
missä K on n:nnen ominaisarvon degeneraatioaste.<br />
ja jokainen u ∈ H voidaan esittää<br />
u =<br />
〈e nk |e ml 〉 = δ nm δ kl (6.8)<br />
∞∑<br />
n=1<br />
(<br />
Kn<br />
)<br />
∑<br />
u nk e nk . (6.9)<br />
k=1<br />
Ominaisarvot λ n ovat diskreettejä, joten ne voidaan järjestää kasvavaan jonoon λ 1 < λ 2 < λ 3 < . . ..<br />
Olkoon P n projektio-operaattori aliavaruuteen, joka vastaa ominaisarvoa λ n (”λ n :n ominaisavaruus”,<br />
vektoreiden e n1 , e n2 , . . ., e nKn virittämä):<br />
P n u = P n<br />
( ∞<br />
∑<br />
n=1<br />
(<br />
Kn<br />
))<br />
∑<br />
∑K n<br />
u nk e nk = u nk e nk . (6.10)<br />
k=1<br />
k=1
58<br />
Helposti nähdään Pn 2 = P n . Operaattorit P n toteuttavat lisäksi P n P m = δ nm P n sekä ∑ n P n = id H .<br />
Lasketaan (formaalisti):<br />
(<br />
)<br />
∞∑<br />
∞∑ ∑K n<br />
( λ n P n )u = λ n u nk e nk (6.11)<br />
Toisaalta<br />
joten<br />
Au = A<br />
( ∞<br />
∑<br />
n=1<br />
(<br />
Kn<br />
n=1<br />
))<br />
∑<br />
u nk e nk =<br />
k=1<br />
∞∑<br />
n=1<br />
A =<br />
n=1<br />
(<br />
Kn<br />
k=1<br />
)<br />
∑<br />
u nk Ae nk =<br />
k=1<br />
(<br />
∞∑<br />
n=1<br />
)<br />
∑<br />
u nk e nk ,<br />
λ n<br />
K n<br />
k=1<br />
∞∑<br />
λ n P n . (6.12)<br />
n=1<br />
Tämä on operaattorin A spektraaliesitys. Kirjoitetaan (6.12) toiseen muotoon. Tätä varten tarvitaan<br />
uusi käsite, Stieltjesin integraali:<br />
∫ b<br />
a<br />
f(x)dg(x) = lim<br />
N→∞<br />
N∑<br />
f(c i ) (g(x i+1 ) − g(x i ))<br />
i=0<br />
= lim<br />
|∆x i |→0<br />
N∑<br />
f(c i ) (g(x i+1 ) − g(x i )) , (6.13)<br />
i=0<br />
missä a = x 0 < x 1 < . . . < x N < x N+1 = b on välin [a, b] jako, c i ∈ [x i , x i+1 ] ja |∆x i | = |x i+1 − x i |.<br />
Jos g on differentioituva, niin<br />
∫ b<br />
a<br />
f(x)dg(x) =<br />
∫ b<br />
Erityisesti valinta g(x) = x antaa Riemannin integraalin<br />
∫ b<br />
a<br />
a<br />
f(x)g ′ (x)dx. (6.14)<br />
f(x)dx. (6.15)<br />
Stieltjesin integraali on hyvin määritelty laajemmalle funktiojoukolle. Esimerkiksi jos<br />
{ 0 , x < 0<br />
g(x) = θ(x) =<br />
1 , x ≥ 0<br />
ja a < 0 < b, niin<br />
∫ b<br />
a<br />
f(x)dθ(x) = f(0).<br />
(Mikä on yhtäpitävää kaavan θ ′ (x) = δ(x) kanssa.) Tulos seuraa siitä että määritelmän (6.13) oikean<br />
puolen summassa ainoa ei-häviävä termi tulee sillä indeksin i arvolla jolla x i+1 > 0 > x i , tällöin<br />
g(x i+1 ) − g(x i ) = 1 − 0, muulloin joko 0 − 0 tai 1 − 1.<br />
Kaikkien operaattorien spektrissä ei ole ollenkaan ominaisarvoja, mutta edellinen tulos voidaan yleistää<br />
käyttämättä eksplisiittisesti ominaisavaruuksien projektio-operaattoreita: Jos g on paloittain vakio<br />
välillä [a, b]:<br />
⎧<br />
g 0 , a < x < y 1<br />
g 1 = g 0 + h 1 , y 1 ≤ x < y 2<br />
⎪⎨<br />
· · ·<br />
g(x) =<br />
,<br />
g i = g i−1 + h i , y i ≤ x < y i+1<br />
· · · ⎪⎩<br />
g p = g p−1 + h p , y p ≥ x ≤ b
59<br />
funktion g(x) arvo hyppää siis p kertaa, aina askeleen h i kohdassa x = y i . Vastaavaan tapaan kuin<br />
askelfunktiolle θ nähdään että<br />
∫ b<br />
p∑<br />
f(x)dg(x) = h i f(y i ) .<br />
a<br />
Operaattorin A ominaisarvot kuuluvat spektriin ∑ (A) (⊂ R), joka on kompakti, joten on ¯λ 0 =<br />
inf ∑ (A) ja ¯λ 0 = sup ∑ (A), joilla ¯λ 0 ≤ λ n ≤ ¯λ M . Määritellään operaattoriarvoinen funktio E A (λ):<br />
i=1<br />
⎧<br />
⎨ ¯0 , λ < λ<br />
∑ 1<br />
E A (λ) = k<br />
⎩ ∑ i=1 P i , λ k ≤ λ < λ k+1 , (6.16)<br />
i P i = id , λ ≥ λ M<br />
missä ¯0 on siis 0-operaattori. E A toteuttaa<br />
E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 )),<br />
koska projektioille P i P j = δ ij P i . Tästä seuraa E A (λ) 2 = E A (λ) eli E A on projektio-operaattori. Määritellään<br />
seuraavaksi operaattoriarvoinen Stieltjesin integraali:<br />
∫ ¯λM<br />
¯λ 0<br />
f(λ)dE A (λ) = lim<br />
N→∞<br />
N∑<br />
f(c i )(E A (λ i+1 ) − E A (λ i ))<br />
i=1<br />
= lim<br />
|∆λ i |→∞<br />
N∑<br />
f(c i )(E A (λ i+1 ) − E A (λ i )), (6.17)<br />
i=1<br />
missä taas λ i : i = 1, . . . , N on välin [¯λ 0 , ¯λ M ] jako, c i ∈ [λ i , λ i+1 ] ja |∆λ i | = |λ i+1 −λ i |. Ilmeisesti pätee:<br />
∫ λ<br />
¯λ 0<br />
dE A (λ) = E A (λ) (6.18)<br />
∫ ¯λM<br />
¯λ 0<br />
λdE A (λ) = A. (6.19)<br />
Tämä esitys yleistyy: Rajoitetun, hermiittisen operaattorin spektraaliesitys:<br />
A =<br />
∫ sup<br />
∑ (A)<br />
inf ∑ (A)<br />
missä E A on operaattoriarvoinen funktio, joka toteuttaa:<br />
E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 ))<br />
lim E A(λ) = ¯0<br />
λ→−∞<br />
∫ sup<br />
∑ (A)<br />
inf ∑ (A)<br />
lim E A(λ) = id<br />
λ→∞<br />
dE A (λ) = id.<br />
λdE A (λ), (6.20)<br />
Esimerkki 6.5 Operaattori X L 2 [a, b]:ssa (kts. esimerkki 6.3).<br />
Määritelllään operaattoriarvoinen funktio E kaavalla<br />
{ f(y) , y ≤ x<br />
(E(x)f)(y) =<br />
0 , y > x . (6.21)
60<br />
Jaetaan osaväli N:ään osaväliin a = x 0 < x 1 < . . . < x N−1 < x N = b. Olkoon y ∈ [a, b] annettu,<br />
jolloin y ∈ [x k−1 , x k ] jollakin k. Nyt<br />
[(<br />
∑ N<br />
) ]<br />
c i (E(x i ) − E(x i−1 ) f (y)<br />
i=1<br />
= 0 + 0 + . . . + c k (f(y) − 0)<br />
+ c k+1 (f(y) − f(y)) + . . . + c N (f(y) − f(y))<br />
= c k f(y) −→ yf(y) = (Xf)(y)<br />
( ∑N<br />
)<br />
eli operaattori<br />
i=1 c i(E(x i ) − E(x i−1 ) lähestyy operaattoria X, toisaalta se myös määrittelee Stieltjesintegraalin<br />
(6.13) jonka integrandissa esiintyy funktio f(x) = x. Kaiken kaikkiaan siis<br />
X =<br />
∫ b<br />
a<br />
xdE(x) . (6.22)<br />
Näin saatiin paikkaoperaattorille X spektraaliesitys, vaikka sillä ei ole lainkaan ominaisarvoja, ainoastaan<br />
jatkuva spektri.<br />
6.5 Rajoittamattomat operaattorit<br />
A on rajoittamaton jos jokaiselle M > 0 löytyy u ∈ H se. ‖Au‖ ≥ M ‖u‖. Kiinnostavat rajoittamattomat<br />
operaattorit A eivät ole määriteltyjä koko H:lla vaan määrittelyjoukossa (engl. domain) D A ⊂ H.<br />
Operaattorin täydellinen määrittely sisältää myös D A :n, merk. (A, D A ). Huom:<br />
(A, D A ) ≠ (A, D ′ A) jos D A ≠ D ′ A.<br />
Vastaavasti R A = A(D A ) = {u ∈ H|u = Av, v ∈ D A } on A:n maalijoukko (engl. range).<br />
D A on H:n tiheä (dense) osajoukko, jos jokaiselle u ∈ H ja jokaiselle ɛ > 0 löytyy v ∈ D A s.e.<br />
‖u − v‖ < ɛ. A on tällöin tiheästi määritelty.<br />
A on operaattorin B laajennus (extension), merkit. B ≤ A jos D B ⊂ D A ja Au = Bu, kun u ∈ D B .<br />
Merkitään myös A| DB = B.<br />
(A, D A ) = (B, D B ) tarkoittaa siis, että D A = D B ja Au = Bu ∀ u ∈ D A .<br />
Huom. Selvästikin<br />
D A+B = D A ∩ D B<br />
D AB = B −1 (R B ∩ D A ),<br />
joten operaattorit eivät yleensä muodosta vektoriavaruutta tai algebraa.<br />
Esimerkki 6.6 H = l 2 , x = (x 1 , x 2 , . . .) ∈ H<br />
Ax = (x 1 , x 2<br />
2 , x 3<br />
3 , . . . , x n<br />
, . . .) (6.23)<br />
n<br />
A on rajoitettu ja hermiittinen, joten voidaan ottaa D A = H = l 2 . Huomataan lisäksi<br />
{<br />
}<br />
∞∑<br />
R A = y ∈ l 2 : n 2 |y n | 2 < ∞ ⊂ l 2 (6.24)<br />
n=1<br />
ja R A on tiheä l 2 :ssa: Olkoon x ∈ l 2 ja ɛ > 0 annettu. Koska x ∈ l 2 löytyy N s.e. ∑ ∞<br />
i=N+1 |x i| 2 < ɛ 2 .<br />
Valitaan y n = x n , kun 0 < n ≤ N ja y n = 0 kun n > N. Nyt y ∈ R A ja ‖x − y‖ ≤ ɛ.<br />
A:lla on käänteisoperaattori, jonka määrittelyjoukko on D A −1 = R A ja (A −1 x) n = nx n . A −1 on<br />
rajoittamaton, sillä:<br />
||A(0, 0, . . . , 0 , 1, 0, . . .)|| = ||n(0, 0, . . . , 0 , 1, 0, . . .)|| = n −→ ∞<br />
}{{}<br />
}{{}<br />
n:s<br />
n:s
61<br />
Esimerkki 6.7 H = L 2 (R) ja X kuten esimerkki 6.3:ssa.<br />
X on rajoittamaton: Olkoon f n (x) = 1, kun x ∈ [n, n + 1), 0 muuten. Tällöin<br />
||f n || = 1, mutta ||Xf|| = n 2 + n + 1 3<br />
−→ ∞.<br />
Laajin mahdollinen määrittelyjoukko on<br />
{ ∫<br />
D X = f ∈ L 2 :<br />
R<br />
}<br />
dx|xf(x)| 2 < ∞ ⊂ L 2 . (6.25)<br />
Huom. esimerkiksi f(x) = 1/(1 + |x|) ∈ L 2 \ D X .<br />
D X on tiheä L 2 :ssa (vrt. edelliseen esimerkkiin l 2 :ssa): Olkoon g ∈ L 2 (R) mielivaltainen. Määritellään<br />
{ g(x) , |x| ≤ n<br />
g n (x) =<br />
0 , |x| > n , (6.26)<br />
jolloin g n ∈ D X ja g n −→ g, joten D X on tiheä. On muitakin L 2 :ssa tiheitä määrittelyjoukkoja, esim.<br />
testifunktioavaruudet<br />
D(R) = {f ∈ C ∞ (R) : ∃ M s.e. |x| > M ⇒ f(x) = 0} (6.27)<br />
{<br />
}<br />
S(R) = f ∈ C ∞ (R) : |x| p f(x) |x|→∞<br />
−→ 0, |x| −→ ∞ ∀p > 0<br />
(6.28)<br />
Ilmeisesti (X, D) ≤ (X, S) ≤ (X, D X ) ja kaikki nämä ovat rajoittamattomia.<br />
Esimerkki 6.8 X = L 2 (R) ja P = −i d<br />
dx , eli (P f)(x) = −if ′ (x).<br />
Laajin määrittelyjoukko ilmeisesti<br />
D P = { f ∈ L 2 : f differentiotuva m.k. ja f ′ ∈ L 2} ⊂ L 2 (6.29)<br />
Esim f(x) = 4√ xe −x2 /∈ D P , sillä f ′ /∈ L 2 . Se, että f ′ (0) ei ole olemassa ei haittaa. Toisaalta voimme<br />
myös ottaa määrittelyjoukoksi S:n tai D:n jolloin (P, D) ≤ (P, S) ≤ (P, P D ).<br />
6.6 Adjungoitu operaattori<br />
Apulause 6.1 Olkoon V tiheä H:ssa. Jos 〈u|v〉 = 0 kaikille v ∈ V ,niin u = ¯0.<br />
Todistus 6.5 Olk. w ∈ H, ɛ > 0. V tiheä, joten on olemassa v ∈ V s.e. ||v − w|| < ɛ. Nyt<br />
〈u|w〉 = 〈u|w − v〉 ≤ ||u||||w − v|| < ɛ||u||.<br />
ɛ > 0 mielivaltainen, joten 〈u|w〉 = 0. w ∈ H mielivaltainen, joten u = ¯0.<br />
Olkoon (A, D A ) tiheästi määritelty operaattori H:ssa. Määrittelemme joukon D A †<br />
seuraavasti:<br />
Jos u † on olemassa, se on yksikäsitteinen:<br />
u ∈ D A † ⇐⇒ ∃ u † s.e. 〈u † |v〉 = 〈u|Av〉 ∀ v ∈ D A .<br />
〈u † 1 |v〉 = 〈u† 2 ∀ v ∈ D A =⇒ 〈u † 1 − u† 2 |v〉 = 0 ∀ v ∈ D A =⇒ 〈u † 1 − u† 2 = ¯0<br />
edellisen apulauseen nojalla.<br />
Vektoreille u ∈ D A † määrittelemme<br />
(A † , D A †) on (A, D A ):n adjungoitu operaattori.<br />
Huom. Jos A on rajoitettu ja D A = H, niin määritelmä yhtyy aiempaan.<br />
Huom. (A † , D A †) voidaan määritellä vain jos D A on tiheä.<br />
Huom. (A † , D A †) riippuu myös D A :sta!<br />
A † u = u † . (6.30)
62<br />
Määritelmä 6.4 Operaattori on suljettu (engl. closed) jos jokaiselle jonolle (u n ) ⊂ D A s.e. u n → u<br />
ja Au n → v pätee u ∈ D A ja v = Au.<br />
Määritelmästä seuraa suoraan, että jokainen jatkuva operaattori on myös suljettu, mutta suljettu<br />
operaattori ei välttämättä ole jatkuva.<br />
Lause 6.5 Jos (A, D A ) on tiheästi määritelty, niin (A † , D A †) on suljettu<br />
Todistus 6.6 Olkoon y n ∈ D A †<br />
jono s.e. y n → y ja A † y n → z. Tällöin kaikille x ∈ D A<br />
〈y|Ax〉 = lim 〈y|Ax〉 = lim<br />
n→∞ n→∞ 〈A† y n |x〉 = 〈z|x〉,<br />
joten y ∈ D A † ja z = A † y.<br />
Esimerkki 6.9 H = l 2 , x = (x 0 , x 1 , x 2 , . . .) ∈ l 2 . Kanta {ē i : i ≥ 0}, (ē i ) j = δ ij .<br />
Määritellään operaattori a:<br />
eli<br />
Voimme valita<br />
ax =<br />
∞∑<br />
x i aē i =<br />
i=0<br />
aē n = √ nē n−1 , n ≥ 1 (6.31)<br />
aē 0 = ¯0, (6.32)<br />
∞∑ √<br />
i + 1x+1 ē i = (x 1 , √ 2x 2 , √ 3x 3 , . . . , √ nx n , . . .).<br />
i=0<br />
D a =<br />
{<br />
x :<br />
}<br />
∞∑<br />
n|x n | 2 < ∞ , (6.33)<br />
n=1<br />
joka on tiheä l 2 :ssa (todistus kuten esimerkissä 6.6). R a = l 2 , koska jos y ∈ l 2 , niin y = ax, missä<br />
x n = √ yn<br />
n<br />
, n ≥ 1 (x 0 mieliv.).<br />
On siis operaattori (a, D a ), missä D a kuten (6.33):ssa, mikä on (a † , D a †)?<br />
Etsitään y † s.e.<br />
∞∑<br />
(y † ) ∗ nax n = 〈y † |x〉 = 〈y|ax〉 =<br />
n=0<br />
Kandidaatti: y † 0 = 0 ja y† n = √ ny n−1 muuten, jolle<br />
||y † || =<br />
∞∑<br />
yn(ax) ∗ n =<br />
n=0<br />
∞∑<br />
yn√ ∗ n + 1xn+1 .<br />
n=0<br />
†∑<br />
(n + 1)|y n | 2 . (6.34)<br />
n=0<br />
Jos ||y † || < ∞, niin |〈y † |x〉 ≤ ∥ ∥y †∥ ∥ ‖x‖ < ∞, joten<br />
{<br />
} {<br />
∞∑<br />
D a † = x : (n + 1)|x n | 2 < ∞ = x :<br />
n=1<br />
sekä (a † y) n = y † n = √ ny n−1 eli a † ē n = √ n + 1ē n+1 ts.<br />
}<br />
∞∑<br />
n|x n | 2 < ∞ = D a<br />
n=1<br />
a † y = (0, y 0 , √ 2y 1 , √ 3y 2 , . . . , √ n + 1y n , . . .). (6.35)<br />
Sekä a että a † suljettuja, mutta R a † = {x ∈ l 2 : x 0 = 0} ≠ R a . Tarkastellaan vielä tuloja a † a ja aa † :<br />
a † ax = a † (x 1 , √ 2x 2 , √ 3x 3 , . . .) = (0, x 1 , 2x 2 , 3x 3 , . . .) (6.36)<br />
aa † x = a(0, x 0 , √ 2x 1 , √ 3x 2 , . . .) = (x 0 , 2x 1 , 3x 2 , . . .). (6.37)
63<br />
Lisäksi<br />
D a † a = {x ∈ l 2 : ∑ n<br />
D aa † = {x ∈ l 2 : ∑ n<br />
n 2 |x n | 2 < ∞} (6.38)<br />
n 2 |x n | 2 < ∞} = D a † a (6.39)<br />
Vähentämällä (6.36) ja (6.37) toisistaan saadaan:<br />
[a, a † ]x := (aa † − a † a)x = x,<br />
joten<br />
[a, a † ] = (id l 2, D a † a) = (id l 2, l 2 ) = id l 2.<br />
Helposti nähdään että jos (A, D A ) ja (B, D B ) ovat tiheästi määriteltyjä ja A ≤ B, niin B † ≤ A † :<br />
Otetaan u ∈ D A ja v ∈ D B †:<br />
〈v|Au〉 }{{} = 〈v|Bu〉 = 〈B † v|u〉,<br />
A≤B<br />
eli v ∈ D a † ja A † v = B † v, kun v ∈ D B †, joten D B † ⊂ D A † ja B † ≤ A † .<br />
Määritelmä 6.5 Olkoon D A tiheä H:ssa.<br />
• A on itseadjungoitu (engl. self-adjoint), jos (A, D A ) = (A † , D A †. (Huom. D A = D A †)<br />
• A on symmetrinen jos A ≤ A † .<br />
Lisäksi kertaus: A on hermiittinen jos A on rajoitettu, A † = A ja D a †<br />
Hilbertin avaruudessa<br />
= D A = H. Eli annetussa<br />
{A : A hermiittinen} ⊂ {A : A itseadj.} ⊂ {A : A symmetrinen}.<br />
Seuraava lause karakterisoi symmetriset operaattorit toisella tavalla.<br />
Lause 6.6 A symmetrinen ⇐⇒ 〈u|Av〉 = 〈Au|v〉 ∀ u, v ∈ D A<br />
Todistus 6.7 ”⇒”. u, v ∈ D A :<br />
〈u|Av〉 }{{} = 〈A † u|v〉 }{{} = 〈Au|v〉.<br />
D A =D A † A≤A †<br />
”⇐”. Koska 〈u|Av〉 = 〈Au|v〉 ∀ u, v ∈ D A ja D A on tiheä, on oltava Au = A † u ∀ u ∈ H. Toisaalta<br />
〈u|Av〉 = 〈A † u|v〉, joten u ∈ D A † ja A ≤ A † .<br />
Esimerkki 6.10 H = L 2 (R), Tarkastellaa operaattoria (X, D(R)), missä X on kuten esimerkki 6.3:ssa<br />
ja D(R) on määritelty yhtälöllä (6.27). Kun ϕ, ψ ∈ D(R), pätee<br />
∫<br />
〈ϕ|Xψ〉 =<br />
R<br />
dxϕ ∗ (x)xψ(x) =<br />
∫ <br />
dx(xϕ(x)) ∗ ψ(x) = 〈Xϕ|ψ〉,<br />
joten (X, D) on symmetrinen. X ei kuitenkaan ole itseadjungoitu: löytyy funktioita f /∈ D, joille on<br />
olemassa f † s.e. 〈f|Xg〉 = 〈f † |g〉 ∀ g ∈ D, esim.<br />
{ 1 , |x| ≤ 1<br />
f(x) =<br />
0 , |x| > 1 ,
64<br />
jolloin<br />
f † (x) =<br />
{ x , |x| ≤ 1<br />
0 , |x| > 1 .<br />
Samalla tavalla osoitetaan, ettei myöskään (X, S(R)) ole itseadjungoitu. Mutta onko (X, D X )? Palautetaan<br />
mieliin että<br />
{ ∫<br />
}<br />
D X = f ∈ L 2 : dx|xf(x)| 2 < ∞ , (6.40)<br />
R<br />
joka on L 2 :n tiheä osajoukko. Kuten yllä (X, D X ) on symmetrinen, joten D X ⊂ D X †. Jotta D X = D X †<br />
ja X olisi itseadjungoitu, riittää osoittaa inkluusio toiseen suuntaan.<br />
{<br />
D X † = f ∈ L 2 : ∃ f † s.e. 〈f|Xg〉 = 〈f † |g〉 ∀ g ∈ L 2} (6.41)<br />
Olkoon g ∈ D X †. Jos ∀ f ∈ D X pätee<br />
niin<br />
∫<br />
R<br />
〈g|Xf〉 = 〈g † |f〉,<br />
dx(xg ∗ (x) − g † (x))f(x) = 0, (6.42)<br />
eli apulauseen 6.1 nojalla g † (x) = xg ∗ (x) m.k. x ∈ R. g † ∈ L 2 =⇒ Xg(x) ∈ L 2 eli g ∈ D X †. Pätee siis<br />
D X † ⊂ D X , joten (X, D X ) on itseadjungoitu.<br />
6.7 Käänteisoperaattorin yleistys<br />
Olkoon A : D A → R A .<br />
Määritellään operaattorin A ydin (engl. kernel)<br />
Ker(A) = {u ∈ D A : Au = ¯0}. (6.43)<br />
¯0 ∈ Ker(A) aina, mutta jos tämä on ainoa mahdollisuus, eli jos Ker(A) = {¯0}, niin voimme määritellä<br />
operaattorin (A −1 , R A ) asettmalla<br />
A −1 u = v ⇐⇒ Av = u, (6.44)<br />
eli A −1 : R A → D A . Tämä on hyvin määritelty:<br />
Av 1 = Av 2 = u<br />
=⇒A(v 1 − v 2 ) = ¯0<br />
=⇒v 1 − v 2 ∈ Ker(A) = ¯0<br />
=⇒v 1 = v 2<br />
6.8 Itseadjungoidun operaattorin spetkristä<br />
(A, D A ) Itseadjungoitu ⇒ ominaisarvot (jos niitä on) ovat reaalisia ja erisuuria ominaisarvoja vastaavat<br />
ominaisvektorit ovat ortogonaalisia (tod. kuten hermiittisille operaattoreille). Jokaiselle λ ∈ C<br />
määritellään resolventtijoukko<br />
∆ λ = R A−λid . (6.45)<br />
Jos λ ei ole ominaisarvo ((A − λid) −1 , R A−λid ) on olemassa (u ∈ Ker(A − λid) =⇒ Au = λu, mutta<br />
λ ei ole ominaisarvo, joten u = ¯0 ja Ker(A) = {¯0}) ja D (A−λid) −1 = R A−λid = ∆ λ .<br />
λ ∈ C on säännöllinen arvo jos ∆ λ = H.<br />
C \ {säännölliset arvot} = ∑ (A) = A:n spektri.<br />
Lause 6.7 λ ∈ C on itseadjungoidun operaattorin ominaisarvo jos ja vain jos ∆ λ ei ole tiheä H:ssa.
65<br />
Todistus 6.8 1) Jos Au = λu, ¯0 ≠ u ∈ D A , λ ∈ R pätee<br />
0 = 〈(A − λid)u|v〉) = 〈u| (A − λid)v〉 ∀ v ∈ D<br />
} {{ }<br />
A<br />
=:w∈∆ λ<br />
eli 〈u|w〉 = 0 ∀ u ∈ ∆ λ . jos ∆ λ olisi tiheä, tästä seuraisi u = ¯0, mikä on ristiriita eli ∆ λ ei ole tiheä<br />
(H:ssa).<br />
2) Ol. ∆ λ ei ole tiheä. ∆ λ ( sulkeuma ) on H:n aliavaruus ja ∆ λ<br />
⊥<br />
≠ {¯0}. On siis olemassa ¯0 ≠ u s.e.<br />
D A on tiheä, joten (A − λid)u = ¯0 eli Au = λu.<br />
〈u|(A − λid)v〉 = 0 ∀ v ∈ D A<br />
t.s. 〈(A − λid)u|v〉 = 0 ∀ v ∈ D A .<br />
Spektraaliesityslause. Olkoon (A, D A ) itseadjungoitu. On olemassa operaattoriarvoinen funktio E A (λ) (λ ∈<br />
R) s.e.<br />
E A (−∞) = 0<br />
E A (∞) = id<br />
E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 ))<br />
∫<br />
λdE A (λ) = A<br />
∫<br />
R<br />
λd〈u|E A (λ)v〉 = 〈u|Av〉 ∀ u, v ∈ D A .<br />
R<br />
Todistus vaikea (sivuutetaan tässä). Spektraaliesitys mahdollistaa operaattorifunktioide määritelmän<br />
∫<br />
f(A) = f(λ)dE A (λ). (6.46)<br />
6.9 Yhteys kvanttimekaniikkaan<br />
6.10 Paikkaoperaattori<br />
( ˆX, D ˆX)<br />
D ˆX<br />
=<br />
( ˆX, D ˆX<br />
itseadjungoitu. Spektraaliesitys:<br />
Määr. operaattorit Êx, x ∈ R<br />
eli<br />
R<br />
( ˆXΨ)(x) = xΨ(x) Ψ ∈ L 2 (R) (6.47)<br />
{ ∫<br />
}<br />
ϕ ∈ L 2 : dx|xϕ(x)| 2 < ∞<br />
R<br />
(ÊxΨ)(y) =<br />
(ÊxΨ)(y) =<br />
{ Ψ(y) , y ≤ x<br />
0 , y > x<br />
∫ z<br />
−∞<br />
Huomaa, että Êx on projektio-operaattori aliavaruudelle<br />
dzΨ(z)δ(y − z).<br />
(6.48)<br />
(6.49)<br />
V x = {Ψ ∈ L 2 : Ψ(y) = 0, x < y} (6.50)<br />
ja lisäksi Ê −∞ = 0 ja E ∞ = id.{Êx} toteuttaa spektraaliesityslauseen ehdot: Olkoon x ′ ≤ x, jolloin<br />
{ { Ψ(y) , y ≤ x<br />
(ÊxÊx ′)(y) = E ′ Ψ(y) , y ≤ x<br />
′<br />
x(<br />
0 , y > x ′ ) =<br />
0 , y > x ′
66<br />
ja<br />
{ { Ψ(y) , y ≤ x Ψ(y) , y ≤ x<br />
(Êx ′Ê x )(y) = E x (<br />
0 , y > x ) = ′<br />
0 , y > x ′ ,<br />
eli E x ′E x = E x E x ′ = E x ′′, missä x ′′ = min(x, x ′ ).<br />
Väitämme nyt, että<br />
∫<br />
ˆX =<br />
tarkoittaen<br />
kaikille ϕ, Ψ ∈ L 2 . Tosiaan:<br />
∫<br />
〈ϕ|ÊxΨ〉 =<br />
f differentioituva ja<br />
R<br />
R<br />
∫<br />
〈ϕ| ˆXΨ〉 =<br />
R<br />
dyϕ ∗ (y)(Êx)(y) =<br />
xdÊx, (6.51)<br />
xd〈ϕ|ÊxΨ〉 (6.52)<br />
∫ x<br />
−∞<br />
dxϕ ∗ (y)Ψ(y) =: f(x)<br />
f ′ (x) = df<br />
dx (x) = ϕ∗ (x)Ψ(x)<br />
∫<br />
∫<br />
=⇒ xd〈ϕ|ÊxΨ〉 = xdf(x)<br />
R<br />
∫R<br />
= ϕ ∗ (x)xΨ(x)dx<br />
∫R<br />
= dxϕ ∗ (x)( ˆXΨ)(x)<br />
R<br />
= 〈ϕ| ˆXΨ〉.<br />
Toimii!<br />
Spektraaliesityksen avulla voidaan määritellä operaattori (F ( ˆX), D F ( ˆX)<br />
)<br />
jolle<br />
laajimmillaan.<br />
D F ( ˆX)<br />
=<br />
6.11 Diracin merkintätapa<br />
∫<br />
F ( ˆX) =<br />
R<br />
F (x)dÊx, (6.53)<br />
{ ∫<br />
}<br />
Ψ ∈ L 2 : dx|F (x)Ψ(x)| 2 < ∞<br />
R<br />
Vektori H:ssa: |u〉 ”ket” ja vektori H ∗ :ssä (H:n duaaliavaruudessa): 〈v| ”bra”. Rieszin esityslauseesta:<br />
v(u) =<br />
(6.54)<br />
〈v|u〉<br />
} {{ }<br />
. (6.55)<br />
skalaaritulo<br />
Olkoon H separoituva ja {|e i 〉} o.n. kanta: 〈e i |e j 〉 = δ ij . u:n esitys tässä kannassa on<br />
joten<br />
∞∑<br />
|u〉 = |e 1 〉〈e 1 |u〉 = id H |u〉 (6.56)<br />
n=1<br />
∞∑<br />
id H = |e 1 〉〈e 1 | (6.57)<br />
n=1
67<br />
”täydellisyysrelaatio”. Â operaattori<br />
missä<br />
Â|e i 〉 =<br />
Voidaan siis kirjoittaa operaattorin matrisiiesitys<br />
∞∑<br />
|e j 〉a ji ,<br />
j=1<br />
a ji = 〈e j |Âe i〉 =: 〈e j |Â|e i〉.<br />
 =<br />
∞∑<br />
|e j 〉a ji 〈e i |. (6.58)<br />
i,j=1<br />
Laajennetaan H sisältämää ”vektoreita” |x〉, x ∈ R, jotka toteuttavat<br />
Ψ ∈ L ( R), merkitään<br />
Tällöin voimme kirjoittaa<br />
koska<br />
(ÊxΨ)(y) = 〈y|ÊxΨ〉 =<br />
〈x|y〉 = δ(x − y). (6.59)<br />
Ψ(x) = 〈x|y〉.<br />
Ê x =<br />
∫ x<br />
−∞<br />
∫ x<br />
−∞<br />
dz|z〉〈z| (6.60)<br />
dz 〈y|z〉 〈z|Ψ〉 =<br />
} {{ } } {{ }<br />
δ(y−z) Ψ(z)<br />
∫ x<br />
−∞<br />
dzδ(y − z)Ψ(z).<br />
Huom. E ∞ = id = ∫ R dx|x〉〈x| ”täydellisyysrelaatio”. Nyt dÊx = |x〉〈x| ja spektraaliesitys<br />
Tarkistus<br />
6.12 Impulssioperaattori<br />
( ˆP , D ˆP<br />
), = 1,<br />
∫<br />
ˆX =<br />
R<br />
∫<br />
dxx|x〉〈x| =<br />
∫<br />
( ˆXΨ)(y) = 〈y| ˆX|Ψ〉) dx 〈y|x〉 x 〈x|Ψ〉 = yΨ(y).<br />
R } {{ } } {{ }<br />
δ(y−x) Ψ(x)<br />
Dˆp =<br />
R<br />
dx|x〉x〈x|. (6.61)<br />
( ˆP Ψ)(x) = −i dΨ<br />
dx , (6.62)<br />
{<br />
∫ ∞<br />
}<br />
Ψ ∈ L 2 (R) : dx|Ψ ′ (x)| 2 < ∞ . (6.63)<br />
−∞<br />
ˆp itseadjungoitu. ˆp:n spektraaliesitys rakennetaan yksinkertaisimmin Fourier’n muunnoksen avulla:<br />
Määritellään operaattori ˆF : L 2 (R) → R,<br />
( ˆFΨ)(k) = √ 1 ∫<br />
dxe −ikx Ψ(x) =: ˆΨ(k). (6.64)<br />
2π<br />
R<br />
ˆFΨ todellakin kuuluu L 2 (R):ään, kun Ψ on L 2 (R):n alkio. Todistus epätriviaali, mutta löytyy useista<br />
L p -avaruuksia käsittelevistä kirjoista. Fourier muunnokselle pätee Plancherelin kaava<br />
〈ϕ|Ψ〉 = 〈 ˆFϕ| ˆFΨ〉, (6.65)
68<br />
eli ˆF on isometrinen. Lisäksi ˆF:llä on käänteisoperaattori<br />
∫<br />
( ˆF −1 1<br />
ˆΨ)(x) = √ dke ikx ˆΨ(k) = Ψ(x). (6.66)<br />
2π<br />
Nämä yhdistämällä seuraa, että ˆF on jopa unitaarinen. Honkonen, Lause 6.4:<br />
eli<br />
(<br />
R<br />
dΨ ˆF(−i ))(k) = k ˆΨ(k)<br />
dx<br />
( ˆF ˆP Ψ)(k) = k ˆΨ(k) = ( ˆX ˆΨ)(k) = ˆX ˆFΨ(k) (6.67)<br />
operoimalla tähän ˆF −1 :llä ja huomaamalla, että Ψ ∈ L 2 on mielivaltainen, saadaan ˆP :n esitys:<br />
ˆP = ˆF −1 ˆX ˆF. (6.68)<br />
Lisäksi ˆX:n spektraaliesityksestä saadaan vastaava myös ˆP :lle:<br />
∫<br />
ˆP = kd( ˆF −1 ˆX ˆF). (6.69)<br />
Lisäki<br />
Konsinstenssi vaatii siis<br />
∫<br />
1<br />
√<br />
2π<br />
R<br />
R<br />
∫<br />
dxe −ikx Ψ(x) = ˆΨ(k) = 〈k|Ψ〉 =<br />
R<br />
dx〈k|x〉Ψ(x).<br />
〈k|x〉 = 1 √<br />
2π<br />
e −ikx (6.70)<br />
eli<br />
ϕ k (x) = 〈x|k〉 = 1 √<br />
2π<br />
e ikx (6.71)<br />
”impulssioperaattorin ominaisfunktio” (/∈ L 2 (R)).<br />
Tarkistetaan vielä:<br />
∫<br />
〈ϕ| ˆP |Ψ〉 = kd〈ϕ| ˆF −1 Ê k ˆF|Ψ〉. (6.72)<br />
Nyt (, koska ˆF † = ˆF −1 )<br />
joten<br />
〈ϕ| ˆF −1 Ê k ˆF|Ψ〉 = 〈 ˆFϕ| Ê k | ˆFΨ〉 =<br />
∫<br />
〈ϕ| ˆP |Ψ〉 =<br />
R<br />
R<br />
∫<br />
dk ˆϕ(k) ∗ k ˆΨ(k) =<br />
R<br />
∫ k<br />
−∞<br />
dk ′ ˆϕ(k ′ ) ∗ ˆΨ(k ′ ),<br />
dxϕ(x) ∗ (<br />
−i dΨ<br />
dx (x) )<br />
,<br />
missä viimeineinen yhtäsuuruus seuraa Plancherelin kaavasta.<br />
Diracin merkintätavassa otetaan käyttöön ”vektoreita” |k〉 s.e. 〈k|k ′ 〉 = δ(k − k ′ ) ja<br />
ˆΨ(k) = 〈k|Ψ〉 = √ 1 ∫<br />
dxe −ikx Ψ(x),<br />
2π<br />
sekä<br />
∫<br />
|Ψ〉 = id|Ψ〉 =<br />
R<br />
R<br />
∫<br />
dx|x〉〈x|Ψ〉 =<br />
R<br />
dx|x〉Ψ(x).
69<br />
Tässä notaatiossa<br />
〈ϕ| ˆF −1 Ê k ˆF|Ψ〉<br />
= 〈 ˆFϕ|Êk| ˆFΨ〉<br />
∫<br />
= dk ′ ˆϕ(k ′ ) ∗ Ê k ˆΨ(k ′ )<br />
=<br />
=<br />
R<br />
∫ k<br />
−∞<br />
∫ k<br />
−∞<br />
dk ′ ˆϕ(k ′ ) ∗ ˆΨ(k ′ )<br />
dk ′ 〈ϕ|k ′ 〉〈k ′ |Ψ〉<br />
eli<br />
Tarkistus:<br />
Toimii!<br />
∫<br />
〈x ′ |x〉 =<br />
R<br />
ˆF −1 Ê k ˆF =<br />
∫ k<br />
ˆF −1 Ê ∞ ˆF =<br />
∫<br />
R<br />
−∞<br />
dk ′ |k ′ 〉〈k ′ | (6.73)<br />
dk ′ |k ′ 〉〈k ′ | = id. (6.74)<br />
dk〈x|k〉〈k|x ′ 〉 = 1 ∫<br />
dke ik(x−x′) = δ(x − x ′ )<br />
2π R