02.11.2014 Views

Fymm IIb luentojen betaversio

Fymm IIb luentojen betaversio

Fymm IIb luentojen betaversio

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

1<br />

Fysiikan matemaattiset menetelmät<br />

Luentomuistiinpanot 2013<br />

19. huhtikuuta 2013


2<br />

Sisältö<br />

1 Johdanto 3<br />

2 Variaatiolaskenta 3<br />

2.1 Kertausta: Funktion ääriarvot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

2.2 Funktionaalit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2.3 Eulerin yhtälö . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7<br />

2.3.1 Yleistys monen funktion funktionaaliin . . . . . . . . . . . . . . . . . . . . . . . 8<br />

2.3.2 Yleistys monen muuttujan funktioihin . . . . . . . . . . . . . . . . . . . . . . . 9<br />

2.4 Sidottu (Ehdollinen) variaatioprobleema . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.5 Isoperimetrinen ongelma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11<br />

2.6 Toinen variaatio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

2.7 Funktionaaliderivaatta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.8 Ritzin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

3 Sturm-Liouville-Teoria 17<br />

3.1 Perusominaisuudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.1.1 Erikoisfunktiot ja Sturm-Liouville yhtälöt . . . . . . . . . . . . . . . . . . . . . 18<br />

3.1.2 Yksinkertainen esimerkki S-L ongelmasta . . . . . . . . . . . . . . . . . . . . . 19<br />

3.2 Itseadjungoidut operaattorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20<br />

3.3 Sturmin ja Liouvillen lause . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

3.4 S-L operaattorin Greenin funktio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.5 Sturm-Liouville -ongelma variaatio-ongelmana . . . . . . . . . . . . . . . . . . . . . . . 29<br />

3.6 Rayleighin ja Ritzin menetelmä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30<br />

3.6.1 Esimerkki: Patarummun säveltaajuus . . . . . . . . . . . . . . . . . . . . . . . . 31<br />

4 Hilbertavaruuksista 32<br />

4.1 Vektori-, normi- ja sisätuloavaruudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

4.2 Gram-Schmidt ja projektio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

4.3 Hilbert avaruudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39<br />

4.4 Aliavaruudet ja separoituvuus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42<br />

4.5 Hilbertin avaruuden jatkuvat funktionaalit . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

5 Operaattorit 46<br />

5.1 Perusominaisuudet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46<br />

5.2 Adjungoitu operaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

5.3 Hermiittiset ja unitaariset operaattorit, projektio . . . . . . . . . . . . . . . . . . . . . 50<br />

6 Spektraaliteoriaa 52<br />

6.1 Ominaisvektorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52<br />

6.2 Rajoitetun operaattorin spektri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

6.3 Hermiittisen operaattorin spektri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.4 Spektraaliesitys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56<br />

6.5 Rajoittamattomat operaattorit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60<br />

6.6 Adjungoitu operaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61<br />

6.7 Käänteisoperaattorin yleistys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

6.8 Itseadjungoidun operaattorin spetkristä . . . . . . . . . . . . . . . . . . . . . . . . . . 64<br />

6.9 Yhteys kvanttimekaniikkaan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />

6.10 Paikkaoperaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65<br />

6.11 Diracin merkintätapa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66<br />

6.12 Impulssioperaattori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67


3<br />

1 Johdanto<br />

FyMM <strong>IIb</strong>:n sisältö jakaantuu kolmeen pääaiheeseen. Kurssi jatkaa siitä mihin FyMM IIa päättyi,<br />

eli syventää erikoisfunktioiden takana olevaa teoriaa. Aluksi tosin tehdään poikkeama variaatiolaskentaan.<br />

Variaatiolaskenta on erittäin hyödyllinen matematiikan ala. Monet käytännön ongelmat voidaan<br />

ratkaista sen avulla. Fyysikon näkökulmasta erityisen tärkeää on klassisen mekaniikan modernimpi<br />

Lagrangen esitys, joka perustuu siihen että tarkasteltavan systeemin dynamiikka kiteytetään vaikutusintegraaliin<br />

S = ∫ dtL(q, ˙q, t), missä q(t) kuvaa systeemin vapausasteita. Liikeyhtälöt johdetaan sen<br />

jälkeen variaatiolaskennan kautta etsimällä vaikutusintegraalin minimi, eli soveltamalla Mapertuisin<br />

periaatetta<br />

δS = 0 . (1.1)<br />

Tarkasteltava systeemi voi olla mikä tahansa: tasolla vierivä sylinteri, sähkömagneettinen kenttä lähteineen,<br />

painovoimakenttä Einsteinin yleisessä suhteellisuusteoriassa, hiukkasfysiikan Standardimalli,<br />

säieteoria. Useimmat fysiikan teoriat rakennetaan lähtien liikkeelle Mapertuisin periaatteesta, niinpä<br />

(1.1) on – vain osittain leikillisesti sanoen – Kaiken Teoria (TOE) (kunhan vain aktio S on tunnetaan).<br />

Variaatiolaskennan jälkeen siirrytään Sturm-Liouville ongelman analysointiin. Lähes kaikki toisen asteen<br />

differentiaaliyhtälöt voidaan kirjoittaa ns. Sturm-Liouville -muodossa. Yhtälöiden ohella tärkeitä<br />

ovat myös reunaehdot. Jos ne ovat tiettyä tyyppiä, kyseessä on Sturm-Liouville -ongelma, jonka ratkaisut<br />

muodostavat ortogonaalisen kannan reunaehdot toteuttavien funktioiden avaruudessa. FyMM<br />

IIa:lla erikoisfunktioille hieman yllättäen löydetyt samankaltaiset ominaisuudet heijastavat tätä yleisempää<br />

teoriaa.<br />

Kurssin viimeinen teema – Hilbert-avaruudet, operaattorit ja spektraaliteoria – suuntaa sovelluksiin<br />

kvanttifysiikassa. Kvanttimekaniikassa kutakin havaittavaa suuretta vastaa Hermiittinen operaattori.<br />

Aaltofunktioiden avaruudessa ne palautuvat yleisesti differentiaalioperaattoreiksi. Niiden ominaisarvot<br />

vastaavat mahdollisia mittaustuloksia ja muodostavat ns. spektrin. Aaltofunktioiden avaruudella taas<br />

on ominaisuuksia (esim. sisätulo ja siihen pohjautuva normi, joilla muotoillaan kvanttimekaniikan<br />

todennäköisyystulkinta) joiden perusteella se on erityinen vektoriavaruus, ns. Hilbert-avaruus. Nämä<br />

käsitteet esitellään kurssin viimeisessä osassa.<br />

2 Variaatiolaskenta<br />

2.1 Kertausta: Funktion ääriarvot<br />

Määritelmä 2.1 Olkoon f(x 1 , x 2 , .., x n ) ∈ C 2 (Ω), Ω ⊂ R n ja x 0 = (x 0 1 , x0 2 , ..., x0 n) ∈ Ω. Sanomme,<br />

että f(x 0 ) on lokaali maksimi (minimi), jos on olemassa avoin ympäristö U x 0 s.e. f(x) ≤ f(x 0 )<br />

(f(x) ≥ f(x 0 )) kaikilla x ∈ U x 0 \ {x 0 }.<br />

Yleisesti maksimeja ja minimejä kutsutaan ääriarvoiksi ja pisteitä, joissa ne saavutetaan ääriarvokohdiksi<br />

tai ääriarvopisteiksi. Välttämätön ehto lokaalille ääriarvolle saadaan funktion Taylor-kehitelmästä<br />

pisteen ympäristössä:<br />

f(x 0 + h) = f(x 0 ) +<br />

n∑<br />

i=1<br />

∂f<br />

x i<br />

∣ ∣∣∣x<br />

0h i + 1 2<br />

n∑<br />

i,j=1<br />

Olkoon f(x 0 ) lokaali maksimi, h = (0, .., 0, h i , 0, .., 0) ja oletetaan ∂f<br />

∂x i<br />

∂ 2 ∣<br />

f ∣∣∣x<br />

h i h j + . . . (2.1)<br />

∂x i ∂x j 0<br />

> 0 ( < 0). Tällöin<br />

f(x 0 + h) ≈ f(x 0 ) + ∂f ∣ ∣∣∣x<br />

· h i > f(x 0 ), kun h i > 0 ( < 0),<br />

∂x i 0


4<br />

eli f(x 0 ) ei olekaan maksimi, mikä on ristiriidassa oletuksen kanssa. Vastaavasti päätellään minimin<br />

tapauksessa, että täytyy siis olla:<br />

( ) ∂f<br />

f(x 0 ) ääriarvo =⇒<br />

= 0 kaikilla i = 1, . . . , n. (2.2)<br />

∂x i x=x 0<br />

Pisteitä, joissa kaikki osittaisderivaatat häviävät kutsutaan stationaarisiksi pisteiksi tai kriittisiksi pisteiksi,<br />

mutta ne eivät välttämättä ole ääriarvokohtia vaan pisteen laatu on selvitettävä toisista osittasiderivaatoista.<br />

Suoraviivainen tapa selvittää pisteen laatu on neliömuotojen<br />

A(h) =<br />

n∑<br />

A ij h i h j<br />

i,j=1<br />

tutkiminen. Jos A(h) ≠ 0, kun h ≠ ¯0, niin neliömuoto on definiitti, muuten sitä kutsutaan indefiniitiksi<br />

(Huom. A(¯0) = 0 kaikilla neliömuodoilla). Seuraavan lauseen todistus ohitetaan.<br />

Lause 2.1 Stationaarinen piste x 0 on maksimi (minimi), jos<br />

D(h) :=<br />

n∑<br />

i,j=1<br />

∂ 2 ∣<br />

f ∣∣∣x<br />

h i h j (2.3)<br />

∂x i ∂x j 0<br />

on negatiivinen (positiivinen) definiitti muoto. Jos muoto on indefiniitti, niin kyseessä on ns. satulapiste.<br />

Jos x 0 on satulapiste, niin f saa jokaisessa sen ympäristö sekä f(x 0 ):aa suurempia, että pienempiä<br />

arvoja kuten seuraavassa esimerkissä.<br />

Esimerkki 2.1 Olkoon f(x, y) = x 2 − y 2 ja Ω = R 2 . Nyt<br />

∂f ∂f<br />

= 2x ja<br />

∂x ∂y<br />

= −2y eli (0,0) on stationaarinen.<br />

Kuitenkin D(h) = 2(h 2 1 − h2 2 ) on indefiniitti eli f(0, 0) ei ole ääriarvo, kuten ei kuulukaan.<br />

Olemme edellä olettaneet, että tarkasteltava funktio on vähintään kaksi kertaa derivoituva, joten lausetta<br />

2.1 ei voi soveltaa alueen reunapisteissä, eikä pisteissä, joissa funktio ei ole derivoituva ja tähän<br />

liittyviä ongelmia valaiskoon seuraavat esimerkit:<br />

Esimerkki 2.2 Olkoon f(x, y) = √ x 2 + y 2 ja Ω = R 2 .<br />

Selvästikin f(x, y) ≥ 0 kaikilla (x, y) ∈ R 2 , joten ilmeisesti minimi on f(0, 0) = 0. Kuitenkin<br />

∂f<br />

∂x =<br />

x ∂f<br />

√ ja<br />

x 2 + y2 ∂y =<br />

y<br />

√<br />

x 2 + y 2 ,<br />

joten derivaattoja ei ole olemassa pisteessä (0, 0). Emme siis voi päätellä pisteen laatua muuten, kuin<br />

tietämällä että f on origoa lukuunottamatta aidosti positiivinen.<br />

Esimerkki 2.3 Olkoon f(x, y) = x 2 − y 2 ja Ω = {¯x ∈ R 2 : |¯x| ≤ 1}.<br />

Napakoordinaateissa f(x, y) = r 2 (cos 2 (θ) − sin 2 (θ)) = r 2 cos(2θ), joten<br />

päätellään:<br />

Maksimit: r = 1, θ = 0, π, jolloin f(1, 0) = f(−1, 0) = 1.<br />

Minimit: r = 1, θ = π/2, 2π/3, jolloin f(0, 1) = f(0, −1) = −1.<br />

Kuitenkin esim. ∂f<br />

∣<br />

(1,0)<br />

= 2 ≠ 0 jne.<br />

∂x<br />

|f| ≤ 1 joukossa Ω. Tästä


5<br />

Esimerkin 2.2 kaltaisiin tilanteisiin ei ole systemaattista menetelmää, jolla pisteiden laatu selvitetään,<br />

vaan ne on tarkastettava tapauskohtaisesti, kuten esimerkissä tehtiin. Esimerkissä 2.3 ongelmana oli<br />

maksimin saaminen alueen reunalla, mutta tämä voidaan välttää seuraavilla menetelmillä.<br />

Sidotut ääriarvot<br />

Etsitään funktion f(x 1 , x 2 , . . . , x n ) ääriarvot sidosehdoilla (m < n)<br />

ϕ 1 (x 1 , x 2 , . . . , x n ) = 0<br />

ϕ 2 (x 1 , x 2 , . . . , x n ) = 0<br />

.<br />

ϕ m (x 1 , x 2 , . . . , x n ) = 0.<br />

Yksi mahdollisuus on ratkaista sidosehdoista m muuttujaa m-n:n jäljelle jäävän muuttujan funktioina.<br />

Voi esimerkiksi ratkaista m ensimmäistä x 1 = x 1 (x m+1 , . . . , x n ), . . ., x m = x m (x m+1 , . . . , x n ), ja etsiä<br />

funktion<br />

g(x m+1 , ..., x n ) := f(x 1 (x m+1 , ..., x n ), ..., x m (x m+1 , ..., x n ), x m+1 , ..., x n )<br />

ääriarvot, jolloin sidosehdot on automaattisesti huomioitu.<br />

Esimerkki 2.4 funktion f(x, y) = x 2 + y 2 ääriarvot sidosehdolla<br />

ϕ(x, y) = x + y − 1 = 0. Eli suoran y = 1 − x suurin ja pienin etäisyys origosta.<br />

Ratkaistaan y = 1 − x ja sijoitetaan: f(x, 1 − x) = x 2 + (1 − x) 2 = 2x 2 − 2x + 1 = g(x). g:n kuvaaja<br />

ylöspäin aukeava paraabeli eli ei maksimia, mutta yksi minimi: g ′ (x) = 4x−2 = 0 ⇐⇒ x = 1/2, jolloin<br />

y = 1 − 1/2 = 1/2. Minimi saavutetaan siis pisteessä (1/2, 1/2) ja sen arvo on f(1/2, 1/2) = 1/2.<br />

Yhtälöiden kääntäminen voi olla työlästä tai käytännössä mahdotonta yksinkertaisillakin sidosehdoilla,<br />

joten usein on kätevämpi käyttää Lagrangen kertoimia:<br />

Määritellään<br />

Φ(x 1 , . . . , x n , λ 1 , . . . , λ m ) = f(x 1 , . . . , x n ) +<br />

ja etsitään Φ:n ääriarvot, i = 1, . . . , n, j = 1, . . . , m:<br />

∂Φ<br />

∂x i<br />

= ∂f<br />

∂x i<br />

+<br />

m∑<br />

j=1<br />

m∑<br />

λ i ϕ i (x 1 , x 2 , . . . , x n ),<br />

i=1<br />

λ j<br />

∂ϕ j<br />

∂x i<br />

= 0<br />

∂Φ<br />

∂λ j<br />

= ϕ j (x 1 , x 2 , . . . , x n ) = 0 (2.4)<br />

Sidokset siis muuttavat hieman stationaarisehtoa 2.2 ja yhtälöt 2.4 antavat alkuperäiset sidosehdot.<br />

Esimerkki 2.5 Jatkoa esimerkkiin 2.4<br />

Φ(x, y, λ) = x 2 + y 2 + λ(x + y − 1), (x,y) stationaarinen:<br />

Lisäksi ∂Φ/∂λ = x + y − 1 = 0 =⇒ x = y = 1/2.<br />

∂Φ<br />

∂x = 2x + λ = 0<br />

}<br />

∂Φ<br />

∂y = 2y + λ = 0 =⇒ x = y


6<br />

2.2 Funktionaalit<br />

Funktionaalilla (funktio funktiosta) tarkoitetaan kuvausta jostain funktioluokasta M reaaliluvuille.<br />

Merkitään F : M → R ja F:n arvoa hakasuluilla F[y]. Yleensä funktioluokka M 1 on<br />

Esimerkkejä:<br />

K := ”kompaktikantajaiset funktiot”<br />

C k := ”(paloittain) k kertaa jatkuvasti derivoituvat funktiot”<br />

L p (Ω) := ”p-integroituvat funktiot Ω:ssa, Ω ⊂ R n ”<br />

S := ”nopeasti häviävät funktiot”<br />

• Distribuutiot eli lineaariset funktionaalit, kuten δ-funktio:<br />

• F : L p ([a, b]) → R,<br />

• ”Funktionaalin Taylor-sarja”<br />

F [y] =<br />

δ x0 : y ↦→ y(x 0 ) =<br />

F [y] = ∫ b<br />

a [y(x)]p dx<br />

∞∑<br />

n=0<br />

1<br />

n!<br />

∫ b<br />

a<br />

· · ·<br />

∫ b<br />

a<br />

∫ ∞<br />

−∞<br />

δ(x − x 0 )y(x)dx<br />

dx 1 · · · dx n K n (x 1 , . . . , x n )y(x 1 ) · · · y(x n ) (2.5)<br />

Ylläoleva funktionaalin esitys 2.5 on itseasiassa varsin yleinen, jos ydinfunktioiksi K n sallitaan myös<br />

distribuutiot.<br />

Esimerkki 2.6 F [y] = ∫ ∞<br />

−∞ [y′ (x)] 2 dx, y ∈ K voidaan esittää<br />

F [y] =<br />

∫ ∞ ∫ ∞<br />

−∞<br />

−∞<br />

kun valitaan K 2 (x 1 , x 2 ) = −δ ′′ (x 1 − x 2 ). Perustelu:<br />

=⇒<br />

= −<br />

∫ ∞<br />

−∞<br />

∫ ∞ ∫ ∞<br />

dx 1 dx 2 K 2 (x 1 , x 2 )y(x 1 )y(x 2 ),<br />

dx 1 δ(x 1 − x 2 )y(x 1 ) = y ′′ (x 2 )<br />

−∞ −∞<br />

∫ ∞<br />

−∞<br />

/ ∞<br />

= −<br />

−∞<br />

=<br />

dx 1 dx 2 (−δ ′′ (x 1 − x 2 ))y(x 1 )y(x 2 )<br />

dx 2 y ′′ (x 2 )y(x 2 )<br />

dx 2 y ′ (x 2 )y(x 2 )<br />

} {{ }<br />

∫ ∞<br />

−∞<br />

=0<br />

dx 2 [y ′ (x 2 )] 2 .<br />

Variaatiolaskennassa tutkitaan funktionaaleja, jotka ovat muotoa<br />

J[y] =<br />

∫ b<br />

a<br />

∫ ∞<br />

+ dx 2 [y ′ (x 2 )] 2<br />

−∞<br />

ja perusongelma kuuluu: Mitkä ovat funktionaalin J ääriarvot joukossa<br />

{<br />

y ∈ C 2 ([a, b]) : y(a) = y a , y(b) = y b kiinteät } ?<br />

f(y(x), y ′ (x), x)dx (2.6)<br />

1 Kts. S:n määritelmää jossain???


7<br />

2.3 Eulerin yhtälö<br />

Johdamme välttämättömän ehdon funktionaalin J (2.6) ääriarvolle ts. löydämme ne y = y(x), joille<br />

J[y] on stationaarinen.<br />

Määritelmä 2.2 J[y] on stationaarinen, jos sen muutos häviää ensimmäisessä kertaluvussa, kun<br />

muutetaan y → y(x) + η(x), missä η on y:n ”pieni” variaatio ja η(a) = η(b) = 0. Toisin sanoen<br />

J[y] stationaarinen ⇔ δJ := J[y + η] − J[y] = 0 + O(η 2 ) kaikilla η.<br />

Apulause 2.1 Jos y on jatkuva ja ∫ b<br />

a<br />

η(x)y(x)dx = 0 kaikilla jatkuvilla η, niin y(x) = 0 kaikilla<br />

x ∈ [a, b].<br />

Todistus 2.1 Oletetaan y(x 0 ) ≠ 0, jossakin x 0 ∈ [a, b]. y on jatkuva, joten on olemassa ɛ s.e. y(x) ei<br />

vaihda merkkiä kun x ∈ [x 0 −ɛ, x 0 +ɛ]. Valitaan η(x) = (x−x 0 +ɛ) 2 (x−x 0 −ɛ) 2 , kun x ∈ [x 0 −ɛ, x 0 +ɛ]<br />

ja η(x) = 0 muuten. Nyt<br />

∫ b<br />

∫ x0 +ɛ<br />

{ > 0 , jos y(x0 ) > 0<br />

η(x)y(x)dx = η(x)y(x)dx =<br />

< 0 , jos y(x 0 ) < 0 ,<br />

a<br />

x 0 −ɛ<br />

josta seuraa ristiriita. On siis oltava y(x) = 0 kaikilla x ∈ [a, b].<br />

Olettaen f sopivan monesti derivoituvaksi voimme laskea J:n variaation f:n Taylor-kehitelmän avulla:<br />

J[y + η] =<br />

=<br />

∫ b<br />

a<br />

∫ b<br />

f(y + η, y ′ + η ′ , x)dx<br />

f(y, y ′ , x)dx<br />

a<br />

} {{ }<br />

=J[y]<br />

∫ b<br />

∂f<br />

+<br />

a ∂y η + ∂f<br />

∂y ′ η′ dx + O(η 2 )<br />

Osittaisintegroidaan viimeinen termi (sijoitus häviää, koska η(a) = η(b) = 0):<br />

∫ b<br />

/<br />

∂f<br />

b ∫<br />

∂f b<br />

a ∂y ′ η′ dx =<br />

a<br />

∂y ′ η − η d<br />

∫<br />

∂f<br />

b<br />

a dx ∂y ′ dx = − η d ∂f<br />

dx , josta<br />

a dx ∂y ′<br />

∫ b<br />

( ∂f<br />

δJ = J[y + η] − J[y] = η<br />

a ∂y − d )<br />

∂f<br />

dx ∂y ′ dx = 0<br />

Jotta tämä pätisi kaikilla variaatioilla η, yo. apulauseesta seuraa Eulerin yhtälö:<br />

∂f<br />

∂y − d<br />

dx<br />

Esimerkki 2.7 Lyhin tason pisteet (a, y a ) ja (b, y b ) yhdistävä käyrä.<br />

Pituuselementti: ds = √ dx 2 + dy 2 = √ 1 + (y ′ ) 2 dx. Käyrän pituus on<br />

∫ (b,yb )<br />

∫ b<br />

∂f<br />

∂y ′ = 0. (2.7)<br />

√<br />

J[y] = ds = 1 + (y ′ ) 2 dx , jolle Euler:<br />

(a,y a) a } {{ }<br />

f(y,y ′ ,x)<br />

∂f<br />

∂y − d ∂f<br />

dx ∂y ′ = − d ∂f<br />

dx ∂y ′ = 0<br />

=⇒ d y ′<br />

√<br />

dx 1 + (y ′ ) = 0 2<br />

=⇒<br />

y ′<br />

√<br />

1 + (y ′ ) 2 = C = vakio<br />

=⇒<br />

dy<br />

dx = α = vakio<br />

=⇒ y = αx + β Suora!


8<br />

Vakiot α ja β määräytyvät ehdoista y(a) = y a ja y(b) = y b . On selvää, että ääriarvo on minimi eikä<br />

maksimi.<br />

Jos varioitava integrandi ei riipu eksplisiittisesti x:stä, Eulerin yhtälö redusoituu ensimmäisen asteen<br />

yhtälöksi (Beltramin identiteetti):<br />

df<br />

dx<br />

=<br />

Euler<br />

{}}{<br />

=<br />

Koska oletuksen mukaan ∂f/∂x = 0, saadaan:<br />

d<br />

dx<br />

=<br />

(<br />

f − y ′ ∂f<br />

∂y ′ )<br />

∂f<br />

∂x + ∂f<br />

∂y y′ + ∂f<br />

∂y ′ y′′<br />

∂f<br />

∂x + d ∂f<br />

y′<br />

dx ∂y ′ + ∂f<br />

∂f<br />

∂x + d (<br />

y ′ ∂f )<br />

dx ∂y ′ .<br />

= 0<br />

joka on ensimmäisen kertaluvun DY y(x):lle (f annettu).<br />

Esimerkki 2.8 Pienimmän pinta-alan pyörähdyskappale.<br />

A[y]<br />

= 2π<br />

∂y ′ y′′<br />

eli f − y ′ ∂f<br />

∂y ′ = C = vakio, (2.8)<br />

∫ b<br />

a<br />

y √ 1 + (y ′ ) 2 dx , jolloin<br />

δA = 0 =⇒ f − y ′ ∂f<br />

∂y ′ = C<br />

⇐⇒<br />

y ′<br />

y √ 1 + (y ′ ) 2 − y ′ y √<br />

1 + (y ′ ) = 2<br />

⇐⇒ y ′ = 1 C<br />

√<br />

y 2 − C 2 separoituu<br />

=⇒ cosh −1 ( y C ) = (x − C 2)/C<br />

⇐⇒ y = C · cosh( x − C 2<br />

C<br />

) ”katenoidi”.<br />

y<br />

√<br />

1 + (y ′ ) 2 = C<br />

Taas C ja C 2 määräytyvät reunaehdoista ja on selvää, että kyseessä on minimi eikä maksimi.<br />

2.3.1 Yleistys monen funktion funktionaaliin<br />

Tutkittava funktionaali on nyt:<br />

ehdolla<br />

J = J[y 1 , y 2 , . . . , y n ] =<br />

∫ b<br />

a<br />

f(y 1 , . . . , y n , y ′ 1, . . . , y ′ n, x)dx, (2.9)<br />

y i (a) = y ia<br />

y i (b) = y ib<br />

kiinnitetyt, i = 1,...,n .<br />

Varioidaan y i (x) → y i (x) + η i (x) (η i (a) = η i (b) = 0), jolloin:<br />

∫ b n∑<br />

( ∂f<br />

δJ = η i (x) − d ∂f<br />

∂y i dx<br />

a<br />

i=1<br />

=⇒ ∂f − d<br />

∂y i dx<br />

∂f<br />

∂y ′ i<br />

∂y ′ i<br />

)<br />

dx = 0<br />

= 0 i = 1,...,n. (2.10)


9<br />

Yhtälöiden 2.10 (Euler-Lagrange yhtälöt) tärkeä sovellus: Lagrangen mekaniikka.<br />

Massapiste (massa m, paikka ⃗r(t)) liikkuu potentiaalissa V (⃗r). Sillä on liike-energia 1 2 m ˙⃗r 2 , ( ˙⃗r = d⃗r<br />

dt ) ja<br />

potentiaalienergia V (⃗r).<br />

Pienimmän vaikutuksen periaate: Massapisteen rata ⃗r(t), t ∈ [t a , t b ] minimoi (tarkemmin stationarisoi)<br />

vaikutusfunktionaalin S, joka määritellään Lagrangen funktion L aikaintegraalina:<br />

S =<br />

∫ tb<br />

(T − V ) dt. (2.11)<br />

t a<br />

} {{ }<br />

Oletetaan, että massapiste liikkuu vapaasti potentiaalissa V (⃗r). Tällöin:<br />

∫ tb<br />

( )<br />

1<br />

S =<br />

2 m ˙⃗r 2 − V (⃗r) dx , ja Euler-Lagrange:<br />

t a<br />

:=L<br />

δS = 0 ⇐⇒ 1 2 m d dt (2 ˙⃗r) + ∇V (⃗r) = 0<br />

⇐⇒ m¨⃗r = −∇V (⃗r) = ⃗ F (Newton!)<br />

Esimerkki 2.9 (1-ul.) harmoninen värähtelijä.<br />

∫ tb<br />

( 1<br />

S =<br />

t a<br />

2 mẋ2 − 1 )<br />

2 x2 dt<br />

δS = 0 ⇐⇒ mẍ = −kx , merk. k/m =ω 2<br />

⇐⇒<br />

⇐⇒<br />

ẍ = −ω 2 x<br />

A ja B määrätään ehdoista x(t a ) = x a , x(t b ) = x b .<br />

x(t) = A · sin(ωt) + B · cos(ωt)<br />

2.3.2 Yleistys monen muuttujan funktioihin<br />

Olkoon nyt y(¯x) : R n → R, y x1 := ∂y/∂x 1 jne. Nyt 1-ulotteiselle tapaukselle analoginen variaatioongelma<br />

on löytää funktionaalin<br />

∫<br />

J[y] = d n xf(y, y x1 , . . . , y xn , ¯x) , Ω ⊂ R n (2.12)<br />

Ω<br />

ääriarvot, kun y| ∂Ω (x) = y 0 (x), ts. y:n arvot alueen reunalla on kiinitetty. Varioidaan kuten aiemmin<br />

y(¯x) → y(¯x) + η(¯x), missä η(¯x) = 0, kun ¯x ∈ ∂Ω.<br />

∫<br />

J[y + η] = d n xf(y + η, y x1 + η x1 , . . . , y xn + η xn , ¯x)<br />

=<br />

Ω<br />

∫ (<br />

)<br />

J[y] + d n ∂f<br />

n∑<br />

x<br />

∂y η + ∂f<br />

η x1 + O(η 2 )<br />

∂y xi<br />

Osittaisintegroidaan summa-termiä ja käytetään divergenssiteoreemaa:<br />

=<br />

=<br />

∫<br />

∫<br />

∫<br />

Ω<br />

Ω<br />

∂Ω<br />

d n x<br />

d n x<br />

d ¯S ·<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

(<br />

Ω<br />

∂f<br />

∂y xi<br />

η x1<br />

∂<br />

∂x 1<br />

( ∂f<br />

∂y xi<br />

η<br />

η<br />

n∑<br />

i=1<br />

)<br />

)<br />

∂f<br />

ê xi −<br />

∂y xi<br />

i=1<br />

∫ (<br />

− d n x η<br />

Ω<br />

∫ (<br />

Ω<br />

d n x<br />

η<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

( ) )<br />

∂ ∂f<br />

∂x i ∂y xi<br />

( ) ) ∂ ∂f<br />

.<br />

∂x i ∂y xi


10<br />

Näistä ensimmäinen termi on 0, sillä η(¯x) ≡ 0 reunalla, joten<br />

∫ ( (<br />

J[y + η] − J[y] = d n ∂f<br />

n∑<br />

( ) ))<br />

x η<br />

∂y − ∂ ∂f<br />

∂x i ∂y xi<br />

= 0<br />

Ω<br />

⇐⇒<br />

∂f n∑<br />

∂y −<br />

i=1<br />

i=1<br />

( )<br />

∂ ∂f<br />

∂x i ∂(∂y/∂x i )<br />

Luonnollisesti tulos yleistyy monen funktion funktionaalille. Tällöin Eulerin yhtälöt ovat<br />

∂f<br />

∂y k<br />

−<br />

i=1<br />

kaikilla k = 1, . . . , n, jos<br />

∫<br />

J = J[y 1 , . . . , y k ] =<br />

= 0. (2.13)<br />

n∑<br />

(<br />

)<br />

∂ ∂f<br />

= 0 (2.14)<br />

∂x i ∂(∂y k /∂x i )<br />

Ω<br />

d n xf(y 1 , . . . , y k , . . . , ∂y l<br />

∂x m<br />

, . . . , ¯x),<br />

missä käydään läpi kaikkien funktioiden kaikki osittaisderivaatat.<br />

Esimerkki 2.10 Skalaarikenttä minkowski-avaruudessa.<br />

x 0 = ct, x 1 = x, x 2 = y ja x 3 = z sekä vaikutus<br />

∫ ( ( ) )<br />

S = dtd 3 1 ∂ϕ 2<br />

x<br />

− 1 2c ∂t 2 (∇ϕ)2 − 1 2 m2 ϕ 2 .<br />

Jolloin:<br />

δS = 0<br />

⇐⇒ −m 2 ϕ − 1 ∂ ∂ϕ<br />

c 2 ∂t ∂t + ∂2 ϕ<br />

∂x 2 + ∂2 ϕ<br />

∂y 2 + ∂2 ϕ<br />

∂z 2 = 0<br />

⇐⇒ ( 1 ∂ 2<br />

c 2 ∂t 2 − ∆)ϕ + m2 ϕ = 0 (Klein-Gordon-yhtälö!)<br />

2.4 Sidottu (Ehdollinen) variaatioprobleema<br />

Etsittävä funktionaalin (taas käydään läpi kaikki osittaisderivaatat ja x ∈ R n )<br />

∫<br />

J[y] = d n xf(y 1 , . . . , y k , . . . , ∂y l<br />

, . . . , ¯x) (2.15)<br />

∂x m<br />

stationaariset arvot ehtojen (k = 1, . . . , K)<br />

Ω<br />

ϕ k (y j , ∂y j<br />

∂x i<br />

, ¯x) := ϕ k (y 1 , . . . , y n , . . . , ∂y l<br />

∂x m<br />

, . . . , ¯x) = 0 (2.16)<br />

valitessa. Ehtoja 2.16 kutsutaan holonomisiksi, jos ϕ ei riipu y i :n derivaatoista (muuten ne ovat eiholonomisia).<br />

Taas ratkaisu löytyy Lagrangen kertojien avulla ts. tutkimalla funktionaalia<br />

∫<br />

K[y] =<br />

Ω<br />

d n x<br />

(<br />

f +<br />

K∑<br />

k=1<br />

λ k (¯x)ϕ k (y j , ∂y j<br />

∂x i<br />

, ¯x)<br />

)<br />

. (2.17)


11<br />

Stationaaristen arvojen selvittämiseksi varioidaan funktiot y j ja λ k , jolloin Euler-Lagrange yhtälöt ovat<br />

(merk. g = f + ∑ λ k ϕ k )<br />

∂g<br />

∂y j<br />

−<br />

∂g<br />

∂λ k<br />

−<br />

⇐⇒<br />

n∑<br />

i=1<br />

n∑<br />

i=1<br />

∂<br />

∂x i<br />

∂<br />

∂x i<br />

Esimerkki 2.11 Sylinteri kaltevalla tasolla.<br />

∂g<br />

∂(∂y j /∂x i )<br />

∂g<br />

∂(∂λ k /∂x i )<br />

= 0 , kaikilla j sekä<br />

= 0 , kaikilla k<br />

ϕ k (y j , ∂y j<br />

∂x i<br />

, x i ) = 0 , kaikilla k<br />

Kappaleella massa m, hitausmomentti I, x-taso pinnan suuntainen (x etäisyys huipulta) ja α pinnan<br />

ja vaakatason välinen kulma:<br />

T = 1 2 mẋ2 + 1 2 I ˙θ 2<br />

V = mg(l − x)sin(α),<br />

missä l on levyn pituus ja α kulma. Sidosehtona tietysti vierimisehto ẋ = R ˙θ. On siis minimoitava<br />

S =<br />

=<br />

∫ t1<br />

∫ t1 (<br />

t 0<br />

Ldt = T − V + λ(t)(ẋ − R ˙θ)<br />

)<br />

dt<br />

t 0<br />

( 1<br />

2 mẋ2 + 1 2 I ˙θ 2 − mg(l − x)sin(α) + λ(t)(ẋ − R ˙θ)<br />

∫ t1<br />

jolle Euler-Lagrange yhtälöt ovat<br />

t 0<br />

d<br />

dt<br />

( ∂L<br />

∂ẋ<br />

d<br />

dt<br />

d<br />

dt<br />

)<br />

− ∂L<br />

Nyt 2.19 ⇒ ˙λ = I/R¨θ, sijoitetaan yhtälöön 2.18, jolloin<br />

)<br />

dt,<br />

∂x = mẍ + ˙λ − mgsin(α) = 0 (2.18)<br />

( ) ∂L<br />

∂ ˙θ<br />

− ∂L<br />

∂θ = I ¨θ − R ˙λ = 0 (2.19)<br />

( ) ∂L<br />

∂ ˙λ<br />

− ∂L<br />

∂λ = R ˙θ − ẋ = 0. (2.20)<br />

mẍ + I/R¨θ − mgsin(α) = 0.<br />

2.20:sta seuraa ¨θ = ẍ/R ja sijoittamalla tämä saatuun yhtälöön saadaan<br />

missä integroimisvakiot määrätään alkuehdoista.<br />

2.5 Isoperimetrinen ongelma<br />

(m + I/R 2 )ẍ = mgsin(α)<br />

=⇒ x(t) = 1 mgsin(α)<br />

2 m + I/R 2 t2 + v 0 t + x 0 ,<br />

Vastaa sidottua variaatio-ongelmaa, mutta sidosehtona on toinen funktionaali. Toisin sanoen, mitkä<br />

ovat funktionaalin<br />

J[y] =<br />

∫ b<br />

a<br />

dxf(y, y ′ , x) (2.21)


12<br />

ääriarvot, kun vaaditaan, että<br />

K[y] =<br />

∫ b<br />

a<br />

dxg(y ′ , y, x) = C = vakio. (2.22)<br />

Tämä(kin!) ratkeaa kätevimmin Lagrangen kertojien avulla, tosin nyt kerroin on luku eikä funktio.<br />

Etsittävä funktionaalin<br />

L λ [y] = J[y] + λ(K[y] − C) (2.23)<br />

stationaariset pisteet. Eulerin yhtälöt tälle ovat:<br />

∂(f + λg)<br />

− d<br />

∂y dx<br />

∂(f + λg)<br />

∂y ′ = 0<br />

∂L λ<br />

∂λ = K[y] − C = 0<br />

Esimerkki 2.12 Yhdistettävä pisteet (a, 0) ja (b, 0) annetun pituisella käyrällä (y ≥ 0) s.e. käyrän ja<br />

x-akselin rajoittama pinta-ala on mahdollisimman suuri.<br />

Nyt 2.21, 2.22 ja 2.23 ovat vastaavasti<br />

Jolloin Eulerin yhtälöstä<br />

J[y] =<br />

K[y] =<br />

L λ [y] =<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

y(x)dx<br />

( )<br />

λ d y ′<br />

√ = 1<br />

dx 1 + (y ′ ) 2<br />

=⇒<br />

√<br />

1 + (y ′ ) 2 dx = l<br />

y ′<br />

√<br />

1 + (y ′ ) 2 = λ−1 (x − C 1 )<br />

y(x) + λ √ 1 + (y ′ ) 2 dx − λl.<br />

⇐⇒ dy<br />

dx = ± x − C<br />

√ 1<br />

λ 2 − (x − C 1 ) = ± d √<br />

λ 2 dx<br />

2 − (x − C 1 ) 2<br />

=⇒ y − C 2 = ± √ λ 2 − (x − C 1 ) 2<br />

=⇒ (x − C 1 ) 2 + (y − C 2 ) 2 = λ 2 (2.24)<br />

2.24 on ympyrän yhtälö. Lisäki y(a) = y(b) = 0, joten (muutaman välivaiheen jälkeen)<br />

C 1 = a + b<br />

√<br />

ja C 2 = − λ<br />

2<br />

2 (b − a)2<br />

− .<br />

4<br />

Lisäksi λ määräytyy ehdosta<br />

∫ b<br />

dx<br />

K[y] = λ √<br />

λ 2 − (x − C 1 ) 2<br />

= λ<br />

a<br />

∫ (b−a)/2λ<br />

−(b−a)/2λ<br />

sij. t = (x − C 1 )/λ<br />

( )<br />

dt<br />

(b − a)<br />

√ = 1 − t 2 2λsin−1 = l. (2.25)<br />


13<br />

2.6 Toinen variaatio<br />

Tässä luvussa johdamme välttämättömän ehdon sille, että funktionaalin<br />

J[y] =<br />

∫ b<br />

a<br />

f(y, y ′ , x)dx (2.26)<br />

stationaarinen piste y 0 = y 0 (x) (ts. Eulerin yhtälön ratkaisu) on minimi tai maksimi. Oletetaan,<br />

että f:n toiset osittaisderivaatat y:n ja y’:n suhteen ovat jatkuvia. Lasketaan J pisteessä y = y(x) =<br />

y 0 (x) + αη(x), missä α on ”pieni” ja η(a) = η(b) = 0:<br />

J[y 0 + αη]<br />

∫ b<br />

( ∂f<br />

= J[y 0 ] + α<br />

a ∂y − d )<br />

∂f<br />

dx ∂y ′ η(x)dx<br />

y=y } {{ } 0<br />

=0 (Euler)<br />

+ 1 ∫ b<br />

( ∂ 2 )<br />

f<br />

2 α2 a ∂y 2 η2 (x) + 2 ∂2 f<br />

∂y∂y ′ η(x)η′ (x) +<br />

∂2 f<br />

∂(y ′ ) 2 (η′ (x)) 2 dx<br />

y=y<br />

} {{ 0<br />

}<br />

δ 2 J<br />

+ O(α 3 ).<br />

Huomataan 2ηη ′ = (η 2 ) ′ ja osittaisintegroidaan δ 2 J:n keskimmäinen termi jolloin saadaan ”toinen<br />

variaatio”<br />

∫ b<br />

(<br />

δ 2 J = α2 ∂ 2 f<br />

2 a ∂y 2 − d ∂ 2 ) (<br />

f<br />

∂<br />

dx ∂y∂y ′ η 2 2 )<br />

f<br />

+<br />

y=y } {{ } 0<br />

∂(y ′ ) 2 (η ′ ) 2 dx.<br />

y=y } {{ } 0<br />

=:S(x)<br />

=:R(x)<br />

Jos nyt oletamme, että y 0 antaa J:n minimin, tällöin tietysti δ 2 J ≥ 0 kaikilla η(x). Väitämme, että<br />

tällöin on välttämättä oltava R(x) ≥ 0, a < x < b.<br />

Tehdään vastaoletus: löytyy x = c ∈ (a, b) s.e. R(c) < 0. Koska R on jatkuva, on olemassa δ s.e.<br />

R(x) < 0 kaikilla c − δ ≤ x ≤ c + δ. Valitaan ɛ s.e. 0 < ɛ < δ ja määritellään<br />

η(x) = (x − (c − ɛ)) 2 (x − (c + ɛ)) 2 , x ∈ [c − ɛ, c + ɛ] , 0 muuten.<br />

Valitsemalla ɛ tarpeeksi pieneksi saamme<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

S(x)η 2 (x)dx ≈ S(c)<br />

R(x)(η ′ ) 2 (x)dx ≈ R(c)<br />

∫ c+ɛ<br />

c−ɛ<br />

∫ c+ɛ<br />

Valitsemalla ɛ riittävän pieneksi (ɛ 9


14<br />

2.7 Funktionaaliderivaatta<br />

Variaatiolaskenta voidaan muotoilla tavallista differentiaalilaskentaa vastaavaan muotoon funktionaaleille<br />

F [y], joiden määrittelyjouko on funktioavaruus S (nopeasti häviävät funktiot) tai K (kompaktin<br />

kantajan funktiot). Määritellään tätä varten δ-jono:<br />

Määritelmä 2.3 Funktiot δ 1 (x), δ 2 (x),... muodostavat δ-jonon jos<br />

1)<br />

∫ ∞<br />

2) lim<br />

n→∞<br />

dxδ n (x) = 1<br />

−∞<br />

∫ ∞<br />

−∞<br />

∀ n ∈ N<br />

dxf(x)δ n (x) = f(0)<br />

, kun f ∈ K tai f ∈ S<br />

δ-jonoja on useita, esimerkiksi<br />

⎧<br />

⎨ 0 , x < −(2n) −1<br />

1) δ n (x) = n , −(2n) −1 ≤ x ≤ (2n) −1<br />

⎩<br />

0 , (2n) −1 < x<br />

2) δ n (x) = √ n e −n2 x 2<br />

π<br />

3) δ n (x) = sin(nx)<br />

πx<br />

4) δ n (x) = n 1<br />

π 1 + n 2 x 2 .<br />

Haluamme tietää kuinka paljon F [y] muuttuu, kun y(x) muutetaan hieman x = x ′ :n ympäristössä.<br />

Tavanomaiselle tapaukselle analogisesti määritellään funktionaaliderivaatta:<br />

Määritelmä 2.4 (Funktionaaliderivaatta)<br />

Ja tästä heti muutama esimerkki:<br />

δF<br />

δy(x ′ ) = lim lim 1 (<br />

F [y + ɛδn (x − x ′ )] − F [y] ) (2.30)<br />

n→∞ ɛ→0 ɛ<br />

Esimerkki 2.13<br />

F 1 [y] =<br />

F 1 [y + ɛδ n (x − x ′ )] =<br />

=<br />

∫ ∞<br />

−∞<br />

∫ ∞<br />

dx[y(x)] p + ɛp<br />

−∞<br />

∫ ∞<br />

−∞<br />

∫ ∞<br />

dx[y(x)] p p ≥ 1<br />

dx[y(x) + ɛδ n (x − x ′ )] p<br />

−∞<br />

dxy p−1 (x)δ n (x − x ′ ) + O(ɛ 2 ),<br />

joten<br />

(<br />

F1 [y + ɛδ n (x − x ′ )<br />

)] − F 1 [y]<br />

ɛ<br />

=⇒ δF 1<br />

δy(x ′ )<br />

−→<br />

ɛ→0<br />

∫ ∞<br />

p dxy p−1 (x)δ n (x − x ′ )<br />

−∞<br />

−→<br />

n→∞ pyp−1 (x ′ )<br />

= py p−1 (x ′ )


15<br />

Esimerkki 2.14<br />

F 1 [y + ɛδ n (x − x ′ )] − F 1 [y]<br />

ɛ<br />

F 2 [y] =<br />

−→<br />

ɛ→0<br />

−→<br />

n→∞<br />

∫ ∞<br />

p<br />

−∞<br />

∫ ∞<br />

−∞<br />

dx[y ′ (x)] p p ≥ 1<br />

dx[y ′ (x)] p−1 δ ′ n(x − x ′ )<br />

∫ ∞<br />

p dx[y ′ (x)] p−1 δ ′ (x − x ′ )<br />

−∞<br />

= −p d<br />

dx [y′ (x)] p−1 ∣<br />

∣∣∣x=x<br />

′<br />

= −p(p − 1)[y ′ (x ′ )] p−2 y ′′ (x ′ )<br />

Huomaa (mm. yo. esimerkeissä), että käytännössä voidaan käyttää<br />

δF<br />

δy(x ′ ) = lim<br />

ɛ→0<br />

F [y + ɛδ(x − x ′ )] − F [y]<br />

, (2.31)<br />

ɛ<br />

kunhan sovitaan, että F [y(x) + ɛδ(x − x ′ )] kehitetään vain 1. kertaluvun tarkkuudella ɛ:n suhteen.<br />

Luonnollinen kysymys: milloin δJ/δy = 0, kun J on kuten 2.26:ssa ja miten se on tulkittava?<br />

J[y] =<br />

=⇒ δJ<br />

δy(x ′ )<br />

=<br />

=<br />

∫ ∞<br />

−∞<br />

∫ ∞<br />

−∞<br />

f(y, y ′ , x)dx<br />

dx<br />

( ∂f<br />

∂y − d<br />

dx<br />

[ ∂f<br />

∂y δ(x − x′ ) + ∂f<br />

∂y ′ δ′ (x − x ′ )<br />

∂f<br />

∂y ′ )x=x ′<br />

Eli ehto δF/δy = 0 on ekvivalentti aiemmin saadun Eulerin yhtälön kanssa, kuten tietysti kuuluukin.<br />

2.8 Ritzin menetelmä<br />

Menetelmä variaatio-ongelman<br />

∫<br />

J[y] =<br />

Ω<br />

d n xf(y, y x1 , . . . , y xn , ¯x) , Ω ⊂ R n (2.32)<br />

likimääräiselle ratkaisemiselle, s.o. menetelmä etsiä Eulerin osittaisdifferentiaaliyhtälön<br />

∂f<br />

n∑<br />

( )<br />

∂y − ∂ ∂f<br />

= 0 (2.33)<br />

∂x i ∂(∂y/∂x i )<br />

likimääräinen ratkaisu, kun y| ∂Ω = g on annettu. Ritzin menetelmä:<br />

i=1<br />

1) Etsitään N riippumatonta ratkaisua ϕ 1 , . . . , ϕ N , jotka toteuttavat ϕ i | ∂Ω = g kaikilla i = 1, . . . , N.<br />

2) Ratkaisuyrite: u N (x) = ∑ N<br />

i=1 a iϕ i (x).<br />

3) Lasketaan J[u] = j(a 1 , a 2 , . . . , a n ).<br />

4) Etsitään funktion j stationaariset pisteet (ā 1 , ā 2 , . . . , ā N ) luvun 2.1 menetelmin (myös min. max.<br />

tarkastelu).<br />

5) Likim. ratkaisu on ū N (x) = ∑ N<br />

i=1 āiϕ i (x) ja J[ū N ] = j(ā 1 , ā 2 , . . . , ā N )<br />

Esimerkki 2.15 Poisson yhtälö (ρ annettu).<br />

Ratkaistaan<br />

∆u = ρ(x, y) (2.34)<br />

]


16<br />

likimääräisesti yksikköneliössä Ω = (0, 1) × (0, 1), kun u(x, y) = 0 reunalla. Huomataan, että 2.34 on<br />

Eulerin yhtälö funktionaalille<br />

∫ 1 ∫ (<br />

1<br />

(∂u ) 2 ( ) ∂u 2<br />

J[u] = dxdy + + 2ρ(x, y)u(x, y))<br />

∂x ∂y<br />

Euler :<br />

Yritefunktioiksi ϕ i voidaan valita esim.<br />

0<br />

0<br />

∂ ∂f<br />

+ ∂ ∂f<br />

− ∂f<br />

∂x ∂u x ∂y ∂u y ∂u = 2u xx + 2u yy − 2ρ(x, y) = 0<br />

ϕ 1 (x, y) = xy(1 − x)(1 − y) , (selvästi ϕ| ∂Ω = 0)<br />

0<br />

ϕ 2 (x, y) = xϕ 1 (x, y) , ϕ 3 (x, y) = yϕ 1 (x, y)<br />

ϕ 4 (x, y) = x 2 ϕ 1 (x, y) , ϕ 5 (x, y) = y 2 ϕ 1 (x, y)<br />

ϕ 6 (x, y) = xyϕ 1 (x, y)<br />

0<br />

i,j<br />

jne. jne.<br />

niin pitkälle kuin sielu sietää. Nyt yrite on u N (x, y) = ∑ N<br />

i=1 a iϕ i (x) ja<br />

⎛<br />

∫ 1 ∫ 1<br />

N∑<br />

(<br />

J[u N ] = dxdy ⎝ ∂ϕi ∂ϕ j<br />

a i a j<br />

∂x ∂x + ∂ϕ )<br />

i ∂ϕ j<br />

+ 2<br />

∂y ∂y<br />

missä<br />

=<br />

N∑<br />

N∑<br />

A ij a i a j + 2 b i a i = j(a 1 , a 2 , . . . , a N ),<br />

i,j<br />

A ij =<br />

b i =<br />

Etsitään j:n stationaariset pisteet:<br />

∫ 1 ∫ 1<br />

0 0<br />

∫ 1 ∫ 1<br />

0<br />

0<br />

∂j<br />

∂a i<br />

=<br />

i<br />

( ∂ϕi ∂ϕ j<br />

dxdy<br />

∂x ∂x + ∂ϕ i<br />

∂y<br />

⎞<br />

N∑<br />

a i ϕ i ρ⎠<br />

i<br />

)<br />

∂ϕ j<br />

= A ji (2.35)<br />

∂y<br />

dxdyρ(x, y)ϕ i (x, y) (2.36)<br />

N∑<br />

(A ij a j + A ji a j ) + 2b i<br />

j<br />

⎛<br />

= 2 ⎝b i +<br />

kun A ij :t ja b i :t kerätään matriiseiksi. Ratkaisu on siis<br />

ū(x, y) =<br />

N∑<br />

j<br />

A ij a j<br />

⎞<br />

⎠ = 0<br />

⇐⇒ Aa = −b, (2.37)<br />

ā = −A −1 b ts. a i = −<br />

N∑<br />

(A −1 ) ij b j (2.38)<br />

j=1<br />

N∑<br />

ā i ϕ i (x, y) (2.39)<br />

i=1<br />

Matriisien alkioiden laskeminen ja matriisin kääntäminen onnistuu helposti tietokoneella.


17<br />

3 Sturm-Liouville-Teoria<br />

3.1 Perusominaisuudet<br />

Yleinen Sturm-Liouville (S-L) yhtälö 2<br />

(<br />

d<br />

p(x) du(x) )<br />

+ (−q(x) + λw(x)) u(x) = 0, a ≤ x ≤ b. (3.1)<br />

dx dx<br />

Sallitaan myös arvot a = −∞, b = ∞. Lisäksi kerroinfunktioilta vaaditaan<br />

1) p(x),q(x),w(x) reaalisia.<br />

2) q ja w vähintään jatkuvia.<br />

3) p jatkuvasti derivoituva ja p(x) ≠ 0, x ∈ (a, b) sekä p(x) > 0. (Tarvittaessa yhtälö kerrotaan -1:llä.)<br />

4) w(x) > 0 x ∈ [a, b]. (Tarvittaessa λ → −λ.)<br />

Lisäksi<br />

jos a ≠ −∞, b ≠ ∞ ja p(a) ≠ 0 ≠ p(b), niin kyseessä on säännöllinen S-L ongelma.<br />

Jos p(a) = 0 ja/tai p(b) = 0, S-L ongelma on singulaarinen, samoin jos a = −∞ ja/tai b = ∞.<br />

(3.1):n lisäksi asetetaan homogeeniset reunaehdot:<br />

Säännöllinen S-L:<br />

Singulaarinen S-L:<br />

A 1 u(a) + A 2 u ′ (a) = 0 (A 1 , A 2 ) ≠ (0, 0) (3.2)<br />

B 1 u(b) + B 2 u ′ (b) = 0 (B 1 , B 2 ) ≠ (0, 0) (3.3)<br />

p(a) ≠ 0, p(b) = 0 : (3.2) sekä |u(b)| < ∞ (3.4)<br />

p(a) = 0, p(b) ≠ 0 : (3.3) sekä |u(b)| < ∞ (3.5)<br />

p(a) = 0, p(b) = 0 : |u(x)| < ∞, a < x < b. (3.6)<br />

Osoittautuu, että S-L yhtälöllä 3.1 on tilanteen mukaisilla reunaehdoilla nollasta eroavia ratkaisuja<br />

vain tietyillä λ = λ k . Näitä kutsutaan Sturm-Liouville-operaattorin<br />

L := − d<br />

dx p(x) d + q(x) (3.7)<br />

dx<br />

ominaisarvoiksi (engl. eigenvalues). Vastaavat ratkaisut u k ovat (vakiokerrointa vaille) ominaisarvoja<br />

vastaavat ominaisfunktiot (engl. eigenfunctions). Huomaa, että myös vakiolla kerrottu u k ratkaisee<br />

S-L:n:<br />

Lu = λ k wu k =⇒ LCu = λ k wCu k .<br />

On hyödyllistä huomata, että mikä tahansa 2-kertaluvun DY voidaan muuttaa S-L-yhtälöksi, toisin<br />

sanoen mikä tahansa operaattori<br />

L = a 2 (x) d2<br />

dx 2 + a 1(x) d<br />

dx + a 0(x) (3.8)<br />

2 q:n etumerkki Cronströmin kirjan mukainen. Esimerkiksi Arfken ja Weber käyttää +-etumerkkiä.


18<br />

voidaan kirjoittaa muodossa L = ϕ(x)L. Kuinka?<br />

ϕ(x)L = −ϕ(x)p(x) d2<br />

dx 2 − ϕ(x)p′ (x) d<br />

dx + ϕ(x)q(x)<br />

=⇒ p′ (x)<br />

p(x) = a 1(x)<br />

a 2 (x)<br />

(∫ x<br />

=⇒ p(x) = exp<br />

=⇒ ϕ(x) = − a 2(x)<br />

p(x) = −a 2(x)exp<br />

a 1 (x ′ )<br />

)<br />

x 0<br />

a 2 (x ′ ) dx′ ( ∫ x<br />

−<br />

a 1 (x ′ )<br />

)<br />

x 0<br />

a 2 (x ′ ) dx′<br />

=⇒ q(x) = a 0(x)<br />

ϕ(x) = −a 0(x)<br />

a 2 (x) exp (∫ x<br />

x 0<br />

a 1 (x ′ )<br />

a 2 (x ′ ) dx′ )<br />

3.1.1 Erikoisfunktiot ja Sturm-Liouville yhtälöt<br />

Legendren polynomit<br />

Legendren liittofunktiot<br />

− d [<br />

(1 − x 2 ) dP ]<br />

l(x)<br />

= l(l + 1)P l (x) (3.9)<br />

dx<br />

dx<br />

a = −1, b = 1, p(x) = 1 − x 2 , q(x) = 0, w(x) = 1, λ = l(l + 1)<br />

− d<br />

dx<br />

[(1 − x 2 ) dP l<br />

m<br />

dx<br />

]<br />

(x)<br />

+ m<br />

1 − x 2 P l<br />

m (x) = l(l + 1)Pl m (x) (3.10)<br />

a = −1, b = 1, p(x) = 1 − x 2 , q(x) = m2<br />

, w(x) = 1, λ = l(l + 1)<br />

1 − x2 Besselin funktiot (R > 0 J ν :n 0-kohta, ξ = x/R ∈ [0, 1])<br />

[<br />

d<br />

ξ dJ ]<br />

ν(ξR)<br />

+ ν2<br />

dξ dξ ξ J ν(ξR) = R 2 ξJ ν (ξR) (3.11)<br />

Laguerren polynomit<br />

Laguerren liittopolynomit<br />

Hermiten polynomit<br />

a = 0, b = 1, p(ξ) = ξ, q(ξ) = ν2<br />

, w(ξ) = ξ, λ = R2<br />

ξ<br />

− d [<br />

xe −x dL ]<br />

n<br />

= ne −x L n (x) (3.12)<br />

dx dx<br />

a = 0, b = ∞, p(x) = xe −x , q(x) = 0, w(x) = e −x , λ = n<br />

− d (<br />

)<br />

x k+1 e −x dLk l<br />

= x k e −x nL k<br />

dx dx<br />

n(x) (3.13)<br />

a = 0, b = ∞, p(x) = x k+1 e −x , q(x) = 0, w(x) = x k e −x , λ = n<br />

− d [<br />

e dH ]<br />

−x2 n<br />

= 2ne −x2 H n (x) (3.14)<br />

dx dx<br />

a = −∞, b = ∞, p(x) = e −x2 , q(x) = 0, w(x) = e −x2 , λ = 2n


19<br />

3.1.2 Yksinkertainen esimerkki S-L ongelmasta<br />

d 2 u<br />

+ λu = 0 (3.15)<br />

dx2 Eli S-L yhtälö, missä p(x) = 1, q(x) = 0, w(x) = 1. Asetetaan vielä reunaehdot u(0) = u(π) = 0. Millä<br />

λ:n arvoilla löydetään 0:sta eroavia ratkaisuja? (3.15):n yleinen ratkaisu on<br />

jolloin reunaehdoista seuraa<br />

u(x) = C 1 e √ −λx + C 2 e −√ −λx ,<br />

C 1 + C 2 = 0 (x = 0)<br />

e √ −λπ C 1 + e −√ −λπ C 2 = 0 (x = π)<br />

Yhtälöparilla on 0:sta eroavia ratkaisuja vain jos kerroindeterminantti on nolla<br />

1 1<br />

∣ e √ −λπ<br />

e −√ −λπ ∣ = e√ −λπ − e −√−λπ = 0<br />

⇐⇒ e 2√ −λπ = 1<br />

=⇒ 2 √ −λπ = 2nπi , n ∈ Z<br />

=⇒ λ n = n 2<br />

Vastaavat ominaisfunktiot (merk. C 1 = C/(2i) (⇒ C 2 = −C/(2i)) ovat<br />

u n = C 2i<br />

(<br />

e inx − e −inx) = Csin(x) (3.16)<br />

Lisäksi huomataan, että n = 0, u 0 ei ole ratkaisu ja -n ja n antavat saman λ n :n, jota vastaavat u n ja<br />

u −n = −u n eivät ole lineaarisesti riippumattomat, eli ratkaisu:<br />

Huomioita:<br />

• Ominaisarvot reaalisia.<br />

Ominaisarvot λ n = n 2<br />

Ominaisfunktiot u n = sin(nx)<br />

• Ominaisarvot alhaalta, muttei ylhäältä rajoitettuja<br />

, n ∈ N<br />

• Jokaista ominaisarvoa vastaa yksi ominaisfunktio. Jos useampia lin. riippumattomia,<br />

niin ominaisarvo on degeneroitunut.<br />

• u n :llä n-1 nollakohtaa välillä (a, b).<br />

• u n+1 :llä täsmälleen yksi nollakohta u n :n kahden peräkkäisen 0-kohdan välillä.<br />

• Eri ominaisarvoihin liittyvät ominaisfunktiot ortogonaalisia (L 2 :ssa), ts. m ≠ n ⇒<br />

∫ b<br />

a u n(x)u m (x)dx = 0 (w(x)=1).<br />

• Ominaisfunktiot u n , n = 1, 2, . . . muodostavat täydellisen funktiojoukon (FyMM Ib).<br />

”Mikä tahansa” F voidaan kehittää F (x) = ∑ a k u k (x) (Fourier’n sinisarja).


20<br />

3.2 Itseadjungoidut operaattorit<br />

Kompleksiarvoisille funktioille voidaan määritellä skalaaritulo eli sisätulo<br />

〈f|g〉 =<br />

∫ b<br />

a<br />

f ∗ (x)g(x)dx (3.17)<br />

Nyt jokaiselle lineaariselle operaattorille A voidaan määritellä adjungoitu operaattori A † , jolle<br />

kaikille annetut reunaehdot toteuttaville f ja g.<br />

Esimerkki 3.1 A = d<br />

dx<br />

, reunaehdot f(a) = f(b) = 0.<br />

〈f|Ag〉 =<br />

〈f|Ag〉 = 〈A † f|g〉 (3.18)<br />

∫ b<br />

a<br />

/ b<br />

a<br />

f ∗ (x) dg(x)<br />

dx<br />

dx<br />

= f ∗ g −<br />

} {{ }<br />

0<br />

∫ b<br />

a<br />

df ∗ (x)<br />

dx<br />

g(x)dx<br />

= −〈 df<br />

dx |g〉 =⇒ A† = − d<br />

dx<br />

Esimerkki 3.2 A = d2<br />

dx 2 , reunaehdot f(a) = f(b) = 0.<br />

〈f|Ag〉 =<br />

∫ b<br />

a<br />

/ b<br />

a<br />

f ∗ (x) d2 g(x)<br />

dx 2 dx<br />

= f ∗ dg −<br />

dx<br />

} {{ }<br />

0<br />

/ b<br />

df ∗<br />

= −<br />

a<br />

dx g<br />

} {{ }<br />

0<br />

∫ b<br />

a<br />

∫ b<br />

+<br />

a<br />

df ∗ (x)<br />

dx<br />

= 〈Af|g〉 =⇒ A † = A<br />

dg(x)<br />

dx<br />

dx<br />

d 2 f ∗ (x)<br />

dx 2 g(x)dx<br />

Operaattori A, jolle A † = A, kuten yo. esimerkissä on itseadjungoitu eli hermiittinen. Matemaatikot<br />

tosin tekevät eron näiden käsitteiden välillä liittyen operaattoreiden määrittelyjoukkoihin (palataan<br />

myöhemmin). S-L-operaattorille (3.1) (p(x),q(x) reaalisia) pätee<br />

〈Lu|v〉 − 〈u|Lv〉 =<br />

ja lisäksi ”Lagrangen identiteetti” (FyMM IIa):<br />

Yhdistämällä nämä saadaan<br />

Reunaehdot:<br />

∫ b<br />

v(Lu) ∗ − u ∗ (Lv) = vLu ∗ − u ∗ Lv = d<br />

dx<br />

〈Lu|v〉 − 〈u|Lv〉 = −<br />

a<br />

/ a<br />

b<br />

v(Lu) ∗ − u ∗ (Lv)dx. (3.19)<br />

[<br />

)]<br />

−p(x)<br />

(v du∗ dv<br />

− u∗ . (3.20)<br />

dx dx<br />

)<br />

p(x)<br />

(v du∗ dv<br />

− u∗ . (3.21)<br />

dx dx


21<br />

1) Säännöllinen S-L ongelma<br />

A 1 u ∗ (a) + A 2 u ′ (a) ∗ = 0<br />

A 1 v(a) + A 2 v ′ (a) = 0.<br />

Olkoon ensin A 2 ≠ 0, jolloin u ′ (a) ∗ = −A 1 /A 2 u ∗ (a) ja v ′ (a) = −A 1 /A 2 v(a) ja<br />

v(a)u ′ (a) ∗ − u(a) ∗ v ′ (a) = − A 1<br />

A 2<br />

(v(a)u(a) ∗ −u(a) ∗ v(a)) = 0.<br />

Jos taas A 2 = 0, A 1 ≠ 0, niin reunaehto on u(a) = v(a) = 0 jolloin<br />

Vastaavalla tavalla päätellään, että<br />

2) Singulaarinen S-L ongelma<br />

v(a)u ′ (a) ∗ −u(a) ∗ v ′ (a) = 0. (3.22)<br />

v(b)u ′ (b) ∗ − u(b) ∗ v ′ (b) = 0. (3.23)<br />

• p(b) = 0, jolloin 3.2:sta seuraa<br />

/ a )<br />

− p(x)<br />

(v du∗ dv<br />

− u∗ = 0 · (v(b)u ′ (b) ∗ − u(b) ∗ v ′ (b)) − p(a) · 0 = 0.<br />

b<br />

dx dx<br />

• p(a) = 0, jolloin 3.3:sta seuraa<br />

/ a )<br />

− p(x)<br />

(v du∗ dv<br />

− u∗ = 0 · p(b) − 0 · (v(a)u ′ (a) ∗ − u(a) ∗ v ′ (a)) = 0.<br />

b<br />

dx dx<br />

• p(a) = p(b) = 0, jolloin sijoitustermi on triviaalisti 0.<br />

Kaikissa tapauksissa siis<br />

〈Lu|v〉 = 〈u|Lv〉, (3.24)<br />

eli S-L-operaattori on itseadjungoitu luvun alussa annetuilla reunaehdoilla. Huomaa, että muilla reunaehdoilla<br />

näin ei välttämättä ole. Lopuksi vielä pari huomiota, jotka ovat osa Sturmin-Liouvillen<br />

lausetta (seuraava kappale).<br />

Lause 3.1 Itseadjungoidun differentiaalioperaattorin ominaisarvot ovat reaalisia<br />

Todistus 3.1 Olkoon ϕ ominaisfunktio, jolloin<br />

mistä väite tietysti seuraa.<br />

Lϕ = λwϕ<br />

(3.24) =⇒ 〈Lϕ|ϕ〉 − 〈ϕ|Lϕ〉 = 0<br />

=⇒ λ ∗ 〈wϕ|ϕ〉 − λ〈ϕ|wϕ〉 = 0<br />

=⇒ (λ ∗ − λ)<br />

∫ b<br />

a<br />

dxw(x)|ϕ(x)| 2 = 0<br />

w(x) > 0 =⇒ λ ∗ − λ = 0, (3.25)<br />

Lause 3.2 Kahteen erisuureen ominaisarvoon liittyvät ominaisfunktiot ovat (tietyssä mielessä) ortogonaaliset.


22<br />

Todistus 3.2 Olkoon ϕ 1 ja ϕ 2 kahteen erisuureen ominaisarvoon λ 1 ja λ 2 liittyvät ominaisfunktiot.<br />

Nyt (vrt. edellisen lauseen todistus)<br />

λ 1 ≠ λ 2 =⇒<br />

〈Lϕ 1 |ϕ 2 〉 − 〈ϕ 1 |Lϕ 2 〉 = 0<br />

=⇒(λ 1 − λ 2 )<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

dxw(x)ϕ 1 (x) ∗ ϕ 2 (x) = 0<br />

dxw(x)ϕ 1 (x) ∗ ϕ 2 (x) = 0<br />

eli<br />

〈 √ wϕ 1 | √ wϕ 2 〉 = 0. (3.26)<br />

Tyypillisempää on muuttaa Hilbert-avaruuden 3 L 2 [a, b] sisätuloa S-L ongelmaan sopivampaan muotoon<br />

(f|g) :=<br />

∫ b<br />

a<br />

dxw(x)f(x) ∗ g(x), (3.27)<br />

jolloin ominaisfunktiot ovat ortogonaalisia perinteisessä mielessä, kun ne tulkitaan painotetun L 2 -<br />

avaruuden alkioiksi, missä kaava (3.27) määrää sisätulon.<br />

3.3 Sturmin ja Liouvillen lause<br />

Lause 3.3 (Sturm & Liouville) Säännöllisen Sturm-Liouville-yhtälön Lu = λwu ratkaisuilla on<br />

ainakin seuraavat ominaisuudet:<br />

1. Ratkaisuja on olemassa (vain) kun λ = λ k , missä λ k , k = 1, 2, 3, . . . on ääretön jono reaalisia<br />

ominaisarvoja (λ k < λ k+1 ) ja λ k → ∞, kun k → ∞.<br />

2. Jokaista ominaisarvoa vastaa vakiokerrointa vaille yksikäsitteinen ratkaisu u k (”ominaisfunktio”).<br />

3. Ominaisfunktiot ovat ortogonaalisia sisätulon (3.27) suhteen.<br />

4. Ominaisfunktiolla u n on täsmälleen n 0-kohtaa välillä [a,b]. Ominaisfunktion u n+1 jokainen 0-<br />

kohta on kahden u n :n peräkkäisen 0-kohdan välissä.<br />

5. Ominaisfunktioiden joukko muodostaa kannan avaruuteen L 2 ([a, b]) eli jos f ∈ L 2 ([a, b]) ts. f on<br />

neliöintegroituva kyseisellä välillä ja<br />

a k = (u k|f)<br />

(u k |u k ) = ∫ b<br />

a dxw(x)u k(x)f(x)<br />

∫ b<br />

a dxw(x)(u k(x)) 2 ,<br />

niin<br />

∫ b<br />

lim<br />

N→∞ a<br />

∫ b<br />

a<br />

N dx<br />

∣ f(x) − ∑<br />

a k u k (x)<br />

∣<br />

k=1<br />

∞ dx<br />

∣ f(x) − ∑<br />

a k u k (x)<br />

∣<br />

k=1<br />

2<br />

2<br />

=0, eli<br />

=0.<br />

Siis f ja yo. sarjakehitelmä ovat sama funktio L 2 -mielessä.<br />

3 Näistä lisää myöhemmin


23<br />

Lauseen tarkka todistus löytyy oppikirjoista (Esim. N. Young: An Introduction to Hilber Space, Cambridge<br />

University Press, 1988).<br />

FyMM I:llä esitetty Parsevalin kaava Fourier-sarjoille yleistyy Sturmin-Liouvillen lauseen avulla myös<br />

S-L yhtälön ominaisfunktioille:<br />

(f|f) =<br />

=<br />

=<br />

=<br />

∫ b<br />

a<br />

dxw(x)|f(x)| 2<br />

∞∑<br />

a ∗ k a l<br />

k,l=1<br />

∫ b<br />

a<br />

∞∑<br />

(u k |u k )|a k | 2<br />

k=1<br />

dxw(x)u ∗ k u l<br />

∞∑<br />

||u k || 2 |a k | 2 , (3.28)<br />

k=1<br />

missä on otettu käyttöön myös sisätulon (·|·) määräämä normi.<br />

Pyritään tässä todistamaan 0-kohtien olemassaolo, eli 1-kohta, niin 4-kohta seuraa todistuksesta itsestään.<br />

Kohdat 2 ja 3 todistimme jo aiemmin. Tätä varten muutetaan S-L yhtälö Lu = λwu sijoituksella<br />

z(x) = √ p(x)u(x) muotoon<br />

d 2 z(x)<br />

dx 2 + (Q(x) + λR(x)) z(x) = 0, missä (3.29)<br />

Q(x) = 1 (<br />

(p ′<br />

4p(x) 2 (x)) 2 − 2p(x)p ′ (x) − 4p(x)q(x) )<br />

ja<br />

R(x) = w(x)<br />

p(x) . (3.30)<br />

Huomaa, että kerroinfunktioille asetetuista ehdoista seuraa, että Q ja R hyvin määriteltyjä ja jatkuvia<br />

sekä lisäksi R(x) ≥ 0. Cronströmin ($ 6.4.1-2) todistuksen rakenne:<br />

1. Kiinnitetään λ ∈ C ja ratkaistaan 3.29 alkuehtona z(a) = 0, z ′ (a) = 1, josta saadaan ratkaisu<br />

z(λ, x) (Diff.yhtälöiden olemassaolo- ja yksikäsitteisyyslause).<br />

2. Osoitetaan, että kiinteällä x z(λ, x) on λ:n kokonainen funktio (ei napoja tai muita singulariteettejä).<br />

3. Huomataan, että jos λ on ominaisarvo, niin z(λ, b) = 0.<br />

4. Funktioteoriasta tuttu lause: Nollasta eroavalla kokonaisella funktiolla on korkeintaa numeroituva<br />

määrä 0-kohtia. Lisäksi ∞ on ainoa mahdollinen kasautumispiste. Eli jos ominaisarvoja on<br />

ääretön määrä, niin ne voidaan järjestää jonoon s.e. |λ k | → ∞.<br />

5. Tiedetään jo, että λ k ∈ R, joten osoitetaan että on olemassa ¯λ s.e. ¯λ < λ n kaikilla n, jolloin<br />

λ 1 < λ 2 < λ 3 < . . ., kun ominaisarvot numeroidaan sopivasti.<br />

Todistetaan tässä sama tulos käyttämättä funktioteoriaa (ja huomataan samalla tapa laskea ominaisarvoja<br />

numeerisesti). Todistetaan ensin muutama aputulos.<br />

Lause 3.4 (1. nollakohtalause) Olkoot y(x) ja Y(x) differentiaaliyhtälöiden<br />

d 2 y(x)<br />

dx 2 + q(x)y(x) = 0 ja<br />

d 2 Y (x)<br />

dx 2 + Q(x)Y (x) = 0<br />

ratkaisuja. Jos nyt a ja b (a < b) ovat kaksi ratkaiun Y 0-kohtaa (Y (a) = Y (b) = 0) ja kaikilla<br />

x ∈ [a, b] pätee q(x) ≥ Q(x) eikä yhtäsuuruus päde identtisesti, niin tällöin ratkaisulla y on vähintään<br />

yksi 0-kohta välillä [a, b].


24<br />

Todistus 3.3 Tehdään vastaoletus y(x) ≠ 0 välillä [a,b], eli voidaan jakaa y:llä ja pätee<br />

[<br />

d Y (<br />

yY ′ − y ′ Y )] ∣ ∣∣x<br />

dx y<br />

∣<br />

= Y ′2 + Y }{{} Y ′′ − y′′<br />

Y 2 + y′2<br />

y y<br />

−QY }{{}<br />

2 Y 2 − 2 y′ ∣∣∣x<br />

y Y Y ′<br />

) 2 ∣<br />

= Y 2 (q − Q) +<br />

(Y ′ − y′ ∣∣∣x<br />

y Y<br />

q<br />

Oletuksen mukaan q(x) − Q(x) ≤ 0 joten yo. derivaatta on epänegatiivinen, ja koska q(x) = Q(x) ei<br />

päde identtisesti, niin ainakin jollain välillä se on aidosti positiivinen. Nyt integroimalla a:sta b:hen<br />

saadaan<br />

0 <<br />

∫ b<br />

a<br />

/ b<br />

=<br />

a<br />

dx d<br />

dx<br />

[ Y (x)<br />

y(x)<br />

[ Y (x)<br />

y(x)<br />

(<br />

y(x)Y ′ (x) − y ′ (x)Y (x) )]<br />

(<br />

y(x)Y ′ (x) − y ′ (x)Y (x) )] = 0,<br />

koska Y (a) = Y (b) = 0, mikä on tietysti ristiriita ja täytyy olla y(x) = 0 jossakin välin pisteessä.<br />

Lause 3.5 (2. nollakohtalause) Jokaisella differentiaaliyhtälön<br />

d 2 y(x)<br />

dx 2 + f(x)y(x) = 0<br />

ratkaisulla on välillä a ≤ x < ∞ äärettömän monta nollakohtaa, mikäli f on jatkuva ja f(x) ≥ m 2 > 0<br />

jollakin m tällä välillä. Lisäksi kahden peräkkäisen nollakohdan välinen etäisyys on korkeintaan π/m.<br />

Toisaalta, jos f(x) ≤ −m 2 < 0 jollakin m tällä välillä, niin jokaisella ratkaisulla on korkeintaan yksi<br />

nollakohta samalla välillä.<br />

Todistus 3.4 f(x) ≥ m 2 . Verrataan yhtälöitä y ′′ + fy = 0 ja Y ′′ + m 2 Y = 0, joista jälkimmäisen<br />

ratkaisu on Y (x) = sin(m(x − δ)). Y:n nollakohdat ovat pisteissä x k = δ + kπ m<br />

, k ∈ Z. Koska oletuksen<br />

mukaan f(x) ≥ m 2 on yhtälön y ′′ +fy = 0 ratkaisulla 1. nollakohtalauseen mukaan 1 nollakohta välillä<br />

[x k , x k+1 ] (k valittu s.e. x k ≥ a), toinen välillä [x k+1 , x k+2 ] jne., eli äärettömän monta nollakohtaa.<br />

Lisäksi kahden peräkkäisen nollakohdan väli < π/m, sillä muuten δ:n sopivalla valinnalla voitaisiin<br />

konstruoida tilanne, jossa y:n nollakohdista yksikään ei osuisi välille [x n , x n+1 ] jollakin n.<br />

f(x) ≤ −m 2 . Verrataan yhtälöitä y ′′ + fy = 0 ja Y ′′ − m 2 Y = 0. Jos ensimmäisen yhtälön ratkaisulla<br />

olisi 2 nollakohtaa x 1 ja x 2 (x 1 < x 2 ), niin 1. nollakohtalauseen mukaan jälkimmäisen yhtälön jokaisella<br />

ratkaisulla olisi ainakin yksi nollakohta välillä [x 1 , x 2 ]. Kuitenkaan esimerkiksi funktiolla Y (x) = e mx ,<br />

joka ratkaisee jälkimmäisen yhtälön, ei ole nollakohtaa millään reaaliluvulla, eikä siis myöskään välillä<br />

[x 1 , x 2 ]. y:llä voi siis olla korkeintaan yksi nollakohta.<br />

Palataan taas S-L yhtälön pariin, joka oltiin jo muutettu muotoon (3.29), missä R ja Q jatkuvia ja R<br />

epänegatiivinen. Jatketaan R ja Q (jatkuvasti) alueeseen x > b kaavoilla<br />

R(x) = R(b) ja Q(x) = Q(b) , kun x > b.<br />

Nyt differentiaaliyhtälöiden olemassaolo- ja yksikäsitteisyyslauseen mukaan yhtälöllä (3.29) on jokaisella<br />

λ välillä [a,B] B > b yksikäsitteinen ratkaisu z(λ, x), joka toteuttaa ehdot z(a) = 0, z ′ (a) = 1.<br />

Koska Q ja R ovat jatkuvia ja siten rajoitettuja, löytyy aina ¯λ s.e. Q(x) + ¯λR(x) ≤ −m 2 < 0 välillä


25<br />

[a,B]. 2. nollakohtalauseen mukaan ratkaisuilla z(λ, x) ei ole toista nollakohtaa (z(λ, a) = 0) kun λ ≤ ¯λ,<br />

joten ei löydy ¯λ:a pienempiä ominaisarvoja. Toisaalta löydetään myös ¯λ, jolle<br />

( ) π 2<br />

Q(x) + ¯λR(x) ≥ > 0.<br />

B − a<br />

2. nollakohtalauseen nojalla z(¯λ, x):llä on väh. yksi nollakohta x0 välillä [a,B], aluksi välillä [b,B]. Kun<br />

λ kasvaa x 0 lähestyy b:tä ylhäältä ja kun λ = λ 1 , x 0 = b. Nyt λ 1 on ominaisarvo ja z(λ 1 , x) on sitä<br />

vastaava ominaisfunktio, jolla on nollakohdat a:ssa ja b:ssä (muttei niiden välissä). Annetaan λ:n kasvaa<br />

edelleen. z(λ, x):n 3. nollakohta lähestyy x = b:tä, ja kun λ = λ 2 z(λ 2 , b) = 0. Nyt z 2 (x) := z(λ 2 , x)<br />

on ominaisfunktio, jolla on yksi nollakohta välillä [a,b]. Jatkamalla iterointia saadaan ääretön määrä<br />

ominaisarvoja ja -funktioita. Nyt λ k :t ovat S-L yhtälön ominaisarvot ja funktiot u k = z(λ k , x)/ √ p(x)<br />

niitä vastaavat ominaisfunktiot.<br />

Ominaisarvojen löytäminen ”shooting-metodilla”.<br />

Arvataan jokin λ ja integroidaan numeerisesti diff.yhtälöä (3.29) alueeseen x > b jatketuilla Q ja R ja<br />

alkuarvoilla z(a)=0, z’(a)=1. Muutetaan λ:aa kunnes 0-kohta osuu b:hen (merkitään tätä λ:aa ˆλ:lla.<br />

Tarkastetaan, kuinka monta nollakohtaa zˆλ:lla on välillä (a,b). Jos zˆλ:lla oli n nollakohtaa, niin löysimme<br />

(n+1):nnen ominaisfunktion. Nyt voidaan pienentää λ:aa ja etsiä n:s,(n-1):s,(n-2):s,... ja ensimmäinen<br />

ominaisfunktio. Tämän jälkeen voidaan kasvattaa λ:aa ja etsiä korkeampia ominaisfunktioita<br />

niin paljon kuin tarvitsee.<br />

Huomautus 3.1 Sturmin ja Liouvillen lause ei päde yleisesti singulaarisille S-L ongelmille! Esimerkiksi<br />

periodisilla reunaehdoilla ei voi olettaa, että Sturmin Liouvillen lauseen tulokset olisivat voimassa.<br />

Yllä olevasta huomautuksesta vielä esimerkki, eli vastaesimerkki sille, että Sturmin Liouvillen lause<br />

yleistyisi koskemaan myös singulaarisia ongelmia.<br />

Esimerkki 3.3 Tutkitaan yhtälöä<br />

(<br />

d<br />

x 2 du )<br />

+ λu = 0 (3.31)<br />

dx dx<br />

välillä x ∈ [0, 1], eli a = 0 ja b = 1. Koska p(a) = 0, yhtälö on singulaarinen. Otetaan vielä reunaehdoiksi<br />

u(b) = 0 ja |u(0)| < ∞. Nyt<br />

(3.31) ⇐⇒ x 2 u ′′ + 2xu ′ + λu = 0<br />

Yrite u(x) = x n =⇒p(p − 1) + 2p + λ = p 2 + p + λ = 0<br />

=⇒p = − 1 2 ± √<br />

1<br />

4 − λ<br />

λ ≠ 1 4 . p − = − 1 2 − √ 1/4 − λ ja p + = − 1 2 + √ 1/4 − λ erisuuret. Yleinen ratkaisu on<br />

ja reunaehdosta u(1) = 0 saadaan<br />

u(x) = C 1 x p −<br />

+ C 2 x p +<br />

C 1 + C 2 = 0 ⇐⇒ C 1 = −C 2 .<br />

Ratkaisu on siis u(x) = C(x p −<br />

−x p +<br />

). Kuitenkin jos λ < 1/4, niin p − < 0, joten x → 0 ⇒ u(x) → ±∞.<br />

Toisaalta jos λ > 1/4, niin Re(p − ) = Re(p + ) = −1/2, joten |u(x)| ≈ 1/ √ x → ∞, kun x → 0. Ei siis<br />

löydy reunaehtoja toteuttavia ratkaisuja jos λ ≠ 1/4.<br />

λ = 1 4 . Toinen ratkaisu on u 1(x) = √ 1<br />

x<br />

ja toinen saadaan vakion varioinnilla:<br />

u(x) = C(x)/ √ x ⇒ C(x) = ln(x).


26<br />

Yleinen ratkaisu on siis u(x) = 1 √ x<br />

(C 1 + C 2 ln(x)). Lisäksi reunaehto<br />

u(1) = C 1<br />

√<br />

1<br />

= 0 ⇒ C 1 = 0,<br />

eli<br />

u(x) = Cln(x)/ √ x , joten |u(x)| −→ ∞ , kun x → 0.<br />

Yhtälöllä ei siis ole ominaisarvoja eikä -funktioita.<br />

Kuitenkin koska L on itseadjungoitu, aina pätee: Jos ominaisarvo on olemassa, se on reaalinen ja<br />

erisuuria ominaisarvoja vastaavat ominaisfunktioit ovat ortogonaalisia.<br />

Esimerkki 3.4 Periodiset reunaehdot.<br />

Tutkitaan yhtälöä<br />

välillä x ∈ [0, π], reunaehdoilla<br />

d 2 u<br />

+ λu = 0 (3.32)<br />

dx2 u(0) = u(π) (3.33)<br />

u ′ (0) = u ′ (π). (3.34)<br />

Merk. α = √ −λ, jolloin yleinen ratkaisu on u(x) = C 1 e αx + C 2 e −αx . Reunaehdot:<br />

(3.33) =⇒ C 1 + C 2 = C 1 e απ + C 2 e −απ<br />

(3.34) =⇒ α(C 1 − C 2 ) = α(C 1 e απ − C 2 e −απ )<br />

α = 0 kelpaa ja tätä vastaava ominaisfunktio on u ≡ C = vakio. Oletetaan sitten, että α ≠ 0 ja jaetaan<br />

se pois toisesta reunaehdosta:<br />

(3.33) =⇒ C 1 (1 − e απ ) + C 2<br />

(<br />

1 − e<br />

−απ ) = 0<br />

(3.34) =⇒ C 1 (1 − e απ ) − C 2<br />

(<br />

1 − e<br />

−απ ) = 0<br />

Jotta olisi nollasta eroava ((C 1 , C 2 ) ≠ ¯0) ratkaisu, ryhmän determinantin on oltava nolla, eli<br />

−2 (1 − e απ ) ( 1 − e −απ) = 0<br />

⇐⇒ e ±απ = 1<br />

⇐⇒ απ = 2nπi<br />

n ∈ Z<br />

=⇒ λ n = −α 2 n = 4n 2 .<br />

Ominaisarvoa λ = 4n 2 vastaa kaksi riippumatonta ominaisfunktiota<br />

u n+ = e 2nix ja u n− = e −2nix<br />

tai reaaliset<br />

u (1)<br />

n = cos(2nx) ja u (2)<br />

n = sin(2nx)<br />

Edellisessä esimerkissä ominaisarvot n ≠ 0 olivat kahdesti degeneroituneet. Monelle singulaariselle S-L<br />

ongelmalle ja sekareunaehto-ongelmalle voidaan kuitenkin johtaa Sturmin Liouvillen lauseen kaltaisia<br />

tuloksia mm. variaatiolaskennan keinoin (Katso esim. R. Courant, D. Hilbert: Methods of Mathematical<br />

Physics, vol.1, luku 6)


27<br />

3.4 S-L operaattorin Greenin funktio<br />

Seuraavaksi tavoitteena on löytää yleiselle S-L operaattorille Greenin funktio. Aputuloksena tarvitsemme<br />

aluksi ominaisfunktiokehitelmän δ-funktiolle. Olkoon f ∈ L 2 ([a, b]), jolloin<br />

f(x) =<br />

∞∑<br />

a n ϕ n (3.35)<br />

n=1<br />

L x ϕ n (x) = λ n w(x)ϕ n (x) (3.36)<br />

a n = (ϕ n, f)<br />

(ϕ k , ϕ k ) := ∫ b<br />

a dxw(x)ϕ k(x)f(x)<br />

∫ b<br />

a dxw(x)ϕ k(x) 2 (3.37)<br />

Sijoittamalla a n :n lauseke(3.37) f:n sarjakehitelmään (3.35) ja vaihtamalla summauksen ja integroinnin<br />

järjestystä saamme<br />

∫ b<br />

∞∑ ϕ n (y)ϕ n (x)<br />

f(x) = dyw(y)<br />

f(y), (3.38)<br />

(ϕ n , ϕ n )<br />

mistä päättelemme<br />

a<br />

n=1<br />

∞∑ ϕ n (y)ϕ n (x)<br />

δ(x − y) = w(y)<br />

(ϕ<br />

n=1 n , ϕ n )<br />

(3.39)<br />

∞∑ ϕ n (y)ϕ n (x)<br />

= w(x)<br />

(ϕ<br />

n=1 n , ϕ n )<br />

(3.40)<br />

= √ ∞∑ ϕ n (y)ϕ n (x)<br />

w(x)w(y)<br />

.<br />

(ϕ n , ϕ n )<br />

(3.41)<br />

Kaksi alinta yhtälöä seuraavat δ-funktion ominaisuudesta f(x)δ(x − y) = f(y)δ(x − y).<br />

Sturm-Liouville -operaattorin Greenin funktio. Muistellaan aluksi että epähomogeenisen differentiaaliyhtälön<br />

L x u(x) = f(x) (3.42)<br />

erikoisratkaisu löydettiin etsimällä ensin operaattorin Greenin funktio G joka toteuttaa<br />

n=1<br />

L x G(x, y) = δ(x − y) . (3.43)<br />

Sen jälkeen erikoisratkaisu u E (x) saatiin kaavasta<br />

∫<br />

u E (x) = dy G(x, y)f(y) . (3.44)<br />

(Lisäksi täytyy tarkistaa että u E (x) toteuttaa siltä vaaditut reunaehdot, ratkaisua voitiin "säätää"muuttamalla<br />

Greenin funktiota käyttämällä homogeenisen yhtälön ratkaisuja.)<br />

Olkoon nyt L x Sturm-Liouville differentiaalioperaattori<br />

L x = − d<br />

dx<br />

[<br />

p(x) d<br />

dx<br />

]<br />

+ q(x) . (3.45)<br />

Etsitään epähomogeenisen differentiaaliyhtälön ratkaisu u E joka toteuttaa S-L reunaehdot<br />

A 1 u E (a) + A 2 u ′ E(a) = 0 (3.46)<br />

B 1 u E (b) + B 2 u ′ E(b) = 0 . (3.47)


28<br />

Muistetaan ensin että myös L x :n ominaisfunktiot ϕ k (x),<br />

L x ϕ k (x) = λw(x)ϕ k (x) (3.48)<br />

toteuttavat nämä reunaehdot.<br />

Arvataan että oikea Greenin funktio on muotoa<br />

G(x, y) = ∑ k<br />

1 ϕ k (x)ϕ k (y)<br />

λ k (ϕ k , ϕ k )<br />

. (3.49)<br />

Yksi perustelu tälle arvaukselle löytyy luentokalvoista. Tässä tyydymme vain tarkistamaan että arvaus<br />

on OK. Ensin joitakin kommentteja:<br />

1. Kaavassa (3.49) summataan yli kaikkien ominaisfunktioiden ja -arvojen.<br />

2. (3.49) on hyvin määritelty vain jos kaikki ominaisarvot λ k ≠ 0.<br />

3. Normitustekijä (ϕ k , ϕ k ) = ∫ dx w(x)ϕ ∗ k (x)ϕ k(x) sisällytetään kaavaan jos ϕ k ei ole vielä normitettu<br />

siten että (ϕ k , ϕ k ) = 1.<br />

Nyt sitten tarkistus:<br />

L x G(x, y) = ∑ k<br />

= w(x) ∑ k<br />

1 (L x ϕ k (x))ϕ k (y)<br />

λ k (ϕ k , ϕ k )<br />

ϕ k (x)ϕ k (y)<br />

(ϕ k , ϕ k )<br />

= δ(x − y) , (3.50)<br />

siis (3.49) totetuttaa ehdon (3.43). Edelleen, koska ominaisfunktiot ϕ k toteuttavat S-L reunaehdot<br />

(3.46), seuraa helposti<br />

A 1 G(a, y) + A 2 ∂ x G(a, y) = 0 (3.51)<br />

B 1 G(b, y) + B 2 ∂ x G(b, y) = 0 . (3.52)<br />

Siispä erikoisratkaisu u E (x) = ∫ dy G(x, y)f(y) toteuttaa myös S-L reunaehdot. Esim:<br />

∫<br />

A 1 u E (a) + A 2 u ′ E(a) = dy (A 1 G(a, y) + A 2 ∂ x G(a, y))f(y) = 0 . (3.53)<br />

Mitä sitten tapahtuu jos jokin ominaisarvoista häviää, λ k = 0? (Käytetään vastaavasta ominaisfunktiosta<br />

merkintää ϕ 0 ja ominaisarvosta merkintää λ 0 . Näistä käytetään usein nimitystä nollamoodi (engl.<br />

zero mode.) Huomaa että S-L teoriassa on korkeintaan yksi nollamoodi, sillä S-L reunaehdoilla ominaisarvot<br />

ja -funktiot eivät ole degeneroituneita.) Kokeillaan onnistuisiko yksinkertainen muokkaus, eli<br />

kävisikö<br />

Ḡ(x, y) = ∑ 1 (L x ϕ k (x))ϕ k (y)<br />

(3.54)<br />

λ k (ϕ k , ϕ k )<br />

λ k ≠0<br />

Greenin funktioksi. (Summaan sisältyvät siis kaikki ominaismoodit paitsi nollamoodi.) Kokeillaan toteuttaako<br />

u(x) = ∫ dy Ḡ(x, y)f(y) epähomogeenisen yhtälön:<br />

∫<br />

L x u(x) = = dy L x Ḡ(x, y)f(y) = ∑ ∫<br />

1<br />

dy (L xϕ k (x))ϕ k (y)<br />

f(y)<br />

λ k (ϕ k , ϕ k )<br />

λ k ≠0<br />

= w(x) ∑ ∫<br />

dy ϕ ∫<br />

∫<br />

k(x)ϕ k (y)<br />

f(y) = dy δ(x − y)f(y) − dy w(x)ϕ 0(x)ϕ 0 (y)<br />

f(y)<br />

(ϕ k , ϕ k )<br />

(ϕ 0 , ϕ 0 )<br />

λ k ≠0<br />

= f(x) − w(x)ϕ 0(x)<br />

(ϕ 0 , ϕ 0 ) 〈ϕ 0|f〉 , (3.55)


29<br />

missä<br />

∫<br />

〈ϕ 0 |f〉 =<br />

dy ϕ 0 (y)f(y) . (3.56)<br />

(Huom. 〈f|g〉 on eri integraali kuin (f, g), jälkimmäinen sisältää painofunktion w.) Tulos kertoo sen<br />

että (3.54) käy Greenin funktioksi nollamooditapauksessa vain jos epähomogeenisen yhtälön lähteen<br />

projektio nollamoodille (3.56) on nolla.<br />

3.5 Sturm-Liouville -ongelma variaatio-ongelmana<br />

Esitämme seuraavaksi miten Sturm-Liouville -ongelmaa voi lähestyä variaatiolaskennan kautta. Ideana<br />

on ensinnäkin löytää funktionaali jota varioimalla S-L ongelman differentiaaliyhtälö saadaan Eulerin<br />

yhtälönä. Toisaalta tiedämme että ongelman ratkaisufunktiot muodostavat ortonormaalin kannan painotetun<br />

sisätulon suhteen. Kanta voidaan edelleen ortonormittaa, jolloin normeeraus voidaan tulkita<br />

sidosehtona. Koska normeeraus sisältää integraalin, se voidaan tulkita globaalina sidosehtona. Näin<br />

päädytään isoperimetriseen ongelmaan. Funktionaali jonka variaatio johtaa S-L yhtälöön on<br />

J S−L [y] =<br />

∫ b<br />

a<br />

dx ( p(x)(y ′ (x)) 2 + q(x)y(x) 2) . (3.57)<br />

Ominaisfunktioden ortonormitus painoten sisätulon kanssa taas johtaa ehtoon<br />

K[y] =<br />

Otetaan käyttöön Lagrangen kertoja λ ja etsitään funktionaalin<br />

L λ [y] =<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

dxw(x)(y(x)) 2 = 1. (3.58)<br />

(<br />

p(x)(y ′ (x)) 2 + (q(x) − λw(x))y(x) 2) + λ<br />

ääriarvot. Tälle funktionaalille Eulerin yhtälön on<br />

(<br />

d<br />

p(x) dy(x) )<br />

+ (q(x) − λw(x))y(x) = 0, (3.59)<br />

dx dx<br />

eli Sturm-Liouville yhtälö kuten edellä todettiin. Lisäksi λ on ominaisarvo ja K[y] = 1 on ominaisfunktion<br />

normitusehto. Nyt on kuitenkin oltava tarkkana reunaehtojen kanssa. Varioidaan y → y + η<br />

ja tutkitaan termin<br />

muutosta.<br />

δ<br />

∫ b<br />

a<br />

dxp(x)(y ′ (x)) 2 = 2<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

p(x)(y ′ (x)) 2<br />

dxp(x)y ′ (x)η ′ (x)<br />

/ b<br />

= 2 p(x)y(x)η(x) − 2<br />

a<br />

∫ b<br />

a<br />

dxη(x) d (<br />

p(x)y ′ (x) ) .<br />

dx<br />

Eulerin yhtälö ääriarvon ehtona pitää siis paikkansa vain jos p(a)y ′ (a)η(a) = p(b)y ′ (b)η(b) = 0. Singulaariselle<br />

ongelmalla p(a) ja/tai p(b) = 0, jolloin η(a) ja/tai η(b) voivat olla mielivaltaisia. Säännölliselle<br />

ongelmalle (p = a tai b) y(p) = 0 ⇒ η(p) = 0 ja y ′ (p) = 0 ⇒ η(p) voi olla mielivaltainen. Kuitenkin<br />

yleiselle homog. reunaehdolle<br />

A 1 y(p) + A 2 y ′ (p) = 0<br />

myös variaatio toteuttaa tämän eikä sijoitustermi välttämättä häviä. Kun S-L yhtälöä halutaan käsitellä<br />

variaatio-ongelman Eulerin yhtälönä on siis rajoituttava reunaehtoihin<br />

p(a)y(a)y ′ (a) = p(b)y(b)y ′ (b) = 0. (3.60)


30<br />

Oletamme jatkossa, että reunaehdot ovat voimassa 4 .<br />

Funktiot u k , jotka stationarisoivat J S−L [y]:n ovat siis S-L ongelman ominaisfunktiot, eli toteuttavat<br />

− d (<br />

p(x) du )<br />

k(x)<br />

+ q(x)u k (x) = λ k w(x)u k (x) ja<br />

dx dx<br />

∫ b<br />

a<br />

dxw(x)u m (x)u n (x) = δ nm .<br />

Ominaisfunktiot muodostavat täydellisen funktiojoukon, joten voidaan kehittää<br />

y(x) = ∑ k<br />

=⇒ J[y] = ∑ k,l<br />

= ∑ k<br />

a k u k (x)<br />

∫ b<br />

a k λ l a l dxw(x)u k (x)u l (x)<br />

a<br />

λ k a 2 k (3.61)<br />

ja<br />

K[y] = ∑ k<br />

a 2 k = 1 (3.62)<br />

Olkoon λ 0 pienin ominaisarvo (λ k ≥ λ 0 kaikilla k). Jos λ 0 ei ole degeneroitunut J[y] saavuttaa globaalin<br />

miniminsä λ 0 , kun y(x) = u 0 (x) (a 2 0 = 1)5 . Voidaan siis kirjoittaa<br />

λ 0 = inf u∈D(L)<br />

J[u]<br />

K[u] ,<br />

missä D(u) on joukko funktioita joille vastaava S-L operaattori L on hyvin määritelty. Huom! funktioluokan<br />

yleien alkio u ei ole ominaisfunktio, joten K[u] ≠ 1 yleensä. Pienintä ominaisarvoa voidaan yrittää<br />

etsiä rajoittumalla sopiviin yritefunktiohin u(α 1 , . . . , α p ) jotka riippuvat parametreista α 1 , . . . , α p<br />

ja jotka toteuttavat vaaditut reunaehdot, ja varioimalla parametrejä. Tätä likiarvomenetelmää kutsutaan<br />

Rayleighin ja Ritzin menetelmäksi. Samantapaista menetelmää käytetään kvanttimekaniikassa<br />

Hamilton-operaattorin pienimmän ominaiarvon (eli systeemin perustilan energian) etsintään.<br />

3.6 Rayleighin ja Ritzin menetelmä<br />

Etsitään pienimmälle ominaisarvolle λ 0 likiarvoa aloittamalla parametreista (α 1 , . . . , α p ) riippuvasta<br />

yritteestä u(α 1 , . . . , α p ). Lasketaan ensin<br />

J[u(α 1 , . . . , α p )] = F (α 1 , . . . , α p )<br />

K[u(α 1 , . . . , α p )] = G(α 1 , . . . , α p )<br />

, sekä<br />

ja minimoidaan tämän jälkeen F (α 1 , . . . , α p ) ehdolla G(α 1 , . . . , α p ) = 1. Otetaan käyttöön Lagrangen<br />

kerroin λ. Eulerin yhtälöt ovat:<br />

Ratkaisu antaa ylärajan miniarvolle.<br />

∂<br />

∂a j<br />

(F (α 1 , . . . , α p ) + λG(α 1 , . . . , α p )) = 0 (3.63)<br />

G(α 1 , . . . , α p ) − 1 = 0 (3.64)<br />

4 Periaatteessa pintatermi voitaisiin hävitää myös ehdolla p(a)y(a)y ′ (a) − p(b)y(b)y ′ (b) = 0. Tämän ehdon ongelma<br />

on se että se on oleellisesti periodinen reunaehto, jonka ominaisarvot saattavat olla degeneroituneita kuten yllä näimme.<br />

S-L ongelmassahan asetettiin reunaehdot erikseen päätepisteissä x = a, b, joten siksi teemme samantapaisen rajoituksen<br />

variaatio-ongelman reunaehtoihin.<br />

5 Jos λ 0 olisi deneroitunut ja sitä vastaa ominaisfunktiot u (1)<br />

0 , u(2) 0 , . . . , u(N) 0 , niin mikä tahansa näiden lineaarikombinaatio<br />

minimoi J:n.


31<br />

3.6.1 Esimerkki: Patarummun säveltaajuus<br />

Orkesterin patarummut ovat rumpuja jotka on suunniteltu niin että värisevän kalvon perustaajuus (eli<br />

matalin ominaistaajuus) vahvistuu siten että rummun äänessä erottuu selvä säveltaajuus. Patarummut<br />

viritetään eri taajuuksiin ja orkesteripartituurissa ne nuotinnetaan sävelinä kuten muut instrumentit.<br />

Rumpukalvo on kiekon muotoinen ja kiinni reunoistaan. Sen värähtelyjä kuvaa siten 2+1 ulotteinen<br />

aaltoyhtälö joka on luontevaa ratkaista napakoordinaateissa, Dirichlet’n reunaehdolla u(R, φ) = 0<br />

missä R on rumpukalvon säde. Kuten <strong>Fymm</strong> IIa:lla opittiin, yhtälön separointi johtaa radiaaliselle<br />

osalle Besselin yhtälöön<br />

y ′′ + 1 x + λy = 0 ,<br />

missä x = r/R on uudelleen skaalattu radiaalinen koordinaatti. Reunaehdot ovat nyt y(1) = 0 ja y(x)<br />

säännöllinen origossa (muuten kalvo repeää). Ominaisarvo λ = R 2 ω 2 /v 2 missä v on äänen nopeus<br />

kalvolla, ja ω = 2πf missä f on kuultava taajuus. <strong>Fymm</strong> IIa:lla opimme toki ratkaisemaan Besselin<br />

yhtälön ja sen ominaisarvot eksaktisti, mutta seuraavaksi harjoittelemme Rayleighin ja Ritzin menetelmää.<br />

Kirjoitetaan ensin Besselin yhtälö standardissa S-L muodossa:<br />

− d<br />

dx<br />

(<br />

x dy<br />

dx<br />

)<br />

= λxy .<br />

Näin ollen p(x) = x, q(x) = 0 ja w(x) = x. Etsitään seuraavaksi sopiva yritefunktio. Kalvon värähdellessä<br />

sen profiili vaihtelee x = 0:ssa maksimipoikkeaman ja minimipoikkeaman välillä. Profiilin<br />

Taylor-sarja ääripoikkeamalla on<br />

y(x) = y(0) + 1 2 y′′ (0)x 2 + 1 4! y′′′′ (0)x 4 + · · · ,<br />

parittomat termit häviävät sillä ääriprofiili on parillinen funktio. Näin motivoimme R-R menetelmän<br />

yritefunktioiksi neljännen asteen parilliset polynomit<br />

y(x) = a + bx 2 + cx 4 .<br />

Vaadimme nyt että ne myös toteuttavat annetut reunaehdot. Ehdosta y(1) = 0 seuraa relaatio a+b+c =<br />

0. Valitaan riippumattomiksi parametreiksi b, c. Lasketaan seuraavaksi<br />

ja<br />

J[y] =<br />

K[y] =<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

dx xy ′2 = b 2 + 8 3 bc + 22 = F (b, c)<br />

dx xy 2 = 1 6 b2 + 5<br />

12 bc + 4 15 c2 = G(b, c) .<br />

Etsitään nyt funktionaalin J[y] + λK[y] = F (b, c) + λG(b, c) stationääriset pisteet:<br />

ja<br />

0 = ∂ ∂b (F + λG) = (2 + 1 3 λ)b + (8 3 + 5<br />

12 λ)c<br />

0 = ∂ ∂c (F + λG) = (8 3 + 5 12 λ)b + (4 + 8 15 λ)c .<br />

Eliminoimalla b ja c saadaan yhtälö<br />

3λ 2 − 128λ + 640 = 0 ,<br />

jonka pienin juuri on<br />

λ = 1 3 (64 − √ 2176) ≈ 5, 7841 ,


32<br />

joka ei ole kovin kaukana eksaktista ratkaisusta 5, 7832.<br />

Lopetamme tämän kappaleen pienellä lisätarkastelulla. Olkoon L Sturm-Liouville-operaattori (3.7). Mitkä ovat funktionaalin<br />

F RR [u] = N[u]<br />

D[u]<br />

(3.65)<br />

stationaariset pisteet, kun<br />

∫ b<br />

N[u] = dxu(x)Lu(x)<br />

a<br />

∫ b<br />

=<br />

a<br />

−<br />

dx<br />

[p(x)(u ′ (x)) 2 + q(x)u(x) 2]<br />

(<br />

p(b)u ′ (b)u(b) − p(a)u ′ (a)u(a)<br />

)<br />

(3.66)<br />

ja<br />

∫ b<br />

D[u] = dxw(x)u(x) 2 . (3.67)<br />

a<br />

Olkoon λ n L-operaattorin ominaisarvot ja ϕ n niitä vastaavat normitetut ( ∫ b<br />

a dxw(x)ϕ n(x) 2 = 1) ominaisfunktiot (n ∈ N). Tällöin siis<br />

Lϕ n(x) = λ nw(x)ϕ n(x)<br />

∫ b<br />

dxw(x)ϕ n(x)ϕ m(x) = δ nm.<br />

a<br />

ja<br />

Jos kyseessä on säännöllinen ongelma, niin ϕ n : n ∈ N on täydellinen ja voidaan kirjoittaa<br />

∞∑<br />

u(x) = a nϕ n(x), (3.68)<br />

n=1<br />

joten<br />

∞∑ ∞∑<br />

∫ b<br />

N[u] =<br />

a ma n dxϕ m(x)Lϕ m(x)<br />

n=1 m=1<br />

a<br />

∞∑ ∞∑<br />

=<br />

a ma nλ nδ mn<br />

n=1 m=1<br />

=<br />

∞∑<br />

λ na 2 n (3.69)<br />

n=1<br />

ja<br />

sekä<br />

Stationaariset pisteet:<br />

eli<br />

∞∑<br />

D[u] = a 2 n (3.70)<br />

n=1<br />

F RR [u] = N[u] ∑ ∞n=1<br />

D[u] = λ na 2 n<br />

∑ ∞n=1 a 2 =: f RR (a 1 , a 2 , . . .). (3.71)<br />

n<br />

∂f RR<br />

∂a i<br />

= 2λ ia i<br />

∑ ∞n=1 a 2 n<br />

2a i<br />

− F RR [u] ∑ ∞n=1 a 2 = 0<br />

n<br />

∑ ∞n=1<br />

λ na 2 n<br />

λ i = F RR [u] = ∑ ∞n=1 a 2 . (3.72)<br />

n<br />

Ratkaisu: a n = 0, kun n ≠ i ja a i mielivaltainen sekä u(x) = a i ϕ i (x). Lisäksi F [a i ϕ i ] = λ i riippumatta a i :n arvosta. Minimin F [a 1 ϕ 1 ] = λ 1 antava<br />

ϕ 1 on vakiokerrointa vaille yksikäsitteinen ja muut ratkaisut ovat satulapisteitä. Kuitenkin funktiot a nϕ n on funktionaalin F RR minimejä avaruudessa<br />

{<br />

F n = u(x) :<br />

∫ b<br />

a<br />

}<br />

dxw(x)u(x)ϕ k (x) = 0, k = 1, 2, . . . , n − 1<br />

(3.73)<br />

4 Hilbertavaruuksista<br />

4.1 Vektori-, normi- ja sisätuloavaruudet<br />

Tästä eteenpäin skalaarikunta on K = C tai R. Määritellään, että joukko V on (K-kertoiminen)<br />

vektoriavaruus, jos jokaista paria ¯v, ū ∈ V vastaa kolmas alkio ū + ¯v, sekä jokaista paria ū ∈ V ja<br />

a ∈ K vastaa kolmas alkio aū ∈ V s.e.<br />

1. ū + ¯v = ¯v + ū<br />

2. ū + (¯v + ¯w) = (ū + ¯v) + ¯w<br />

3. a(ū + ¯v) = aū + a¯v


33<br />

4. (a + b)ū = aū + bū<br />

5. a(bū) = (ab)ū<br />

6. 1ū = ū<br />

7. ∃ ¯0 s.e. ū + ¯0 = ū ∀ ū ∈ V<br />

8. ∃ − ū s.e. ū + (−ū) = 0.<br />

Näistä seuraa tutut vektoreiden laskulait, kuten 0 · ū = ¯0 ja −1 · ū = −ū jne. Vektorit ¯v 1 , ¯v 2 , . . . , ¯v N<br />

ovat lineaarisesti riippumattomat, jos ∑ N<br />

n=1 a n¯v n = ¯0 jos ja vain jos a 1 = a 2 = . . . = a N = 0. Huom.<br />

jos yksikin ¯v n = ¯0, niin vektorit eivät ole lin. riippumattomia. Joukko {u 1 , u 2 , . . .} virittää V :n, jos<br />

jokainen ū ∈ V voidaan lausua muodossa<br />

ū = ∑ k<br />

a k ū k . (4.1)<br />

Jos {u 1 , u 2 , . . .} on lisäksi lineaarisesti riippumaton, niin sen vektorit muodostavat avaruuden V kannan.<br />

Kannassa on aina sama määrä vektoreita ja tätä määrää kutsutaan V :n dimensioksi dim(V ).<br />

Esimerkki 4.1 K n := n tai C n<br />

¯x = (x 1 , x 2 , . . . , x n ) x i ∈ K<br />

¯x + ȳ = (x 1 + y 1 , x 2 + y 2 , . . . , x n + y n )<br />

a¯x = (ax 1 , ax 2 , . . . , ax n )<br />

¯0 = (0, 0, . . . , 0)<br />

−¯x = (−x 1 , −x 2 , . . . , −x n )<br />

Kanta = {ē 1 , ē 2 , . . . , e¯<br />

n } , missä<br />

ē i = (0, . . . , 0, }{{} 1 , 0, . . . , 0).<br />

i:s<br />

Huom. dim(K n ) = n ja myös n = ∞ on mielekäs!<br />

Esimerkki 4.2 V = funktiot f : A → C, A ⊂ C<br />

(f + g)(z) = f(z) + g(z)<br />

(af)(z) = af(z), a ∈ C<br />

¯0(z) = 0 ∀ z ∈ A<br />

(−f)(z) = −f(z)<br />

Huom. dim(V ) = ∞, lisäksi V :llä ei ole luonnollista kantaa.<br />

Esimerkki 4.3 V = astetta n-1 olevat polynomit P : A → C, A ⊂ C<br />

n−1<br />

∑<br />

P (z) = a k z k<br />

k=0<br />

Laskutoimitukset kuten edellisessä esimerkissä, mutta nyt dim(V ) = n. Eräs kanta on {1, z, z 2 , . . . , z n−1 }.<br />

Vektoriavaruus on normitettu, eli normiavaruus, jos on lisäksi olemassa kuvaus ‖·‖ : V → R s.e.<br />

1. ‖¯v‖ ≥ 0 ∀ ¯v ∈ V<br />

2. ‖¯v‖ = 0 ⇐⇒ ¯v = ¯0


34<br />

3. ‖¯v + ū‖ ≤ ‖¯v‖ + ‖ū‖ (”kolmioepäyhtälö”, ∆ − ey.)<br />

4. ‖a¯v‖ = |a| ‖¯v‖<br />

Esimerkki 4.4 Esimerkiksi K n (esimerkki 4.1) varustettuna normilla<br />

∑<br />

‖x‖ = ‖(x 1 , x 2 , . . . , x n )‖ = √ n |x k | 2 (4.2)<br />

ja polynomien avaruus V (esimerkki 4.3) varustettuna normilla<br />

ovat normiavaruuksia. Tarkista!<br />

Normi määrää avaruuteen myös etäisyyden eli metriikan<br />

k=1<br />

‖f‖ = sup |f(x)| (4.3)<br />

x∈A<br />

d(ū, ¯v) = ‖u − v‖ . (4.4)<br />

Metriikka puolestaan määrää suppenemisen: Sanomme, että jono ¯v 1 , ¯v 2 , . . . suppenee kohti ¯v ∈ V jos<br />

ja merkitsemme<br />

lim ‖¯v n − v‖ = 0 (4.5)<br />

n→∞<br />

Määritelmä 4.1 (Cauchyn jono) Jono (¯v n ) ∞ n=1 on Caychyn jono, jos<br />

¯v = lim<br />

n→∞ ¯v n (4.6)<br />

‖¯v n − ¯v m ‖ −→ 0, kun n, m → ∞<br />

Huomataan, että jokainen suppeneva jono on Cauchyn jono, sillä<br />

‖¯v n − ¯v m ‖ = ‖(¯v n − ¯v) + (¯v − ¯v m )‖ ≤ ‖¯v n − ¯v‖ + ‖¯v − ¯v m ‖ → 0, mutta päinvastainen ei ole välttämättä<br />

voimassa kaikissa vektoriavaruuksissa. Tätä varten määritellään täydelliset normitetut vektoriavaruudet<br />

eli Banachin avaruudet.<br />

Määritelmä 4.2 Normitettu vektoriavaruus on täydellinen, jos jokainen Cauchyn jono suppenee eli<br />

lim ‖¯v n − ¯v m ‖ = 0 =⇒ ∃ ¯v ∈ V s.e.<br />

n,m→∞<br />

lim ¯v n = ¯v<br />

n→∞<br />

Vektoriavaruuteen V saadaan vielä enemmän rakennetta, jos siinä on määritelty sisätulo eli skalaaritulo.<br />

Määritelmä 4.3 (Skalaaritulo) Kuvaus V ∗ V → C, (ū, ¯v) ↦→ 〈ū|¯v〉 on skalaaritulo, jos<br />

1. 〈ū|ū〉 ∈ R ja 〈ū|ū〉 ≥ 0 ∀ ū ∈ V .<br />

2. 〈ū|ū〉 = 0 ⇐⇒ ū = ¯0.<br />

3. 〈ū|¯v〉 = 〈¯v|ū〉 ∗ .<br />

4. 〈ū|¯v + ¯w〉 = 〈ū|¯v〉 + 〈ū| ¯w〉<br />

5. 〈ū|a¯v〉 = a〈ū|ū〉


35<br />

Esimerkiksi ”pistetulo” C n ∗ C n → C.<br />

x · y := 〈(x 1 , . . . , x n )|(y 1 , . . . , y n )〉 =<br />

n∑<br />

x ∗ i y i (4.7)<br />

on sisätulo. Vektoriavaruutta, jossa on määritelty sisätulo kutsutaan sisätuloavaruudeksi.<br />

Lause 4.1 (Schwarzin epäyhtälö) Sisätuloavaruudessa pätee aina<br />

ja yhtäsuuruus pätee vain jos vektorit ovat lin. riippuvia.<br />

i=1<br />

|〈ū|¯v〉| 2 ≤ 〈ū|ū〉〈¯v|¯v〉 (4.8)<br />

Todistus 4.1 Koska väite pätee kun ¯v = ¯0 (0 = 0), niin riittää tutkia tapaus ¯v ≠ ¯0, jolloin erityisesti<br />

〈¯v|¯v〉 > 0. Olkoon<br />

¯w = ū − 〈¯v|ū〉<br />

〈¯v|¯v〉 ¯v.<br />

Nyt sisätulon 1. ominaisuuden nojalla<br />

mistä väite tietysti seuraa.<br />

〈 ¯w| ¯w〉 = 〈ū|ū〉 − 〈ū|¯v〉〈¯v|ū〉<br />

〈¯v|¯v〉<br />

= 〈ū|ū〉 − |〈ū|¯v〉|2<br />

〈¯v|¯v〉<br />

≥ 0,<br />

− 〈¯v|ū〉〈ū|¯v〉<br />

〈¯v|¯v〉<br />

Schwarzin epäyhtälön avulla saadaan todistettua tärkeä tulos:<br />

Lause 4.2 Sisätuloavaruus on normiavaruus, kun normiksi otetaan<br />

Todistus 4.2 Muut ominaisuudet ilmeisiä, paitsi kolmioepäyhtälö:<br />

mistä väite seuraa ottamalla neliöjuuri.<br />

+ |〈ū|¯v〉|2 〈¯v|¯v〉<br />

〈¯v|¯v〉 2<br />

‖ū‖ = √ 〈ū|ū〉. (4.9)<br />

‖ū + ¯v‖ 2 = 〈ū + ¯v|ū + ¯v〉<br />

= 〈ū|ū〉 + 〈ū|¯v〉 + 〈¯v|ū〉 + 〈¯v|¯v〉<br />

= ‖ū‖ 2 + ‖¯v‖ 2 + 2Re(〈ū|¯v〉)<br />

≤ ‖ū‖ 2 + ‖¯v‖ 2 + 2|〈ū|¯v〉|<br />

Schwarz → ≤ ‖ū‖ 2 + ‖¯v‖ 2 + 2 ‖ū‖ ‖¯v‖<br />

= (‖ū‖ + ‖¯v‖) 2 ,<br />

Hilbertin avaruudet ovat täydellisiä sisätuloavaruuksia. Esimerkiksi C n ja R n ovat Hilbertin avaruuksia<br />

sisätulona pistetulo (4.7).<br />

Esimerkki 4.5 (l 2 ) Jonot x = (x 1 , x 2 , . . .), x i ∈ C, joille<br />

Sisätulo:<br />

∞∑<br />

|x i | 2 < ∞.<br />

i=1<br />

∞∑<br />

〈x|y〉 = x ∗ i y i (4.10)<br />

i=1


36<br />

Normi:<br />

Kantana {e i : i ∈ N}, missä<br />

‖x‖ =<br />

∞∑<br />

|x i | 2 (4.11)<br />

i=1<br />

e i = (0, . . . , 0, }{{} 1 , 0, . . .)<br />

i:s<br />

Esimerkki 4.6 (L 2 (a, b)) Funktiot [a, b] → C, joille<br />

Sisätulo:<br />

Normi:<br />

∫ b<br />

a<br />

〈f|g〉 =<br />

‖f‖ =<br />

dx|f(x)| 2 < ∞.<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

dxf(x) ∗ g(x) (4.12)<br />

dx|f(x)| 2 (4.13)<br />

Koska on oltava ‖f − g‖ = 0 ⇔ f = g, niin on samaistettava funktiot joilla ∫ b<br />

a dx|f(x) − g(x)|2 = 0<br />

t.s. f(x) = g(x) melkein kaikkialla. Eräs avaruuden L 2 kanta on trigonometriset funktiot (todistus<br />

epätriviaali).<br />

Huomautus 4.1 l p - ja L p -avaruudet voidaan määritellä vastaavasti myös, kun p ≠ 2. Tällöin avaruuksissa<br />

ei ole sisätuloa, mutta ne ovat Banach avaruuksina varsin käyttökelpoisia.<br />

4.2 Gram-Schmidt ja projektio<br />

Olkoon V sisätuloavaruus ja {¯v 1 , ¯v 2 , . . .} joukko lineaarisesti riippumattomia vektoreita. Voimme rakentaa<br />

niistä ortonormitetun joukon<br />

{ē 1 , ē 2 , . . .}, joille 〈ē i |ē j 〉 = δ ij seuraavasti:<br />

Valitaan<br />

ē 1 = ¯v 1<br />

‖¯v 1 ‖ (⇒ 〈ē 1|ē 1 〉 = 1).<br />

Nyt<br />

ja k 2 määrätään ehdosta<br />

e 2 = k 2 (¯v − 〈ē 1 |¯v 2 〉ē 1 ) toteuttaa<br />

⎛<br />

⎞<br />

〈ē 1 |ē 2 〉 = k 2<br />

⎝〈ē 1 |¯v 2 〉 − 〈ē 1 |¯v 2 〉 〈ē 1 |ē 1 〉 ⎠ = 0<br />

} {{ }<br />

=1<br />

1 = 〈ē 2 |ē 2 〉 = |k 2 | 2 ( ‖ ¯v 2 ‖ 2 − |〈ē 1 |¯v 2 〉| 2) .<br />

Jatketaan induktiivisesti: Olkoon ē 1 , . . . , ē n jo rakennettu. Asetetaan<br />

)<br />

n∑<br />

ē n+1 = k n+1<br />

(¯v n+1 − 〈ē i |¯v n+1 〉ē i , (4.14)<br />

joka toteuttaa 〈ē n+1 |ē i 〉 = 0, i = 1, 2, . . . , n ja k n+1 määrätään ehdosta<br />

〈ē n+1 |ē n+1 〉 = 1. (4.15)<br />

Jatkamalla näin saadaan ortonormitettu jono.<br />

i=1


37<br />

Olkoon nyt ē 1 , ē 2 , . . . , ē n ortonormitettu (o.n.) joukko V:n alkioita. Vektoreiden virittämä aliavaruus<br />

L koostuu kaikista vektoreista ū ∈ V , jotka ovat muotoa<br />

ū =<br />

n∑<br />

a i ē i . (4.16)<br />

i=1<br />

Approksimointiongelma: Olkoon ¯v ∈ V annettu. Mikä L:n vektori ū approksimoi ¯v:tä parhaiten, s.o.<br />

mille ū ‖ū − ¯v‖ saa miniminsä?<br />

Kirjoitetaan u = ∑ n<br />

i=1 a iē i ja muodostetaan<br />

F (a 1 , a 2 , . . . , a n ) = ‖ū − ¯v‖ 2<br />

= 〈ū − ¯v|ū − ¯v〉<br />

n∑<br />

= ‖¯v‖ 2 − (a ∗ i 〈ē i |¯v〉 + a i 〈¯v|ē i 〉) +<br />

i=1<br />

Kirjoitetaan a j = b j + ic j , missä b j , c j ∈ R, jolloin<br />

F = ‖¯v‖ 2 +<br />

n∑<br />

|a i | 2 (4.17)<br />

n∑ [<br />

b<br />

2<br />

j + c 2 j − (b j − ic j )〈ē i |¯v〉 − (b j + ic j )〈¯v|ē i 〉 ] , (4.18)<br />

j=1<br />

i=1<br />

jonka stationaariset pisteet:<br />

sekä<br />

∂F<br />

∂b j<br />

= 2b j − (〈ē j |¯v〉 + 〈¯v|ē j 〉)<br />

= 2(b j − Re(〈ē j |¯v〉)) = 0<br />

=⇒ b j = Re(〈ē j |¯v〉),<br />

∂F<br />

∂c j<br />

= 2c j + i(〈ē j |¯v〉 − 〈¯v|ē j 〉)<br />

= 2(c j − Im(〈ē j |¯v〉)) = 0<br />

=⇒ c j = Im(〈ē j |¯v〉).<br />

Nyt siis a j = 〈ē j |¯v〉 eli paras approksimaatio on<br />

n∑<br />

¯v L = 〈ē j |¯v〉ē j . (4.19)<br />

j=1<br />

Voidaan myös määritellä projektio-operaattori P L kaavalla<br />

n∑<br />

P L¯v = ¯v L = 〈ē i |¯v〉ē i , (4.20)<br />

joka on ¯v : n projektio aliavaruudelle L. Kuvaus todellakin on projektio, sillä kaikilla v pätee<br />

PL¯v 2 = P L¯v L<br />

n∑ n∑<br />

= 〈ē i | 〈ē j |¯v〉ē j 〉ē i<br />

=<br />

i=1<br />

i=1<br />

j=1<br />

n∑<br />

〈ē i |¯v〉ē i<br />

i=1<br />

= ¯v L ,


38<br />

eli P 2 L = P L. Määritellään sitten ¯v ⊥ = ¯v − ¯v L , ”¯v:n L:ää vastaan kohtisuora komponentti”, jolle<br />

Lisäksi, jos ū ∈ L, niin ū = ∑ n<br />

j=1 u jē j ja<br />

P L¯v ⊥ = P L¯v − P L¯v L = ¯v L − ¯v L = ¯0.<br />

〈¯v ⊥ |ū〉 =<br />

=<br />

n∑<br />

u i 〈¯v ⊥ |ē i 〉<br />

i=1<br />

n∑<br />

u i<br />

(〈¯v|ē i 〉 −<br />

i=1<br />

= 0,<br />

eli ¯v ⊥ on kohtisuorassa jokaista ū ∈ L kohtaan, erityisesti<br />

Lisäksi tästä seuraa<br />

eli (Besselin epäyhtälö)<br />

)<br />

n∑<br />

〈ē k |¯v〉 ∗ δ kj<br />

k=1<br />

〈¯v ⊥ |¯v L 〉 = 0. (4.21)<br />

‖¯v‖ 2 = ‖¯v ⊥ + ¯v L ‖ 2 = ‖¯v L ‖ 2 + ‖¯v ⊥ ‖ 2 ≥ ‖¯v L ‖ 2<br />

‖¯v‖ 2 ≥<br />

n∑<br />

|〈ē i |¯v〉| 2 . (4.22)<br />

i=1<br />

Otetaan ilman todistusta käyttöön tulos: Separoituvalla 6 Hilbertin avaruudella H on numeroituva<br />

kanta, joka voidaan olettaa ortonormaaliksi. Tällöin jokainen ¯v ∈ H voidaan lausua muodossa<br />

¯v = ∑ k<br />

v k ē k . (4.23)<br />

Nyt<br />

〈ē j |¯v〉 = ∑ k<br />

v k 〈ē j |ē k 〉 = v j<br />

eli<br />

¯v = ∑ k<br />

〈ē k |¯v〉ē k . (4.24)<br />

Lisäksi<br />

‖¯v‖ 2 = ∑ k,l<br />

v ∗ k v l〈ē k |ē l 〉 = ∑ k<br />

|v k | 2<br />

eli<br />

‖¯v‖ 2 = ∑ k<br />

|〈ē k |¯v〉| 2 , (4.25)<br />

joka tunnetaan Parsevalin kaavana.<br />

Huom. Esimerkiksi l 2 , L 2 , C n ja R n ovat separoituvia.<br />

Huom. Erikoistapauksena saamme Parsevalin kaavan Fourier-sarjoille (vrt. FyMM Ib).<br />

6 Avaruus on separoituva jos siihen sisältyy numeroituva tiheä joukko. Esim. R on separoituva, sillä Q on tiheä ja<br />

numeroituva.


39<br />

4.3 Hilbert avaruudet<br />

Kertausta:<br />

– V on C-kertoiminen vektoriavaruus<br />

– Normi: kuvaus ‖·‖ : V → R, jolle<br />

1. ‖u‖ ≥ 0, ‖u‖ = 0 ⇔ u = ¯0.<br />

2. ‖au‖ = |a| ‖u‖, a ∈ C<br />

3. ‖u + v‖ ≤ ‖u‖ + ‖v‖<br />

– Suppeneminen: u n → u ⇔ ‖u n − u‖ → 0<br />

– Cauchyn jono: ‖u n − u m ‖ → 0, n, m → ∞<br />

– Banach-avaruus: Normiavaruus, jonka jokainen Cauchyn jono myös suppenee. (Täydellinen normiavaruus)<br />

– Sisätulo: kuvaus V × V → C, jolle<br />

1. 〈u|v〉 = 〈v|u〉 ∗<br />

2. 〈u|av + bw〉 = a〈u|v〉 + b〈u|w〉<br />

3. 〈u|u〉 ≥ 0, 〈u|u〉 = 0 ⇔ u = ¯0<br />

– Sisätuloavaruus on normiavaruus: ‖u‖ = √ 〈u|u〉<br />

– Hilbert avaruus: Täydellinen sisätuloavaruus.<br />

Lisäksi palautetaan mieleen funktion jatkuvuus<br />

Määritelmä 4.4 Funktio f : V → C on jatkuva (pisteessä u) jos<br />

tai<br />

u n → u =⇒ f(u n ) → f(u) (4.26)<br />

∀ ɛ ∃ δ s.e. ‖u − v‖ < δ =⇒ |f(u) − f(v)| < ɛ. (4.27)<br />

Funktio on jatkuva joukossa A, jos se on jatkuva jokaisessa joukon pisteessä.<br />

Kuvausta ϕ : V → C sanotaan (lineeariseksi) funktionaaliksi, jos se on sekä jatkuva että lineaarinen.<br />

Toisin sanoen ϕ on jatkuva ja ϕ(au + bv) = aϕ(u) + bϕ(v). (Lineaariset) Funktionaalit muodostavat<br />

myös vektoriavaruuden, duaaliavaruuden V ∗ , kun määritellään<br />

(ϕ + ψ)(u) = ϕ(u) + ψ(u)<br />

(aϕ)(u) = aϕ(u)<br />

¯0(u) = 0 ∀ u ∈ V


40<br />

Määritelmä 4.5 Kuvaus ϕ on rajoitettu jos on olemassa M > 0 s.e.<br />

|ϕ(u)| ≤ M ‖u‖ ∀ u ∈ V (4.28)<br />

Lause 4.3 Olkoon V Banach avaruus. Lineaarinen funktionaali ϕ : V → C on jatkuva jos ja vain jos<br />

se on rajoitettu.<br />

Todistus 4.3 ”⇒”. Koska ϕ on jatkuva, se on jatkuva erityisesti origossa. On siis olemassa δ s.e.<br />

|ϕ(u)| < 1, kun ‖u‖ < δ. Olkoon ¯0 ≠ u ∈ V ja δ kuten edellä, jolloin<br />

( )∣ |ϕ(u)| =<br />

2 ‖u‖ δu ∣∣∣<br />

∣ ϕ < 2 ‖u‖ · 1,<br />

δ 2 ‖u‖ δ<br />

sillä<br />

∥ ∥∥∥ δu<br />

2 ‖u‖ ∥ = δ 2 < δ.<br />

M:ksi voidaan siis valita esimerksi 2/δ.<br />

”⇐”. Olkoon ɛ > 0. Jos |ϕ(u)| ≤ M ‖u‖ ∀u ∈ V , niin<br />

joten ϕ on jatkuva.<br />

‖u − v‖ < ɛ M ⇒ |ϕ(u) − ϕ(v)| = |ϕ(u − v)| ≤ M ‖u − v‖ < M · ɛ<br />

M = ɛ,<br />

Esimerkki 4.7 V = l 1 eli jonot (x 1 , x 2 , . . .), joille<br />

‖x‖ =<br />

∞∑<br />

|x k | < ∞. (4.29)<br />

Olkoon c = (c 1 , c 2 , . . .) jono kompleksilukuja ja ϕ c : l 1 → C määritelty kaavalla<br />

k=1<br />

ϕ c (x) =<br />

∞∑<br />

c k x k . (4.30)<br />

ϕ c on selvästi lineaarinen. Jos |c k | < K kaikilla i, niin ϕ c on rajoitettu, sillä<br />

|ϕ c (x)| ≤<br />

k=1<br />

k=1<br />

∞∑<br />

∞∑<br />

|c k x k | ≤ K |x k | = K ‖x‖ .<br />

ϕ on siis jatkuva jos c on rajoitettu. Osoitetaan vielä, että muussa tapauksessa ϕ c ei ole jatkuva. Jos<br />

|c i | ei ole ylhäältä rajoitettu on olemassa osajono (c ij ) ∞ j=1 s.e. |c i j<br />

| → ∞, kun i j → ∞. Käytetään<br />

jatkuvuuden jonomääritelmää, ja muodostetaan jono (x (j) ) ⊂ l 1 , missä<br />

Nyt ∥ ∥x (j)∥ ∥ = 1/|c ij | → 0, koska |c ij | → ∞, mutta<br />

k=1<br />

x (j) = (0, 0, . . . , 0, 1/c ij , 0 . . .).<br />

} {{ }<br />

i j :s<br />

ϕ c (x (j) ) =<br />

∞∑<br />

i=1<br />

c i x (j)<br />

i<br />

= c ij · 1/c ij = 1<br />

kaikilla i, mikä on ristiriita, sillä jatkuvuuden nojalla pitäisi ϕ(x (j) ) → 0 = ϕ x (¯0), koska x (j) → ¯0.


41<br />

Lause 4.4 (Suunnikassääntö) Hilbert avaruudessa pätee<br />

Todistus 4.4 Suora lasku:<br />

‖u + v‖ 2 + ‖u − v‖ 2 = 2 ‖u‖ 2 + 2 ‖v‖ 2<br />

‖u + v‖ 2 + ‖u − v‖ 2 = 〈u + v|u + v〉 + 〈u − v|u − v〉<br />

= 2 ‖u‖ 2 + 2 ‖v‖ 2 + 〈u|v〉 + 〈v|u〉 − 〈u|v〉 − 〈v|u〉<br />

= 2 ‖u‖ 2 + 2 ‖v‖ 2 .<br />

Tästä seuraa mm. ‖u + v‖ 2 ≤ 2 ‖u‖ 2 + 2 ‖v‖ 2 . Suunnikassäännön avulla on myös helppo osoittaa, ettei<br />

jokin normi ole sisätulon määräämä ts. että jokin Banach avaruus ei ole Hilbert avaruus. Esim l p - ja<br />

L p -avaruudet eivät ole Hilbert-avaruuksia, kun p ≠ 2.<br />

Eräs tärkeä Hilbertin avaruus on L 2 (Ω), missä Ω ⊂ R n ja<br />

∫<br />

f ∈ L 2 (Ω) ⇐⇒ ‖f‖ 2 := d n x|f(x)| 2 < ∞.<br />

Sisätulo on<br />

∫<br />

〈f|g〉 =<br />

Ω<br />

Ω<br />

d n xf(x) ∗ g(x).<br />

Samaistetaan f ja g jos ‖f − g‖ = 0 (”f = g melkein kaikkialla”). Seuraava lause on osa Riesz-Fischerin<br />

lauseesta.<br />

Lause 4.5 (Riesz-Fischer, p = 2.)<br />

Jos f 1 , f 2 , . . . on Cauchyn jono L 2 (Ω):ssa, niin on olemassa f ∈ L 2 (Ω) jolle ‖f n − f‖ → 0, kun n → ∞<br />

Todistuksen pääpiirteet. (f n ) Cauchyn jono, joten voidaan siirtyä osajonoon (f nk ), jolle<br />

‖f nk − f nk −1‖ < 2 −n .<br />

Indeksöidään osajono uudelleen, merk. (f k ). Muodostetaan sitten<br />

ja koska<br />

‖h‖ ≤<br />

h(x) =<br />

∞∑<br />

|f k (x) − f k−1 (x)|<br />

k=1<br />

∞∑<br />

‖f k (x) − f k−1 (x)‖ ≤<br />

k=1<br />

∞∑<br />

2 −n = 1<br />

on h 2 integroituva ja tällöin |h(x)| < ∞ melkein kaikkialla. Määritellään<br />

{<br />

fn (x) − f<br />

g n (x) =<br />

n−1 (x), kun |h(x)| < ∞<br />

0 , kun |h(x)| = ∞ .<br />

Nyt haluttu f on ∑ n g n. Näin määritelty f kuuluu L 2 :een, sillä<br />

∥ ∞∑ ∥∥∥∥ ∞∑<br />

‖f‖ =<br />

g n ≤<br />

|g n |<br />

= ‖h‖ (4.31)<br />

∥ ∥ ∥<br />

n=1<br />

n=1<br />

k=1<br />

ja h ∈ L 2 . Lisäksi<br />

‖f − f n ‖ =<br />

∥<br />

∥<br />

∞∑ ∥∥∥∥ ∞∑<br />

∞∑<br />

g k ≤ ‖g k ‖ < 2 −k = 2 −n → 0.<br />

k=n+1<br />

k=n+1 k=n+1


42<br />

4.4 Aliavaruudet ja separoituvuus<br />

Vektoriavaruuden V vektorialiavaruus on mikä tahansa joukko W ⊂ V , jonka alkioille pätee u, v ∈<br />

W ⇒ αu + βv ∈ W kaikilla α, β ∈ C. Hilbert avaruudessa määritellään: Hilbertin avaruuden H<br />

aliavaruus H ′ on H:n vektorialiavaruus, joka on lisäksi joukkona suljettu, t.s. jos u n ∈ H ′ ∀ n ja<br />

‖u n − u‖ → 0, niin u ∈ H ′ . Jos W on H:n vektorialiavaruus, sen sulkeuma W on pienin H:n aliavaruus,<br />

joka sisältää W :n. Oleellisesti W saadaan lisäämällä W :hen kaikkien W :n alkioista muodostettujen<br />

suppenevien jonojen raja-arvot. Olkoon K H:n mielivaltainen osajoukko. K:n generoima<br />

vektorialivaruus L(K) on<br />

{ n∑<br />

}<br />

L(K) = α i u i : α i ∈ C, u i ∈ K . (4.32)<br />

i=1<br />

Vastaavasti K:n generoima H:n aliavaruus on L(K).<br />

Kuten aiemmin todettin (ilman todistusta), jos H on separoituva on olemassa numeroituva joukko<br />

K = {u 1 , u 2 , . . .} ⊂ H s.e. H = L(K). Jos H on separoituva, niin lähtien vektoreista u i voimme<br />

Gram-Schmidtin menetelmää käyttäen ja jättäen pois lineaarisesti riippuvia vektoreita muodostaa<br />

ortonormitetun joukon {e 1 , e 2 , . . .} (〈e i |e j 〉 = δ ij ) ja tällöin<br />

H = L(K) ⇐⇒ H = L({e 1 , e 2 , . . .})<br />

eli separoituvalla Hilbert avaruudella on numeroituva ortonormaali kanta.<br />

Lause 4.6 Jos H on separoituva Hilbert avaruus ja {e 1 , e 2 , . . .} on o.n. kanta, niin jokainen u ∈ H<br />

voidaan esittää yksikäsitteisesti muodossa<br />

u =<br />

∞∑<br />

c i e i , (4.33)<br />

i=1<br />

missä c i = 〈e i |u〉.<br />

Lauseen todistamiseksi ensin kaksi aputulosta.<br />

Apulause 4.1 Hilbert avaruuden sisätulo on jatkuva, t.s. kaikilla u ∈ H pätee<br />

lim v n = v =⇒ lim 〈u|v n〉 = 〈u|v〉.<br />

n→∞ n→∞<br />

Todistus 4.5 |〈u|v n 〉−〈u|v〉| = |〈u|v n −v〉| ≤ ‖u‖ ‖v n − v‖ → 0, missä epäyhtälö on Cauchy-Schwarzin<br />

epäyhtälö (4.8). Oikeastaan pelkkä Cauchy-Schwarzin epäyhtälö riittää kun huomaa että sisätulo on<br />

rajoitettu funktionaali.<br />

Apulause 4.2 Jos {e 1 , e 2 , . . .} on Hilbert avaruuden H o.n. kanta ja 〈v|e k 〉 = 0 kaikilla k, niin v = ¯0<br />

Todistus 4.6 Koska H = L({e 1 , e 2 , . . .}), niin v = lim n→∞ v n , missä v n = ∑ N n<br />

i=1 v n,ie i . Lisäksi<br />

〈v|e k 〉 = 0 ∀ k =⇒ 〈v|v n 〉 = 0.<br />

Nyt aputuloksen 4.1 mukaan<br />

eli v = ¯0.<br />

‖v‖ 2 = 〈v|v〉 = lim<br />

n→∞ 〈v|v n〉 = 0


43<br />

Todistus 4.7 (Lauseen 4.6 todistus) Besselin epäyhtälön mukaan<br />

N∑<br />

|〈e n |u〉| 2 ≤ ‖u‖ 2<br />

n=1<br />

∀ N ∈ N<br />

eli sarja ∑ k |〈e n|u〉| 2 suppenee. Määritellään nyt<br />

jolloin (u n ) on Cauchyn jono, sillä<br />

u N =<br />

‖u N − u M ‖ 2 =<br />

N∑<br />

〈e n |u〉e n ,<br />

n=1<br />

N∑<br />

n=M+1<br />

|〈e n |u〉| 2 −→ 0<br />

osana suppenevan sarjan häntää. Koska H on täydellinen on olemassa u ′ , jolle u n → u ′ . Nyt aputuloksen<br />

4.1 mukaan<br />

Kuitenkin 〈e k |u N 〉 = 〈e k |u〉, kun N ≥ k, joten<br />

〈e k |u − u ′ 〉 = 〈e k |u〉 − 〈e k |u ′ 〉<br />

= 〈e k |u ′ 〉 − lim<br />

N→∞ 〈e k|u N 〉.<br />

lim 〈e k|u N 〉 = 〈e k |u〉 ja 〈e k |u − u ′ 〉 = 0.<br />

N→∞<br />

Koska tämä pätee kaikilla k ∈ N on aputuloksen 4.2 mukaan oltava u − u ′ = ¯0 eli<br />

mikä kuuluikin todistaa.<br />

u = u ′ =<br />

∞∑<br />

〈e n |u〉e n , (4.34)<br />

n=1<br />

Voidaan osoittaa, että esimerkiksi L 2 ([a, b]), L 2 (R) ja L 2 (R n ) ovat separoituvia.<br />

Todistuksn idea. Weierstrassin approksimaatiolauseen mukaan jokaista f ∈ L 2 ([a, b]) voidaan approksimoida<br />

mielivaltaisen tarkasti polynomeilla. Eli kaikilla f ∈ L 2 ([a, b]) on olemassa polynomi<br />

P s.e. ‖f − P ‖ < ɛ. Pätee siis L 2 ([a, b]) = L({1, x, x 2 , . . .}). Monomien joukkoon voi soveltaa Gram-<br />

Schmidtiä tai o.n. kannan voi rakentaa vaikka suoraan Legendren polynomeista. Vastaavasti L 2 (R) =<br />

L({ϕ 0 , ϕ 1 , . . .}, missä<br />

ϕ n (x) =<br />

1<br />

√<br />

2 n n! √ π H n(x)exp<br />

) (− x2<br />

2<br />

ja H n on Hermiten n:s polynomi. Tästä seuraa myös L 2 (R d ):n separoituvuus:<br />

ϕ n1 n 2···n d<br />

(x 1 , x 2 , . . . , x d ) = ϕ n1 (x 1 )ϕ n2 (x 2 ) · · · ϕ nd (x d )<br />

Jotta saisimme todistettua vielä Plancherelin kaavan separoituvissa Hilbert avaruuksissa todistetaan<br />

ensin skalaaritulon jatkuvuus kahden muuttujan funktiona.<br />

Apulause 4.3 Jos u n → u ja v n → v, niin<br />

〈v n |u n 〉 −→ 〈v|u〉


44<br />

Todistus 4.8<br />

|〈v n |u n 〉 − 〈v|u〉| = |〈v n |u n 〉 − 〈v|u n 〉 + 〈v|u n 〉 − 〈v|u〉|<br />

≤ |〈v n |u n 〉 − 〈v|u n 〉| + |〈v|u n 〉 − 〈v|u〉|<br />

≤ ‖u n ‖ ‖v n − v‖ + ‖u n − u‖ ‖v‖<br />

−→ 0,<br />

kun n → ∞.<br />

Lause 4.7 (Plancherel) Olkoon {e 1 , e 2 , . . .} Hilbertin avaruuden H o.n. kanta. Tällöin kaikilla u, v ∈<br />

H pätee<br />

∞∑<br />

〈u|v〉 = 〈u|e n 〉〈e n |v〉. (4.35)<br />

n=1<br />

Todistus 4.9 Määritellään<br />

Nyt apulauseen 4.3 mukaan<br />

u n =<br />

v n =<br />

n∑<br />

〈e i |u〉e i (−→ u) ja<br />

i=1<br />

n∑<br />

〈e i |v〉e i (−→ v).<br />

i=1<br />

〈u|v〉 = lim 〈u n|v n 〉<br />

n→∞<br />

n∑ n∑<br />

= lim 〈u|e i 〉〈e i |e j 〉〈e j |v〉<br />

n→∞<br />

= lim<br />

n→∞<br />

=<br />

i=1 j=1<br />

n∑<br />

〈u|e i 〉〈e i |v〉<br />

i=1<br />

∞∑<br />

〈u|e i 〉〈e i |v〉.<br />

Huom. erikoistapaus u = v, jolloin ‖u‖ = ∑ i |〈e i|u〉| 2 (Parseval).<br />

i=1<br />

Kertauksena u, v ∈ H ovat ortogonaalisia (u⊥v) jos 〈u|v〉 = 0. Olkoon V H:n aliavaruus, sen ortogonaalinen<br />

komplementti on<br />

V ⊥ = {u : u⊥v ∀ v ∈ V } . (4.36)<br />

Myös V ⊥ on H:n aliavaruus:<br />

Se on vektoriavaruus, koska<br />

u, u ′ ∈ V ⊥ =⇒ 〈au + bu ′ |v〉 = a ∗ 〈u|v〉 + b ∗ 〈u ′ |v〉 = 0 + 0 = 0<br />

kaikilla v ∈ V eli au + bu ′ ∈ V ⊥ . Lisäksi se on suljettu, sillä jos u n ∈ V ⊥ ja u n → u, niin<br />

〈u|v〉 = lim<br />

n→∞ 〈u n|v〉 = lim<br />

n→∞ 0 = 0<br />

eli u ∈ V ⊥ .<br />

Huom. V ∩ V ⊥ = {¯0}, sillä jos v ∈ V ∩ V ⊥ , niin 〈v|v〉 = 0 eli v = ¯0.<br />

Lause 4.8 Jos V on Hilbert avaruuden H aliavararuus, niin jokainen u ∈ H voidaan yksikäsitteisesti<br />

hajoittaa muotoon u = u ′ + u ′′ , missä u ′ ∈ V ja u ′′ ∈ V ⊥ .


45<br />

Todistus 4.10 (Olemme jo todistaneet lauseen äärellisulotteisen aliavaruuden tapauksessa ja nyt tehdään<br />

se yleisesti.) Olkoon u ∈ H annettu, merkitään<br />

d = inf {‖u − v‖ : v ∈ V } (4.37)<br />

Olkoon (v n ) jokin V:n jono jolle ‖u − v n ‖ → d. (v n ) on Cauchyn jono, sillä suunnikassäänön mukaan<br />

‖u − v m ‖ 2 + ‖u − v n ‖ 2 =<br />

∥ u − 1 2 (v n + v m ) + 1 2 (v 2<br />

n − v m )<br />

∥<br />

+<br />

∥ u − 1 2 (v n + v m ) − 1 2 (v 2<br />

n − v m )<br />

∥<br />

= 2<br />

∥ u − 1 2 (v 2<br />

n + v m )<br />

∥ + 2<br />

1<br />

∥2 (v n − v m )<br />

∥<br />

2<br />

,<br />

joten<br />

‖v n − v m ‖ 2 = 2 ‖u − v n ‖ 2 + 2 ‖u − v m ‖ 2 − 4<br />

∥ u − 1 2 (v n + v m )<br />

∥<br />

2<br />

joka lähestyy nollaa, kun n, m → ∞, sillä<br />

‖u − v n ‖ 2 −→ d 2<br />

‖u − v m ‖ 2 −→ d 2<br />

∥ u − 1 2 (v 2<br />

n + v m )<br />

∥ −→ d 2 .<br />

V on suljettu joten on olemassa u ′ ∈ V s.e. v n → u ′ . Määritellän u ′′ = u − u ′ (‖u ′′ ‖ = d). Osoitetaan,<br />

että u ′′ ∈ V ⊥ . Olkoon v ∈ V ja v 0 = v/ ‖v‖. Koska V on vektoriavaruus ja u ′ , v 0 ∈ V , niin u ′ +<br />

〈v 0 |u ′′ 〉v 0 ∈ V . Tällöin<br />

d 2 ≤ ∥ ∥ u − (u ′ + 〈v 0 |u ′′ 〉v 0 ) ∥ ∥ 2<br />

= ∥ ∥u ′′ − 〈v 0 |u ′′ 〉v 0<br />

∥ ∥<br />

2<br />

= ∥ ∥u ′′∥ ∥ 2 − |〈v 0 |u ′′ 〉| 2<br />

= d 2 − |〈v 0 |u ′′ 〉| 2 .<br />

Tämä on mahdollista vain jos 〈v 0 |u ′′ 〉 = 0 eli 〈v|u ′′ 〉 = 0, joten u ′′ ∈ V ⊥ ja u = u ′ − u ′′ on haluttu<br />

esitys. Lisäksi esitys on yksikäsitteinen: Oletetaan, että on olemassa u ′ , v ′ ∈ V ja u ′′ , v ′′ ∈ V ⊥ s.e.<br />

u = u ′ + u ′′ = v ′ + v ′′ . Tällöin<br />

u<br />

} ′ {{<br />

− v<br />

}<br />

′ =<br />

}<br />

u ′′ {{<br />

− v ′′<br />

}<br />

∈V ∈V ⊥<br />

eli u ′ − v ′ = u ′′ − v ′′ = ¯0, sillä V ∩ V ⊥ = {¯0}.<br />

Seuraus 4.1 (V ⊥ ) ⊥ = V .<br />

Todistus 4.11 ”⊇”. Jos v ∈ V , niin 〈v|u〉 = 0 ∀ u ∈ V ⊥ ⇒ v ∈ (V ⊥ ) ⊥ ⇒ V ⊆ (V ⊥ ) ⊥ .<br />

”⊆”. Olkoon v ∈ (V ⊥ ) ⊥ . v = v ′ + v ′′ joillakin v ′ ∈ V, v ′′ ∈ V ⊥ . Edellisen kohdan mukaan v ′ ∈ V ⊆<br />

(V ⊥ ) ⊥ , joten v ′′ = v − v ′ ∈ (V ⊥ ) ⊥ sekä (V ⊥ ) joten v ′′ = ¯0 ja siis v ∈ V eli (V ⊥ ) ⊥ ⊆ V .<br />

Nyt V ⊆ (V ⊥ ) ⊥ & (V ⊥ ) ⊥ ⊆ V =⇒ (V ⊥ ) ⊥ = V .


46<br />

4.5 Hilbertin avaruuden jatkuvat funktionaalit<br />

Olemme jo kahdesti (4.8 ja 4.1) osoittaneet, että kuvaus u ↦→ 〈v|u〉 on jatkuva kaikilla v ∈ H ja<br />

lisäksi se on määritelmänsä mukaan lineaarinen. Seuraava lause osoittaa että kaikki Hilbert avaruuden<br />

jatkuvat funktionaalit ovat tätä muotoa.<br />

Lause 4.9 (Rieszin esityslause) Jos ϕ on Hilbert avaruuden jatkuva funktionaali, niin on olemassa<br />

yksikäsitteinen vektori v ∈ H s.e. ϕ(u) = 〈v|u〉 ∀ u ∈ H.<br />

Todistus. Olkoon V = Ker(ϕ) := {x ∈ H : ϕ(x) = 0}, joka on H:n aliavaruus: x, y ∈ V ⇒ ϕ(ax+by) =<br />

aϕ(x) + bϕ(y) = 0. Lisäksi V on ϕ:n jatkuvuuden nojalla suljettu.<br />

Jos V = H, niin ϕ(u) = 0 ∀ u ∈ H ja voidaan valita v = ¯0. Tämä on yksikäsitteinen, sillä 〈v|u〉 =<br />

0 ∀ u ∈ H vain kun v = ¯0.<br />

Jos V ≠ H, niin on olemassa ¯0 ≠ w ∈ H \ V , joka voidaan esittää w = w ′ + w ′′ , missä w ′ ∈ V ja<br />

w ′′ ∈ V ⊥ . Huomataan<br />

joten mielivaltaiselle u ∈ H voidaan kirjoittaa<br />

ϕ(w ′′ ) = ϕ(w − w ′ ) = ϕ(w) − ϕ(w ′ ) = ϕ(w) ≠ 0,<br />

u = u − ϕ(u)<br />

ϕ(w ′′ ) w′′ + ϕ(u)<br />

ϕ(w<br />

} {{ }<br />

′′ ) w′′ . (4.38)<br />

} {{ }<br />

∈V<br />

∈V ⊥<br />

Olkoon nyt v = ϕ(w ′′ ) ∗<br />

w′′<br />

‖w ′′ ‖ 2<br />

∈ V ⊥ , jolloin<br />

〈v|u〉 = ϕ(w′′ )<br />

‖w ′′ ‖ 2 〈w′′ | ϕ(u)<br />

ϕ(w ′′ ) w′′ 〉<br />

= ϕ(u)<br />

‖w ′′ ‖ 2 〈w′′ |w ′′ 〉<br />

= ϕ(u). (4.39)<br />

Lisäksi löydetty v on yksikäsitteinen, sillä jos 〈v|u〉 = 〈v ′ |u〉 ∀ u ∈ H, niin valitsemalla u = v − v ′<br />

saadaan ‖v − v ′ ‖ 2 = 0 eli v − v ′ = ¯0.<br />

Rieszin esityslause sanoo siis, että on olemassa 1-1 vastaavuus H:n ja sen duaalin H ∗ välillä (ϕ ↔ v).<br />

5 Operaattorit<br />

5.1 Perusominaisuudet<br />

Olkoon V normitettu vektoriavaruus. Operaattori A on lineaarinen kuvaus A : V → V , u ↦→ Au ja<br />

A(αu + βv) = αAu + βAv.<br />

Lisäksi operaattori A on jatkuva jos u n → u ⇒ Au n → Au t.s. ∀ ɛ > 0 ∃ δ > 0 s.e. ‖u − v‖ < δ ⇒<br />

‖Au − Av‖ < ɛ.<br />

Operaattori on rajoitettu jos on olemassa K > 0 s.e. ‖Au‖ ≤ K ‖u‖ kaikilla u ∈ V ja aivan kuten<br />

funktionaaleilla nämä kaksi ovat yhtäpitäviä ominaisuuksia.<br />

Lause 5.1 A on rajoitettu ⇐⇒ A on jatkuva.<br />

Todistus 5.1 ”⇒”. Olkoon ɛ > 0. Nyt<br />

‖u − v‖ < ɛ K ⇒ ‖Au − Av‖ = ‖A(u − v)‖ < ɛ K K = ɛ.


47<br />

”⇐”. Jos A ei olisi rajoitettu pitäisi jokaiselle K > 0 löytyä u K s.e ‖Au K ‖ ≥ K ‖u K ‖. Määritellään<br />

jolloin<br />

w K =<br />

‖Aw K ‖ ≥<br />

u K<br />

K ‖u K ‖ ⇒ ‖w K‖ = 1 K ,<br />

1<br />

K ‖u K ‖ K ‖u K‖ = 1.<br />

Kun K → ∞, niin w K → ¯0, mutta ‖Aw K ‖ → 1 ≠ 0, mikä on ristiriidassa jatkuvuuden kanssa, joten<br />

A:n täytyy olla rajoitettu.<br />

Määritellään rajoitetun operaattorin normi:<br />

Pätee<br />

‖A‖ = sup ‖Au‖ . (5.1)<br />

‖u‖≤1<br />

( )∥ ‖Au‖ = ‖u‖<br />

u ∥∥∥<br />

∥ A ≤ ‖u‖ ‖A‖ ,<br />

‖u‖<br />

joten A on rajoitettu (eli jatkuva) jos ja vain jos sen normi on äärellinen.<br />

Esimerkki 5.1 V = l 2 eli jonot x = (x 1 , x 2 , . . .), joille<br />

Määritellään siirto-operaattorit S − ja S + :<br />

Nyt<br />

‖x‖ 2 =<br />

∞∑<br />

|x i | 2 < ∞<br />

i=1<br />

S + (x 1 , x 2 , x 3 , x 4 , . . .) = (0, x 1 , x 2 , x 3 , . . .) (5.2)<br />

S − (x 1 , x 2 , x 3 , x 4 , . . .) = (x 2 , x 3 , x 4 , . . .) (5.3)<br />

‖S + x‖ 2 = 0 +<br />

‖S − x‖ 2 =<br />

∞∑<br />

|x n | 2 = ‖x‖ 2<br />

n=1<br />

∞∑<br />

|x n | 2 = ‖x‖ 2 − |x 1 | ≤ ‖x‖ 2 ,<br />

n=2<br />

joten molemmat ovat rajoitettuja. Ilmeisesti ‖S + ‖ = 1, mutta myös ‖S − ‖ = 1, sillä esimerkiksi<br />

‖S − (0, 1, 0, 0, . . .)‖ = ‖(1, 0, 0, . . .)‖ = 1 = ‖(0, 1, 0, 0, . . .)‖ .<br />

Operaattoreiden A : V → V ja B : V → V tulo määritellään kaavalla (AB)u = A(Bu). Määritelmästä<br />

seuraa A(BC) = (AB)C (”assosiatiivisuus”). Ilmeisesti pätee id V A = Aid V = A, A 2 = AA, A k =<br />

AA k−1 = A k−1 A (sovitaan A 0 = id V ).<br />

Jos A on rajoitettu ja löytyy rajoitettu operaattori A −1 s.e. AA −1 = A −1 A = id V (Huom. molempien<br />

on oltava voimassa!), niin A −1 on A:n käänteisoperaattori. Jos käänteisoperaattori on olemassa, se on<br />

yksikäsitteinen, sillä jos BA = A −1 A = id V , niin BA = BAA −1 = A −1 AA −1 = A −1 .<br />

Esimerkki 5.2 Jatkoa esimerkkiin 5.1. Kaikilla x ∈ l 2 pätee<br />

S − S + x = S − S + (x 1 , x 2 , x 3 , x 4 , . . .)<br />

= S − (0, x 1 , x 2 , x 3 , . . .)<br />

= (x 1 , x 2 , x 3 , x 4 , . . .)<br />

= x<br />

⇒ S − S + = id l 2.


48<br />

Mutta<br />

S + S − x = S + S − (x 1 , x 2 , x 3 , x 4 )<br />

= S + (x 2 , x 3 , x 4 , x 5 , . . .)<br />

= (0, x 2 , x 3 , x 4 , . . .)<br />

≠ x<br />

⇒ S + S − ≠ id l 2.<br />

S + ja S − eivät siis ole toistensa käänteisoperaattoreita.<br />

Lause 5.2 (Neumannin sarja) Jos V on Banach avaruus ja A V :n operaattori s.e. ‖A‖ < 1, niin<br />

id V − A:lla on käänteisoperaattori<br />

∞∑<br />

(id V − A) −1 = A n . (5.4)<br />

Todistus 5.2 Kaikilla x ∈ V pätee<br />

∥<br />

∥A k ∥<br />

x∥ ≤ ‖A‖ ∥A k−1 ∥ x∥ ≤ ‖A‖ 2 ∥A k−2 x∥ ≤ . . . ≤ ‖A‖ k ‖x‖ ,<br />

joten A k on rajoitettu ja ∥ ∥A k∥ ∥ ≤ ‖A‖ k . Huomataan, että vektorit u n = (id V + A + A 2 + . . . + A n )x<br />

muodostavat Cauchyn jonon (n ≥ m):<br />

n=0<br />

‖u n − u m ‖ = ∥ ∥(A m+1 + A m+2 + . . . + A n )x ∥ ∥<br />

= (‖A‖ m+1 + ‖A‖ m+2 + . . . + ‖A‖ n ) ‖x‖<br />

≤ ‖A‖m+1<br />

1 − ‖A‖ ‖x‖<br />

−→ 0.<br />

Koska V on täydellinen, on olemassa u ∈ V s.e. u n → u. Määritellään operaattori T : V → V kaavalla<br />

T x = u, joka on lineearinen ja<br />

M∑<br />

(T − A n )x = u − u M → ¯0.<br />

Voimme siis kirjoittaa<br />

Lisäksi nähdään<br />

eli T = (id V − A) −1 .<br />

5.2 Adjungoitu operaattori<br />

n=0<br />

T =<br />

∞∑<br />

A n .<br />

n=0<br />

(id V − A)T = id V + A + A 2 + . . . − A − A 2 − . . .<br />

= id V<br />

= T (id V − A)<br />

Olkoon H Hilbert avaruus ja A : H → H rajoitettu operaattori H:lla. Operaattorin adjungoitu operaattori<br />

A † : H → H määritellään yhtälön<br />

〈u|Av〉 = 〈A † u|v〉 ∀ u, v ∈ H (5.5)


49<br />

avulla. Määritelmä on mielekäs, sillä kun u on annettu, funktionaali ϕ u (v) = 〈u|Av〉 on selvästi lineaarinen<br />

ja lisäksi jatkuva, koska<br />

|ϕ u (v)| = |〈u|Av〉| ≤ ‖u‖ ‖Av‖ ≤ ‖u‖ ‖A‖ ‖v‖ =: K ‖v‖ .<br />

Rieszin esityslauseen nojalla on olemassa yksikäsitteinen vektori A † u ∈ H s.e. ϕ u (v) = 〈A † u|v〉. Lisäksi<br />

A † on lineaarinen:<br />

〈A † (au + bw)|v〉 = 〈au + bw|Av〉<br />

= a ∗ 〈u|Av〉 + b ∗ 〈w|Av〉<br />

= a ∗ 〈A † u|v〉 + b ∗ 〈A † w|v〉<br />

= 〈aA † u + bA † w|v〉.<br />

Sekä jatkuva:<br />

∥<br />

∥A † u∥ 2 = 〈A † u|A † u〉<br />

= 〈u|AA † u〉<br />

∥<br />

(Schwarz) → ≤ ‖u‖ ∥AA † u∥<br />

∥<br />

≤ ‖u‖ ‖A‖ ∥A † u∥<br />

∥<br />

⇒ ∥A † u∥ ≤ ‖A‖ ‖u‖ .<br />

Esimerkki 5.3 (l 2 :n siirto-operaattoreiden adjungaatit)<br />

S + (x 1 , x 2 , x 3 , x 4 , . . .) = (0, x 1 , x 2 , x 3 , . . .)<br />

S − (x 1 , x 2 , x 3 , x 4 , . . .) = (x 2 , x 3 , x 4 , . . .).<br />

Huomataan, että pätee<br />

〈y|S + x〉 =<br />

〈S − y|x〉 =<br />

∞∑<br />

yi ∗ (S + x) i =<br />

i=1<br />

∞∑<br />

(S − y) ∗ i x i =<br />

∞∑<br />

i=1<br />

i=1<br />

i=1<br />

y ∗ i+1x i<br />

∞∑<br />

yi+1x ∗ i ,<br />

joten S − = S † + . Ilmeisesti myös S + = S † − (itse asiassa aina pätee (A† ) † = A).<br />

Esimerkki 5.4 Olkoon H = L 2 (X) ja α : X → C rajoitettu (|α(x)| ≤ M ∀ x ∈ X). Määritellään<br />

kertomisoperaattori A α kaavalla (A α f)(x) = α(x)f(x). Se on rajoitettu:<br />

∫<br />

∫<br />

‖A α f‖ 2 = dx |α(x)| 2 |f(x)| 2 ≤ M 2 dx|f(x)| 2 = M 2 ‖f‖ 2 .<br />

X } {{ }<br />

X<br />

≤M 2<br />

Lisäksi kaikilla f, g ∈ L 2 (X) pätee<br />

∫<br />

∫<br />

〈f|A α g〉 = dxf(x) ∗ α(x)g(x) =<br />

eli (A † αf)(x) = α(x) ∗ f(x).<br />

X<br />

X<br />

dx(f(x)α(x) ∗ ) ∗ g(x) = 〈α ∗ f|g〉


50<br />

Operaattorin A matriisielementti vektoreiden u ja v välillä on 〈u|Av〉. Jos H on separoituva ja<br />

{e i : i ∈ N} on sen o.n. kanta, voidaan kirjoittaa<br />

∞∑<br />

Ae j = e i a ij<br />

missä a ij on matriisielementti 〈e i |Ae j 〉. Jos taas<br />

u =<br />

i=1<br />

∞∑<br />

u i e i ja v =<br />

i=1<br />

niin (vrt. vektori-matriisitoimituksiin A · v ja u ∗ · A · v)<br />

ja<br />

Operaattoritulolle<br />

Av =<br />

∞∑<br />

v i Ae i =<br />

i=1<br />

∞∑<br />

j=1 i=1<br />

〈u|Av〉 =<br />

∞∑<br />

v i e i ,<br />

i=1<br />

∞∑<br />

v i a ji e j =<br />

∞∑<br />

j=1 i=1<br />

(<br />

∞∑ ∑ ∞<br />

)<br />

a ji v i e j (5.6)<br />

j=1<br />

i=1<br />

〈e i |ABe j 〉 = 〈A † e i |Be j 〉<br />

∞∑<br />

(Parseval) → = 〈A † e i |e k 〉〈e k |Be j 〉<br />

=<br />

=<br />

k=1<br />

∞∑<br />

u ∗ ja ji v i . (5.7)<br />

∞∑<br />

〈e i |Ae k 〉〈e k |Be j 〉<br />

k=1<br />

∞∑<br />

a ik b kj (5.8)<br />

k=1<br />

= (AB) ij<br />

Annetussa kannassa voidaan siis operaattoria kuvata (yl. ∞×∞) matriisilla. Adjungoidun operaattorin<br />

matriisi:<br />

a ij = 〈e i |Ae j 〉 = 〈A † e i |e j 〉 = 〈e j |A † e i 〉 ∗ = (a † ji )∗<br />

(<br />

)<br />

eli adjungoidun operaattorin matriisi on siis operaattorin matriisin hermiittinen konjugaatti (M † ) ij = (M) ∗ ji .<br />

5.3 Hermiittiset ja unitaariset operaattorit, projektio<br />

Operaattori on hermiittinen jos A † = A. Tästä seuraa<br />

Separoituvassa Hilbert avaruudessa ({e i } o.n. kanta)<br />

〈u|Av〉 = 〈A † u|v〉 = 〈Au|v〉. (5.9)<br />

a ij = 〈e i |Ae j 〉 = 〈Ae i |e j 〉 = 〈e j |Ae i 〉 ∗ = a ∗ ji,<br />

toisin sanoen hermiittisen operaattorin matriisi on hermiittinen (matriisi on hermiittinen jos M ij =<br />

M ∗ ji ).<br />

Aikaisemmin todistimme: Jos M on Hilbert avaruuden H aliavaruus niin kaikilla u ∈ H on yksikäsitteinen<br />

hajoitelma u = u ′ + u ′′ , missä u ′ ∈ M ja u ′′ ∈ M ⊥ . Määrittelemme projektio-operaattorin:<br />

P M : H → H, P M u = u ′<br />

ja kutsumme u ′ :a vektorin u kohtisuoraksi projektioksi aliavaruudelle M.


51<br />

Lause 5.3 Jokaiselle aliavaruudelle M projektio-operaattori P M on rajoitettu, hermiittinen ja toteuttaa<br />

P 2 M = P M. Kääntäen jokainen yhtälön P 2 = P toteuttava hermiittinen operaattori on projektio jollekin<br />

H:n aliavaruudelle.<br />

Todistus 5.3 P M on hermiittinen:<br />

P M on rajoitettu:<br />

eli ‖P M ‖ 2 ≤ 1.P 2 M = P M:<br />

〈u|P M v〉 = 〈u|v ′ 〉 = 〈u ′ + u ′′ |v ′ 〉 = 〈u ′ |v ′ 〉 = 〈u ′ |v ′ + v ′′ 〉 = 〈P M u|v〉.<br />

‖P M u‖ 2 = ∥ ∥ u<br />

′ ∥ ∥ 2 ≤ ∥ ∥ u<br />

′ ∥ ∥ 2 + ∥ ∥u ′′∥ ∥ 2 = ∥ ∥u ′ + u ′′∥ ∥ 2 = ‖u‖ 2 .<br />

P 2 Mu = P M u ′ = u ′ = P M u ∀ u ∈ H ⇒ P 2 M = P M .<br />

Käänteinen puoli: Olkoon P † = P = P 2 . P on rajoitettu, koska<br />

‖P u‖ 2 = |〈P u|P u〉| = |〈u|P 2 u〉| = |〈u|P u〉| ≤ ‖u‖ ‖P u‖<br />

eli ‖P u‖ ≤ ‖u‖. P projektio-operaattori: Olkoon M = {u : u = P u}. M on vektoriavaruus, sillä<br />

u = P u & v = P v ⇒ P (au + bv) = aP u + bP v = au + bv. Lisäksi M on suljettu: jos u n → u ja<br />

P u n = u n , niin<br />

u = lim u n = lim P u n =<br />

n→∞ n→∞ }{{} P u.<br />

P jva.<br />

M on siis H:n aliavaruus. Olkoon v ∈ H, määritellään<br />

Nyt v ′′ ∈ M ⊥ , sillä jos w ∈ M, niin<br />

Siis P on projektio M:lle.<br />

U : H → H on unitaarinen, jos<br />

v ′ = P v<br />

v ′′ = (id H − P )v = v − v ′ .<br />

〈v ′′ |w〉 = 〈v − P v|w〉<br />

= 〈v|w〉 − 〈P v|w〉<br />

= 〈v|w〉 − 〈v|P w〉<br />

= 〈v|w〉 − 〈v|w〉<br />

= 0.<br />

ja U −1 on olemassa. Suoraan määritelmästä seuraa:<br />

joten<br />

Lisäksi<br />

〈Uu|Uv〉 = 〈u|v〉 ∀ u, v ∈ H (5.10)<br />

〈U † Uu|v〉 = 〈u|v〉 ∀ u, v ∈ H,<br />

U † U = id H eli U −1 = U † .<br />

‖Uu‖ 2 = 〈Uu|Uu〉 = 〈u|u〉 = ‖u‖ 2 (5.11)<br />

eli U on isometrinen (säilyttää normin). Kääntäen jokainen isometrinen operaattori S on unitaarinen:<br />

〈S(u + v)|S(u + v)〉 − i〈S(u + iv)|S(u + iv)〉<br />

= 〈u + v|u + v〉 − i〈u + iv|u + iv〉. (5.12)


52<br />

Purkamalla sisätulot auki ja käyttämällä isometrisyyttä uudelleen saadaan:<br />

Pätee siis<br />

Oikea puoli = 〈u|u〉 + 〈u|v〉 + 〈v|u〉 + 〈v|v〉<br />

− i〈u|u〉 + 〈u|v〉 − 〈v|u〉 − i〈v|v〉<br />

= (1 − i)〈u|v〉 + (1 − i)〈v|v〉 + 2〈u|v〉.<br />

Vasen puoli = 〈Su|Su〉 + 〈Su|Sv〉 + 〈Sv|Su〉 + 〈Su|Sv〉<br />

− i〈Su|Su〉 + 〈Su|Sv〉 − 〈Sv|Su〉 − i〈Sv|Sv〉<br />

= (1 − i)〈Su|Su〉 + (1 − i)〈Sv|Sv〉 + 2〈Su|Sv〉<br />

(S isom. →) = (1 − i)〈u|u〉 + (1 − i)〈v|v〉 + 2〈Su|Sv〉.<br />

5.12 ⇐⇒ 2〈Su|Sv〉 = 2〈u|v〉<br />

jakamalla tämä 2:lla saadaan 〈Su|Sv〉 = 〈u|v〉 eli S on unitaarinen.<br />

Olkoon nyt H separoituva, {e k } o.n. kanta sekä U unitaarinen operaattori H:lla. Tällöin myös vektorit<br />

e ′ i = Ue i muodostavat o.n. kannan, sillä<br />

〈e ′ i|e ′ j〉 = 〈Ue i |Ue j 〉 = 〈e i |e j 〉 = δ ij .<br />

Kääntäen jos {e ′ k } ja {e k} ovat kaksi o.n. kantaa ja määritellään operaattori U s.e. Ue i = e ′ i ∀ i ∈ N,<br />

niin U on unitaarinen: Olkoon<br />

∞∑<br />

∞∑<br />

u = u i e i ja v = v i e i .<br />

Tällöin<br />

i=1<br />

i=1<br />

i=1<br />

∞∑ ∞∑<br />

〈Uu|Uv〉 = 〈 u i Ue i | v j Ue j 〉 =<br />

=<br />

j=1<br />

∞∑<br />

u ∗ i v j δ ij =<br />

i,j=1<br />

∞∑<br />

u ∗ i v j 〈e ′ i|e ′ j〉<br />

i,j=1<br />

∞∑<br />

u ∗ i v i = 〈u|v〉<br />

i=1<br />

eli U on unitaarinen.<br />

6 Spektraaliteoriaa<br />

6.1 Ominaisvektorit<br />

Määritelmä 6.1 α ∈ C on rajoitetun operaattorin A : H → H ominaisarvo, jos on olemassa ¯0 ≠ u ∈<br />

H s.e. Au = αu. Tällöin u on operaattorin A ominaisvektori.<br />

Huom. Au = αu → A(βu) = α(βu). Monikäsitteisyyttä voidaan rajoittaa vaatimalla esimerkiksi<br />

‖u‖ 2 = 1. Voi olla myös v ≠ βu, jolle Av = αv. Tällöin ominaisarvo on degeneroitunut.<br />

Lause 6.1 Hermiittisen operaattorin ominaisarvot ovat reaalisia ja erisuuria ominaisarvoja vastaavat<br />

ominaisvektorit ovat ortogonaalisia. (vrt. Sturm-Liouville)<br />

Todistus 6.1 Olkoon α ja u s.e. Au = αu. Nyt<br />

ja koska 〈u|u〉 ≠ 0 (u ≠ ¯0) on oltava α = α ∗ .<br />

Jos lisäksi Av = βv, α ≠ β, niin<br />

α〈u|u〉 = 〈u|Au〉 = 〈A † u|u〉 = 〈Au|u〉 = α ∗ 〈u|u〉<br />

β〈u|v〉 = 〈u|Av〉 = 〈A † u|v〉 = α〈u|v〉<br />

eli (α − β)〈u|v〉 = 0, ja koska α ≠ β on oltava 〈u|v〉 = 0.


53<br />

Sanomme, että operaattori A on täydellinen, jos sen ominaisvektorit muodostavat täydellisen o.n.<br />

joukon, eli mielivaltainen u ∈ H voidaan esittää<br />

u = ∑ α<br />

c α u α , (6.1)<br />

missä Au α = αu α .<br />

Esimerkki 6.1 (Projektio-operaattorin täydellisyys) Projektioille P 2 = P , joten jos P u = αu,<br />

niin<br />

αu = P u = P 2 u = αP u = α 2 u.<br />

Tällöin siis α 2 = α eli α = 1 tai 0. P projisoi jollekin aliavaruudelle M:<br />

u ∈ M =⇒ P u = u (ominaisarvo 1)<br />

u ∈ M 2 =⇒ P u = 0 (ominaisarvo 0).<br />

Todistimme aiemmin, että mikä tahansa u ∈ H voidaan esittää u = u ′ + u ′′ , missä u ′ ∈ M ja u ′′ ∈<br />

M ⊥ . Erityisesti nämä ovat P M :n ominaisvektoreita ja ortogonaalisia, joten projektio-operaattorit ovat<br />

täydellisiä.<br />

Lause 6.2 Unitaarisen operaattorin ominaisarvot ovat muotoa α = e ia , missä a ∈ R, ja erisuuria<br />

ominaisarvoja vastaavat ominaisvektorit ovat ortogonaalisia.<br />

Todistus 6.2 Jos Uu = αu, niin<br />

eli |α| = 1 t.s. α = e ia , jollakin a ∈ R.<br />

Olkoon lisäksi Uv = βv, α ≠ β. Tällöin<br />

Lisäksi<br />

eli U † u = α −1 u = α ∗ u (|α| = 1). Pätee siis<br />

ja koska α ≠ β on oltava 〈u|v〉 = 0.<br />

6.2 Rajoitetun operaattorin spektri<br />

‖u‖ = ‖Uu‖ = ‖αu‖ = |a| ‖u‖ ,<br />

β〈u|v〉 = 〈u|Uv〉 = 〈U † u|v〉.<br />

U † U = id H =⇒ u = U † Uu = αU † u,<br />

β〈u|v〉 = 〈α ∗ u|v〉<br />

⇐⇒ (α − β)〈u|v〉 = 0,<br />

Äärellisulotteisessa sisätuloavaruudessa (dim(V ) = n) on kannan valinnan jälkeen ”operaattori ⇔ n×n<br />

matriisi”. (Äärellisulotteisella) Matriisilla on aina ominaisarvoja: det(M − λI) on n:nnen asteen yhtälö<br />

λ:lle ja algebran peruslauseen mukaan sillä on aina juuri(a). Ääretönulotteisessa avaruudessa tilanne<br />

on monimutkaisempi.<br />

Esimerkki 6.2 H = l 2 . Tutkitaan Siirto-operaattoreita S + , S − : l 2 → l 2<br />

S + (x 1 , x 2 , x 3 , . . .) = (0, x 1 , x 2 , . . .) (6.2)<br />

S − (x 1 , x 2 , x 3 , . . .) = (x 2 , x 3 , x 4 , . . .) (6.3)<br />

Jos (0, x 1 , x 2 , . . .) = S + (x 1 , x 2 , . . .) = α(x 1 , x 2 , . . .), niin on oltava αx 1 = 0.


54<br />

Jos x 1 = 0, niin x 2 = 0, joten x 3 = 0, joten x 4 = 0 jne. x i = 0 ∀ i ∈ N. ¯0 ei kuitenkaan kelpaa<br />

ominaisvektoriksi.<br />

Jos taas α = 0, niin x 1 = αx 2 = 0, x 2 = αx 3 = 0 jne. a i = αx i+1 = 0 ∀ i ∈ N. ¯0 ei kuitenkaan kelpaa<br />

ominaisvektoriksi, joten S + :lla ei ole ominaisvektoreita!<br />

Jos (x 2 , x 3 , . . .) = S − (x 1 , x 2 , . . .) = α(x 1 , x 2 , . . .), niin on oltava<br />

x 2 = αx 1<br />

x 3 = αx 2 = α 2 x 1<br />

x 4 = αx 3 = α 3 x 1<br />

.<br />

x i = αx i−1 = α i−1 x 1 ,<br />

joten ominais vektori on muotoa x = x 1 (1, α, α 2 , . . .). Lisäksi jotta<br />

‖x‖ 2 = |x 1 | 2<br />

∞ ∑<br />

n=0<br />

|α| 2n < ∞,<br />

on oltava |α| < 1. Jokainen α ∈ C, jolle |α| < 1 on siis ominaisarvo! Huomaa ero (vaikka S − = S † + )!<br />

Esimerkki 6.3 H = L 2 ([a, b])<br />

Määritellään operaattori X : L 2 → L 2 :<br />

Huomataan:<br />

‖Xf‖ 2 =<br />

∫ b<br />

a<br />

(Xf)(x) = xf(x) (6.4)<br />

∫ b<br />

x 2 |f(x)| 2 ≤ M 2 |f(x)| 2 = M 2 ‖f‖ 2 ,<br />

missä M = max{|a|, |b|}, joten X on rajoitettu. Lisäksi X on myös hermiittinen (Tarkista!). X:n<br />

ominaisfunktio toteuttaisi<br />

xf λ (x) = λf λ (x) m.k. x ∈ [a, b],<br />

joten täytyy olla f λ (x) = 0 m.k. x ∈ [a, b], mutta ¯0 ei käy ominaisvektoriksi. (Toisaalta distribuutio<br />

f λ (x) = δ(x − λ) kävisi, muttei kuulu L 2 :een)<br />

Tarvitaan siis uusi käsite spektri, joka yleistää ominaisarvot ja ottaisi huomioon edellisen esimerkin<br />

kaltaiset tilanteet. Huomataan, että jos λ on A:n ominaisarvo, niin (A − λid H ) −1 ei ole olemassa: Jos<br />

(A − λid H ) −1 olisi olemassa ja Au = λu, niin<br />

u = (A − λid H ) −1 (A − λid H )u = (A − λid H ) −1¯0 = ¯0.<br />

Määritelmä 6.2 λ ∈ C on operaattorin A säännöllinen arvo (engl. regular value) jos (A − λid H ) −1<br />

on olemassa ja rajoitettu.<br />

Määritelmä 6.3 Operaattorin A spektri on joukko<br />

a<br />

∑<br />

(A) = {λ ∈ C : λ ei ole A:n säännöllinen arvo} (6.5)<br />

Ainakin A:n kaikki ominaisarvot kuuluvat spektriin. ominaisarvot = ”pistespektri”, muut spektrin piteet<br />

= ”jatkuva spektri”.


55<br />

Esimerkki 6.4 (jatkoa esimerkkiin 6.3) Tarkastellaan siis L 2 :n operaattoria (Xf)(x) = xf(x).<br />

Jos λ /∈ [a, b] (siis Im(λ) ≠ 0 tai Im(λ) = 0 ja λ < a tai λ > b) niin x − λ ≠ 0 kaikilla x ∈ [a, b] ja<br />

sillä voidaan jakaa:<br />

Lisäksi käänteisoperaattori on rajoitettu:<br />

∥<br />

∥(A − λid L 2) −1 f ∥ ∫ b<br />

2 =<br />

a<br />

((X − λid L 2)f)(x) = (x − λ)f(x)<br />

=⇒ ((X − λid L 2) −1 f)(x) = 1<br />

x − λ f(x)<br />

dx<br />

|x − λ| 2 |f(x)|2 ≤ 1 ∫ b<br />

d 2 dx|f(x)| 2 = 1 d 2 ‖f‖2 ,<br />

missä 0 < d = inf x∈[a,b] |x − λ| = ”λ:n etäisyys janasta [a,b]”. Jokainen λ /∈ [a, b] on siis X:n säännöllinen<br />

arvo. Jos taas λ ∈ [a, b], niin (X − λid L ) −1 ei ole rajoitettu (Osoita!), joten<br />

∑<br />

(A) = {λ : a ≤ λ ≤ b} = [a, b].<br />

a<br />

Lause 6.3 Olkoon A Hilbert avaruuden rajoitettu operaattori. Tällöin<br />

1. λ ∈ ∑ (A) ⇒ |λ| ≤ ‖A‖.<br />

2. A:n säännöllisten arvojen joukko on avoin.<br />

3. ∑ (A) on C:n kompakti osajoukko.<br />

Todistus 6.3 (1) Olkoon λ s.e. |λ| > ‖A‖. Operaattorin A/λ normi on tällöin < 1, joten<br />

(id H − 1 λ A)−1 =<br />

∞∑<br />

( ) A n<br />

λ<br />

on olemassa ja rajoitettu. (A − λid H ) = λ(A/λ − id H ), joten (A − λid H ) −1 = −1/λ(id H − A/λ) −1 on<br />

olemassa ja λ on säännöllinen. Siis jos λ ∈ ∑ (A) on oltava λ ≤ ‖A‖.<br />

(2) Olkoon λ 0 säännöllinen arvo ja λ ∈ C. Muodostetaan<br />

jolle<br />

Tällöin on olemassa ja rajoitettu<br />

n=0<br />

B = id H − (A − λ 0 id H ) −1 (A − λid H )<br />

= (A − λ 0 id H ) −1 [(A − λ 0 id H ) − (A − λid H )]<br />

= (A − λ 0 id H ) −1 (λ − λ 0 )id H ,<br />

‖B‖ = |λ − λ 0 | ∥ ∥(A − λ 0 id H ) −1∥ ∥ < 1<br />

1<br />

kun |λ − λ 0 | <<br />

‖(A − λ 0 id H ) −1 ‖ .<br />

(id H − B) −1 = [(A − λ 0 id H )(A − λid H )] −1<br />

= (A − λid H ) −1 (A − λ 0 id H ),<br />

joten myös λ on säännöllinen. On siis olemassa λ 0 :n ympäristö, jossa kaikki λ:t ovat säännöllisiä,<br />

joten säännöllisten arvojen joukko on avoin.<br />

(3) ∑ (A) on (1)-kohdan nojalla rajoitettu ja (2)-kohdan nojalla suljettu (avoimen joukon komplementtina),<br />

joten se on Heine-Borelin lauseen nojalla kompakti.


56<br />

6.3 Hermiittisen operaattorin spektri<br />

Lause 6.4 Rajoitetun hermiittisen operaattorin spektri on reaalinen.<br />

Todistus 6.4 Olkoon λ = a + ib, b ≠ 0 ja<br />

V = {(A − λid H )u : u ∈ H} . (6.6)<br />

Osoitetaan ensin että V on H:n aliavaruus. V on selvästi vektorialiavaruus, joten riittää osoittaa, että<br />

se on suljettu. Olkoon v n = (A−λid H )u n → v jono V:n vektoreita. On osoitettava, että v ∈ V . Kaikilla<br />

w ∈ H pätee:<br />

joten<br />

‖(A − id H )w‖ 2 = 〈(A − id H )w|(A − id H )w〉<br />

= ‖Aw‖ 2 + |λ| 2 ‖w‖ 2 − λ〈Aw|w〉 − λ ∗ 〈w|Aw〉<br />

= ‖Aw‖ 2 + |λ| 2 ‖w‖ 2 − (λ + λ ∗ )〈w|Aw〉<br />

} {{ }<br />

2a<br />

= ‖Aw‖ 2 + (a 2 + b 2 ) ‖w‖ 2 − a (〈w|Aw〉 + 〈Aw|w〉)<br />

= ‖(A − aid H )w‖ 2 + b 2 ‖w‖ 2<br />

=⇒ ‖w‖ 2 = 1 b 2 (<br />

‖(A − λid H )w‖ 2 − ‖(A − aid H )w‖ 2)<br />

≤ 1 b 2 ‖(A − λid H)w‖ 2<br />

⇐⇒ ‖w‖ ≤ 1<br />

|b| ‖(A − λid H)w‖ , (6.7)<br />

‖u n − u m ‖ ≤ 1<br />

|b| ‖(A − λid H)(u n − u m )‖ = 1<br />

|b| ‖v n − v m ‖ −→ 0,<br />

koska (v n ) on suppeneva (erityisesti Cauhcy) jono. Myös u n on siis Cauchyn jono, joten se on myös<br />

suppeneva (H täydellinen) eli on olemassa lim n u n = u. Mutta A − λid H on jatkuva operaattori, joten<br />

siis v ∈ V .<br />

Olkoon nyt w ∈ V ⊥ eli<br />

(A − λid H )u = lim<br />

n→∞ (A − λid H)u n = lim<br />

n→∞ v n = v<br />

〈(A − λid H )u|w〉 = 〈u|(A − λ ∗ id h )w〉 = 0 ∀ u ∈ H.<br />

Valinnalla u = (A − λ ∗ id H )w seuraa Aw = λ ∗ w. Jos w ≠ ¯0 on siis λ ∗ = a − ib, b ≠ 0 A:n ominaisarvo.<br />

Mutta A † = A ja kaikki ominaisarvot ovat reaalisia, joten w = ¯0 on ainoa mahdollisuus. On siis<br />

V ⊥ = {¯0} eli V = H.<br />

Olemme siis osoittaneet, että jokainen v ∈ H voidaan kirjoittaa v = (A − λid H )u, jollakin u ∈ H.<br />

Tässä u on yksikäsitteinen, sillä jos (A − λid H )u 1 = (A − λid H )u 2 , niin A(u 1 − u 2 ) = λ(u 1 − u 2 ).<br />

Koska λ /∈ R, se ei voi olla ominaisarvo, joten on oltava u 1 − u 2 = ¯0 eli u 1 = u 2 .<br />

Koska yo. u on yksikäsitteinen, voidaan määritellä operaattori B kaavalla Bv = u. Ilmeisesti B(A −<br />

λid H ) = (A − λid H )B = id H , joten B = (A − λid H ) −1 ja todistuksen alkuosan (6.7) mukaan se on<br />

rajoitettu, joten λ on säännöllinen arvo. Pätee siis ∑ (A) ⊂ R.<br />

6.4 Spektraaliesitys<br />

Kvanttimekaniikkaa tunteville on varmaankin avuksi tarkastella ensiksi pienenä alkumotivaationa kvanttimekaanisen<br />

systeemin Hamiltonin operaattoria H. Olkoon systeemillä ominaisenergiat E n , n = 0, . . ..


57<br />

Oletetaan että kaikkien mahdollinen degeneraatioaste on sama, eli kutakin energian ominaisarvoa vastaa<br />

K ominaistilaa |n k 〉:<br />

H|n k 〉 = E n |n k 〉 , k = 1, . . . , K ,<br />

jotka ovat ortogonaaleja,<br />

〈n k |m l 〉 = δ n,m δ k,l .<br />

Energian ominaistilat muodostavat ortonormaalin kannan jossa systeemin tilat |ψ〉 voidaan esittää,<br />

missä kertoimet<br />

|ψ〉 =<br />

∞∑<br />

n=0 k=1<br />

K∑<br />

c nk |n k 〉 ,<br />

c nk = 〈n k |ψ〉 .<br />

Koska tilat |n k 〉 muodostavat ortonormaalin kannan, pätee täydellisyysrelaatio<br />

Voimme nyt kirjoittaa<br />

H = id H id =<br />

Määritelemällä operaattori<br />

∞∑<br />

voidaan siis kirjoittaa H muodossa<br />

K∑<br />

id =<br />

∞∑<br />

n=0 k=1 m=0 l=1<br />

∞∑<br />

n=0 k=1<br />

K∑<br />

|n k 〉〈n k | .<br />

K∑<br />

|n k 〉〈n k |H|m l 〉〈m l | =<br />

P n ≡<br />

H =<br />

K∑<br />

|n k 〉〈n k |<br />

k=1<br />

∞∑<br />

E n P n ,<br />

n=0<br />

∞∑<br />

n=0<br />

E n<br />

K ∑<br />

k=1<br />

|n k 〉〈n k |<br />

tämä on Hamiltonin operaattorin ns. spektraalihajotelma eli spektraaliesitys. On helppo tarkistaa että<br />

P n on projektio-operaattori ominaisarvoa E n vastaavaan (K-ulottaiseen) ominaisavaruuteen, jonka<br />

virittävät tilat {n k }, =˛1 . . . K.<br />

Siirrymme nyt takaisin matematiikkaan ja johdamme spektraaliesityksen yleisemmin hermiittisille ja<br />

täydellisille operaattoreille A. Aiheen täsmällinen esitys on varsin tekninen, joten tyydymme tässä<br />

vain luonnostelemaan teoriaa. Aloitetaan yksinkertaisesta tapauksesta: A : H → H hermiittinen,<br />

täydellinen ja H separoituva. A:n ominaisvektoreista voidaan rakentaa kanta {e nk }<br />

Ae nk = λ n e nk , k = 1, 2, . . . , K n ,<br />

missä K on n:nnen ominaisarvon degeneraatioaste.<br />

ja jokainen u ∈ H voidaan esittää<br />

u =<br />

〈e nk |e ml 〉 = δ nm δ kl (6.8)<br />

∞∑<br />

n=1<br />

(<br />

Kn<br />

)<br />

∑<br />

u nk e nk . (6.9)<br />

k=1<br />

Ominaisarvot λ n ovat diskreettejä, joten ne voidaan järjestää kasvavaan jonoon λ 1 < λ 2 < λ 3 < . . ..<br />

Olkoon P n projektio-operaattori aliavaruuteen, joka vastaa ominaisarvoa λ n (”λ n :n ominaisavaruus”,<br />

vektoreiden e n1 , e n2 , . . ., e nKn virittämä):<br />

P n u = P n<br />

( ∞<br />

∑<br />

n=1<br />

(<br />

Kn<br />

))<br />

∑<br />

∑K n<br />

u nk e nk = u nk e nk . (6.10)<br />

k=1<br />

k=1


58<br />

Helposti nähdään Pn 2 = P n . Operaattorit P n toteuttavat lisäksi P n P m = δ nm P n sekä ∑ n P n = id H .<br />

Lasketaan (formaalisti):<br />

(<br />

)<br />

∞∑<br />

∞∑ ∑K n<br />

( λ n P n )u = λ n u nk e nk (6.11)<br />

Toisaalta<br />

joten<br />

Au = A<br />

( ∞<br />

∑<br />

n=1<br />

(<br />

Kn<br />

n=1<br />

))<br />

∑<br />

u nk e nk =<br />

k=1<br />

∞∑<br />

n=1<br />

A =<br />

n=1<br />

(<br />

Kn<br />

k=1<br />

)<br />

∑<br />

u nk Ae nk =<br />

k=1<br />

(<br />

∞∑<br />

n=1<br />

)<br />

∑<br />

u nk e nk ,<br />

λ n<br />

K n<br />

k=1<br />

∞∑<br />

λ n P n . (6.12)<br />

n=1<br />

Tämä on operaattorin A spektraaliesitys. Kirjoitetaan (6.12) toiseen muotoon. Tätä varten tarvitaan<br />

uusi käsite, Stieltjesin integraali:<br />

∫ b<br />

a<br />

f(x)dg(x) = lim<br />

N→∞<br />

N∑<br />

f(c i ) (g(x i+1 ) − g(x i ))<br />

i=0<br />

= lim<br />

|∆x i |→0<br />

N∑<br />

f(c i ) (g(x i+1 ) − g(x i )) , (6.13)<br />

i=0<br />

missä a = x 0 < x 1 < . . . < x N < x N+1 = b on välin [a, b] jako, c i ∈ [x i , x i+1 ] ja |∆x i | = |x i+1 − x i |.<br />

Jos g on differentioituva, niin<br />

∫ b<br />

a<br />

f(x)dg(x) =<br />

∫ b<br />

Erityisesti valinta g(x) = x antaa Riemannin integraalin<br />

∫ b<br />

a<br />

a<br />

f(x)g ′ (x)dx. (6.14)<br />

f(x)dx. (6.15)<br />

Stieltjesin integraali on hyvin määritelty laajemmalle funktiojoukolle. Esimerkiksi jos<br />

{ 0 , x < 0<br />

g(x) = θ(x) =<br />

1 , x ≥ 0<br />

ja a < 0 < b, niin<br />

∫ b<br />

a<br />

f(x)dθ(x) = f(0).<br />

(Mikä on yhtäpitävää kaavan θ ′ (x) = δ(x) kanssa.) Tulos seuraa siitä että määritelmän (6.13) oikean<br />

puolen summassa ainoa ei-häviävä termi tulee sillä indeksin i arvolla jolla x i+1 > 0 > x i , tällöin<br />

g(x i+1 ) − g(x i ) = 1 − 0, muulloin joko 0 − 0 tai 1 − 1.<br />

Kaikkien operaattorien spektrissä ei ole ollenkaan ominaisarvoja, mutta edellinen tulos voidaan yleistää<br />

käyttämättä eksplisiittisesti ominaisavaruuksien projektio-operaattoreita: Jos g on paloittain vakio<br />

välillä [a, b]:<br />

⎧<br />

g 0 , a < x < y 1<br />

g 1 = g 0 + h 1 , y 1 ≤ x < y 2<br />

⎪⎨<br />

· · ·<br />

g(x) =<br />

,<br />

g i = g i−1 + h i , y i ≤ x < y i+1<br />

· · · ⎪⎩<br />

g p = g p−1 + h p , y p ≥ x ≤ b


59<br />

funktion g(x) arvo hyppää siis p kertaa, aina askeleen h i kohdassa x = y i . Vastaavaan tapaan kuin<br />

askelfunktiolle θ nähdään että<br />

∫ b<br />

p∑<br />

f(x)dg(x) = h i f(y i ) .<br />

a<br />

Operaattorin A ominaisarvot kuuluvat spektriin ∑ (A) (⊂ R), joka on kompakti, joten on ¯λ 0 =<br />

inf ∑ (A) ja ¯λ 0 = sup ∑ (A), joilla ¯λ 0 ≤ λ n ≤ ¯λ M . Määritellään operaattoriarvoinen funktio E A (λ):<br />

i=1<br />

⎧<br />

⎨ ¯0 , λ < λ<br />

∑ 1<br />

E A (λ) = k<br />

⎩ ∑ i=1 P i , λ k ≤ λ < λ k+1 , (6.16)<br />

i P i = id , λ ≥ λ M<br />

missä ¯0 on siis 0-operaattori. E A toteuttaa<br />

E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 )),<br />

koska projektioille P i P j = δ ij P i . Tästä seuraa E A (λ) 2 = E A (λ) eli E A on projektio-operaattori. Määritellään<br />

seuraavaksi operaattoriarvoinen Stieltjesin integraali:<br />

∫ ¯λM<br />

¯λ 0<br />

f(λ)dE A (λ) = lim<br />

N→∞<br />

N∑<br />

f(c i )(E A (λ i+1 ) − E A (λ i ))<br />

i=1<br />

= lim<br />

|∆λ i |→∞<br />

N∑<br />

f(c i )(E A (λ i+1 ) − E A (λ i )), (6.17)<br />

i=1<br />

missä taas λ i : i = 1, . . . , N on välin [¯λ 0 , ¯λ M ] jako, c i ∈ [λ i , λ i+1 ] ja |∆λ i | = |λ i+1 −λ i |. Ilmeisesti pätee:<br />

∫ λ<br />

¯λ 0<br />

dE A (λ) = E A (λ) (6.18)<br />

∫ ¯λM<br />

¯λ 0<br />

λdE A (λ) = A. (6.19)<br />

Tämä esitys yleistyy: Rajoitetun, hermiittisen operaattorin spektraaliesitys:<br />

A =<br />

∫ sup<br />

∑ (A)<br />

inf ∑ (A)<br />

missä E A on operaattoriarvoinen funktio, joka toteuttaa:<br />

E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 ))<br />

lim E A(λ) = ¯0<br />

λ→−∞<br />

∫ sup<br />

∑ (A)<br />

inf ∑ (A)<br />

lim E A(λ) = id<br />

λ→∞<br />

dE A (λ) = id.<br />

λdE A (λ), (6.20)<br />

Esimerkki 6.5 Operaattori X L 2 [a, b]:ssa (kts. esimerkki 6.3).<br />

Määritelllään operaattoriarvoinen funktio E kaavalla<br />

{ f(y) , y ≤ x<br />

(E(x)f)(y) =<br />

0 , y > x . (6.21)


60<br />

Jaetaan osaväli N:ään osaväliin a = x 0 < x 1 < . . . < x N−1 < x N = b. Olkoon y ∈ [a, b] annettu,<br />

jolloin y ∈ [x k−1 , x k ] jollakin k. Nyt<br />

[(<br />

∑ N<br />

) ]<br />

c i (E(x i ) − E(x i−1 ) f (y)<br />

i=1<br />

= 0 + 0 + . . . + c k (f(y) − 0)<br />

+ c k+1 (f(y) − f(y)) + . . . + c N (f(y) − f(y))<br />

= c k f(y) −→ yf(y) = (Xf)(y)<br />

( ∑N<br />

)<br />

eli operaattori<br />

i=1 c i(E(x i ) − E(x i−1 ) lähestyy operaattoria X, toisaalta se myös määrittelee Stieltjesintegraalin<br />

(6.13) jonka integrandissa esiintyy funktio f(x) = x. Kaiken kaikkiaan siis<br />

X =<br />

∫ b<br />

a<br />

xdE(x) . (6.22)<br />

Näin saatiin paikkaoperaattorille X spektraaliesitys, vaikka sillä ei ole lainkaan ominaisarvoja, ainoastaan<br />

jatkuva spektri.<br />

6.5 Rajoittamattomat operaattorit<br />

A on rajoittamaton jos jokaiselle M > 0 löytyy u ∈ H se. ‖Au‖ ≥ M ‖u‖. Kiinnostavat rajoittamattomat<br />

operaattorit A eivät ole määriteltyjä koko H:lla vaan määrittelyjoukossa (engl. domain) D A ⊂ H.<br />

Operaattorin täydellinen määrittely sisältää myös D A :n, merk. (A, D A ). Huom:<br />

(A, D A ) ≠ (A, D ′ A) jos D A ≠ D ′ A.<br />

Vastaavasti R A = A(D A ) = {u ∈ H|u = Av, v ∈ D A } on A:n maalijoukko (engl. range).<br />

D A on H:n tiheä (dense) osajoukko, jos jokaiselle u ∈ H ja jokaiselle ɛ > 0 löytyy v ∈ D A s.e.<br />

‖u − v‖ < ɛ. A on tällöin tiheästi määritelty.<br />

A on operaattorin B laajennus (extension), merkit. B ≤ A jos D B ⊂ D A ja Au = Bu, kun u ∈ D B .<br />

Merkitään myös A| DB = B.<br />

(A, D A ) = (B, D B ) tarkoittaa siis, että D A = D B ja Au = Bu ∀ u ∈ D A .<br />

Huom. Selvästikin<br />

D A+B = D A ∩ D B<br />

D AB = B −1 (R B ∩ D A ),<br />

joten operaattorit eivät yleensä muodosta vektoriavaruutta tai algebraa.<br />

Esimerkki 6.6 H = l 2 , x = (x 1 , x 2 , . . .) ∈ H<br />

Ax = (x 1 , x 2<br />

2 , x 3<br />

3 , . . . , x n<br />

, . . .) (6.23)<br />

n<br />

A on rajoitettu ja hermiittinen, joten voidaan ottaa D A = H = l 2 . Huomataan lisäksi<br />

{<br />

}<br />

∞∑<br />

R A = y ∈ l 2 : n 2 |y n | 2 < ∞ ⊂ l 2 (6.24)<br />

n=1<br />

ja R A on tiheä l 2 :ssa: Olkoon x ∈ l 2 ja ɛ > 0 annettu. Koska x ∈ l 2 löytyy N s.e. ∑ ∞<br />

i=N+1 |x i| 2 < ɛ 2 .<br />

Valitaan y n = x n , kun 0 < n ≤ N ja y n = 0 kun n > N. Nyt y ∈ R A ja ‖x − y‖ ≤ ɛ.<br />

A:lla on käänteisoperaattori, jonka määrittelyjoukko on D A −1 = R A ja (A −1 x) n = nx n . A −1 on<br />

rajoittamaton, sillä:<br />

||A(0, 0, . . . , 0 , 1, 0, . . .)|| = ||n(0, 0, . . . , 0 , 1, 0, . . .)|| = n −→ ∞<br />

}{{}<br />

}{{}<br />

n:s<br />

n:s


61<br />

Esimerkki 6.7 H = L 2 (R) ja X kuten esimerkki 6.3:ssa.<br />

X on rajoittamaton: Olkoon f n (x) = 1, kun x ∈ [n, n + 1), 0 muuten. Tällöin<br />

||f n || = 1, mutta ||Xf|| = n 2 + n + 1 3<br />

−→ ∞.<br />

Laajin mahdollinen määrittelyjoukko on<br />

{ ∫<br />

D X = f ∈ L 2 :<br />

R<br />

}<br />

dx|xf(x)| 2 < ∞ ⊂ L 2 . (6.25)<br />

Huom. esimerkiksi f(x) = 1/(1 + |x|) ∈ L 2 \ D X .<br />

D X on tiheä L 2 :ssa (vrt. edelliseen esimerkkiin l 2 :ssa): Olkoon g ∈ L 2 (R) mielivaltainen. Määritellään<br />

{ g(x) , |x| ≤ n<br />

g n (x) =<br />

0 , |x| > n , (6.26)<br />

jolloin g n ∈ D X ja g n −→ g, joten D X on tiheä. On muitakin L 2 :ssa tiheitä määrittelyjoukkoja, esim.<br />

testifunktioavaruudet<br />

D(R) = {f ∈ C ∞ (R) : ∃ M s.e. |x| > M ⇒ f(x) = 0} (6.27)<br />

{<br />

}<br />

S(R) = f ∈ C ∞ (R) : |x| p f(x) |x|→∞<br />

−→ 0, |x| −→ ∞ ∀p > 0<br />

(6.28)<br />

Ilmeisesti (X, D) ≤ (X, S) ≤ (X, D X ) ja kaikki nämä ovat rajoittamattomia.<br />

Esimerkki 6.8 X = L 2 (R) ja P = −i d<br />

dx , eli (P f)(x) = −if ′ (x).<br />

Laajin määrittelyjoukko ilmeisesti<br />

D P = { f ∈ L 2 : f differentiotuva m.k. ja f ′ ∈ L 2} ⊂ L 2 (6.29)<br />

Esim f(x) = 4√ xe −x2 /∈ D P , sillä f ′ /∈ L 2 . Se, että f ′ (0) ei ole olemassa ei haittaa. Toisaalta voimme<br />

myös ottaa määrittelyjoukoksi S:n tai D:n jolloin (P, D) ≤ (P, S) ≤ (P, P D ).<br />

6.6 Adjungoitu operaattori<br />

Apulause 6.1 Olkoon V tiheä H:ssa. Jos 〈u|v〉 = 0 kaikille v ∈ V ,niin u = ¯0.<br />

Todistus 6.5 Olk. w ∈ H, ɛ > 0. V tiheä, joten on olemassa v ∈ V s.e. ||v − w|| < ɛ. Nyt<br />

〈u|w〉 = 〈u|w − v〉 ≤ ||u||||w − v|| < ɛ||u||.<br />

ɛ > 0 mielivaltainen, joten 〈u|w〉 = 0. w ∈ H mielivaltainen, joten u = ¯0.<br />

Olkoon (A, D A ) tiheästi määritelty operaattori H:ssa. Määrittelemme joukon D A †<br />

seuraavasti:<br />

Jos u † on olemassa, se on yksikäsitteinen:<br />

u ∈ D A † ⇐⇒ ∃ u † s.e. 〈u † |v〉 = 〈u|Av〉 ∀ v ∈ D A .<br />

〈u † 1 |v〉 = 〈u† 2 ∀ v ∈ D A =⇒ 〈u † 1 − u† 2 |v〉 = 0 ∀ v ∈ D A =⇒ 〈u † 1 − u† 2 = ¯0<br />

edellisen apulauseen nojalla.<br />

Vektoreille u ∈ D A † määrittelemme<br />

(A † , D A †) on (A, D A ):n adjungoitu operaattori.<br />

Huom. Jos A on rajoitettu ja D A = H, niin määritelmä yhtyy aiempaan.<br />

Huom. (A † , D A †) voidaan määritellä vain jos D A on tiheä.<br />

Huom. (A † , D A †) riippuu myös D A :sta!<br />

A † u = u † . (6.30)


62<br />

Määritelmä 6.4 Operaattori on suljettu (engl. closed) jos jokaiselle jonolle (u n ) ⊂ D A s.e. u n → u<br />

ja Au n → v pätee u ∈ D A ja v = Au.<br />

Määritelmästä seuraa suoraan, että jokainen jatkuva operaattori on myös suljettu, mutta suljettu<br />

operaattori ei välttämättä ole jatkuva.<br />

Lause 6.5 Jos (A, D A ) on tiheästi määritelty, niin (A † , D A †) on suljettu<br />

Todistus 6.6 Olkoon y n ∈ D A †<br />

jono s.e. y n → y ja A † y n → z. Tällöin kaikille x ∈ D A<br />

〈y|Ax〉 = lim 〈y|Ax〉 = lim<br />

n→∞ n→∞ 〈A† y n |x〉 = 〈z|x〉,<br />

joten y ∈ D A † ja z = A † y.<br />

Esimerkki 6.9 H = l 2 , x = (x 0 , x 1 , x 2 , . . .) ∈ l 2 . Kanta {ē i : i ≥ 0}, (ē i ) j = δ ij .<br />

Määritellään operaattori a:<br />

eli<br />

Voimme valita<br />

ax =<br />

∞∑<br />

x i aē i =<br />

i=0<br />

aē n = √ nē n−1 , n ≥ 1 (6.31)<br />

aē 0 = ¯0, (6.32)<br />

∞∑ √<br />

i + 1x+1 ē i = (x 1 , √ 2x 2 , √ 3x 3 , . . . , √ nx n , . . .).<br />

i=0<br />

D a =<br />

{<br />

x :<br />

}<br />

∞∑<br />

n|x n | 2 < ∞ , (6.33)<br />

n=1<br />

joka on tiheä l 2 :ssa (todistus kuten esimerkissä 6.6). R a = l 2 , koska jos y ∈ l 2 , niin y = ax, missä<br />

x n = √ yn<br />

n<br />

, n ≥ 1 (x 0 mieliv.).<br />

On siis operaattori (a, D a ), missä D a kuten (6.33):ssa, mikä on (a † , D a †)?<br />

Etsitään y † s.e.<br />

∞∑<br />

(y † ) ∗ nax n = 〈y † |x〉 = 〈y|ax〉 =<br />

n=0<br />

Kandidaatti: y † 0 = 0 ja y† n = √ ny n−1 muuten, jolle<br />

||y † || =<br />

∞∑<br />

yn(ax) ∗ n =<br />

n=0<br />

∞∑<br />

yn√ ∗ n + 1xn+1 .<br />

n=0<br />

†∑<br />

(n + 1)|y n | 2 . (6.34)<br />

n=0<br />

Jos ||y † || < ∞, niin |〈y † |x〉 ≤ ∥ ∥y †∥ ∥ ‖x‖ < ∞, joten<br />

{<br />

} {<br />

∞∑<br />

D a † = x : (n + 1)|x n | 2 < ∞ = x :<br />

n=1<br />

sekä (a † y) n = y † n = √ ny n−1 eli a † ē n = √ n + 1ē n+1 ts.<br />

}<br />

∞∑<br />

n|x n | 2 < ∞ = D a<br />

n=1<br />

a † y = (0, y 0 , √ 2y 1 , √ 3y 2 , . . . , √ n + 1y n , . . .). (6.35)<br />

Sekä a että a † suljettuja, mutta R a † = {x ∈ l 2 : x 0 = 0} ≠ R a . Tarkastellaan vielä tuloja a † a ja aa † :<br />

a † ax = a † (x 1 , √ 2x 2 , √ 3x 3 , . . .) = (0, x 1 , 2x 2 , 3x 3 , . . .) (6.36)<br />

aa † x = a(0, x 0 , √ 2x 1 , √ 3x 2 , . . .) = (x 0 , 2x 1 , 3x 2 , . . .). (6.37)


63<br />

Lisäksi<br />

D a † a = {x ∈ l 2 : ∑ n<br />

D aa † = {x ∈ l 2 : ∑ n<br />

n 2 |x n | 2 < ∞} (6.38)<br />

n 2 |x n | 2 < ∞} = D a † a (6.39)<br />

Vähentämällä (6.36) ja (6.37) toisistaan saadaan:<br />

[a, a † ]x := (aa † − a † a)x = x,<br />

joten<br />

[a, a † ] = (id l 2, D a † a) = (id l 2, l 2 ) = id l 2.<br />

Helposti nähdään että jos (A, D A ) ja (B, D B ) ovat tiheästi määriteltyjä ja A ≤ B, niin B † ≤ A † :<br />

Otetaan u ∈ D A ja v ∈ D B †:<br />

〈v|Au〉 }{{} = 〈v|Bu〉 = 〈B † v|u〉,<br />

A≤B<br />

eli v ∈ D a † ja A † v = B † v, kun v ∈ D B †, joten D B † ⊂ D A † ja B † ≤ A † .<br />

Määritelmä 6.5 Olkoon D A tiheä H:ssa.<br />

• A on itseadjungoitu (engl. self-adjoint), jos (A, D A ) = (A † , D A †. (Huom. D A = D A †)<br />

• A on symmetrinen jos A ≤ A † .<br />

Lisäksi kertaus: A on hermiittinen jos A on rajoitettu, A † = A ja D a †<br />

Hilbertin avaruudessa<br />

= D A = H. Eli annetussa<br />

{A : A hermiittinen} ⊂ {A : A itseadj.} ⊂ {A : A symmetrinen}.<br />

Seuraava lause karakterisoi symmetriset operaattorit toisella tavalla.<br />

Lause 6.6 A symmetrinen ⇐⇒ 〈u|Av〉 = 〈Au|v〉 ∀ u, v ∈ D A<br />

Todistus 6.7 ”⇒”. u, v ∈ D A :<br />

〈u|Av〉 }{{} = 〈A † u|v〉 }{{} = 〈Au|v〉.<br />

D A =D A † A≤A †<br />

”⇐”. Koska 〈u|Av〉 = 〈Au|v〉 ∀ u, v ∈ D A ja D A on tiheä, on oltava Au = A † u ∀ u ∈ H. Toisaalta<br />

〈u|Av〉 = 〈A † u|v〉, joten u ∈ D A † ja A ≤ A † .<br />

Esimerkki 6.10 H = L 2 (R), Tarkastellaa operaattoria (X, D(R)), missä X on kuten esimerkki 6.3:ssa<br />

ja D(R) on määritelty yhtälöllä (6.27). Kun ϕ, ψ ∈ D(R), pätee<br />

∫<br />

〈ϕ|Xψ〉 =<br />

R<br />

dxϕ ∗ (x)xψ(x) =<br />

∫ <br />

dx(xϕ(x)) ∗ ψ(x) = 〈Xϕ|ψ〉,<br />

joten (X, D) on symmetrinen. X ei kuitenkaan ole itseadjungoitu: löytyy funktioita f /∈ D, joille on<br />

olemassa f † s.e. 〈f|Xg〉 = 〈f † |g〉 ∀ g ∈ D, esim.<br />

{ 1 , |x| ≤ 1<br />

f(x) =<br />

0 , |x| > 1 ,


64<br />

jolloin<br />

f † (x) =<br />

{ x , |x| ≤ 1<br />

0 , |x| > 1 .<br />

Samalla tavalla osoitetaan, ettei myöskään (X, S(R)) ole itseadjungoitu. Mutta onko (X, D X )? Palautetaan<br />

mieliin että<br />

{ ∫<br />

}<br />

D X = f ∈ L 2 : dx|xf(x)| 2 < ∞ , (6.40)<br />

R<br />

joka on L 2 :n tiheä osajoukko. Kuten yllä (X, D X ) on symmetrinen, joten D X ⊂ D X †. Jotta D X = D X †<br />

ja X olisi itseadjungoitu, riittää osoittaa inkluusio toiseen suuntaan.<br />

{<br />

D X † = f ∈ L 2 : ∃ f † s.e. 〈f|Xg〉 = 〈f † |g〉 ∀ g ∈ L 2} (6.41)<br />

Olkoon g ∈ D X †. Jos ∀ f ∈ D X pätee<br />

niin<br />

∫<br />

R<br />

〈g|Xf〉 = 〈g † |f〉,<br />

dx(xg ∗ (x) − g † (x))f(x) = 0, (6.42)<br />

eli apulauseen 6.1 nojalla g † (x) = xg ∗ (x) m.k. x ∈ R. g † ∈ L 2 =⇒ Xg(x) ∈ L 2 eli g ∈ D X †. Pätee siis<br />

D X † ⊂ D X , joten (X, D X ) on itseadjungoitu.<br />

6.7 Käänteisoperaattorin yleistys<br />

Olkoon A : D A → R A .<br />

Määritellään operaattorin A ydin (engl. kernel)<br />

Ker(A) = {u ∈ D A : Au = ¯0}. (6.43)<br />

¯0 ∈ Ker(A) aina, mutta jos tämä on ainoa mahdollisuus, eli jos Ker(A) = {¯0}, niin voimme määritellä<br />

operaattorin (A −1 , R A ) asettmalla<br />

A −1 u = v ⇐⇒ Av = u, (6.44)<br />

eli A −1 : R A → D A . Tämä on hyvin määritelty:<br />

Av 1 = Av 2 = u<br />

=⇒A(v 1 − v 2 ) = ¯0<br />

=⇒v 1 − v 2 ∈ Ker(A) = ¯0<br />

=⇒v 1 = v 2<br />

6.8 Itseadjungoidun operaattorin spetkristä<br />

(A, D A ) Itseadjungoitu ⇒ ominaisarvot (jos niitä on) ovat reaalisia ja erisuuria ominaisarvoja vastaavat<br />

ominaisvektorit ovat ortogonaalisia (tod. kuten hermiittisille operaattoreille). Jokaiselle λ ∈ C<br />

määritellään resolventtijoukko<br />

∆ λ = R A−λid . (6.45)<br />

Jos λ ei ole ominaisarvo ((A − λid) −1 , R A−λid ) on olemassa (u ∈ Ker(A − λid) =⇒ Au = λu, mutta<br />

λ ei ole ominaisarvo, joten u = ¯0 ja Ker(A) = {¯0}) ja D (A−λid) −1 = R A−λid = ∆ λ .<br />

λ ∈ C on säännöllinen arvo jos ∆ λ = H.<br />

C \ {säännölliset arvot} = ∑ (A) = A:n spektri.<br />

Lause 6.7 λ ∈ C on itseadjungoidun operaattorin ominaisarvo jos ja vain jos ∆ λ ei ole tiheä H:ssa.


65<br />

Todistus 6.8 1) Jos Au = λu, ¯0 ≠ u ∈ D A , λ ∈ R pätee<br />

0 = 〈(A − λid)u|v〉) = 〈u| (A − λid)v〉 ∀ v ∈ D<br />

} {{ }<br />

A<br />

=:w∈∆ λ<br />

eli 〈u|w〉 = 0 ∀ u ∈ ∆ λ . jos ∆ λ olisi tiheä, tästä seuraisi u = ¯0, mikä on ristiriita eli ∆ λ ei ole tiheä<br />

(H:ssa).<br />

2) Ol. ∆ λ ei ole tiheä. ∆ λ ( sulkeuma ) on H:n aliavaruus ja ∆ λ<br />

⊥<br />

≠ {¯0}. On siis olemassa ¯0 ≠ u s.e.<br />

D A on tiheä, joten (A − λid)u = ¯0 eli Au = λu.<br />

〈u|(A − λid)v〉 = 0 ∀ v ∈ D A<br />

t.s. 〈(A − λid)u|v〉 = 0 ∀ v ∈ D A .<br />

Spektraaliesityslause. Olkoon (A, D A ) itseadjungoitu. On olemassa operaattoriarvoinen funktio E A (λ) (λ ∈<br />

R) s.e.<br />

E A (−∞) = 0<br />

E A (∞) = id<br />

E A (λ 1 )E A (λ 2 ) = E A (min(λ 1 , λ 2 ))<br />

∫<br />

λdE A (λ) = A<br />

∫<br />

R<br />

λd〈u|E A (λ)v〉 = 〈u|Av〉 ∀ u, v ∈ D A .<br />

R<br />

Todistus vaikea (sivuutetaan tässä). Spektraaliesitys mahdollistaa operaattorifunktioide määritelmän<br />

∫<br />

f(A) = f(λ)dE A (λ). (6.46)<br />

6.9 Yhteys kvanttimekaniikkaan<br />

6.10 Paikkaoperaattori<br />

( ˆX, D ˆX)<br />

D ˆX<br />

=<br />

( ˆX, D ˆX<br />

itseadjungoitu. Spektraaliesitys:<br />

Määr. operaattorit Êx, x ∈ R<br />

eli<br />

R<br />

( ˆXΨ)(x) = xΨ(x) Ψ ∈ L 2 (R) (6.47)<br />

{ ∫<br />

}<br />

ϕ ∈ L 2 : dx|xϕ(x)| 2 < ∞<br />

R<br />

(ÊxΨ)(y) =<br />

(ÊxΨ)(y) =<br />

{ Ψ(y) , y ≤ x<br />

0 , y > x<br />

∫ z<br />

−∞<br />

Huomaa, että Êx on projektio-operaattori aliavaruudelle<br />

dzΨ(z)δ(y − z).<br />

(6.48)<br />

(6.49)<br />

V x = {Ψ ∈ L 2 : Ψ(y) = 0, x < y} (6.50)<br />

ja lisäksi Ê −∞ = 0 ja E ∞ = id.{Êx} toteuttaa spektraaliesityslauseen ehdot: Olkoon x ′ ≤ x, jolloin<br />

{ { Ψ(y) , y ≤ x<br />

(ÊxÊx ′)(y) = E ′ Ψ(y) , y ≤ x<br />

′<br />

x(<br />

0 , y > x ′ ) =<br />

0 , y > x ′


66<br />

ja<br />

{ { Ψ(y) , y ≤ x Ψ(y) , y ≤ x<br />

(Êx ′Ê x )(y) = E x (<br />

0 , y > x ) = ′<br />

0 , y > x ′ ,<br />

eli E x ′E x = E x E x ′ = E x ′′, missä x ′′ = min(x, x ′ ).<br />

Väitämme nyt, että<br />

∫<br />

ˆX =<br />

tarkoittaen<br />

kaikille ϕ, Ψ ∈ L 2 . Tosiaan:<br />

∫<br />

〈ϕ|ÊxΨ〉 =<br />

f differentioituva ja<br />

R<br />

R<br />

∫<br />

〈ϕ| ˆXΨ〉 =<br />

R<br />

dyϕ ∗ (y)(Êx)(y) =<br />

xdÊx, (6.51)<br />

xd〈ϕ|ÊxΨ〉 (6.52)<br />

∫ x<br />

−∞<br />

dxϕ ∗ (y)Ψ(y) =: f(x)<br />

f ′ (x) = df<br />

dx (x) = ϕ∗ (x)Ψ(x)<br />

∫<br />

∫<br />

=⇒ xd〈ϕ|ÊxΨ〉 = xdf(x)<br />

R<br />

∫R<br />

= ϕ ∗ (x)xΨ(x)dx<br />

∫R<br />

= dxϕ ∗ (x)( ˆXΨ)(x)<br />

R<br />

= 〈ϕ| ˆXΨ〉.<br />

Toimii!<br />

Spektraaliesityksen avulla voidaan määritellä operaattori (F ( ˆX), D F ( ˆX)<br />

)<br />

jolle<br />

laajimmillaan.<br />

D F ( ˆX)<br />

=<br />

6.11 Diracin merkintätapa<br />

∫<br />

F ( ˆX) =<br />

R<br />

F (x)dÊx, (6.53)<br />

{ ∫<br />

}<br />

Ψ ∈ L 2 : dx|F (x)Ψ(x)| 2 < ∞<br />

R<br />

Vektori H:ssa: |u〉 ”ket” ja vektori H ∗ :ssä (H:n duaaliavaruudessa): 〈v| ”bra”. Rieszin esityslauseesta:<br />

v(u) =<br />

(6.54)<br />

〈v|u〉<br />

} {{ }<br />

. (6.55)<br />

skalaaritulo<br />

Olkoon H separoituva ja {|e i 〉} o.n. kanta: 〈e i |e j 〉 = δ ij . u:n esitys tässä kannassa on<br />

joten<br />

∞∑<br />

|u〉 = |e 1 〉〈e 1 |u〉 = id H |u〉 (6.56)<br />

n=1<br />

∞∑<br />

id H = |e 1 〉〈e 1 | (6.57)<br />

n=1


67<br />

”täydellisyysrelaatio”. Â operaattori<br />

missä<br />

Â|e i 〉 =<br />

Voidaan siis kirjoittaa operaattorin matrisiiesitys<br />

∞∑<br />

|e j 〉a ji ,<br />

j=1<br />

a ji = 〈e j |Âe i〉 =: 〈e j |Â|e i〉.<br />

 =<br />

∞∑<br />

|e j 〉a ji 〈e i |. (6.58)<br />

i,j=1<br />

Laajennetaan H sisältämää ”vektoreita” |x〉, x ∈ R, jotka toteuttavat<br />

Ψ ∈ L ( R), merkitään<br />

Tällöin voimme kirjoittaa<br />

koska<br />

(ÊxΨ)(y) = 〈y|ÊxΨ〉 =<br />

〈x|y〉 = δ(x − y). (6.59)<br />

Ψ(x) = 〈x|y〉.<br />

Ê x =<br />

∫ x<br />

−∞<br />

∫ x<br />

−∞<br />

dz|z〉〈z| (6.60)<br />

dz 〈y|z〉 〈z|Ψ〉 =<br />

} {{ } } {{ }<br />

δ(y−z) Ψ(z)<br />

∫ x<br />

−∞<br />

dzδ(y − z)Ψ(z).<br />

Huom. E ∞ = id = ∫ R dx|x〉〈x| ”täydellisyysrelaatio”. Nyt dÊx = |x〉〈x| ja spektraaliesitys<br />

Tarkistus<br />

6.12 Impulssioperaattori<br />

( ˆP , D ˆP<br />

), = 1,<br />

∫<br />

ˆX =<br />

R<br />

∫<br />

dxx|x〉〈x| =<br />

∫<br />

( ˆXΨ)(y) = 〈y| ˆX|Ψ〉) dx 〈y|x〉 x 〈x|Ψ〉 = yΨ(y).<br />

R } {{ } } {{ }<br />

δ(y−x) Ψ(x)<br />

Dˆp =<br />

R<br />

dx|x〉x〈x|. (6.61)<br />

( ˆP Ψ)(x) = −i dΨ<br />

dx , (6.62)<br />

{<br />

∫ ∞<br />

}<br />

Ψ ∈ L 2 (R) : dx|Ψ ′ (x)| 2 < ∞ . (6.63)<br />

−∞<br />

ˆp itseadjungoitu. ˆp:n spektraaliesitys rakennetaan yksinkertaisimmin Fourier’n muunnoksen avulla:<br />

Määritellään operaattori ˆF : L 2 (R) → R,<br />

( ˆFΨ)(k) = √ 1 ∫<br />

dxe −ikx Ψ(x) =: ˆΨ(k). (6.64)<br />

2π<br />

R<br />

ˆFΨ todellakin kuuluu L 2 (R):ään, kun Ψ on L 2 (R):n alkio. Todistus epätriviaali, mutta löytyy useista<br />

L p -avaruuksia käsittelevistä kirjoista. Fourier muunnokselle pätee Plancherelin kaava<br />

〈ϕ|Ψ〉 = 〈 ˆFϕ| ˆFΨ〉, (6.65)


68<br />

eli ˆF on isometrinen. Lisäksi ˆF:llä on käänteisoperaattori<br />

∫<br />

( ˆF −1 1<br />

ˆΨ)(x) = √ dke ikx ˆΨ(k) = Ψ(x). (6.66)<br />

2π<br />

Nämä yhdistämällä seuraa, että ˆF on jopa unitaarinen. Honkonen, Lause 6.4:<br />

eli<br />

(<br />

R<br />

dΨ ˆF(−i ))(k) = k ˆΨ(k)<br />

dx<br />

( ˆF ˆP Ψ)(k) = k ˆΨ(k) = ( ˆX ˆΨ)(k) = ˆX ˆFΨ(k) (6.67)<br />

operoimalla tähän ˆF −1 :llä ja huomaamalla, että Ψ ∈ L 2 on mielivaltainen, saadaan ˆP :n esitys:<br />

ˆP = ˆF −1 ˆX ˆF. (6.68)<br />

Lisäksi ˆX:n spektraaliesityksestä saadaan vastaava myös ˆP :lle:<br />

∫<br />

ˆP = kd( ˆF −1 ˆX ˆF). (6.69)<br />

Lisäki<br />

Konsinstenssi vaatii siis<br />

∫<br />

1<br />

√<br />

2π<br />

R<br />

R<br />

∫<br />

dxe −ikx Ψ(x) = ˆΨ(k) = 〈k|Ψ〉 =<br />

R<br />

dx〈k|x〉Ψ(x).<br />

〈k|x〉 = 1 √<br />

2π<br />

e −ikx (6.70)<br />

eli<br />

ϕ k (x) = 〈x|k〉 = 1 √<br />

2π<br />

e ikx (6.71)<br />

”impulssioperaattorin ominaisfunktio” (/∈ L 2 (R)).<br />

Tarkistetaan vielä:<br />

∫<br />

〈ϕ| ˆP |Ψ〉 = kd〈ϕ| ˆF −1 Ê k ˆF|Ψ〉. (6.72)<br />

Nyt (, koska ˆF † = ˆF −1 )<br />

joten<br />

〈ϕ| ˆF −1 Ê k ˆF|Ψ〉 = 〈 ˆFϕ| Ê k | ˆFΨ〉 =<br />

∫<br />

〈ϕ| ˆP |Ψ〉 =<br />

R<br />

R<br />

∫<br />

dk ˆϕ(k) ∗ k ˆΨ(k) =<br />

R<br />

∫ k<br />

−∞<br />

dk ′ ˆϕ(k ′ ) ∗ ˆΨ(k ′ ),<br />

dxϕ(x) ∗ (<br />

−i dΨ<br />

dx (x) )<br />

,<br />

missä viimeineinen yhtäsuuruus seuraa Plancherelin kaavasta.<br />

Diracin merkintätavassa otetaan käyttöön ”vektoreita” |k〉 s.e. 〈k|k ′ 〉 = δ(k − k ′ ) ja<br />

ˆΨ(k) = 〈k|Ψ〉 = √ 1 ∫<br />

dxe −ikx Ψ(x),<br />

2π<br />

sekä<br />

∫<br />

|Ψ〉 = id|Ψ〉 =<br />

R<br />

R<br />

∫<br />

dx|x〉〈x|Ψ〉 =<br />

R<br />

dx|x〉Ψ(x).


69<br />

Tässä notaatiossa<br />

〈ϕ| ˆF −1 Ê k ˆF|Ψ〉<br />

= 〈 ˆFϕ|Êk| ˆFΨ〉<br />

∫<br />

= dk ′ ˆϕ(k ′ ) ∗ Ê k ˆΨ(k ′ )<br />

=<br />

=<br />

R<br />

∫ k<br />

−∞<br />

∫ k<br />

−∞<br />

dk ′ ˆϕ(k ′ ) ∗ ˆΨ(k ′ )<br />

dk ′ 〈ϕ|k ′ 〉〈k ′ |Ψ〉<br />

eli<br />

Tarkistus:<br />

Toimii!<br />

∫<br />

〈x ′ |x〉 =<br />

R<br />

ˆF −1 Ê k ˆF =<br />

∫ k<br />

ˆF −1 Ê ∞ ˆF =<br />

∫<br />

R<br />

−∞<br />

dk ′ |k ′ 〉〈k ′ | (6.73)<br />

dk ′ |k ′ 〉〈k ′ | = id. (6.74)<br />

dk〈x|k〉〈k|x ′ 〉 = 1 ∫<br />

dke ik(x−x′) = δ(x − x ′ )<br />

2π R

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!