26.11.2014 Views

Osat 1-9: MAPU I + II

Osat 1-9: MAPU I + II

Osat 1-9: MAPU I + II

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

N<br />

<br />

O<br />

O<br />

<br />

N<br />

1. Vektorit<br />

1.1 Vektorin käsite<br />

Fysikaalisten suureiden spesifioimiseksi ei useinkaan<br />

pelkkä suureen koko ole riittävä. Esimerkiksi liikettä<br />

kuvattaessa on yleensä tarpeen kertoa myös liikkeen<br />

suunta kolmiulotteisessa avaruudessamme. Liikkeen<br />

puolestaan aiheuttaa johonkin suuntaan vaikuttava jonkin<br />

suuruinen voima. Tällaisia suureita kuvaamaan on luotu<br />

vektorit.<br />

Vektori on suure, jolla on suunta ja suuruus. Skalaari<br />

puolestaan on suure, jolla on vain suuruus.<br />

Graafisesti vektori esitetään nuolena, jonka kärki osoittaa<br />

vektorin suunnan ja pituus vektorin suuruuden.<br />

) ) N ) O ) <br />

+ N<br />

+ <br />

) O<br />

+ O<br />

* O<br />

) <br />

) N<br />

+ + N + O + <br />

* * N * O * <br />

* <br />

* N<br />

Kuva 1.1 Vektorin esitys<br />

Määritelmän mukaan vektorin paikalla avaruudessa ei ole<br />

merkitystä. Esimerkiksi kuvan 1.1 kaikki kolme vektoria<br />

ovat samoja, ts.<br />

A = B = C.<br />

Merkintöjä<br />

Tekstissä vektoreita merkitään tavallisesti (mm. tässä esityksessä)<br />

lihavoitetuilla symboleilla (A, r,β,...). Käsin kirjoitettaessa<br />

vektoreiden päälle piirretään useimmiten yläviiva, Ā, joskus nuoli,<br />

⃗A.<br />

Valitussa koordinaatistossa vektori voidaan spesifioida<br />

esim.<br />

• antamalla kaksi suuntakulmaa, vaikkapa vektorin ja<br />

z-akselin välinen kulma sekä vektorin xy-tasolla<br />

olevan projektion ja x-akselin välinen kulma, ja<br />

vektorin pituus.<br />

• antamalla vektorin koordinaattiakseleilla olevien<br />

projektioiden pituudet (merkki huomioiden).<br />

Käytämme aluksi lähes yksinomaan jälkimmäistä esitystä.<br />

Vektorin A spesifioivat siis sen projektiot<br />

koordinaattiakseleille: kolmiulotteisessa avaruudessa<br />

reaalilukukolmikko (A x ,A y ,A z ),<br />

A = (A x ,A y ,A z ).<br />

Projektioita A x ,... sanotaan vektorin koordinaateiksi tai<br />

komponenenteiksi. Puhutaan myös vektorin<br />

komponenttiesityksestä.<br />

Koska vektorin paikalla ei ole merkitystä, voisimme<br />

siirtää kaikki vektorit valitsemamme koordinaatiston<br />

origoon, jolloin vektoria kuvaisivat sen kärjen<br />

koordinaatit. Kääntäen, mitä tahansa avaruuden pistettä<br />

voidaan pitää origosta lähtevän vektorin kärkenä. Tällöin<br />

puhutaan usein paikka- eli radiusvektorista.<br />

Kuva 1.2 Paikkavektori<br />

H 2 N O N O <br />

Esimerkiksi massapisteen paikkaa avaruudessa voisi<br />

kuvata paikkavektori<br />

r = (x,y,z).<br />

Jos piste on liikkeessä, niin sen koordinaatit x, y ja z ovat<br />

ajan funktioita, joten paikkavektorin r kärkikin liikkuu<br />

ajan myötä:<br />

H J <br />

Kuva 1.3 Liikkuva piste<br />

r = r(t) = (x(t),y(t),z(t)).<br />

H J <br />

Liikkuvan pisteen nopeus v määräytyy ilmeisestikin sen<br />

koordinaattien muutosnopeuksista ẋ(t), ẏ (t) ja ż(t), ts.<br />

v(t) = (ẋ(t),ẏ(t),ż(t)).<br />

Jos vielä sovimme, että vektori derivoidaan derivoimalla<br />

sen komponentit, voimme kirjoittaa ytimekkäästi<br />

v(t) = ṙ(t).<br />

Vektorin määritelmän perusteella vektorit a = (a x ,a y ,a z )<br />

ja b = (b x ,b y ,b z ) ovat yhtäsuuria jos ja vain jos niiden<br />

vastinkomponentit ovat yhtäsuuria, ts. jos ja vain jos<br />

a x = b x , a y = b y ja a z = b z . Tällöin merkitään a = b.<br />

1


)<br />

)<br />

)<br />

*<br />

*<br />

*<br />

)<br />

Vektorin ajatellaan olevan jotakin absoluuttista; vektori on<br />

olemassa ja pysyy samana käytettiinpä millaista koordinaatistoa<br />

tahansa tai toimittiinpa ilman koordinaatistoa. Vektorin esitys<br />

komponenttimuodossa sen sijaan riippuu valitusta<br />

koordinaatistosta. Mittakaava ja koordinaattiakseleiden suunnat<br />

vaikuttavat vektorin komponentteihin. Esimerkiksi vektoreiden<br />

yhtäsuuruudesta päätettäessä on pidettävä huoli siitä, että ne<br />

esitetään samassa koordinaatistossa.<br />

Määritellään nollavektori 0 siten, että<br />

) N<br />

) O<br />

) N ) O ) <br />

<br />

) N ) O <br />

<br />

Kuva 1.4 Vektorin pituus<br />

0 = (0,0,0). (1.1)<br />

) <br />

Vektorin suuruus on sama kuin vektorin pituus. Kuten<br />

kuvasta 1.4 nähdään, on vektorin A = (A x ,A y ,A z )<br />

pituus |A| Pythagoraan lauseen mukaan<br />

√<br />

|A| = A 2 x +A 2 y +A 2 z. (1.2)<br />

Hyvin usein vektorista käytetty symboli ilman<br />

vektorimerkintää tarkoittaa ko. vektorin pituutta, esim.<br />

A = |A|.<br />

Ilmeisestikin A = 0 jos ja vain jos |A| = 0. Tämän vuoksi<br />

hyvin usein jätetään vektorimerkintä pois nollavektorista.<br />

1.2 Vektorialgebra<br />

Skalaarilla kertominen<br />

Olkoon A = (A x ,A y ,A z ) jokin vektori ja λ jokin<br />

reaalinen vakio. Silloin λA on vektori<br />

λA = (λA x ,λA y ,λA z ). (1.3)<br />

Skalaarilla λ kerrottaessa vektori siis säilyttää suuntansa<br />

jos λ > 0 tai kääntyy vastakkaiseen suuntaan jos λ < 0.<br />

Vektorin pituus muuttuu vakiolla λ kerrottaessa kuten<br />

|λA| = |λ||A|.<br />

Yhteen- ja vähennyslasku<br />

Vektorien A = (A x ,A y ,A z ) ja B = (B x ,B y ,B z ) summan<br />

määrittelee yhtälö<br />

A+B = (A x +B x ,A y +B y ,A z +B z ). (1.4)<br />

ja erotuksen yhtälö<br />

A−B = A+(−1)B<br />

= (A x −B x ,A y −B y ,A z −B z ).<br />

(1.5)<br />

) *<br />

) *<br />

Kuva 1.5 Vektorien yhteen- ja vähennyslasku<br />

Graafisesti kahden vektorin A ja B summa siis<br />

muodostetaan siirtämällä esim. vektori B siten, että sen<br />

kanta yhtyy vektorin A kärkeen. Summa- eli<br />

resultanttivektori A+B on silloin vektorin A kannasta<br />

vektorin B kärkeen ulottuva vektori. Erotusvektori<br />

voidaan puolestaan muodostaa siten, että siirretään<br />

molempien vektorien kannat samaan kohtaan. Erotus<br />

A−B on nyt vektorin B kärjestä vektorin A kärkeen<br />

ulottuva vektori.<br />

Laskutoimitusten ominaisuuksia<br />

Suoraan määritelmistä on helppo todeta, että<br />

• Vektoreiden yhteenlasku on kommutatiivinen, ts.<br />

A+B = B+A.<br />

• Vektoreiden yhteenlasku on assosiatiivinen, ts.<br />

A+(B+C) = (A+B)+C.<br />

Sulut voidaan siis tämän kaltaisissa lausekkeissa<br />

jättää merkitsemättä.<br />

• Skalaarilla kertominen on distributiivinen, ts.<br />

λ(A+B) = λA+λB.<br />

Yksikkövektorit<br />

Yksikkövektori on sellainen vektori, jonka pituus on yksi.<br />

Esim. Vektorin A = (5,3, √ 2) suuntainen yksikkövektori<br />

Vektorin A pituus A on<br />

√<br />

A = |A| =<br />

Tällöin vektori<br />

5 2 +3 2 + √ 2 2 = √ 36 = 6.<br />

a = 1 A A = 1 6 (5,3,√ 2) = ( 5 6 , 1 2 , 1<br />

3 √ 2 )<br />

on vektorin A suuntainen. Se on ilmeisestikin myös<br />

yksikön mittainen, sillä<br />

∣ |a| =<br />

1 ∣∣∣<br />

∣A A = 1 A |A| = 1 A A = 1.<br />

2


Yksikkövektorit erotetaan usein kirjoittamalla ˆ-merkki vektorin<br />

yläpuolelle, kuten esim. ˆb. Jos samassa yhteydessä puhutaan<br />

myös vektorista b, niin silloin ˆb tarkoittaa yleensä vektorin b<br />

suuntaista yksikkövektoria.<br />

Koordinaattiakseleiden suuntaisia yksikkövektoreita<br />

sanotáan yksikkökoordinaattivektoreiksi tai lyhyesti<br />

kantavektoreiksi. Niitä merkitään usein kuten<br />

e x = (1,0,0)<br />

e y = (0,1,0)<br />

e z = (0,0,1).<br />

. Toinen hyvin paljon käytetty merkitsemistapa on<br />

(1.6)<br />

i = e x , j = e y ja k = e z . (1.7)<br />

Koska vektori voidaan kirjoittaa kuten<br />

A = (A x ,A y ,A z )<br />

= (A x ,0,0)+(0,A y ,0)+(0,0,A z )<br />

= A x (1,0,0)+A y (0,1,0)+A z (0,0,1),<br />

saadaan sille komponenttiesitykset<br />

A = A x e x +A y e y +A z e z<br />

= A x i+A y j+A z k.<br />

1.3 Vektoreiden tulot<br />

1.3.1 Pistetulo<br />

Vektoreiden A = (A x ,A y ,A z ) ja B = (B x ,B y ,B z )<br />

Pistetulon eli skalaaritulon A·B määrittelee kaava<br />

A·B = A x B x +A y B y +A z B z . (1.8)<br />

Merkintä A 2 tarkoittaa vektorin A skalaarituloa itsensä<br />

kanssa eli<br />

A 2 = A·A = A 2 x +A 2 y +A 2 z<br />

= |A| 2 .<br />

Vektorin pituus on siis ilmaistavissa skalaaritulon avulla<br />

kuten<br />

|A| = √ A·A = √ A 2 .<br />

Suoraan määritelmästä nähdään, että pistetulo<br />

• on kommutatiivinen, ts. A·B = B·A.<br />

• on distributiivinen: A·(B+C) = A·B+A·C.<br />

• skalaarilla kerrottaessa toteuttaa relaatiot<br />

λ(A·B) = (λA)·B = A·(λB).<br />

Esim. Cauchy-Schwartzin epäyhtälö<br />

Olkoot A ja B nollasta poikkeavia vektoreita ja λ<br />

mielivaltainen skalaari. Tarkastellaan vektoreiden λA ja<br />

B resultanttia λA+B ja erikoisesti sen pituuden neliötä<br />

q(λ) = |λA+B| 2 .<br />

Kuten näimme, vektorin pituuden neliö on vektorin<br />

skalaaritulo itsensä kanssa, ts.<br />

q(λ) = (λA+B)·(λA+B)<br />

= λ 2 A·A+λA·B+λB·A+B·B<br />

= λ 2 |A| 2 +2λA·B+|B| 2<br />

(<br />

= |A| 2 λ 2 +2λ A·B )<br />

|A| 2 +|B| 2 ,<br />

missä olemme käyttäneet hyväksi skalaaritulon<br />

ominaisuksia (distributiivisuus, kommutatiivisuus jne.).<br />

Täydennetään sulkujen sisällä oleva lauseke neliöksi ja<br />

saadaan<br />

(<br />

q(λ) = |A| 2 λ 2 +2λ A·B )<br />

|A| 2 + (A·B)2<br />

|A| 4<br />

− (A·B)2<br />

|A| 2 +|B| 2 .<br />

Hieman sieventäen ja ryhmittäen voimme kirjoittaa<br />

edellisen lausekkeen muotoon<br />

(<br />

q(λ) = |A| 2 λ+ A·B ) 2<br />

|A| 2<br />

+ 1<br />

|A| 2 (<br />

|A| 2 |B| 2 −(A·B) 2)<br />

Tämän muodon ensimmäinen termi on neliönä aina<br />

ei-negatiivinen, joten funktiolla q(λ) on minimi kun<br />

neliötermi on minimissään. Valitsemalla λ = −A·B/|A| 2<br />

saadaan neliötermi häviämään joten funktion q(λ) minimi<br />

q min on sama kuin jälkimmäinen termi. Pituuden neliönä<br />

q(λ) ei voi olla negatiivinen olipa λ mitä hyvänsä, joten<br />

myös sen minimille täytyy olla voimassa q min ≥ 0. Siis on<br />

|A| 2 |B| 2 −(A·B) 2 ≥ 0.<br />

Tämä on kirjoitettavissa Cauchy-Schwartzin epäyhtälönä<br />

tunnettuun muotoon<br />

|A·B| ≤ |A||B|. (1.9)<br />

Oletimme, että A ≠ 0 ja B ≠ 0. Jos nyt jompi kumpi tai<br />

molemmat ovat nollia, niin epäyhtälö on edelleenkin<br />

voimassa (yhtäsuuruutena).<br />

Esim. Kolmioepäyhtälö<br />

Vektorit A, B ja A+B muodostavat kolmion, jonka<br />

sivujen pituudet ovat |A|, |B| ja |A+B|. Kääntäen,<br />

3


)<br />

)<br />

D<br />

*<br />

*<br />

jokainen kolmio voidaan esittää kahtena vektorina ja<br />

niiden resultanttina.<br />

) *<br />

Kuva 1.6 Kolmioepäyhtälö<br />

Nyt on<br />

|A+B| 2<br />

= (A+B)·(A+B)<br />

= |A| 2 +2A·B+|B| 2<br />

≤ |A| 2 +2|A·B|+|B| 2<br />

≤ |A| 2 +2|A||B|+|B| 2<br />

= (|A|+|B|) 2 ,<br />

missä viimeistä edellisessä muodossa olemme soveltaneet<br />

Cauchy-Schwarzin epäyhtälöä. Päädymme siten<br />

kolmioepäyhtälönä tunnettuun relaatioon<br />

|A+B| ≤ |A|+|B|, (1.10)<br />

joka kertoo sen tutun tosiasian, että kolmiossa kahden<br />

sivun summa on aina suurempi tai yhtäsuuri kuin kolmas<br />

sivu.<br />

Pistetulon geometrinen merkitys<br />

Tarkastellaan nyt vektoreiden A, B ja A−B<br />

muodostamaa kolmiota.<br />

G<br />

) *<br />

) ? I G<br />

* ) ? I G<br />

Kuva 1.7 Pistetulon geometrinen merkitys<br />

Sivun A−B pituuden neliö on<br />

|A−B| 2<br />

= (A−B)·(A−B)<br />

= |A| 2 +|B| 2 −2A·B<br />

= A 2 +B 2 −2A·B,<br />

missä A ja B tarkoittavat vektoreiden A ja B pituuksia.<br />

Kuviosta 1.7 nähdään, että vektoreiden A, B ja A−B<br />

muodostaman kolmion korkeuden h neliö on<br />

h 2 = A 2 −A 2 cos 2 θ,<br />

missä θ on vektoreiden A ja B välinen kulma.<br />

Edelleen Pythagoraan lausetta soveltaen saamme<br />

|A−B| 2 = h 2 +(B −Acosθ) 2<br />

= A 2 −A 2 cos 2 θ<br />

+B 2 +A 2 cos 2 θ −2ABcosθ<br />

= A 2 +B 2 −2ABcosθ.<br />

Vertaamalla tätä aikaisempaan suureen |A−B| 2<br />

lausekkeeseen näemme, että<br />

A·B = ABcosθ. (1.11)<br />

Kuviosta 1.7 on luettavissa myös tulkinnat: A·B on<br />

• vektorin A projektion pituus vektorilla B kertaa<br />

vektorin B pituus tai<br />

• vektorin B projektion pituus vektorilla A kertaa<br />

vektorin A pituus.<br />

Vektoreiden välisen kulman θ kosini on lausuttavissa<br />

pistetulon avulla kuten<br />

cosθ = A·B<br />

|A||B| . (1.12)<br />

Ilmeisestikin vektorit A ja B ovat kohtisuorassa toisiaan<br />

vastaan jos A·B = 0 ja yhdensuuntaisia jos<br />

A·B = |A||B|. Erikoisesti kantavektoreille i, j ja k on<br />

voimassa<br />

i·j = i·k = j·k = 0<br />

eli ne ovat toisiaan vastaan kohtisuorassa, ts.<br />

ortogonaalisia. Koska vielä on<br />

i·i = j·j = k·k = 1,<br />

sanotaan näiden kantavektoreiden olevan ortonormaalisia.<br />

Kirjoitetaan vektori A komponenttimuodossa<br />

A = A x i+A y j+A z k.<br />

Kantavektoreiden ortonormaalisuuden perusteella on mm.<br />

A·i = A x i·i+A y j·i+A z k·i = A x<br />

Vektorin komponentit voidaan siten lausua skalaarituloina<br />

A x = A·i, A y = A·j ja A z = A·k.<br />

Kantavektoreiden ortonormaalisuudesta seuraa samoin se,<br />

että muodossa A = A x i+A y j+A z k ja<br />

B = B x i+B y j+B z k esitettyjen vektoreiden skalaaritulo<br />

on<br />

A·B = A x B x +A y B y +A z B z<br />

4


E<br />

<br />

<br />

)<br />

.<br />

<br />

H<br />

*<br />

)<br />

H<br />

eli yhtäpitävä määritelmän (1.8) kanssa. Esim. Voiman F = 2i−j−k tekemä työ sen siirtäessä<br />

kappaletta vektorin r = 3i+2j−5k kannasta kärkeen<br />

Määritelmän mukaan voiman tekemä työ on siirroksen<br />

suuntainen voima kerrottuna siirron pituudella.<br />

C<br />

= ><br />

G<br />

Kuva 1.8 Suuntakulmat<br />

Vektorin ja yksikkövektorin i välisen kulman eli vektorin . ? I G<br />

ja x-akselin välisen kulman α kosini on<br />

Kuva 1.9 Voiman tekemä työ<br />

cosα = A·i<br />

|A||i| = A x<br />

A , Kuvan mukaisesti voiman F tekemä työ on<br />

W = (F cosθ)r. Pistetulon avulla tämä saadaan<br />

missä A = |A|. Vastaavat lausekkeet saadaan vektorin ja kirjoitettua muotoon<br />

y-akselin välisen kulman β sekä vektorin ja z-akselin<br />

välisen kulman γ kosineille. Näemme siis, että vektori on<br />

W = F·r.<br />

kirjoitettavissa suuntakulmiensa α, β ja γ avulla mm.<br />

Tässä tapauksessa työ on siis<br />

muodossa<br />

A = A(cosα,cosβ,cosγ).<br />

W = (2i−j−k)·(3i+2j−5k)<br />

Olkoon nyt a vektori<br />

= (2)(3)+(−1)(2)+(−1)(−5)<br />

a = 1 A A.<br />

= 6−2+5 = 9.<br />

Esim. Vektoria A = 2i+3j+6k vastaan kohtisuorassa<br />

Ensinnäkin on<br />

a·a = 1 olevan ja vektorin B = i+5j+3k kärjen kautta kulkevan<br />

A 2 A2 = 1 tason yhtälö<br />

ja toiseksi vektorien a ja A väliselle kulmalle θ aA on<br />

voimassa<br />

cosθ aA = a·A<br />

|a||A| = 1 A A·A1 A = 1,<br />

joten a on vektorin A suuntainen yksikkövektori.<br />

Vektorin B projektio p vektorin A suuntaan voidaan nyt<br />

lausua yksikkövektorin a avulla kuten<br />

* H<br />

p = 1 A·B = a·B.<br />

A<br />

Esim. Vektorin A = i−2j+k projektio vektorille<br />

B = 4i−4j+7k<br />

Vektorin B suuntainen yksikkövektori on<br />

b = B B = 4i−4j+7k<br />

√ Kuva 1.10 Tason yhtälö<br />

42 +(−4) 2 +7 2<br />

= 4 9 i− 4 9 j+ 7 9 k.<br />

Olkoon r jokin tason piste. Tällöin vektori B−r on<br />

jonkin vektoreitten r ja B kärkien kautta kulkevan tason<br />

suuntainen. Koska tason piti olla kohtisuorassa vektoria A<br />

Vektorin A projektio tähän suuntaan on<br />

vastaan, täytyy vektorin B−r olla kohtisuorassa vektoria<br />

p = A·b = (i−2j+k)·( 4 9 i− 4 9 j+ 7 9 k) A vastaan osoittipa r mihin tahansa tason pisteeseen.<br />

Saamme siis ehdon<br />

= (1)( 4 9 )+(−2)(−4 9 )+(1)(7 9 ) = 19 9 .<br />

(B−r)·A = 0<br />

5


tason pisteille r. Sijoittamalla tähän r = xi+yj+zk<br />

sekä vektoreiden A ja B eksplisiittiset lausekkeet saadaan<br />

0 = ((1−x)i+(5−y)j+(3−z)k)<br />

·(2i+3j+6k)<br />

= −2x−3y −6z +(1)(2)+(5)(3)+(3)(6)<br />

= −2x−3y −6z +35.<br />

Kysytyn tason yhtälö on siis<br />

2x+3y +6z = 35.<br />

1.3.2 Ristitulo<br />

Vektoreiden A = (A x ,A y ,A z ) ja B = (B x ,B y ,B Z )<br />

ristitulon eli vektoritulon A×B määrittelee kaava<br />

A×B = (A y B z −A z B y ,A z B x −A x B z ,A x B y −A y B x ).<br />

(1.13)<br />

Vektoritulon muodostamista auttanee muistisääntö:<br />

Tulo A×B lasketaan siten, että kolmirivisen<br />

determinantin ylimmäksi riviksi kirjoitetaan kantavektorit<br />

i, j ja k (tässä järjestyksessä), keskimmäisen rivin<br />

muodostavat vektorin A komponentit A x , A y ja A z (tässä<br />

järjestyksessä) sekä alimman rivin vektorin B<br />

komponentit B x , B y ja B z (tässä järjestyksessä), ts.<br />

A×B =<br />

∣<br />

i j k<br />

A x A y A z<br />

B x B y B z<br />

∣ ∣∣∣∣∣<br />

. (1.14)<br />

Determinanteista<br />

Determinantit ovat muotoa<br />

∣ a 11 a 12 ··· a 1n ∣∣∣∣∣∣<br />

a 21 a 22 ··· a 2n<br />

. . .. ..<br />

. .<br />

∣<br />

a n1 a n2 ··· a nn<br />

olevia taulukoita. Niissä siis sarakkeiden ja rivien lukumäärä on<br />

sama. Puhutaan n×n-determinanteista tai n-rivisisistä<br />

determinanteista. Determinanteilla on lukuarvo.<br />

Meidän tarkoituksiimme riittävät kaksi- ja kolmiriviset<br />

determinantit. Kaksirivisen determinantin arvon määrittelee kaava<br />

∣ ∣ a 11 a 12 ∣∣ = a11 a<br />

a 21 a 22 −a 12 a 21 ,<br />

22<br />

ts. kaksirivisen determinantin arvo saadaan vähentämällä<br />

lävistäjäalkioden tulosta sivulävistäjäalkioiden tulo.<br />

Kolmirivinen determinantti lasketaan helpoimmin kehittämällä se<br />

alideterminanttien avulla:<br />

1. kuhunkin determinantin alkioon liittyy merkki taulukon<br />

+ − +<br />

− + −<br />

∣ + − + ∣<br />

mukaisesti.<br />

2. valitaan jokin vaaka- tai pystyrivi.<br />

3. kuhunkin valitun rivin tai sarakkeen alkioon liittyy<br />

2×2-alideterminantti, joka muodostetaan alkuperäisestä<br />

determinantista pyyhkimällä siitä pois ko. alkion kautta<br />

kulkeva vaaka- ja pystyrivi.<br />

4. käydään läpi kaikki valitun rivin tai sarakkeen alkiot kertoen<br />

keskenään alkio varustettuna siihen liittyvällä merkillä ja<br />

sen alideterminantti. Muodostettujen termien summa on<br />

determinantin arvo.<br />

Esim. Determinantti<br />

D =<br />

∣<br />

2 1 −2<br />

1 −2 3<br />

4 −3 4<br />

Kehitetään vaikkapa oikeanpuoleisimman sarakkeen mukaan.<br />

Tämän ylimpään alkioon −2 liittyy merkki +. Vastaava<br />

alideterminantti saadaan pyyhkimällä pois ylin rivi ja<br />

oikeanpuoleisin sarake. Päädymme termiin<br />

+(−2) ∣ 1 −2<br />

4 −3 ∣ = (−2)[(1)(−3)−(4)(−2)] = −10.<br />

Vastaavasti kehityssarakkeen toinen alkio antaa termin<br />

∣ −(3) ∣∣ 2 1<br />

4 −3 ∣ = −3[(2)(−3)−(1)(4)] = 30<br />

ja alin alkio termin<br />

+(4) ∣ 2 1<br />

1 −2<br />

∣<br />

∣ = 4[(2)(−2)−(1)(1)] = −20.<br />

Determinantin arvo D on näiden termien summa eli<br />

D = (−10)+(30)+(−20) = 0.<br />

Determinantteihin liittyy useita laskusääntöjä. Tässä vaiheessa<br />

meille riittänee tieto siitä, että<br />

• determinantin merkki vaihtuu vaihdettaessa kaksi vaakariviä<br />

(tai kaksi pystyriviä) keskenään.<br />

• determinantti on nolla, jos sen kaksi vaakariviä (tai kaksi<br />

pystyriviä) ovat samoja.<br />

Kehitetään determinantti (1.14) ylimmän rivin mukaan,<br />

jolloin<br />

∣ i j k ∣∣∣∣∣ A x A y A z = i<br />

∣ A ∣ y A z ∣∣∣ −j<br />

∣<br />

B<br />

B x B y B y B z<br />

∣ A ∣<br />

x A z ∣∣∣<br />

B x B z<br />

z +k<br />

∣ A ∣<br />

x A y ∣∣∣<br />

B y<br />

B x<br />

= (A y B z −A z B y )i<br />

−(A x B z −A z B x )j<br />

+(A x B y −A y B x )k.<br />

Nähdään, että tämä todellakin yhtyy määritelmään<br />

(1.13).<br />

Determinanttiesityksestä nähdään mm. ominaisuus<br />

A×B =<br />

∣<br />

∣<br />

i j k ∣∣∣∣∣<br />

A x A y A z = −<br />

B x B y B z<br />

= −B×A.<br />

∣<br />

∣<br />

i j k ∣∣∣∣∣<br />

B x B y B z<br />

A x A y A z<br />

6


N<br />

<br />

O<br />

)<br />

*<br />

Siten ristitulon merkki vaihtuu vaihdettaessa tekijöiden<br />

järjestystä:<br />

A×B = −B×A. (1.15)<br />

Ristitulo ei siis ole kommutatiivinen. Ominaisuudesta<br />

(1.15) seuraa mm.<br />

A×A = −A×A,<br />

joten vektorin ristitulo itsensä kanssa on nolla,<br />

A×A = 0. (1.16)<br />

Suoraan määritelmästä nähdään vektoritulon<br />

distributiivisuus<br />

A×(B+C) = A×B+A×C. (1.17)<br />

Skalaarilla kerrottaessa ristitulo noudattaa yhtälöä<br />

λ(A×B) = (λA)×B = A×(λB). (1.18)<br />

Katsotaan, millaisia ovat yksikkövektoreiden ristitulot<br />

toistensa kanssa. Lasketaan esimerkkinä<br />

i×j = (1,0,0)×(0,1,0) = (0−0,0−0,1−0)<br />

= (0,0,1) = k.<br />

Samalla tavoin voimme todeta, että muutkin kaavoista<br />

i×j = k<br />

j×k = i<br />

k×i = j<br />

(1.19)<br />

pitävät paikkansa. Koordinaatistoa, jonka kantavektorit<br />

toteuttavat relaatiot (1.19) sanotaan oikeakätiseksi.<br />

Kuva 1.11 Oikeakätinen koordinatisto<br />

Oikeakätisessä xyz-koordinaatistossa z-akselin suuntainen<br />

oikeakätinen ruuvi postiiviseen kiertosuuntaan<br />

kierrettäessä (kierretään lyhintä kautta positiiviselta<br />

x-akselilta positiiviselle y-akselille) etenee positiivisen<br />

z-akselin suuntaan. Sama asia voidaan ilmaista myös ns.<br />

oikean käden kolmisormisääntönä:<br />

oikean käden peukalon osoittaessa x-akselin suuntaan ja<br />

etusormen y-akselin suuntaan osoittaa keskisormi<br />

z-akselin suunnan.<br />

Ristitulon geometrinen merkitys<br />

Vektorin A×B pituuden neliö on<br />

|A×B| 2 = (A y B z −A z B y ) 2 +(A z B x −A x B z ) 2<br />

+(A x B y −A y B x ) 2 .<br />

Suoraviivainen lasku osoittaa, että tämä voidaan<br />

kirjoittaa muotoon<br />

|A×B| 2 = (A 2 x +A 2 y +A 2 z)(B 2 x +B 2 y +B 2 z)<br />

Tämä taas on sama kuin<br />

−(A x B x +A y B y +A z B z ) 2 .<br />

|A×B| 2 = A 2 B 2 −(A·B) 2 ,<br />

missä jälleen A ja B tarkoittavat vektoreiden A ja B<br />

pituuksia. Kirjoitetaan pistetulo vektoreiden välisen<br />

kulman θ avulla, jolloin<br />

|A×B| 2 = A 2 B 2 (1−cos 2 θ) = A 2 B 2 sin 2 θ.<br />

Näemme siis, että ristitulovektorin A×B pituus on<br />

|A×B| = AB|sinθ|.<br />

Vektoreiden A×B ja A skalaaritulo on<br />

A·(A×B) = A x (A y B z −A z B y )<br />

= 0.<br />

+A y (A z B x −A x B z )<br />

+A z (A x B y −A y B x )<br />

Samoin nähdään, että B·(A×B) = 0. Vektori A×B on<br />

siis kohtisuorassa molempia tekijöitään vastaan eli<br />

kohtisuorassa tekijöiden muodostamaa tasoa vastaan.<br />

Tulovektorin suunta on pääteltävissä yksikkövektoreitten<br />

ristituloista (1.19):<br />

Vektoreiden A ja B ristitulo on<br />

A×B = (|A||B|sinθ)n, (1.20)<br />

missä θ on vektoreiden välinen kulma ja n vektoreiden<br />

muodostamaa tasoa vastaan kohtisuorassa oleva sellainen<br />

yksikkövektori että vektoreiden A, B ja n kolmikko (tässä<br />

järjestyksessä) muodostaa oikeakätisen systeemin. Oikean<br />

käden kolmisormisääntö lienee havainnollisempi: Jos A<br />

osoittaa oikean käden peukalon suuntaan ja B etusormen<br />

suuntaan niin A×B osoittaa keskisormen suuntaan (ja<br />

on kohtisuorassa vektoreita A ja B vastaan).<br />

) *<br />

G<br />

) * <br />

Kuva 1.12 Ristitulon geometrinen merkitys<br />

7


2<br />

<br />

H<br />

.<br />

)<br />

<br />

D<br />

2<br />

H<br />

+<br />

L<br />

*<br />

Kuvassa 1.12 vektoreiden A ja B muodostaman kolmion<br />

korkeus on Bsinθ jos kolmion kantana pidetään vektoria<br />

A. Tämän kolmion pinta-ala on siten 1 2ABsinθ, joten<br />

ristitulo on suuruudeltaan tekijävektoreiden<br />

muodostaman suunnikkaan pinta-ala.<br />

Esim. A = 2i−3j−k ja B = i+4j−2k, a) A×B, b)<br />

B×A ja c) (A+B)×(A−B)<br />

a)<br />

i j k<br />

A×B =<br />

2 −3 −1<br />

∣ 1 4 −2 ∣<br />

∣ ∣ = i<br />

−3 −1<br />

∣∣∣ ∣ 4 −2 ∣ −j 2 −1<br />

∣∣∣ 1 −2 ∣ +k 2 −3<br />

1 4 ∣<br />

= 10i+3j+11k.<br />

b)<br />

i j k<br />

B×A =<br />

1 4 −2<br />

∣ 2 −3 −1 ∣<br />

∣ ∣ = i<br />

4 −2<br />

∣∣∣ ∣ −3 −1 ∣ −j 1 −2<br />

∣∣∣ 2 −1 ∣ +k 1 4<br />

2 −3 ∣<br />

c)<br />

H I E G<br />

= −10i−3j−11k = −A×B.<br />

(A+B)×(A−B) = A×(A−B)<br />

G<br />

+B×(A−B)<br />

= A×A−A×B<br />

+B×A−B×B<br />

= 0−A×B−A×B−0<br />

= −2A×B<br />

= −20i−6j−22k.<br />

Kuva 1.13 Vääntömomentti<br />

Esim. Vääntömomentti: Määritelmän mukaan voiman<br />

F vääntömomentti pisteen P suhteen on suuruudeltaan F<br />

kertaa pisteen P kohtisuora etäisyys voiman<br />

vaikutussuorasta. Olkoon nyt r pisteestä P voiman<br />

vaikutuspisteeseen suunnattu vektori ja θ tämän vektorin<br />

ja voiman välinen kulma. Kuvasta nähdään, että pisteen<br />

P kohtisuora etäisyys vaikutussuorasta on r|sinθ|, joten<br />

vääntömomentti on suuruudeltaan<br />

M = Fr|sinθ| = |r×F|.<br />

Vääntömomentin suunnasta on sovittu, että voiman<br />

kiertämä vaikutuspisteeseen asetettu vaikutustasoa<br />

(vektoreiden r ja F muodostama taso) vastaan<br />

kohtisuorassa oleva oikeakätinen ruuvi etenee<br />

vääntömomentin suuntaan. Voimme siis kirjoittaa<br />

G<br />

M<br />

M<br />

H I E G<br />

M = r×F.<br />

Kuva 1.14 Kulmanopeus ja lineaarinen nopeus<br />

Esim. Lineaarinen nopeus pyörivässä<br />

kappaleessa: Oletetaan, että kiinteä kappale pyörii origon<br />

O kautta kulkevan akselin ω ympäri kulmanopeudella ω.<br />

Vektori ω orientoidaan siten, että vektorin suuntaan<br />

katsottuna kappale pyörii myötäpäivään. Tarkastellaan<br />

kappaleen pistettä P. Kappaleen pyöriessä piste P seuraa<br />

sellaisen ympyrän kehää, joka on kohtisuorassa<br />

keskipisteensä kautta kulkevaa vektoria ω vastaan. Jos<br />

nyt r on pisteen P paikka sekä θ vektorien r ja ω välinen<br />

kulma, niin tämän ympyrän säde on rsinθ.<br />

Ympyräliikkeen lineaarinen nopeus on suuruudeltaan<br />

ympyrän säde kertaa kulmanopeus, ts. rωsinθ.<br />

Lineaarisen nopeuden suunta taas on ympyrän tangentin<br />

suuntainen eli nyt kohtisuorassa vektoreita ω ja r<br />

vastaan. Oikean käden kolmisormisäännön perusteella<br />

voimme siten kirjoittaa<br />

1.3.3 Kolmitulot<br />

v = ω×r.<br />

Skalaarikolmitulo<br />

Tarkastellaan muotoa A·(B×C) olevia kolmen vektórin<br />

tuloja. Vektoreiden A ja B×C pistetulona tämä on<br />

skalaari. Siksi sitä nimitetäänkin skalaarikolmituloksi.<br />

Skalaarikolmitulon geometrinen merkitys selvinnee alla<br />

olevasta kuvasta.<br />

* +<br />

Kuva 1.15 Skalaarikolmitulo<br />

8


Vektoreiden A, B ja C muodostaman suuntaissärmiön<br />

tilavuus on pohjasuunnikkaan pinta-ala |B×C| kertaa<br />

särmiön korkeus h. Korkeus taas on vektorin A projektio<br />

pohjatasoa vastaan kohtisuoralle suunnalle, esim.<br />

vektorille B×C. Särmiön tilavuus V on siis<br />

V = |A·(B×C)|. (1.21)<br />

Komponenttimuodossa skalaarikolmitulo on<br />

eli<br />

A·(B×C) = (A x i+A y j+A z k)·<br />

∣ i j k ∣∣∣∣∣<br />

B x B y B z<br />

∣ C x C y C z<br />

= (A x i+A y j+A z k)·<br />

(<br />

i<br />

∣ B ∣ y B z ∣∣∣ −j<br />

C y C z<br />

∣ B x<br />

C x<br />

+k<br />

∣ B ∣)<br />

x B y ∣∣∣<br />

C x C y<br />

∣<br />

B z ∣∣∣<br />

C z<br />

∣ ∣ ∣ ∣ ∣∣∣ B<br />

= A y B z ∣∣∣ ∣∣∣ B<br />

x −A x B z ∣∣∣<br />

C y C y<br />

z C z<br />

=<br />

A·(B×C) =<br />

∣<br />

∣ ∣ ∣∣∣ B<br />

+A x B y ∣∣∣<br />

z<br />

C x C y ∣ A x A y A z ∣∣∣∣∣<br />

B x B y B z<br />

∣ C x C y C z<br />

C x<br />

A x A y A z<br />

B x B y B z<br />

C x C y C z<br />

∣ ∣∣∣∣∣<br />

. (1.22)<br />

Koska vaihdettaessa kaksi riviä keskenään determinantti<br />

vaihtaa merkkinsä, saamme<br />

∣ A x A y A z ∣∣∣∣∣<br />

A·(B×C) =<br />

B x B y B z<br />

∣ C x C y C z ∣ C x C y C z ∣∣∣∣∣<br />

= −<br />

B x B y B z<br />

∣ A x A y A z ∣ C x C y C z ∣∣∣∣∣<br />

=<br />

A x A y A z = C·(A×B).<br />

∣ B x B y B z<br />

Vektorikolmitulo<br />

Vektorikolmitulolla tarkoitetaan kolmen vektorin<br />

ristituloja A×(B×C) ja (A×B)×C. Nämä ovat<br />

yleensä erisuuria, joten sulkumerkit ovat oleellisia.<br />

Käsitellään edellistä muotoa olevia kolmituloja<br />

(jälkimmäisen käsittely menee samalla tavoin). Koska<br />

kyseessä on vektoreiden A ja B×C vektoritulo, on<br />

tuloskin vektori. Lasketaan näytteeksi sen x-komponentti:<br />

(A×(B×C)) x<br />

= i·(A×(B×C))<br />

∣ 1 0 0 ∣∣∣∣∣∣∣<br />

=<br />

∣ A x A y A z<br />

∣ ∣ B ∣ y B z ∣∣∣ −<br />

C z<br />

∣ B ∣ ∣ ∣<br />

x B z ∣∣∣ ∣∣∣ B x B y ∣∣∣<br />

C x C z C y<br />

C y<br />

C x<br />

= A y (B x C y −B y C x )+A z (B x C z −B z C x )<br />

= B x (A x C x +A y C y +A z C z )<br />

−C x (A x B x +A y B y +A z B z )<br />

= (A·C)(B·i)−(A·B)(C·i)<br />

= i·[(A·C)B−(A·B)C].<br />

Samalla tavoin voisimme laskea niin tämän kolmitulon<br />

muut komponentit kuin myös jälkimmäisen muodon<br />

komponentit jolloin päätyisimme yhtälöihin<br />

A×(B×C) = (A·C)B−(A·B)C<br />

(A×B)×C = (A·C)B−(B·C)A.<br />

(1.24)<br />

Muistamista helpottanee molempiin tapauksiin soveltuva<br />

sääntö:<br />

vektorikolmitulo = (kauempi·ulko)lähempi<br />

-(lähempi·ulko)kauempi,<br />

missä ”ulko”tarkoitaa sulkujen ulkopuolista tekijää,<br />

”lähempi”lähempänä ja ”kauempi”kauempana<br />

”ulko”-tekijästä olevaa sulkujen sisäpuolista vektoria.<br />

Koska skalaaritulo on kommutatiivinen, voimme<br />

kirjoittaa tämän myös muotoon<br />

A·(B×C) = (A×B)·C (1.23)<br />

eli skalaarikolmitulossa pisteen ja ristin paikan voi vaihtaa<br />

(sulkumerkkien paikat toki vaihtuvat tässä operaatiossa).<br />

9


Lineaarinen riippumattomuus<br />

Vektorit v 1 , v 2 , ...v n ovat lineaarisesti riippumattomia,<br />

jos<br />

n∑<br />

a k v k = 0 vain jos a 1 = ... = a n = 0 (1.25)<br />

k=1<br />

Muussa tapauksessa vektorit ovat lineaarisesti riippuvia.<br />

Kolmiulotteisessa avaruudessa on enintään 3 vektorin<br />

joukko keskenään lineaarisesti riippumaton.<br />

Esim. kantavektorit i, j, k ovat lineaarisesti<br />

riippumattomia:<br />

a 1 i+a 2 j+a 3 k = 0<br />

vain jos a 1 = a 2 = a 3 = 0.<br />

Esim. v 1 = i, v 2 = j, v 3 = i+j ovat lineaarisesti<br />

riippuvia:<br />

v 3 = v 1 +v 2 ⇒ v 1 +v 2 −v 3 = 0<br />

Jos vektorit ovat lineaarisesti riippuvia, ainakin yksi<br />

vektoreista voidaan kirjoittaa lineaarikombinaationa<br />

muista.<br />

Skalaarikolmitulon ja lineaarisen riippumattomuuden<br />

välillä on seuraava yhteys:<br />

Vektorit a, b ja c ovat lineaarisesti riippumattomia jos ja<br />

vain jos a·(b×c) ≠ 0.<br />

Esim. i·(j×k) = 1, joten i, j, k ovat lineaarisesti<br />

riippumattomia.<br />

Esim. a = (1,0,1), b = (1,2,3), c = (3,2,5):<br />

1 0 1<br />

a·(b×c) =<br />

1 2 3<br />

∣ 3 2 5 ∣<br />

= 1<br />

∣ 2 3<br />

∣ ∣ ∣∣∣ 2 5 ∣ −0 1 3<br />

∣∣∣ 3 5 ∣ +1 1 2<br />

3 2 ∣<br />

= 4−0−4 = 0<br />

Vektorit eivät ole lineaarisesti riippumattomia. Helposti<br />

nähdään että a = (c−b)/2.<br />

Huom: jos meillä on kolme lineaarisesti riippumatonta<br />

vektoria v 1 , v 2 , v 3 , niin mielivaltainen vektori voidaan<br />

esittää näiden lineaarikombinaationa:<br />

a = a 1 v 1 +a 2 v 2 +a 3 v 3 . Sanotaan että vektorit v i<br />

virittävät 3-ulotteisen avaruuden.<br />

Tutuin esimerkki näistä on tietysti i, j, k.<br />

2. Raja-arvo ja derivaatta<br />

2.1 Raja-arvon määritelmä<br />

Funktiolla f(x) on raja-arvo f 0 pisteessä x 0 jos f(x)<br />

lähestyy arvoa f 0 kun x lähestyy arvoa x 0 .<br />

Merkitään<br />

f(x) → f 0 kun x → x 0 (2.1)<br />

tai<br />

Raja-arvo matemaattisemmin:<br />

lim f(x) = f 0 . (2.2)<br />

x→x 0<br />

Intuitiivisesti raja-arvon käsite on varsin selvä. Matemaattisesti se<br />

määritellään seuraavasti: funktiolla f(x) on raja-arvo f 0 pisteessä<br />

x 0 , jos<br />

∀ǫ ∃δ > 0 siten että |f(x)−f 0 | < ǫ<br />

jos 0 < |x−x 0 | < δ<br />

Tässä merkintä “∀: kaikille”, “∃: on olemassa”.<br />

Eli: f on mielivaltaisen lähellä f 0 :aa, jos x on riittävän lähellä<br />

x 0 :aa.<br />

Raja-arvo on selkeä esim. tapauksissa<br />

lim<br />

x→1 x2 +x = 2,<br />

1<br />

lim<br />

x→∞ x = 0,<br />

lim sinx = sinπ/4 = 1/√ 2,<br />

x→π/4<br />

lim x a<br />

x→∞ e x = 0, a ∈ R<br />

(Huom: eksponenttifunktio pesee minkä tahansa<br />

potenssin!)<br />

Kavalia ovat esim. tapaukset jotka lähenevät muotoa<br />

Esim:<br />

0<br />

0 , 0×∞, ∞<br />

∞ , ∞−∞, 00 ,...<br />

2x 4 +x 2 +1 2x 4<br />

lim<br />

x→∞ −x 4 +x 3 = lim = −2 (2.3)<br />

x→∞ −x4 Suurin potenssi voittaa kun x → ∞. (vastaavasti pienin<br />

jos x → 0).<br />

Usein raja-arvojen laskemisessa auttavat seuraavat<br />

approksimaatiot, kun |x| on pieni:<br />

sinx = x− 1 6 x3 +O(x 5 ) (2.4)<br />

cosx = 1− 1 2 x2 +O(x 4 ) (2.5)<br />

(1+x) a = 1+ax+O(x 2 ) (2.6)<br />

ln(1+x) = x+O(x 2 ) (2.7)<br />

e x = 1+x+O(x 2 ) (2.8)<br />

Tässä merkintä O(x n ) tarkoittaa että kaikissa lopuissa<br />

termeissä x:n potenssi on vähintään n.<br />

Esim. √ 1+x = 1+x/2+O(x 2 )<br />

10


Esim.<br />

sinx<br />

lim<br />

x→0 x<br />

= lim<br />

x→0<br />

x−x 3 /6+O(x 5 )<br />

x<br />

= lim<br />

x→0<br />

(1−x 2 /6+O(x 4 )) = 1.<br />

Määritellään vielä oikeanpuoleinen raja-arvo:<br />

f 0 = lim f(x) (2.9)<br />

x→x 0+<br />

tai f(x) → f 0 , kun x → x 0 +. Merkintä tarkoittaa että x<br />

lähestyy arvoa x 0 oikealta (positiiviselta) puolelta.<br />

Vastaavasti vasemmanpuoleinen:<br />

f 0 = lim f(x) (2.10)<br />

x→x 0−<br />

Eli x lähestyy arvoa x 0 vasemmalta (negatiiviselta)<br />

puolelta.<br />

Epäjatkuvalla funktiolla oikeanpuoleinen ja<br />

vasemmanpuoleinen raja-arvo voivat olla erilaiset:<br />

Esim. askelfunktio eli Heavisiden funktio:<br />

⎧<br />

⎨<br />

θ(x) =<br />

⎩<br />

1, x > 0<br />

1/2, x = 0<br />

0 x < 0<br />

(2.11)<br />

Ilmeisesti lim x→0+ θ(x) = 1, mutta lim x→0− θ(x) = 0.<br />

Huom: askelfunktiolla ei ole tavallista raja-arvoa pisteessä<br />

x = 0!<br />

Huom: merkitään myös ilmeiset raja-arvot<br />

1 1<br />

lim = ∞, lim = −∞, lim<br />

x→0+ x x→0− x x = ∞<br />

x→∞<br />

2.2 Jatkuva funktio<br />

Funktio f(x) jatkuva pisteessä x 0 , jos f on määritelty<br />

jossain pisteen x 0 ympäristössä ja<br />

lim f(x) = f(x 0 ) (2.12)<br />

x→x 0<br />

Fysiikassa funktiot ovat jatkuvia (melkein) kaikkialla.<br />

Esim. Heavisiden askelfunktio (2.11) ei ole jatkuva<br />

pisteessä x = 0, mutta on jatkuva kaikissa pisteissä x ≠ 0.<br />

Esim. Funktio f(x) = 1/x 2 ei ole jatkuva pisteessä x = 0<br />

(ei edes määritelty)<br />

Raja-arvoille pätevät myös seuraavat ominaisuudet: jos<br />

funktioilla f(x) ja g(x) on raja-arvot kun x → x 0 , niin<br />

lim [f(x)+g(x)] = lim f(x)+ lim g(x)<br />

x→x 0 x→x 0 x→x 0<br />

lim [f(x)g(x)] = lim f(x) lim g(x)<br />

x→x 0 x→x 0 x→x 0<br />

lim [f(x)/g(x)] = lim f(x)/ lim g(x)<br />

x→x 0 x→x 0 x→x 0<br />

missä viimeisin edellyttää että lim x→x0 g(x) ≠ 0.<br />

2.3 Derivaatan määritelmä<br />

Funktion f(x) derivaatalla f ′ (x 0 ) pisteessä x 0<br />

tarkoitetaan raja-arvoa<br />

f ′ (x 0 ) = lim<br />

x→x 0<br />

f(x)−f(x 0 )<br />

x−x 0<br />

(2.13)<br />

= lim<br />

h→0<br />

f(x 0 +h)−f(x 0 )<br />

h<br />

(2.14)<br />

Geometrisesti derivaatta on funktion kuvaajan tangentin<br />

kulmakerroin derivointipisteessä.<br />

N N N N !<br />

=<br />

O B N <br />

B N J = =<br />

Kuva 2.1 Derivaatan geometrinen tulkinta<br />

Määritelmässä (2.14) ei ole spesifioitu lähestymissuuntaa,<br />

ts. voi olla joko x > x 0 tai x < x 0 . Molempien<br />

lähestymistapojen täytyy johtaa samaan lopputulokseen.<br />

Raja-arvo (2.14) ei välttämättä aina ole yksikäsitteinen<br />

tai sitä ei ole olemassa. Tällaisessa tapauksessa<br />

derivaattaa ei ole määritelty. Jos raja-arvo (2.14)on<br />

(yksikäsitteisenä) olemassa, sanotaan, että funktio on<br />

derivoituva pisteessä x 0 .<br />

Esim. funktio f(x) = |x| on jatkuva kaikilla x ∈ R. Jos<br />

x > 0, on<br />

f ′ f(y)−f(x)<br />

(x) = lim = 1,<br />

y→x y −x<br />

ja vastaavasti jos x < 0 on f ′ (x) = −1. Pisteessä x = 0 ei<br />

raja-arvoa ole olemassa (on vain vasemman- ja<br />

oikeanpuoleiset raja-arvot), eikä |x| ole derivoituva<br />

pisteessä x = 0.<br />

Merkintöjä<br />

Olkoon y = f(x) jokin derivoituva funktio. Derivaattaa f ′ (x)<br />

merkitään usein myös<br />

f ′ (x) = y ′ = d df(x)<br />

f(x) = = Dy = Df(x).<br />

dx dx<br />

Monesti jätetään funtion f argumenttikin merkitsemättä. Kun<br />

halutaan painottaa, että derivaattafunktio f ′ (x) halutaan laskea<br />

nimenomaan pisteessä x 0 , merkitään joskus<br />

f ′ (x 0 ) = df(x)<br />

∣<br />

.<br />

dx<br />

∣x=x 0<br />

Kun kyseessä on derivointi ajan suhteen, käytetään fysiikassa<br />

usein merkintää<br />

d<br />

f(t) = ḟ(t).<br />

dt<br />

Leibnitzin merkintätapa df<br />

dx<br />

funktion muutos<br />

muuttujan muutos<br />

on intuitiivisin:<br />

kun muutos → 0<br />

11


Huom:<br />

f ′ (x) = 0: funktio vaakasuora pisteessä x<br />

f ′ (x) = 1: funktion kulmakerroin = 1 (45 ◦ ) pisteessä x)<br />

f ′ (x) → ∞: funktio lähestyy pystysuoraa<br />

2.4 Derivaattojen lasku<br />

Derivaatta suoraan määritelmästä<br />

Lasketaan esimerkiksi potenssifunktion f(x) = x n<br />

derivaatta. Määritelmän mukaan derivaatta f ′ (x) on<br />

raja-arvo<br />

f ′ f(y)−f(x)<br />

(x) = lim<br />

y→x y −x<br />

= lim<br />

∆x→0<br />

f(x+∆x)−f(x)<br />

.<br />

∆x<br />

Tässä tapauksessa on siis laskettava raja-arvo<br />

f ′ (x) = lim<br />

∆x→0<br />

(x+∆x) n −x n<br />

.<br />

∆x<br />

Käyttäen (1+δ) a = 1+aδ +O(δ 2 ) (2.6) saamme<br />

(x+∆x) n = x n (1+ ∆x<br />

x )n = x n [1+n ∆x<br />

x +O((∆x x )2 )]<br />

joten<br />

(x+∆x) n −x n<br />

lim<br />

∆x→0 ∆x<br />

= lim<br />

∆x→0 [nxn−1 +x n−1 O( ∆x<br />

x )]<br />

= nx n−1 .<br />

Siis saimme dxn<br />

dx = nxn−1 .<br />

Käsitellään toisena esimerkkinä funktion f(x) = sinx<br />

derivaatan laskua. Nyt<br />

sin(x+∆x) = sinxcos∆x+cosxsin∆x,<br />

joten derivaatan määritelmän mukaan on<br />

f ′ sin(x+∆x)−sinx<br />

(x) = lim<br />

∆x→0 ∆x<br />

sinxcos∆x+cosxsin∆x−sinx<br />

= lim<br />

∆x→0<br />

= lim<br />

∆x→0<br />

[<br />

∆x<br />

sinx cos∆x−1 +cosx sin∆x<br />

∆x ∆x<br />

missä olemme käyttäneet sinin ja kosinin<br />

yhteenlaskukaavoja.<br />

Pienillä argumentin arvoilla trigonometriset funktiot<br />

käyttäytyvät kuten (2.4,2.5):<br />

sinδ = δ − 1 6 δ3 +O ( δ 5)<br />

]<br />

,<br />

joten<br />

ja<br />

cos∆x−1<br />

lim<br />

∆x→0 ∆x<br />

sin∆x<br />

lim<br />

∆x→0 ∆x<br />

Derivaataksi saamme siis<br />

− 1 2<br />

= lim<br />

(∆x)2 +O ( (∆x) 4)<br />

∆x→0 ∆x<br />

= lim O(∆x)<br />

∆x→0<br />

= 0<br />

∆x−O ( (∆x) 3)<br />

= lim<br />

∆x→0 ∆x<br />

[ (<br />

= lim 1−O (∆x)<br />

2 )]<br />

∆x→0<br />

= 1.<br />

d<br />

sinx = cosx.<br />

dx<br />

Trigonometristen funktioiden yhteenlaskukaavoja<br />

Sini- kosinifunktiot toteuttavat yhteenlaskukaavat<br />

sin(x+y) = sinxcosy +cosxsiny<br />

cos(x+y) = cosxcosy −sinxsiny.<br />

Koska<br />

tanx = sinx<br />

cosx ,<br />

voidaan tangentin yhteenlaskukaava kirjoittaa mm. muotoon<br />

tan(x+y) =<br />

sinxcosy +cosxsiny<br />

cosxcosy −sinxsiny = tanx+tany<br />

1−tanxtany .<br />

Erikoistapauksena saadaan kaksinkertaisille kulmille kaavat<br />

sin2x = 2sinxcosx<br />

cos2x = cos 2 x−sin 2 x<br />

tan2x =<br />

Pythagoraan lauseen perusteella on<br />

2tanx<br />

1−tan 2 x .<br />

sin 2 x+cos 2 y = 1.<br />

Kaksinkertaisen kulman kosini voidaan siten kirjoittaa myös<br />

muotoihin<br />

cos2x = 2cos 2 x−1 = 1−2sin 2 x.<br />

Muutamien tavallisimpien funktioiden derivaattoja on<br />

esitetty taulukossa<br />

f(x) Df(x)<br />

c (vakio) 0<br />

x n<br />

e x<br />

nx n−1<br />

e x<br />

lnx 1/x<br />

. (2.15)<br />

sinx cosx<br />

cosx −sinx<br />

tanx 1/cos 2 x = 1+tan 2 x<br />

cosδ = 1− 1 2 δ2 +O ( δ 4) ,<br />

12


Derivaatan laskusääntöjä<br />

Olkoot f ja g derivoituvia funktioita ja a ja b vakioita.<br />

Tällöin on voimassa<br />

d<br />

dx [af(x)+bg(y)] = af′ (x)+bg ′ (x). (2.16)<br />

Derivointi on lineaarinen operaatio. Funktioiden tulo<br />

f(x)g(x) derivoidaan kuten<br />

d<br />

dx [f(x)g(x)] = f′ (x)g(x)+f(x)g ′ (x) (2.17)<br />

ja osamäärä f(x)/g(x) kuten<br />

d f(x)<br />

dx g(x) = f′ (x)g(x)−f(x)g ′ (x)<br />

g 2 . (2.18)<br />

(x)<br />

Tulon derivointi<br />

Osoitetaan tulon derivoimissääntö. Suoraan derivaatan<br />

määritelmästä nähdään<br />

Nyt<br />

d<br />

dx (f(x)g(x))<br />

= lim<br />

h→0<br />

f(x+h)−f(x) = hf ′ (x)+O(h 2 )<br />

f(x+h)g(x+h)−f(x)g(x)<br />

h<br />

(f(x)+hf ′ (x))(g(x)+hg ′ (x))−f(x)g(x)+O(h 2 )<br />

= lim h→0 h<br />

h(f ′ (x)g(x)+f(x)g ′ (x))+O(h 2 )<br />

= lim h→0 h<br />

= f ′ (x)g(x)+f(x)g ′ (x)<br />

Yhdistetyn funktion f(g(x)) derivointiin soveltuu<br />

ketjusääntö<br />

d<br />

dx f(g(x)) = f′ (g(x))g ′ (x). (2.19)<br />

Tämä tulee erityisen selväksi käyttäen Leibnitzin<br />

notaatiota: jos merkitään y = f(z) ja z = g(x), saadaan<br />

d dy<br />

f(g(x)) =<br />

dx dx = dy dz<br />

dz dx = f′ (g(x))g ′ (x)<br />

Tämän avulla nähdään muun muassa että<br />

Esimerkkejä:<br />

d<br />

dx [f(x)]µ = µ[f(x)] µ−1 f ′ (x)<br />

d<br />

dx ef(x) = e f(x) f ′ (x)<br />

d<br />

dx lnf(x) = f′ (x)<br />

f(x)<br />

d<br />

dx ex2 = e x2 d<br />

dx x2 = e x2 2x<br />

d<br />

dx sinex = cos(e x ) d<br />

dx ex = cos(e x )e x<br />

d<br />

dx xx<br />

= d<br />

dx exlnx = e xlnx d<br />

dx xlnx<br />

= x x (1lnx+x 1 x ) = xx (1+lnx)<br />

Käänteisfunktion derivaatta<br />

Olkoon meillä funktion y = f(x), käänteisfunktio<br />

x = f −1 (y). Nyt käänteisfunktion derivaatta saadaan<br />

funktion derivaatan avulla seuraavasti:<br />

Df −1 (y) =<br />

1<br />

f ′ (f −1 (y)) = 1<br />

f ′ (x) . (2.20)<br />

Leibnitzin notaatiolla tämä on yksinkertaisesti<br />

dx<br />

dy = 1 dy<br />

dx<br />

(2.21)<br />

(miten todistetaankin käänteisfunktion derivoimissääntö,<br />

kun ajatellaan raja-arvoja ∆x, ∆y.)<br />

Esim. Johdetaan logaritmin derivoimissääntö. Nyt<br />

y = e x , x = lny:<br />

dlny<br />

dy<br />

= dx<br />

dy = 1 dy<br />

dx<br />

= 1<br />

de x<br />

dx<br />

tai Dlny = 1/(De x ) = 1/e x = 1/y.<br />

Syklometriset funktiot<br />

Trigonometrisillä funktioilla ei ole yksikäsitteistä<br />

käänteisfunktiota. Esimerkiksi yhtälön<br />

sinx = 1 2<br />

= 1<br />

e x = 1 y<br />

ratkaisee mikä tahansa äärettömän joukon<br />

{<br />

π<br />

x = 6 +2nπ<br />

5π<br />

6 +2nπ, n kokonaisluku<br />

luvuista. Kun rajoitetaan sinin argumentti välille − π 2 ≤ x ≤ π 2 ,<br />

on yhtälöllä sinx = a yksikäsitteinen ratkaisu, jota nimitetään<br />

arkussiniksi ja merkitään<br />

x = arcsina, − π 2 ≤ x ≤ π 2 .<br />

Arkussini on siis se sinin käänteisfunktio, jonka arvoalue on<br />

rajoitettu välille − π 2 ≤ x ≤ +π . Kosinilla puolestaan on<br />

2<br />

yksikäsitteinen arkuskosiniksi sanottu käänteisfunktio, kun<br />

rajoitetaan kosinin argumentti välille 0 ≤ x ≤ π. Tästä käytetään<br />

merkintää<br />

x = arccosz, 0 ≤ x ≤ π.<br />

Tangentin käänteisfunktio on nimeltään arkustangentti. Sen<br />

arvoalue on<br />

y = arctanx, − π 2 ≤ y ≤ π 2 .<br />

Koska sinin ja kosinin arvoalueet kattavat välin [−1,1], voivat<br />

arkussinin ja arkuskosinin argumenttit olla väillä [−1,1].<br />

Arkustangentin argumentti taas voi olla mikä tahansa reaaliluku,<br />

sillä tangentin arvoalueena on koko reaaliakseli.<br />

13


Joskus halutaan määritellä trigonometristen funktioiden<br />

käänteisfunktiot monikäsitteisiksi, esim. halutaan että<br />

z = arcsinx antaa kaikki ne arvot z, joilla sinz = x. Tällöin<br />

arvoalueelle − π 2 ≤ arcsinx ≤ π rajattua arkussiniä sanotaan ko.<br />

2<br />

funktion päähaaraksi. Päähaarasta käytetään merkintää arcsinx.<br />

Vastaavat nimitykset ja merkinnät ovat käytössä muillekin<br />

trigonometrisille käänteisfunktioille.<br />

Trigonometristen funktioiden käänteisfunktioita sanotaan<br />

syklometrisiksi funktioiksi tai useimmiten niiden nimen mukaisesti<br />

tuttavallisesti arkus-funktioiksi.<br />

Lasketaan esimerkkinä funktion arcsinx derivaatta. Nyt<br />

arcsin on sinifunktion käänteisfunktio, ts. jos x = siny<br />

niin y = arcsinx. Säännön (2.20) perusteella on<br />

Darcsinx =<br />

1<br />

Dsiny = 1<br />

cosy .<br />

Trigonometristen funktioiden ominaisuuksien perusteella<br />

voidaan kirjoittaa<br />

√<br />

cosy = 1−sin 2 y = √ 1−x 2 ,<br />

joten saamme<br />

Samoin voidaan osoittaa<br />

d<br />

dx arcsinx = 1<br />

√<br />

1−x<br />

2 . (2.22)<br />

d<br />

dx arctanx = 1<br />

1+x2. (2.23)<br />

Kaavat (2.22,2.23) ovat hyödyllisiä integraalien laskuissa.<br />

2.5 Korkeamman kertaluvun derivaatat<br />

Jos funktion f(x) derivaatta f ′ (x) on myöskin<br />

derivoituva, voimme laskea senkin derivaatan:<br />

Df ′ (x) = lim<br />

∆x→0<br />

f ′ (x+∆x)−f ′ (x)<br />

. (2.24)<br />

∆x<br />

Sanomme, että funktio f(x) on kahdesti derivoituva ja<br />

suure Df ′ (x) funktion f(x) toinen derivaatta. Jos vielä<br />

tämä toinen derivaattakin on derivoituva, voisimme<br />

edelleen määrätä sen derivaatan DDf ′ (x) jne. Vastaavasti<br />

funktion sanotaan tällöin olevan kolmesti, ..., n kertaa,<br />

derivoituva ja puhutaan kolmansista, ..., n:stä<br />

derivaatoista.<br />

Merkintöjä<br />

Olkoon funktio f(x) n-kertaisesti derivoituva. Sen n:ttä<br />

derivaattaa merkitään mm. kuten<br />

f (n) (x) = D n f(x) = dn f(x)<br />

dx n .<br />

Alhaisen kertaluvun derivaatoista voidaan myös käyttää sellaisia<br />

merkintöjä kuin<br />

f (2) (x) = f ′′ (x) = DDf(x).<br />

Jos kyseessä on derivointi ajan suhteen, merkitään usein<br />

d 2 f(t) ..<br />

dt 2 = f(t).<br />

2.6 Sovelluksia<br />

Differentiaalilaskennan lukemattomista käyttökohteista<br />

käsitellään muutamia fysiikan kannalta ehkä tärkeähköjä<br />

sovelluksia.<br />

Suureiden muodostus<br />

Intuitiivisesti nopeudella ymmärretään aikayksikössä<br />

kuljettua matkaa. Matemaattisen täsmälliseksi nopeuden<br />

käsite saadaan määrittelemällä se rajarvona<br />

v(t) = lim<br />

∆t→0<br />

x(t+∆t)−x(t)<br />

, (2.25)<br />

∆t<br />

kun oletetaan tarkasteltavan objektin liikkuvan pitkin<br />

x-akselia ja sen olevan paikassa x(t) hetkellä t.<br />

Derivaatan määritelmästä (2.14) nähdään, että nopeus<br />

v(t) hetkellä t on<br />

v(t) = dx(t)<br />

dt<br />

= ẋ(t). (2.26)<br />

Kiihtyvyys puolestaan on nopeuden muutos aikayksikössä.<br />

Derivaattojen avulla ilmaistuna on siis pitkin x-akselia<br />

liikkuvan kappaleen kiihtyvyys a kirjoitettavissa kuten<br />

a(t) = dv(t)<br />

dt<br />

= d2 x(t)<br />

dt 2<br />

= v(t) . = .ẋ(t). (2.27)<br />

Muista lukemattomista derivaattojen avulla määritellyistä<br />

fysiikan käsitteistä mainittakoon vaikkapa sähkövirta<br />

I = dQ<br />

dt<br />

sähkövarauksen Q muuttuessa ajan t funktiona tai teho<br />

P = dW dt ,<br />

missä W on hetkeen t mennessä tehty työ tai, kolmantena<br />

esimerkkinä kappaleen tilavuuden V muutoksesta<br />

aiheutuvasta paineen P muutoksesta kertova<br />

puristusmoduuli (kompressibiliteetti)<br />

B = − 1 V<br />

Approksimaatio<br />

Derivaatan määritelmästä (2.14)<br />

dP<br />

dV .<br />

f ′ f(x+∆x)−f(x)<br />

(x) = lim<br />

∆x→0 ∆x<br />

voidaan ratkaista f(x+∆x) likimääräisesti:<br />

f(x+∆x) ≈ f(x)+f ′ (x)∆x. (2.28)<br />

Tämä relaatio on sitä tarkempi mitä pienempi ∆x on.<br />

14


N<br />

N<br />

N<br />

Väliarvolause<br />

Tarkasti ottaen on voimassa ns. väliarvolause:<br />

Olkoon f derivoituva funktio. Tällöin pisteiden x ja x+∆x<br />

välissä on olemassa sellainen piste x 0 että<br />

f ′ (x 0 ) = f(x+∆x)−f(x) .<br />

∆x<br />

Lauseen mukaan on siis tarkasti voimassa<br />

f(x+∆x) = f(x)+f ′ (x 0 )∆x,<br />

missä x < x 0 < x+∆x (olettaen, että ∆x > 0).<br />

Esim. sinx kun x on pieni<br />

Kaavan (2.28) mukaan on<br />

sinx ≈ xsin ′ 0 = xcos0 = x.<br />

Esim. Newton-Raphsonin menetelmä<br />

Tehtävänä on etsiä funktion f(x) nollakohta, ts. ratkaista<br />

yhtälö<br />

f(x) = 0.<br />

Oletetaan, että f(x) on derivoituva. Olkoon x 0 jokin<br />

likiarvo ratkaisulle (saatu esim. arvaamalla tai piirtämällä<br />

funktion kuvaaja). Approksimoidaan funktiota pisteen x 0<br />

läheisyydessä (ks. kuva 2.2) lineaarisella kuvaajalla<br />

f(x) ≈ f(x 0 )+f ′ (x 0 )(x−x 0 ).<br />

Tämän suoran ja x-akselin leikkauspiste<br />

x 1 = x 0 − f(x 0)<br />

f ′ (x 0 )<br />

on (yleensä) parempi nollakohdan likiarvo kuin<br />

alkuperäinen x 0 .<br />

B N <br />

Ääriarvot<br />

Funktion maksimikohta on sellainen piste, että<br />

poistuttaessa siitä mihin tahansa suuntaan funktion arvo<br />

pienee. Vastaavasti minimikohdasta poistuttaessa<br />

funktion arvo kasvaa. Maksimi (minimi) on paikallinen eli<br />

lokaali, jos funktiolla on muita arvoltaan tätäkin<br />

suurempia (pienempiä) maksimeja (minimejä). Jos<br />

kyseessä on funktion suurin (pienin) arvo, puhutaan<br />

globaalista tai absoluuttisesta maksimista (minimistä).<br />

Esim. kuvassa 2.3 minimi kohdassa x 0 ja maksimi<br />

kohdassa x 1 ovat paikallisia. Kohdan x 2 minimi saattaisi<br />

olla globaali.<br />

B N <br />

N N N N !<br />

Kuva 2.3 Funktion ääriarvot<br />

Derivoituvan funktion f(x) ääriarvokohdissa, ts.<br />

maksimeissa ja minimeissä funktion tangentti on<br />

x-akselin suuntainen (ks. kuva 2.3) eli<br />

Derivoituvan funktion derivaatta ääriarvopisteissä on<br />

nolla.<br />

Tarkasti ottaen derivaatta häviää sellaisissa ääriarvopisteissä,<br />

jotka sijaitsevat funktion määrittelyalueen sisällä. Jos esim.<br />

funktio f(x) on määritelty siten, että<br />

f(x) = x 2 , kun −1 ≤ x ≤ 1,<br />

maksimit (arvoltaan 1) sijaitsevat reunapisteissä x = ±1.<br />

N <br />

N <br />

Pisteitä, joissa derivaatta häviää sanotaan kriittisiksi<br />

pisteiksi. Derivaatan häviäminen on siis ääriarvon<br />

välttämätön ehto. Se ei kuitenkaan ole riittävä. Esim.<br />

kuvassa 2.3 kohdan x 3 vasemmalla puolen funktio on<br />

pienempi ja oikealla puolen suurempi kuin pisteessä x 3 .<br />

Jos funktio on kahdesti derivoituva, voimme toisesta<br />

derivaatasta päätellä kriittisen pisteen luonteen:<br />

Kuva 2.2 Newton-Raphsonin iteraatio<br />

Toistetaan sama menettely käyttäen pistettä x 1<br />

lähtöarvona, jolloin saadaan taas (toivottavasti) parempi<br />

likiarvo x 2 . Jatketaan samalla tavoin iteroiden, ts.<br />

lasketaan likiarvosta x n likiarvo<br />

x n+1 = x n − f(x n)<br />

f ′ (x n ) ,<br />

niin kauan kunnes f(x n ) on halutulla tarkkuudella nolla<br />

tai kunnes x n+1 poikkeaa riittävän vähän edellisestä<br />

arvosta x n .<br />

• Jos toinen derivaatta on negatiivinen, siirryttäessä<br />

pisteen yli vasemmalta oikealle ensimmäinen<br />

derivaatta pienenee positiivisesta negatiiviseksi, ts.<br />

kyseessä on maksimi.<br />

• Jos toinen derivaatta on positiivinen, siirryttäessä<br />

pisteen yli vasemmalta oikealle ensimmäinen<br />

derivaatta kasvaa negatiivisesta positiiviseksi, ts.<br />

minimi.<br />

• jos toinen derivaatta on nolla kriittisessä pisteessä,<br />

täytyy tarkastella korkeampia derivaattoja: jos pienin<br />

nollasta poikkeava derivaatta on:<br />

15


A) parillista kertalukua (2,4,...), kyseessä on Esim. lim x→0 sin 2 2x/x 2<br />

maksimi/minimi jos derivaatan etumerkki on -/+. l’Hospitalin sääntö on ilmeisestikin sovellettavissa ja<br />

B) pariton (1,3,...), kyseessä ei ole ääriarvo. saamme<br />

Esim. Funktion f(x) = 3x 4 −4x 3 kriittiset pisteet sin 2 2x 4sin2xcos2x<br />

lim<br />

Derivaatta on nyt<br />

x→0 x 2 = lim<br />

x→0 2x<br />

sin2x<br />

f ′ (x) = 12x 3 −12x 2 = 12x 2 (x−1).<br />

= lim 2cos2x = lim<br />

x→0 x 2sin2x<br />

x→0 x .<br />

Kriittiset pisteet saadaan asettamalla f ′ (x) = 0, ts.<br />

Päädymme siten edelleen muotoa 0/0 olevaan<br />

ratkaistaan yhtälö<br />

lausekkeeseen. Sovelletaan tähän uudelleen l’Hospitalin<br />

12x 2 (x−1) = 0.<br />

sääntöä, jolloin saadaan<br />

Kriittiset pisteet ovat siten 0 ja 1. Funktion toinen<br />

lim<br />

derivaatta on<br />

2sin2x = lim 4 cos2x = 4.<br />

x→0 x x→0 1<br />

f ′′ (x) = 36x 2 −24x,<br />

Esim. lim x→0+ xlnx<br />

joten f ′′ (0) = 0 ja f ′′ (1) = 12. Piste 1 on siis minimi. Tässä merkintä x → 0+ tarkoittaa, että x lähestyy nollaa<br />

mutta piste 0 ei ole maksimi eikä minimi. positiiviselta puolelta. Tämä rajoitus on asetettu, jotta<br />

l’Hospitalin sääntö<br />

logaritmifunktio olisi määritelty. Nyt x → 0 ja<br />

Hyvin monesti raja-arvoja laskettaessa päädytään<br />

lnx → −∞, joten l’Hospitalin säännön soveltamiseksi<br />

muotoa 0/0, ∞/∞ tai 0·∞ oleviin lausekkeisiin. Jos<br />

kirjoitetaan raja-arvo muotoon<br />

kyseessä ovat derivoituvat funktiot, voidaan useimmiten<br />

lnx<br />

soveltaa l’Hospitalin sääntöä<br />

lim xlnx = lim<br />

x→0+ x→0+ 1<br />

.<br />

Jos<br />

f ′ x<br />

(x)<br />

lim<br />

x→a g ′ (x) = A<br />

Nyt sekä osoittaja että nimittäjä lähestyvät ääretöntä ja<br />

l’Hospitalin sääntö on jälleen käyttökelpoinen:<br />

ja jos joko<br />

1<br />

f(x) → 0 ja g(x) → 0 kun x → a<br />

x<br />

lim xlnx = lim<br />

x→0+ x→0+ − 1 = lim (−x) = 0.<br />

x<br />

tai<br />

2 x→0+<br />

g(x) → ±∞ kun x → a,<br />

Implisiittinen derivointi<br />

niin<br />

Joskus funktiota y(x) määritellään esim. ehdolla<br />

f(x)<br />

lim<br />

x→a g(x) = A.<br />

F(x,y) = F(x,y(x)) = c, (2.29)<br />

Perusteluja<br />

missä c on vakio. Periaatteessa tästä yhtälöstä voitaisiin<br />

Tarkastellaan esimerkkinä tapausta, missä a on äärellinen ja missä (ehkä) ratkaista muuttuja y. Tämä ratkaisu riippuisi<br />

sekä f(a) = 0 että g(a) = 0. Voimme siis kirjoittaa<br />

tietenkin muuttujasta x. Voimme siis ajatella, että yhtälö<br />

f(x) f(x)−f(a)<br />

lim = lim<br />

x→a g(x) x→a g(x)−g(a) . (2.29) määrää implisiittisesti funktion y(x).<br />

Funktion y(x) derivaatta voidaan usein ratkaista suoraan<br />

[f(x)−f(a)]/(x−a)<br />

= lim<br />

x→a [g(x)−g(a)]/(x−a) . derivoimalla ehtoa F:<br />

= limx→a[f(x)−f(a)]/(x−a)<br />

d<br />

lim .<br />

F(x,y(x)) = 0 (2.30)<br />

x→a[g(x)−g(a)]/(x−a) dx<br />

= f′ (x)<br />

g ′ (x)<br />

ja ratkaisemalla y ′ (x).<br />

jos derivaatat ovat olemassa.<br />

Esim. Tason origokeskeinen ympyrä x 2 +y 2 = a 2<br />

määrittelee implisiittisesti funktion y(x).Nyt<br />

Esim. lim x→0 sinx/x<br />

Sekä osoittaja että nimittäjä lähestyvät nollaa<br />

d<br />

argumentin lähestyessä nollaa ja funktiot ovat<br />

dx (x2 +y(x) 2 ) = 2x+2y(x)y ′ (x) = 0<br />

derivoituvia. Voimme siis soveltaa l’Hospitalin sääntöä: ⇒ y ′ (x) = −x/y<br />

sinx<br />

lim<br />

x→0 x = lim cosx<br />

= 1<br />

x→0 1 1 = 1. mikä on ympyrän tangentin kulmakerroin.<br />

16


Esim. Muodosta implisiittisesti derivaatta dy<br />

dx yhtälöstä<br />

sin(xy)+y = x<br />

Tässä tapauksessa siis F(x,y(x)) = sin(xy)+y−x = 0, ja<br />

d<br />

dx F(x,y(x)) = d<br />

dx<br />

= 0<br />

= cos(xy)<br />

(sin(xy)+y −x)<br />

(<br />

y +x dy<br />

dx<br />

Hieman ryhmittäen voidaan kirjoittaa<br />

(1+xcos(xy)) dy<br />

dx = 1−ycos(xy),<br />

josta saamme derivaataksi<br />

dy<br />

dx = 1−ycos(xy)<br />

1+xcos(xy) .<br />

)<br />

+ dy<br />

dx −1<br />

Parametrisesti annetun funktion derivaatta<br />

Esim. x = cost ja y = sint määrittelee parametrisesti<br />

funktion (yksikköympyrän kaari) y(x) (kun 0 ≤ t ≤ π).<br />

Yleisemmin: olkoon annettu x = g(t) ja<br />

y = f(t) = f(g −1 (x)). Nyt ketjusäännön mukaan<br />

dy<br />

dx = f′ (t) d<br />

dx g−1 x = f ′ 1<br />

(t)<br />

g ′ (t) = y′ (t)<br />

x ′ (t)<br />

Tai yksinkertaisesti<br />

Ympyrälle siis<br />

dy<br />

dy<br />

dx = dt<br />

dx<br />

dt<br />

dy<br />

dx = cost<br />

√<br />

1−x<br />

−sint = − 2<br />

x<br />

(2.31)<br />

(2.32)<br />

3. Potenssisarjoja<br />

3.1 Äärettömät sarjat<br />

Olkoon {a n } jokin lukujono. Summaa<br />

S =<br />

∞∑<br />

a n = a 0 +a 1 +a 2 +···+a n +··· (3.1)<br />

n=0<br />

sanotaan äärettömäksi sarjaksi. Lukuja<br />

S n =<br />

n∑<br />

k=0<br />

kutsutaan osasummiksi. Äärettömän sarjan, tai lyhyesti<br />

vain sarjan, sanotaan suppenevan (konvergoituvan) jos<br />

raja-arvo lim n→∞ S n on olemassa. Jos raja-arvoa ei ole,<br />

sarja hajaantuu (divergoi).<br />

Alkaako sarja nollannesta, ensimmäisestä, toisesta tai jostakin ∑ ∞<br />

muusta termistä on vain numerointikysymys. Summat<br />

∑ ∑ ∑ k=1 a k,<br />

∞<br />

k=2 a ∞<br />

k, ... tai lyhyemmin<br />

1 a ∞<br />

k,<br />

2 a k, ... ovat myöskin<br />

(äärettömiä) sarjoja.<br />

Katsotaan esimerkkinä geometrista sarjaa ∑ ∞<br />

0 xn .<br />

Osasummat ovat<br />

n∑<br />

S n = x k = 1+x+···+x n<br />

0<br />

= 1−xn+1<br />

=<br />

a k<br />

1−x<br />

1<br />

1−x − xn+1<br />

1−x .<br />

Tiedämme, että x n+1 → 0 kun |x| < 1. Tällöin siis<br />

limS n = 1<br />

1−x .<br />

Toisaalta sarja selvästikin hajaantuu kun |x| ≥ 1.<br />

Olemme siis saaneet tuloksen<br />

∞∑<br />

0<br />

x n = 1 , kun |x| < 1. (3.2)<br />

1−x<br />

Se, että sarjan termit lähestyvät nollaa, ei takaa sarjan<br />

suppenemista. Esimerksi harmoninen sarja<br />

∞∑ 1<br />

n = 1+ 1 2 +···+ 1 n +···<br />

n=1<br />

hajaantuu.<br />

On olemassa useita testejä, joilla sarjojen suppenemista<br />

voi tutkia. Näistä ehkä käytetyin on suhdetesti:<br />

Olkoon ∑ a n sellainen positiivisten termien sarja, että<br />

raja-arvo<br />

lim<br />

n→∞ a n+1/a n = q<br />

on olemassa. Silloin<br />

17


• jos q < 1, niin sarja suppenee,<br />

• jos q > 1, niin sarja hajaantuu ja<br />

• jos q = 1, niin sarja voi supeta tai hajaantua.<br />

Vaikka suhdetesti käsitteleekin vain positiivitermisiä<br />

sarjoja, sitä voidaan soveltaa yleisempiinkin tapauksiin.<br />

Sanotaan että sarja ∑ ∑<br />

a n suppenee itseisesti jos sarja<br />

|an | suppenee. Voidaan osoittaa, että sarjan supetessa<br />

itseisesti myös itse sarja suppenee. Jos siis suhdetestillä<br />

todetaan sarjan suppenevan itseisesti niin voidaan<br />

päätellä sarjan suppenevan sellaisenaankin.<br />

Esim. Osoita, että sarja ∑ ∞ (−1) n n<br />

1 2<br />

suppenee<br />

n<br />

Kyseessä on ns. vuorotteleva sarja: joka toinen termi on<br />

positiivinen ja joka toinen negatiivinen. Osoitetaan, että<br />

sarja suppenee itseisesti, ts. että ∑ ∣<br />

∞<br />

1 ∣ (−1)n n ∣∣<br />

2 suppenee.<br />

n<br />

Nyt a n = n 2<br />

ja n<br />

a n+1<br />

a n<br />

= (n+1)2n<br />

n2 n+1 = 1 (<br />

1+ 1 )<br />

2 n<br />

→ 1 2 < 1.<br />

Suhdetestin mukaan sarja suppenee itseisesti ja niin ollen<br />

suppenee sellaisenaankin.<br />

3.2 Potenssisarjat<br />

Geometrinen sarja (3.2) ∑ 0 xn esittää funktiota<br />

1/(1−x). Itseasiassa hyvin monet funktiot voidaan<br />

esittää tyyppiä<br />

∞∑<br />

a n (x−x 0 ) n<br />

0<br />

olevina potenssisarjoina. Jatkossa käsittelemme<br />

enimmäkseen tapauksia, joissa x 0 = 0, sillä vaihtamalla<br />

muuttujaan x ′ = x−x 0 mikä tahansa potenssisarja<br />

saadaan muotoon<br />

∞∑<br />

a n x ′ n .<br />

n<br />

Potenssisarjan suppeneminen riippuu yleensä muuttujan<br />

x arvosta. Voidaan osoittaa, että<br />

On olemassa sellainen luku R ≥ 0 (mahdollisesti +∞,<br />

että potenssisarja ∑ n a nx n suppenee itseisesti, kun<br />

−R < x < R ja hajaantuu kun |x| > R.<br />

Lukua R sanotaan suppenemissäteeksi.<br />

Tärkein suppenemissäteen määräämismenetelmä on<br />

jälleen suhdetesti:<br />

Olkoon sarja ∑ n a nx n sellainen, että raja-arvo<br />

lim|a n+1 /a n | = q on olemassa. Suppenemissäde on silloin<br />

R = 1/q.<br />

∑ Suhdetestin mukaan sarja<br />

n anxn suppenee itseisesti, jos<br />

termien suhteelle on voimassa<br />

∣ lim<br />

∣ a n+1x n+1 ∣∣∣ a nx n = lim∣ a ∣<br />

n+1 ∣∣ |x| < 1.<br />

a n<br />

Sarja siis suppenee, jos muuttuja x toteuttaa ehdon<br />

∣<br />

1<br />

|x| <<br />

∣ lim∣ a = lim<br />

n+1<br />

∣ an ∣∣,<br />

a n+1<br />

a n<br />

joten suppenemissäde R on<br />

∣ R = lim∣ an ∣∣.<br />

a n+1<br />

Esim. Sarjan ∑ n xn /n! suppenemissäde<br />

Nyt ∣ ∣ ∣∣∣ a n+1∣∣∣<br />

n!<br />

=<br />

a n (n+1)! = 1<br />

n+1 ,<br />

joten suhdetestin q on 0. Suppenemissäde on niin ollen<br />

ääretön eli sarja suppenee kaikilla muuttujan x arvoilla.<br />

Esim. Sarjan ∑ ∞<br />

1 10n<br />

n xn suppenemissäde<br />

Suhdetesti antaa<br />

∣ a n ∣∣∣<br />

∣ =<br />

a n+1<br />

10 n<br />

n<br />

10 n+1<br />

n+1<br />

= n+1 ·<br />

n<br />

1<br />

10 → 1<br />

10 = 1 q = R.<br />

Kuten todettua potenssisarjoja voidaan pitää<br />

argumenttinsa funktioina. Potenssisarjafunktioilla on mm.<br />

ominaisuudet:<br />

Suppenemissäteen sisällä sarjan ∑ a n x n esittämä funktio<br />

• on jatkuva,<br />

• voidaan integroida integroimalla sarja termeittäin,<br />

• voidaan derivoida (mielivaltaisen monesti)<br />

derivoimalla sarja termeittäin.<br />

3.3 Taylorin sarjat<br />

Olkoon funktio f(x) äärettömän monta kertaa<br />

derivoituva pisteen x 0 ympäristössä. Tällöin se voidaan<br />

esittää Taylorin sarjana pisteen x 0 suhteen kehitettynä<br />

suppenemissäteen sisällä:<br />

f(x) =<br />

∞∑<br />

n=0<br />

f (n) (x 0 )<br />

(x−x 0 ) n (3.3)<br />

n!<br />

Tässä siis f (n) (x 0 ) on funktion n:s derivaatta pisteessä<br />

x 0 , ja f (0) (x 0 ) = f(x 0 ). Luku<br />

n! ≡ n(n−1)(n−2)...1, 0! ≡ 1<br />

on n:n kertoma.<br />

Jos x 0 = 0, Taylorin sarja saadaan usein esiintyvään<br />

muotoon<br />

∞∑ f (n) (0)<br />

f(x) = x n (3.4)<br />

n!<br />

n=0<br />

18


Todistus: Olkoon meillä potenssisarja<br />

f(x) =<br />

∞∑<br />

a n (x−x 0 ) n .<br />

n=0<br />

Asettamalla x = x 0 vain ensimmäinen termi on nollasta<br />

poikkeava, ja nähdään heti a 0 = f(x 0 ) = f (0) (x 0 ).<br />

Potenssisarjojen ominaisuuksien mukaan sarjaa voidaan<br />

derivoida termeittäin. Silloin ensimmäinen derivaatta<br />

suppenemissäteen sisällä on<br />

f ′ (x) =<br />

∞∑<br />

0<br />

a n<br />

d<br />

dx (x−x 0) n =<br />

∞∑<br />

a n n(x−x 0 ) n−1 .<br />

Asettamalla tässä x = x 0 nähdään a 1 = f ′ (x 0 ) = f (1) (x 0 ).<br />

Derivoimalla k kertaa saamme<br />

∞∑<br />

f (k) d k<br />

(x) = a n<br />

dx k(x−x 0) n<br />

=<br />

n=0<br />

1<br />

∞∑<br />

a n n(n−1)...(n−k +1)(x−x 0 ) n−k<br />

n=k<br />

mistä jälleen seuraa f (k) (x 0 ) = k!a k , mikä jo osoittaakin<br />

tuloksen (3.3).<br />

Esim. Kosinifunktion Taylorin sarja<br />

Nyt<br />

d<br />

cosx = −sinx<br />

dx<br />

d 2<br />

2<br />

cosx = −cosx<br />

dx<br />

d 3<br />

3<br />

cosx = sinx<br />

dx<br />

d 4<br />

4<br />

cosx = cosx<br />

dx .<br />

d 2n<br />

dx 2n cosx = (−1)n cosx<br />

d 2n+1<br />

dx 2n+1 cosx = (−1)n+1 sinx<br />

.<br />

Nähdään, että tässä tapauksessa parittomat derivaatat<br />

f (2n+1) (0) häviävät ja jäljelle jäävät ainoastaan parilliset<br />

f (2n) (0) = (−1) n .<br />

Funktion cosx Taylorin sarja on niin ollen<br />

cosx = f(0)+f (1) (0)x+ f(2) (0)<br />

x 2<br />

2!<br />

+ f(3) (0)<br />

3!<br />

x 3 + f(4) (0)<br />

x 4 +···<br />

4!<br />

= 1− 1 2 x2 + 1 4! x4 +···<br />

=<br />

∞∑<br />

n=0<br />

(−1) n x2n<br />

(2n)! .<br />

Suhdetestin avulla todetaan helposti, että tämän sarjan<br />

suppenemissäde on ääretön.<br />

Tarkasti ottaen suhdetestillä määrätään sarjan ∑ n anxn<br />

suppenemissäde. Sarja ∑ n anxβn saadaan muuttujan vaihdolla<br />

y = x β suhdetestille sopivaan muotoon ∑ n anyn . Tämä sarja<br />

suppenee kun muuttuja y on itseisarvoltaan pienempi kuin testin<br />

antama suppenemissäde R. Muuttujalle x = y 1/β<br />

suppenemissäde on niin ollen R 1/β .<br />

Kääntäen, jos tunnetaan funktion f(x) Taylorin sarja<br />

∑<br />

f(x) = a nx n<br />

ja sen suppenemissäde R, niin funktion f(x β ) Taylorin sarja on<br />

yksinkertaisesti<br />

∑<br />

f(x β ) = a nx βn<br />

ja sen suppenemissäde R 1/β .<br />

Katsotaan nyt, miten muodostaisimme logaritmifunktion<br />

Taylorin sarjan. Koska sen jokainen derivaatta,<br />

d n<br />

dx n lnx = (−1) n−1(n−1)!<br />

x n ; (n > 0),<br />

divergoi kun x = 0, emme voi origon (x 0 = 0)<br />

ympäristössä Taylorin sarjaa muodostaa.<br />

Kehittämällä sen sijaan Taylorin sarja (3.3) pisteen<br />

x 0 = 1 ympäristössä, saame sarjan<br />

lnx = ln1+(x−1)− (x−1)2<br />

2<br />

=<br />

n<br />

n<br />

+ (x−1)3 − (x−1)4 +···<br />

3 4<br />

∞∑<br />

(−1) n−1(x−1)n .<br />

n<br />

n=1<br />

mikä on tapana esittää muodossa (y = x−1)<br />

ln(1+y) =<br />

∞∑<br />

(−1) n−1yn n<br />

n=1<br />

Näiden sarjojen suppenemissäde on 1 (suppenee jos<br />

|y| = |x−1| < 1)<br />

Taylorin sarjat funktioiden approksimaatioina<br />

Kirjoitetaan funktion f Taylorin sarja muotoon<br />

f(x) = f(0)+f (1) (0)x+···+ f(n) (0)<br />

x n +R(x).<br />

n!<br />

Intuitiivisesti on ilmeistä (ja voidaan osoittaa), että mitä<br />

pienempi on argumetti x ja mitä suurempi on n sitä<br />

pienempi on jäännöstermi R(x). Tämän perusteella<br />

19


voimme approksimoida funktioita katkaistuilla Taylorin<br />

sarjoilla:<br />

f(x) ≈ f(0)+f (1) (0)x+···+ f(n) (0)<br />

x n . (3.5)<br />

n!<br />

Approksimaatio on siis sitä tarkempi mitä pienempi on x<br />

tai mitä suurempi on n. Yleensä approksimoitaessa<br />

tyydytään lineaarisiin tai neliöllisiin termeihin.<br />

Katkaistaessa yleistetty Taylorin sarja (3.3) tarkkuus on<br />

vastaavasti sitä parempi mitä lähempänä argumentti on<br />

kehityspistettä. Jotta tarkkuus olisi sitä parempi mitä<br />

pienempi argumentti on, useimmiten muutetaan<br />

tarkasteltavaa funktiota sen sijaan että kehitettäisiin<br />

origosta poikkeavassa pisteessä.<br />

Esimerkiksi logaritmifunktion tapauksessa saadaan<br />

approksimaatio<br />

Jos µ on positiivinen kokonaisluku, sarjassa on äärellinen<br />

määrä termejä (n = 0...µ). Muussa tapauksessa sarjan<br />

suppenemissäde on |x| < 1.<br />

tai sinille<br />

ln(1+x) = x− x2<br />

2 + x3<br />

3 +O(x4)<br />

sinx = x− x3<br />

6 +O(x5 ).<br />

Alla olevaan taulukkoon on kerätty muutamia usein<br />

tarvittavia Taylorin sarjoja.<br />

∑<br />

f(x) an x n<br />

e x<br />

sinx<br />

cosx<br />

sinhx<br />

coshx<br />

ln(1+x)<br />

tanx<br />

∑<br />

0 xn<br />

n!<br />

x2n+1<br />

∑0<br />

(−1)n<br />

(2n+1)!<br />

x2n<br />

∑0<br />

(−1)n<br />

(2n)!<br />

∑0 x2n+1<br />

(2n+1)!<br />

∑0 x2n<br />

(2n)!<br />

∑<br />

1 (−1)n−1xn n , |x| < 1<br />

x+ x3<br />

3 + 2 15 x5 +···, |x| < π 2<br />

(3.6)<br />

Näistä saamme suoraan aiemmin esitetyt approksimaatiot<br />

(2.4–2.8).<br />

Eksponenttifunktion sarjasta<br />

e x = ∑ 0<br />

x n<br />

n!<br />

seuraa d<br />

dx ex = e x , jos sitä ei muuten tunnettaisi:<br />

d<br />

dx<br />

∑<br />

n<br />

x n<br />

n!<br />

nx n−1<br />

= ∑ n!<br />

n<br />

∞∑ x n−1<br />

=<br />

(n−1)! = ∑ n=1 k<br />

missä k = n−1.<br />

Toistuvasti derivoimalla saadaan myös sarja<br />

x k<br />

k!<br />

(1+x) µ = 1+µx+ µ(µ−1) x 2 +...<br />

2!<br />

∞∑ µ(µ−1)...(µ−n+1)<br />

=<br />

x n<br />

n!<br />

n=0<br />

20


4. Integraalilaskentaa<br />

4.1 Integraalifunktio<br />

Funktio F on funktion f integraalifunktio (integraali), jos<br />

F ′ (x) = f(x). (4.1)<br />

Integraalifunktion laskeminen (integrointi) on siis<br />

derivoinnin käänteisoperaatio. Integraalifunktiosta on<br />

tapana käyttää merkintää<br />

∫<br />

F(x) = f(x)dx (4.2)<br />

Funktiota f sanotaan integroitavaksi.<br />

Integraalifunktio ei ole yksikäsitteinen: Olkoon f<br />

integroituva funktio, jonka eräs integraalifunktio on F.<br />

Tällöin jokainen funktion f integraalifunktio on muotoa<br />

F(x)+C.<br />

Todistus:<br />

1. (F(x)+C) ′ = F ′ (x) = f(x), joten F(x)+C on<br />

integraalifunktio.<br />

2. Olkoon G(x) toinen f(x):n integraalifunktio. Nyt<br />

(F(x)−G(x)) ′ = F ′ (x)−G ′ (x) = f(x)−f(x) = 0, joten<br />

F(x)−G(x) on vakio.<br />

Yleisesti integrointi on huomattavasti vaikeampaa kuin<br />

derivointi: alkeisfunktioiden derivaatat ovat<br />

alkeisfunktioita, mutta alkeisfunktioiden integraalit eivät<br />

yleisesti ottaen ole!<br />

Koska derivointi on lineaarinen operaatio, myös<br />

integrointi on lineaarinen, ts.<br />

∫<br />

∫ ∫<br />

[αf(x)+βg(x)]dx = α f(x)dx+β g(x)dx, (4.3)<br />

missä α ja β ovat vakioita.<br />

Etenkin fysiikassa käytetään usein merkintää missä dx<br />

tulee välittömästi integraalimerkin jälkeen, siis<br />

∫ ∫<br />

dxf(x) ≡ f(x)dx<br />

4.1.1 Tavallisia integraaleja<br />

Johto seuraaville: derivoimalla!<br />

∫<br />

x µ dx = xµ+1<br />

µ+1 +C, µ ≠ 1<br />

∫<br />

adx = ax+C, a vakio<br />

∫ 1<br />

dx = ln|x|+C = ln|Ax|, missä C = ln|A|.<br />

x<br />

∫<br />

e x dx = e x +C<br />

∫<br />

a x dx = ax<br />

lna +C<br />

∫<br />

∫<br />

∫<br />

∫<br />

∫<br />

sinxdx = −cosx+C<br />

cosxdx = sinx+C<br />

tanxdx = −ln|cosx|+C<br />

coshxdx = sinhx+C<br />

sinhxdx = coshx+C<br />

Usein esiintyvät myös<br />

∫<br />

1<br />

dx = ln|1+x|+C<br />

1+x<br />

∫<br />

1<br />

dx = arctanx+C<br />

1+x2 ∫<br />

1<br />

1−x 2 dx = 1 ∣ ∣∣∣<br />

2 ln 1+x<br />

1−x∣ +C<br />

∫<br />

1<br />

√ dx = arcsinx+C<br />

1−x<br />

2<br />

∫<br />

1<br />

√<br />

x2 ±1 dx = ln|x+√ x 2 ±1|+C<br />

4.2 Integraalien lasku<br />

Toisin kuin derivointi integrointi ei yleensä ole<br />

suoraviivainen mekaaninen toimenpide. Läheskään kaikki<br />

alkeisfunktioista muodostetut funktiot eivät ole<br />

integroituvia alkeisfunktioiden avulla! Integraalifunktion<br />

etsinnässä on käytössä lukuisia menetelmiä, joista<br />

tärkeimmät ovat muuttujan vaihto ja osittaisintegrointi.<br />

Polynomit ja sarjat<br />

Koska integrointi on lineaarinen operaatio, voimme laskea<br />

esim. minkä tahansa polynomin integraalin. Jos polynomi<br />

on muotoa,<br />

P(x) = a 0 +a 1 x+a 2 x 2 +···a n x n ,<br />

on sen integraali<br />

∫<br />

P(x)dx = C+a 0 x+ 1 2 a 1x 2 +···+ 1<br />

n+1 a nx n+1 . (4.4)<br />

Samoin jos tunnemme funktion Taylorin sarjan,<br />

f(x) = ∑ n a nx n , saamme välittömästi integraalifunktion<br />

sarjan ∫<br />

f(x)dx = C + ∑ a n<br />

n+1 xn+1 (4.5)<br />

n<br />

Tämä sarja ei välttämättä vastaa mitään alkeisfunktiota.<br />

4.2.1 Ketjusäännön käyttö<br />

Derivoinnin ketjusäännön (2.19)<br />

d<br />

dx g(f(x)) = g′ (f(x))f ′ (x)<br />

21


mukaan on<br />

∫<br />

g ′ (f(x))f ′ (x)dx = g(f(x)). (4.6)<br />

Jos g(x) = x 2 , saadaan usein esiintyvä<br />

∫<br />

f ′ (x)f(x)dx = 1 2 f(x)2 +C (4.7)<br />

Tai jos g(x) = lnx,<br />

∫ f ′ (x)<br />

dx = ln|f(x)|+C (4.8)<br />

f(x)<br />

Yleisemmin<br />

∫<br />

f ′ (x)(f(x)) n dx = 1<br />

n+1 (f(x))n+1 +C, n ≠ −1 (4.9)<br />

Esimerkkejä:<br />

∫ ∫<br />

sinxcosxdx =<br />

sinx(sinx) ′ dx = 1 2 sin2 x+C<br />

∫ ∫ sinx −(cosx)<br />

′<br />

cosx dx = dx = −ln|cosx|+C<br />

cosx<br />

4.2.2 Muuttujan vaihto<br />

Ketjusääntöön perustuu myös muuttujanvaihto- eli<br />

sijoitustekniikka. Olkoon F funktion f integraalifunktio,<br />

joka siis toteuttaa relaation<br />

d<br />

F(x) = f(x).<br />

dx<br />

Oletetaan nyt että x on parametrin t funktio, x(t).<br />

Ketjusäännön mukaan on<br />

d<br />

dt F(x(t)) = F′ (x(t))x ′ (t) = f(x(t))x ′ (t).<br />

Integroimalla yhtälö puolittain saadaan siten<br />

∫<br />

F(x(t)) = f(x(t))x ′ (t)dt,<br />

jonka voimme myös kirjoittaa muotoon<br />

∫ ∫<br />

f(x)dx = f(x(t))x ′ (t)dt. (4.10)<br />

Lyhyesti, tämä vastaa sijoitusta<br />

dx = dx<br />

dt dt<br />

eli siis muuttuja x “ylennetään” muuttujan t funktioksi.<br />

Muuttujan vaihdon jälkeen integraali voi olla helpompi<br />

laskea. Tulos on t’n funktio, mutta saadaan x:n funktioksi<br />

kääntämällä x = x(t).<br />

Valaistaan muuttujan vaihtoa esimerkillä: integroidaan<br />

∫ lnx<br />

x dx.<br />

Sijoitetaan t = lnx, jolloin dt = 1/xdx eli<br />

dx = xdt.<br />

Integraali on siten<br />

∫ lnx<br />

x dx = ∫ t<br />

x xdt = ∫<br />

= 1 2 t2 .<br />

tdt<br />

Sijoitetaan takaisin t = lnx, jolloin saadaan lopulta<br />

∫ lnx<br />

x dx = 1 2 ln2 x.<br />

Integroinnin tulos kannattaa yleensä tarkistaa derivoimalla.<br />

Äskeisessä esimerkissä derivointi antaa<br />

[<br />

d 1<br />

x]<br />

dx 2 ln2 = 1 2 2lnx 1 x = lnx<br />

x<br />

kuten pitääkin.<br />

Ongelma: kuinka löytää sopiva sijoitus t(x)? Löytyy<br />

lukuisia sääntöjä, mutta yleispätevää ei. Kannattaa<br />

yrittää tunnistaa sopiva kokonaisuus integroitavasta<br />

funktiosta.<br />

∫ Esimerkkejä tyypillisistä sijoituksista:<br />

(ax+b) µ dx:<br />

kokeillaan t = ax+b, dt = adx, joten<br />

∫ ∫<br />

(ax+b) µ dx =<br />

t µdt<br />

a<br />

= tµ+1 (ax+b)µ+1<br />

+C = +C<br />

a(µ+1) a(µ+1)<br />

Esim. ∫ (5x−6) 6 dx. Sijoitetaan t = 5x−6,<br />

dt = 5dx ⇒ dx = dt/5, ja<br />

∫ ∫<br />

(5x−6) 6 dx = t 61 5 dt = 1 1<br />

57 t7 +C = 1<br />

35 (5x−6)7 +C<br />

∫Viimeisessä √ vaiheessa sijoitetaan x takaisin.<br />

a2 −x 2 dx:<br />

kokeillaan x = asint, dx = acostdt. (Miksi tämä sijoitus?<br />

Syy: √ √<br />

a 2 −x 2 = a 2 −a 2 sin 2 t = |acost|.)<br />

∫ √a2 ∫<br />

−x 2 dx = acostacostdt<br />

= a 2 ∫<br />

= a2<br />

= a2<br />

2<br />

= a2<br />

2<br />

cos 2 tdt = a2<br />

2<br />

∫<br />

(1+cos2t)dt<br />

2 (t− 1 2 sin2t)+C<br />

(arcsin x a − 1 2 sin(2arcsin x )<br />

a ) +C<br />

(<br />

arcsin x a + x √ )<br />

1− x2<br />

a a 2 +C<br />

22


missä viimeisessä käytettiin cos2t = 2cos 2 t−1 ja<br />

sin2t = 2sintcost = 2sint √ ∫ √ 1−sin 2 t.<br />

a2 +x 2 dx:<br />

√<br />

Tässä toimii x = asinht, sillä 1+sinh 2 x = coshx<br />

(vertaa ∫ edelliseen).<br />

1<br />

e x +e<br />

dx: −x<br />

Kokeillaan y = e x , dy = e x dx ja<br />

∫ ∫<br />

1<br />

e x +e −xdx = 1 1<br />

y +1/y y dy<br />

∫<br />

1<br />

=<br />

1+y 2dy = arctany +C = arctanex +C<br />

∫ √<br />

3x 1−2x2 dx:<br />

Kokeillaan u = 1−2x 2 , du = −4xdx ⇒ xdx = − 1 4 du<br />

∫<br />

3x √ 1−2x 2 dx = − 3 ∫ √udu<br />

4<br />

= − 3 2<br />

43 u3/2 +C = − 1 2 (1−2x2 ) 3/2 +C<br />

Huom: sijoitukset eivät useinkaan ole yksikäsitteisiä.<br />

Esim. yllä voidaan kokeilla myös t = √ 1−2x 2 ,<br />

dt = −2x(1−2x 2 ) −1/2 dx = − 2x t dx ⇒ xdx = −1 2 tdt:<br />

∫<br />

3x √ ∫<br />

1−2x 2 dx = 3t(− 1 2 t)dt<br />

= − 1 2 t3 +C = − 1 2 (1−2x2 ) 3/2 +C<br />

Vinkki: juurilausekkeen sisältävässä integraalissa<br />

kannattaa kokeilla uudeksi muuttujaksi joko juuren<br />

sisäpuolta ∫ tai juurilauseketta kokonaisuudessaan<br />

√dx<br />

1+x<br />

:<br />

Kokeillaan s = √ 1+x, ds = 1 2 (1+x)−1/2 dx ja<br />

∫ ∫<br />

dx<br />

√ = 2ds = 2s+C = 2 √ 1+x+C<br />

1+x<br />

Usein juurilausekkeita sisältävät funktiot eivät ole<br />

∫kuitenkaan integroitavissa alkeisfunktioiden avulla.<br />

√ x+2<br />

x+1+1<br />

dx:<br />

sijoitus t = √ x+1 ⇒ x = t 2 −1, dx = 2tdt:<br />

∫ ∫<br />

x+2 t 2 −1+2<br />

√ dx = 2tdt<br />

x+1+1 t+1<br />

∫ t 3 +t<br />

= 2<br />

t+1 dt<br />

Koska rationaalilausekkeen osoittaja on korkeampaa<br />

kertalukua kuin nimittäjä, voimme “jakaa” lausekkeen<br />

muotoon polynomi + jakojäännös. Tästä tarkemmin<br />

rationaalifunktioiden integroinnin yhteydessä.<br />

Tarkistamalla nähdään että integraali on<br />

= 2<br />

∫ (<br />

t 2 −t+2− 2<br />

t+1<br />

)<br />

dt<br />

= 2( 1 3 t3 − 1 2 t2 +2t−2ln(t+1)+C<br />

= 2 3 (x+1)3/2 −(x+1)+4(x+1) 1/2<br />

−4ln( √ x+1+1)+C<br />

4.2.3 Osittaisintegrointi<br />

Integroimalla tulon derivointisäännön<br />

d<br />

dx [f(x)g(x)] = f′ (x)g(x)+f(x)g ′ (x)<br />

saamme osittaisintegrointisäännön<br />

∫<br />

∫<br />

f ′ (x)g(x)dx = f(x)g(x)− f(x)g ′ (x)dx. (4.11)<br />

Sovelletaan osittaisintegrointia integraaliin ∫ xlnxdx.<br />

Olkoon säännön (4.11) f ′ (x) = x ja g(x) = lnx. Silloin on<br />

f(x) = 1/2x 2 ja g ′ (x) = 1/x ja saamme<br />

∫<br />

xlnxdx = 1 2 x2 lnx− 1 ∫<br />

x 2 1 2 x dx<br />

= 1 2 x2 lnx− 1 ∫<br />

xdx<br />

2<br />

= 1 2 x2 lnx− 1 4 x2 .<br />

Kuten nähtiin, funktiot “f” ja “g” täytyy valita<br />

huolellisesti että osittaisintegrointi johtaisi helpommin<br />

ratkeavaan integraaliin! Väärä valinta johtaa vain<br />

huonompaan ∫ lopputulokseen.<br />

Esim. arctanxdx. Valitaan nyt g(x) = arctanx ja<br />

f ′ (x) ∫ = 1! Tästä seuraa g ′ (x) = ∫1/(1+x 2 ) ja f(x) = x, ja<br />

x<br />

arctanxdx = xarctanx−<br />

1+x 2dx =<br />

xarctanx− 1 2 ln(1+x2 )+C<br />

missä x/(1+x 2 ) on muotoa 1 2 u′ (x)/u(x). Tapaus f ′ = 1<br />

on yleisesti ∫ käytetty osittaisintegroinnissa.<br />

Esim. lnxdx: valitaan jälleen f ′ = 1, g = lnx, jolloin<br />

f = ∫ x, g ′ = 1/x, ja ∫<br />

lnxdx = xlnx− x 1 dx = xlnx−x+C.<br />

∫ x<br />

Esim. xcosxdx: valitaan f ′ = cosx, g = x, jolloin<br />

f = ∫ sinx, g ′ = 1 ja pääsemme ∫ eroon x:n potenssista. Siis<br />

xcosxdx = xsinx− 1sinxdx = xsinx+cosx+C.<br />

Esimerkin vuoksi katsotaan mitä tapahtuisi jos valitaan<br />

f ′ = x, g = cosx: nyt f = x 2 /2, g ′ = −sinx ja<br />

∫<br />

xcosxdx = 1 2 x2 cosx+∫ 1<br />

2 x2 sinxdx<br />

Saatu integraali on pahempi kuin alkuperäinen! Funktiot<br />

siis kannattaa valita huolella.<br />

Osittaisintegrointia ∫ voi joutua toistamaan:<br />

Esim. x 2 sinxdx:kuten edellä, otetaan f ′ = sinx,<br />

g = x 2 , joten f = −cosx, g ′ = 2x ja<br />

23


∫<br />

∫<br />

x 2 sinxdx = −x 2 cosx+<br />

2xcosxdx =<br />

−x 2 cosx+2xsinx+2cosx+C<br />

missä saatu integraali laskettiin jo edellä.<br />

Yleisesti: ∫ Muotoa∫<br />

∫<br />

x m sinxdx, x m cosxdx, x m e x dx<br />

olevat integraalit voidaan laskea osittaisintegroimalla m<br />

kertaa ∫<br />

Esim. sin 2 xdx: otetaan<br />

f ′ ∫= g = sinx ⇒ f = −cosx, ∫g ′ = cosx ja<br />

sin 2 xdx = −cosxsinx+ cos 2 xdx = −cosxsinx+<br />

∫<br />

∫<br />

(1−sin 2 x)dx = −cosxsinx+x− sin 2 xdx<br />

Saimme siis alkuperäisen integraalin, joka voidaan<br />

ratkaista yhtälöstä:<br />

∫<br />

sin 2 xdx = 1 2 (−cosxsinx+x)+C<br />

(Tämän olisi nähnyt nopeamminkin käyttämällä<br />

sin 2 x = 1 2 (1−cos2x))<br />

Yleisemmin: tyyppiä ∫ sin n xdx olevat integraalit voidaan<br />

laskea palautuskaavan avulla: valitaan f ′ = sinx,<br />

g = sin n−1 x, joten f = −cosx, g ′ = (n−1)sin n−2 xcosx<br />

∫<br />

sin n xdx<br />

∫<br />

= −cosxsin n−1 x+(n−1) cos 2 xsin n−2 xdx<br />

∫<br />

= −cosxsin n−1 x+(n−1) (1−sin 2 x)sin n−2 xdx<br />

∫<br />

= −cosxsin n−1 x+(n−1) sin n−2 xdx<br />

∫<br />

−(n−1) sin n xdx<br />

Saimme siis jälleen alkuperäisen integraalin.<br />

Ratkaisemalla ∫ se saamme<br />

sin n xdx = − 1 n cosxsinn−1 x+ n−1 ∫<br />

sin n−2 xdx<br />

n<br />

Näin siis sin n x:n integraali saatiin palautettua sin n−2 x:n<br />

integraaliksi. Toistamalla tätä päästään aina n = 1 tai 0,<br />

ja sin 1 x ja sin 0 x integraalit tunnetaan.<br />

Samalla menetelmällä saamme cos n x:n integraalille<br />

palautuskaavan.<br />

Näin ∫ esim.<br />

sin 4 xdx = − 1 4 cosxsin3 x+ 3 ∫<br />

sin 2 xdx =<br />

4<br />

− 1 4 cosxsin3 x+ 3 4 (−1 2 cosxsinx+ 1 ∫<br />

sin 0 xdx) =<br />

2<br />

usein integroida standardisijoituksella<br />

Tällöin<br />

t = tan x 2<br />

dt = (1+tan 2 x 2 )1 2<br />

dx ⇒ dx =<br />

2 1+t 2dt,<br />

cosx = cos2 x 2 = cos2 x 2 −sin2 x 2<br />

= cos 2 x 2 (1−tan2 x 2 ) = 1−tan2 x 2<br />

1+tan 2 x 2<br />

sinx = 2sin x 2 cos x 2 = 2tan x x 2 cos2 2<br />

tan x 2<br />

= 2<br />

1+tan 2 x = 2t<br />

1+t<br />

2<br />

2<br />

(4.12)<br />

= 1−t2<br />

1+t 2<br />

Tällä ratkeavat kaikki sinx, cosx rationaalifunktiot.<br />

Esim: ∫ ∫<br />

1 1+t<br />

2<br />

∫<br />

sinx dx = 2 1<br />

2t 1+t 2dt = dt = ln|t|+C =<br />

t<br />

ln|tan x 2 |+C<br />

Helpompia sijoituksia usein kuitenkin ovat t = sinx,<br />

t = cosx, t = tanx, joita voi myös kokeilla.<br />

Monet trigonometrisia funktioita sisältävät integraalit<br />

voidaan laskea helpommin kompleksilukujen ja Eulerin<br />

kaavan avulla:<br />

cosx = 1 2 (eix +e −ix ) (4.13)<br />

sinx = 1 2i (eix −e −ix ) (4.14)<br />

e ix = cosx+isinx (4.15)<br />

Näiden käyttö nojautuu siihen että e x :n integraalit ovat<br />

helppoja laskea. Imaginääriyksikö i on vakio, joka<br />

toteuttaa i 2 = −1. Tästä puhutaan tarkemmin<br />

kompleksilukujen yhteydessä.<br />

Esim. ∫<br />

sinaxcosbxdx<br />

=<br />

∫ (<br />

e iax −e −iax<br />

∫<br />

2i<br />

)<br />

e ibx +e −ibx<br />

dx<br />

2<br />

= 1 (e i(a+b)x +e i(a−b)x −e −i(a−b)x −e −i(a+b)x )dx<br />

4i<br />

(<br />

)<br />

= 1 e i(a+b)x<br />

4i i(a+b) + ei(a−b)x<br />

i(a−b) + e−i(a−b)x + e−i(a+b)x +C<br />

i(a−b) i(a+b)<br />

= − 1 cos(a+b)<br />

− 1 cos(a−b)<br />

+C<br />

2 a+b 2 a−b<br />

− 1 4 cosxsin3 x− 3 8 cosxsinx+ 3 8 x+C<br />

4.2.4 Trignonometristen funktioiden integrointi:<br />

jos integroitava funktio sisältää sinx, cosx, se voidaan<br />

24


4.2.5 Rationaalifunktion integrointi<br />

Viimeisenä menetelmänä tarkastelemme muotoa<br />

R = P n<br />

Q m<br />

olevien murtolausekkeiden integrointia, kun P n ja Q m<br />

ovat asteen n ja m polynomeja (siis suurimmat niissä<br />

esiintyvät potenssit ovat m ja n). Jos osoittaja on<br />

asteluvultaan suurempi kuin nimittäja, voidaan tehdä<br />

polynomien jakolasku ja päädytään lausekkeeseen<br />

R = T n−m + S<br />

Q m<br />

,<br />

missä T n−m on astetta n−m oleva osamääräpolynomi ja<br />

S jakojäännöspolynomi. Polynomi T n−m on helppo<br />

integroida, joten jäljelle jää jälleen muotoa P n /Q m oleva<br />

murtofunktio, missä nyt on n < m.<br />

Kaikki muotoa<br />

R = P n<br />

Q m<br />

; (n < m)<br />

olevat rationaalifunktiot voidaan integroida, mikäli<br />

tunnetaan polynomin Q m nollakohdat. Tällöin<br />

rationaalifunktio voidaan hajoittaa osamurtoihin.<br />

Polynomien jakolasku<br />

Kuinka polynomit jaetaan? Esim. jakokulmassa, kuten<br />

numerotkin. Esim:<br />

x+6<br />

x−1 x 2 +5x−3<br />

– x 2 −x<br />

6x−3<br />

– 6x−6<br />

3<br />

Jakolaskun tulos on siis<br />

P(x)<br />

Q(x) = x2 +5x−3<br />

=?<br />

x−1<br />

x 2 +5x−3<br />

x−1<br />

= x+6+ 3<br />

x−1<br />

mikä on helppo tarkistaa laventamalla.<br />

Toinen esimerkki:<br />

2x 4 +6x 2 +2<br />

x 2 +x+1<br />

=?<br />

2x 2 −2x+6<br />

x 2 +x+1 2x 4 +6x 2 +2<br />

– 2x 4 +2x 3 +2x 2<br />

−2x 3 +4x 2 +2<br />

– −2x 3 −2x 2 −2x<br />

6x 2 +2x+2<br />

– 6x 2 +6x+6<br />

−4x−4<br />

Siis<br />

? = 2x 2 −2x+6+ −4x−4<br />

x 2 +x+1<br />

Polynomi in välittömästi integroitavissa. Entä<br />

jakojäännöksenjä jäävä rationaalifunktio?<br />

Jako osamurtoihin<br />

1-kertaiset reaalijuuret: Oletetaan että yhtälöllä<br />

Q(x) = 0 on vain 1-kertaisia reaalijuuria; olkoon nämä<br />

juuret x 1 , x 2 , ...x n (huom: Q:n asteluku on n, joten<br />

löytyy n juurta.)<br />

Tällöin voimme jakaa rationaalilausekkeen osamurtoihin<br />

n<br />

P(x)<br />

Q(x) = ∑ A i<br />

(4.16)<br />

x−x i<br />

i=1<br />

missä A i ovat vakioita. Selvästi oikea puoli voidaan nyt<br />

integroida.<br />

Esim: jaetaan 4/(x 2 −1) osamurtoihin: nimittäjän<br />

nollakohdat ovat x = ±1, mitkä ovat reaalisia ja<br />

yksinkertaisia (x 2 −1 = (x−1)(x+1)). Siis<br />

4<br />

x 2 −1 = a<br />

x−1 + b<br />

x+1<br />

ja määräämme vakiot a ja b siten, että yhtälö on<br />

voimassa kaikilla muuttujan x arvoilla. Kerrotaan yhtälö<br />

(x+1)(x−1):llä, joten<br />

4 = a(x+1)+b(x−1) = (a+b)x+(a−b)<br />

Jotta tämä olisi yhtäsuuri alkuperäisen lausekkeen kanssa,<br />

täytyy olla a+b = 0 ja a−b = 4, joten a = 2 ja b = −2.<br />

Osamurtojen avulla integraali<br />

∫<br />

4<br />

x 2 −1 dx.<br />

on heti laskettavissa:<br />

∫ ∫ ∫<br />

4<br />

x 2 −1 dx = 2<br />

x−1 dx− 2<br />

x+1 dx<br />

= 2ln|x−1|−2ln|x+1|+C<br />

Sovelletaan edellistä integraaliin<br />

= ln(x−1) 2 −ln(x+1) 2 +C<br />

( ) 2 x−1<br />

= ln +C.<br />

x+1<br />

F(x) =<br />

∫ x 3 −2<br />

x 2 −1 dx<br />

Osoittaja on korkeampaa kertalukua, joten tehdään ensin<br />

polynomien jakolasku. Nähdään että<br />

x 3 −2 x−2<br />

x 2 = x+<br />

−1 x 2 −1<br />

25


Jäännöslausekkeen nimittäjän nollakohdat ovat x = ±1,<br />

1-kertaisia. Siis voimme jakaa<br />

Siis<br />

x−2 a<br />

x 2 =<br />

−1 x−1 + b<br />

x+1 ⇒<br />

x−2 = a(x+1)+b(x−1) = (a+b)x+(a−b)<br />

F(x) =<br />

⇒ a+b = 1, a−b = −2<br />

⇒ a = −1/2, b = 3/2<br />

∫ [<br />

x+ −1/2<br />

x−1 + 3/2 ]<br />

dx<br />

x+1<br />

= 1 2 x2 − 1 2 ln|x−1|+ 3 2 ln|x+1|+C<br />

= 1 2 x2 + 1 ∣ ∣∣∣<br />

2 ln (x+1) 3<br />

x−1 ∣ +C<br />

Moninkertainen juuri: Yleisemmässä tapauksessa<br />

polynomilla voi olla moninkertaisia juuria (joiden edelleen<br />

oletamme olevan reaalisia). Yleisesti polynomi Q(x)<br />

voidaan kirjoittaa muotoon<br />

Q(x) = A(x−x 1 ) n1 (x−x 2 ) n2 ...<br />

missä x i ovat polynomin nollakohtia, n i nollakohdan x i<br />

kertaluku ja A vakio. Tässä tapauksessa<br />

osamurtolausekkeella on yleinen muoto<br />

n<br />

P(x)<br />

1<br />

Q(x) = ∑<br />

k=1<br />

n<br />

a<br />

2<br />

k<br />

(x−x 1 ) k + ∑<br />

missä a k , b k ...ovat vakioita.<br />

Esim.<br />

k=1<br />

b k<br />

(x−x 2 ) k +...<br />

1<br />

(x−1) 2 (x+2) = a 1<br />

x−1 + a 2<br />

(x−1) 2 + b<br />

x+2<br />

x = 1 on 2-kertainen nollakohta, ja x = −2 1-kertainen.<br />

Määrätään vakiot kertomalla (x−1) 2 (x−2):lla:<br />

1 = a 1 (x−1)(x+2)+a 2 (x+2)+b(x−1) 2<br />

Tästä voidaan ratkaista vakiot vaatimalla että yhtälön<br />

kaikkien x:n potenssien kertoimet ovat samat molemmin<br />

puolin (x 0 ,x 1 ,x 2 ). Kuitenkin usein nopeampi menetelmä<br />

on sijoittaa x ↦→ x i :<br />

x = 1 ⇒ 1 = a 2 (1+2) ⇒ a 2 = 1 3<br />

x = −2 ⇒ 1 = b(−2−1) 2 = b9 ⇒ b = 1 9<br />

a 1 saadaan esim. x 2 :n kertoimista: 0 = a 1 +b ⇒ a 1 = − 1 9 .<br />

Esimerkki: integroidaan<br />

∫ 3x 2 −37x+83<br />

F(x) =<br />

(x−2) 3 (x+5)<br />

Osoittaja (2) on alempaa astetta kuin nimittäjä (4), joten<br />

voidaan jakaa suoraan osamurtoihin. Nimittäjän<br />

nollakohdat ovat<br />

x 1 = 2,<br />

x 2 = −5,<br />

3-kertainen<br />

1-kertainen<br />

Siis<br />

3x 2 −37x+83<br />

(x−2) 3 (x+5) = a 1<br />

x−2 + a 2<br />

(x−2) 2 + a 3<br />

(x−2) 3 + b<br />

x+5<br />

Lavennetaan nimittäjät pois:<br />

3x 2 −37x+83 = a 1 (x−2) 2 (x+5)<br />

+a 2 (x−2)(x+5)+a 3 (x+5)+b(x−2) 3<br />

Tästä tulee 4 yhtälöä 4 vakiolle (x:n potenssit x 0 ...x 3 ),<br />

jotka ovat suoraan ratkaistavissa.<br />

Määrätään kuitenkin vakiot jälleen käyttämällä<br />

“pikamenetelmää” ja sijoitetaan nollakohdat:<br />

x = 2: 3·4−37·2+83 = a 3 7 ⇒ a 3 = 3<br />

x = −5: 3·25+37·5+83 = −b7 3 ⇒ b = −1<br />

Muut vakiot vaativat muita ehtoja, helpoin lienee x:n<br />

korkeimman potenssin kerroin, mikä voidaan lukea<br />

suoraan:<br />

x 3 : 0x 3 = a 1 x 3 +bx 3 ⇒ a 1 = −b = 1<br />

Jäljelle jää a 2 . Tämän saa esim x 2 :n kertoimesta tai<br />

sijoittamalla esim.<br />

x = 0: 83 = a 1 4·5−a 2 2·5+a 3 5−b8 ⇒ a 2 = −4<br />

Siis saimme a 1 = 1, a 2 = −4, a 3 = 3, b = 1, ja<br />

F(x) =<br />

∫ [ 1<br />

x−2 + −4<br />

(x−2) 2 + 3<br />

(x−2) 3 + −1<br />

x+5<br />

= ln|x−2|+4(x−2) −1 − 3 2 (x−2)−2<br />

=<br />

−ln|x+5|+C<br />

4<br />

x−2 − 3 ∣ 1 ∣∣∣<br />

2(x−2) 2 +ln x−2<br />

x+5∣ +C<br />

Kompleksijuuret: Yleisimmässä tapauksessa polynomin<br />

Q(x) juuret ovat kompleksisia. Esim.<br />

x 2 +1 = 0 ⇒ x = ±i<br />

]<br />

dx<br />

Kompleksijuurisen rationaalifunktion integraalin voi<br />

laskea yllä olevia sääntöjä noudattaen, ottaen vain<br />

huomioon että joistain kertoimista tulee kompleksilukuja.<br />

Näitä varten voidaan myös johtaa omat<br />

integrointisäännöt. Tätä ei käsitellä <strong>MAPU</strong> I:llä<br />

tarkemmin.<br />

4.3 Määrätty integraali<br />

Tarkastellaan suljetulla välillä [a,b] määriteltyä<br />

paloittain jatkuvaa rajoitettua funktiota f(x). Jaetaan<br />

väli [a,b] n yhtäsuureen h-mittaiseen osaan,<br />

ja merkitään<br />

ts.<br />

h = b−a<br />

n<br />

(4.17)<br />

x k = a+kh, (4.18)<br />

x 0 = a,x 1 = a+h,x 2 = a+2h,...,x n = b. (4.19)<br />

26


D<br />

<br />

N<br />

B N <br />

) "<br />

B N " <br />

N = N N N $<br />

Kuva 4.1 Porrassumma<br />

> N %<br />

Jakoon (4.19) liittyvä porrassumma on<br />

n−1<br />

∑<br />

S n = h f(x k ). (4.20)<br />

k=0<br />

Geometrisesti summan jokainen termi<br />

A k = hf(x k )<br />

esittää suorakaiteen, leveydeltään h ja korkeudeltaan<br />

f(x k ), pinta-alaa. Koska jakovälin pituus h on<br />

positiivinen, pinta-ala A k on positiivinen jos f(x k ) on<br />

positiivinen ja negatiivinen jos f(x k ) on negatiivinen.<br />

Summa S n (4.20) approksimoi siten välillä [a,b] käyrän<br />

y = f(x) ja x-akselin väliin jäävää pinta-alaa siten, että<br />

x-akselin yläpuolinen osa lasketaan positiivisena ja<br />

alapuolinen osa negatiivisena. Tämä approksimaatio on<br />

ilmeisestikin sitä tarkempi mitä tiheämpi jako on, ts. mitä<br />

pienempi on h tai mitä suurempi on n.<br />

Voidaan osoittaa, että jaon (4.19) tihentyessä summa<br />

(4.20) lähestyy äärellistä raja-arvoa, ts. raja-arvo<br />

S = lim<br />

n→∞ S n<br />

on olemassa ja äärellinen. Tätä raja-arvoa sanotaan<br />

funktion f(x) määrätyksi integraaliksi välillä [a,b]. Sitä<br />

merkitään kuten<br />

∫ b<br />

a<br />

f(x)dx = lim<br />

n→∞ h n−1<br />

∑<br />

f(x k ). (4.21)<br />

k=0<br />

Geometrisesti määrätty integraali on ilmeisestikin käyrän<br />

y = f(x) ja x-akselin väliin jäävä pinta-ala.<br />

4.3.1 Määrätyn integraalin ominaisuuksia<br />

Tyhjä integroimisväli<br />

Olkoon integrointiväli [a,a], ts. se sisältää vain yhden<br />

pisteen. Tällöin on<br />

∫ a<br />

a<br />

f(x)dx = 0, (4.22)<br />

sillä integraalin määritelmässä (4.21) jakoväli<br />

h = (a−a)/n on aina nolla riippumatta jakopisteiden<br />

lukumäärästä.<br />

Integrointirajojen vaihto<br />

Määrittelimme (4.21) integraalin ”vasemmalta oikealle”eli<br />

integroimisvälissä [a,b] oli a ≤ b. Tällöin jakoväli<br />

h = (b−a)/n on positiivinen. Voimme myös ajatella<br />

integrointia ”oikelta vasemmalle”, jolloin jakovälistä<br />

(4.17) tulee negatiivinen. Tämän huomioonottaen<br />

määrittelemme<br />

∫ b<br />

a<br />

f(x)dx = −<br />

∫ a<br />

b<br />

f(x)dx. (4.23)<br />

Additiivisuus<br />

Jos c on integroimisvälin [a,b] sisäpiste, nähdään<br />

määritelmästä (4.21) että voimme koostaa integraalin<br />

paloista, kuten<br />

∫ b<br />

a<br />

f(x)dx =<br />

∫ c<br />

a<br />

f(x)dx+<br />

∫ b<br />

c<br />

f(x)dx. (4.24)<br />

Ottaen huomioon rajojen vaihto-ominaisuuden (4.23)<br />

näemme, että additiivisuus (4.24) on voimassa olivatpa a,<br />

b ja c mitä tahansa funktion määrittelyalueen pisteitä.<br />

Lineaarisuus<br />

Integraalin määritelmästä (4.21) nähdään, että integrointi<br />

on lineaarinen operaatio, ts.<br />

∫ b<br />

a<br />

[αf(x)+βg(x)]dx = α<br />

∫ b<br />

a<br />

f(x)dx+β<br />

∫ b<br />

a<br />

g(x)dx.<br />

(4.25)<br />

Integroimismuuttujan vaihto<br />

Integraalin ∫ b<br />

f(x)dx arvo (käyrän ja x-akselin välinen<br />

a<br />

pinta-ala) ei ilmeisestikään riipu muuttujasta x. On siis<br />

aivan samantekevää, millä symbolilla funktion<br />

argumenttia merkitään, ts.<br />

∫ b<br />

a<br />

f(x)dx =<br />

∫ b<br />

4.3.2 Kertymäfunktio<br />

Funktion f kertymäfunktio K on<br />

K(x) =<br />

∫ x<br />

a<br />

a<br />

f(s)ds. (4.26)<br />

f(t)dt. (4.27)<br />

Ilmeisestikin pisteessä a kertymäfunktio on nolla, sillä<br />

K(a) =<br />

∫ a<br />

a<br />

f(t)dt = 0.<br />

Kertymäfunktio (4.27) ilmoittaa käyrän ja x-akselin<br />

välisen pinta-alan kohdasta a kohtaan x. Annetaan<br />

kertymäfunktion argumentille (pieni) lisäys ∆x.<br />

27


Vastaava kertymäfunktion muutos<br />

∆K = K(x+∆x)−K(x)<br />

on silloin suuruudeltaan likimain kuvan 4.2 varjostetun<br />

alueen pinta-ala ∆A = ∆xf(x), ts.<br />

K(x+∆x)−K(x) ≈ ∆xf(x).<br />

B N <br />

N , )<br />

= N N , N<br />

Kuva 4.2 Kertymäfunktion derivaatta<br />

Tämä relaatio on ilmeisestikin sitä tarkempi mitä<br />

pienempi ∆x on, joten saamme<br />

eli<br />

K(x+∆x)−K(x)<br />

lim = f(x)<br />

∆x→0 ∆x<br />

K ′ (x) = d<br />

dx<br />

∫ x<br />

a<br />

f(t)dt = f(x). (4.28)<br />

Täten siis kertymäfunktio K(x) on f(x):n<br />

integraalifunktio, katso (4.1), riippumatta määrätyn<br />

integraalin alarajasta a. Kertymäfunktiokin on siis<br />

muotoa<br />

K(x) =<br />

∫ x<br />

a<br />

f(t)dt = F(x)+C.<br />

Integroimisvakio C määräytyy nyt alkuehdosta<br />

eli<br />

K(a) = F(a)+C = 0<br />

C = −F(a),<br />

joten saamme yhteyden määrätyn integraalin<br />

(kertymäfunktion) ja integraalifunktion välille:<br />

∫ b<br />

a<br />

f(x)dx = F(b)−F(a). (4.29)<br />

Tämä ominaisuus on ilmeisestikin voimassa olipa F mikä<br />

hyvänsä funktion f integraalifunktio.<br />

Määrättyjä integraaleja laskettaessa käytetään usein<br />

sijoitusmerkintää:<br />

∫ b<br />

a<br />

f(t)dt = /<br />

b F(t) = F(b)−F(a). (4.30)<br />

a<br />

Esim.<br />

Esim.<br />

∫ 2π<br />

0<br />

Huom: koska d<br />

mukaan<br />

d<br />

dx<br />

Esim.<br />

∫ g(x)<br />

a<br />

∫ b<br />

a<br />

e x dx = /<br />

b e x = e b −e a<br />

a<br />

sinxdx = − 2π<br />

/ cosx = −cos2π +cos0 = 0<br />

0<br />

d<br />

dx<br />

∫ x<br />

dx a<br />

f(t)dt = f(x), on ketjusäännön<br />

f(t)dt = dg d<br />

dxdg<br />

∫ 2x<br />

0<br />

∫ g<br />

a<br />

f(t)dt = f(g(x))g ′ (x)<br />

sinxdx = sin(2x) d2x<br />

dx = 2sin2x<br />

Epäoleellinen integraali on määrätty integraali jossa<br />

ainakin toinen raja = ∞:<br />

∫ ∞<br />

a<br />

f(x)dx ≡ lim<br />

L→∞<br />

∫ L<br />

a<br />

f(x)dx (4.31)<br />

Jos raja-arvo on olemassa, sanotaan että integraali<br />

suppenee, muuten hajaantuu.<br />

Esim.<br />

∫ b<br />

a<br />

∫ ∞<br />

1<br />

b/<br />

1<br />

x 2dx =<br />

∫ ∞<br />

1<br />

a<br />

∞/<br />

1<br />

x 2dx =<br />

−1<br />

x = 1 a − 1 b<br />

1<br />

−1<br />

x = 1<br />

1<br />

x dx = ∞ / lnx hajaantuu<br />

1<br />

Esim.<br />

∫ ∞<br />

dx ∞/<br />

√ = 2 √ x = lim (2√ L−2) hajaantuu<br />

1 x 1<br />

L→∞<br />

∫ 1<br />

0<br />

dx 1/<br />

√ = 2 √ x = 2 x 0<br />

Huom: kuten edellä, määrätty integraali voi olla olemassa<br />

vaikka integroitava → ∞ jossain pisteessä!<br />

Esim. Seuraava kaunis tulos pätee (ei näytetä tässä)<br />

∫ ∞<br />

−∞<br />

Esim. Oletetaan p ≠ −1:<br />

∫ ∞<br />

1<br />

x p dx =<br />

∞/<br />

1<br />

e −x2 = √ π<br />

x p+1<br />

p+1 = 1<br />

p+1 ( lim<br />

L→∞ Lp+1 −1)<br />

28


∫ 1<br />

0<br />

{ ∞ jos p > −1<br />

=<br />

1/(p+1) jos p < −1<br />

x p dx =<br />

1/<br />

0<br />

x p+1<br />

p+1 = 1 (1− lim<br />

p+1 a→0 ap+1 )<br />

{ 1/(p+1) jos p > −1<br />

=<br />

∞ jos p < −1<br />

4.3.3 Muuttujan vaihto määrätyssä integraalissa<br />

Integrointimenetelmät määrätylle integraalille ovat samat<br />

kuin integraalifunktiollekin, mutta lisäksi tulee ottaa<br />

huomioon kuinka integroimisalueen rajat käyttäytyvät!<br />

Integraalissa<br />

I =<br />

∫ b<br />

a<br />

f(x)dx<br />

sijoitetaan x = g(t), jolloin dx = g ′ (t)dt ja kun x = a tai<br />

b, on<br />

Siis<br />

I =<br />

∫ g −1 (b)<br />

0<br />

g −1 (a)<br />

a = g(t a ) ⇒ t a = g −1 (a)<br />

b = g(t b ) ⇒ t b = g −1 (b)<br />

f(g(t))g ′ (t)dt =<br />

∫ tb<br />

t a<br />

f(g(t))g ′ (t)dt (4.32)<br />

Rajojen vaihto on helppo muistaa seuraavasti: jos x:n<br />

rajat ovat a, b, niin korvataan ne vain niitä vastaavilla t:n<br />

arvoilla.<br />

Esim. I = ∫ 1√ 1−x2 dx:<br />

0<br />

sopiva sijoitus on x = sint, ja dx = costdt. Nyt kun<br />

x = 0, on t = 0, ja kun x = 1 on t = π/2. Siis<br />

∫ π/2 √ ∫ π/2<br />

I = 1−sin 2 tcostdt = cos 2 tdt =<br />

∫ π/2<br />

0<br />

π/2<br />

/<br />

1<br />

2 (cos2t+1)dt = 1<br />

2 (1 2 sin2t+t) = π 4<br />

4.3.4 Määrätyn integraalin osittaisintegrointi<br />

Kuten arvata saattaa, on osittaisintegrointisääntö<br />

määrätylle integraalille<br />

∫ b<br />

a<br />

Esim. I =<br />

f ′ (x)g(x)dx = /<br />

b f(x)g(x)−<br />

a<br />

∫ ∞<br />

0<br />

xe −x dx:<br />

0<br />

0<br />

∫ b<br />

a<br />

f(x)g ′ (x)dx (4.33)<br />

olkoon f ′ = e −x , g = ∫x, joten f = −e −x , g ′ = 1:<br />

∞/ ∞<br />

∞/<br />

I = x(−e −x )− (−e −x )dx = (0−0)− e −x =<br />

0<br />

−(0−1) = 1<br />

0<br />

0<br />

Esim. I =<br />

∫ 1<br />

0<br />

lnxdx:<br />

valitaan f ′ = 1 ja g = lnx, joten f = x ja g ′ = 1/x:<br />

I = /<br />

1 xlnx−<br />

0<br />

∫ 1<br />

0<br />

x 1 x dx = (0−0)− /<br />

1 x = 1<br />

Huomaa että tässä on käytetty “0ln0 = 0”, sillä<br />

alna = 0.<br />

lim<br />

a→0<br />

Derivointi parametrin suhteen<br />

Usein näppärä keino integraalien sieventämisessä on<br />

derivoida integroitavaa jonkun parametrin suhteen: jos<br />

f(x,t) on kahden muuttujan funktio, voimme määritellä<br />

jolloin<br />

I(x) =<br />

I ′ (x) =<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

f(x,t)dt<br />

0<br />

∂f(x,t)<br />

dt<br />

∂x<br />

Tässä osittaisderivaatta ∂f(x,t)/∂x tarkoittaa että f<br />

derivoidaan muuttujan x suhteen pitäen t vakiona.<br />

Esim. halutaan integroida<br />

∫ ∞<br />

0<br />

t 2 e −at dt<br />

Tämän voisi integroida osittain, mutta vaihtoehtoisesti<br />

voimme määritellä<br />

I(a) ≡<br />

I ′ (a) =<br />

I ′′ (a) =<br />

∫ ∞<br />

0<br />

∫ ∞<br />

0<br />

∫ ∞<br />

0<br />

e −at dt =<br />

∞/<br />

0<br />

− e−at<br />

a<br />

(−te −at )dt = − 1 a 2<br />

t 2 e −at dt = 1 a 3<br />

= 1 a<br />

Derivointi parametrin suhteen korvaa usein<br />

osittaisintegrointia, mutta voi olla huomattavasti<br />

nopeampi.<br />

Käyrän pituus<br />

Funktio y = f(x) määrittelee (x,y) -tason käyrän kun<br />

x ∈ [a,b]. Kun x muuttuu dx:n verran, y muuttuu<br />

dy = dy<br />

dx = f′ (x)dx:n verran.<br />

ds<br />

dy<br />

Kuva 4.3<br />

dx<br />

Tästä saadaan käyrän pituuden differentiaali<br />

ds = √ (dx) 2 +(dy) 2 = √ 1+[f ′ (x)] 2 dx<br />

ja siis koko käyrän (funktion kuvaajan) pituus<br />

L =<br />

∫ b<br />

a<br />

√<br />

1+[f′ (x)] 2 dx<br />

29


Esimerkki: olkoon y = √ 1−x 2 , kun 0 ≤ x ≤ 1 (ympyrän<br />

neljännes). Mikä on kaaren pituus?<br />

L =<br />

=<br />

=<br />

=<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

√<br />

1+y′ (x) 2 dx<br />

√<br />

(<br />

−x 2dx<br />

1+ √<br />

1−x 2)<br />

√<br />

1+ x2<br />

1−x 2dx<br />

dx<br />

√<br />

1−x<br />

2<br />

= /<br />

1 arcsin(x) = π<br />

0 2<br />

mikä on tietysti tunnettu tulos.<br />

Pyörähdyskappaleen pinta-ala ja tilavuus<br />

z<br />

y<br />

r<br />

x<br />

ja tilavuus<br />

V =<br />

= π<br />

∫ R<br />

−R<br />

[√ ] 2dx<br />

∫ R<br />

π R2 −x 2 = π (R 2 −x 2 )dx<br />

R/<br />

(R 2 x− 1 3 x3 ) = 4 3 πR3<br />

−R<br />

Integroinnin apuvälineet<br />

−R<br />

Kun omat neuvot eivät riitä, voi turvautua apuvälineisiin.<br />

Integraaleja on taulukoitu lukuisiin kirjoihin, joista paras ja<br />

tunnetuin lienee Gradshteyn and Ryzhik: Table of Integrals,<br />

Series, and Products.<br />

Toinen mahdollisuus on käyttää symboliseen laskentaan tehtyjä<br />

tietokoneohjelmia. Näistä tunnetuimpia ovat Maple ja<br />

Mathematica. Nämä osaavat huomattavasti enemmän<br />

integrointitemppuja kuin <strong>MAPU</strong>lla on kuvattu.<br />

Jos näitä ei ole saatavilla, löytyy Mathematicaan pohjautuva<br />

ilmaiseksi käytettävä “laskin” www-sivulta<br />

www.wolframalpha.com (ainakin v. 2010). Tämäkin tuntee<br />

kaikki integointitemput mitkä Mathematicakin, ja sen avulla<br />

kannattaa muun muassa tarkistaa <strong>MAPU</strong>n kotitehtävät.<br />

Oletetaan että käyrä r = f(x) > 0 pyörähtää x-akselin<br />

ympäri. Kun rajoitutaan a ≤ x ≤ b, käyrä rajaa<br />

pyörähdyskappaleen pinnan, päädyissä x = a, x = b<br />

olevien ympyröiden kanssa. Nyt käyrän pyyhkäisemän<br />

pinnan alan differentiaali on<br />

joten alaksi saadaan<br />

A =<br />

dA = 2πrds = 2πf(x) √ 1+[f ′ (x)] 2 dx<br />

∫ b<br />

a<br />

2πf(x) √ 1+f ′ (x) 2 dx+πf(a) 2 +πf(b) 2<br />

Samoin pyörähdyskappaleen tilavuuden differentiaali on<br />

(ympyräkiekon tilavuus)<br />

ja tilavuudeksi tulee<br />

dV = πr 2 dx = πf(x) 2 dx<br />

V =<br />

∫ b<br />

a<br />

π[f(x)] 2 dx<br />

Esim. Ympyrän kaari r = √ R 2 −x 2 , −R ≤ x ≤ R,<br />

pyörähtää x-akselin ympäri määritellen<br />

pyörähdyskappaleen (mikä on tässä tapauksessa tietysti<br />

pallo). Sen pinta-ala on<br />

A =<br />

=<br />

∫ R<br />

−R<br />

∫ R<br />

−R<br />

2π √ (<br />

R 2 −x<br />

√1+<br />

2 −x<br />

) 2dx<br />

√<br />

R2 −x 2<br />

2πRdx = 2πR /<br />

R x = 4πR 2<br />

−R<br />

30


4.3.5 Numeerinen integrointi<br />

puolisuunnikassäännöllä<br />

Usein integraalifunktiota ei osata (tai voida) laskea, vaan<br />

joudutaan turvautumaan integraalin numeeriseen<br />

laskemiseen. Lasku perustuu määrätyn integraalin<br />

tulkintaan pinta-alana, lasketaan siis porrassumman<br />

kaltainen summa äärellisellä askelvälillä. Porrassumma<br />

(4.20) ei kuitenkaan ole käytännössä suositeltava tapa<br />

laskea integraalia, sillä se on hyvin tehoton.<br />

Yksinkertaisin suositeltava tapa on käyttää ns.<br />

puolisuunnikassääntöä: Olkoon laskettavana integraali<br />

∫ b<br />

a<br />

f(x)dx<br />

• Jaetaan integroimisväli (a,b) N:ään tasaväliin<br />

x 0 ,x 1 ,...x N (tässä x 0 = a ja x N = b). Yhden välin<br />

pituus on siis h = (b−a)/N.<br />

y<br />

f(x)<br />

x0 x1 x2 xN<br />

Kuva 4.4<br />

• Approksimoidaan integraalia summaamalla kunkin<br />

välin ala puolisuunnikkaan pinta-alan avulla:<br />

∫ xi+1<br />

x i<br />

f(x)dx ≈ h 1 2 [f(x i)+f(x i+1 )]<br />

f( x i+1 )<br />

f( x i )<br />

x i x i+1<br />

Kuva 4.5 Puolisuunnikkaan ala<br />

x<br />

tässä x 1 = x i , x 2 = x i+1 ):<br />

V(h) =<br />

=<br />

∫ x2<br />

x 1<br />

f(x)dx− h 2 [f(x 1)+f(x 2 )]<br />

∫ x1+h<br />

x 1<br />

[f(x 1 )+f ′ (x 1 )(x−x 1 )<br />

+ 1 2 f′′ (x 1 )(x−x 1 ) 2 +...<br />

− h 2 [f(x 1)+[f(x 1 )+f ′ (x 1 )h<br />

+ 1 ]<br />

2 f′′ (x 1 )h 2 +...]<br />

= f(x 1 )h+f ′ (x 1 ) 1 2 h2 + 1 2 f′′ (x 1 ) 1 3 h3<br />

− h 2 [2f(x 1)+f ′ (x 1 )h+ 1 2 f′′ (x 1 )h 2 ]+O(h 4 )<br />

= − 1<br />

12 h3 f ′′ (x 0 )+O(h 4 )<br />

Siis virhe yhden välin pinta-alassa on O(h 3 ). Koko<br />

summassa virhe tulee siis olemaan<br />

V = NO(h 3 ) = O(Nh 3 ) = O( 1<br />

N 2)<br />

sillä h = (b−a)/N = O(1/N).<br />

Siis: jos lisäämme jakopisteiden määrää tekijällä 2<br />

(N → 2N), virhe pienenee tekijällä 4.<br />

Harjoitustehtävä: mikä virhe tulee jos arvoidaan<br />

integraalia summalla suorakaiteita, eli<br />

∫ xi+1<br />

x i<br />

f(x)dx = hf(x i ) ?<br />

Hiven tarkempi tulos integroinnissa saadaan jos<br />

käytetään puolisuunnikassäännön sijasta Simpsonin<br />

sääntöä: siinä arvoidaan funktiota sovittamalla siihen<br />

parabeli (toisen asteen käyrä). Tässä tapauksessa virhe<br />

koko integraalissa on vain O(1/N 4 ).<br />

Vielä hienostuneemmat menetelmät eivät jaa<br />

integroimisaluetta tasaväleihin, vaan tihentävät jakoa<br />

niissä kohdissa missä funktio muuttuu nopeimmin.<br />

Lisätietoja numeerisesta integroinnista saa erinomaisesta<br />

kirjasta Numerical Recipes (Cambridge University<br />

Press), ja sen verkkosivulta www.nr.com. Tämä kirja on<br />

jokaisen numeriikkaa harrastavan perusteos!<br />

• Näin siis koko integraaliksi tulee<br />

∫ b<br />

a<br />

f(x)dx ≈ h N−1<br />

2 f(x ∑<br />

0)+h f(x k )+ h 2 f(x N)<br />

k=1<br />

Kuinka suuri virhe tehdään? Tätä voidaan estimoida<br />

kehittämällä yhden välin virhe Taylorin sarjaksi (olkoon<br />

31


5. Kompleksiluvut<br />

5.1 Lukualueen laajennus<br />

Luonnolliset luvut N : 1,2,3,...<br />

Luonnollisille luvuille on määritelty<br />

• yhteenlasku: a+b ∈ N, kun a,b ∈ N.<br />

• kertolasku: a·b ∈ N, kun a,b ∈ N.<br />

Kysymys: Löydetäänkö aina sellainen x ∈ N, että<br />

a+x = b kun a,b ∈ N?<br />

Vastaus: ei aina (esim. a = 5,b = 2).<br />

Laajennetaan lukualuetta lisäämällä 0 ja negatiiviset<br />

luvut.<br />

Kokonaisluvut Z : ...,−2,−1,0,1,2,...<br />

Kokonaisluvuille on määritelty<br />

• yhteenlasku: a+b ∈ Z, kun a,b ∈ Z.<br />

• vähennyslasku: a−b = a+(−b) ∈ Z, kun a,b ∈ Z.<br />

• kertolasku: a·b ∈ Z, kun a,b ∈ Z.<br />

Vähennyslasku a−b vastaa kysymykseen: paljonko on x,<br />

jos x+b = a.<br />

Kysymys: Onko olemassa sellainen x ∈ Z, että a·x = b,<br />

kun a,b ∈ Z?<br />

Vastaus: ei aina (esim. a = 3,b = 2).<br />

Laajennetaan lukualuetta lisäämällä murtoluvut.<br />

Rationaaliluvut Q : a ;a,b ∈ Z,b ≠ 0<br />

b<br />

Rationaaliluvuille on määritelty<br />

• yhteenlasku: a+b ∈ Q, kun a,b ∈ Q.<br />

• vähennyslasku: a−b ∈ Q, kun a,b ∈ Q.<br />

• kertolasku: a·b ∈ Q, kun a,b ∈ Q.<br />

• jakolasku: a b<br />

∈ Q, kun a,b ∈ Q ja b ≠ 0.<br />

Jakolasku a b<br />

vastaa kysymykseen: paljonko on x, kun<br />

x·b = a?<br />

Kysymys: Onko olemassa sellainen x ∈ Q, että x·x = a,<br />

kun a ∈ Q ja a > 0?<br />

Vastaus: ei aina (esim. a = 2).<br />

Laajennetaan lukualuetta lisäämällä irrationaaliluvut.<br />

Reaaliluvut R<br />

Reaaliluvuille on määritelty<br />

• yhteenlasku: a+b ∈ R, kun a,b ∈ R.<br />

• vähennyslasku: a−b ∈ R, kun a,b ∈ R.<br />

• kertolasku: a·b ∈ R, kun a,b ∈ R.<br />

Reaalilukujen<br />

• jakolasku: a b<br />

∈ R, kun a,b ∈ R ja b ≠ 0.<br />

joukosta löytyy myös vastaus kysymykseen<br />

paljonko on x, kun x·x = a ja a ≥ 0.<br />

Kysymykseen, onko olemassa sellainen x ∈ R, että<br />

x·x = a kun a < 0, vastaus on edelleenkin kielteinen.<br />

Laajennetaan lukualuetta kompleksilukuihin C lisäämällä<br />

imaginääriluvut.<br />

5.2 Kompleksilukujen esitys ja algebra<br />

5.2.1 Imaginääriyksikkö<br />

Määritellään imaginääriyksikkö i siten, että<br />

i 2 = −1. (5.1)<br />

Jos nyt a ∈ R on jokin reaaliluku, niin ia on<br />

imaginääriluku, joka toteuttaa relaation<br />

(ia) 2 = i 2 a 2 = −1·a 2 = −a 2 .<br />

Kompleksiluku z ∈ C voidaan esittää mm. reaaliluvun ja<br />

imaginääriluvun summana<br />

z = a+ib, (5.2)<br />

missä a,b ∈ R. Sanotaan, että a on luvun z reaaliosa ja b<br />

sen imaginääriosa. Kompleksiluvun reaaliosaa ja<br />

imaginäärisosaa merkitään kuten<br />

Rez = a<br />

Imz = b,<br />

kun z = a+ib.<br />

Tutustuimme kompleksilukuun 2. asteen yhtälön<br />

ratkaisuissa: yhtälön<br />

ratkaisut ovat<br />

ax 2 +bx+c = 0<br />

x = 1<br />

2a (−b±√ b 2 −4ac)<br />

Jos b 2 ≥ 4ac, ratkaisut ovat reaalisia.<br />

Jos b 2 < 4ac, niin ( √ ) 2 < 0 ja<br />

x = 1<br />

2a (−b±√ −(4ac−b 2 )) = 1<br />

2a (−b±i√ 4ac−b 2 )<br />

Esim.<br />

z 2 −2z +5 = 0<br />

(5.3)<br />

ratkaisut ovat<br />

z = 1 2 (2±√ 4−20) = 1 2 (2±√ −16) = 1±2i.<br />

Kompleksiluku z on (puhtaasti) reaalinen, jos Imz = 0 ja<br />

(puhtaasti) imaginäärinen, jos Rez = 0.<br />

Kompleksiluvut ovat yhtäsuuria, jos niiden reaali- ja<br />

imaginääriosat ovat yhtäsuuria, ts. u = v tarkoittaa, että<br />

Reu = Rev ja Imu = Imv. Kompleksiluku on nolla jos ja<br />

32


vain jos sen reaali- ja imaginääriosat ovat nollia, ts. z = 0<br />

on sama kuin Rez = Imz = 0.<br />

Kompleksiluvun z = a+ib liittoluku eli<br />

kompleksikonjugaatti z ∗ on<br />

z ∗ = a−ib, (5.4)<br />

ts. konjugoitaessa vaihdetaan imaginääriosan merkki.<br />

Kompleksiluvun z normi |z| 2 on<br />

|z| 2 = zz ∗ = (Rez) 2 +(Imz) 2 . (5.5)<br />

Normi on siis aina ei-negatiivinen ja nolla vain jos luku<br />

itse on nolla.<br />

z ∗ on fyysikoiden käyttämä merkintä. Matemaatikot piirtävät<br />

kompleksikonjugoidun suureen päälle viivan, ¯z.<br />

√<br />

Normiksi kutsutaan silloin tällöin myös suuretta |z| 2 , jolloin<br />

siitä käytetään merkintää |z|.<br />

Insinöörit puolestaan merkitsevät imaginääriyksikköä symbolilla j.<br />

5.2.2 Algebra<br />

Kompleksilukujen algebra saadaan soveltamalla<br />

reaalilukujen algebraa summiin z = a+ib muistaen<br />

kuitenkin, että i 2 = −1. Tarkastellaan kompleksilukuja<br />

u = a+ib ja v = c+id.<br />

Yhteenlasku<br />

Summa u+v voidaan muodostaa kuten<br />

eli<br />

u+v = a+ib+c+id = (a+c)+i(b+d),<br />

Re(u+v) = Reu+Rev<br />

Im(u+v) = Imu+Imv.<br />

Vähennyslasku<br />

Vastaavasti vähennyslasku antaa<br />

u−v = a+ib−c−id = (a−c)+i(b−d)<br />

(5.6)<br />

Jakolasku<br />

Jakolasku on hieman monimutkaisempi. Lavennetaan<br />

ensin murtolauseke u/v nimittäjän<br />

kompleksikonjugaatilla, jolloin päädytään reaaliseen (ja<br />

positiiviseen) nimittäjään:<br />

u<br />

v = a+ib<br />

c+id = (a+ib)(c−id)<br />

(c+id)(c−id) .<br />

Normin laskusäännön (5.5) mukaan nimittäjä on nyt<br />

ja osoittaja<br />

|v| 2 = vv ∗ = (c+id)(c−id) = c 2 +d 2 ∈ R<br />

(a+ib)(c−id) = ac+bd+i(bc−ad).<br />

Tämän jälkeen jakolasku on helppoa, jaetaan vain<br />

osoittajan reaali- ja imaginääriosat reaalisella<br />

nimittäjällä, ts.<br />

Re u v<br />

Im u v<br />

= (Reu)(Rev)+(Imu)(Imv)<br />

|v| 2<br />

= (Imu)(Rev)−(Reu)(Imv)<br />

|v| 2 .<br />

Vastaavasti kompleksiluvun z käänteisluku z −1 = 1 z<br />

saadaan seuraavasti: jos z = x+iy, niin<br />

z −1 1<br />

=<br />

x+iy = x−iy<br />

(x+iy)(x−iy)<br />

= x−iy<br />

x 2 +y 2 = x<br />

|z| 2 −i y<br />

|z| 2<br />

Esim. Luvun z = 1+2i käänteisluku on<br />

z −1 = 1<br />

1+2i = 1−2i<br />

(1+2i)(1−2i) = 1 5 −i2 5<br />

(5.9)<br />

eli<br />

Re(u−v) = Reu−Rev<br />

Im(u−v) = Imu−Imv.<br />

(5.7)<br />

Esim. Olkoot u = 3−i2 ja v = −1+i. Laske u+v,<br />

u−v, uv ja u/v<br />

Yhteen- ja vähennyslasku antavat<br />

Kertolasku<br />

Kahden kompleksiluvun tulo puolestaan on<br />

u+v = 3−i2+(−1+i) = 3−1+i(−2+1)<br />

= 2−i<br />

tai<br />

u·v = (a+ib)(c+id)<br />

= ac+(ib)(id)+(ib)c+a(id)<br />

= ac+i 2 bd+i(bc+ad)<br />

= (ac−bd)+i(ad+bc)<br />

Re(uv) = (Reu)(Rev)−(Imu)(Imv)<br />

Im(uv) = (Reu)(Imv)+(Rev)(Imu).<br />

(5.8)<br />

ja<br />

u−v = 3−i2−(−1+i) = 3+1+i(−2−1)<br />

= 4−3i,<br />

Kertolasku taas antaa<br />

uv = (3−i2)(−1+i) = −3+3i+2i−2ii<br />

= −1+5i<br />

33


O<br />

H<br />

N<br />

<br />

H<br />

<br />

ja jakolasku<br />

u<br />

v<br />

= 3−2i<br />

−1+i = 3−2i<br />

−1+i · −1−i<br />

−1−i = −3−3i+2i−2<br />

1+i−i+1<br />

= −5−i = − 5 2 2 − 1 2 i.<br />

5.2.3 Kompleksitaso<br />

Kompleksiluku voidaan esittää myös x,y-tason pisteinä<br />

(vektoreina): z = x+iy ↦→ (x,y) = (Rez,Imz). Tässä siis<br />

y-akselin yksikkönä on i.<br />

Tasoa, jossa kompleksilukuja esitetään sanotaan<br />

kompleksitasoksi. Tason akseleita kutsutaan yleensä<br />

reaali- ja imaginääriakseleiksi. Kääntäen, jokaista<br />

(kompleksi)tason pistettä vastaa kompleksiluku.<br />

1 <br />

Kuva 5.1 Kompleksitaso<br />

N O <br />

4 A <br />

Kuvassa 5.1 r on pisteen etäisyys origosta. Pythagoraan<br />

teoreeman mukaan on<br />

ja<br />

Suure<br />

r 2 = x 2 +y 2 = |z| 2<br />

r = |z| = √ (Rez) 2 +(Imz) 2 = √ zz ∗ . (5.10)<br />

|z| = √ zz ∗ = √ |z| 2<br />

on kompleksiluvun z itseisarvo, luvun suuruus. Joskus<br />

puhutaan myös modulista ja käytetään merkintää<br />

|z| = modz.<br />

Kun z on puhtaasti reaalinen, on<br />

|z| = √ (Rez) 2 = |Rez|<br />

eli itseisarvon määritelmä yhtyy tässä tapauksessa<br />

reaaliluvun itseisarvon määritelmään.<br />

Huom: kompleksikonjugointi z → z ∗ vastaa heijastusta<br />

x-akselin suhteen: iy → −iy.<br />

Kompleksitason pisteiden esityksessä voidaan käyttää<br />

myös napakoordinaatteja, ns. polaariesitystä:<br />

O H I E B<br />

1 <br />

B<br />

N H ? I B<br />

Kuva 5.2 Polaariesitys<br />

Polaariesityksessä (r,φ)<br />

H ? I B H I E B <br />

4 A <br />

• r on kompleksiluvun itseisarvo |z| = modz,<br />

• φ on luvun z vaihekulma eli argumentti.<br />

Polaariesityksessa kompleksiluvun z = x+iy koordinaatit<br />

ovat<br />

r = |z| = √ x 2 +y 2<br />

φ = arctan y x . (5.11)<br />

Jotta reaali- ja imaginääriosien merkit saataisiin oikein,<br />

on tällä kertaa arkustangenttia pidettävä<br />

monikäsitteisenä funktiona. Kaikista mahdollisista<br />

kulman φ = arctan y x<br />

arvoista on valittava se, jolla sekä<br />

cosφ ja x keskenään että sinφ ja y keskenään ovat saman<br />

merkkisiä. Kääntäen napakoordinaateista (r,φ) päästään<br />

luvun z = x+iy karteesisiin koordinaatteihin kaavoilla<br />

34<br />

ts.<br />

x = rcosφ<br />

y = rsinφ,<br />

(5.12)<br />

z = x+iy = rcosφ+irsinφ = re iφ (5.13)<br />

missä viimeisessä kohdassa käytettiin Eulerin kaavaa<br />

e iφ = cosφ+isinφ. (5.14)<br />

Tämä osoitetaan myöhemmin.<br />

Esim. Luku 2+2 √ 3i polaariesityksessä<br />

Nyt moduli on<br />

Vaihekulma on<br />

Nyt siis<br />

r = |2+2 √ 3i| = √ 4+12 = 4.<br />

φ = arctan 2√ 3<br />

2<br />

= arctan √ 3 = π 3 .<br />

2+2 √ 3i = 4e iπ/3 = 4cos π 3 +4isin π 3 .<br />

Esim. Luku −2+2 √ 3i polaariesityksessä<br />

Kuten edellä, moduli on r = 4. Vaihekulma on nyt<br />

φ = arctan 2√ 3<br />

−2 = arctan(−√ 3).


Tangetille on voimassa<br />

tan(φ+nπ) = tanφ.<br />

Jos siis φ = arctanx, niin on myös φ+nπ = arctanx.<br />

Vaihekulmaa määrättäessä on näistä mahdollisista<br />

arvoista valittava sellainen, että reaali- ja<br />

imaginäärisosien merkit tulevat oikein. Nyt vaihekulma on<br />

φ = arctan(− √ 3)+nπ = − π 3 +nπ.<br />

Reaaliosa on negatiivinen ja imaginääriosa positiivinen,<br />

joten vaihekulma on välillä π/2 ≤ φ ≤ π, ts. on valittava<br />

n = 1 eli<br />

Polaariesitys on siis<br />

φ = 2π 3 .<br />

−2+2 √ 3i = 4e i2π/3 = 4cos 2π 3 +4sin 2π 3 i.<br />

Huom: polaariesitys helpottaa kompleksilukujen kerto- ja<br />

jakolaskuja:<br />

Olkoon z 1 = r 1 e iθ1 ja z 2 = r 2 e iθ2 . Nyt<br />

z 1 z 2 = r 1 r 2 e i(θ1+θ2)<br />

normaalien eksponenttifunktioiden laskusääntöjen<br />

mukaan. Samoin<br />

z 1<br />

z 2<br />

= r 1<br />

r 2<br />

e i(θ1−θ2)<br />

Myös potenssit ovat helppoja:<br />

z n = (re iθ ) n = r n e inθ<br />

Sen sijaan yhteen- ja vähennyslasku on hankala suorittaa<br />

polaariesityksessä.<br />

Huom: jos z = re iθ , niin z ∗ = re −iθ .<br />

z ∗ z = re −iθ re iθ = r 2 = |z| 2 .<br />

5.3 Kompleksifunktiot<br />

Tarkastellaan funktiota f(z), joka kuvaa kompleksiluvun<br />

z kompleksiluvuksi w, ts.<br />

Sanotaan, että f(z) on<br />

w = f(z).<br />

• yksiarvoinen funktio, jos ja vain jos jokainen z<br />

kuvautuu täsmälleen yhdeksi luvuksi w.<br />

• moniarvoinen funktio, jos ja vain jos jotkin<br />

muuttujan z arvot kuvautuvat useammaksi kuin<br />

yhdeksi luvuksi w.<br />

Esimerkiksi w = f(z) = z 2 on yksiarvoinen. Funktio<br />

w = f(z) = z 1/2 on puolestaan moniarvoinen<br />

(kaksiarvoinen), mm. piste z = 1 kuvautuu pisteiksi<br />

w = ±1.<br />

Ellei toisin mainita, funktio tarkoittaa jatkossa<br />

yksiarvoista funktiota.<br />

Tulkinta<br />

Olkoon w = f(z) jokin kompleksifunktio. Kirjoitetaan<br />

ja<br />

Nyt<br />

w = u+iv, u,v ∈ R<br />

z = x+iy, x,y ∈ R.<br />

w = u+iv = f(z) = f(x+iy),<br />

ts. funktion reaali- ja imaginääriosat,<br />

u = u(x,y) ja v = v(x,y),<br />

ovat muuttujien x ja y funktioita. Voidaan siis ajatella,<br />

että kompleksifunktio kuvaa kompleksitason (z-tason)<br />

pisteen (x,y) toisen kompleksitason (w-tason) pisteeksi<br />

(u,v).<br />

Funktion reaali- ja imaginääriosat<br />

Tehtävänä on nyt jakaa funktio f(z) reaali- ja<br />

imaginääriosiinsa. Polynomien ja polynomien<br />

murtolausekkeiden tapauksessa kompleksilukujen algebra<br />

määrää jaon. Esimerkiksi w = z 2 jakautuu reaali- ja<br />

imaginääriosiinsa kuten<br />

joten<br />

w = u+iv = (x+iy) 2 = x 2 −y 2 +2ixy,<br />

u = x 2 −y 2<br />

v = 2xy.<br />

Usein halutaan jatkaa (analyyttisesti) reaalimuuttujan<br />

reaaliarvoinen funktio kompleksitasoon siten, että<br />

alkuperäinen ja jatkettu funktio yhtyvät reaaliakselilla.<br />

Jos reaalifunktio f(x) voidaan esittää Taylorin sarjana<br />

(3.3), korvataan sarjassa reaalimuuttuja x<br />

kompleksimuuttujalla.<br />

Koska kompleksiluvut noudattavat samoja laskusääntöjä<br />

kuin reaaliluvut, säilyttää analyttinen jatkaminen<br />

funktionaaliset ominaisuudet. Esimerkiksi jatkettu<br />

eksponenttifunktio toteuttaa edelleenkin relaation<br />

e z1+z2 = e z1 e z2 , z 1 ,z 2 ∈ C.<br />

Samoin trigonometristen funktioiden yhteenlaskukaavat<br />

ovat voimassa jatketuillekin funktioille.<br />

35


Eulerin kaava<br />

Tarkastellaan eksponenttifunktiota w = e z . Koska<br />

jatkaminen säilyttää funktionaaliset ominaisuudet, on<br />

w = e x+iy = e x e iy .<br />

Tässä e x on vanha tuttu reaalinen eksponenttifunktio.<br />

Selvitetään siis, mitä on e ix , kun x ∈ R.<br />

Eksponenttifunktion Taylorin sarja (3.6) on<br />

e z = 1+z + z2<br />

2! + z3<br />

3! + z4<br />

4! + z5<br />

+···. (5.15)<br />

5!<br />

Sijoitetaan tähän z = ix. Imaginääriluvun ix potenssit<br />

ovat<br />

(ix) 2 = i 2 x 2 = −x 2<br />

(ix) 3 = ix(ix) 2 = −ix 3<br />

(ix) 4 = ix(ix) 3 = −i 2 x 4 = x 4<br />

(ix) 5 = ix(ix) 4 = ix 5<br />

(ix) 2n<br />

.<br />

= (−1) n x 2n<br />

(ix) 2n+1 = i(−1) n x 2n+1<br />

.<br />

Sijoitetaan nämä potenssit Taylorin kehitelmään (5.15),<br />

jolloin saadaan<br />

e ix<br />

= 1+ix− x2<br />

2! −ix3 3! + x4<br />

4! +ix5 5! +···<br />

= 1− x2<br />

2! + x4<br />

4! +···<br />

+i<br />

(x− +···)<br />

x3<br />

3! + x5<br />

.<br />

5!<br />

Vertaamalla reaali- ja imaginääriosia Taylorin sarjoihin<br />

(3.6) todetaan niiden esittävän kosini- ja sinifunktioita.<br />

Päädymme Eulerin kaavaan<br />

e ix = cosx+isinx. (5.16)<br />

Yleisesti kompleksinen eksponenttifunktio on siten<br />

e z = e x (cosy +isiny), (5.17)<br />

kun z = x+iy.<br />

Muistetaan, että polaariesityksessa (5.13) kompleksiluku<br />

z voitiin kirjoittaa muotoon<br />

z = rcosφ+irsinφ.<br />

josta, Eulerin kaavaa (5.16) soveltaen saamme<br />

standardimuodon polaariesitykselle:<br />

z = re iφ , (5.18)<br />

missä siis r = |z| ja φ = arctanImz/Rez. Kuten edellä<br />

mainittiin, polaariesityksen avulla kompleksilukujen<br />

kerto- ja jakolaskut ovat suoraviivaisia:<br />

ja<br />

z 1 z 2 = r 1 r 2 e i(φ1+φ2)<br />

= r 1 r 2 (cos(φ 1 +φ 2 )+isin(φ 1 +φ2))<br />

z 1<br />

z 2<br />

= r 1<br />

r 2<br />

e i(φ1−φ2)<br />

= r 1<br />

r 2<br />

(cos(φ 1 −φ 2 )+isin(φ 1 −φ2)).<br />

Potenssifunktiot<br />

Kertolaskun erikoistapauksena saadaan<br />

potenssiinkorotukselle De Moivren kaavana tunnettu<br />

lauseke<br />

z n = r n (cosφ+isinφ) n = r n e niφ<br />

= r n (cosnφ+isinnφ).<br />

(5.19)<br />

Polaariesityksen napakulma ei ole yksikäsitteinen. Jos<br />

nimittäin φ on luvun z napakulma, niin on myös mikä<br />

tahansa muotoa φ+n2π, n = 0,±1,±2,..., oleva kulma,<br />

sillä Eulerin kaavan mukaan on<br />

e i(φ+n2π)<br />

= e iφ e i2nπ<br />

= e iφ (cos2nπ +isin2nπ)<br />

= e iφ (1+i0)<br />

= e iφ .<br />

Kompleksiluku z voidaan siis esittää kuten<br />

z = re iφ+i2nπ , n = 0,±1,±2,....<br />

Luvun z n:s juuri w = z 1/n on se luku mikä toteuttaa<br />

w n = z. Käyttäen polaariesitystä<br />

w = ρe iφ ,<br />

nähdään että on oltava voimassa<br />

ja<br />

z = re iθ<br />

ρ n = r ⇒ ρ = n√ r<br />

e inφ = e iθ ⇒ nφ = θ +k2π, k ∈ N<br />

koska e ik2π = 1. Siis saamme<br />

z 1/n = n√ re i(θ/n+k2π/n) , k ∈ N (5.20)<br />

Helposti nähdään, että vain luvut k = 0,1,...(n−1)<br />

tuottavat erisuuruisen tuloksen:<br />

e 0 ,e i2π/n ,e i4π/n ,...,e i2(n−1)π/n (5.21)<br />

36


Toisaalta positiivinen kokonaisluku k voidaan aina<br />

kirjoittaa muodossa k = qn+r, missä q on jakolaskun<br />

k/n osamäärä ja r, 0 ≤ r < n, sen jakojäännös. On siis<br />

voimassa<br />

e i2kπ/n = e i2rπ/n e i2qπ = e i2rπ/n ,<br />

joten jokainen muotoa exp(i2kπ/n), k ≥ 0, oleva<br />

kompleksiluku on joukossa (5.21). Samalla tavoin voidaan<br />

todeta, että myös luvut exp(i2kπ/n) kokonaisluvun k<br />

ollessa negatiivinen ovat nekin joukossa (5.21). Siis,<br />

kompleksiluvulla z = re iφ , r ≠ 0, on täsmälleen n<br />

erilaista n:ttä juurta:<br />

z 1/n = r 1/n e iφ/n ,r 1/n e i(φ+2π)/n ,<br />

r 1/n e i(φ+4π)/n ,...,<br />

r 1/n e i(φ+2(n−1)π)/n .<br />

Esim. Luvun 2 neljännet juuret<br />

Kirjoitetaan Eulerin kaavaa käyttäen<br />

2 = 2e 0i = 2e 2πi = 2e 4πi = 2e 6πi .<br />

(5.22)<br />

Hyperboliset kosini- ja sinifunktiot määritellään kaavoilla<br />

coshx = 1 2 (ex +e −x )<br />

sinhx = 1 2 (ex −e −x ).<br />

(5.24)<br />

Myös tangenttifunktio voidaan kirjoittaa eksponenttien<br />

avulla:<br />

tanφ = sinφ<br />

cosφ = eiφ −e −iφ<br />

i(e iφ +e −iφ ) . (5.25)<br />

Analogisesti hyperbolinen tangentti määritellään kuten<br />

tanhx = sinhx<br />

coshx = ex −e −x<br />

e x +e−x. (5.26)<br />

Trigonometristen ja hyperbolisten funktioiden välillä<br />

vallitsee yhteys<br />

cosh iφ = cosφ<br />

sinh iφ = isinφ<br />

tanh iφ = itanφ.<br />

(5.27)<br />

Näemme, että neljännet juuret ovat<br />

2 1/4 , 2 1/4 e πi/2 , 2 1/4 e πi ja 2 1/4 e 3πi/2 .<br />

Eulerin kaavan mukaan on mm.<br />

e πi/2 = cos 1 2 π +isin 1 2 π = i<br />

Samoin voimme todeta, että exp(πi) = −1 ja<br />

exp ( 3<br />

2 πi) = −i. Kysytyt juuret ovat niin ollen<br />

2 1/4 , 2 1/4 i, −2 1/4 ja −2 1/4 i.<br />

Huomattakoon, että jonossa seuraava termi,<br />

2 = 2exp(8πi), antaisi neljänneksi juureksi<br />

2 1/4 exp(2πi) = 2 1/4 . Tämä esiintyy jo juurilistassamme.<br />

Trigonometriset funktiot<br />

Eulerin kaavan (5.16)<br />

mukaan on<br />

e iφ = cosφ+isinφ<br />

e −iφ = cos(−φ)+isin(−φ) = cosφ−isinφ.<br />

Ratkaistaan näistä yhtälöistä sini- ja kosinifunktiot:<br />

(<br />

cosφ = 1 2 ( e iφ +e −iφ)<br />

sinφ = 1 2i e iφ −e −iφ) (5.23)<br />

.<br />

Voimme itse asiassa tästä lähtien pitää näitä lausekkeita<br />

sini- ja kosinifunktioiden määritelminä. Nämä<br />

määritelmät ovat voimassa siinäkin tapauksessa, että<br />

argumenttikulma φ on kompleksinen.<br />

37


Kompleksiluvun logaritmi:<br />

lnz = w ⇔ z = e w<br />

Jos nyt z = re iθ = re iθ e in2π , missä n ∈ Z, niin saadaan<br />

w = lnz = lnr +iθ +in2π, n ∈ Z<br />

Logaritmi on siis äärettömän moniarvoinen funktio.<br />

Helposti nähdään että e w = z kaikilla n.<br />

Logaritmin päähaaraksi sanotaan valintaa n = 0 ja<br />

0 ≤ θ < 2π:<br />

lnz = lnr +iθ, 0 ≤ θ < 2π<br />

Jos nyt z ∈ R, ja z on positiivinen (> 0):<br />

lnz = lnr<br />

Jos taas z on negatiivinen reaaliluku,<br />

lnz = lnr +iπ<br />

Esim. (päähaara-arvot):<br />

ln(−1) = lne iπ ) = iπ<br />

lni = lne iπ/2 = i π 2<br />

ln(1+i) = ln( √ 1 2 +1 2 e iπ/4 ) = 1 2 ln2+iπ 4<br />

6. Differentiaaliyhtälöistä<br />

Newtonin toisen lain mukaan kappaleeseen vaikuttava<br />

voima on yhtäsuuri kuin kappaleen massa kerrottuna sen<br />

kiihtyvyydellä. Korkeudella h putoamisliikkeessä olevan<br />

kappaleen kiihtyvyys on d2 h<br />

dt 2 ja siihen vaikuttava<br />

gravitaatiovoima −mg, kun kappaleen massa on m.<br />

Newtonin lain mukaan on siis<br />

tai<br />

m d2 h<br />

dt 2 = −mg<br />

d 2 h<br />

dt 2 = −g.<br />

Tämä on korkeutta h hallitseva differentiaaliyhtälö, ts.<br />

siinä esiintyy tuntemattoman funktion derivaattoja.<br />

Differentiaaliyhtälön ratkaisemisella tarkoitetaan yhtälön<br />

toteuttavan funktion etsimistä.<br />

Putoamisliikkeen tapauksessa ratkaisu on helppo löytää.<br />

Integroidaan differentiaaliyhtälön<br />

d 2 h<br />

dt 2 = −g<br />

molemmat puolet, jolloin saadaan<br />

dh<br />

dt = −gt+c 1.<br />

Tämä on edelleenkin differentiaaliyhtälö ja edelleenkin<br />

voimme integroida sen puolittain. Päädymme ratkaisuun<br />

h = − 1 2 gt2 +c 1 t+c 2 .<br />

38<br />

Terminologiaa<br />

Putoamisliikkeen ratkaisussa on kummastakin<br />

integroinnista aiheutuneet integrointivakiot otettu<br />

mukaan. Vakioiden arvot määräytyvät alkuehdoista.<br />

Tässä tapauksessa tieto kappaleen korkeudesta ja<br />

nopeudesta alkuhetkellä t = 0 riittää.<br />

Kun yhtälössä on jonkin muuttujan derivaattoja jonkin<br />

toisen muuttujan suhteen, sanotaan edellistä muuttujaa<br />

riippuvaksi ja jälkimmäistä riippumattomaksi (vapaaksi).<br />

Riippuva muuttuja on siis sama kuin funktio mikä<br />

halutaan ratkaista.<br />

Jos differentiaaliyhtälössä esiintyy derivaattoja vain<br />

yhden riippumattoman muuttujan suhteen, puhutaan<br />

tavallisesta differentiaaliyhtälöstä. Jos yhtälössä on<br />

osittaisderivaattoja useamman kuin yhden vapaan<br />

muuttujan suhteen, kyseessä on<br />

osittaisdifferentiaaliyhtälö.<br />

Esimerkiksi differentiaaliyhtälö<br />

d 2 x<br />

dt 2 +adx dt +kx = 0


on tavallinen. Sen riippuva muuttuja on x ja riippumaton<br />

t. Yhtälö<br />

∂u<br />

∂x + ∂u<br />

∂y = x−3y<br />

on puolestaan osittaisdifferentiaaliyhtälö, jonka<br />

riippumattomat muuttujat ovat x ja y. u on tämän<br />

yhtälön riippuva muuttuja.<br />

Yhtälön kertaluku on korkein siinä esiintyvien<br />

derivaattojen kertaluvuista. Esimerkiksi yhtälön<br />

d 2 h<br />

dt 2 = −g<br />

kertaluku on 2.<br />

Differentiaaliyhtälö on lineaarinen, jos riippuva muuttuja<br />

(y) ja sen derivaatat esiintyvät yhtälön kaikissa termeissä<br />

joko ensimmäisessä potenssissa tai ei ollenkaan. Jos<br />

differentiaaliyhtälö ei ole lineaarinen, sen sanotaan olevan<br />

epälineaarinen. Esimerkiksi yhtälö<br />

on lineaarinen mutta yhtälöt<br />

d 2 y<br />

d 2 y<br />

2<br />

+y = x4<br />

dx<br />

dx 2 +siny = 0, y′ +2yy ′ = 0 ja y ′ = x y<br />

ovat epälineaarisia.<br />

Mikä tahansa kertaluvun n tavallinen differentiaaliyhtälö<br />

on kirjoitettavissa muotoon<br />

(<br />

F x,y, dy )<br />

dx ,..., dn y<br />

dx n = 0.<br />

Olkoon I jokin lukuväli ((a,b),[a,b],...).<br />

Jos sijoitettaessa y = f(x) yhtälöön<br />

F<br />

(<br />

x,y, dy )<br />

dx ,..., dn y<br />

dx n = 0<br />

se toteutuu kaikilla x ∈ I, sanotaan että f(x) on ko.<br />

yhtälön ratkaisu välillä I.<br />

Esim. Yhtälön y ′′ − 2 x 2 y = 0 ratkaisu on f(x) = x 2 −x −1<br />

Nyt derivaatat f ′ (x) = 2x+x −2 ja f ′′ (x) = 2−2x −3 ovat<br />

määriteltyjä aina kun x ≠ 0. Sijoitetaan f yhtälöön,<br />

jolloin saadaan<br />

(2−2x −3 )− 2 x 2(x2 −x −1 )<br />

= (2−2x −3 )−(2−2x −3 )<br />

= 0.<br />

Yhtälö siis toteutuu kun x ≠ 0 eli f(x) = x 2 −x −1 on<br />

yhtälön ratkaisu alueissa (−∞,0) ja (0,∞).<br />

Esim. φ(x) = c 1 e −x +c 2 e 2x on yhtälön y ′′ −y ′ −2y = 0<br />

ratkaisu<br />

Nyt φ ′ (x) = −c 1 e −x +2c 2 e 2x ja φ ′′ (x) = c 1 e −x +4c 2 e 2x .<br />

Sijoitetaan nämä yhtälöön, jolloin<br />

(c 1 e −x +4c 2 e 2x )−(−c 1 e −x +2c 2 e 2x )<br />

−2(c 1 e −x +c 2 e 2x )<br />

= (c 1 +c 1 −2c 1 )e −x +(4c 2 −2c 2 −2c 2 )e 2x = 0.<br />

Tämä on ilmeisestikin voimassa koko reaaliakselilla, joten<br />

φ(x) = c 1 e −x +c 2 e 2x on yhtälön ratkaisu välillä (−∞,∞)<br />

olivatpa c 1 ja c 2 mitä tahansa vakioita.<br />

Esim. Yhtälön (1+xe xy ) dy<br />

dx +1+yexy = 0 ratkaisu<br />

määräytyy yhtälöstä x+y +e xy = 0<br />

Suoraviivainen menettely olisi ratkaista y yhtälöstä<br />

x+y +e xy = 0 ja sijoittaa tämä differentiaaliyhtälöön.<br />

Valitettavasti vain emme osaa tätä ratkaisua muodostaa.<br />

Derivoidaan sen sijaan yhtälö x+y +e xy = 0<br />

implisiittisesti, jolloin<br />

1+ dy (<br />

dx +exy y +x dy )<br />

= 0.<br />

dx<br />

Uudestaan ryhmittäen voidaan kirjoittaa<br />

(1+xe xy ) dy<br />

dx +1+yexy = 0,<br />

joten yhtälö x+y +e xy = 0 todellakin määrää<br />

implisiittisesti ko. differentiaaliyhtälön ratkaisun.<br />

Osoittautuu, että kertalukua n olevien<br />

differentiaaliyhtälöiden ratkaisuihin liittyy aina n<br />

mielivaltaista vakiota. Useimmissa tapauksissa vakiot<br />

ovat määrättävissä, jos tunnetaan funktio ja sen n−1<br />

ensimmäisen derivaatan arvot jossakin ratkaisuvälin I<br />

pisteessä.<br />

Differentiaaliyhtälöön<br />

(<br />

F x,y, dy )<br />

dx ,..., dn y<br />

dx n = 0<br />

liittyvä alkuarvoprobleema kuuluu: Etsi välillä I se<br />

differentiaaliyhtälön ratkaisu, joka pisteessä x 0 ∈ I<br />

toteuttaa n ehtoa<br />

y(x 0 ) = y 0<br />

dy<br />

dx (x 0) = y 1<br />

.<br />

d n−1 y<br />

dx n−1(x 0) = y n−1 ,<br />

missä suureet y 0 ,y 1 ,...,y n−1 ovat vakioita.<br />

Nimitys alkuarvo on peräisin mekaniikasta, missä y(x 0 ) = y 0<br />

tarkoittaa usein kappaleen paikkaa alkuhetkellä x 0 ja y ′ (x 0 ) = y 1<br />

sen nopeutta samalla hetkellä.<br />

39


Esim. Määrää se yhtälön y ′′ −y ′ −2y = 0 ratkaisu, joka<br />

toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −3<br />

Aiemmin näimme, että φ(x) = c 1 e −x +c 2 e 2x on ko.<br />

yhtälön ratkaisu olivatpa vakiot c 1 ja c 2 mitä tahansa.<br />

Määrätään nämä kertoimet siten, että alkuehdot<br />

toteutuvat:<br />

eli<br />

φ(0) = c 1 e 0 +c 2 e 0 = 2<br />

φ ′ (0) = −c 1 e 0 +2c 2 e 0 = −3,<br />

c 1 +c 2 = 2<br />

−c 1 +2c 2 = −3.<br />

Yhtälöryhmän ratkaisuna saadaan c 1 = 7/3 ja c 2 = −1/3.<br />

Alkuarvot toteuttava ratkaisu on siis<br />

φ(x) = 7 3 e−x − 1 3 e2x .<br />

tavallisimmat differentiaaliyhtälöt:<br />

Seuraavat differentiaaliyhtälöt esiintyvät usein fysiikassa<br />

ja muissa sovelluksissa:<br />

d 2 y<br />

dx 2<br />

dy<br />

= ay, a ∈ R ⇒ y = Ceax<br />

dx<br />

d 2 y<br />

dx 2 = a2 y, ⇒ y = C 1 e ax +C 2 e −ax<br />

= −a 2 y, ⇒ y = C 1 cos(ax)+C 2 sin(ax)<br />

= D 1 e iax +D 2 e −iax<br />

Viimeinen yhtälö on esim. harmonisen värähtelijän<br />

yhtälö: jos kappale liikkuu x-akselia pitkin voiman<br />

F = −kx vaikutuksessa, Newtonin lain mukaan (F = ma)<br />

F = −kx = d2 x<br />

dt 2<br />

6.1 Ensimmäisen kertaluvun yhtälöt<br />

Ensimmäisen kertaluvun differentiaaliyhtälöille voidaan<br />

todistaa olemassaolo- ja yksikäsitteisyyslause:<br />

Olkoot funktio f(x,y) ja sen osittaisderivaatta ∂f<br />

∂x (x,y)<br />

jatkuvia pisteen (x 0 ,y 0 ) sisältävässä suorakaiteessa<br />

R = {(x,y)|a < x < b,c < y < d}.<br />

Silloin alkuarvoprobleemalla<br />

dy<br />

dx = f(x,y), y(x 0) = y 0<br />

on yksikäsitteinen ratkaisu φ(x) jollakin välillä<br />

x 0 −h < x < x 0 +h, missä h > 0.<br />

Vastaavanlaisia lauseita on olemassa myös korkeamman<br />

kertaluvun differentiaaliyhtälöille.<br />

Lause siis kertoo, milloin ratkaisu on löydettävissä ja että<br />

ratkaisun löydyttyä ei tarvitse etsiä muita ratkaisuja<br />

koska niitä ei ole olemassa. Graafisesti olemassaolo<br />

tarkoittaa, että lauseen suorakaiteen jokaisen pisteen<br />

kautta kulkee jokin ratkaisu ja yksikäsitteisyys sitä, että<br />

kunkin pisteen (x 0 ,y 0 ) kautta kulkee täsmälleen yksi<br />

ratkaisu. Tästä johtuen ratkaisujen kuvaajat eivät<br />

koskaan leikkaa toisiaan. Valitettavasti lause kertoo vain<br />

että ratkaisu on olemassa pisteen x = x 0 ympäristössä,<br />

mutta ei kerro tämän ympäristön suuruutta.<br />

Fysiikan mallintamisessa alkuarvotehtävän ratkaisun olemassaolo<br />

ja yksikäsitteisyys ovat ensiarvoisen tärkeitä. Ensinnäkin<br />

todellisessa maailmassa ”jotakin tapahtuu”joten mallinnettaessa<br />

maailmaa aluarvoprobleemoina olisi ratkaisujen syytä olla<br />

olemassa. Toiseksi, jos saman kokeen toisto samoilla ehdoilla<br />

johtaa aina samaan tulokseen, täytyy kokeeseen liittyvän<br />

mallinkin olla yksikäsitteinen. Mekaniikka on hyvä esimerkki<br />

deterministisestä mallista: tulevaisuus määräytyy tarkasti jos<br />

alkutila tunnetaan tarkasti.<br />

6.1.1 Separoituvat yhtälöt<br />

Jos differentiaaliyhtälö voidaan kirjoittaa muodossa<br />

dy<br />

= q(x)p(y) (6.1)<br />

dx<br />

ts. oikea puoli on kirjoitettavissa kahden funktion tulona,<br />

joista toinen riippuu vain muuttujasta x ja toinen vain<br />

muuttujasta y, sanotaan että yhtälö on separoituva tai<br />

että yhtälön muuttujat ovat erotettavissa.<br />

Luonnollisesti myös muotoa<br />

ovat separoituvia.<br />

Separoituva yhtälö<br />

dy<br />

dx = q(x)<br />

p(y)<br />

tai<br />

dy<br />

dx = q(x)<br />

p(y)<br />

dy<br />

dx = p(y)<br />

q(x)<br />

ratkeaa muuttujien separoinnilla:<br />

kerrotaan molemmat puolet funktiolla p(y) ja<br />

differentiaalilla dx, jolloin<br />

p(y)dy = q(x)dx,<br />

(6.2)<br />

ja integroimalla näin saatu yhtälö,<br />

∫ ∫<br />

p(y)dy = q(x)dx. (6.3)<br />

Jos integraalit osataan laskea, voidaan ratkaista y = f(x).<br />

Näytetään että (6.3) antaa oikean ratkaisun: Olkoot P(y)<br />

ja Q(x) funktioiden p(y) ja q(x) integraalifunktioita, ts.<br />

P ′ (y) = p(y),<br />

Q ′ (x) = q(x)<br />

40


Tälloin yhtälö (6.3) on ekvivalentti yhtälön<br />

P(y) = Q(x)+C<br />

kanssa. Kirjoittamalla y = y(x) ja derivoimalla x:n<br />

suhteen saamme<br />

d<br />

dx P(y(x)) = P′ (y(x))y ′ (x) = d<br />

dx Q(x) ⇒<br />

p(y)y ′ = q(x)<br />

mikä oli alkuperäinen differentiaaliyhtälö.<br />

Esim. Ratkaise dy<br />

dx = x−5<br />

y 2<br />

Kerrotaan yhtälö puolittain tekijällä y 2 dx, jolloin saadaan<br />

y 2 dy = (x−5)dx.<br />

Integrointi molemmin puolin antaa<br />

∫ ∫<br />

y 2 dy = (x−5)dx<br />

eli<br />

Ratkaistaan y:<br />

y 3<br />

3 = x2<br />

2 −5x+C.<br />

( ) 3x<br />

2 1/3<br />

y =<br />

2 −15x+3C .<br />

Koska vakio C voi olla mielivaltainen reaaliluku niin<br />

sellainen on myös 3C. Voimme siis aivan hyvin korvata<br />

sen vaikkapa symbolilla K:<br />

( ) 3x<br />

2 1/3<br />

y =<br />

2 −15x+K .<br />

Esim. Ratkaise alkuarvotehtävä dy<br />

Muuttujien erottaminen johtaa yhtälöön<br />

Tämän integrointi antaa<br />

dy<br />

y −1 = dx<br />

x+3 .<br />

dx = y−1<br />

x+3<br />

ln|y −1| = ln|x+3|+C.<br />

kun y(−1) = 0<br />

Eksponentioidaan yhtälön molemmat puolet ja saadaan<br />

eli<br />

e ln|y−1| = e ln|x+3|+C<br />

|y −1| = e C |x+3| = K|x+3|,<br />

missä olemme merkinneet K = e C > 0. Riippuen<br />

muuttujien y ja x arvoista on |y −1| = ±(y −1) ja<br />

|x+3| = ±(x+3). Voimme siis kirjoittaa<br />

y −1 = ±K(x+3) tai y = 1+(±K)(x+3).<br />

Merkitään vakiota ±K jälleen symbolilla C, joka voi nyt<br />

siis olla mielivaltainen reaaliluku. Saamme silloin<br />

differentiaaliyhtälön ratkaisuksi y = 1+C(x+3).<br />

Alkuehto oli y(−1) = 1+C(−1+3) = 0 eli C = −1/2.<br />

Alkuarvotehtävän siis ratkaisee funktio<br />

y = − 1 2 − 1 2 x.<br />

6.1.2 Lineaariset yhtälöt<br />

Ensimmäisen kertaluvun lineaarinen yhtälö on muotoa<br />

a 1 (x) dy<br />

dx +a 0(x)y = b(x), (6.4)<br />

missä kertoimet a 1 (x), a 0 (x) ja oikea puoli b(x) voivat<br />

riippua vain vapaasta muuttujasta x mutta eivät<br />

riippuvasta muuttujasta y.<br />

Esimerkiksi yhtälö<br />

x 2 sinx−(cosx)y = (sinx) dy<br />

dx<br />

on selvästikin lineaarinen. Yhtälö<br />

y dy<br />

dx +(sinx)y3 = e x +1<br />

sen sijaan ei ole lineaarinen, sillä sen lisäksi että<br />

derivaatan kertoimena on riippuva muuttuja y esiintyy<br />

yhtälössä muuttujan y kuutiollinen termi.<br />

Olettaen, että kerroin a 1 (x) yhtälössä (6.4) on<br />

tarkasteltavalla välillä nollasta poikkeava, ensimmäisen<br />

kertaluvun yhtälö on kirjoitettavissa standardimuotoon<br />

dy<br />

+p(x)y = q(x). (6.5)<br />

dx<br />

Jos asetetaan q(x) = 0 yhtälöä sanotaan homogeeniseksi,<br />

alkuperäistä täydelliseksi. Homogeenisen yhtälön kaikissa<br />

termeissä esiintyy siis ainoastaan y:n tai y ′ ensimmäistä<br />

potenssia.<br />

Ratkaisussa kannattaa lähteä liikkeelle homogeenisen<br />

yhtälön ratkaisusta:<br />

I) Homogeeninen yhtälö (HY):<br />

Ratkeaa separoimalla:<br />

dy<br />

dx +p(x)y = 0<br />

dy<br />

y = −p(x)dx<br />

∫<br />

⇒ ln|y| = − p(x)dx+A<br />

[ ∫ ]<br />

⇒ y = Cexp − p(x)dx<br />

missä C = ±e A on integroimisvakio. Tämä on HY:n<br />

yleinen ratkaisu.<br />

41


<strong>II</strong>) Täydellinen yhtälö (TY):<br />

Nyt riittää löytää joku ratkaisu TY:lle, olkoon se y 0 (x).<br />

Tällöin TY:n yleinen ratkaisu on HY:n ja TY:n<br />

ratkaisujen summa,<br />

y TY (x) = y HY (x)+y 0 (x)<br />

missä y HY on yllä lasketty HY:n yleinen ratkaisu.<br />

Todistus:<br />

1. y TY (x) on selvästi TY:n ratkaisu<br />

2. Olkoon y 1 (x) TY:n mielivaltainen ratkaisu. Tällöin<br />

y 1 (x)−y 0 (x) on selvästi HY:n joku ratkaisu, joten<br />

y 1 (x) = y HY (x)+y 0 (x).<br />

Kuinka TY:n ratkaisu löydetään?<br />

Arvaus: toimii usein, mutta pitää keksiä!<br />

Esim. y ′ +xy = x: selvästi yksi TY:n ratkaisu on y = 1.<br />

Vakion variointi: Etsitään ratkaisua niin että HY:n<br />

ratkaisun vakio “ylennetään” x:n funktioksi:<br />

∫<br />

y = C(x)e − p(x)dx<br />

∫ ∫<br />

y ′ = C ′ e − pdx −Cpe − pdx<br />

∫<br />

= C ′ e − pdx −py<br />

Sijoitetaan tämä TY:hyn:<br />

∫<br />

C ′ e − pdx −py +py = q<br />

∫<br />

⇒ C ′ pdx<br />

= qe<br />

∫ ∫<br />

⇒ C = qe<br />

pdx dx<br />

Siis TY:n yleinen ratkaisu saadaan muotoon<br />

∫ [ ∫ ∫ ]<br />

y(x) = e − pdx<br />

C + qe<br />

pdx dx<br />

(6.6)<br />

Tässä C -termi on HY:n yleinen ratkaisu. Tätä muotoa ei<br />

kannata muistaa, menetelmä kyllä!<br />

Esim. Etsi yhtälön 1 dy<br />

x dx − 2y<br />

x<br />

= xcosx yleinen ratkaisu<br />

2<br />

Yhtälö on lineaarinen, joten kirjoitetaan se ensin<br />

standardimuotoon kertomalla se tekijällä x:<br />

dy<br />

dx − 2 x y = x2 cosx.<br />

Nyt homogeeninen yhtälö on siis y ′ − 2 xy = 0, joka<br />

ratkeaa separoimalla:<br />

dy<br />

y = 2 dx ⇒ ln|y| = 2ln|x|+A ⇒ y = Cx2<br />

x<br />

Täydellinen yhtälö ratkeaa vakion varioinnilla:<br />

y = Cx 2 ⇒ y ′ = C ′ x 2 +C2x<br />

Siis TY:n yleinen ratkaisu on siis näiden kahden ratkaisun<br />

summa:<br />

y = (C +sinx)x 2<br />

Vakio C määräytyy nyt alkuehdosta.<br />

Esim. Etsi yhtälön y ′ −2y = 2 yleinen ratkaisu<br />

Yhtälö on lineaarinen:<br />

HY:<br />

dy<br />

dx −2y = 0<br />

⇒ dy y = 2dx<br />

⇒ ln|y| = 2x+A ⇒ y = Ce 2x<br />

TY: Täydellisen yhtälön ratkaisu voidaan etsiä vakion<br />

varioinnilla, mutta tässä tapauksessa nähdään helposti<br />

että y = −1 toteuttaa TY:n. Siis yleinen ratkaisu on<br />

y = Ce 2x −1.<br />

Esim. Putoava kappale:kappale jonka massa on m putoaa<br />

ilmassa maan vetovoiman vaikutuksesta. Hetkellä t = 0<br />

kappale on levossa. Mikä on kappaleen nopeus ajan<br />

funktiona?<br />

Kappaleeseen vaikuttavat voimat:<br />

maan vetovoima: mg<br />

ilmanvastus: −kv (pitää paikkansa jos nopeus v on pieni).<br />

Newtonin liikelaki<br />

F = ma ⇒ m dv<br />

dt<br />

= mg −kv<br />

Kyseessä on lineaarinen 1. kertaluvun differentiaaliyhtälö.<br />

HY on<br />

mv ′ = −kv ⇒ 1 v dv = − k m dt<br />

⇒ ln|v| = − k t+A ⇒ v = Ce−kt/m<br />

m<br />

TY:n yksittäisratkaisu saadan vakion varioinnilla, tai<br />

jälleen arvaamalla: selvästi v = mg/k toteuttaa TY:n,<br />

joten yleinen ratkaisu on<br />

v(t) = Ce −kt/m +mg/k<br />

Hetkellä t = 0 nopeus v(0) = 0 ⇒ C = −mg/k, joten<br />

alkuehdon toteuttava ratkaisu on<br />

v(t) = mg<br />

k (1−e−kt/m )<br />

Kun t on pieni (t ≪ m/k), kappaleen nopeus v ≈ gt,<br />

mutta kun t → ∞, nopeus lähestyy raja-arvoa mg/k.<br />

ja TY:<br />

C ′ x 2 +C2x− 2 x Cx2 = x 2 cosx ⇒ C ′ = cosx ⇒ C = sinx<br />

42


6.2 Lineaariset toisen kertaluvun yhtälöt<br />

Toisen kertaluvun differentiaaliyhtälöt ovat tuntuvasti<br />

hankalampia ratkaista kuin ensimmäinen.<br />

Käsittelemmekin tässä vain tärkeintä erikoistapausta,<br />

toisen kertaluvun lineaarista ja vakiokertoimista<br />

differentiaaliyhtälöä.<br />

Toisen kertaluvun lineaarinen differentiaaliyhtälö on<br />

muotoa<br />

a 2 (x) d2 y<br />

dx 2 +a 1(x) dy<br />

dx +a 0(x)y = b(x),<br />

ts. se sisältää enintään y:n toista derivaattaa (toinen<br />

kertaluku) ja sen termit ovat verrannollisia ainoastaan y 1<br />

tai y 0 (lineaarinen differentiaaliyhtälö). (siinä ei siis<br />

esiinny termejä y 2 , y ′ y, e y jne.)<br />

Jos kertoimet a 0 , a 1 ja a 2 ovat vakioita, sanotaan yhtälön<br />

olevan vakiokertoimisen.<br />

Lineaarisen toisen kertaluvun yhtälön standardimuoto on<br />

d 2 y<br />

dx 2 +p(x)dy +q(x)y = g(x), (6.7)<br />

dx<br />

missä p(x) = a 1 (x)/a 2 (x), q(x) = a 0 (x)/a 2 (x) ja<br />

g(x) = b(x)/a 2 (x) (olettaen, että a 2 (x) ≠ 0<br />

tarkasteltavalla välillä).<br />

Standardimuotoon (6.7) liittyvä homogeeninen yhtälö on<br />

d 2 y<br />

dx 2 +p(x)dy +q(x)y = 0. (6.8)<br />

dx<br />

Jos standardimuotoisessa yhtälössä (6.7) g(x) ≠ 0,<br />

sanotaan yhtälön olevan ei-homogeeninen tai täydellinen.<br />

2. kertaluvun lineaarisen dy:n ratkaisujen<br />

ominaisuuksia<br />

Toisen kertaluvun lineaarisen differentiaaliyhtälön<br />

ratkaisu etenee samaan tapaan kuin ensimmäisen<br />

kertaluvun:<br />

1. Etsitään homogeenisen yhtälön yleinen ratkaisu,<br />

y HY (x).<br />

2. Etsitään täydellisen yhtälön joku ratkaisu y 0 (x). Nyt<br />

täydellisen yhtälön yleinen ratkaisu on muotoa<br />

y TY (x) = y HY (x)+y 0 (x).<br />

Tämä ominaisuus seuraa samalla perusteella kuten 1. kl:n<br />

yhtälölläkin.<br />

Voidaan osoittaa, että homogeenisen yhtälön (HY) (6.8)<br />

yleinen ratkaisu (jossain joukossa x ∈ I) voidaan<br />

kirjoittaa muodossa<br />

y HY (x) = C 1 y 1 (x)+C 2 y 2 (x) (6.9)<br />

missä C 1 , C 2 ovat vakioita jotka voidaan kiinnittää<br />

alkuehdoista ja y 1 (x) ja y 2 (x) ovat kaksi mielivaltaista<br />

lineaarisesti riippumatonta HY:n ratkaisua. Tässä<br />

tapauksessa lineaarinen riippumattomuus tarkoittaa että<br />

a 1 y 1 (x)+a 2 y 2 (x) = 0 vain jos a 1 = a 2 = 0<br />

kaikilla x ∈ I.<br />

Helposti nähdään että jos y 1 ja y 2 ovat HY:n ratkaisuja<br />

niin y HY on myös ratkaisu.<br />

Normaalisti ratkaisujen lineaarinen riippumattomuus on selvää.<br />

Tarkemmin se voidaan laskea Wronskin determinantista:<br />

∣ W[y 1 ,y 2 ](x) = ∣ y 1(x) y 2 (x) ∣∣<br />

y 1 ′(x) y′ 2 (x) (6.10)<br />

= y 1 (x)y 2 ′(x)−y 2(x)y 1 ′(x) on = 0 jos ja vain jos y 1 ja y 2 ovat lineaarisesti riippuvia<br />

ratkaisuja.<br />

Käytännössä lineaarista riippuvuutta ei useinkaan testatata<br />

Wronskin determinantilla, ei ainakaan silloin kun on kyse tutuista<br />

funktioista. On helppo nähdä, että esimerkiksi kaikki eri<br />

potenssifunktiot (x r , potenssit r erisuuria) ovat toisistaan<br />

lineaarisesti riippumattomia. Tästä seuraa se, että kaikki eri<br />

eksponenttifunktiotkin (e rx , eri kertoimet r) ovat toisistaan<br />

riippumattomia sen lisäksi, että ne ovat riippumattomia myös<br />

potenssifunktioista. Samoin sini- ja kosinifunktiot ovat toisistaan<br />

rippumattomia. Sen sijaan esim. kosinifunktio riippuu lineaarisesti<br />

(kompleksisista) eksponenttifunktioista (Eulerin kaava:<br />

cosx = 1 2 (eix +e −ix )). Tästä voidaan toisaalta päätellä, että<br />

funktiot cosrx (kertoimet r itseisarvoltaan erisuuria) ovat<br />

riippumattomia sekä toisistaan että funktioista sinrx.<br />

Esim. Funktiot y 1 (x) = e 2x cos3x ja y 2 (x) = e 2x sin3x<br />

ratkaisevat homogeenisen yhtälön y ′′ −4y ′ +13y = 0. Etsi<br />

ratkaisu, joka toteuttaa alkuehdot y(0) = 2 ja y ′ (0) = −5<br />

y 1 ja y 2 ovat lineaarisesti riippumattomia. Yleinen<br />

ratkaisu on siis<br />

Tämän derivaatta on<br />

y(x) = c 1 e 2x cos3x+c 2 e 2x sin3x<br />

y ′ (x) = c 1 (2e 2x cos3x−3e 2x sin3x)<br />

+c 2 (2e 2x sin3x+3e 2x cos3x).<br />

Asetetaan y(0) = 2 ja y ′ (0) = −5, jolloin saadaan yhtälöt<br />

c 1 = 2<br />

2c 1 +3c 2 = −5.<br />

Ratkaisut ovat c 1 = 2 ja c 2 = −3. Alkuehdot toteuttava<br />

differentiaaliyhtälön ratkaisu on siten<br />

y(x) = 2e 2x cos3x−3e 2x sin3x.<br />

6.2.1 Vakiokertoimiset toisen kertaluvun<br />

homogeeniset lineaariset yhtälöt<br />

<strong>MAPU</strong>lla rajoitumme ratkaisemaan vakiokertoimisia 2.<br />

kertaluvun differentiaaliyhtälöitä. Nämä ratkaistaan<br />

ratkaisemalla ensin homogeeninen yhtälö (HY), mikä on<br />

muotoa<br />

ay ′′ +by ′ +cy = 0, (6.11)<br />

43


missä a, b ja c ovat vakiota ja a ≠ 0. Yhtälön mukaan siis<br />

vakioilla kerrotun funktion ja sen derivaattojen summan<br />

pitäisi olla identtisesti nolla. Ratkaisua kannattaisi<br />

varmaankin etsiä sellaisten funktioiden joukosta, joiden<br />

derivaatat ovat keskenään ja itse funktion kanssa samaa<br />

muotoa, mahdollisesti vakiotekijöillä kerrottuna. Ratkaisu<br />

saattaisi siten löytyä funktioiden e rx joukosta (r vakio).<br />

Sijoitetaan tämä yrite yhtälöön (6.11), jolloin saadaan<br />

ar 2 e rx +bre rx +ce rx = 0.<br />

Koska eksponenttifunktio e rx on aina nollasta poikkeava,<br />

voimme jakaa yhtälön sillä ja päädytään ns.<br />

karakteristiseen yhtälöön<br />

ar 2 +br +c = 0. (6.12)<br />

Toisen asteen yhtälönä karakteristinen yhtälö on helppo<br />

ratkaista:<br />

r 1<br />

r 2<br />

= −b+√ b 2 −4ac<br />

2a<br />

= −b−√ b 2 −4ac<br />

.<br />

2a<br />

Funktiot y 1 = e r1x ja y 2 e r2x ratkaisevat siten<br />

differentiaaliyhtälön (6.11).<br />

Tapaus 1: b 2 > 4ac:<br />

Tässä tapauksessa karakteristisen yhtälön ratkaisut r 1 ja<br />

r 2 ovat reaalisia, ja r 1 ≠ r 2 . Tällöin e r1x ja e r2x ovat<br />

lineaarisesti riippumattomia. (Nähdään myös Wronskin<br />

determinantista). Yleinen ratkaisu y on näiden<br />

superpositio<br />

y(x) = c 1 e r1x +c 2 e r2x .<br />

Esim. Yhtälön y ′′ +5y ′ −6y = 0 yleinen ratkaisu<br />

Karakteristinen yhtälö on nyt<br />

ja sen ratkaisut<br />

r 2 +5r −6 = 0<br />

r 1,2 = −5±√ 25+24<br />

2<br />

Yleinen ratkaisu on siten<br />

{<br />

=<br />

y(x) = c 1 e x +c 2 e −6x .<br />

1<br />

−6.<br />

Esim. Alkuarvotehtävä y ′′ +2y ′ −y = 0, kun y(0) = 0 ja<br />

y ′ (0) = −1<br />

Karakteristisen yhtälön r 2 +2r −1 = 0 ratkaisut ovat<br />

r 1 = −1+ √ 2 ja r 2 = −1− √ 2. Yleinen ratkaisu on niin<br />

ollen<br />

y(x) = c 1 e (−1+√ 2)x +c 2 e (−1−√ 2)x .<br />

Alkuehdot johtavat yhtälöihin<br />

0 = y(0) = c 1 e 0 +c 2 e 0 = c 1 +c 2<br />

−1 = y ′ (0) = (−1+ √ 2)c 1 e 0 +(−1− √ 2)c 2 e 0<br />

= (−1+ √ 2)c 1 +(−1− √ 2)c 2 ,<br />

joiden ratkaisuina ovat c 1 = − √ 2/4 ja c 2 = √ 2/4.<br />

Alkuarvoprobleeman siis toteuttaa funktio<br />

√ √<br />

2 2<br />

y(x) = −<br />

4 e(−1+√ 2)x +<br />

4 e(−1−√ 2)x .<br />

Tapaus 2: b 2 < 4ac<br />

Nyt karakteristisen yhtälön<br />

juuret ovat kompleksiset:<br />

ar 2 +br +c = 0<br />

r 1,2 = 1<br />

2a (−b±i√ |b 2 −4ac|) ≡ α±iβ<br />

missä α = −b/(2a) ja β = √ 4ac−b 2 /(2a) ovat reaalisia.<br />

Juuret ovat siis toistensa liittolukuja, r 1 = r ∗ 2. Nyt siis<br />

differentiaaliyhtälön yleinen ratkaisu saadaan edelleen<br />

eksponenttifunktioiden summasta<br />

y = C 1 e r1x +C 2 e r2x<br />

= e αx (C 1 e iβx +C 2 e −iβx )<br />

= e αx (Acosβx+Bsinβx)<br />

missä nyt A = C 1 +C 2 ja B = iC 1 −iC 2 . Yllä viimeisin<br />

muoto antaa reaalisen ratkaisun (y(x) ∈ R), jos A,B ∈ R.<br />

Esim. Yhtälön y ′′ +2y ′ +4y = 0 yleinen ratkaisu<br />

Karakteristisen yhtälön r 2 +2r +4 = 0 ratkaisut ovat<br />

Silloin funktiot<br />

r = −2±√ 4−16<br />

2<br />

= −1±i √ 3.<br />

y 1 (x) = e −x cos √ 3x ja y 2 (x) = e −x sin √ 3x<br />

ovat yhtälön lineaarisesti riippumattomia ratkaisuja.<br />

Yleinen ratkaisu on siten<br />

y(x) = c 1 e −x cos √ 3x+c 2 e −x sin √ 3x.<br />

Esim. Vaimennettu harmoninen värähtelijä<br />

Olkoon meillä kappale (massa m) joka liikkuu x -akselia<br />

pitkin ja joka on kiinnitetty jousella kiintopisteeseen.<br />

Olkoon kappaleen paikka x(t). Jousi aiheuttaa<br />

kappaleeseen harmonisen voiman F jousi = −kx (k > 0),<br />

missä x = 0 on piste missä kappale on levossa. Lisäksi<br />

kappaleeseen vaikuttaa nopeuteen verrannollinen<br />

kitkavoima γv = −γx ′ (t).<br />

44


Newtonin lain mukaan F = ma = mx ′′ ⇒<br />

−kx−γx ′ = mx ′′<br />

Tämä on 2. kertaluvun lineaarinen homogeeninen<br />

vakiokertoiminen differentiaaliyhtälö. Karakteristinen<br />

yhtälö on<br />

−k −γr = mr 2 ⇒ r = 1<br />

2m (−γ ±√ γ 2 −4mk)<br />

Jos γ 2 < 4km (pieni vaimennus), ratkaisu on<br />

x(t) = e −γt/(2m) (Acosωt+Bsinωt)<br />

missä ω = √ 4mk −γ 2 /(2m). Kappale siis värähtelee<br />

vaimenevasti taajuudella ω. Jos γ = 0, värähtely ei<br />

vaimene.<br />

Jos taas γ 2 > 4km (voimakas vaimennus), ratkaisu on<br />

x(t) = Ae r1t +Be r2t<br />

missä<br />

r 1,2 = 1<br />

2m (−γ ±√ γ 2 −4mk) < 0<br />

ovat reaalisia.<br />

Tapaus 3: b 2 = 4ac<br />

Karakteristisen yhtälön<br />

ar 2 +br +c = 0<br />

juuret ovat yhtäsuuret, jos b 2 −4ac = 0. Ainoa juuri on<br />

tällöin reaalinen ja suuruudeltaan<br />

r 0 = − b<br />

2a<br />

ja e r0x on siten ainoa muotoa e rx oleva ratkaisu.<br />

Tiedämme toisaalta, että toisen kertaluvun yhtälöllä on<br />

aina kaksi lineaarisesti riippumatonta ratkaisua.<br />

Etsitään toinen ratkaisu vakion varioinnilla: yrite<br />

vie differentiaaliyhtälömme<br />

y(x) = v(x)e r0x<br />

ay ′′ +by ′ +cy = 0.<br />

Sijoitamme tähän yritteemme ja derivaatat<br />

y ′ = v ′ e r0x +r 0 ve r0x<br />

y ′′ = v ′′ e r0x +2r 0 v ′ e r0x +r 2 0ve r0x .<br />

Hieman ryhmittäen saadaan<br />

(<br />

av ′′ +(2ar 0 +b)v ′ +(ar 2 0 +br 0 +c)v ) e r0x = 0.<br />

Funktion v täytyy siis toteuttaa yhtälö<br />

av ′′ +(2ar 0 +b)v ′ +(ar 2 0 +br 0 +c)v = 0.<br />

Sijoitetaan tähän r 0 = −b/2a ja nähdään että<br />

ja<br />

2ar 0 +b = −2a b<br />

2a +b = 0<br />

ar0 2 +br 0 +c = a b2<br />

4a 2 −b b +c = −b2<br />

2a 4a +c<br />

= − b2 −4ac<br />

= 0,<br />

4a<br />

koska diskriminantti oli b 2 −4ac = 0. Päädymme siten<br />

yhtälöön<br />

av ′′ = 0<br />

ratkaisu on v(x) = C 1 x+C 2 . Tästä nähdään että<br />

y(x) = xe r0x on niin ollen eräs alkuperäisen yhtälömme<br />

ratkaisu, ja on helppo nähdä, että tämä on lineaarisesti<br />

riippumaton ratkaisusta e r0x .<br />

Olemme saaneet aikaan reseptin:<br />

Jos yhtälöön<br />

ay ′′ +by ′ +cy = 0<br />

liittyvän karakteristisen yhtälön<br />

ar 2 +br +c = 0<br />

molemmat juuret ovat yhtäsuuret, r 0 , niin yleinen<br />

ratkaisu on<br />

y(x) = C 1 e r0x +C 2 xe r0x .<br />

Esim. Yhtälön y ′′ +4y ′ +4y = 0 yleinen ratkaisu<br />

Karakteristinen yhtälö on<br />

r 2 +4r +4 = (r +2) 2 = 0,<br />

jonka molemmat juuret ovat −2. Yleinen ratkaisu on<br />

silloin<br />

y(x) = c 1 e −2x +c 2 xe −2x .<br />

Vakion variointi soveltuu yleisemminkin tilanteisiin, missä<br />

tunnetaan jokin erikoisratkaisu ja pitäisi etsiä toinen tästä<br />

lineaarisesti riippumaton ratkaisu.<br />

Olkoon g jokin yhtälön<br />

y ′′ +py ′ +qy = 0<br />

ratkaisu. Sijoittamalla tähän y(x) = g(x)v(x) päädytään yhtälöön<br />

gv ′′ +2g ′ v ′ +g ′′ v +pg ′ v +pgv ′ +qgv = 0.<br />

Uudelleen ryhmittäen voidaan kirjoittaa<br />

gv ′′ +(2g ′ +pg)v ′ +(g ′′ +pg ′ +qg)v = 0.<br />

Koska g toteutti alkuperäisen yhtälön, g ′′ +pg ′ +qg = 0, saamme<br />

gv ′′ +(2g ′ +pg)v ′ = 0.<br />

Tämä on funktiolle v ′ = u ensimmäisen kertaluvun yhtälö<br />

g(x) du<br />

dx +[2g′ (x)+p(x)g(x)]u = 0.<br />

45


Tämä separoitavissa yhtälöksi<br />

∫ du<br />

u = − ∫ 2g ′ (x)+p(x)g(x)<br />

jolloin saadaan<br />

ln|u| = ln<br />

Eksponenttiointi antaa<br />

v ′ (x) = u(x) =<br />

g(x)<br />

∫<br />

1<br />

[g(x)] 2 −<br />

p(x)dx.<br />

dx,<br />

∫<br />

1 p(x)dx ,<br />

[g(x)] 2e−<br />

josta vielä kerran integroimalla saadaan v.<br />

6.2.2 Epähomogeeninen vakiokertoiminen<br />

lineaarinen toisen kertaluvun differentiaaliyhtälö<br />

Nyt differentiaaliyhtälö (täydellinen yhtälö, TY) on<br />

muotoa<br />

ay ′′ +by ′ +cy = f(x) (6.13)<br />

Helposti nähdään että jos y 1 on TY:n joku ratkaisu ja y 0<br />

on homogeenisen yhtälön (HY, f(x) = 0) joku ratkaisu<br />

niin y = y 0 +y 1 on myös TY:n ratkaisu. Koska 2.<br />

kertaluvun lineaarisen yhtälön täydellinen ratkaisu<br />

riippuu kahdesta vakiosta, saadaan<br />

TY:n täydellinen ratkaisu = HY:n täydellinen ratkaisu +<br />

TY:n joku yksittäisratkaisu.<br />

Kuinka siis löytää TY:n yksittäisratkaisu?<br />

1. Arvaus/yrite:<br />

toimii hyvin etenkin jos f(x) on polynomi. Tällöin<br />

kannattaa yrittää y(x) polynomi, jonka asteluku = f:n<br />

asteluku.<br />

Esim. y ′′ +ay ′ +by = c: yritetään y = α, vakio. Siis<br />

by = bα = c ⇒ α = c/b.<br />

Arvaus toimii myös usein jos f(x) = e αx , sillä f:n kaikki<br />

derivaatat ovat verrannollisia e αx :ään:<br />

y ′′ +ay ′ +by = e αx<br />

Yrite: y = Ae αx , sijoitus yhtälöön antaa<br />

A(α 2 +aα+b)e αx = e αx ⇒ A = (α 2 +aα+b) −1<br />

Tämä toimii jollei e αx satu olemaan HY:n ratkaisu<br />

(jolloin α 2 +aα+b = 0). Tällöin kannattaa kokeilla<br />

yritettä Axe αx , ellei sekin satu olemaan HY:n ratkaisu<br />

(tällöin α on HY:n karakterisen polynomin<br />

kaksinkertainen juuri). Siinä tapauksessa yrite on Ax 2 e αx .<br />

2. Integrointi kahdessa vaiheessa:<br />

Tämä on yleisempi menetelmä täydellisen yhtälön<br />

ratkaisuun. Tässä menetelmässä yhtälöä ryhmitellään<br />

muotoon jossa sitä voidaan integroidan suoraan, ja<br />

homogeenista yhtälöä ei tarvitse ratkaista erikseen.<br />

Kirjoitetaan yhtälö ensin muotoon (jaetaan y ′′ :n<br />

kertoimella, jos tarpeen)<br />

y ′′ +ay ′ +by = (D 2 +aD +b)y = f(x)<br />

missä D ≡ d<br />

dx , D2 ≡ d2 on merkintätapa.<br />

dx 2<br />

HY:n karakteristinen yhtälö on r 2 +ar +b = 0, jonka<br />

ratkaisut ovat r 1 ,r 2 . Näiden juurien avulla voimme<br />

kirjoittaa karakteristisen polynomin muotoon<br />

r 2 +ar +b = (r −r 1 )(r −r 2 )<br />

Täten differentiaaliyhtälökin voidaan kirjoittaa<br />

(D 2 +aD +b)y(x) = (D −λ 1 )(D −λ 2 )y(x) = f(x)<br />

Määritellään nyt u ≡ (D −λ 2 )y, jolloin saamme dy:n:<br />

(D −λ 1 )u = f(x)<br />

Tämä on lineaarinen 1. kl:n vakiokertoiminen dy, mikä<br />

ratkeaa edellä kuvatulla menetelmällä. Nyt voimme sitten<br />

ratkaista y:n yhtälöstä<br />

(D −λ 2 )y = u(x)<br />

mikä siis antaa alkuperäisen TY:n ratkaisun.<br />

Esim. y ′′ +y ′ −2y = e x HY:n karakteristinen yhtälö on<br />

r 2 +r −2 = 0 ⇒ r = 1 2 (−1±√ 1+8) = − 1 2 ± 3 2 = 1,−2<br />

Täten voimme kirjoittaa<br />

y ′′ +y ′ −2y = (D −1)(D +2)y = e x<br />

1.vaihe: olkoon nyt u(x) = (D +2)y, jolloin u:n<br />

differentiaaliyhtälö on<br />

(D −1)u(x) = u ′ (x)−u(x) = e x<br />

tämän HY:<br />

∫ ∫ du<br />

u ′ −u = 0 ⇒<br />

u = dx ⇒ u(x) = Ce x<br />

TY:n ratkaisu saadaan vakion varioinnilla:<br />

u(x) = C(x)e x ⇒ u ′ (x) = C ′ e x +Ce x , joten sijoitus<br />

(C ′ +C)e x −Ce x = e x ⇒ C ′ = 1 ⇒ C = x+A<br />

Siis TY:n täydellinen ratkaisu on<br />

u(x) = Ce x +xe x<br />

2.vaihe: ratkaistaan y yhtälöstä<br />

(D +2)y = y ′ +2y = u(x) = (C +x)e x<br />

HY: y ′ = −2y ⇒ y = Be −2x<br />

TY: jälleen vakion varioinnilla B → B(x):<br />

y ′ = B ′ e −2x −2Be x .<br />

46


Sijoitus differentiaaliyhtälöön antaa<br />

(B ′ −2B)e −2x +2Be −2x = (C +x)e x<br />

⇒ B ′ = (C +x)e 3x<br />

∫<br />

⇒ B = (C +x)e 3x dx = C 3 e3x + x ∫ 1<br />

3 e3x −<br />

3 e3x<br />

= ( C 3 − 1 9 )e3x + x 3 e3x +D<br />

= Ee 3x + x 3 e3x +D<br />

missä viimeisessä vaiheessa otettiin käyttöön uusi vakio<br />

E = C/3−1/9.<br />

Siis TY:n ratkaisu on<br />

y = (Ee 3x + x 3 e3x +D)e −2x = De −2x +(E + x 3 )ex<br />

mikä onkin myös TY:n yleinen ratkaisu. Vakion variointi<br />

antaakin yleisesti koko ratkaisun kaupan päälle<br />

yksittäisratkaisun lisäksi, vakioista riippuvat osat ovat<br />

HY:n yleinen ratkaisu.<br />

Edellisen esimerkin yhtälöön<br />

Nyt e i2x ei ole HY:n ratkaisu, joten TY:n<br />

yksittäisratkaisu löytyy yrittellä z = Ae i2x :<br />

⇒ A =<br />

A[(2i) 2 +2i−2]e i2x = 4e i2x<br />

Siis TY:n yleinen ratkaisu on<br />

ja<br />

4<br />

−6+2i = 2(−3−i)<br />

(−3+i)(−3−i) = −3−i<br />

5<br />

z = C 1 e x +C 2 e −2x + −3−i e i2x<br />

5<br />

y = Imz = A 1 e x +A 2 e −2x − 1 5 cos2x− 3 5 sin2x<br />

missä A 1 = ImC 1 , A 2 = ImC 2 .<br />

y ′′ +y ′ −2y = e x<br />

voi myös soveltaa arvausmenetelmää. HY:n<br />

karakteristinen yhtälö on r 2 +r −2 = 0, minkä juuret<br />

ovat r = 1,−2. Koska nyt siis e x on HY:n ratkaisu, TY:n<br />

yksittäisratkaisu voidaan löytää yritteellä<br />

y = Axe x :<br />

y ′ = A(e x +xe x ), y ′′ = A(2e x +xe x )<br />

Nyt dy tulee muotoon<br />

A(2+x)e x +A(1+x)e x −2Axe x = e x ⇒ 3A = 1<br />

Siis TY:n yksittäisratkaisu on y = x 3 ex , ja TY:n<br />

täydellinen ratkaisu on HY:n täydellisen ratkaisun ja<br />

TY:n yksittäisratkaisun summa:<br />

y = Ae x +Be −2x + x 3 ex<br />

Eksponenttifunktioyritteestä on usein myös hyötyä jos<br />

f(x) ∼ sinx, cosx (esim. värähtelevä pakkovoima<br />

harmonisella oskillaattorilla).<br />

Esim: y ′′ +y ′ −2y = 4sin2x<br />

Tämän voi toki ratkaista integroinnilla kahdessa<br />

vaiheessa, mutta kirjoitammekin yhtälön muotoon<br />

z ′′ +z ′ −2z = 4e i2x .<br />

Tällöin ottamalla imaginaariosa yhtälöstä saadaan<br />

alkuperäinen yhtälö, ja y = Imz.<br />

HY:n karakteristinen yhtälö on<br />

r 2 +r −2 = 0 ⇒ r = 1 2 (−1±√ 1+8) = 1,−2<br />

joten HY:n ratkaisu on<br />

z HY = C 1 e x +C 2 e −2x<br />

47


7. Vektorit ja differentiaalilaskenta<br />

7.1 Yhden muuttujan vektorifunktiot<br />

Liikkuvan kappaleen paikka avaruudessa muuttuu ajan<br />

kuluessa. Matemaattisesti voimme ilmaista tämän<br />

sanomalla, että kappaleen paikkaa kuvaava radiusvektori<br />

r on ajan t funktio r(t), ts. vektorin<br />

r(t) = x(t)i+y(t)j+z(t)k<br />

komponentit x, y ja z riippuvat yhdestä muuttujasta t.<br />

Samoin yhden muuttujan, ajan, vektorifunktioita ovat<br />

myös kyseisen kappaleen nopeus ja kiihtyvyys. Usein<br />

puhutaan lyhyesti vain vektorifunktioista kun<br />

tarkoitetaan yhden muuttujan vektoriarvoisia funktioita.<br />

7.1.1 Vektorifunktion derivaatta<br />

Olkoon A(u) jokin yhden muuttujan u vektorifunktio<br />

A(u) = A x (u)i+A y (u)j+A z (u)k.<br />

) K <br />

Kuva 7.1 Vektorin derivaatta<br />

) K , K ) K <br />

) K , K <br />

Vektorifunktion derivaatta määritellään analogisesti<br />

skalaarifunktion derivaatan kanssa eli<br />

dA(u)<br />

du<br />

= lim<br />

∆u→0<br />

A(u+∆u)−A(u)<br />

. (7.1)<br />

∆u<br />

Kirjoitetaan määritelmä (7.1) komponenteittain,<br />

dA(u)<br />

du<br />

[<br />

Ax (u+∆u)−A x (u)<br />

= lim<br />

i<br />

∆u→0 ∆u<br />

+ A y(u+∆u)−A y (u)<br />

j<br />

∆u<br />

+ A ]<br />

z(u+∆u)−A z (u)<br />

k<br />

∆u<br />

= dA x(u)<br />

du i+ dA y(u)<br />

du j+ dA z(u)<br />

du k,<br />

jolloin nähdään, että vektorifunktio derivoidaan<br />

derivoimalla sen komponentit.<br />

Esim. Nopeus v, v, kiihtyvyys a ja a kun paikka on<br />

r = sinti+costj+k<br />

Nopeus on nyt<br />

v = dr<br />

dt = ṙ = dx(t)<br />

dt<br />

= costi−sintj.<br />

Vauhti puolestaan on<br />

v = |v| =<br />

i+ dy(t)<br />

dt<br />

√<br />

cos 2 t+sin 2 t = 1.<br />

Kiihtyvyys saadaan derivoimalla nopeus,<br />

ja sen itseisarvo on<br />

j+ dz(t)<br />

dt<br />

a = dv<br />

dt = v . .ṙ<br />

= = −sinti−costj,<br />

a = |a| =<br />

√<br />

sin 2 t+cos 2 t = 1.<br />

Derivaatan ominaisuuksia<br />

Olkoot A(u) ja B(u) muuttujan u vektorifunktioita.<br />

Lasketaan pistetulon A·B derivaatta:<br />

dA·B<br />

du<br />

= d<br />

du (A xB x +A y B y +A z B z )<br />

= dA x<br />

du B dB x<br />

x +A x<br />

du<br />

=<br />

+ dA y<br />

du B dB y<br />

y +A y<br />

du<br />

+ dA z<br />

du B dB z<br />

z +A z<br />

(<br />

du<br />

dAx<br />

du i+ dA y<br />

du j+ dA )<br />

z<br />

du k ·<br />

(B x i+B y j+B z k)<br />

+(A x i+A y j+A z k)·<br />

( dBx<br />

du i+ dB y<br />

du j+ dB )<br />

z<br />

du k<br />

= dA<br />

du<br />

·B+A· dB<br />

du .<br />

Näemme, että pistetulon derivointiin soveltuu<br />

skalaarifunktioista tuttu derivointisääntö (2.17) kunhan<br />

vain korvataan tavallinen tulo pistetulolla.<br />

Yleensäkin on helppo todeta, että luonnollisella tavalla<br />

modifioidut tutut säännöt ovat voimassa myös vektoreille:<br />

d<br />

(αA+βB) = αdA<br />

du<br />

d(φA)<br />

du<br />

d(A·B)<br />

du<br />

d(A×B)<br />

du<br />

du +βdB du<br />

= dφ<br />

du A+φdA du<br />

= dA<br />

du<br />

= dA<br />

du<br />

dB ·B+A·<br />

du<br />

dB<br />

×B+A×<br />

k<br />

du . (7.2)<br />

48


6<br />

+<br />

Tässä α ja β ovat mielivaltaisia skalaarivakioita ja φ(u)<br />

mielivaltainen derivoituva muuttujan u skalaarifunktio.<br />

Analogisesti skalaarifunktion differentiaalin kanssa<br />

määrittelemme vektorifunktion differentiaalin:<br />

dA = idA x +jdA y +kdA z .<br />

Koska vektorin komponentit A i ovat nyt vain yhden<br />

muuttujan u funktioita, ovat niiden differentiaalit muotoa<br />

du ja vektorin A(u) differentiaali niin ollen<br />

dA i<br />

du<br />

( dAx<br />

dA = du<br />

du i+ dA y<br />

du j+ dA )<br />

z<br />

du k<br />

7.1.2 Avaruuskäyrät<br />

Tangentti<br />

Olkoon<br />

r(u) = x(u)i+y(u)j+z(u)k<br />

= dA du. (7.3)<br />

du<br />

muuttujasta u riippuva paikkavektori. Muuttujan u<br />

käydessä läpi arvoalueensa vektorin r kärki piirtää<br />

käyrän kolmiulotteisessa avaruudessamme. Derivaatta dr<br />

du<br />

on konstruktionsa perusteella (kuva 7.1) ilmeisestikin<br />

tämän käyrän pisteeseen r(u) piirretyn tangentin<br />

suuntainen. Käyrän tangentin suuntainen yksikkövektori<br />

T on niin ollen<br />

T = dr<br />

du /|dr |. (7.4)<br />

du<br />

@ H<br />

H K <br />

on käyrän tangentin suuntainen. Tämän vektorin pituus<br />

on ∣ ∣∣∣ dr<br />

dt∣ = √ (2t) 2 +16+(4t−6) 2 ,<br />

joten yksikkötangentti on<br />

T = dr /∣ ∣∣∣ dr<br />

dt dt∣ = √ 2ti+4j+(4t−6)k<br />

(2t)2 +16+(4t−6) 2.<br />

Erikoisesti pisteessä, missä t = 2, yksikkötangentti on<br />

T = 4i+4j+2k √<br />

42 +4 2 +2 2 = 2 3 i+ 2 3 j+ 1 3 k.<br />

Koska derivaatta dr<br />

du<br />

on yksikkötangentin suuntainen, niin<br />

toki silloin myös differentiaali<br />

dr = du dr<br />

du<br />

on yksikkötangentin suuntainen. Voimme siis kirjoittaa<br />

dr = Tds<br />

missä olemme symbolilla ds merkinneet differentiaalin dr<br />

pituutta<br />

ds = |dr| = √ dx 2 +dy 2 +dz 2 .<br />

Voimme siis kirjoittaa yksikkötangentin myös muodossa<br />

T = dr<br />

ds . (7.5)<br />

Kaaren pituus<br />

Differentiaali ds oli infinitesimaalisen muutoksen dr<br />

suuruus. Koska muutos dr oli käyrän tangentin<br />

suuntainen, on ds siten käyrän kaaren pituuden s<br />

infinitesimaalinen muutos.<br />

Kuva 7.2 Käyrän tangentti<br />

Esim. Käyrän x = t 2 +1, y = 4t−3, z = 2t 2 −6t<br />

yksikkötangentti kun t = 2<br />

Käyrän piirtää vektorin<br />

I <br />

I I @ I<br />

@ H<br />

r = xi+yj+zk<br />

= (t 2 +1)i+(4t−3)j+(2t 2 −6t)k<br />

kärki kun t käy läpi kaikki arvonsa (kun muuta ei ole<br />

sanottu, arvoalueena on yleensä koko reaalilukualue).<br />

Paikkavektorin derivaatta<br />

dr<br />

dt<br />

= i d dt (t2 +1)+j d dt (4t−3)+k d dt (2t2 −6t)<br />

= 2ti+4j+(4t−6)k<br />

Kuva 7.3 Käyrän kaaren pituus<br />

Käyrän C kaaren pituus s saadaan summaamalla pitkin<br />

käyrää laskettuja differentiaalisia kaaren pituuksia.<br />

Formaalisti voimme ilmaista tämän, kuten<br />

∫<br />

s = ds. (7.6)<br />

C<br />

49


Käyrän ulottuessa äärettömyyteen on yleensä on myös<br />

spesifioitava integroinnin alkukohta eli kaaren pituuden<br />

nollakohta. Kuvassamme tämä voisi olla vaikkapa piste s 0 .<br />

Laskettaessa kaaren pituutta kaavalla (7.6) integroinnin<br />

suunnaksi otetaan differentiaalin dr suunta eli tangentin<br />

suunta. Pituus s siis kasvaa kun edetään käyrällä<br />

tangentin osoittamaan suuntaan. Jos nyt käyrän yhtälö<br />

on annettu muodossa<br />

r = r(u),<br />

niin tangentti osoittaa vektorin<br />

dr = dr du = r(u+du)−r(u)<br />

du<br />

suuntaan eli suuntaan johon u kasvaa. Pituus s on siten<br />

muuttujan u kasvava funtio ja derivaatta ds<br />

du silloin<br />

positiivinen. Differentiaali ds oli määritelty itseisarvona<br />

|dr|, joten on<br />

ds = |dr| =<br />

dr<br />

∣du∣ du,<br />

kun du > 0. Toisaalta derivaatta ds<br />

du<br />

oli positiivinen, joten<br />

voimme kirjoittaa ∣ ∣∣∣ dr<br />

du∣ = ds<br />

du . (7.7)<br />

Jos ratkaisemme relaatiosta s = s(u) muuttujan u<br />

pituuden s funktiona, u = u(s), niin voimme pitää käyrää<br />

piirtävää vektoriakin kaaren pituuden funktiona: r = r(s).<br />

Esim. Käyrän x = sint, y = cost, z = 0 kaaren pituus<br />

lähtien pisteestä, missä t = 0<br />

Käyrän piirtää vektori<br />

r = isint+jcost+0k = isint+jcost.<br />

Differentiaali dr on<br />

dr = dr dt = (icost−jsint)dt<br />

dt<br />

ja differentiaali ds siten<br />

√<br />

ds = |dr| = cos 2 t+sin 2 tdt = √ 1dt = dt,<br />

kun etenemme muuttujan t kasvavaan suuntaan (dt > 0).<br />

Kaaren pituus on siis<br />

∫<br />

s(t) =<br />

C<br />

ds =<br />

∫ t<br />

0<br />

dt = t.<br />

Kaarevuussäde<br />

Avaruuskäyrän r = r(s), s kaaren pituus,<br />

yksikkötangentti on kaavan (7.5) mukaisesti<br />

T = dr<br />

ds .<br />

Vektori T on sekin kaaren pituuden s funktio, joten<br />

voimme laskea derivaatan<br />

Olkoon nyt N vektorin dT<br />

ds<br />

missä on merkitty<br />

Voimme siis kirjoittaa<br />

dT<br />

ds = d2 r<br />

ds 2.<br />

N = 1 κ<br />

suuntainen yksikkövektori<br />

dT<br />

ds ,<br />

κ =<br />

dT<br />

∣ds∣ . (7.8)<br />

dT<br />

ds<br />

= κN. (7.9)<br />

Suuretta κ sanotaan käyrän kaarevuudeksi ja sen<br />

käänteisarvoa<br />

ρ = 1 κ = 1<br />

∣ dT<br />

∣<br />

ds<br />

(7.10)<br />

käyrän kaarevuussäteeksi. Yksikkötangentti T on nimensä<br />

mukaisesti yksikön mittainen, joten on<br />

T 2 = T·T = |T| 2 = 1.<br />

Derivoidaan relaatio T·T = 1 kaaren pituuden suhteen,<br />

jolloin saadaan<br />

d dT dT<br />

(T·T) = ·T+T·<br />

ds ds ds<br />

= 2κT·N = 0,<br />

= 2T· dT<br />

ds<br />

kun on sijoitettu lauseke (7.9). Päädymme yhtälöön<br />

T·N = 0, (7.11)<br />

eli vektori N on kohtisuorassa tangenttia T vastaan ja<br />

siten myös kohtisuorassa ko. avaruuskäyrää vastaan.<br />

Tämän vuoksi vektoria N sanotaan käyrän<br />

päänormaaliksi.<br />

Esim. Käyrän x = 3cost, y = 3sint, z = 4t<br />

yksikkötangentti, päänormaali, kaarevuus ja<br />

kaarevuussäde<br />

Käyrän<br />

r = i3cost+j3sint+k4t<br />

eräs tangentti on<br />

dr<br />

dt = −i3sint+j3cost+k4.<br />

Normitetaan tämä, ts. muodostetaan yksikön mittainen<br />

saman suuntainen vektori jakamalla vektori pituudellaan.<br />

50


Tangentin pituus on<br />

dr<br />

∣dt∣ = √ (−3sint) 2 +(3cost) 2 +4 2<br />

√<br />

= 9(sin 2 t+cos 2 t)+16<br />

= √ 9+16 = 5.<br />

Yksikkötangentti on siten<br />

T = −i3sint+j3cost+k4 ∣<br />

∣dr∣<br />

Yksikkötangentiksi saatiin siis<br />

dt<br />

= −i 3 5 sint+j3 5 cost+k4 5 .<br />

T = −i 3 5 sint+j3 5 cost+k4 5 .<br />

Derivoidaan tämä muuttujan t suhteen:<br />

dT<br />

dt = −i3 5 cost−j3 5 sint.<br />

Toisaalta, koska kaaren pituus s on jokin muuttujan t<br />

funktio, voimme ketjusäännön perusteella kirjoittaa<br />

joten<br />

dT<br />

dt = dT ds<br />

ds dt ,<br />

dT<br />

ds = dT / ds<br />

dt dt<br />

Aikaisemmin (kaava (7.7)) totesimme, että kaaren<br />

pituuden derivaatta käyrää parametrisoivan muuttujan<br />

suhteen noudattaa kaavaa<br />

∣ ds ∣∣∣<br />

dt = dr<br />

dt∣<br />

eli<br />

dT<br />

ds = dT<br />

dt<br />

/∣ ∣∣∣ dr<br />

dt∣<br />

Määritelmän (7.9) mukaan on siis<br />

κN = dT<br />

ds = dT /∣ ∣∣∣ dr<br />

dt dt∣<br />

= −i3 5 cost−j3 5 sint<br />

5<br />

= −i 3<br />

25 cost−j 3<br />

25 sint.<br />

Kaarevuus<br />

Koska N on yksikön mittainen, on voimassa<br />

dT<br />

∣ds∣ = |κ||N| = κ, κ ≥ 0.<br />

on silloin<br />

√ ( ) 2 3<br />

κ = (sin 2 t+cos<br />

25<br />

2 t) = 3<br />

25<br />

ja kaarevuussäde<br />

ρ = 1 κ = 25 3 .<br />

Esim. Ympyräliike<br />

Ajan t funktiona massapisteen paikkavektori olkoon<br />

r = r(t). Nopeus on tällöin<br />

v = dr<br />

dt = ṙ.<br />

Kun piste kulkee pitkin origokeskeisen R säteisen<br />

ympyrän kehää, on vektorin r pituus vakio R: |r| = R tai<br />

Tämän derivointi antaa<br />

r·r = R 2 .<br />

2ṙ·r = 2v·r = 0.<br />

Nopeus on kohtisuorassa radiusvektoria r vastaan (eli<br />

kohtisuorassa ympyrän sädettä vastaan, ympyrän<br />

tangentin suuntainen).<br />

Tarkastellaan erikoisesti sellaista xy-tason liikettä, missä<br />

r = iRcosωt+jRsinωt<br />

kun ω on vakio. Nyt<br />

√<br />

|r| = R 2 (cos 2 ωt+sin 2 ωt) = R,<br />

joten kyseessä on ympyräliike.<br />

Nopeus on<br />

v = ṙ = −iRωsinωt+jRωcosωt.<br />

Kuten todettiin, tämä on kohtisuorassa paikkavektoria r<br />

vastaan. Vauhti on nyt<br />

√<br />

|v| = (ωR) 2 (cos 2 ωt+sin 2 ωt) = ωR,<br />

joten liikkeen vauhtikin on vakio. Kiihtyvyys taas on<br />

a = . v = −iRω 2 cosωt−jRω 2 sinωt.<br />

Vauhdin vakioisuudesta (v·v = ω 2 R 2 = vakio) seuraa<br />

että kiihtyvyys on kohtisuorassa nopeutta vastaan (ja<br />

siten joko radiusvektorin suuntainen tai sille<br />

vastakkaissuuntainen). Itseasiassa näemme, että<br />

a = −ω 2 r.<br />

Kiihtyvyyden suuruus on sekin vakio, sillä<br />

|a| = |−ω 2 r| = ω 2 R.<br />

51


7.2 Gradientti, divergenssi, roottori<br />

Osittaisderivaatta ja kentät<br />

Olkoon f koordinaattipisteen r = (x,y,z) funktio,<br />

f(r) = f(x,y,z). funktion osittaisderivaattaa esim.<br />

muuttujan x suhteen merkitään<br />

∂f(r)<br />

∂x = ∂f(x,y,z) = ∂ x f(r)<br />

∂x<br />

ja se lasketaan derivoimalla x:n suhteen pitämällä muut<br />

muuttujat vakiona.<br />

Esim. Olkoon f(x,y,z) = xyz +x 2 y. Nyt<br />

∂f ∂f<br />

= yz +2xy,<br />

∂x<br />

∂y = xz +x2 ,<br />

∂f<br />

∂z = xy<br />

Avaruudessa (x,y,z) ∈ R 3 tai sen osajoukossa<br />

määriteltyä funktiota kutsutaan usein kentäksi.<br />

Jos f on reaaliluku, f(r) ∈ R, kyseessä on skalaarifunktio<br />

eli skalaarikenttä, jos taas funktio on vektori,<br />

⃗v(r) = iv x (r)+jv y (r)+kv z (r) ∈ R 3 , kyseessä on<br />

vektorifunktio eli vektorikenttä.<br />

Esim. skalaarikenttiä (-funktioita) ovat ilman paikallinen<br />

lämpötila T(r), paine p(r), sähkövarauksen tiheys ρ(r).<br />

Vektorikenttiä ovat esim. kaasun (nesteen) virtausnopeus<br />

v(r), sähkökenttä E(r), sähkövirran tiheys J(r)...<br />

Nabla<br />

Määritellään “derivaattavektori” nabla:<br />

∇ ≡ i ∂<br />

∂x +j ∂ ∂y +k ∂ ∂z = ∑ i<br />

ê i<br />

∂<br />

∂x i<br />

(7.12)<br />

Nabla ∇ on siis yhtä aikaa derivaatta ja vektori. Sillä<br />

voidaan operoida skalaari- tai vektorifunktioihin:<br />

∇f(r) gradientti (vektori)<br />

∇·v(r) divergenssi (skalaari)<br />

∇×v(r) roottori (vektori)<br />

7.2.1 Gradientti<br />

Olkoon φ(r) skalaarifunktio. Funktion gradientti on<br />

vektorifunktio<br />

∇φ = ∂φ ∂φ ∂φ<br />

i+ j+<br />

∂x ∂y ∂z k = ∑ i<br />

ê i<br />

∂φ<br />

∂r i<br />

(7.13)<br />

Graafisesti: gradientti ∇f(r) on vektori, joka on<br />

kohtisuorassa pintaa f(r) = vakio vastaan, ja |∇f| kertoo<br />

kuinka nopeasti funktio muuttuu ko. suuntaan.<br />

Vielä havainnollisemmin: kartta ja korkeuskäyrät<br />

(kahdessa ulottuvuudessa): olkoon φ(x,y) maaston<br />

korkeus koordinaattipisteessä (x,y). Nyt yhtälö<br />

φ(x,y) = vakio määrittelee korkeuskäyrän, jossa korkeus<br />

on vakio, ja ∇φ osoittaa suuntaan mihin φ kasvaa<br />

jyrkimmin. |∇φ|:n pituus on korkeuden kulmakerroin<br />

∇φ:n suuntaan.<br />

φ=vakio<br />

φ=vakio<br />

Kuva 7.4 Gradientti ∇φ<br />

∆<br />

φ<br />

tangenttitaso<br />

Todistus: tehdään pieni muutos r → r+∆r. Nyt<br />

f(r+∆r) = f(x+∆x,y +∆y,z +∆z)<br />

= f(r)+ ∂f ∂f ∂f<br />

∆x+ ∆y +<br />

∂x ∂y ∂z ∆z +O(∆2 )<br />

= f(r)+(∇f)·(∆r)<br />

Pistetulosta näkee, että funktion muutos<br />

∆f = f(r+∆r)−f(r)<br />

on suurin, kun ∆r ‖ ∇f<br />

on = 0, kun ∆r ⊥ ∇f<br />

Siis:<br />

– pinnan f = vakio yksikkönormaali on ∇f/|∇f|<br />

– pinnan f = vakio tangenttitaso on vektoria ∇f<br />

kohtisuoraan<br />

– funktion f kasvunopeus suuntaan ˆn on ˆn·∇f (ˆn<br />

yksikkövektori)<br />

Näistä viimeisimmän näkee valitsemalla yllä ∆r ‖ ˆn.<br />

Esim. Funktion φ(x,y,z) = 3x 2 y −y 3 z 2 gradientti ∇φ<br />

pisteessä (1,−2,−1)<br />

Gradientti mielivaltaisessa pisteessä (x,y,z) on<br />

∇φ =<br />

(<br />

i ∂<br />

∂x +j ∂ ∂y +k ∂ ∂z<br />

)<br />

(3x 2 y −y 3 z 2 )<br />

= i ∂<br />

∂x (3x2 y −y 3 z 2 )+j ∂ ∂y (3x2 y −y 3 z 2 )<br />

+k ∂ ∂z (3x2 y −y 3 z 2 )<br />

= 6xyi+(3x 2 −3y 2 z 2 )j−2y 3 zk,<br />

joten pisteessä (1,−2,−1) se on<br />

∇φ = 6(1)(−2)i+(3(1) 2 −3(−2) 2 (−1) 2 )j<br />

−2(−2) 3 (−1)k<br />

= −12i−9j−16k.<br />

Suunnattu derivaatta<br />

Edellisestä esimerkistä yleistäen voimme todeta, että<br />

skalaarikentän φ muutos pituusyksikköä kohti suunnassa<br />

52


n, |n| = 1, on ∇φ·n. Sanomme, että suure<br />

n·∇φ = (∇φ)·n, |n| = 1 (7.14)<br />

on funktion φ suunnattu derivaatta (suuntaan n). Kuten<br />

olemme nähneet, suunnattu derivaatta on suurimmillaan<br />

gradientin suunnassa.<br />

Huom: voimme kirjoittaa derivaattaoperaattorin<br />

suuntaan n<br />

n·∇ = ∑ ∂<br />

n i<br />

∂r<br />

i i<br />

Jos esim. n ‖ i, saamme tavallisen osittaisderivaatan x:n<br />

suuntaan.<br />

Esim. Funktion φ = x 2 yz +4xz 2 derivaatta pisteessä<br />

(1,−2,−1) suuntaan 2i−j−2k<br />

Gradientti pisteessä (1,−2,−1) on<br />

∇φ = (2xyz +4z 2 )i+x 2 zj+(x 2 y +8xz)k<br />

= (2(1)(−2)(−1)+4(−1) 2 )i<br />

+(1) 2 (−1)j+((1) 2 (−2)+8(1)(−1))k<br />

= 8i−j−10k.<br />

Vektorin A = 2i−j−2k suuntainen yksikkövektori on<br />

a = A A = 2i−j−2k √<br />

22 +1 2 +2 2<br />

= 2 3 i− 1 3 j− 2 3 k.<br />

Tähän suuntaan laskettu derivaatta on<br />

∇ a φ = ∇φ·a<br />

= (8i−j−10k)·( 2 3 i− 1 3 j− 2 3 k)<br />

= 16 3 + 1 3 + 20<br />

3 = 37 3 .<br />

7.2.2 Divergenssi<br />

Olkoon nyt v(r) = (v x (r),v y (r),v z (r)) vektorikenttä.<br />

Vektorikentän divergenssi on<br />

∇·v) = (i ∂<br />

∂x +j ∂ ∂y +k ∂ ∂z )·(iv x +jv y +kv x )<br />

= ∂v x<br />

∂x + ∂v y<br />

∂y + ∂v z<br />

∂z<br />

Graafisesti: vektorikentän divergenssi on<br />

(yksikkötilavuudessa) syntyvän vuon (vesi!) määrä:<br />

∇·v > 0, lähde (source))<br />

∇·v < 0, nielu (sink)<br />

Jos ∇·v = 0 koko määrittelyjoukossa, sanotaan että<br />

vektorikenttä v on lähteetön<br />

Katsotaan esimerkkinä nesteen virtausta tarkemmin. Jokaisessa<br />

avaruuden pisteessä (ajattelemme nestettä jatkuvasti<br />

jakautuneena aineena unohtaen sen atomaarisen rakenteen)<br />

r = (x,y,z) neste virtaa paikasta riippuvalla nopeudella<br />

v =v(r) = v x(x,y,z)i+v y(x,y,z)j+v z(x,y,z)k.<br />

Jos nesteen massatiheys on ρ (kg/m 3 ), massavirtatiheys µ<br />

((kg/m 3 )(m/s)=kg/(m 2 s)) pisteessä r on<br />

µ = ρv.<br />

N O <br />

N O @ <br />

<br />

N<br />

<br />

N O @ <br />

@ O<br />

Kuva 7.5 Divergenssin tulkinta<br />

<br />

O<br />

@ N<br />

@ <br />

Katsotaan, mitä massavirralle tapahtuu pisteen r<br />

infinitesimaalisessa ympäristössä. Kuvitellaan tätä tarkoitusta<br />

varten ko. piste sijoitetuksi sellaisen suorakulmaisen särmiön<br />

keskelle, jonka särmien pituudet ovat dx, dy ja dz. Virta µ tuo<br />

särmiön pohjan kautta materiaa virtatiheydellä µ z(x,y,z−dz/2),<br />

joten kaiken kaikkiaan pohjan läpi virtaa aikayksikössä särmiöön<br />

materiaa määrä µ z(x,y,z −dz/2)dxdy (kg/s). Vastaavasti<br />

kannen läpi poistuu aikayksikössä materiamäärä<br />

µ z(x,y,z +dz/2)dxdy. Näiden virtausten seurauksena särmiön<br />

nestemäärän vähenemä aikayksikössä on<br />

dm z<br />

= µ z(x,y,z +dz/2)dxdy<br />

=<br />

−µ z(x,y,z −dz/2)dxdy<br />

[<br />

µ ∂µz(x,y,z) dz<br />

z(x,y,z)+<br />

∂z 2<br />

[<br />

− µ ∂µz(x,y,z)<br />

z(x,y,z)+<br />

∂z<br />

]<br />

dxdy<br />

(<br />

− dz 2<br />

)]<br />

dxdy<br />

= ∂µz<br />

∂z dxdydz.<br />

Differentiaalien tulo dxdydz on infinitesimaalisen särmiömme<br />

(infinitesimaalinen) tilavuus<br />

dV = dxdydz.<br />

Pohjan ja pinnan läpi suuntautuvien virtausten aiheuttama<br />

massan nettomuutos (nettopoistuma) aikayksikössä tilavuudessa<br />

dV on siten<br />

dm z = ∂µz<br />

∂z dV.<br />

Vastaava lasku osoittaa, että xz- ja yz-suuntaisten pintojen läpi<br />

kulkevat virrat aiheuttavat aikayksikössä nettopoistumat<br />

dm y<br />

= ∂µy<br />

∂y dV<br />

dm x = ∂µx<br />

∂x dV.<br />

Massan kokonaismuutos aikayksikössä tilavuusalkiossa dV on<br />

siten<br />

dm = dm x +dm y +dm z<br />

( ) ∂µx<br />

=<br />

∂x + ∂µy<br />

∂y + ∂µz dV.<br />

∂z<br />

53


Vektorimerkintää käyttäen voimme kirjoittaa tämän muotoon<br />

(<br />

dm = i ∂<br />

∂x +j ∂<br />

∂y +k ∂ )<br />

·(µ xi+µ yj+µ zk)dV.<br />

∂z<br />

Kun huomaamme, että skalaaritulon ensimmäinen tekijä on<br />

operaattori ∇, saamme tämän kompaktimpaan muotoon<br />

dm = ∇·µdV.<br />

Massatieyden muutos dm/dV pisteessä (x,y,z)<br />

voi aiheutua mm. siitä, että<br />

dm/dV = ∇·µ<br />

• neste puristuu kokoon tai laajenee, jolloin ∂ρ<br />

∂t ≠ 0,<br />

• ko. pisteeseen ruiskutetaan lisää nestettä eli pisteessä on<br />

lähde tai ko. pisteestä poistetaan nestettä eli pisteessä on<br />

nielu.<br />

Massatiheyden muutos (pienennys) voidaan siten ilmaista kahden<br />

termin summana<br />

dm/dV = − ∂ρ<br />

∂t +ψ,<br />

missä jälkimmäinen termi ψ kuvaa nielujen ja lähteiden<br />

vaikutusta. Näin olemme johtaneet nesteiden (ja kaasujen)<br />

virtausta hallitsevan kontinuiteettiyhtälön<br />

∇·(ρv)+ ∂ρ = ψ, (7.15)<br />

∂t<br />

muistaen, että massavirtatiheys oli µ = ρv.<br />

Sähkömagnetismi, Maxwellin yhtälöt:<br />

∇·E = 1 ǫ 0<br />

ρ<br />

∇·B = 0<br />

Tässä E on sähkökenttä, B magneettikenttä, ρ<br />

sähkövaraustiheys (lähde sähkökentälle!). Magneettisia<br />

varauksia ei ole olemassa (magneettinen monopoli), joten<br />

magneettikentän lähdetermi = 0, ja magneettikenttä on<br />

lähteetön.<br />

7.2.3 Roottori<br />

Vektorikentän v(r) roottori ∇×v lasketaan seuraavasti:<br />

∣ i j k ∣∣∣∣∣<br />

∇×v =<br />

∂ x ∂ y ∂ z (7.16)<br />

∣ v x v y v z<br />

= i(∂ y v z −∂ z v y )−j(∂ x v z −∂ z v x )<br />

+ k(∂ x v y −∂ y v x ) (7.17)<br />

Tämä on siis tavallinen ristitulo vektoreille, mutta<br />

derivaatta vaikuttaa aina eteenpäin, “alariville”:<br />

∣ ∂ ∣<br />

x ∂ y ∣∣∣<br />

= ∂<br />

v x v y −∂ y v x<br />

y<br />

v x<br />

Roottori kuvaa vektorikentän pyörteisyyttä:<br />

Esim. v = xi+yj+zk<br />

∇·v = 3 lähde (kaikilla r!)<br />

∇×v = i(∂ y z −∂ z y)−j(∂ x z −∂ z x)+k(∂ x y −∂ y x) = 0<br />

Kyseessä on pyörteetön kenttä<br />

Esim. v = −yi+xj<br />

∇·v = 0 lähteetön<br />

∇×v = 2k ≠ 0, pyörre<br />

Esim. Maxwellin yhtälöt:kuvaavat sähködynamiikkaa<br />

∇·E = 1 ǫ 0<br />

ρ<br />

∇·B = 0<br />

∇×B− 1 c 2 ∂E<br />

∂t = µ 0j<br />

∇×E+ ∂B<br />

∂t = 0<br />

E sähkö, B magneettikenttä, ρ sähkövaraustiheys, j<br />

sähkövirrantiheys, c valon nopeus, ǫ 0 tyhjiön<br />

permittiivisyys ja µ 0 permeabiliteetti (vakioita).<br />

Vektorikenttä v on pyörteetön, jos ∇×v = 0.<br />

Esim. r on pyörteetön:<br />

∇×r =<br />

∣<br />

i j k<br />

∂ x ∂ y ∂ z<br />

x y z ∣ = 0<br />

Esim. Gradientti ∇f(r) on pyörteetön:<br />

∇×(∇f) = (∇×∇)f = 0<br />

(näin voidaan tehdä, sillä ∇:n vektorikomponentit<br />

menevät tavallisen ristitulon tapaan, ja derivaatat kaikki<br />

vaikuttavat f:ään.)<br />

Huom: usein käytetään derivaattaoperaattoreita v·∇ ja<br />

v×∇. Näissä ei derivoida v:tä, derivaatta ei ole vielä<br />

operoinut! Siis esim.<br />

v·∇ = ∑ i v i∂ i<br />

v×∇ = i(v y ∂ z −v z ∂ y )+j...<br />

Laplacen operaattori<br />

Määritellään<br />

∇·∇ ≡ ∇ 2 = ∂ 2 x +∂ 2 y +∂ 2 z = ∑ i<br />

∂ 2<br />

∂r 2 i<br />

Tämä on skalaaridifferentiaalioperaattori, jota käytetään<br />

usein fysiikassa.<br />

Roottori mikroskooppisesti<br />

Tarkastellaan jälleen ρ-tiheyksisen nesteen virtausta. Kun<br />

virtausnopeus pisteessä r = (x,y,z) on v(r), on µ = ρv<br />

massavirtatiheys tässä pisteessä. Tutkitaan tällä kertaa, miten<br />

pyörteellistä virtaus on. Katsotaan esimerkkinä pisteen (x,y,z)<br />

ympäri kiertyvää virtausta. Lasketaan erikseen nettokiertymät<br />

kunkin koordinaattitason suuntaisissa virtauksissa, esimerkkinä<br />

54


xy-tason suuntainen taso.<br />

O N @ N O <br />

N N O @ O <br />

N O <br />

N N O @ O <br />

Kuva 7.6 Virtauksen kiertymä<br />

O N @ N O <br />

Kuvitellaaan piste (x,y,z) (kuvassa z-koordinaattia ei ole<br />

merkitty) sijoitetuksi tässä tasossa dxdy-sivuisen suorakaiteen<br />

keskelle. Suorakaiteen alalaidalla kokonaisvirtaus positiiviseen<br />

kiertosuuntaan on µ x(x,y −dy/2,z)dx, oikeanpuoleista laidalla<br />

µ y(x+dx/2,y,z)dy, ylälaidalla −µ x(x,y +dy/2,z)dx ja<br />

vasemmanpuoleisella laidalla −µ y(x−dx/2,y,z)dy. z-akselin<br />

ympäri kiertyvä kokonaisvirtaus dS z (kg/(ms)) on näiden neljän<br />

termin summa<br />

dS z<br />

= µ x(x,y −dy/2,z)dx+µ y(x+dx/2,y,z)dy<br />

−µ x(x,y +dy/2,z)dx−µ y(x−dx/2,y,z)dy<br />

= [µ y(x+dx/2,y,z)−µ y(x−dx/2,y,z)]dy<br />

−[µ x(x,y +dy/2,z)−µ x(x,y −dy/2,z)]dx<br />

= ∂µy ∂µx<br />

dxdy −<br />

∂x ∂y dydx<br />

[ ] ∂µy<br />

=<br />

∂x − ∂µx dxdy. (7.18)<br />

∂y<br />

Jakamalla tämä suorakaiteen pinta-alalla dxdy saamme z-akselin<br />

ympäri aikayksikössä kiertyväksi massatiheydeksi<br />

s z = dSz<br />

dxdy = ∂µy<br />

∂x − ∂µx<br />

∂y .<br />

Menettelemme samoin kuin kulmanopeuden tapauksessa ja<br />

muodostamme pyörteisyydeksi sanotun vektorisuureen s z, jonka<br />

pituus ilmoittaa aikayksikössä kiertyvän massatiheyden määrän ja<br />

suunta kiertoakselin, ts.<br />

[ ] ∂µy<br />

s z = s zk =<br />

∂x − ∂µx k.<br />

∂y<br />

Vastaavasti x- ja y-akseleiden suuntaiset pyörteisyydet ovat<br />

[ ] ∂µz<br />

s x =<br />

∂y − ∂µy i<br />

∂z<br />

[ ] ∂µx<br />

s y =<br />

∂z − ∂µz j.<br />

∂x<br />

Vektoreiden s x, s y ja s z resultantin s pituus kertoo silloin<br />

pisteeseen (x,y,z) asetetun resultanttivektorin ympäri<br />

aikayksikössä kiertyvän massatiheyden kokonaismäärän.<br />

Virtauskentän pyörteisyys on siis<br />

[ ∂µz<br />

s =<br />

∂y − ∂µy<br />

∂z<br />

[ ∂µy<br />

+<br />

∂x − ∂µx<br />

∂y<br />

] [ ∂µx<br />

i+<br />

]<br />

k.<br />

∂z − ∂µz<br />

∂x<br />

]<br />

j<br />

Nähdään helposti että s voidaan kirjoittaa determinantin avulla<br />

muotoon<br />

∣ i j k ∣∣∣∣<br />

s ∂ ∂ ∂<br />

=<br />

∂x ∂y ∂z = ∇×µ<br />

∣ µ x µ y µ z<br />

Siis s on µ:n roottori.<br />

Laskusääntöjä<br />

Nablalle on helppo näyttää mm. seuraavat laskusäännöt:<br />

∇(a+b) = ∇a+∇b<br />

∇(ab) = (∇a)b+a(∇b)<br />

∇·(u+v) = ∇·u+∇·v<br />

∇·(au) = (∇a)·u+a∇·⃗u<br />

∇×(u+v) = ∇×u+∇×v<br />

∇×(au) = (∇a)×u+a∇×u<br />

∇×(∇a) = ∇×∇a = 0 eli ∇a on pyörteetön<br />

∇·(∇×v) = (∇×∇)·v = 0 eli ∇×v on lähteetön<br />

(tässä käytettiin skalaarikolmituloa,<br />

a·(b×c) = (a×b)·c<br />

Joskus esiintyy myös<br />

∇×(∇×u) = ∇(∇·u)−(∇·∇)u<br />

missä käytettiin vektorikolmitulon laskusääntöä.<br />

Siis sääntö: derivaattaosa - käytä derivoimissääntöjä,<br />

vektoriosa - vektoreiden laskusääntöjä.<br />

Huom: jos kehität ∇-lausekkeita skalaari- tai kolmitulon<br />

avulla, muista järjestys:<br />

Esim: u×(∇×v) = ∇(u c ·v)−(u·∇)v<br />

missä siis u c pidetään vakiona derivoinnissa.<br />

Samoin esim.<br />

∇·(u×v) = ∇·(u×v c )+∇·(u c ×v) = v·(∇×u)+u·(∇×v).<br />

Esim. Olkoon u = xyi+yzj+zxk.Nyt<br />

∇×(∇×u) = ∇(∇·u)−∇ 2 u = ∇(y+z+x)−0 = i+j+k<br />

Tai suoraan<br />

∇×u =<br />

∣<br />

ja<br />

∇×(∇×u) =<br />

∣<br />

i j k<br />

∂ x ∂ y ∂ z<br />

xy yz zk<br />

i j k<br />

∂ x ∂ y ∂ z<br />

−y −z −x<br />

= −iy −jz −kx<br />

∣<br />

Esim. ∇×A pisteessä (1−1,1), kun<br />

A = xz 3 i−2x 2 yzj+2yz 4 k<br />

Nyt<br />

( ∂<br />

∇×A =<br />

∂x i+ ∂ ∂y j+ ∂ )<br />

∂z k ×<br />

=<br />

=<br />

∣ = i+j+k<br />

(xz 3 i−2x 2 yzj+2yz 4 k)<br />

∣ i j k ∣∣∣∣∣<br />

∂ ∂ ∂<br />

∂x ∂y ∂z<br />

∣ xz 3 −2x 2 yz 2yz 4<br />

[ ∂<br />

∂y (2yz4 )− ∂ yz)]<br />

∂z (−2x2 i<br />

[ ∂<br />

−<br />

∂x (2yz4 )− ∂ ]<br />

∂z (xz3 ) j<br />

[ ∂<br />

+<br />

∂x (−2x2 yz)− ∂ ]<br />

∂y (xz3 ) k<br />

55


= (2z 4 +2x 2 y)i+3xz 2 j−4xyzk<br />

= (2(1) 4 +2(1) 2 (−1))i+3(1)(1) 2 j<br />

−4(1)(−1)(1)k<br />

= 3j+4k.<br />

Esim. ∇×(∇×A), kun A = x 2 yi−2xzj+2yzk<br />

Nyt<br />

i j k<br />

∇×(∇×A) = ∇×<br />

∂ ∂ ∂<br />

∂x ∂y ∂z<br />

∣ x 2 y −2xz 2yz ∣<br />

= ∇×[(2x+2z)i−(x 2 +2z)k]<br />

i j k<br />

=<br />

∂ ∂ ∂<br />

∂x ∂y ∂z<br />

∣ 2x+2z 0 −x 2 −2z ∣<br />

= (2x+2)j.<br />

ja<br />

∇ 21 r = ∇·(∇1 r ) = ∇·( r r 3) = 3 r 3 −3 r r 4 · r<br />

r = 0<br />

Jos pätee ∇ 2 f = 0, funktio f(r) on harmoninen.<br />

Samoin edelleen<br />

∇ 2 f(r) = ∇·∇f(r) = ∇·(f ′ (r) r r )<br />

= f ′′ (r) r r )· r<br />

r +f′ (r) 3 r −f′ (r) r r 2 · r<br />

r<br />

= f ′′ (r)+ 2 r f′ (r)<br />

7.2.4 Paikkavektorin derivaatat<br />

Paikkavektori on<br />

r = xi+yj+zk, r = √ x 2 +y 2 +z 2 = |r|<br />

Nyt saamme heti tulokset<br />

∇·r = ∑ i<br />

∂ i r i = ∑ i<br />

1 = 3 (7.19)<br />

∇×r = 0 (ks. aiemmin) (7.20)<br />

∇r = r = ˆr r:n suuntainen 1-vektori (7.21)<br />

r<br />

Viimeisin tulee siitä, että<br />

∂ x r = 1 2 (x2 +y 2 +z 2 ) −1/2 2x = x/r, joten<br />

∇r = ∑ i<br />

ê i ∂ i r = ∑ i<br />

ê i<br />

r i<br />

r = r r<br />

Jos nyt f(r) on r:n funktio, niin ketjusääntö saa muodon<br />

∇f(r) = f ′ (r)∇r = f ′ (r) r r<br />

Tämä tulee suoraan tavallisesta ketjusäännöstä:<br />

i∂ x f(r) = if ′ (r)∂ x r = if ′ (r)r/r.<br />

Näin esim<br />

∇·(rf(r)) = ∂ x (xf(r))+∂ y (yf(r))+∂ z (zf(r))<br />

tai suoraan:<br />

= 3f(r)+xf ′ (r) x r +yf′ (r) y r +zf′ (r) z r<br />

= 3f(r)+rf ′ (r)<br />

∇·(rf(r)) = f(r)∇·r+r·∇f(r) = 3f(r)+rf ′ (r)<br />

Usein tavataan<br />

∇ 1 r = d dr<br />

( 1<br />

r)<br />

∇r = − 1 r 2 r<br />

r = − r r 3<br />

56


+<br />

.<br />

)<br />

*<br />

8. Viiva-, pinta- ja<br />

tilavuusintegrointi<br />

8.1 Viivaintegraali<br />

Luvussa 7.1.2 käsiteltiin viivan pituuden integrointia.<br />

Tässä luvussa yleistetään integrointi avaruuskäyrää,<br />

viivaa pitkin. Olkoon meillä käyrä C, jonka piirtää<br />

paikkavektori<br />

r = r(u) = x(u)i+y(u)j+z(u)k.<br />

Oletamme edelleen, että pistettä A vastaa paikkavektori<br />

r(a) ja pistettä B paikkavektori r(b). Käyrällä C laskettu<br />

differentiaali dr on<br />

dr = idx+jdy +kdz = dr<br />

du du<br />

ja osoittaa, kuten aiemmin olemme nähneet (ks. (7.4)),<br />

käyrän tangentin suuntaan.<br />

Käyrää C pitkin voidaan muodostaa useita viiva- eli<br />

polkuintegraaleja:<br />

Jos f(r) on skalaarifunktio, saamme f:n integraalin<br />

viivan pituuden suhteen<br />

missä<br />

∫<br />

C<br />

f(r)ds =<br />

∣ √<br />

ds ∣∣∣<br />

du = dr<br />

( du∣ = dr x<br />

du<br />

∫ b<br />

a<br />

f(r) ds<br />

du du<br />

) 2<br />

+<br />

(dr y<br />

du<br />

) 2 (dr z<br />

) 2<br />

+<br />

du<br />

Jos f(r) = 1, integraali antaa käyrän C pituuden.<br />

Jos nyt F(r) on vektorifunktio, saamme erittäin yleisen<br />

viivaintegraalin<br />

) *<br />

H = <br />

H > <br />

@ H<br />

H K <br />

Kuva 8.1 Viivaintegraali<br />

∫<br />

C<br />

F(r)·dr<br />

∫<br />

= (F x dx+F y dy +F z dz) (8.1)<br />

=<br />

C<br />

∫ b<br />

a<br />

(<br />

dx(u)<br />

F x<br />

du +F dy(u)<br />

y<br />

du +F z<br />

)<br />

dz(u)<br />

du.<br />

du<br />

Geometrisesti viivaintegraali ∫ F·dr tarkoittaa vektorin<br />

C<br />

F käyrän C tangentin suuntaisten projektioiden summaa.<br />

Integrointitiellä on määrätty suunta: kussakin käyrän<br />

pisteessä etenemissuunta on sama kuin käyrällä lasketun<br />

differentiaalin suunta. Kun siis tien C kuvaaja on<br />

r = r(u), niin integrointi etenee parametrin u kasvavaan<br />

suuntaan. Jos nyt −C on muuten sama käyrä kuin C<br />

mutta suunnaltaan päinvastainen, niin näemme että<br />

∫ ∫<br />

F·dr = − F·dr, (8.2)<br />

−C<br />

sillä käyrällä C laskettu differentiaali on<br />

vastakkaisuuntainen käyrällä −C lasketulle<br />

differentiaalille.<br />

H = H = > > <br />

+ H K <br />

+ H = > K <br />

Kuva 8.2 Suunnan vaihto<br />

C<br />

H > H = > = <br />

Kuvassa integroinnin alku- ja loppupisteitä yhdistävä tie<br />

on C : r(u). Kuvan mukaisesti pistettä A vastaa<br />

paikkavektori r(a) ja pistettä B paikkavektori r(b). Jos<br />

nyt a > b, niin käyrän ja siis integroinnin suunta on<br />

pisteestä A pisteeseen B. Integroinnin suunnan kääntö<br />

voidaan toteuttaa helposti esimerkiksi vaihtamalla<br />

parametri u käyrän C kuvaajassa parametriksi a+b−u,<br />

ts. käännettyä integrointisuuntaa vastaava tie on<br />

−C : p(u) = r(a+b−u).<br />

Vielä selvemmäksi geometrinen merkitys käy, kun<br />

kirjoitamme differentiaalin dr muotoon<br />

dr = T(r)ds.<br />

Tässä T on käyrän yksikkötangentti ja s käyrän kaaren<br />

pituus (mitattuna jostakin pisteestä). Viivaintegraalissa<br />

esiintyvä skalaaritulo on tällöin<br />

F(r)·dr = |F(r)||T(r)|cosθds = F(r)cosθds,<br />

missä θ on vektorin F ja integrointitien tangentin välinen<br />

kulma. Viivaintegraali saadaan nyt muotoon<br />

∫ ∫<br />

F(r)·dr = F(r)cosθds.<br />

C<br />

Tästä muodosta nähdään esimerkiksi, että vektorin F<br />

ollessa massapisteeseen vaikuttava voima tarkoittaa<br />

viivaintegraali tehtyä työtä siirrettäessä massapistettä<br />

pitkin käyrää C.<br />

Esim. Integraali ∫ F·dr pitkin xy-tason käyrää y = 2x2<br />

C<br />

pisteestä (0,0) pisteeseen (1,2), kun F = 3xyi−y 2 j<br />

Parametrisoidaan käyrä C siten, että x = t ja y = 2t 2 .<br />

Tällöin alkupisteessä t = 0 ja loppupisteessä t = 1.<br />

C<br />

57


)<br />

)<br />

*<br />

*<br />

Differentiaali dr on<br />

dr = dxi+dyj<br />

(<br />

= i dx )<br />

dt +jdy dt<br />

dt<br />

= (i+4tj)dt.<br />

Viivaintegraali on siis<br />

∫ ∫<br />

F·dr = (3xyi−y 2 j)·(dxi+dyj)<br />

C<br />

=<br />

=<br />

=<br />

C<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

(3(t)(2t 2 )i−(2t 2 ) 2 j)·(i+4tj)dt<br />

(6t 3 −16t 5 )dt =<br />

[ 3<br />

2 − 8 3]<br />

−[0] = − 7 6 .<br />

1/ [ 6<br />

4 t4 − 16 ]<br />

6 t6<br />

Käyrää parametrisoivaksi muuttujaksi voidaan usein<br />

ottaa jokin muuttujista x, y tai z. Esimerkiksi xy-tason<br />

käyrät esitetään monesti muodossa<br />

y = y(x).<br />

Esim. Integraali ∫ F·dr pitkin xy-tason käyrää y = 2x2<br />

C<br />

pisteestä (0,0) pisteeseen (1,2), kun F = 3xyi−y 2 j<br />

Otetaan käyrää C parametrisoivaksi muuttujaksi x,<br />

jolloin y = 2x 2 . Alkupisteessä x = 0 ja loppupisteessä<br />

x = 1. Differentiaali dr on<br />

dr = dxi+dyj<br />

= dxi+j dy<br />

dx dx<br />

= (i+4xj)dx.<br />

Viivaintegraali on siis<br />

∫ ∫<br />

F·dr = (3xyi−y 2 j)·(dxi+dyj)<br />

C<br />

=<br />

=<br />

=<br />

C<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

(3x(2x 2 )i−(2x 2 ) 2 j)·(i+4xj)dx<br />

(6x 3 −16x 5 )dx =<br />

[ 3<br />

2 − 8 3]<br />

−[0] = − 7 6 .<br />

0<br />

1/<br />

0<br />

[ 6<br />

4 x4 − 16<br />

6 x6 ]<br />

Esim. Tehty työ siirrettäessä kappale xy-tasossa pisteestä<br />

A = (0,0) pisteeseen B = (2,1), kun kappaleeseen<br />

vaikuttava voima on F = xyi−y 2 j<br />

Nyt<br />

F·dr = (xyi−y 2 j)·(dxi+dyj) = xydx−y 2 dy.<br />

Tehty työ on<br />

∫<br />

W =<br />

C<br />

∫<br />

F·dr =<br />

a) Otetaan integrointitieksi suora<br />

jolloin<br />

C<br />

y = 1 2 x,<br />

dy = 1 2 dx.<br />

O N <br />

Kuva 8.3 Integrointitie a)<br />

Tehty työ on nyt<br />

W a =<br />

=<br />

=<br />

∫<br />

C<br />

∫ 2<br />

0<br />

∫ 2<br />

0<br />

(xydx−y 2 dy).<br />

(xydx−y 2 dy)<br />

[<br />

x 1 ( ) ] 2 1<br />

2 xdx− 2 x 1<br />

2 dx<br />

3<br />

8 x2 dx =<br />

2/<br />

0<br />

x 3<br />

8 = 1.<br />

b) Integroidaan ensin pitkin y-akselia pisteestä (0,0)<br />

pisteeseen (0,1) ja sitten x-akselin suuntaisesti pisteestä<br />

(0,1) pisteeseen (2,1).<br />

Kuva 8.4 Integrointitie b)<br />

Reitillä (0,0) → (0,1) on x = 0 ja dx = 0. Reitillä<br />

(0,1) → (2,1) taas on y = 1 ja dy = 0. Työ on siten<br />

W b =<br />

∫ 1<br />

y=0<br />

∫ 2<br />

+<br />

((0)y(0)−y 2 dy)<br />

x=0<br />

(x(1)dx−(1)(0))<br />

58


=<br />

1/<br />

0<br />

) (− y3<br />

+<br />

3<br />

2/<br />

0<br />

x 2<br />

2 = −1 3 +2 = 5 3 .<br />

Konservatiiviset kentät<br />

Edellisen esimerkin tapauksessa tehty työ riippui<br />

siirtoreitistä. Toisaalta hyvin monissa kiinnostavissa<br />

fysikaalisissa syteemeissä työ riippuu ainoastaan<br />

siirroksen alku- ja loppupisteistä mutta ei lainkaan näitä<br />

pisteitä yhdistävästä reitistä. Tällöin siis pisteitä P 1 ja P 2<br />

yhdistävää käyrää myöten laskettu voiman F<br />

viivaintegraali<br />

W =<br />

∫ P2<br />

P 1<br />

F·dr<br />

on tiestä riippumaton ja voimakentän F sanotaan olevan<br />

konservatiivinen.<br />

Oletetaan nyt, että kenttä F on konservatiivinen. Silloin<br />

pisteitä P 1 = (x 1 ,y 1 ,z 1 ) ja P = (x,y,z) yhdistävää tietä<br />

myöten laskettu viivaintegraali<br />

φ(x,y,z) =<br />

∫ (x,y,z)<br />

(x 1,y 1,z 1)<br />

F·dr<br />

määrittelee yksikäsitteisesti integrointitiestä<br />

riippumattoman ja vain integroinnin loppupisteestä<br />

(pidetään alkupistettä kiinnitettynä) riippuvan<br />

skalaarikentän φ. Olkoon<br />

r = u(t)<br />

jokin sellainen pisteitä P 1 ja P yhdistävä käyrä, että<br />

(x 1 ,y 1 ,z 1 ) = u(t 1 ) ja (x,y,z) = u(t).<br />

Tällä käyrällä on<br />

dr = du<br />

dt dt,<br />

joten tätä käyrää myöten laskettuna kentän φ arvoksi<br />

saadaan ∫ t<br />

φ(x,y,z) = F· du<br />

t 1<br />

dt dt.<br />

Kentän φ argumentteja voidaan näin pitää<br />

integrointimuuttujan t funktioina. Tällöin ensinnäkin<br />

integraalifunktion määritelmän (4.1) mukaan on<br />

dφ<br />

dt<br />

= F· du<br />

dt .<br />

Toiseksi, koska kentän φ differentiaali käyrällä r = u(t) on<br />

dφ = ∇φ·du,<br />

derivaatta parametrin t suhteen on kirjoitettavissa myös<br />

muotoon<br />

dφ du<br />

= ∇φ·<br />

dt dt .<br />

Näemme siis, että kenttä φ toteuttaa ehdon<br />

∇φ· du<br />

dt<br />

= F· du<br />

dt<br />

tai<br />

(∇φ−F)· du<br />

dt = 0.<br />

Koska u(t) oli mielivaltainen pisteitä P 1 ja P yhdistävä<br />

käyrä, täytyy olla<br />

F = ∇φ.<br />

Konservatiivinen kenttä on siis esitettävissä jonkin<br />

skalaarikentän gradienttina.<br />

Oletetaan nyt, että vektorikenttä F on skalaarikentän φ<br />

gradientti, ts.<br />

F = ∇φ.<br />

Lasketaan pisteestä P 1 pisteeseen P 2 pitkin käyrää C<br />

viivaintegraalia<br />

W =<br />

∫ P2<br />

P 1<br />

F·dr =<br />

∫ P2<br />

Skalaarifunktion φ differentiaali on<br />

P 1<br />

∇φ·dr.<br />

dφ(x,y,z) = ∇φ·dr,<br />

joten työ W on kirjoitettavissa muotoon<br />

Olkoon nyt<br />

W =<br />

∫ P2<br />

P 1<br />

dφ.<br />

r = r(t)<br />

sellainen käyrän C parametriesitys, että<br />

(x 1 ,y 1 ,z 1 ) = r(t 1 ) ja (x 2 ,y 2 ,z 2 ) = r(t 2 ).<br />

Tällä käyrällä kenttä φ saa arvot φ(x(t),y(t),z(t)) eli<br />

voimme pitää käyrällä kenttää yhden muuttujan t<br />

funktiona<br />

ψ(t) = φ(x(t),y(t),z(t)).<br />

Käyrällä laskettu differentiaali on<br />

dφ = dψ(t) = dψ(t) dt,<br />

dt<br />

eli pitkin käyrää C tehty työ on nyt<br />

W =<br />

∫ P2<br />

P 1<br />

dφ =<br />

∫ t2<br />

t 1<br />

dψ(t)<br />

dt<br />

dt<br />

= t2<br />

/<br />

t 1<br />

ψ(t) = ψ(t 2 )−ψ(t 1 )<br />

= φ(x 2 ,y 2 ,z 2 )−φ(x 1 ,y 1 ,z 1 ).<br />

Integraalin arvo riippuu näin ollen ainoastaan<br />

päätepisteistä eikä lainkaan valitusta integrointitiestä.<br />

59


Olemme johtaneet lauseen<br />

Integraali ∫ P 2<br />

P 1<br />

F·dr on riippumaton integrointitiestä (ts.<br />

F on konservatiivinen) jos ja vain jos kenttä F on<br />

esitettävissä jonkin skalaarifunktion φ gradienttina<br />

F = ∇φ.<br />

Eräs operaattoriin ∇ liittyvä ominaisuus oli<br />

∇×(∇φ) = 0<br />

olipa φ mikä tahansa skalaarikenttä. Jos siis kenttä F on<br />

konservatiivinen ja siten ilmaistavissa jonkin<br />

skalaarikentän gradienttina, sen roottori häviää:<br />

∇×F = 0.<br />

Oletetaan nyt että kentän F roottori on nolla, ts.<br />

∣ i j k ∣∣∣∣∣<br />

∇×F =<br />

∂ ∂ ∂<br />

∂x ∂y ∂z<br />

∣ F x F y F z<br />

( ∂Fz<br />

=<br />

∂y − ∂F ) (<br />

y ∂Fx<br />

i+<br />

∂z ∂z − ∂F z<br />

∂x<br />

+<br />

= 0.<br />

( ∂Fy<br />

∂x − ∂F x<br />

∂y<br />

)<br />

k<br />

)<br />

j<br />

Kentän komponenttien osittaisderivaatat toteuttavat siis<br />

ehdot<br />

∂F z<br />

∂y = ∂F y<br />

∂z , ∂F x<br />

∂z = ∂F z<br />

∂x ja ∂F y<br />

∂x = ∂F x<br />

∂y .<br />

Lasketaan viivaintegraali<br />

∫ ∫<br />

F·dr = (F x dx+F y dy +F z dz)<br />

C<br />

C<br />

pisteestä P 1 = (x 1 ,y 1 ,z 1 ) pisteeseen P = (x,y,z) pitkin<br />

käyrää C. Valitaan erikoisesti täksi käyräksi<br />

koordinaattiakselien suuntaiset viivasegmentit pisteestä<br />

(x 1 ,y 1 ,z 1 ) pisteeseen (x,y 1 ,y 2 ), siitä pisteeseen (x,y,z 1 )<br />

ja tästä lopuksi pisteeseen (x,y,z). Olkoon φ(x,y,z) tätä<br />

käyrää myöten laskettu viivaintegraalin arvo, ts.<br />

φ(x,y,z) =<br />

∫ x<br />

+<br />

+<br />

x 1<br />

F x (x,y 1 ,z 1 )dx<br />

∫ y<br />

y 1<br />

F y (x,y,z 1 )dy<br />

∫ z<br />

z 1<br />

F z (x,y,z)dz.<br />

Tästä esityksestä funktion φ osittaisderivaataksi<br />

muuttujan z suhteen saadaan<br />

∂φ<br />

∂z = F z(x,y,z).<br />

Muuttujan y suhteen osittaisderivaatta on<br />

∂φ<br />

∂y<br />

= F y (x,y,z 1 )+<br />

= F y (x,y,z 1 )+<br />

∫ z<br />

∂F z (x,y,z)<br />

dz<br />

z 1<br />

∂y<br />

∂F y (x,y,z)<br />

dz<br />

z 1<br />

∂z<br />

∫ z<br />

= F y (x,y,z 1 )+ z /<br />

z 1<br />

F y (x,y,z)<br />

= F y (x,y,z 1 )+F y (x,y,z)−F y (x,y,z 1 )<br />

= F y (x,y,z),<br />

missä olemme käyttäneet hyväksi roottorin häviämisestä<br />

seuranneita ehtoja.<br />

Funktion φ osittaisderivaatta muuttujan x suhteen on<br />

∂φ<br />

∂x = F x(x,y 1 ,z 1 )+<br />

+<br />

∫ z<br />

∫ y<br />

∂F z (x,y,z)<br />

dz<br />

z 1<br />

∂x<br />

= F x (x,y 1 ,z 1 )+<br />

∫ z<br />

+<br />

∂F y (x,y,z 1 )<br />

y 1<br />

∂x<br />

∫ y<br />

∂F x (x,y,z)<br />

z 1<br />

∂z<br />

∂F x (x,y,z 1 )<br />

y 1<br />

∂y<br />

dz<br />

= F x (x,y 1 ,z 1 )+ y /<br />

y 1<br />

F x (x,y,z 1 )+ z /<br />

z 1<br />

F x (x,y,z)<br />

= F x (x,y 1 ,z 1 )+F x (x,y,z 1 )−F x (x,y 1 ,z 1 )<br />

+F x (x,y,z)−F(x,y,z 1 )<br />

= F x (x,y,z),<br />

missä jälleen olemme käyttäneet osittaisderivaattojen<br />

välisiä ehtoja.<br />

Kenttä F voidaan siis kirjoittaa muodossa<br />

F = ∂φ ∂φ ∂φ<br />

i+ j+<br />

∂x ∂y ∂z k = ∇φ.<br />

Skalaarikentän gradienttina kenttä F on siten edellisen<br />

lauseemme mukaisesti konservatiivinen.<br />

Olemme saaneet kentän konservatiivisuudelle kätevän<br />

kriteerin:<br />

Vektorikenttä on konservatiivinen (ts. esitettävissä<br />

skalaarifunktion gradienttina) jos ja vain jos sen roottori<br />

häviää.<br />

Lausetta ∫ johtaessamme muodostimme sellaisia derivaattoja kuin<br />

∂<br />

∂y φ(x,y)dx siirtämällä derivoinnin integraalin sisälle, ts.<br />

∫ ∫<br />

∂ ∂φ(x,y)<br />

φ(x,y)dx = dx.<br />

∂y<br />

∂y<br />

Tämä on sallittua silloin kun integraalit ovat kyllin<br />

”siistejä”(tasaisesti suppenevia). Fysikaalisissa systeemeissä<br />

voidaan useimmiten näin olettaa.<br />

Konservatiivista kenttää vastaavaa skalaarifunktiota<br />

sanotaan kentän potentiaaliksi.<br />

dy<br />

dy<br />

60


Jos integrointitie C on suljettu, ts. integrointitien<br />

alkupiste yhtyy loppupisteeseen, on viivaintegraalista<br />

tapana käyttää merkintää<br />

∮ ∫<br />

F·dr = F·dr. (8.3)<br />

C<br />

Jos kenttä on konservatiivinen, niin pitkin mitä tahansa<br />

suljettua käyrää C myöten laskettu viivaintegraali on<br />

nolla, ∮<br />

F·dr = 0. (8.4)<br />

C<br />

Tämä on voimassa myös toisin päin. Oletetaan siis, että<br />

mitä tahansa suljettua käyrää myöten laskettu<br />

viivaintegraali häviää. Olkoot P a ja P b kaksi avaruuden<br />

pistettä ja C 1 jokin pisteestä P a pisteeseen P b kulkeva<br />

käyrä. Jos C 2 on jokin toinen käyrä välillä P a −→ P b , niin<br />

∫ ∫ ∮<br />

F·dr− F·dr = F·dr<br />

C 1 C 2 C<br />

= 0,<br />

kun C on yhdistetty suljettu käyrä<br />

C<br />

P a −→<br />

C1<br />

P b −→<br />

−C2<br />

P a .<br />

Viivaintegraali<br />

∫ Pb<br />

∫ ∫<br />

F·dr = F·dr = F·dr<br />

P a C 1 C 2<br />

ei siis riipu lainkaan integrointitiestä, joten kenttä F on<br />

konservatiivinen.<br />

Esim. Onko kenttä F = (2xy +z 3 )j+x 2 j+3xz 2 k<br />

konservatiivinen?<br />

Lasketaan kentän roottori<br />

∣ i j k ∣<br />

∇×F =<br />

=<br />

∂ ∂ ∂<br />

∂x ∂y ∂z<br />

∣ 2xy +z 3 x 2 3xz2 ∣<br />

( ∂(3xz 2 )<br />

)<br />

− ∂(x2 )<br />

i<br />

∂y ∂z<br />

( ∂(2xy +z 3 )<br />

+ − ∂(3xz2 )<br />

∂z ∂x<br />

( ∂(x 2 )<br />

+<br />

∂x − ∂(2xy )<br />

+z3 )<br />

k<br />

∂y<br />

= 0,<br />

)<br />

j<br />

joten kenttä F on konservatiivinen.<br />

Esim. Kenttää F = (2xy +z 3 )j+x 2 j+3xz 2 k vastaava<br />

skalaaripotentiaali<br />

Edellisen esimerkin perusteella F on konservatiivinen,<br />

joten on olemassa sellainen potentiaali φ, että<br />

F = ∇φ.<br />

On siis etsittävä sellainen φ, että<br />

∂φ<br />

∂x<br />

∂φ<br />

∂y<br />

∂φ<br />

∂z<br />

= 2xy +z3<br />

= x 2<br />

= 3xz 2 .<br />

Integroimalla nämä lausekkeet saamme<br />

⎧<br />

⎨ x 2 y + xz 3 + f(y,z)<br />

φ = x 2 y + g(x,z)<br />

⎩<br />

xz 3 + h(x,y)<br />

Tulokset ovat yhtäpitäviä, kun valitsemme f(y,z) = 0,<br />

g(x,z) = xz 3 ja h(x,y) = x 2 y. Haettu skalaaripotentiaali<br />

on siis<br />

φ = x 2 y +xz 3 ,<br />

mihin voidaan vielä lisätä mielivaltainen vakio.<br />

Esim. Tehty työ siirrettäessä massapistettä pisteestä<br />

P 1 = (1,−2,1) pisteeseen P 2 = (3,1,4), kun vaikuttava<br />

voima on F = (2xy +z 3 )j+x 2 j+3xz 2 k<br />

Konservatiivista kenttää F vastaava skalaaripotentiaali on<br />

edellisen esimerkin perusteella<br />

φ = x 2 y +xz 3 .<br />

Voiman konservatiivisuudesta johtuen tehty työ on<br />

∫ P2<br />

W = F·dr = φ(3,1,4)−φ(1,−2,1)<br />

P 1<br />

= 201−(−1) = 202.<br />

Muita viivaintegraaleja<br />

Edellä käsittelimme integraaleja ∫ C fds ∫ C F·dr.<br />

Muunkinnäköisiä yhdistelmiä esiintyy:<br />

∫ ∫ ∫<br />

fdr, Fds, F×dr<br />

C<br />

C<br />

Nämä kaikki muunnetaan tavallisiksi integraaleiksi<br />

käyräparametrin u yli: r(u) = (x(u),y(u),z(u)). Näistä<br />

esim<br />

∫<br />

C<br />

F×dr =<br />

∫ b<br />

a<br />

∫ b<br />

a<br />

F× dr ∫ b<br />

du du = a ∣<br />

C<br />

[i(F y z ′ −F z y ′ )+j...]<br />

i j k<br />

F x F y F z<br />

x ′ y ′ z ′ ∣ ∣∣∣∣∣<br />

du =<br />

Esim. (x,y)-tason käyrän C rajoittaman alueen<br />

ala:Olkoon r käyrän C koordinaattivektori, ja dr<br />

differentiaali C:n suuntaisesti. Näiden vektoreiden<br />

61


virittämän kolmion ala on 1 2<br />

|r×dr|. Koko alueen ala<br />

saadaan integroimalla (piirrä kuva!)<br />

1<br />

2<br />

∮<br />

C(r×dr) z = 1 2<br />

∮<br />

C<br />

(xdy −ydx)<br />

Tämä toimii riippumatta siitä onko origo käyrän C sisällä<br />

vai ei.<br />

8.2 Pintaintegraali tasoalueen yli<br />

Olkoon meillä funktio f(x,y) jonka haluamme integroida<br />

yli tason alueen A:<br />

y (x)<br />

2<br />

y-akselin (vakio x) suuntaiset suorat enintään 2 kertaa.<br />

Jos näin ei ole, alue täytyy joko jakaa kahteen tai<br />

useampaan säännölliseen osaan tai vaihtaa<br />

integroimismuuttujia. Usein riittä että vaihdetaan vain x,<br />

y-integrointijärjestystä.<br />

8.2.1 Muuttujien vaihto pintaintegraalissa<br />

Usein kannattaa vaihtaa koordinaatistosysteemi johonkin<br />

muuhun kuin karteesiseen (x,y)-koordinaatistoon,<br />

integroimisalueen tai funktion mukaan. (esim. integraali<br />

riippuu vain vektorin r pituudesta, ei suunnasta).<br />

1-ulotteisessa tapauksessa muuttujan vaihto x → u<br />

tapahtui muuttamalla differentiaalia: du = du<br />

dxdx. Tämä<br />

yleistyy myös tasolle (tai useampaankin ulottuvuuteen:<br />

jos vaihdetaan muuttujat (x,y) ↔ (u,v), niin<br />

y<br />

v<br />

y (x)<br />

1<br />

x<br />

x<br />

1 2<br />

Kuva 8.5 Pintaintegraali<br />

I =<br />

=<br />

∫<br />

A<br />

∫ x2<br />

∫ ∫<br />

f(x,y)da = f(x,y)dxdy<br />

x 1<br />

dx<br />

∫ y2(x)<br />

y 1(x)<br />

dyf(x,y)<br />

Tämä palautuu siis kahdeksi sisäkkäiseksi integraaliksi.<br />

Tässä da = dxdy on infintesimaalinen pinta-alaelementti.<br />

Huom: joskus pintaintegraaleja merkitään kahdella, joskus yhdellä<br />

integraalimerkillä: ∫ fdxdy = ∫ ∫ fdxdy. Kaksi integraalimerkkiä<br />

on tarpeen jos merkitään eksplisiittisesti muuttujien rajat. Näissä<br />

muistiinpanoissa käytetään pääsääntöisesti vain yhtä<br />

integraalimerkkiä.<br />

On syytä huomata että ∫ ...dxdy ei spesifioi integrointien<br />

suoritusjärjestystä eikä myöskään kerro eksplisiittisesti<br />

integrointirajoja. Nämä valitaan tilanteen mukaan, useista<br />

vaihtoehdoista tietenkin helpoimmin laskettava. Usein käytetään<br />

myös sellaisia samaa tarkoittavia merkintöjä kuin ∫ dx ∫ dy....<br />

Vastaavia merkintöjä käytetään myös kolmi- ja useampiulotteisille<br />

integroinneille.<br />

Esim: Alueen A pinta-ala on ∫ A dxdy<br />

Esim: Olkoon A pisteiden (0,0), (1,0), (1,1) määräämä<br />

kolmio, ja f(x,y) = x+y. Nyt<br />

∫ ∫ 1 ∫ x<br />

fdxdy = dx dy(x+y)<br />

A<br />

∫ 1<br />

=<br />

0<br />

dx<br />

0<br />

0<br />

x/<br />

(xy + 1 2 y2 ) =<br />

0<br />

= 1 1/<br />

x 3 = 1 2 2<br />

0<br />

∫ 1<br />

0<br />

dx(x 2 + 1 2 x2 )<br />

Huom: jako ∫ A da = ∫ dx ∫ y 2(x)<br />

y 1(x)<br />

dy toimii vain jos alue on<br />

riittävän säännöllinen, ts. että suljettu käyrä C leikkaa<br />

Kuva 8.6 Koordinaattien vaihto<br />

{ u = u(x,y)<br />

tai kääntäen<br />

v = v(x,y)<br />

u<br />

x<br />

Differentiaaleille pätee<br />

dxdy =<br />

∣∣<br />

tai kääntäen,<br />

dudv =<br />

∣∣<br />

∂x<br />

∂u<br />

∂y<br />

∂u<br />

∂u<br />

∂x<br />

∂v<br />

∂x<br />

∂x<br />

∂v<br />

∂y<br />

∂v<br />

∂u<br />

∂y<br />

∂v<br />

∂y<br />

{ x = x(u,v)<br />

y = y(u,v)<br />

∣∣ dudv<br />

∣∣ dudv<br />

(||J||, determinantin itseisarvo). Determinanttia<br />

kutsutaan Jacobin determinantiksi.<br />

Osoitetaan tämä: tutkitaan kuinka kuvautuu pinta-alan<br />

differentiaali dudv xy-tasolle. Olkoon r = x(u,v)i+y(u,v)j<br />

tason koordinaattivektori.<br />

Jos u → u+du, v vakio, r:n muutos on<br />

∆ ur = ∂ urdu = (∂ uxi+∂ uyj)du.<br />

Samoin jos v → v +dv, r:n muutos on<br />

∆ vr = ∂ vrdv = (∂ vxi+∂ vyj)dv.<br />

Vektorien ∆ ur ja ∆ vr virittämän suunnikkaan pinta-ala on<br />

i j k<br />

∣ ∣∣<br />

|∆ ur×∆ vr| = |<br />

∂ ux ∂ uy 0<br />

∣ ∂ vx ∂ uy 0 ∣ |dudv = | ∂ ux ∂ uy<br />

∂ vx ∂ uy<br />

Siis: jos vaihdetaan muuttujia (x,y) → (u,v), eli<br />

sijoitetaan x = x(u,v), y = y(u,v),<br />

∫ ∫<br />

f(x,y)dxdy = f(x(u,v),y(u,v))|<br />

∂(x,y)<br />

∣<br />

A ∂(u,v) ∣ |dudv<br />

′<br />

A<br />

∣<br />

∣|dudv<br />

62


O<br />

N<br />

N<br />

<br />

H<br />

<br />

<br />

O<br />

missä A ′ on sama alue mutta ilmaistu u,v-koordinaateilla.<br />

Siis saamme I = √ π.<br />

8.2.2 Napakoordinaatisto<br />

Kaksiulotteisen tason rφ-napakoordinaatiston<br />

määrittelevät yhtälöt<br />

x = rcosφ<br />

y = rsinφ.<br />

(8.5)<br />

8.2.3 Tilavuusintegraalit<br />

Tilavuusintegraali yleistyy suoraan tasointegraalista:<br />

∫<br />

V<br />

f(x,y,z)dV =<br />

∫ z2<br />

z 1<br />

dz<br />

∫ y2(z)<br />

y 1(z)<br />

dy<br />

∫ x2(y,z)<br />

x 1(y,z)<br />

dxf(x,y,z)<br />

A B<br />

B<br />

A H<br />

B L = E <br />

N O <br />

H L = E <br />

Kuva 8.7 Napakoordinaatisto<br />

Tämän muunnoksen Jacobin determinantti on<br />

∣ ∂ ∣ rx ∂ φ x<br />

∣∣∣ ∂ r y ∂ φ y ∣ = cosφ −rsinφ<br />

sinφ rcosφ ∣ = r<br />

Siis saamme tuloksen dxdy = rdrdθ, ja<br />

∫ ∫<br />

f(x,y)dxdy = frdrdφ<br />

A<br />

A ′<br />

Esim. Integroidaan f = r = √ x 2 +y 2 1-ympyrän alan<br />

yli:<br />

1. karteesisissa (x,y)-koordinaateissa:<br />

(tai joku muu x,y,z-järjestys!). Jos f = 1, integraali<br />

antaa suoraan alueen V tilavuuden. Tässä tilavuuden<br />

differentiaali dV = dxdydz.<br />

Esim. Määritellään tilavuus niin että x,y,z > 0, ja<br />

x+y +z < 1 (tetraedri). Lasketaan tämän tilavuus. Nyt<br />

kiinteällä z, 0 < z < 1, pätee 0 < y < 1−z. Samoin<br />

kiinteällä y,z 0 < x < 1−y −z. Siis<br />

∫<br />

V<br />

dV =<br />

=<br />

=<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

∫ 1<br />

0<br />

dz<br />

dz<br />

∫ 1−z<br />

0<br />

∫ 1−z<br />

0<br />

dy<br />

∫ 1−y−z<br />

0<br />

dx<br />

dy(1−y −z) =<br />

∫ 1<br />

dz[(1−z) 2 − 1 2 (1−z)2 ] = 1 6<br />

0<br />

dz<br />

1−z /<br />

Muuttujan vaihto: tapahtuu jälleen Jacobin<br />

determinantin avulla, (x,y,z) → (u,v,t):<br />

∣∣ ∣∣∣∣∣ ∣∣∣∣∣ dxdydz = |<br />

∂r<br />

∂ u x ∂ v x ∂ t x<br />

∣∂u∣ |dudvdt = ∂ u y ∂ v y ∂ t y<br />

∂ u z ∂ v z ∂ t z ∣∣ dudvdt<br />

Kaksi tärkeää erikoistapausta: sylinterikoordinaatisto ja<br />

pallokoordinaatisto<br />

0<br />

(1−z)y − 1 2 y2<br />

∫ 1<br />

0<br />

∫ √ 1−x 2<br />

dx<br />

− √ dy √ x 2 +y 2 = ...<br />

1−x 2<br />

2. napakoordinaatistossa:<br />

∫ 2π<br />

0<br />

dφ<br />

∫ 1<br />

0<br />

drrr = 2π 3<br />

ei yksinkertainen!<br />

Helppoa! Kannattaa valita siis koordinaatisto ongelman<br />

mukaan!<br />

Esim. Mikä on I = ∫ ∞<br />

−∞ e−x2 dx?Käytetään tässä<br />

seuraava temppua ja muutetaan integraali<br />

tasointegraaliksi:<br />

∫ ∞ ∫ ∞ ∫<br />

I 2 = dxe −x2 dye −y2 = dxdye −(x2 +y 2 )<br />

−∞ −∞ R<br />

∫ ∫ 2 2π ∫ ∞<br />

= dθdrre −r2 = dθ drre −r2<br />

R 2 0 0<br />

∞/<br />

= 2π<br />

0<br />

− 1 2 e−r2 = π<br />

8.2.4 Sylinterikoordinaatisto<br />

Sylinterikoordinaatiston ρφz määrittelevät yhtälöt<br />

H L = E <br />

L = E <br />

B<br />

B<br />

H<br />

x = ρcosφ<br />

y = ρsinφ<br />

z = z.<br />

H L = E <br />

B L = E <br />

A B<br />

A H<br />

Kuva 8.8 Sylinterikoordinaatisto<br />

A <br />

B L = E <br />

L = E <br />

H<br />

(8.6)<br />

63


N<br />

N<br />

<br />

<br />

H<br />

H<br />

O<br />

O<br />

Kuten kuvasta nähdään, on ρ pisteen xy-tasolla olevan<br />

projektion etäisyys origosta, φ tämän projektion<br />

napakulma ja z pisteen korkeus xy-tasosta mitattuna.<br />

Koordinaattikäyrät ovat<br />

• ρ-käyrät: z-akselia vastaan kohtisuorat (= xy-tason<br />

suuntaiset) ja sitä leikkaavat suorat.<br />

• φ-käyrät: z-akselikeskeiset ja sitä vastaan kohtisuorat<br />

ympyrät.<br />

• z-käyrät: z-akselin suuntaiset suorat.<br />

Sylinterikoordinaatiston yksikkövektorit nähdään suoraan<br />

kuvasta:<br />

e ρ = icosφ+jsinφ<br />

e φ = −isinφ+jcosφ (8.7)<br />

e z = k.<br />

olevan projektion ja x-akselin välisenä atsimuuttikulmana<br />

φ.<br />

B<br />

G<br />

H I E G<br />

H I E G I E B<br />

H ? I G<br />

H I E G ? I B<br />

Kuva 8.10 Pallokoordinaatit<br />

Kuvasta nähdään, että pallokoordinaateista rθφ<br />

siirrytään karteesisiin koordinaatteihin kaavoilla<br />

Sylinterikoordinaatistossa tilavuuden differentiaali antaa<br />

Jacobin determinantin<br />

cosφ −ρsinφ 0<br />

dV = dxdydz = |<br />

sinφ ρcosφ 0<br />

|dρdφdz = ρdρdφdz<br />

∣ 0 0 1 ∣<br />

Siis: dV = ρdρdφdz.<br />

Tämän näkee myös tutkimalla suoraan<br />

tilavuuselementtiä:<br />

H<br />

@ B<br />

@ 8<br />

@ H<br />

@ <br />

H @ B<br />

H L = E <br />

G L = E <br />

B <br />

B<br />

G<br />

x = rsinθcosφ<br />

y = rsinθsinφ<br />

z = rcosθ.<br />

H<br />

G L = E <br />

B L = E <br />

H L = E <br />

G <br />

B L = E <br />

Kuva 8.11 Pallokoordinaatiston<br />

koordinaattikäyrät<br />

(8.8)<br />

Kuva 8.9 Tilavuuselementti sylinterikoordinaatistossa<br />

Kuvasta nähdään, että sylinterikoordinaattien<br />

differentiaalisia muutoksia dρ, dφ ja dz vastaa<br />

tilavuuselementti dV = ρdρdφdz.<br />

Esim. laske ∫ fdV, kun V on sylinteri 0 ≤ z ≤ 1,<br />

V<br />

x 2 +y 2 = ρ 2 ≤ 1, ja f = ρ 2 :<br />

∫<br />

V<br />

ρ 2 dV =<br />

∫ 2π<br />

0<br />

dφ<br />

∫ 1<br />

0<br />

dz<br />

∫ 1<br />

0<br />

dρρρ 2 = π 2<br />

8.2.5 Pallokoordinaatisto<br />

Pallokoordinaatistossa pisteen paikka ilmoitetaan<br />

etäisyytenä r origosta, paikkavektorin ja z-akselin<br />

välisenä korkeuskulmana θ sekä paikkavektorin xy-tasolla<br />

Pallokoordinaatiston koordinaattikäyrät ovat<br />

• r-käyrät: origon kautta kulkevat suorat.<br />

• θ-käyrät: origokeskiset ympyrät, joiden halkaisijana<br />

on z-akselin suuntaiset origokeskiset janat (= joiden<br />

taso on kohtisuorassa xy-tasoa vastaan).<br />

• φ-käyrät: z-akselikeskeiset ja sitä vastaan<br />

kohtisuorassa olevat (= xy-tason suuntaiset)<br />

ympyrät.<br />

Pallokoordinaatistossa Jacobin determinantti on<br />

∂(x,y,z)<br />

∣∣∂(r,θ,φ)<br />

∣∣ = r2 sinθ<br />

Siis nyt dV = r 2 sinθdrdθdφ = r 2 drd(cosθ)dφ.<br />

64


Esim. Laske integraali ∫ fdV, kun tilavuus V on<br />

V<br />

pallonkuori 1 ≤ r ≤ 2 ja f = 1/r 2 :<br />

∫<br />

V<br />

∫<br />

1 2π<br />

r 2dV = dφ<br />

0<br />

∫ π<br />

0<br />

dθsinθ<br />

∫ 1<br />

0<br />

drr 2 1 r 2 = 4π<br />

Usein merkitään kulmaosia yhdessä avaruuskulmalla Ω:<br />

∫ ∫ ∫<br />

dV = dΩ drr 2<br />

V<br />

4π<br />

Tässä siis ∫ 4π dω = ∫ 2π<br />

0<br />

dφ ∫ π<br />

0 dθsinθ<br />

8.2.6 Nabla sylinteri- ja pallokoordinaatistoissa:<br />

Samoin kuin integaaleja voidaan sylinteri- ja<br />

pallokoordinaateissa, joskus on edullista laskea myös<br />

differentiaaleja ko. koordinaateissa. Näiden osoittaminen<br />

on varsin suoraviivaista mutta työlästä, joten annetaan<br />

tässä vain tulokset:<br />

Sylinterikoordinaatisto<br />

• Muunnoskaavat<br />

• Kantavektorit<br />

• Gradientti<br />

• Divergenssi<br />

e ρ<br />

e φ<br />

x = ρcosφ<br />

y = ρsinφ<br />

z = z.<br />

= icosφ+jsinφ<br />

= −isinφ+jcosφ<br />

e z = k.<br />

∂ψ<br />

∇ψ = e ρ<br />

∂ρ +e 1∂ψ<br />

φ<br />

ρ ∂φ +e ∂ψ<br />

z<br />

∂z .<br />

∇·A = 1 ∂<br />

ρ∂ρ (ρA ρ)+ 1 ρ<br />

• Laplacen operaattori<br />

∇ 2 ψ = 1 ∂<br />

ρ∂ρ<br />

(<br />

ρ ∂ψ<br />

∂ρ<br />

∂A φ<br />

∂φ + ∂A z<br />

∂z .<br />

)<br />

+ 1 ρ 2 ∂ 2 ψ<br />

∂φ 2 + ∂2 ψ<br />

∂z 2 .<br />

• Kantavektorit<br />

e r<br />

e θ<br />

e φ<br />

• Gradientti<br />

• Divergenssi<br />

= isinθcosφ+jsinθsinφ+kcosθ<br />

= icosθcosφ+jcosθsinφ−ksinθ<br />

= −isinφ+jcosφ.<br />

∂ψ<br />

∇ψ = e r<br />

∂r + e θ ∂ψ<br />

r ∂θ + e φ ∂ψ<br />

rsinθ ∂φ .<br />

∇·A = 1 ∂ (<br />

r 2 ) 1<br />

r 2 A r +<br />

∂r<br />

+ 1<br />

rsinθ<br />

• Laplacen operaattori<br />

∇ 2 ψ = 1 r 2 ∂<br />

∂r<br />

(<br />

r 2∂ψ<br />

∂r<br />

∂A φ<br />

∂φ .<br />

)<br />

+<br />

1 ∂ 2 ψ<br />

+<br />

r 2 sin 2 θ ∂φ 2.<br />

rsinθ<br />

1<br />

r 2 sin 2 θ<br />

∂<br />

∂θ (A θsinθ)<br />

(<br />

∂<br />

sin 2 θ ∂ψ )<br />

∂θ ∂θ<br />

8.3 Pintaintegraali yli käyrän pinnan<br />

8.3.1 Skalaarifunktion integraalit<br />

Olkoon φ(x,y,z) on jokin skalaarifunktio, A jokin<br />

kolmiulotteisen avaruuden pinta ja dA tämän pinnan<br />

infinitesimaalinen pinta-alkio. Tehtävänä on nyt laskea<br />

pintaintegraali ∫<br />

I = φ(x,y,z)dA.<br />

A<br />

Samalla tavoin kuin tavallisen yhden muuttujan<br />

integraalinkin tapauksessa tämä tarkoittaa sitä, että<br />

1. jaetaan pinta A pieniin ∆A suuruisiin palasiin,<br />

2. lasketaan kussakin palasessa funktion φ(x,y,z) arvo<br />

ja kerrotaan tämä palasen pinta-alalla ∆A,<br />

3. summataan yhteen kaikki termit φ(x,y,z)∆A ja<br />

4. annetaan palasten pinta-alan lähestyä nollaa.<br />

Pallokoordinaatisto<br />

• Muunnoskaavat<br />

x = rsinθcosφ<br />

y = rsinθsinφ<br />

z = rcosθ.<br />

Pintaintegraali on usein helpompi laskea palauttamalla se<br />

koordinaattien yli suoritettaviksi integroinneiksi. Jos<br />

esimerkiksi pinta A voidaan esittää muodossa z = f(x,y),<br />

kannattaa yleensä integroida muuttujien x ja y yli, ts.<br />

viedä integraali muotoon<br />

∫ y1<br />

[∫ x1<br />

]<br />

I = φ(x,y,f(x,y))h(x,y)dx dy.<br />

y 0 x 0<br />

65


N<br />

<br />

)<br />

<br />

<br />

O<br />

Tässä h(x,y) on skaalaustekijä, jolla xy-tason pinta-alkio<br />

dA 0 = dxdy on kerrottava, jotta saataisiin pinnan alkio<br />

dA. Integrointien rajat riippuvat pinnasta. Se,<br />

kannattaako ensin integroida muuttujan x (kuten yo.<br />

lausekkeessa) vai muuttujan y yli riippuu paitsi pinnasta<br />

niin myös funktiosta φ.<br />

@ ) <br />

@ O<br />

Kuva 8.12 Pintaintegraali<br />

C<br />

@ N<br />

@ )<br />

Kuten kuvasta nähdään, xy-tason pinta-alkiota dA 0 ja<br />

sitä pinnalla A vastaavaa alkiota sitoo toisiinsa relaatio<br />

dA 0 = dxdy = dA cosγ, (8.9)<br />

missä γ on pinnan normaalin n ja z-akselin välinen<br />

kulma. Tässä tapauksessa pintaintegraali on siis<br />

kirjoitettavissa muotoon<br />

∫<br />

I =<br />

A<br />

∫<br />

φdA =<br />

φ(x,y,z) dxdy<br />

cosγ .<br />

Oletetaan nyt, että pinnan A yhtälö on annettu muodossa<br />

g(x,y,z) = C.<br />

Kyseessä on siis skalaarikentän g eräs tasa-arvopinta.<br />

Kuten gradientin yhteydessä näimme, on skalaarin<br />

gradientti kohtisuorassa tasa-arvopintaa vastaan. Eräs<br />

pinnan A normaali on niin ollen ∇g ja normaalin<br />

suuntainen yksikkövektori silloin<br />

n = ∇g<br />

|∇g| .<br />

Tämän projektio z-akselille on<br />

n·k = cosγ =<br />

∂g<br />

∂z<br />

|∇g| .<br />

Pintaintegraalimme on nyt kirjoitettavissa muotoon<br />

∫<br />

I = φ(x,y,z) |∇g| dxdy. (8.10)<br />

∂g<br />

∂z<br />

Jos pinta A on annettu muodossa<br />

niin asettamalla<br />

z = f(x,y),<br />

g = z −f(x,y)<br />

pinnan yhtälö on<br />

g = 0.<br />

Tällöin kaavassa (8.10) tarvittavat osittaisderivaatat ovat<br />

∂g<br />

∂x = ∂f<br />

∂x , ∂g<br />

∂y = ∂f<br />

∂y<br />

ja<br />

∂g<br />

∂z = 1<br />

ja pintaelementin skaalaustekijä vastaavasti<br />

√ (∂f ) 2<br />

1<br />

cosγ = |∇g| = +<br />

∂x<br />

Pinta-integraali I on nyt<br />

√<br />

∫ (∂f ) 2<br />

I = φ(x,y,f(x,y)) +<br />

∂x<br />

( ) 2 ∂f<br />

+1.<br />

∂y<br />

Esim. Funktion φ = z integraali puolipallon<br />

x 2 +y 2 +z 2 = R 2 , z ≥ 0 pinnan yli<br />

Nyt<br />

z = √ R 2 −x 2 −y 2 = f(x,y),<br />

jolloin<br />

ja<br />

∂f<br />

∂x = − x<br />

√<br />

R2 −x 2 −y 2<br />

∂f<br />

∂y<br />

1<br />

cos 2 γ<br />

y<br />

= −√ R2 −x 2 −y 2<br />

= 1+<br />

( ) 2 ∂f<br />

+<br />

∂x<br />

x 2 +y 2<br />

= 1+<br />

R 2 −x 2 −y 2<br />

R 2<br />

=<br />

R 2 −x 2 −y 2.<br />

( ) 2 ∂f<br />

+1dxdy.<br />

∂y<br />

(8.11)<br />

( ) 2 ∂f<br />

∂y<br />

Integrointialueena xy-tasossa on puolipallon pinnan<br />

projektio eli kehän<br />

x 2 +y 2 = R 2 ; z = 0<br />

rajoittama ympyrä. xy-tason integraali kannattaa tehdä<br />

nyt napakoordinaatteja käyttäen: ρ 2 = x 2 +y 2 :<br />

∫ R<br />

∫ ∫ 2π<br />

1<br />

I = φdA = dφ dρρz<br />

A 0 0 cosγ<br />

∫ R<br />

= 2π dρρ √ √<br />

R 2 −ρ 2 R 2<br />

R 2 −ρ 2<br />

0<br />

= 2π/<br />

R R 1<br />

0 2 ρ2 = πR 3<br />

66


H<br />

8.3.2 Vuointegraalit: vektoreiden pintaintegraalit<br />

Tavallisin tapaus pintaintegraaleista on laskea<br />

vektorikentän vuo pinnan läpi: Tarkastellaan pintaa A ja<br />

sillä pisteessä P(x,y,z) olevaa pinta-alkiota dA.<br />

Määritellään vektoriaalinen pinta-alkio dA siten, että<br />

dA = ndA,<br />

missä n on pisteessä P laskettu pinnan normaalin<br />

suuntainen yksikkövektori. Olkoon F(x,y,z) jokin<br />

(integroituva) vektorikenttä. Eräs vektorikentän F<br />

pintaintegraali on<br />

∫ ∫<br />

F·dA = F·ndA. (8.12)<br />

A<br />

Tämä integraali kuvaa vektorin F vuota pinnan A läpi.<br />

Huom: jos kyseessä on suljettu pinta, integraalia<br />

merkitään ∮<br />

F·dA.<br />

A<br />

Jos pinta ei ole suljettu, sillä on luonnollisesti reunaviiva.<br />

Esim. Nesteen virtaus<br />

Jos ρ on nesteen tiheys ja v sen nopeus, niin<br />

A<br />

ρv·dA = ρv·ndA<br />

on pintaelementin dA läpi aikayksikössä kulkevan nesteen<br />

määrä. Vektorin µ = ρv vuo pinnan A läpi, ∫ µ·dA, on<br />

A<br />

aikayksikössä pinnan A läpi kulkevan nesteen määrä.<br />

Muunlaisia pintaintegraaleja ovat esim.<br />

∫ ∫ ∫ ∫<br />

F×dA = F×ndA; φdA; φdA.<br />

A<br />

A<br />

Esim. Radiaalikenttä pallokuoren yli:<br />

Olkoon v = rf(r), ja pallonkuori |r| 2 = r 2 = R 2 . Nyt<br />

n = r/r, ja<br />

∮ ∮<br />

∮<br />

v·dA = f(R)r·r/RdA = f(R)R dA = 4πR 3 f(R)<br />

A<br />

A<br />

A<br />

missä käytettiin tietoa pallon ala = 4πR 2 .<br />

Esim. I = ∫ (∇×F)·dA, kun F = −yi+xj+zk, ja A<br />

A<br />

on puolipallon x 2 +y 2 +z 2 = R 2 ; z ≥ 0 pinta<br />

Nyt<br />

i j k<br />

∇×F =<br />

∂ ∂ ∂<br />

∂x ∂y ∂z<br />

∣ −y x z ∣ = 2k.<br />

Pinnan A yhtälö on<br />

joten<br />

A<br />

g = x 2 +y 2 +z 2 = R 2 ,<br />

∇g = 2xi+2yj+2zk = 2r.<br />

Pallopinnan A yksikkönormaali n on siis<br />

n = ∇g<br />

|∇g| = r r = xi+yj+zk ,<br />

r<br />

A<br />

eli radiusvektorin suuntainen yksikkövektori.<br />

Edelleen<br />

∇×F·dA = 2k·ndA = 2cosθdA,<br />

missä θ on radiusvektorin ja z-akselin välinen kulma.<br />

H I E G<br />

@ B<br />

G<br />

@ G<br />

@ )<br />

H @ G<br />

H I E G @ B<br />

Kuva 8.13 Pintaelementti pallolla<br />

Kuvassa φ radiusvektorin xy-tasolla olevan projektion ja<br />

x-akselin välinen kulma. Kuten kuvasta nähdään, pallon<br />

pinnalla pallokoordinaattien θ ja φ differentiaalisia<br />

muutoksia dθ ja dφ vastaava pintaelementti dA on<br />

dA = r 2 sinθdθdφ. (8.13)<br />

Puolipallon pinnalla kulmat θ ja φ saavat arvot<br />

Integraali I on siis<br />

∫<br />

I =<br />

=<br />

A<br />

∫ π/2<br />

0<br />

0 ≤ θ ≤ π 2<br />

0 ≤ φ ≤ 2π.<br />

∇×F·ndA<br />

dθ<br />

∫ 2π<br />

0<br />

dφ2cosθR 2 sinθ<br />

∫ π/2<br />

= 4πR 2 cosθsinθdθ<br />

0<br />

π/2<br />

/<br />

= 4πR 2<br />

0<br />

sin 2 θ<br />

2<br />

= 2πR 2 .<br />

8.4 Gaussin lause<br />

Edellä laskettiin vektorikentän v = rf(r) vuo R-säteisen<br />

pallon pinnan läpi, tuloksella<br />

∮<br />

A<br />

v·dA = 4πR 3 f(R)<br />

Lasketaan nyt ∇·v integroituna pallon tilavuuden yli: nyt<br />

∇·v = ∇·(rf(r)) = f(r)∇·r+r·f ′ (r)∇r = 3f(r)+rf ′ (r)<br />

67


)<br />

N<br />

<br />

=<br />

D<br />

O<br />

Siis<br />

∫ ∫<br />

∇·vdV = dΩ<br />

V<br />

∫ R<br />

Saimme siis tuloksen<br />

∮ ∫<br />

v·dA =<br />

A<br />

0<br />

drr 2 (3f(r)+rf ′ (r)) = 4π<br />

V<br />

∫ R<br />

∇·vdV (8.14)<br />

missä A on alueen V pinta. Tämä tulos pätee yleisesti,<br />

kaikille vektorikentille ja tilavuuksille, ja sitä sanotaan<br />

Gaussin laiksi: vektorin v normaalikomponentin integraali<br />

yli suljetun pinnan on sama kuin sen divergenssin<br />

integraali pinnan sulkeman tilavuuden yli.<br />

Toisin: kentän v vuo suljetun pinnan läpi = kentän v<br />

lähteet pinnan sisällä!<br />

Gaussin laki on 3-ulotteinen yleistys 1-ulotteisia<br />

integraaleja koskevalle totuudelle<br />

∫ b<br />

a<br />

df<br />

dx = f(b)−f(a)<br />

dx<br />

Gaussin lauseen tarkempi todistus<br />

Kirjoitetaan vektori F komponenteittain:<br />

ja tarkastellaan integraalia<br />

∫∫∫<br />

<br />

F = F xi+F yj+F zk,<br />

) <br />

@ N<br />

@ O 4<br />

V<br />

∂F z<br />

∂z dV.<br />

Kuva 8.14 Gaussin lauseen todistus<br />

Olkoot A 1 ja A 2 tilavuutta V ympäröivän suljetun pinnan A alaja<br />

yläpinta, joita esittävät yhtälöt<br />

A 1 : z = f 1 (x,y)<br />

A 2 : z = f 2 (x,y).<br />

Olkoon R pinnan A (tai A 1 tai A 2 ) projektio xy-tasolla.<br />

Tällöin<br />

∫∫∫<br />

V<br />

∂F z<br />

∂z dV = ∫∫∫<br />

=<br />

=<br />

∫<br />

∫<br />

∂F z<br />

∂z dzdxdy<br />

V<br />

[∫ f2 (x,y)<br />

R<br />

R<br />

f 1 (x,y)<br />

0<br />

∂F z<br />

∂z dz ]<br />

dxdy<br />

[F z(x,y,f 2 )−F z(x,y,f 1 )] dxdy<br />

Olkoon n pinnan A yksikkönormaali, n 1 alapinnan A 1<br />

yksikkönormaali ja n 2 yläpinnan A 2 yksikkönormaali. Nyt<br />

dr∂ r (r 3 f(r)) = 4πR 3 f(R) alapinnalla: dxdy = −k·n 1 dA 1<br />

yläpinnalla: dxdy =k·n 2 dA 2<br />

pinnalla: dxdy =k·ndA,<br />

68<br />

joten<br />

∫<br />

Saamme siis<br />

[F z(x,y,f 2 )−F z(x,y,f 1 )] dxdy<br />

R<br />

∫ ∫<br />

=<br />

=<br />

F zk·n 2 dA 2 +<br />

A<br />

∫<br />

2<br />

A<br />

∫∫∫<br />

V<br />

F zk·ndA.<br />

A 1<br />

F zk·n 1 dA 1<br />

∂F z<br />

∂z<br />

∫A<br />

dV = F zk·ndA.<br />

Vastaavasti voidaan osoittaa, että<br />

∫∫∫<br />

∂F y<br />

∂y dV = F yj·ndA<br />

∫A<br />

V<br />

∫∫∫<br />

∂F x<br />

∂x dV = F xi·ndA,<br />

∫A<br />

V<br />

joten kaiken kaikkiaan on<br />

∫∫∫<br />

eli<br />

∫∫∫<br />

V<br />

V<br />

=<br />

( ∂Fx<br />

∂x + ∂Fy<br />

∂y + ∂Fz<br />

∂z<br />

∫<br />

A<br />

∇·FdV =<br />

)<br />

dV<br />

( Fxi+F yj+F zk )·ndA,<br />

∫<br />

A<br />

F·ndA =<br />

∫<br />

A<br />

F·dA.<br />

Esim. Vektorin r vuo a-säteisen ja h-korkuisen sylinterin<br />

pinnan läpi<br />

Olkoon A sylinteriä rajoittava pinta (mukaan lukien<br />

pohjat) ja V sylinterin tilavuus.<br />

Kuva 8.15 Sylinteri<br />

a) Divergenssilauseen perusteella vuo I on<br />

∫ ∫<br />

I = r·dA = ∇·rdV.<br />

A<br />

V


Koska<br />

on<br />

joten<br />

r = xi+yj+zk,<br />

∇·r = ∂x<br />

∂x + ∂y<br />

∂y + ∂z<br />

∂z = 3,<br />

∫<br />

I = 3 dV = 3V = 3πa 2 h.<br />

V<br />

b) Lasketaan vuo pintaintegraalina.<br />

(i) Yläpinnalla n = k ja<br />

joten<br />

∫<br />

yläpinta<br />

(ii) Pohjalla n = −k ja<br />

joten<br />

r·n = r·k = z = h,<br />

∫<br />

r·ndA = hdA = πa 2 h.<br />

∫<br />

r·n = −z = 0,<br />

pohja<br />

r·ndA = 0.<br />

(iii) Vaipalla yksikkönormaali on<br />

sillä vaipan yhtälö on<br />

ja niin ollen vektori<br />

n = xi+yj ,<br />

a<br />

f = x 2 +y 2 = a 2 ,<br />

∇f = 2xi+2yj<br />

on kohtisuorassa vaippaa vastaan. Nyt<br />

joten<br />

∫<br />

vaippa<br />

r·n = x2 +y 2<br />

a<br />

∫<br />

r·ndA = a<br />

= a2<br />

a = a,<br />

Laskemalla kaikki vuot yhteen saadaan<br />

I = 3πa 2 h.<br />

dA = a·2πah.<br />

Esim. Newtonin gravitaatiopotentiaali φ toteuttaa<br />

yhtälön<br />

∇ 2 φ = 4πGρ,<br />

missä G on gravitaatiovakio ja ρ massatiheys.<br />

Määritetään gravitaatiokenttävoimakkuus<br />

pallosymmetrisessä tapauksessa<br />

Merkitään<br />

K = −∇φ,<br />

jolloin<br />

∇·K = −∇ 2 φ = −4πGρ.<br />

Jos tilavuudessa V oleva kokonaismassa on M, niin<br />

∫<br />

V<br />

∫<br />

∇·KdV = −4πG ρdV<br />

V<br />

= −4πGM.<br />

Toisaalta Gaussin lauseen mukaan on<br />

∫ ∫<br />

∇·KdV = K·dA,<br />

V<br />

kun A on tilavuutta V rajoittava pinta.<br />

Oletetaan, että M-massainen kappale on<br />

pallosymmetrinen ja otetaan tilavuudeksi V ko. kappaleen<br />

sisäänsä sulkeva r-säteinen kappalekeskinen pallo. Tällöin<br />

ilmeisestikin |K| on vakio pallon pinnalla ja K on<br />

radiusvektorin suuntainen (tai vastakkaissuuntainen), ts.<br />

voidaan kirjoittaa<br />

A<br />

K = K(r)e r ,<br />

missä e r on radiusvektorin suuntainen yksikkövektori.<br />

Vektori e r on tietystikin myös yksikkönormaali ko. pallon<br />

pinnalla, joten<br />

∫<br />

r-säteinen pallo<br />

∫<br />

K·dA = K(r)e r ·e r dA<br />

∫<br />

= K(r) dA = K(r)·4πr 2<br />

= −4πGM.<br />

Saamme siis tutun Newtonin gravitaatiolain<br />

tai vektoriaalisesti<br />

K(r) = − GM<br />

r 2 ,<br />

K(r) = − GM<br />

r 2 e r.<br />

8.5 Stokesin lause<br />

Roottorin fysikaalista tulkintaa etsiessämme saimme<br />

tuloksen (7.18), jonka mukaan xy-tasossa pisteen (x,y)<br />

ympäri kiertyvä virtaus oli<br />

dS z<br />

= µ x (x,y −dy/2,z)dx+µ y (x+dx/2,y,z)dy<br />

=<br />

−µ x (x,y +dy/2,z)dx−µ y (x−dx/2,y,z)dy<br />

[ ∂µy<br />

∂x − ∂µ ]<br />

x<br />

dxdy.<br />

∂y<br />

69


O<br />

"<br />

N<br />

!<br />

<br />

@ N<br />

Kuva 8.16 xy-tason pinta-alkio<br />

@ )<br />

@ O<br />

Kuvan mukaisesti voimme kirjoittaa tämän muotoon<br />

4∑<br />

µ·dr i = (∇×µ) z dxdy,<br />

i=1<br />

missä vektoriaaliset differentiaalit ovat dr 1 = dxi,<br />

dr 2 = dyj, dr 3 = −dxi sekä dr 4 = −dyj ja virtatiheys on<br />

laskettava aina vastaavalla infinitesimaalisen suorakaiteen<br />

sivulla. Yhtälön oikeakin puoli on lausuttavissa<br />

kompaktimmin, kun otamme käyttöön vektoriaalisen<br />

pinta-alkion dA = dxdyk. Näin päädymme relaatioon<br />

4∑<br />

µ·dr = (∇×µ)·dA,<br />

i=1<br />

missä nyt sekä dr että µ on laskettava summausindeksiin<br />

liittyvällä suorakaiteen sivulla. Tämä yhtälö on toki<br />

voimassa mielivaltaisellekin (differentioituvalle)<br />

vektorikentälle F ja miten tahansa orientoituneelle<br />

pintaelementille dA:<br />

4∑<br />

F·dr = (∇×F)·dA, (8.15)<br />

i=1<br />

missä vasemmalla puolen kierretään dA vastapäivään.<br />

Tarkastellaan nyt mielivaltaista pintaa A. Jaetaan A<br />

infinitesimaalisiin palasiin dA i . Kussakin pinta-alkiossa on<br />

voimassa<br />

4∑<br />

(∇×F)·dA i = F·dr,<br />

j=1<br />

missä vasemmalla puolen roottori lasketaan alueen dA i<br />

keskipisteessä ja oikealla puolen seka F että differentiaalit<br />

alueen dA i summausindeksistä j riippuvalla reunalla.<br />

Summataan yli kaikkien palasten, jolloin<br />

∑<br />

(∇×F)·dA i = ∑<br />

i<br />

i<br />

4∑<br />

F·dr. (8.16)<br />

j=1<br />

Tarkastellaan kahta vierekkäistä pinta-alkiota, sanotaan<br />

alkioita 1 ja 2. Näiden yhteisellä reunalla toisen<br />

suorakaiteen dr on vastakkainen toisen suorakaiteen<br />

vastaavalle differentiaalille kun taas kenttä F on sama.<br />

Summassa (8.16) yhteisiin reunoihin liittyvät termit<br />

kumoutuvat, joten jäljelle jäävät vain alueen A reunoihin<br />

rajoittuvien pinta-alkioiden ulkoreunat eli<br />

∑ ∑<br />

(∇×F)·dA i = F·dr.<br />

i<br />

A:n ulkoreuna<br />

Yhtälön vasen puoli on suureen ∇×F pintaintegraali yli<br />

pinnan A ja oikea puoli viivaintegraali pintaa A<br />

rajoittavan reunakäyrän C ympäri. Koska jokainen<br />

pinta-elementti yhtälön (8.15) ja kuvan 8.16 mukaisesti<br />

kierrettiin positiiviiseen kiertosuuntaan, samaan suuntaan<br />

kierretään myös pinta A. Olemme näin päätyneet<br />

Stokesin lauseena tunnettuun pinta- ja viivaintegraaleja<br />

sitovaan relaatioon<br />

∮ ∫<br />

F·dr = (∇×F)·dA. (8.17)<br />

C<br />

A<br />

Sanallisesti Stokesin lause on ilmaistavissa muodossa<br />

Vektorikentän F viivaintegraali pinnan A reunakäyrän C<br />

ympäri on sama kuin kentän F roottorin<br />

normaalikomponentin pintaintegraali pinnan A yli.<br />

Huom. Integraalin arvo ei muutu sellaisissa<br />

integrointipinnan deformaatioissa, joissa reunakäyrä<br />

säilyy muuttumattomana.<br />

∫<br />

Esim. ∇×F·dA kun F = −yi+xj+zk ja A on<br />

A<br />

puolipallon x 2 +y 2 +z 2 = a 2 ;z ≥ 0 pinta<br />

1) Suoraan pintaintegraalina. Katso edellä<br />

(pintaintegraalit).<br />

2) Viivaintegraalina Stokesin lausetta soveltaen. Nyt<br />

F·dr = (−yi+xj+zk)·(dxi+dyj+dzk)<br />

= −ydx+xdy +zdz.<br />

Puolipallon pinnan A reunakäyrä C on xy-tason ympyrä<br />

Tällä käyrällä<br />

x 2 +y 2 = a 2 ; z = 0.<br />

x = acosθ<br />

y = asinθ<br />

z = 0,<br />

kun θ on vektorin r = (x,y,0) ja x-akselin välinen kulma.<br />

Tällöin<br />

joten käyrällä C<br />

dx = −asinθdθ<br />

dy = acosθdθ<br />

dz = 0,<br />

F·dr = −ydx+xdy<br />

= a 2 sin 2 θdθ +a 2 cos 2 θdθ<br />

= a 2 dθ.<br />

70


Stokesin lauseen mukaan on<br />

∫ ∮<br />

(∇×F)·dA =<br />

A<br />

C<br />

= 2πa 2 .<br />

F·dr =<br />

∫ 2π<br />

0<br />

a 2 dθ<br />

3) Pintaintegraali on sama mille tahansa käyrän C<br />

rajoittamalle pinnalle. Valitaan xy-tason ympyrä. Koska<br />

∇×F = 2k,<br />

on<br />

∫<br />

∫<br />

(∇×F)·dA = 2k·kdA<br />

x 2 +y 2 ≤a 2 x 2 +y 2 ≤a 2<br />

= 2A = 2πa 2 .<br />

Stokesin lauseen perusteella pyörteettömälle kentälle F on<br />

voimassa<br />

∮ ∫<br />

F·dr = (∇×F)·dA = 0,<br />

C<br />

A<br />

olipa C mikä tahansa suljettu käyrä ja A sen sisäänsä<br />

sulkema pinta. Tähän tulokseen päädyimme jo<br />

viivaintegraalien yhteydessä konservatiivisia<br />

vektorikenttiä tarkastellessamme (ks. kaava (8.4).<br />

71


9. Lineaarikuvaukset, matriisit<br />

9.1 Vektoriavaruudet<br />

Aiemmin olemmme puhuneet tason (R 2 ) ja kotiavaruuden<br />

(R 3 ) vektoreista. Nämä (kuten myös pelkkä R) ovat<br />

esimerkkejä reaalisista vektoriavaruuksista.<br />

Yleisesti vektoriavaruudet ovat joukkoja V joille on<br />

määritelty<br />

1. Yhteenlasku: x+y ∈ V, jos x ja y ∈ V.<br />

2. Skalaarilla kertominen: ax ∈ V, jos x ∈ V ja a ∈ R.<br />

Vektoriavaruus sisältää yksikäsitteisen nollavektorin:<br />

0 ∈ V siten, että x+0 = x.<br />

Lisäksi jokaisella alkiolla x ∈ V on vastavektori −x ∈ V:<br />

x+(−x) = 0.<br />

Erilaiset vektoriavaruudet ovat matematiikassa ja<br />

fysiikassa hyvin yleisiä. R n :n lisäksi usein puhutaan<br />

funktionaalisista avaruuksista, esim. asteluvun n<br />

polynomit muodostavat n+1-ulotteisen<br />

vektoriavaruuden: p(x) = ∑ n<br />

i=0 a ix i (polynomeja voidaan<br />

laskea yhteen ja kertoa skalaarilla, ja tuloksena on edellen<br />

polynomi).<br />

Vektoriavaruuden V aliavaruus S on sellainen V:n<br />

alijoukko S, että:<br />

jos x,y ∈ S ja a ∈ R, niin<br />

x+y ∈ S ja<br />

ax ∈ S<br />

Esim. R 3 :n aliavaruuksia ovat esim. kaikki origon kautta<br />

kulkevat suorat ja tasot. Myös {0} ja R 3 ovat R 3 :n<br />

aliavaruuksia. Sen sijaan esim. R 3 :n yksikkövektorien<br />

joukko (|x| = 1) ei ole aliavaruus.<br />

Vektoriavaruuksissa R n on määritelty muitakin<br />

laskusääntöjä, esim. vektorien pistetulo x·y. Oletetaan<br />

jatkossa että pistetulo on määritelty.<br />

Lineaarinen riippumattomuus<br />

Muistetaan, että vektorit v 1 ...v k ovat lineaarisesti<br />

riippumattomia (eli vapaita), jos<br />

k∑<br />

a i v i = 0<br />

i=1<br />

vain jos kaikki a 1 = a 2 = ... = a k = 0. Muussa<br />

tapauksessa vektorit ovat lineaarisesti riippuvia, ja<br />

ainakin yksi vektori voidaan lausua muiden<br />

lineaarikombinaationa.<br />

n-ulotteisessa vektoriavaruudessa voidaan valita enintään<br />

n:n keskenään lineaarisesti riippumattoman vektorin<br />

joukko. Kolmiulotteisessa avaruudessa on enintään 3<br />

vektorin joukko keskenään lineaarisesti riippumaton.<br />

Jos vektorit e 1 , e 2 ...e n ovat lineaarisesti riippumattomia<br />

n-ulotteisen vektoriavaruuden V alkioita, sanotaan että<br />

ne virittävät V:n: mikä tahansa v ∈ V voidaan esittää<br />

niiden lineaarikombinaatioina:<br />

n∑<br />

v = a i e i ≡ a i e i<br />

i=1<br />

Huom: ylläolevan kaltainen lineaarikombinaatio<br />

vektoreista on niin yleinen, että siitä usein käytetään<br />

oikeanpuoleista merkintätapaa: toistuvan indeksin yli<br />

summataan automaattisesti (implisiittisesti). Einsteinin<br />

summaussääntö.<br />

Sanotaan että vektorit e i muodostavat V:n kannan, ja<br />

a i :t ovat v:n komponentit tässä kannassa.<br />

Kanta ei ole yksikäsitteinen. Yksinkertaisin kanta on<br />

ortonormaali kanta:<br />

e i ·e j = δ ij =<br />

{<br />

1, jos i = j<br />

0, jos i ≠ j<br />

Tässä δ ij on nimeltään Kroneckerin delta. Siis<br />

ortonormaalit vektorit ovat kohtisuorassa toisiaan vastaan<br />

ja niiden pituus |⃗e i | = 1.<br />

Ortonormaalissa kannassa kahden vektorin a, b pistetulo<br />

on<br />

n∑ n∑ n∑<br />

a·b = a i e i · b j e j = a i b j<br />

i=1<br />

j=1<br />

i=1<br />

Tai lyhyemmin: a·b = a i b i .<br />

Tutuin esimerkki ortonormaalista kannasta on R 3 :n kanta<br />

i, j, k.<br />

Palaamme myöhemmin siihen miten ei-ortonormaalista<br />

kannasta voidaan tehdä ortonormaali.<br />

Huom: ortonormitetussa kannassa<br />

eli<br />

e j ·a = ∑ i<br />

a i e j ·e i = ∑ i<br />

a i = a·e i<br />

a i δ ij = a j<br />

Kertoimet a i siis ilmaisevat vektorin a projektion e i<br />

suuntaan.<br />

9.2 Lineaarikuvaus<br />

Olkoon A kuvaus (funktio) vektoriavaruudesta V<br />

vektoriavaruuteen U: jos nyt<br />

A(x+y) = A(x)+A(y),<br />

A(αx) = αA(x)<br />

kaikilla x,y ∈ V ja α ∈ R, niin A on lineaarikuvaus.<br />

Esim. Kuvaus A : R → R, A(x) = cx, c vakio, on<br />

lineaarikuvaus:<br />

A(x+y) = c(x+y) = cx+cy = A(x)+A(y)<br />

A(αx) = cαx = αA(x)<br />

Esim. Kuvaus B : R → R, B(x) = cx+d, d ≠ 0, ei ole<br />

lineaarinen (HT).<br />

Lineaarikuvaukset ovat hyvin rajoitettu funktiojoukko, ja<br />

pelkästään R:n kuvauksina ne ole kovinkaan<br />

mielenkiintoisia (tavallisin sovellus: yleisen funktion f(x)<br />

approksimaatio lineaarisesti). Useampiulotteisissa<br />

avaruuksissa sen sijaan niillä on paljon käyttöä!<br />

72


9.2.1 Tason kuvaus itselleen<br />

Tarkastellaan tason vektorien lineaarikuvausta A, joka<br />

muuttaa tason vektorin v = (x,y) toiseksi tason<br />

vektoriksi v ′ = (x ′ ,y ′ ): A(v) = v ′ , tai<br />

{<br />

x<br />

′<br />

= a 11 x+a 12 y<br />

y ′ = a 21 x+a 22 y<br />

Tässä a ij ovat lukuja, jotka määrittelevät A:n. Kyseessä<br />

on todellakin lineaarikuvaus (HT):<br />

A(v 1 +v 2 ) = A(v 1 )+A(v 2 )<br />

A(αv) = αA(v)<br />

On kätevää ottaa käyttöön pystyvektorit ja matriisit:<br />

Merkitään nyt<br />

( ) ( )<br />

x<br />

v = v ′ x<br />

′<br />

=<br />

y y ′<br />

ja<br />

a 21<br />

A =<br />

( )<br />

a11 a 12<br />

a 21 a 22<br />

Tässä notaatiossa merkitään<br />

( ) ( )( )<br />

x<br />

′ a11 a<br />

y ′ = 12 x<br />

=<br />

a 22 y<br />

(<br />

a11 x+a 12 y<br />

a 21 x+a 22 y<br />

Siis esimerkiksi<br />

( ) ( )( ) ( )<br />

x<br />

′ a11 a<br />

= 12 x a11 x+a<br />

= 12 y<br />

·′<br />

· · y ·<br />

Siis: tulosvektorin rivi k lasketaan siten, että kerrotaan<br />

matriisin rivin k alkiot elementti elementiltä alkuperäisen<br />

vektorin elementeillä, ja lasketaan yhteen.<br />

Vielä systemaattisemmin: merkitään<br />

v =<br />

(<br />

v1<br />

v 2<br />

)<br />

Nyt ( )<br />

v<br />

′<br />

1<br />

v 2<br />

′ =<br />

tai lyhyesti ja ytimekkäästi<br />

v ′ i = ∑ j<br />

(<br />

a11 a 12<br />

a 21<br />

v ′ =<br />

(<br />

v<br />

′<br />

1<br />

v ′ 2<br />

)<br />

a 22<br />

)(<br />

v1<br />

v 2<br />

)<br />

a ij v j = a ij v j<br />

Yleinen lineaarikuvaus R n → R m<br />

Kuvaus A : R n → R m voidaan myös esittää<br />

matriisimuodossa: jos y ∈ R m ja x ∈ R n , niin<br />

n∑<br />

y = Ax ⇔ y i = a ij x j , 1 ≤ j ≤ m<br />

eli eksplisiittisesti<br />

⎛ ⎞ ⎛<br />

y 1<br />

y 2<br />

⎜ .<br />

⎝<br />

⎟<br />

. ⎠ = ⎜<br />

⎝<br />

y m<br />

j=1<br />

⎞⎛<br />

a 11 a 12 ··· a 1n<br />

a 21 a 22 ··· a 2n<br />

.<br />

⎟⎜<br />

. ⎠⎝<br />

a m2 ··· a mn<br />

a m1<br />

⎞<br />

x 1<br />

x 2<br />

. ⎟<br />

. ⎠<br />

x n<br />

)<br />

Tässä siis A:n on oltava m vaakariviä ja n pystyriviä,<br />

jotta lasku yllä voidaan tehdä! A on siis m×n -matriisi.<br />

Jos m = n, on A neliömatriisi<br />

Erikoisasemassa ovat yksikkömatriisi (neliömatriisi)<br />

⎛<br />

I = ⎜<br />

⎝<br />

1 0 ··· 0<br />

0 1 ··· 0<br />

.<br />

0 0 ··· 1<br />

⎞<br />

⎟<br />

⎠<br />

eli I ij = δ ij . Se kuvaa vektorin itselleen: Ix = x<br />

nollamatriisi: ⎛ ⎞<br />

0 ··· 0<br />

0 ··· 0<br />

0 = ⎜<br />

⎟<br />

⎝ . ⎠<br />

0 ··· 0<br />

mikä kuvaa kaikki vektorit nollavektoreiksi: 0x = 0.<br />

Rotaatio tasossa<br />

Tärkeä tason lineaarikuvaus on rotaatio: vektorien kierto<br />

kulman θ verran origon suhteen positiiviseen suuntaan.<br />

Matriiseina<br />

( x<br />

′<br />

y ′ )<br />

=<br />

( )( )<br />

cosθ −sinθ x<br />

=<br />

sinθ cosθ y<br />

( cosθx−sinθy<br />

sinθx+cosθy<br />

eli x ′ = R(θ)x.<br />

Rotaatio kääntää vektoria muuttamatta sen pituutta:<br />

|x ′ | = |x|, kuten helposti nähdään.<br />

Vektorien väliset kulmat säilyvät rotaatioissa (pituuden<br />

lisäksi): jos x ja y ovat kaksi vektoria, niin<br />

(R(θ)x)·(R(θ)y) = x·y<br />

kuten suoraviivaisesti nähdään laskemalla.<br />

Standardikannan kuvautuminen<br />

R n :n standardikanta e 1 ...e n on sellainen jossa<br />

⎛ ⎞<br />

0<br />

.<br />

e k =<br />

1<br />

⎜ ⎟<br />

⎝<br />

. ⎠<br />

0<br />

k:s rivi<br />

eli (e k ) i = δ ki (vektorin e k elementti i).<br />

Se kuvautuu lineaarikuvauksessa A seuraavasti:<br />

eli<br />

(Ae k ) i = ∑ j<br />

a ij (e k ) j = ∑ j<br />

⎛<br />

Ae k = ⎜<br />

⎝<br />

⎞<br />

a 1k<br />

a 2k<br />

. ⎟<br />

. ⎠<br />

a nk<br />

a ij δ kj = a ik<br />

)<br />

73


Tuloksena on siis A:n pystyrivin k alkioista muodostuva<br />

vektori.<br />

Kääntäen, jos tunnemme kuinka standardikanta kuvautuu<br />

lineaarikuvauksessa A, saamme A:n matriisiesityksen. Siis<br />

jos tiedämme, että<br />

Ae k = f k ,<br />

täytyy olla<br />

⎛<br />

⎞<br />

(f 1 ) 1 (f 2 ) 1 ··· (f n ) 1<br />

(f 1 ) 2 (f 2 ) 2 ··· (f n ) 2<br />

A = ⎜<br />

⎝<br />

.<br />

⎟<br />

. ⎠ = (f 1,f 2 ,···,f n )<br />

(f 1 ) n (f 2 ) n ··· (f n ) n<br />

missä viimeinen merkintätapa tarkoittaa että kyseessä on<br />

vektoreista f i koottu matriisi.<br />

Esim. Etsi R 3 :n lineaarikuvauksen matriisi, joka vie<br />

standardikannan i, j, k vektoreiksi<br />

⎛<br />

Ai = ⎝<br />

1<br />

1<br />

0<br />

⎞<br />

⎛<br />

⎠ ≡ f 1 , Aj = ⎝<br />

1<br />

0<br />

1<br />

⎞<br />

⎛<br />

⎠ ≡ f 2 , Ak = ⎝<br />

Edellisen mukaan siis on oltava<br />

⎛ ⎞<br />

1 1 0<br />

A = ⎝ 1 0 0 ⎠ = (f 1 ,f 2 ,f 3 )<br />

0 1 1<br />

9.3 Kuvausten yhdistäminen: matriisien<br />

kertolasku<br />

Kuten yhdistetyissä funktioissa yleensä, matriiseilla<br />

voidaan myös tehdä yhdistetty kuvaus: olkoon<br />

lineaarikuvaukset<br />

A : R s → R m ja<br />

B : R n → R s<br />

Nyt yhdistetty kuvaus AB : R n → R m on lineaarikuvaus.<br />

Kuvauksen AB matriisi on A:n m×s -matriisin ja B:n<br />

s×n-matriisin matriisitulo. Sen saamme<br />

(AB) ij =<br />

s∑<br />

A ik B kj = A ik B kj<br />

k=1<br />

Huom: B:ssä on oltava sama määrä vaakarivejä kuin<br />

A:ssa on pystyrivejä (s), muuten matriisituloa ei ole<br />

määritelty!<br />

Siis<br />

⎛<br />

⎝<br />

⎛<br />

⎝<br />

⎞<br />

· · ·<br />

· (AB) ij · ⎠ =<br />

· · ·<br />

⎛<br />

· · · ·<br />

A i1 A i2 ··· A is<br />

· · · ·<br />

⎞<br />

⎞ · B 1j ·<br />

⎠<br />

· B 2j ·<br />

⎜<br />

⎝ ·<br />

⎟<br />

. · ⎠<br />

· B sj ·<br />

0<br />

0<br />

1<br />

⎞<br />

⎠ ≡ f 3<br />

Nyt<br />

Eli: tulomatriisin elementti ij, (AB) ij , saadaan<br />

kertomalla A:n i:s vaakarivi ja B:n j:s pystyrivi alkio<br />

alkiolta keskenään ja laskemalla yhteen.<br />

Tämä on helppo näyttää tutkimalla mielivaltaisen<br />

vektorin v ∈ R n kuvausta:<br />

(ABv) i = (A(Bv)) i = A ij (Bv) j = A ij B jk v k<br />

ja toisaalta (ABv) i = (AB) ik v k .<br />

Huom: matriiseille ei yleensä päde AB = BA! Sanotaan<br />

että matriisitulo ei kommutoi.<br />

Huom: Jos B on m×1-matriisi, matriisitulo AB palautuu<br />

matriisin ja vektorin tuloksi. Siis vektori = matriisi, jossa<br />

on vain yksi pystyrivi.<br />

Esim. Olkoon lineaarikuvaukset A : R 3 → R 2 ja<br />

B : R 2 → R 3 , ja niiden matriisiesitykset<br />

AB =<br />

=<br />

=<br />

A =<br />

(<br />

0 1 0<br />

1 0 1<br />

(<br />

0 1 0<br />

1 0 1<br />

) ⎛ ⎝<br />

)<br />

, B =<br />

1 1<br />

0 2<br />

1 0<br />

⎞<br />

⎠<br />

⎛<br />

⎝<br />

1 1<br />

0 2<br />

1 0<br />

( )<br />

0·1+1·0+0·1 0·1+1·2+0·0<br />

1·1+0·0+1·1 1·1+0·2+1·0<br />

( )<br />

0 2<br />

2 1<br />

on kuvaus R 2 → R 2 ja<br />

⎛<br />

BA = ⎝<br />

1 1 1<br />

2 0 2<br />

0 1 0<br />

on kuvaus R 3 → R 3 .<br />

Sen sijaan tulot AA tai BB eivät ole määriteltyjä,<br />

johtuen siitä että A ja B eivät ole neliömatriiseja.<br />

Esim. Rotaatioiden yhdistäminen<br />

Rotaatiomatriisi tasossa oli<br />

( ) cosθ −sinθ<br />

R(θ) =<br />

sinθ cosθ<br />

Jos teemme peräkkäin kaksi rotaatiota, niin matriisituloa<br />

ja sinin ja kosinin laskusääntöjä käyttäen saamme (HT)<br />

⎞<br />

⎠<br />

R(θ 2 )R(θ 1 ) = R(θ 1 +θ 2 )<br />

9.4 Matriisilaskentoa<br />

Matriiseille (ja niiden määrittämille lineaarikuvauksille)<br />

on määritelty<br />

Yhteenlasku: (A+B) ij = A ij +B ij . Tässä A:n ja B:n<br />

täytyy olla samankokoisia (m×n) matriiseja.<br />

⎞<br />

⎠<br />

74


Skalaarilla kertominen: (λA) ij = λA ij . vektorit: Otetaan nyt käyttöön merkintätapa R n :n<br />

Matriisien kertolasku: (AB) ij = A ik B kj , missä A on n×r pystyvektoreille ⎛ ⎞<br />

ja B on r ×m matriisi. Jos m ≠ n, tule BA ei ole<br />

x 1<br />

määritelty.<br />

x 2<br />

Diagonaalimatriisi: neliömatriisia A sanotaan<br />

x = ⎜ .<br />

⎝<br />

⎟<br />

. ⎠<br />

diagonaaliseksi, jos se on muotoa<br />

x n<br />

⎛<br />

⎞<br />

A 11 0 ··· 0 (ilman lihavointia x, kompaktiuden vuoksi). Tämä on siis<br />

0 A 22 ··· 0<br />

n×1 -matriisi. Transponoimalla saamme vaakavektorin<br />

A = ⎜<br />

⎝<br />

⎟<br />

. ⎠<br />

x T = (x 1 x 2 ··· x n )<br />

0 0 ··· A nn<br />

(1×n -matriisi!)<br />

Jos kaikki A 11 = A 22 = ... = λ, voidaan A kirjoittaa Jos nyt x ja y ovat R n :n (pysty)vektoreita, niin<br />

muotoon A = λI missä I on yksikkömatriisi I ij = δ ij .<br />

⎛ ⎞<br />

Jos A on neliömatriisi, niin AI = IA = A.<br />

x 1<br />

Transpoosi A T<br />

y T ⎜<br />

x = (y 1 ··· y n ) .<br />

⎝<br />

⎟<br />

. ⎠ = y i x i = y·x<br />

Kaikille matriiseille A voidaan määritellä transpoosi A T .<br />

x n<br />

Sen elementit ovat<br />

y T x antaa siis vektoreiden pistetulon.<br />

(A T ) ij = A ji<br />

Jos taas kerrotaan pystyvektorilla vaakavektori, saadaan<br />

matriisi:<br />

(joskus merkitään A T = Ã). Siis vaakarivit käännetään ⎛ ⎞ ⎛ ⎞<br />

x<br />

pystyriveiksi ja päinvastoin.<br />

1 x 1 y 1 ··· x 1 y n<br />

Esim.<br />

xy T ⎜<br />

= .<br />

⎝<br />

⎟ ⎜<br />

. ⎠(y 1 ··· y n ) =<br />

⎝<br />

.<br />

⎟<br />

. ⎠<br />

⎛ ⎞<br />

x<br />

( )<br />

n x n y 1 ··· x n y n<br />

1 4<br />

1 2 3<br />

A = ⇒ A T = ⎝ 2 5 ⎠<br />

4 5 6<br />

tai (xy T ) ij = x i y j .<br />

3 6 Esim. Tason rotaatioille pätee R T R = I, mikä nähdään<br />

suoraan laskemalla. Sen saa myös siitä että rotaatiot<br />

Jos A on n×m-matriisi, on A T m×n -matriisi. säilyttävät pistetulon:<br />

Transpoosille on voimassa seuraava tärkeä tulos:<br />

y T x = (Ry) T (Rx) = y T R T Rx ⇒ R T R = I<br />

(AB) T = B T A T<br />

Tässä tapauksessa sanotaan että R T on R:n<br />

Todistus: nyt<br />

käänteismatriisi.<br />

[(AB) T ] ij = (AB) ji = A jk B ki<br />

Konjugaatti A ∗<br />

Toisaalta<br />

(B T A T ) ij = (B T ) ik (A T Yleistetään lineaarikuvaukset kompleksisiin avaruuksiin,<br />

) kj = B ki A jk = A jk B ki .<br />

ts. olkoon A : C n → C m . Nyt A:ta voidaan kuvata<br />

Huom: viimeisessä vaiheessa järjestys voidaan vaihtaa,<br />

matriisilla jonka elementit ovat kompleksilukuja. Tälle<br />

sillä A jk ,B ki ovat pelkkiä lukuja (matriisin elementtejä),<br />

matriisille ovat voimassa kaikki samat tulokset kuin yllä<br />

eivät matriiseja! Yleensä matriisien järjestystä ei voida<br />

reaaliselle matriisillekin.<br />

vaihtaa.<br />

Matriisin A konjugaatti A ∗ on matriisi jonka kaikki<br />

Olkoon A neliömatriisi. Silloin A on<br />

symmetrinen, jos A T elementit ovat A:n elementtien kompleksikonjugaatteja:<br />

= A eli A ij = A ji . (samat elementit<br />

symmetrisesti diagonaalin molemmin puolin!)<br />

(A ∗ ) ij = A ∗<br />

antisymmetrinen, jos A T ij<br />

= −A eli A ij = −A ji .<br />

Antisymmetristen matriisien diagonaalielementit Jos pätee A ∗ = A, matriisi on reaalimatriisi.<br />

häviävät, ts. A ii = −A ii = 0.<br />

Hermiittinen konjugaatti A<br />

Useimmat matriisit eivät ole symmetrisiä eivätkä<br />

†<br />

Hermiittinen konjugointi on transpoosin ja konjugoinnin<br />

antisymmetrisiä.<br />

yhdistelmä:<br />

Ilmeisesti pätee:<br />

(A T ) T = A, (A+B) T = A T +B T A † = (A ∗ ) T = (A T ) ∗ , (A † ) ij = (A ji ) ∗<br />

75


A on hermiittinen, jos A † = A, ja antihermiittinen, jos<br />

A † = −A.<br />

Ominaisuuksia:<br />

(A † ) † = A, (A+B) † = A † +B † , (AB) † = B † A †<br />

Esim. Paulin spinmatriisit<br />

( ) ( 0 1 0 −i<br />

σ 1 = , σ<br />

1 0 2 =<br />

i 0<br />

) ( 1 0<br />

, σ 3 =<br />

0 −1<br />

)<br />

σ 1 ja σ 3 ovat symmetrisiä: σ T 1 = σ 1 , σ T 3 = σ 3 .<br />

σ 2 on antisymmetrinen: σ T 2 = −σ 2 .<br />

σ 1 ja σ 3 ovat reaalimatriiseja: σ ∗ 1 = σ 1<br />

Kaikki σ i ovat hermiittisiä, esim. σ † 2 = σ 2.<br />

Jos x,y ∈ C n eli ovat n-komponenttisia<br />

kompleksivektoreita, niin niiden sisätulo (eli pistetulo)<br />

voidaan esittää muodossa<br />

x † y = x ∗ iy i , y † x = y ∗ ix i = (x † y) ∗<br />

Käänteismatriisi A −1<br />

Olkoot A ja B n×n -neliömatriiseja. Jos pätee<br />

AB = BA = I<br />

matriisia B kutsutaan A:n käänteismatriisiksi ja<br />

merkitään A −1 . Siis<br />

A −1 A = AA −1 = I<br />

Huom. Kaikille neliömatriiseille ei löydy<br />

käänteismatriisia.<br />

Jos A −1 on olemassa, sanotaan että A on säännöllinen eli<br />

kääntyvä<br />

Jos A −1 ei ole olemassa, A on singulaarinen tai<br />

ei-säännöllinen.<br />

Käänteismatriisi on yksikäsitteinen: jos sekä B että C<br />

ovat A:n käänteismatriiseja, niin välttämättä B = C.<br />

Todistus: B(AC) = (BA)C ⇒ BI = IC ⇒ B = C.<br />

76


Käänteismatriiseille pätee<br />

(AB) −1 = B −1 A −1<br />

Todistus:<br />

(B −1 A −1 )(AB) = B −1 B = I, ja<br />

(AB)(B −1 A −1 ) = A −1 A = I.<br />

Siis (AB) −1 = B −1 A −1 .<br />

Jos käänteismatriisi on olemassa, niin pätee<br />

(A T ) −1 = (A −1 ) T , (A † ) −1 = (A −1 ) † .<br />

Tod. (A −1 ) T A T = (AA −1 ) T = I T = I, eli (A −1 ) T on<br />

A T :n käänteismatriisi.<br />

Ei-singulaarisen matriisin käänteismatriisin löytäminen ei<br />

ole aina kovin yksinkertaista. Myöhemmin palataan<br />

konsteihin joilla käänteismatriisi voidaan löytää.<br />

Suurten matriisien käänteismatriisien löytäminen<br />

numeerisesti onkin oma tieteenalansa, ja yksi<br />

tärkeimmistä numeeristen algoritmien luokasta.<br />

Esim. Matriisi ( ) 1 1<br />

A =<br />

0 1<br />

on säännöllinen, sen käänteismatriisi on<br />

( )<br />

A −1 1 −1<br />

=<br />

0 1<br />

AA −1 = A −1 A = I (tarkista!)<br />

Matriisi ( ) 1 1<br />

B =<br />

1 1<br />

on puolestaan singulaarinen: jos C on mielivaltainen<br />

2×2-matriisi,<br />

( )( ) ( )<br />

1 1 c11 c<br />

BC =<br />

12 c11 +c<br />

= 21 c 12 +c 22<br />

1 1 c 21 c 22 c 11 +c 21 c 12 +c 22<br />

mikä selvästikään ei voi olla yksikkömatriisi millään c ij :n<br />

arvoilla.<br />

Neliömatriisi on ortogonaalinen, jos<br />

ja unitaarinen, jos<br />

A T = A −1 .<br />

A † = A −1<br />

Ortogonaaliset matriisit säilyttävät reaalivektorien<br />

pistetulon:<br />

(Ay) T (Ax) = y T A T Ax = y T A −1 Ax = y T x<br />

ja unitaariset matriisit kompleksivektorien:<br />

Esim. Paulin spinmatriisit ovat kaikki unitaarisia: esim.<br />

( )( ) ( )<br />

σ † 0 1 0 1 1 0<br />

1 σ 1 = =<br />

1 0 1 0 0 1<br />

Samoin σ † 2 σ 2 = I, σ † 3 σ 3 = I.<br />

σ 1 ja σ 3 ovat myös ortogonaalisia, mutta σ 2 ei ole.<br />

9.5 Matriisin jälki TrA ja determinantti<br />

detA<br />

Neliömatriisien jälki (engl. trace) ja sen determinantti<br />

ovat tärkeimpiä matriiseja karakterisoivia lukuja. Ne ovat<br />

määriteltyjä ainoastaan neliömatriiseille.<br />

9.5.1 Jälki TrA<br />

Neliömatriisin jälki on sen diagonaalielementtien summa:<br />

TrA = A 11 +A 22 +...+A nn = ∑ i<br />

A ii<br />

Jos A on n×m matriisi ja B on n×m-matriisi, niin AB<br />

on n×n ja<br />

Tr(AB) =<br />

BA on taas m×m ja<br />

n∑<br />

(AB) ii =<br />

i=1<br />

j=1<br />

n∑<br />

i=1 j=1<br />

j=1 i=1<br />

m∑<br />

A ij B ji<br />

m∑ m∑ n∑<br />

Tr(BA) = (BA) jj = B ji A ij<br />

(Tai lyhyesti Tr(AB) = (AB) ii = A ij B ji jne.) Siis pätee<br />

mikä yleistyy muotoon<br />

Tr(AB) = Tr(BA)<br />

Tr(A 1 A 2 ...A k ) = Tr(A k A 1 ...A k−1 )<br />

eli matriiseja voi permutoida syklisesti ilman että jälki<br />

muuttuu.<br />

Esim. Tr(ABC) = Tr(CAB) = Tr(BAC).<br />

Heti nähdään että myös<br />

Tr(A+B) = TrA+ TrB<br />

9.5.2 Determinantti detA<br />

Tarkastellaan tason lineaarikuvausta<br />

( ) (<br />

y1 1 1<br />

y = Ax ⇔ =<br />

y 2 −1 2<br />

)(<br />

x1<br />

x 2<br />

)<br />

(Ay) † (Ax) = y † A † Ax = y † x<br />

Huom: jos A on reaalimatriisi, A T = A † .<br />

Tämä kuvaa tason neliöt suunnikkaiksi (yleinen<br />

lineaarikuvausten ominaisuus!). Esim. yksikköneliö<br />

kuvautuu seuraavasti:<br />

77


(0,0) → (0,0)<br />

(1,0) → (1,−1)<br />

(0,1) → (1,2)<br />

(1,1) → (2,1)<br />

Nämä pisteet muodostavat todellakin suunnikkaan<br />

(piirrä!). Yksikköneliön pinta-ala on 1, ja suunnikkaan<br />

pinta-ala saadaan esim. ristitulosta<br />

|(1,−1)×(1,2)| =<br />

∣∣<br />

i j k<br />

1 −1 0<br />

1 2 0<br />

∣∣ = |1×2+1×1| = 3<br />

Huomataan myös että detA = 2+1 = 3.<br />

Tämä tulos pätee täysin yleisesti: mielivaltainen 2×2<br />

matriisi A kuvaa pinta-alan a pinta-alaksi adet(A).<br />

Tämä yleistyy: n×n-matriisi A kuvaa n-ulotteisen<br />

tilavuuselementin detA-kertaiseksi, missä detA on<br />

matriisin determinantti.<br />

Vertaa Jacobin determinanttiin! Se pohjautuu juuri tähän<br />

tulokseen.<br />

Katsotaan nyt kuinka determinantti lasketaan.<br />

2×2 ja 3×3-matriisien determinantti tuli jo tutuksi<br />

vektorien kolmitulon yhteydessä. Yleisesti n×n-matriisin<br />

A determinantti on<br />

n∑<br />

detA = ǫ ijk... A 1i A 2j A 3k ...<br />

ijk...=1<br />

missä indeksejä ijk... on n kappaletta. Tässä ǫ ijk... on<br />

Levi-Civita symboli:<br />

⎧<br />

⎨ +1, kun ijk... on 123... parillinen permutaatio<br />

ǫ ijk... = −1, kun ijk... on 123... pariton permutaatio<br />

⎩<br />

0, kun mikä tahansa indeksi toistuu<br />

Siis: valitaan matriisin jokaiselta vaakariviltä yksi alkio<br />

siten, että ne ovat aina eri pystyriveiltä ja kerrotaan<br />

keskenään. Jos rivit ovat 123...:n pariton permutaatio<br />

kerrotaan -1:llä. Käydään läpi kaikki permutaatiot ja<br />

summataan yhteen.<br />

Esim. 2×2-matriisin determinanttiNyt ǫ 12 = −ǫ 21 = 1,<br />

ǫ 11 = ǫ 22 = 0.<br />

( )<br />

a11 a<br />

detA = det 12<br />

a 21 a 22<br />

=<br />

2∑<br />

ǫ ij a 1i a 2j<br />

ij=1<br />

= ǫ 11 a 11 a 21 +ǫ 12 a 11 a 22 +ǫ 21 a 12 a 21 +ǫ 22 a 12 a 22<br />

= a 11 a 22 −a 12 a 21<br />

mikä on sama tulos kuin aiemmin. Samoin 3×3<br />

-matriisin determinantti palautuu vanhaan tulokseen.<br />

Kirjoitetaan mukavuuden vuoksi matriisi A pystyriviensä<br />

A i avulla:<br />

A = (A 1 ,A 2 ,...,A n )<br />

Determinantin määritelmästä voidaan suoraviivaisesti<br />

nähdä<br />

det(...,A i ,...,A j ,...) = −det(...,A j ,...,A i ,...)<br />

eli determinantti vaihtaa etumerkkiä jos kaksi pystyriviä<br />

(tai vaakariviä) vaihdetaan keskenään.<br />

det(A 1 ,...,λA i ,...) = λdet(A 1 ,...,A i ,...)<br />

missä λ on reaali- tai kompleksiluku. Tästä seuraa<br />

det(λA) = λ n detA<br />

jos A on n×n matriisi.<br />

Determinantin kehittäminen vaakarivin suhteen:<br />

Determinantti voidaan kehittää mielivaltaisen vaakarivin<br />

i suhteen seuraavasti:<br />

n∑<br />

detA = A ij cofA ij<br />

missä kofaktori on<br />

j=1<br />

cofA ij = (−1) i+j D ij (9.1)<br />

ja missä D ij on sen (n−1)×(n−1) matriisin<br />

determinantti mikä saadaan poistamalla matriisista A<br />

vaakarivi i ja pystyrivi j. Tätä sääntöä käytettiin<br />

aiemmin 3×3 matriisien determinantteihin.<br />

Tämä pätee myös mielivaltaisille pystyriville j:<br />

detA =<br />

n∑<br />

A ij cofA ij<br />

i=1<br />

Determinantille pätee:<br />

detA = 0, jos A:ssa on kaksi samaa vaaka- tai pystyriviä<br />

detA ei muutu, jos sen johonkin vaaka/pystyriviin<br />

lisätään tai siitä vähennetään muiden vaaka/pystyrivien<br />

mielivaltainen lineaarikombinaatio<br />

Näitä sääntöjä voidaan käyttää determinanttien<br />

“sieventämiseen” ja oikomaan niiden laskemista.<br />

Esim. Lasketaan<br />

∣<br />

1 0 3 1<br />

1 2 3 1<br />

0 1 1 1<br />

−1 1 1 0<br />

lisäämällä ja vähentämällä lineaarikombinaatioita niin<br />

että 1. vaakarivi tulee nollaksi, paitsi 1. elementti.<br />

Vähennetään 3×(pystyrivi 1) pystyrivistä 3, vähennetään<br />

pystyrivi 1 pystyrivistä 4, ja kehitetään 1. vaakarivin<br />

suhteen:<br />

=<br />

∣<br />

1 0 0 0<br />

1 2 0 0<br />

0 1 1 1<br />

−1 1 4 1<br />

∣<br />

= (−1) 1+1 1×<br />

∣<br />

∣<br />

2 0 0<br />

1 1 1<br />

1 4 1<br />

∣<br />

78


Kehitetään jälleen 1. rivin suhteen:<br />

= (−1) 1+1 2<br />

∣ 1 1<br />

4 1 ∣ = 2(1−4) = −6<br />

HUOM: kuten yllä, determinanttia merkitään usein<br />

samalla merkinnällä kuin itseisarvoa: |A| = detA. Tällöin<br />

determinantin itseisarvoa merkitään ||A||.<br />

Matriisien tulon determinantille pätee tärkeä tulos<br />

det(AB) = detAdetB<br />

Tämän näkee suoraviivaisella mutta hieman työläällä<br />

pyörittämisellä, ja jätetään todistus tässä väliin.<br />

Käänteismatriisi ja determinantti<br />

Determinantti ilmoittaa suoraan onko matriisi A<br />

säännöllinen, ts. löytyykö A −1 :<br />

detA ≠ 0 ⇔ A säännöllinen ⇔ A −1 olemassa<br />

Käänteismatriisin elementit ovat<br />

(A −1 ) ij = cofA ji<br />

detA = (−1)i+j D ji<br />

detA<br />

missä kofaktorit määriteltiin kaavassa (9.1). Huomaa<br />

että kofaktorin indeksit tulevat “väärässä” järjestyksessä.<br />

Näytetään tämä: muistetaan että<br />

∑<br />

detA = A ik cofA ik<br />

k<br />

vaivattomin tapa laskea sitä (suurille matriiseille), vaan<br />

käytetään esim. Gaussin eliminointimenetelmää<br />

(myöhemmin).<br />

Esim. 2×2 matriisin käänteismatriisi: Olkoon<br />

A =<br />

( a b<br />

c d<br />

)<br />

, detA ≠ 0<br />

Nyt D ij on se determinantti mikä saadaan poistamalla<br />

A:sta rivi i ja pystyrivi j. 2×2 matriiseille tämä on<br />

yksinkertaisesti ( )<br />

d c<br />

D =<br />

b a<br />

Nyt siis<br />

eli<br />

Esim.<br />

A −1 = 1 (<br />

d −b<br />

detA −c a<br />

(A −1 ) ij = (−1)i+j D ji<br />

detA<br />

A =<br />

)<br />

=<br />

(<br />

1 2<br />

2 3<br />

(<br />

1 d −b<br />

ad−bc −c a<br />

Nyt detA = −1 ≠ 0, siis A −1 on olemassa. Nyt<br />

( )<br />

3 2<br />

D =<br />

2 1<br />

)<br />

)<br />

Nyt huomataan että<br />

∑<br />

k<br />

A jk cofA ik = δ ji detA<br />

sillä jos j ≠ i, niin kaavan vasen puoli vastaa sellaisen matriisin<br />

determinanttia mikä saadaan A:sta korvaamalla rivi i rivillä j.<br />

Koska nyt matriisissa on kaksi samaa vaakariviä, sen<br />

determinantti = 0.<br />

Jakamalla detA:lla saadaan<br />

∑ cofA ik<br />

∑<br />

A jk<br />

detA = A jk B ki = δ ji<br />

k<br />

k<br />

eli<br />

missä B ki = cofA ik /detA.<br />

AB = I<br />

Tämä näytti että jos detA on olemassa, käänteismatriisin lauseke<br />

saadaan sen ja kofaktorin avulla.<br />

Näytetään vielä että jos matriisi A on säännöllinen (siis<br />

A −1 on olemassa), siitä seuraa että detA ≠ 0:<br />

detI = 1 = det(A −1 A) = detAdetA −1 ⇒ detA ≠ 0.<br />

Lisäksi nähdään<br />

detA −1 = 1/detA<br />

HUOM: yllä esitetty tapa antaa käänteismatriisin<br />

suljetussa muodossa. Se ei kuitenkaan ole tavallisesti<br />

ja<br />

eli<br />

(A −1 ) ij = 1<br />

detA (−1)i+j D ji =<br />

A −1 =<br />

(<br />

−3 2<br />

2 −1<br />

9.6 Lineaariset yhtälöryhmät<br />

Monissa yhteyksissä tapaamme lineaarisen yhtälöryhmän,<br />

esim.<br />

eli lyhyesti<br />

)<br />

A 11 x 1 +A 12 x 2 = b 1<br />

A 21 x 1 +A 22 x 2 = b 2<br />

Ax = b<br />

Tässä siis A on joku tunnettu kerroinmatriisi, b annettu<br />

vektori ja halutaan ratkaista x.<br />

Kukin kahdesta yo. yhtälöstä määrää suoran<br />

(x 1 ,x 2 )-koordinaateissa. Kahden yhtälön yhtälöryhmällä<br />

siis pyritään määräämään suorien leikkauspiste.<br />

Milloin yo. yhtälöryhmällä on ratkaisu? Jos nyt<br />

detA ≠ 0, käänteismatriisi A −1 on olemassa ja<br />

A −1 Ax = x = A −1 b<br />

79


on yhtälön ainoa ratkaisu.<br />

Entä jos detA = A 11 A 22 −A 12 A 21 = 0? Tällöin ei yleensä<br />

ratkaisua ole, ellei sitten käy niin että yllä molemmat<br />

yhtälöistä ovat vakiokerrointa vaille samat. Nimittäin<br />

tällöin A:n ensimmäinen ja toinen rivi ovat kerrointa<br />

vaille samat, ja detA = 0. Tässä tapauksessa yhtälöt<br />

määräävät saman suoran, ja ratkaisuja on äärettömästi:<br />

x 2 = 1<br />

A 12<br />

(b 1 −A 11 x 1 )<br />

Siis:<br />

a) jos detA ≠ 0, suorat eivät ole yhdensuuntaisia ja ∃<br />

ratkaisu x = A −1 b.<br />

b) jos detA = 0, suorat ovat yhdensuuntaiset. Nyt<br />

riippuu vektorista b kuvaavatko yhtälöt kahta<br />

yhdensuuntaista suoraa (ei ratkaisua) vai samaa suoraa<br />

(äärettömästi ratkaisuja).<br />

Tämä kaikki yleistyy luonnollisesti n×n-matriiseihin.<br />

Siis, jos detA ≠ 0, yhtälöryhmällä<br />

Ax = b<br />

on yksikäsitteinen ratkaisu x = A −1 b. Erityisesti yhtälöllä<br />

Ax = 0<br />

on vain ratkaisu x = 0, jos detA ≠ 0. Kirjoittamalla tämä<br />

muotoon ∑<br />

A ij x j = 0 ⇒ ∑ Â j x j = 0<br />

j<br />

j<br />

vain jos x j = 0, ja missä Âi on A:n pystyrivistä i<br />

koostuva pystyvektori, niin nähdään seuraava tulos:<br />

detA ≠ 0 ⇔ A:n pystyvektorit lineaarisesti<br />

riippumattomia.<br />

Sama pätee myös vaakavektoreille.<br />

9.6.1 Yhtälöryhmän ratkaisu<br />

eliminointimenetelmällä<br />

Olkoon meillä yhtälö (detA ≠ 0)<br />

Ax = b ⇒ x = A −1 b<br />

Tässä tapauksessa käänteismatriisia ei useimmiten<br />

kannata laskea, vaan ratkaista yhtälöryhmä<br />

eliminointimenetelmällä:<br />

Esim.<br />

(<br />

2 1<br />

1 −2<br />

)(<br />

x<br />

y<br />

)<br />

=<br />

(<br />

2x+y<br />

x−2y<br />

)<br />

=<br />

(<br />

5<br />

−5<br />

Nyt detA = −5 ≠ 0, joten yhtälö kääntyy. Pyrkimyksenä<br />

on eliminoida jälkimmäisestä yhtälöstä x lisäämällä<br />

ensimmäinen yhtälö sopivasti kerrottuna. Lisäksi<br />

ensimmäisestä eliminoidaan y. Tämä voidaa<br />

systematisoida seuraavasti:<br />

)<br />

( )( ) 2 1 5 ×1/2<br />

(<br />

1 −2<br />

)(<br />

−5<br />

)<br />

1 1/2 5/2<br />

(<br />

1 −2<br />

)(<br />

−5<br />

)<br />

väh. rivi 1<br />

1 1/2 5/2<br />

0 −5/2 −15/2 ×−2/5<br />

( )( )<br />

1 1/2 5/2 väh. rivi 2 ×1/2<br />

(<br />

0 1<br />

)( )<br />

3<br />

1 0 1<br />

0 1 3<br />

Yhtälön ratkaisu on siis x = (1 3) T , mikä voidaan heti<br />

tarkistaa.<br />

Päämäärä on siis lisätä ja vähentää rivejä sopivasti<br />

kerrottuina niin että vasemmalle saadaan yksikkömatriisi.<br />

Esim.<br />

⎛<br />

⎝<br />

1 −1 1<br />

1 1 −1<br />

1 2 −3<br />

⎞⎛<br />

⎠⎝<br />

x<br />

y<br />

z<br />

⎞<br />

⎛<br />

⎠ = ⎝<br />

Eliminoidaan ⎛ ⎞⎛<br />

⎞<br />

1 −1 1 0<br />

⎝ 1 1 −1 ⎠⎝<br />

1 ⎠ −rv.1<br />

1 2 −3 −1 −rv.1<br />

⎛<br />

⎝ 1 −1 1<br />

⎞⎛<br />

0 2 −2 ⎠⎝ 0 ⎞<br />

1 ⎠ +(1/2)rv.2<br />

×1/2<br />

0 3 −4 −1 −(3/2)rv.2<br />

⎛ ⎞⎛<br />

⎞<br />

1 0 0 1/2<br />

⎝ 0 1 −1 ⎠⎝<br />

1/2 ⎠ −rv.3<br />

0 0 −1 −5/2 ×−1<br />

⎛<br />

⎞⎛<br />

1 0 0<br />

⎝ 0 1 0 ⎠⎝<br />

0 0 1<br />

Siis ratkaisu on<br />

1/2<br />

3<br />

5/2<br />

⎞<br />

⎠<br />

⎛<br />

x = ⎝<br />

1/2<br />

3<br />

5/2<br />

0<br />

1<br />

−1<br />

Huom: jos matriisin det = 0, eliminointimenetelmä kertoo<br />

sen: ei voida konstruoida I-matriisia.<br />

9.6.2 Matriisin kääntäminen Gaussin<br />

eliminointimenetelmällä<br />

Eliminointimenetelmällä voidaan (lähes) samalla vaivalla<br />

ratkaista usea muotoa<br />

⎞<br />

⎠<br />

Ax = b i , i = 1...n<br />

oleva yhtälö: kirjoitetaan vain rinnan<br />

(A)(b 1 )(b 2 )...<br />

ja eliminoidaan rivejä niin että A:n tilalle tulee<br />

yksikkömatriisi, ja tehdään sama eliminointi kaikille b i .<br />

Lopputuloksena voimme lukea b i :n paikalta yhtälöryhmän<br />

Ax = b i ratkaisun.<br />

⎞<br />

⎠<br />

80


Tämä toimii myös jos b i = ê i , standardikannan vektori.<br />

Nyt lopputuloksena saadaan A:n käänteismatriisi.<br />

Esim. Edellisen esimerkin matriisin<br />

⎛<br />

⎝<br />

1 −1 1<br />

1 1 −1<br />

1 2 −3<br />

käänteismatriisi: ⎛<br />

⎝ 1 −1 1<br />

⎞⎛<br />

1 1 −1 ⎠⎝ 1 0 0<br />

⎞<br />

0 1 0 ⎠ −rv.1<br />

1 2 −3 0 0 1 −rv.1<br />

⎛ ⎞⎛<br />

⎞<br />

1 −1 1 1 0 0 +(1/2)rv.2<br />

⎝ 0 2 −2 ⎠⎝<br />

−1 1 0 ⎠ ×1/2<br />

0 3 −4 −1 0 1 −(3/2)rv.2<br />

⎛ ⎞⎛<br />

⎞<br />

1 0 0 1/2 1/2 0<br />

⎝ 0 1 −1 ⎠⎝<br />

−1/2 1/2 0 ⎠ −rv.3<br />

⎛<br />

0 0 −1<br />

⎞⎛<br />

1/2 −3/2 1<br />

⎞<br />

×−1<br />

1 0 0 1/2 1/2 0<br />

⎝ 0 1 0 ⎠⎝<br />

−1 2 −1 ⎠<br />

0 0 1 −1/2 3/2 −1<br />

Siis käänteismatriisi on<br />

⎛ ⎞<br />

1/2 1/2 0<br />

⎝ −1 2 −1 ⎠<br />

−1/2 3/2 −1<br />

mikä nähdään kokeilemalla.<br />

HUOM: joskus diagonaalille uhkaa tulla 0. Tämä ei ole<br />

ongelma, sillä tähän riviin voidaan lisätä/vähentää<br />

sopivasti joku alla olevista riveistä niin että diagonaalille<br />

tulee 1. Jos tämä ei millään onnistu, on det = 0.<br />

Usein eliminointi on helpompaa tehdä niin että ei tule<br />

murtolukuja.<br />

Esim. Matriisin<br />

⎛<br />

A = ⎝<br />

2 3 5<br />

1 2 4<br />

3 1 0<br />

käänteismatriisi. ⎛ ⎞⎛<br />

⎞<br />

2 3 5 1 0 0<br />

⎝ 1 2 4 ⎠⎝<br />

0 1 0 ⎠ ×2−(rv.1)<br />

3 1 0 0 0 1 −3×(rv.2)<br />

⎛ ⎞⎛<br />

⎞<br />

2 3 5 1 0 0 −3×(rv.2)<br />

⎝ 0 1 3 ⎠⎝<br />

−1 2 0 ⎠<br />

⎛<br />

0 −5 −12<br />

⎞⎛<br />

0 −3<br />

⎞<br />

1 +5×(rv.2)<br />

2 0 −4 4 −6 0 ×3+4×(rv.3)<br />

⎝ 0 1 3 ⎠⎝<br />

−1 2 0 ⎠ −(rv.3)<br />

0 0 3 −5 7 1<br />

⎛<br />

⎝<br />

⎛<br />

⎝<br />

6 0 0<br />

0 1 0<br />

0 0 3<br />

1 0 0<br />

0 1 0<br />

0 0 1<br />

⎞⎛<br />

⎠⎝<br />

⎞⎛<br />

⎠⎝<br />

−8 10 4<br />

4 −5 −1<br />

−5 7 1<br />

⎞<br />

⎠<br />

−4/3 5/3 2/3<br />

4 −5 −1<br />

−5/3 7/3 1/3<br />

⎞<br />

⎠<br />

⎞<br />

⎠<br />

×1/6<br />

×1/3<br />

⎞<br />

⎠<br />

Käänteismatriisi on siis<br />

⎛<br />

A −1 = 1 ⎝<br />

3<br />

−4 5 2<br />

12 −15 −3<br />

−5 7 1<br />

9.7 Ominaisarvot ja -vektorit<br />

Jos A on n×n-matriisi, ja jos löytyy vektori x ≠ 0 siten<br />

että<br />

Ax = λx<br />

missä λ on skalaari (yleisesti kompleksiluku), sanotaan<br />

että<br />

x on A:n ominaisvektori ja<br />

λ on vektoriin x liittyvä ominaisarvo<br />

Ominaisvektorit siis säilyttävät suuntansa<br />

lineaarikuvauksissa. Ne ovat aina erityisasemassa, ja<br />

vastaavat kuvausten “pääakseleita”.<br />

Ominaisarvoille pätee: A on säännöllinen ↔ A:n kaikki<br />

ominaisarvot ≠ 0.<br />

Tod. Jos λ = 0, niin vastaava ominaisvektori Ax = 0.<br />

Koska x ≠ 0, tämä toteutuu jos ja vain jos detA = 0, siis<br />

A ei ole säännöllinen.<br />

Ominaisvektorit eivät ole yksikäsitteisiä: ne voidaa kertoa<br />

vakiolla ja ne ovat edelleen ominaisvektoreita. Samalla<br />

ominaisarvolla voi myös olla useita lineaarisesti<br />

riippumattomia ominaisvektoreita.<br />

Esim. Yksikkömatriisi I toteuttaa Ix = x kaikilla x. Siis<br />

kaikki vektorit ovat sen ominaisvektoreita ominaisarvolla<br />

1.<br />

Pätee: A:n ominaisarvot ovat yhtälön<br />

det(A−λI) = 0<br />

juuret.<br />

Tod. Jos λ on ominaisarvo, on<br />

Ax = λx = λIx ⇒ (A−λI)x = 0. Tällä on ratkaisu kun<br />

x ≠ 0 vain jos det(A−λI) = 0.<br />

Jos A on n×n-matriisi, det(A−λI) on n:n asteen<br />

polynomi λ:n suhteen:<br />

det(A−λI) =<br />

∣<br />

Yhtälö<br />

⎞<br />

⎠<br />

A 11 −λ A 12 ··· A 1n<br />

A 21 A 22 −λ ··· A 2n<br />

.<br />

A n1 ··· A nn −λ<br />

P n (λ) = 0<br />

≡ P n (λ)<br />

∣<br />

(9.2)<br />

on A:n karakteristinen yhtälö, ja sen ratkaisut ovat A:n<br />

ominaisarvot. Näiden avulla P n voidaan kirjoittaa<br />

muotoon<br />

∏ n<br />

P n (λ) = (−1) n (λ−λ 1 )(λ−λ 2 )... ≡ (−1) n (λ−λ i )<br />

i=1<br />

(9.3)<br />

81


(nähdään kaavasta (9.2) että λ n :n kerroin on (−1) n ).<br />

Tästä seuraa että<br />

P n (0) =<br />

n∏<br />

λ i = detA<br />

i=1<br />

Kertalukuun λ n−1 on otettava (9.2) diagonaalilta kaikki<br />

λ:t paitsi vuorollaan yksi A ii . Samoin karakteristisen<br />

polynomin ekspansiosta (9.3):<br />

termi λ n−1 :<br />

Siis saamme tulokset:<br />

Esim. Matriisin<br />

∑<br />

A ii (−λ) n−1 = (−λ) n−1∑<br />

i<br />

i<br />

detA = λ 1 λ 2 ... =<br />

n∏<br />

i=1<br />

TrA = λ 1 +λ 2 +... =<br />

A =<br />

( 2 1<br />

0 1<br />

)<br />

λ i<br />

n∑<br />

i=1<br />

ominaisarvot:<br />

det(A−λI) =<br />

∣ 2−λ 1<br />

0 1−λ ∣ = (2−λ)(1−λ) = 0<br />

minkä ratkaisut ovat λ = 2 ja λ = 1. Tässä tapauksessa<br />

karakteristinen yhtälö oli yksinkertainen.<br />

Esim. Yleinen 2×2-matriisi<br />

A =<br />

( a b<br />

c d<br />

)<br />

,<br />

λ i<br />

λ i<br />

= −(2−λ)(1+λ)(1−λ)+4(1−λ)+6−3(1−λ)<br />

= −λ 3 +2λ 2 −6λ+5 = (1−λ)(λ 2 −λ+5) = 0<br />

Ominaisarvot ovat siis<br />

λ 1 = 1, λ 2,3 = 1 2 ± 1 2<br />

√<br />

1−20 =<br />

1<br />

2 (1±i√ 19)<br />

Ominaisarvoa λ vastaava ominaisvektori saadaan<br />

yhtälöstä<br />

Av = λv<br />

Esim. jos<br />

A =<br />

( 1 1<br />

2 0<br />

niin sen ominaisarvot ovat<br />

det(A−λI) =<br />

∣ 1−λ 1<br />

2 −λ ∣ = λ2 −λ+2 = 0<br />

joten ominaisarvot λ 1 = 2, λ 2 = −1.<br />

1. Ominaisvektori:<br />

( )( ) ( )<br />

1 1 x1 x1<br />

= 2<br />

2 0 y 1 y 1<br />

)<br />

{<br />

x1 +y<br />

⇒ 1 = 2x 1<br />

2x 1 = 2y 1<br />

minkä ratkaisu on x 1 = y 1 (molemmista sama ehto). Siis<br />

ominaisarvoa λ 1 = 2 vastaava ominaisvektori<br />

( )<br />

1<br />

v 1 = vakio<br />

1<br />

2. ominaisvektori:<br />

( 1 1<br />

2 0<br />

)( ) ( )<br />

x2 x2<br />

= −1<br />

y 2 y 2<br />

{<br />

Karakteristinen yhtälö on<br />

x2 +y<br />

⇒ 2 = −x 2<br />

⇒ y det(A−λI) =<br />

∣ a−λ b<br />

2x 2 = −y 2 = −2x 2<br />

2 c d−λ ∣ = λ2 −(a+d)λ+(ad−bc) Siis ominaisarvoa λ 2 = −1 vastaava ominaisvektori<br />

= λ 2 ( )<br />

− TrAλ+detA = 0<br />

1<br />

v 2 = vakio<br />

−2<br />

Huom: tämä pätee vain 2×2-matriiseille.<br />

Esim. Etsitään matriisin<br />

Ominaisvektorit on usein tapana normittaa: määrätään<br />

⎛ ⎞ vakio niin että |v| = 1. Edellä normitetut vektorit ovat siis<br />

2 −2 3<br />

A = ⎝ 2 −1 0 ⎠<br />

−1 1 1<br />

v 1 = 1 ( )<br />

1<br />

√ v 2 1 2 = 1 ( )<br />

1<br />

√<br />

5 −2<br />

2−λ −2 3<br />

Pystyvektorit ovat ortogonaalisia, jos niiden välinen<br />

ominaisarvot: det(A−λI) =<br />

2 −1−λ 0<br />

pistetulo (sisätulo) häviää:<br />

∣ −1 1 1−λ ∣<br />

= (2−λ)<br />

∣ −1−λ 0<br />

∣ ∣∣∣ 1 1−λ ∣ −(−2) 2 0<br />

n∑<br />

−1 1−λ ∣ +<br />

x † y = x ∗ iy i = 0<br />

i=1<br />

3<br />

2 −1−λ<br />

∣ −1 1 ∣<br />

Olkoon matriisi A hermiittinen, ts. A † = A. Sille pätee<br />

82


Hermiittisen matriisin ominaisarvot ovat reaaliset, ja eri<br />

ominaisarvoja vastaavat ominaisvektorit ortogonaaliset<br />

Tod. Olkoon Ax = λx. Nyt<br />

ja toisaalta<br />

x † Ax = λx † x<br />

x † Ax = x † A † x = (Ax) † x = (λx) † x = λ ∗ x † x<br />

Siis λ ∗ = λ.<br />

Olkoon nyt λ 1 , λ 2 kaksi erisuurta ominaisarvoa, ja niiden<br />

ominaisvektorit x 1 , x 2 . Nyt<br />

x † 2 Ax 1 = λ 1 x † 2 x 1.<br />

Toisaalta<br />

x † 2 A† x 1 = (Ax 2 ) † x 1 = λ 2 x † 2 x 1<br />

Koska λ 2 ≠ λ 1 , tämä voi pitää paikkansa vain jos<br />

x † 2 x 1 = 0.<br />

Liite A. Kreikkalaiset kirjaimet<br />

Pienet kirjaimet<br />

α alfa θ theta π pi<br />

β beta ι iota ρ ro<br />

γ gamma κ kappa σ sigma<br />

δ delta λ lambda τ tau<br />

ǫ epsilon µ my υ ypsilon<br />

ζ zeta ν ny φ fi<br />

η eta ξ xi χ khi<br />

ψ psi ω omega<br />

Isot kirjaimet<br />

Γ Gamma Λ Lambda Σ Sigma<br />

∆ Delta Ξ Xi Υ Ypsilon<br />

Θ Theta Π Pi Φ Fi<br />

Ψ Psi Ω Omega<br />

83


Liite B. Joukko-oppia<br />

Joukko koostuu alkioista (jäsenistä, elementeistä). Kun<br />

halutaan ilmoittaa, että joukon A alkiot ovat a 1 ,a 2 ,...<br />

käytetään usein merkintää<br />

A = {a 1 ,a 2 ,...}.<br />

Joukko voi olla tyhjä, ts. siinä ei ole yhtään jäsentä.<br />

Tyhjästä joukosta käytetään merkintää ∅.<br />

Jos joukon A jäsenet toteuttavat jonkun tietyn ehdon,<br />

merkitään<br />

A = {x|ehto x:lle}.<br />

Esimerkiksi<br />

I = {x|0 ≤ x ≤ 1}<br />

on välillä 0 ja 1 olevien (reaali)lukujen joukko.<br />

Merkintä a ∈ A ilmoittaa, että a on joukon A jäsen, a<br />

kuuluu joukkoon A. Jos kaikki joukon A alkiot ovat myös<br />

joukon B alkioita, merkitään A ⊂ B (B ⊃ A) ja<br />

sanotaan, että A kuuluu joukkoon B tai että A on joukon<br />

B osajoukko.<br />

Joukkojen A ja B yhtäsuuruus tarkoittaa, että<br />

molemmissa joukoissa on samat jäsenet, ts. A ⊂ B ja<br />

B ⊂ A. Luonnollinen merkintä yhtäsuuruudelle on A = B.<br />

Kahden joukon A ja B yhteisistä jäsenistä koostuvaa<br />

joukkoa A∩B sanotaan leikkaukseksi. Ilmeisestikin on<br />

voimassa A∩B = B ∩A, A∩B ⊂ A ja A∩B ⊂ B.<br />

Yhdiste A∪B on molempien joukkojen A ja B alkioista<br />

koostuva joukko. Se toteuttaa mm. relaatiot<br />

A∪B = B ∪A, A ⊂ A∪B ja B ⊂ A∪B.<br />

Liite C. Kvanttorit<br />

Matematiikassa käytetään usein ilmauksia on olemassa<br />

ja kaikilla. Esimerkkilauseita voisivat olla vaikkapa: on<br />

olemassa sellainen reaaliluku x, että x 2 = a kun a ≥ 0<br />

tai<br />

kaikilla reaaliluvuilla x on voimassa x 2 ≥ 0.<br />

Päästään hieman vähemmällä kirjoittamisella, kun<br />

otetaan käyttöön formaalin logiikan kvanttorit ∃ ja ∀<br />

ilmaisemaan olemassaoloa (eksistenssiä) ja<br />

yleispätevyyttä (universaalisuutta). Kvanttoreiden avulla<br />

esimerkkilauseet voitaisiin kirjoittaa vaikkapa muotoihin<br />

∃x ∈ R siten, että x 2 = a kun a ≥ 0<br />

ja<br />

x 2 ≥ 0 ∀x ∈ R.<br />

Symbolilla R on tässä merkitty reaalilukujen joukkoa.<br />

84


Liite D. Intervalleja, jatkuvuuksia, ...<br />

Reaaliakselin yhtenäisistä osista intervalleista käytetään<br />

usein merkintöjä<br />

suljettu väli [a,b] tarkoittaa reaaliakselin väliä<br />

a ≤ x ≤ b, ts. alku- ja loppupisteet kuuluvat mukaan.<br />

avoin väli (a,b) tarkoittaa väliä a < x < b, ts. alku- ja<br />

loppupisteet eivät kuulu väliin.<br />

puoliavoimet välit (a,b] ja [a,b) tarkoittavat<br />

vastaavasti välejä, joissa vain toinen päätepiste<br />

kuuluu joukkoon.<br />

Funktio f(x) on<br />

rajoitettu jos tarkasteltavalla välillä on |f(x)| ≤ M,<br />

missä 0 ≤ M < ∞.<br />

jatkuva jos se ei ”hyppää”pisteestä toiseen,<br />

paloittain jatkuva funktio jos se on jatkuva muualla<br />

paitsi mahdollisesti äärellisen monessa tarkasteltavan<br />

välin pisteessä.<br />

85

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!