09.07.2015 Views

Lineaire algebra voor ingenieurs [ ]

Lineaire algebra voor ingenieurs [ ]

Lineaire algebra voor ingenieurs [ ]

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Deze visie op het matrixproduct is zeer waardevol in de lineaire <strong>algebra</strong>, we illustreren dit meteen oefening (op te lossen zonder rekentoestel):Stel1 1 1 0A = ⎡ ⎤⎢0 1 1 1 ⎥⎣ ⎦ .a) Construeer een 4× 2 matrix B met elementen gelijk aan 0 of 1, zodat AB = I2.b) Zijn er meerdere mogelijkheden <strong>voor</strong> B indien de elementen gelijk zijn aan 1, -1 of 0 ?c) Bestaat er een 4× 2 matrix C zodat CA = I4? Waarom wel of waarom niet?d) Kan je <strong>voor</strong> elke 2× 4 matrix A een 4× 2 matrix B vinden zodat AB = I2? Wat moet ergelden <strong>voor</strong> de kolommen van A ?3 Beknopte <strong>voor</strong>stelling van de TI-89 TitaniumDe TI-89 Titanium is een symbolisch rekentoestel, <strong>voor</strong>zien van computer<strong>algebra</strong> op basisvan het pakket DERIVE. Tijdens de uiteenzetting worden de mogelijkheden van dit toestelkort besproken.Enkele <strong>voor</strong>delen:• Computer<strong>algebra</strong> in vestzakformaat.• De onmiddellijke beschikbaarheid, het snelle aan- en uitzetten.• De veelzijdige inzet niet alleen <strong>voor</strong> wiskunde en statistiek, maar ook <strong>voor</strong>labtoepassingen (chemie, fysica, elektronica) bij het opmeten van data gekoppeld aansensoren.4 ToepassingenIn de onderstaande toepassingen worden veel schermafdrukken van de TI-89 getoond. Ditgeeft een idee van de mogelijkheden van het toestel. Het is echter niet de bedoeling om hier inte gaan op de syntax van het rekentoestel.4.1 Kegelsnedena) Een cirkel door 3 gegeven punten: lineair stelselUit de meetkunde weten we dat er één cirkel gaat door drie punten die niet gelegen zijn opeen rechte.De standaardvergelijking ( x − x ) 2 ( )2 20+ y− y0= R van de cirkel met middelpunt ( x0,y0)enstraal R kan worden herschreven als x 2 + y 2 + lx+ my+ n= 0 (1) . Substitutie van decoördinaten van de gegeven punten ( x1, y1) ,( x2, y2) ,( x3,y3)in (1) levert een stelsel vanlineaire vergelijkingen waaruit de onbekenden l, m, n worden opgelost:⎧ lx + my + n =−x − y⎪⎨lx + my + n =−x − y⎪⎩lx + my + n =−x − y2 21 1 1 12 22 2 2 22 23 3 3 3(2)2


Voorbeeld: vind de vergelijking van de cirkel door de punten ( 1, 7 ), ( 6, 2 ) en ( 4,6 ).Het stelsel (2) wordt⎧l+ 7m+ n=−50⎪⎨6l+ 2m+ n=−40⎪⎩4l+ 6m+ n=−52.De gereduceerde echelonvorm van de uitgebreide matrix van het stelsel levert de oplossinglmm , , = −2, −4, − 20 .( ) ( )De vergelijking van de cirkel wordt2 2+ −2 −4 − 20 = 0 of ( x− 1) + ( y− 2)= 25.2 2x y x yEen grafische bevestiging:Wanneer heeft het stelsel (2) geen oplossingen of oneindig veel oplossingen?b) Een cirkel door 3 gegeven punten: vergelijking in determinantvormDe vergelijking2 2x y lx my n2 2worden geschreven als ( )+ + + + = 0 van de cirkel kan, na vermenigvuldiging met a ≠ 0 ,a x + y + bx+ cy+ d = 0 (3) . De coördinaten van de gegevenpunten ( x1, y1) ,( x2, y2) ,( x3,y3)moeten voldoen aan (3). Ook de coördinaten van eenwillekeurig punt ( x,y ) van de cirkel voldoen aan (3). Dit levert het volgende homogeenstelsel:3


c) Een kegelsnede door 5 gegeven puntenDe algemene vergelijking van een kegelsnede is2 2ax + by + cxy + dx + ey + f = 0waarbij de 6 coëfficiënten niet allemaal nul zijn. Het aantal coëfficiënten kan worden herleidtot 5 door te delen door een coëfficiënt verschillend van nul, zodat 5 verschillende punten inhet vlak volstaan om de vergelijking van de kegelsnede te bepalen.Analoog met <strong>voor</strong>gaande paragraaf vinden we de vergelijking in determinantvorm:2 2x y xy x y 12 2x1 y1 x1y1 x1 y112 2x2 y2 x2y2 x2 y21= 02 2x3 y3 x3y3 x3 y312 2x4 y4 x4y4 x4 y412 2x y x y x y 15 5 5 5 5 5Ter illustratie bepalen we de vergelijking van de kegelsnede door de punten( 1,2, ) ( −2,3,4,6, ) ( ) ( −5,2,3, ) ( − 4).2 2We verkrijgen 228x −163y − 517xy+ 1946x+ 1833y− 4154 = 0 (na deling door 36).Aangezien228 −517 / 2−517 / 2 −163< 0is het een hyperbool.De kegelsnede door de punten ( 1,1 ), ( −1,1 ), ( −1, −1 ), ( 1, − 1 ), ( 0, 0)levertontaard en bestaat uit twee rechten.x− y = 0, ze is2 25


d) De ellips als meetkundige plaatsEen ellips is de meetkundige plaats van de punten waar<strong>voor</strong> de som van de afstanden tot tweegegeven brandpunten constant is.Kies een orthonormaal assenstelsel. Zij = ( x,y)f = ( xf,yf ) , = ( xg, yg)g de brandpunten, dan geldt:p een willekeurig punt van de ellips en( ) ( )d pf , + d pg , = 2a(6)Omwille van de driehoeksongelijkheid moet d( f, g) ≤ d( fp , ) + d( pg , ) of d( )We eisen echter strikte ongelijkheid d( fg , ) < 2aaangezien d( , ) = 2adat f met g verbindt.2 2Nu is: d( pf , ) = p− f = ( x− xf ) + ( y−yf)Eerst werken we de wortelvormen weg die gepaard gaan met (6):2 22Kwadrateren van (6) levert d( pf , ) = 4a −4 a⋅ d( pg , ) + d( p,g )2 22of 4 a⋅ d( p, g) = 4 a + d( p, g) −d( pf , )( ) 22 2 22 2opnieuw kwadrateren: a d( ) a d( ) d( )fg , ≤ 2a(7).fg het lijnstuk oplevert16 ⋅ pg , − 4 + pg , − pf , = 0 (8)Het uitwerken van (8) gebeurt met computer<strong>algebra</strong>, dit levert de vergelijking van de ellipswaarvan we het linkerlid opslaan in de functie ellips ( xf, yf, xg, yg,a ) met als variabelen decoördinaten van de brandpunten en de lengte a van de halve brandpuntenas. Dit is een langeuitdrukking (zie vierde plaatje onderaan).Zo levert ellips( 4,0, − 4,0,5)= 0 de vergelijking2 2144x400y3600 0+ − = of2 2x y+ = 1.2 25 36


( c c a)ellips ,0, ,0, 0− = wordt ( )16a 2 − 16c 2 x 2 + 16a 2 y 2 − 16a 4 + 16a 2 c2 = 0of ( a 2 − c 2 ) x 2 + a 2 y 2 = a 2 ( a 2 − c2)met2 2 2b = a − c verkrijgen we het gekende resultaatxay+ = .b2 22 21De keuze van de brandpunten is vrij.ellips( 5, 2, −4, − 2,8)= 0 wordt2 2700x 288xy 960y 700x 144y40529 0− + − + − = :Opmerking:Wat gebeurt er als we een waarde a kiezen met d( )driehoeksongelijkheid (7)?Proberen met ellips ( 5, 0, − 5,0,3)= 0 levertde hyperbool2 2x y− = 1 !!16 9fg , > 2a, zodat niet voldaan is aan de2 2− 144x+ 256y+ 2304 = 0 ofMen kan narekenen dat ook een hyperbool met d( pf , ) − d( pg , ) = 2aen d( fg )voldoet aan vergelijking (8)., > 2aDe functie ellips ( xf, yf, xg, yg,a ) levert dus een ellips of een hyperbool met gegevenbrandpunten f = ( xf,yf ) en g = ( xg, yg)groter is dan 2a ., naargelang de afstand tussen f en g kleiner of7


4.2 Eigenwaarden en eigenvectorenHet probleem waarbij men een getal λ en een vectorveel toepassingen.x≠0 nodig heeft zodat Ax=λx kenta) De stelling van Cayley-HamiltonDe stelling van Cayley-Hamilton kan als volgt worden ingeleid:• kies een 2 2× matrix A en bereken zijn karakteristieke veelterm p ( λ ) = det ( A−λI)• vervang λ in de veelterm p ( λ ) door A (hierbij wordt0λ vervangen door• wat is het resultaat? Probeer ook eens met een 3× 3 en een 4× 4 matrix.0A= I )We verkrijgen telkens de nulmatrix, we vermoeden dus algemeen dat elke matrix A voldoetaan zijn eigen karakteristieke vergelijking:als p ( λ ) = 0 de karakteristieke vergelijking is van A, dan is p( A ) = 0 (de nulmatrix). Dit isde stelling van Cayley-Hamilton.Voor⎡−4 4⎤A = ⎢0 3 ⎥⎣ ⎦ wordt de karakteristieke vergelijking 2λ + λ− 12 = 0 zodat2A A I+ − 12 = 0 of2A 12I A= − .Merk op dat A 3 = A 2 A= ( 12I − A) A= 12A− A 2 = 12A−( 12I − A)= 13A−12IVoor elk natuurlijk getal k ≥ 2 geldt datafhankelijk van k.kA α A β I= + , waarbij α en β constanten zijn8


) De cirkels van GerschgorinZij A= ⎡ ⎣ a ⎤ij ⎦ een vierkante matrix van orde n, dan is elke eigenwaarde van A gelegen binnen(of op) ten minste één van de cirkels in het complexe vlak met middelpunt a iien straalnn⎛ ⎞ri = ∑ ai, j= ⎜ ∑ ai,j ⎟−a ( iii = 1,2,3, … n ) .j= 1, j≠ i ⎝ j=1 ⎠Alle eigenwaarden van A liggen dus in de unie van de schijvenD = z∈ : z−a ≤r( i = 1,2,3, … n).{ }i ii iDeze stelling van Gerschgorin is handig om snel een grafisch idee te krijgen van de liggingvan de eigenwaarden van een matrix:Stel⎡ 8 −1 0⎤A =⎢1 2 3⎥⎢− ⎥⎢⎣0 −1 3⎥⎦. De drie Gerschgorin cirkels zijn(i) z − 8 = − 1+ 0= 1 (ii) z − 2 = − 1+ 3 = 4 (iii) z − 3 = 0+ − 1 = 1We zien dat de eigenwaarden gelegen zijn binnen de unie van de schijven. Bovendien vormtde unie van twee van die schijven een samenhangend gebied dat disjunct is met de derdeschijf, hieruit mogen we concluderen dat er binnen die unie exact twee eigenwaarden liggen(rekening houdend met de multipliciteit).TAangezien A en A dezelfde eigenwaarden hebben kunnen we ook drie cirkels bepalen metstralen berekend uit de kolomsommen i.p.v. de rijsommen. Dit levert de volgende cirkels:De eigenwaarden liggen dus in de doorsnede van de twee unies van drie schijven.Toepassingen:• Als de oorsprong niet gelegen is in de unie van de schijven bepaald door een matrix A,dan is 0 geen eigenwaarde van A. Dit betekent dat A een inverse heeft.9


• Een stelsel u′ = Au van lineaire eerste orde differentiaalvergelijkingen, met Adiagonaliseerbaar, is stabiel als alle eigenwaarden van A een strikt negatief reëel deelhebben. Dit is zeker zo als al de cirkels van Gerschgorin in het halfvlak x < 0 gelegenzijn.• Alle eigenwaarden liggen binnen de schijf⎛n⎞z ≤ max ⎜∑ aij⎟ ( i = 1, 2, … n)(analoogi⎝ j=1 ⎠<strong>voor</strong> de kolomsommen).c) Markov ketensEen firma van huurfietsen heeft drie vestigingsplaatsen, die we noteren met A, B, C.Een klant kan een fiets ophalen en terug afleveren op elk van die plaatsen.De klanten leveren de fietsen terug af op de verschillende plaatsen met de volgende kansen ofproporties:0.8 0.2A0.10.10.3C0.50.2 0.6B0.2Deze overgang wordt beschreven door de volgende stochastische matrix (kolomsommen =1):van :A B C⎡0.8 0.3 0.2⎤P= ⎢0.1 0.2 0.6⎥⎢ ⎥⎢⎣0.1 0.5 0.2⎥⎦naar :ABC⎡0.4⎤1) Kies een starttoestandsvector, bij<strong>voor</strong>beeld x0=⎢0.5⎥⎢ ⎥(d.i. een kansvector met som⎢⎣0.1⎥⎦der elementen gelijk aan 1). Op die avond na sluitingstijd bevinden zich 40% van allefietsen van de firma in A, 50% in B en 10% in C.De Markov keten wordt gevormd door de opeenvolgende toestandsvectorenx0, x1 = Px0, x2 = Px1, x3 = Px 2,… (met xkde fietsverdeling na k werkdagen).10


Er geldt dus dat x = Pxof kk+ 1 kxk= P x0, met k = 0,1,2, …Bereken de opeenvolgende toestandsvectoren en bestudeer hun evolutie op de langeduur.2) Bepaal een evenwichtstoestandsvector, d.i. een kansvector q waar<strong>voor</strong> P q=q.3) Bestudeer de evolutie vankP , met k = 0,1, 2,…Het rekentoestel levert de volgende resultaten:1)De toestandsvectoren stabiliseren klaarblijkelijk naar⎡0.557⎤⎢0.230⎥⎢ ⎥⎢⎣0.213⎥⎦.2) Merk op dat P q=q zeker een oplossing heeft aangezien een stochastische matrix P⎡1⎤Tsteeds eigenwaarde 1 heeft (<strong>voor</strong> P is⎢1⎥een eigenvector met eigenwaarde 1).⎢ ⎥⎢⎣ 1⎥⎦Met de cirkels van Gerschgorin kun je overigens concluderen dat alle eigenwaarden eenmodulus hebben kleiner dan of gelijk aan 1 (werk met de kolomsommen).De eigenruimte horende bij eigenwaarde 1 wordt gegeven door de vectoren11


3) We observeren de opeenvolgende machten van de overgangsmatrix P:We vermoeden dat lim Pk = [ q q q ]Waarom is dat zo?k→∞k k kMerk op dat P = P ⋅ I = P ⋅[ e e e ]⎡1 2 3k k k= ⎣ P e1 P e2 P e3⎦Nu geldt lim P k = ⎡lim P k e lim P k e lim Pk e ⎤ = [ q q q ]⎣1 2 3k→∞ k→∞ k→∞ k→∞aangezien e1, e2,e3kansvectoren zijn.⎤⎦Stelling:kAls P een reguliere n× n stochastische matrix is (d.w.z. dat er een k bestaat waar<strong>voor</strong> Puitsluitend strikt positieve elementen bevat), dan heeft P een unieke evenwichtsvector q,waar<strong>voor</strong> P q=q.Als x0eender welke starttoestand is en x = P k+ 1xkmet k = 0,1, 2, … , dan convergeert dekq q … q als k →∞.Markov keten { x k } naar q enP naar [ ]13


d) Diagonalisatie van een vierkante matrixEen vierkante matrix A is diagonaliseerbaar als hij gelijkvormig is met een diagonaalmatrix,d.w.z. dat er een inverteerbare matrix P bestaat waar<strong>voor</strong> A= PDP −1 .De kolommen van P zijn lineair onafhankelijke eigenvectoren van A en de diagonaalmatrix Dbevat de opeenvolgende corresponderende eigenwaarden op de hoofddiagonaal.Diagonalisatie speelt o.a. een rol bij• Het diagonaliseren van een kwadratische vorm.• <strong>Lineaire</strong> discrete en lineaire continue dynamische systemen (stelsels van lineairedifferentievergelijkingen of lineaire differentiaalvergelijkingen van eerste orde).• Het berekenen van matrixfuncties.Als <strong>voor</strong>beeld berekenen we 3 A met1 1P = ⎡ ⎤⎢−1 −2⎥⎣ ⎦ en 5 0D = ⎡ ⎤⎢0 3 ⎥⎣ ⎦ .7 2A = ⎡ ⎤⎢−4 1 ⎥⎣ ⎦ . Er geldt dat 1A= PDP − metWe definiëreneigenschap ( ) 3 3A = A heeft.3⎡35 0 ⎤1A = P⎢ ⎥P − . Men rekent vlug na dat deze matrix de gewenste3⎢⎣0 3⎥⎦Is dit echter een goede definitie, onafhankelijk van de gekozen eigenvectoren in P?Klaarblijkelijk vinden we dezelfde matrix <strong>voor</strong> 3 A bij een andere keuze van P.14


Stelling:Zij A= PDP −1 een diagonaliseerbare matrix waarbij de gelijke eigenwaarden inD = diag ( λ1I, λ2I, …, λkI)gegroepeerd zijn. Voor een functie f ( z ) die gedefinieerd is inelke eigenwaarde λidefiniëren we( λ )⎛ f1I 0 0 ⎞⎜⎟0 f ( λ ) If ( A) = P⋅ f ( D)⋅ P = P⎜⎟P⎜ ⎟⎜f ( λk) I⎟⎝⎠−1 2−1Deze definitie is onafhankelijk van de gekozen diagonalisatie van A.Oefening:Bewijs dat sin2 ( ) cos2( )A + A = I en controleer dit met7 2A = ⎡ ⎤⎢−4 1 ⎥⎣ ⎦ .4.3 Orthogonaliteit en kleinste kwadraten methodea) Orthogonale basissen van een vectorruimte vereenvoudigen het rekenwerk, zij spelen eenbelangrijke rol in de numerieke wiskunde, o.a. bij de “QR ontbinding” waarbij een m×nmatrix A met lineair onafhankelijke kolommen wordt geschreven als A= QR, met Q eenm× n matrix waarvan de kolommen een orthonormale basis vormen van de kolomruimte vanA, en R een n× n inverteerbare bovendriehoeksmatrix met strikt positieve getallen op dehoofddiagonaal.15


) Orthogonale projecties zijn de sleutel tot het “oplossen” van overgedetermineerde stelsels.In de praktijk komen er vaak stelsels <strong>voor</strong> van lineaire vergelijkingen, met meervergelijkingen dan onbekenden, die geen oplossingen hebben.Hoe vinden we bij<strong>voor</strong>beeld de “beste” rechte y = ax+ b “door” de punten( 0,0 ),( 1,1 ),( 2, 2 ),( 3, 2 )?We wensen dat yiaxib= + ( 1, 2, 3, 4)i = maar dit stelsel⎧0a+ b=0⎪a+ b = 1⎨⎪2a+ b=2⎪⎩3a+ b=2of⎡0⎤ ⎡1⎤ ⎡0⎤⎢1⎥ ⎢1⎥ ⎢1⎥a⎢ ⎥+ b⎢ ⎥ = ⎢ ⎥⎢2⎥ ⎢1⎥ ⎢2⎥⎢ ⎥ ⎢ ⎥ ⎢ ⎥⎣3⎦ ⎣1⎦ ⎣2⎦of⎡0 1⎤ ⎡0⎤⎢1 1⎥a⎢1⎥⎢ ⎥⎡ ⎤= ⎢ ⎥⎢2 1⎥ ⎢b⎥⎣ ⎦ ⎢2⎥⎢ ⎥ ⎢ ⎥⎣3 1⎦ ⎣2⎦of A x =yheeft geen oplossing x.Een “beste” oplossing ˆx is een vector zodat Ax ˆ zo dicht als mogelijk gelegen is bij y , in de2zin dat Axˆ−y ≤ Ax −y <strong>voor</strong> elke x∈ .We noemen ˆx een kleinste kwadraten oplossing, de bijbehorende kleinste kwadraten rechteminimaliseert de som van de kwadraten van de verticale afwijkingen van de gegeven puntent.o.v. de rechte.De vectorˆ Ax behoort tot de kolomruimte van A (notatie kol A ).De vector die in kol A het dichtst gelegen is bij y is de orthogonale projectie van y op kol A,dit is de unieke vector projkolAy met de eigenschap dat y = n + projkolAy met n ⊥ kol A .Er bestaat zeker een vector ˆx met A xˆ= projkolAy want als x de verzamelingdan doorloopt Ax de volledige kolomruimte van A.2 doorlooptEr moet dus gelden daty = n+ Ax ˆ met n ⊥ kol A of y−Ax ˆ ⊥ kol A.De kolommen van A genereren kol A . De vectoren slechts als − Aˆy − Ax ˆ staat bijgevolg loodrecht op kol A alsy x loodrecht staat op de twee kolomvectoren van [ ]TTTDit betekent dat a ( y− Ax ) = en a ( y− Ax ) = of A ( Aˆ)1ˆ 02ˆ 0A = a a .1 2y − x = 0.16


Er geldt bijgevolg datTTAAxˆ= Ay .Een beste oplossing ˆx van A x = y vinden we dus door het stelsel TTAAxˆ= Ay op te lossen.TAangezien de matrix AA een inverse heeft als en slechts als de kolommen van A lineaironafhankelijk zijn (zoals in ons <strong>voor</strong>beeld) vinden we in dat geval een unieke vector−( AA) 1ˆT Tx = Ay .Als de kolommen van A lineair afhankelijk zijn, dan heeftoplossingen ˆx waar<strong>voor</strong> A xˆ= projkolAy .TTAAxˆ= Ay oneindig veelConcreet vinden we <strong>voor</strong> ons <strong>voor</strong>beeld:Als beste oplossing vinden wey = 0.7x+ 0.2 .x ⎡a⎤ ⎡7/10⎤ˆ = ⎢ =b⎥ ⎢1/5⎥⎣ ⎦ ⎣ ⎦zodat de beste rechte gegeven wordt doorDit wordt bevestigd door de lineaire regressie met het rekentoestel uit te voeren.17


5 BesluitMet de bovenstaande <strong>voor</strong>beelden hebben we geïllustreerd dat de TI-89 kan helpen bij• het snel verkrijgen van een correct resultaat zonder rekenfouten,• het volgen van een werkwijze die manueel te tijdrovend is,• het verwerven van inzicht bij het invoeren van nieuwe wiskundige begrippen,• het onderzoeken van verschillende situaties die leiden tot het formuleren vanuitspraken,• de belangrijke visuele grafische ondersteuning.De TI-89 is een rekentoestel <strong>voor</strong>zien van computer<strong>algebra</strong>. Het toestel bevat tevens veelnumeriek ingebouwde algoritmen, o.a. <strong>voor</strong> het berekenen van eigenwaarden, eigenvectorenen matrixonbindingen. Deze algoritmen worden bestudeerd in de numerieke wiskunde,waarbij men vaak een heel andere weg inslaat dan de didactische aanpak in een cursus lineaire<strong>algebra</strong>…6 Bronnen1. H. Anton, C. Rorres, Elementary Linear Algebra, Applications Version, John Wiley &Sons, 1991.2. S.I. Grossman, Elementary Linear Algebra, fourth edition, Saunders College Publishing,1991.3. G. James, Advanced Modern Engineering mathematics, third edition, Pearson Education,2004.4. D.C. Lay, Linear Algebra and Its Applications, third edition update, Pearson Education,2006.5. C.D. Meyer, Matrix Analysis and Applied Linear Algebra, Siam, 2000.18

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!