12.07.2015 Views

Felfortplantningsformlerna - Matematiska institutionen - Stockholms ...

Felfortplantningsformlerna - Matematiska institutionen - Stockholms ...

Felfortplantningsformlerna - Matematiska institutionen - Stockholms ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Postadress:Matematisk statistik<strong>Matematiska</strong> <strong>institutionen</strong><strong>Stockholms</strong> universitet106 91 StockholmSverigeInternet:http://www.math.su.se/matstat


Matematisk statistik<strong>Stockholms</strong> universitetKompendium 1997http://www.math.su.se/matstat<strong>Felfortplantningsformlerna</strong>Esbjörn Ohlsson ∗September 1993Uppdaterat januari 2005FörordAvsnitt 1-4 i detta kompendium är avsedda som en komplettering till kursboken Ross(2002) för grundkursen Sannolikhetsteori I. Det något mer teoretiska avsnitt 5 är skrivetför kursen Statistisk Inferensteori II. Första versionen av kompendiet skrevs 1993. Iden uppdaterade versionen 2005 har referenserna förnyats och layouten förhoppningsvisförbättrats.Stockholm i januari 2005Esbjörn OhlssonInnehåll1 Introduktion 22 Funktioner av en stokastisk variabel 33 Funktioner av flera stokastiska variabler 54 Approximation av fördelningen 65 Asymptotiska resultat 76 Övningar 117 Facit 13∗ E-post: esbj@math.su.se. Postadress: Matematisk Statistik, <strong>Stockholms</strong> Universitet, 106 91 Stockholm.


1 INTRODUKTION 21 IntroduktionFör många funktioner av stokastiska variabler kan det vara svårt att bestämma väntevärde ochvarians exakt. I sådana fall kan man dock ofta göra en approximativ beräkning med hjälp avde så kallade felfortplantningsformlerna, som presenteras på följande sidor. Vi inleder medett exempel.Exempel 1.1 (Omsättning i livsmedelshandeln) En undersökning av den totala omsättningeni livsmedelshandeln 1987 baserad på ett slumpmässigt urval av butiker gav resultatet 74mkr. När undersökningen upprepades 1988 (med ett nytt urval) blev resultatet 83 mkr. Dessavärden kan betraktas som utfall av oberoende stokastiska variabler X respektive Y . Låt µ 1vara den verkliga omsättningen 1987 och µ 2 densamma 1988. Enligt uppgift förelåg ingasystematiska fel i undersökningen, dvs E [X] = µ 1 och E [Y ] = µ 2 . Vidare angavs standardavvikelsentill 2.8 mkr för X och 3.1 mkr för Y , dvs Var(X) = 2.8 2 och Var(Y ) = 3.1 2 .Det är i denna typ av tillämpning vanligt att studera förändringen i omsättning (från 1987 till1988). Den absoluta förändringen µ 2 − µ 1 uppskattas naturligtvis med 83 − 74 = 9 mkr, somär en observation av Y − X. Vad vet vi om det systematiska och slumpmässiga felet i dennauppskattning? Enligt våra räkneregler för väntevärde och varians för summor av stokastiskavariabler (återgivna nedan som formel 3.2 och 3.3 ) gällerE [Y − X] = E [Y ] − E [X] = µ 2 − µ 1 (1.1)Var(Y − X) = Var(Y ) + Var(X) = 4.2 2 (1.2)Observera att vi här antagit att X och Y kan betraktas som oberoende (pga oberoende urval)så att Cov(X, Y ) = 0.Antag nu att vi i stället är intresserade av förändringen uttryckt som kvoten µ 2 /µ 1 , vilket ipraktiken är väl så vanligt som att studera den absoluta förändringen. Kvoten skattas med83/74 = 1.12, som är en observation av Y/X . Vi skulle i detta fall, analogt till (1.1) och(1.2), vilja beräkna[ ] YEX( ) YVarX(1.3)(1.4)


2 FUNKTIONER AV EN STOKASTISK VARIABEL 4<strong>Felfortplantningsformlerna</strong> för en funktion av en stokastisk variabel.Med µ = E [X] gällerE [g(X)] ≈ g(µ) (2.4)Var(g(X)) ≈ Var(X) · [g ′ (µ)] 2 (2.5)Dessa formler kallas ibland även ”Gauss approximationsformler”. I avsnitt 3 skall vi antydahur formlerna kan ges en mer strikt motivering med hjälp av ett asymptotiskt resultat. Vi nöjeross här med att konstatera att från resonemanget kring (2.3) följer att approximationernabör bli hyfsade om g(x) är ungefär linjär i ett intervall kring , dit (nästan) hela sannolikhetsfördelningenför X är koncentrerad. Figur 1 och nedanstående anmärkning antyder attapproximationen bör bli bättre ju mer koncentrerad sannolikhetsfördelningen för X är kringµ.y ✻✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭✭y = g(x)f(x)Figur 1: Approximationen blir bra om fördelningen för X är koncentrerad till ett område där g(x) ärungefär linjär.✲xAnmärkning: Här följer ett exempel på en situation där vi kan ange en enkel uppskattningav felet i approximationen (2.4). Låt I vara ett intervall dit hela sannolikhetsmassan för X ärkoncentrerad (eventuellt är I hela reela axeln). Antag att funktionen g har kontinuerlig förstaochandraderivata på I. Då har vi följande välkända utseende på resttermen: R(x) = (x −µ) 2 g ′′ (z)/2, där z ligger mellan µ och x. Antag vidare att beloppet av g:s andraderivata, g ′′ ,är begränsat av en konstant C på I. Då begränsas absolutbeloppet av felet i approximationen(2.4) av C · Var(X)/2. Att ”g(x) är ungefär linjär” betyder att C kan väljas liten. Om nu ävenVar(X) är liten, kommer approximationen att vara god.


3 FUNKTIONER AV FLERA STOKASTISKA VARIABLER 5Exempel 2.1 Låt Y = 1/X. Då ger felfortplantningsformlernaE [Y ]≈1E [X](2.6)Var(Y ) ≈ Var(X)(E [X]) 4 (2.7)Approximationen bör vara god om ligger långt ifrån 0 och Var(X) är liten relativt E [X].<strong>Felfortplantningsformlerna</strong> måste tillämpas med stor försiktighet, vilket följande exempelunderstryker.Exempel 2.2 Låt g(X) = x 2 . Då ger (2.3)E [ X 2] ≈ µ 2 = (E [X]) 2varur vi felaktigt skulle kunna dra slutsatsen att Var(X) ≈ 0 för alla stokastiska variabler!3 Funktioner av flera stokastiska variablerLåt g(X 1 , X 2 , . . . , X n ) vara en funktion av de n stokastiska variablerna X 1 , X 2 , . . . , X n . Antagförst att g är linjär, dvsn∑g(X 1 , X 2 , . . . , X n ) = c i X i (3.1)för några konstanter c 1 , c 2 , . . . , c n . Då får vi, med hjälp av Ross formel (2.2) sid 307 och (3.1)sid 323, samt (2.1) och (2.2) ovan, de välkända räknereglerna[ n∑]n∑E c i X i = c i E [X i ] (3.2)i=1i=1( n∑)n∑n∑ n∑Var c i X i = c 2 i Var(X i ) + 2 c i c j Cov(X i , X j ) (3.3)i=1i=1i=1 j=i+1i=1Låt nu g vara en godtycklig funktion som är approximativt linjär i ett område där (X 1 , X 2 , . . . , X n )lägger huvuddelen av sin sannolikhetsmassa. Med hjälp av en Taylor-utveckling kring vektornav väntevärden µ = (µ 1 , µ 2 , . . . , µ n ) för X 1 , X 2 , . . . , X n och med samma typ av resonemangsom i avsnitt 2 får vi


4 APPROXIMATION AV FÖRDELNINGEN 6<strong>Felfortplantningsformlerna</strong> för en funktion av flera stokastiska variabler.E [g(X 1 , X 2 , . . . , X n )] ≈ g(µ 1 , µ 2 , . . . , µ n ) (3.4)n∑Var(g(X 1 , X 2 , . . . , X n )) ≈ Var(X i ) ( g i(µ) ) n∑ n∑′ 2+ 2 Cov(X i , X j )g i(µ)g ′ j(µ)′i=1i=1 j=i+1(3.5)Här betyder g i(µ) ′ den partiella förstaderivatan av g med avseende på argument i (dvs påx i ), evaluerad i punkten µ = (µ 1 , µ 2 , . . . , µ n ). Om X 1 , X 2 , . . . , X n är oberoende förenklasvariansformeln (3.5) tilln∑Var(g(X 1 , X 2 , . . . , X n )) ≈ Var(X i ) ( g i(µ) ) ′ 2(3.6)i=1Exempel 3.1 (Omsättning i livsmedelshandeln, forts.) Vi kan nu använda formel (3.4) och(3.6) till att ge approximativa svar på frågorna i (1.3) och (1.4). Eftersom funktionen g(x, y) =y/x har partiella derivator −y/x 2 respektive 1/x får vi[ ] YE ≈ µ 2(3.7)X µ 1( ) YVar ≈ Var(X) µ2 2+ Var(Y ) 1 (3.8)X µ 4 1 µ 2 1Ekvation (3.7) visar att vi (approximativt) inte har något systematiskt fel i vår uppskattningav den relativa omsättningsförändringen. Om vi gör den ytterligare approximationen att viersätter µ 1 och µ 2 med 74, respektive 83 i (3.8) kan vi uppskatta variansen till 0.060 2 .4 Approximation av fördelningenLåt oss återvända till formel (2.3). Från denna följer givetvis att g(X) är approximativt fördeladsom det linjära uttrycket i högerledet. Ofta kan det vara betydligt enklare att härledasannolikhetsfördelningen för högerledet än för g(X) direkt. Om till exempel X är normalfördelad,så är högerledet i (2.3) också det (Ross sid 201). Härav följer att g(X) är approximativtnormalfördelad, med väntevärde och varians givna av (2.4) och (2.5). Även när X endast ärapproximativt normalfördelad, följer med samma resonemang som ovan att g(X) också är


5 ASYMPTOTISKA RESULTAT 7det. Detta är ett mycket användbart resultat, bland annat inom statistikteorin där man oftaarbetar med (approximativt) normalfördelade storheter. Även detta resultat kan utvidgas tillfunktioner av flera stokastiska variabler.5 Asymptotiska resultatDetta avsnitt förutsätter kunskaper i sannolikhetsteori på fortsättningsnivå, motsvarande Gut(1995). I bevisen kommer vi att behöva ett antal standardsatser om konvergens från sannolikhetsteorin.Dessa hämtar vi från Guts kapitel VI.Härledningen av (2.4), (2.5), (3.4) och (3.5) ovan var tämligen heuristisk. Kan dessa formlerges ett stringent rättfärdigande? En idé som ligger nära till hands är att söka användbararesttermsuppskattningar, såsom i anmärkningen på sidan 4. Detta är i praktiken ett svårlöstproblem; vi kommer också att se i exempel 5.1 nedan att resttermen inte nödvändigtvis ärdet lämpligaste sättet att bedöma felfortplantningsformlernas tillämplighet. Den matematiskastatistikens vanligaste metod för att motivera approximationer är asymptotiska resultat,såsom till exempel centrala gränsvärdessatsen. Vi följer här den vägen och börjar med deten-dimensionella fallet. Låt {X n ; n = 1, 2, . . . } vara en följd av stokastiska variabler som ärasymptotiskt normalfördelad med asymptotiskt väntevärde µ och asymptotisk varians σ 2 /n,dvs√ n(Xn − µ)d−→ N(0, σ 2 ) då n → ∞ (5.1)Det kanske viktigaste exemplet på en sådan följd är när X n är medelvärdet X av n styckenoberoende likafördelade stokastiska variabler.Sats 5.1 Låt X n uppfylla (5.1). Låt g(x) vara en deriverbar funktion vars derivata ärkontinuerlig i µ och skild från 0 där. Då gäller√ n (g(Xn ) − g(µ))d−→ N(0, [g ′ (µ)] 2 σ 2 ) då n → ∞ (5.2)Vår tolkning av (5.2) är att när n är stort är g(X n ) approximativt normalfördelad med väntevärdeoch varians som ges av felfortplantningsformlerna (2.4) och (2.5) och Var(X n ) ≈σ 2 /n.


The most important conclusion is that the classical propagation formula is much better thanseems to be usually realized. Examples indicate that it is likely to suffice for most work. (JohnW. Tukey)Referenser[1] Gut, A.,(1995), An Intermediate Course in Probability Theory, Springer-Verlag[2] Ku, H. H.,(1966), Notes on the Use of Propagation of Error Formulas, Journal of Researchof the National Bureau of Standards, Vol 70C, No. 4[3] Ross, S.,(2002), A First Course in Probability, 6 Edition, Prentice Hall[4] Sundberg, R.,(1984), Kompendium i Tillämpad Matematisk Statistik, KTHEn elementär framställning, som influerat avsnitt 1-3 ovan, ges i[5] Blom, G.,(1980), Sannolikhetsteori och statistikteori med tillämpningar (Bok C), Tredjeupplagan, Studentlitteratur, Lund


6 ÖVNINGAR 116 ÖvningarAvsnitt 1-4Låt oss först påminna om att standardavvikelsen är kvadratroten ur variansen. Uppgiftermärkta (KTH) är hämtade ur någon av de problemsamlingar som förekommer vid KTH.F1. (KTH) En kemist beräknar volymen av sfäriska bubblor genom att mäta bubblornasdiameter d på en fotografisk plåt och tillämpa formeln v = πd 3 /6. Mätningen av endiameter är behäftad med osäkerhet och kan betraktas som en observation av en stokastiskvariabel med väntevärde d och standardavvikelse 0.02 mm. För en viss bubbla blevdiametervärdet d = 1.80 mm varur v = 3.05 mm 3 . Bestäm approximativt väntevärdeoch standardavvikelse för volymsbestämningen.F2. Om en lösning har vätejonkoncentration x, så definieras pH-värdet som − 10 log(x). Antagatt en viss vätska har pH-värdet p och att detta kan bestämmas med ett mätfel somhar standardavvikelse σ. Ange approximativa formler för väntevärde och standardavvikelseför motsvarande bestämning av vätejonkoncentrationen.F3. a) Visa att (2.4) och (2.5) reduceras till (2.1) och (2.2) då g(x) = ax + b för någrakonstanter a och b. Följaktligen är approximationen exakt i detta fall.b) Visa att (3.4) och (3.5) reduceras till (3.2) och (3.3) då g är linjär, dvs (3.1) gäller.Slutsatsen blir även här att approximationen är exakt.F4. Den kontinuerliga stokastiska variabeln X är likformigt fördelad på intervallet (a, b),där a = 1 − ɛ och b = 1 + ɛ för någon konstant ɛ, 0 < ɛ < 1. Sätt Y=1/X.a) Bestäm E [Y ], dels exakt, dels med felfortplantningsformeln. Hur stort blir detrelativa felet i approximationen om ɛ är: 0.50, 0.25, 0.10 respektive 0.05?b) För ɛ = 0.10, bestäm Var(Y ) dels exakt, dels med felfortplantningsformeln ochjämför resultaten.F5. Upprepa beräkningarna för Y − X och Y/X i exempel 1.1 i texten, men nu underantagande att de båda undersökningarna byggde på delvis samma urval, så attCov(X, Y ) = 3.0 (säg).F6. (KTH) I en serie försök uppmättes svängningstiden t för en pendel samt pendelns längdl. Mätningarna kan ses som observationer av stokastiska variabler med väntevärden lika


7 FACIT 137 FacitF1) σ ≈ 0.01πd 2F2) E [X] ≈ 10 −p σ X ≈ σ·log(10)10 pF4) (a) Exakt: E [Y ] = log((1+ɛ)/(1−ɛ))2ɛApprox: E [Y ] = 1F5)Det relativa felet blir ungefär 9.0% (ɛ = 0.50) , 2.1% (ɛ = 0.25), 0.3% (ɛ = 0.10) ,respektive 0.1% (ɛ = 0.05).(b) Exakt: Var(Y ) ≈ 3.383 · 10 −3F6) E [g] ≈ 4π2 lt 2Approx: Var(Y ) ≈ 3.333 · 10 −3E [Y − X] = µ 2 − µ 1 Var(Y − X) = 11.45E [Y/X] ≈ µ 2µ 1Var(Y/X) ≈ (7.84µ2 2 + 9.61µ 2 1 − 6µ 1 µ 2 )µ 4 1Var(g) ≈ Var(l) · 16π4t 4 + Var(t) · 64π4 l 2t 6 (σ g ≈ 19.64)F7) (a) Om X, Y antar värdena 1, 2:Exakt: E [Y/X] = 9/8 = 1.125Approx: E [Y/X] ≈ 1Om X, Y antar värdena 11, 12:Exakt: E [Y/X] = 529/528 ≈ 1.0019Approx: E [Y/X] ≈ 1Om X, Y antar värdena 0.5, 1:Exakt: E [Y/X] = 9/8 = 1.125Approx: E [Y/X] ≈ 1(b) Om X, Y antar värdena 1, 2:Exakt: Var(Y/X) = 19/64 ≈ 0.297Approx: Var(Y/X) = 2/9 ≈ 0.222Om X, Y antar värdena 11,12:Exakt: Var(Y/X) ≈ 0.003799


7 FACIT 14Approx: Var(Y/X) ≈ 0.003781Om X, Y antar värdena 0.5, 1:Exakt: Var(Y/X) = 19/64 ≈ 0.297Approx: Var(Y/X) = 2/9 ≈ 0.222F9) e = 1+2/λ+1/λ21+2/λ> 1 ⇒ ˆγ 1 är bättre. e →{∞ då λ → 01 då λ → ∞

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!