30.07.2013 Views

Meddelelse 7 - Aarhus Universitet

Meddelelse 7 - Aarhus Universitet

Meddelelse 7 - Aarhus Universitet

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Institut for Matematiske Fag STATISTIK(2003-ordning)<br />

<strong>Aarhus</strong> <strong>Universitet</strong> Jens Ledet Jensen<br />

Jørgen Granfeldt<br />

10. marts 2006<br />

Forelæsningerne i uge 10 (6.3–12.3)<br />

<strong>Meddelelse</strong> 7<br />

I denne uge har jeg ved forelæsningerne mandag og onsdag gennemgået Section 3.1 One Sample<br />

i SABG frem til side 79, dog undtaget Section 3.1.4 The Likelihood Method, som først omtales<br />

senere. I forbindelse med gennemgangen omtalte jeg ogsådele af Supplement to Chapter 3 og<br />

beregning at testsandsynligheder ved hjælp af Statistical Tables.<br />

Fredag begynder jeg på Section 3.2.1 Two samples.<br />

Forelæsningerne i uge 11 (13.3–19.3)<br />

Gennemgangen af Chapter 3 fortsætter. Jeg når muligvis at afslutte Section 3.2 Two or more<br />

samples.<br />

Øvelserne i uge 11<br />

(13.3–19.3) Opgaverne 31, 32, 33, 35 og 36 i sandsynlighedsregning, Exercise 3.1 (side 170 i<br />

SABG) og Sommeren 2003, opgave 2.<br />

Øvelserne i uge 14<br />

(3.4–9.4første uge efter pausen mellem de to kvarterer) Følgende gamle eksamensopgaver, som<br />

alle vedrører to normalfordelte observationsrækker:<br />

Sommeren 2001, 3 Sommeren 2001 Reeksamen, 2<br />

Vinteren 2001/02, 2 Vinteren 1999/2000, 2<br />

Desuden regnes Exercise 3.4 i SABG (side 171).<br />

Afleveringsopgaver<br />

(uge 10) Opgave 34<br />

(uge 11) Opgave 40<br />

(uge 14, første uge efter pausen mellem de to kvarterer) Opgave 39 i sandsynlighedsregning.<br />

Fordelingskatalog<br />

1


Instruktorerne har efterspurgt et „fordelingskatalog“, hvor ofte anvendte egenskaber ved udvalgte<br />

fordelinger resumeres. I slutningen af denne meddelelse er et sådant katalog. Siderne er<br />

nummereret, så de passer med resuméerne af forelæsningerne over BPT.<br />

<strong>Meddelelse</strong>r som denne udleveres hver uge ved forelæsningen om fredagen.<br />

De kan desuden findes via kursushjemmesiden:<br />

http://www.imf.au.dk/kurser/statistik-2003ord/F06/<br />

Ugens StatiStikpille:<br />

En statistiker er en person, hvis livsdrøm er kun at tage fejl 5 pct. af tiden.<br />

Obligatoriske opgaver<br />

Anonym<br />

Til kurset hører tre obligatoriske opgaver, som skal godkendes, inden man kan få lov til at gå til<br />

eksamen.<br />

Opgaverne stilles og afleveres efter følgende plan.<br />

Opgave Stilles Afleveres<br />

1 <strong>Meddelelse</strong> 7 (uge 9) uge 15 senest tirsdag<br />

2 <strong>Meddelelse</strong> 9 (uge 14) uge 18<br />

3 <strong>Meddelelse</strong> 12 (uge 17) uge 20<br />

Det giver mindst to uger til hver opgave.<br />

Håndteringen af de obligatoriske opgaver De obligatoriske opgaver skal afleveres rimeligt<br />

pænt indskrevet på fortløbende nummerede sider.<br />

Besvarelsen skal forsynes med navn, årskortnummer og holdnummer.<br />

Besvarelsen omfatter, at der gøres rede for de anvendte modeller, de opstillede hypoteser, og<br />

hvordan de testes. Endvidere redegøres for den faglige konklusion.<br />

Derudover skal opgaven suppleres med en kommenteret SAS udskrift, hvor man viser, at man<br />

kan finde de størrelser, der er relevante for besvarelsen. Det understreges, at SAS udskriften er<br />

et supplement til besvarelsen. En SAS udskrift alene vil ikke blive godkendt som besvarelse.<br />

Heller ikke selv om man har understreget et par testsandsynligheder.<br />

Aflevering. Opgave 1 afleveres senest tirsdag før påske. Opgave 2 og 3 afleveres den dag jeres<br />

hold har øvelser i den relevante uge. Aflevering sker på informationskontoret på Institut for<br />

Matematiske Fag inden kl. 14. Afleveringsfristen skal overholdes. For sent afleverede opgaver<br />

modtages ikke.<br />

Konsultationstid. I forbindelse med de obligatoriske opgaver aftaler instruktorerne på de enkelte<br />

hold konsultationstid, hvor man kan træffe instruktoren og diskutere opgaven. Man opfordres<br />

2


indtrængende til at benytte konsultationstiden mindst én gang for hver opgave. Det letter arbejdet<br />

både for instruktor og student. Besvarelserne bliver bedre, og der bliver færre, som skal<br />

aflevere en ny besvarelse, for at få opgaven godkendt.<br />

Afviste opgaver. Hvis en opgave bliver afvist på grund af fejl og mangler, får man lejlighed<br />

til at aflevere en ny besvarelse med en frist, som aftales med instruktoren. Opgaverne rettes af<br />

instruktorerne, men det er læreren på kurset, som afgør om en opgave skal afvises, og hvor<br />

meget der skal laves om.<br />

Samarbejde er naturligvis tilladt, men hver deltager i kurset skal aflevere en personligt udarbejdet<br />

besvarelse.<br />

1. obligatoriske opgave til aflevering i uge 15 (senest tirsdag den 11. april på grund af påsken)<br />

er<br />

Opgave 1 fra Sommeren 2004 og opgave 2 fra Sommeren 2005.<br />

I opgave 2 fra Sommeren 2005 skal spørgsmålene 2 ◦ , 3 ◦ og 4 ◦ erstattes af følgende:<br />

2 ◦ Vis, at det kan antages, at variansen af vækstraten er den samme for population 1 og<br />

population 2.<br />

3 ◦ Vis, at det kan antages, at middelværdien af vækstraten er den samme for population 1 og<br />

population 2.<br />

4 ◦ Undersøg, om det kan antages at middelværdi og varians af vækstraten er den samme for<br />

population 3 som for population 1 og 2.<br />

5 ◦ Angiv estimater og 95 % konfidensintervaller for parametrene i slutmodellen. Herunder<br />

et 95 % konfidensinterval for differensen mellem middelværdien af middelværdien af<br />

vækstraten i population 2 og den fælles middelværdi i population 1 og 2.<br />

Ikke alt det stof, der er skal bruges til statistik opgaven, er gennemgået. Det vil være tilfældet i<br />

løbet af uge 11.<br />

3


Kørsel af programmer fra SABG<br />

SAS programmer til eksemplerne og opgaverne i SABG kan hentes på adressen<br />

http://www.imf.au.dk/biogeostatistics<br />

De fleste af disse programmer har i starten følgende smarte option<br />

OPTIONS SASAUTOS= ’c:\biogeostatistics\sasmacros’;<br />

der bevirker, at en macro kan benyttes uden et %INCLUDE statement, hvis blot den pågældende<br />

macro findes i det angivne katalog.<br />

Kørsel af programmer under WINDOWS på egen PC<br />

Det kan anbefales på PC-en at oprette kataloget<br />

’c:\biogeostatistics\sasmacros’;<br />

og kopiere bogens macroer over i dette katalog. Bogens macroer kan findes på adressen<br />

http://www.imf.au.dk/biogeostatistics/sasmacros<br />

Programmer til eksempler og opgaver skulle nu køre uden problemer.<br />

Vær dog opmærksom på, at programmer med grafik typisk indeholder en linje som<br />

FILENAME GSASFILE ’c:\biogeostatistics\chapter3\examples\eks31.ps’; der angiver,<br />

hvor grafik filer skal gemmes. Denne linje skal modificeres, så den refererer til et katalog<br />

på jeres PC.<br />

Kørsel af programmer under UNIX eller LINUX på IMF<br />

Erstat<br />

OPTIONS SASAUTOS= ’c:\biogeostatistics\sasmacros’;<br />

med<br />

OPTIONS SASAUTOS= ’∼statbib/biogeostatistics/sasmacros’;<br />

(Bemærk, at WINDOWS bruger \ i forbindelse med navne på kataloger, mens UNIX og LINUX<br />

bruger /.)<br />

Desuden skal GOPTIONS DEV=win rettes til GOPTIONS DEV=xcolor i programmer, der producerer<br />

grafik.<br />

Endelig gælder bemærkningen om FILENAME GSASFILE også i dette tilfælde.<br />

4


Fordelinger<br />

I det følgende opsummeres egenskaber ved nogle af de vigtigste fordelinger, som vi skal arbejde<br />

med. Gennemgangen er delt op efter vore to hovedtyper af stokastiske variable (diskrete og<br />

absolut kontinuerte), og omfatter følgende.<br />

• Diskrete fordelinger:<br />

– Binomialfordelingen b(n,π). (Side R.36).<br />

– Poissonfordelingen po(λ). (Side R.37).<br />

– Den geometriske fordeling geo(π). (Side R.38).<br />

– Multinomialfordelingen m(n,π). (Side R.39).<br />

• Absolut kontinuerte fordelinger:<br />

– Den uniforme fordeling R(a,b). (Side R.40).<br />

– Normalfordelingen N(µ,σ 2 ). (Side R.41).<br />

– Eksponentialfordelingen e(λ). (Side R.43).<br />

– Gammafordelingen Γ(α,λ). (Side R.44).<br />

– σ 2 χ 2 ( f )-fordelingen. (Side R.45).<br />

I det diskrete tilfælde angiver vi sandsynlighedsfunktionen, men ikke fordelingsfunktionen. I<br />

det absolut kontinuerte tilfælde angives tætheden, og undertiden også fordelingsfunktionen.<br />

R.35


Binomialfordelingen b(n,π).<br />

Lad π ∈]0,1[ og n = 1,2,.... Vi siger, at en stokastisk variabel X er binomialfordelt med antalsparameter<br />

n og sandsynlighedsparameter π, kort X ∼ b(n,π), hvis X er diskret og har sandsynlighedsfunktion<br />

f givet ved<br />

⎧ <br />

⎨ n<br />

π<br />

f (x) = x<br />

⎩<br />

x (1 − π) n−x hvis x ∈ {0,1,2,...,n}<br />

0 ellers.<br />

Egenskaber:<br />

X ∼ b(n,π) medfører EX = nπ og VarX = nπ(1 − π). (Table 6.1 side 76 i BPT).<br />

Antag at X1,...,Xk er uafhængige med Xi ∼ b(ni,π) for i = 1,...,k. Da gælder (se Table<br />

8.1 side 94 i BPT), at<br />

X1 + ··· + Xk ∼ b(n1 + ··· + nk,π)<br />

Anvendelse:<br />

Antag at en mønt kastes n gange, hvor der er sandsynlighed π for plat og kastene er uafhængige.<br />

Da gælder, at „antal plat“ er binomialfordelt b(n,π).<br />

R.36


Poissonfordelingen po(λ).<br />

Lad λ > 0. Vi siger, at en stokastisk variabel X er Poissonfordelt med parameter λ, kort X ∼<br />

po(λ), hvis X er diskret og har sandsynlighedsfunktion f givet ved<br />

Egenskaber:<br />

f (x) =<br />

<br />

e−λ λx x!<br />

hvis x ∈ {0,1,...}<br />

0 ellers.<br />

X ∼ po(λ) medfører EX = λ og VarX = λ. (Table 6.1 side 76 i BPT).<br />

Antag at X1,...,Xk er uafhængige med Xi ∼ po(λi) for i = 1,...,k. Da gælder (se Table<br />

8.1 side 94 i BPT)<br />

X1 + ··· + Xk ∼ po(λ1 + ··· + λk).<br />

Anvendelse:<br />

Grænsefordeling for binomialfordelingen. Benyttes som regel til at modellere „antal radioaktive<br />

henfald“, „antal telefonopkald“ og lignende.<br />

R.37


Den geometriske fordeling geo(π).<br />

Lad π ∈]0,1[. Vi siger, at en stokastisk variabel X er geometrisk fordelt med parameter π, kort<br />

X ∼ geo(π), hvis X er diskret og har sandsynlighedsfunktion f givet ved<br />

<br />

(1 − π)πx hvis x ∈ {0,1,...}<br />

f (x) =<br />

0 ellers.<br />

(Dette svarer til den negative binomialfordeling b − (1,π).)<br />

Egenskaber:<br />

X ∼ geo(π) medfører EX = π<br />

π<br />

1−π og VarX =<br />

(1−π) 2 . (Table 6.1 side 76 i BPT).<br />

Antag at X1,...,Xn er uafhængige med Xi ∼ geo(π) for i = 1,...,n. Da gælder (Table 8.1<br />

side 94 i BPT)<br />

X1 + ··· + Xn ∼ b − (n,π),<br />

hvor den negative binomialfordeling b − er defineret i BPT.<br />

Anvendelser:<br />

Antag at en mønt kastes igen og igen, hvor kastene er uafhængige og der er sandsynlighed<br />

π for at få plat. Da er „antal plat før første krone“ geometrisk fordelt geo(π).<br />

Den geometriske fordeling modellerer ikke-negative glemsomme stokastiske variable med<br />

diskret tid. Mere præcist har vi, at hvis X er geometrisk fordelt, så gælder<br />

P(X ≥ n + k | X ≥ n) = P(X ≥ k) for n,k = 0,1,...<br />

Omvendt har vi, at hvis en ikke-negativ heltallig stokastisk variabel opfylder ovenstående,<br />

så gælder at X er geometrisk fordelt.<br />

R.38


Multinomialfordelingen m(n,π).<br />

Lad n ∈ {1,2...}, k ∈ {2,3,...} og π = (π1,...,πk) være en k-dimensional vektor med π j > 0<br />

for j = 1,...,k og π1 + ··· + πk = 1.<br />

Vi siger, at en stokastisk vektor X = (X1,...,Xk) er multinomialfordelt med antalsparameter n<br />

og sandsynlighedsparameter π, kort X ∼ m(n,π), hvis X er diskret og har sandsynlighedsfunk-<br />

tion f givet ved<br />

<br />

n<br />

f (x) =<br />

x1 ...xk<br />

<br />

π x1<br />

1 ···πxk<br />

k<br />

når x = (x1,...,xk) opfylder at x1,...,xk er ikke-negative og heltallige med n = x1 + ··· + xk.<br />

Egenskaber:<br />

Antag X ∼ m(n,π). Da gælder (Table 6.1) EX = nπ og<br />

<br />

nπi(1 − πi) i = j<br />

Cov(Xi,Xj) =<br />

i = j.<br />

−nπiπ j<br />

Antag X ∼ m(n,π). Da gælder Xj ∼ b(n,πj) for j = 1,...,k.<br />

Antag at X1 og X2 er uafhængige med Xi ∼ m(ni,π) for i = 1,2. Da gælder<br />

Anvendelse:<br />

X 1 + X 2 ∼ m(n1 + n2,π).<br />

Antag at en k-sidet terning kastes n gange hvor kastene er uafhængige og der er sandsynlighed<br />

π j for at observere j øjne for j = 1,...,k. Lad Xj betegne antal gange vi ser j øjne for j =<br />

1,...,k. Da gælder<br />

X = (X1,...,Xk) ∼ m(n,π).<br />

R.39


Den uniforme fordeling R(a,b).<br />

Lad a < b være reelle tal. En stokastisk variabel X siges at være uniformt fordelt på intervallet<br />

[a,b], kort X ∼ R(a,b), hvis X er absolut kontinuert med tæthed f givet ved<br />

⎧<br />

⎪⎨<br />

f (x) =<br />

⎪⎩<br />

1<br />

b − a<br />

hvis x ∈ ]a,b[<br />

0 ellers.<br />

Alternativt kan man specificere den uniforme fordeling via fordelingsfunktionen F for X, som<br />

er<br />

⎧<br />

⎪⎨<br />

0<br />

x − a<br />

F(x) =<br />

⎪⎩ b − a<br />

1<br />

hvis x ≤ a<br />

hvis x ∈ ]a,b[<br />

hvis x ≥ b.<br />

Egenskaber:<br />

Antag at X ∼ R(a,b). Da gælder EX = a+b<br />

2<br />

og VarX = (b−a)2<br />

12 .<br />

X ∼ R(a,b) medfører α + βX ∼ R(α + βa,α + βb) for α ∈ R og β > 0.<br />

Anvendelse:<br />

Den uniforme fordeling er en model for en tilfældig udtrækning af et tal mellem a og b.<br />

R.40


Normalfordelingen N(µ,σ 2 ).<br />

Her opsummeres nogle af de vigtigste egenskaber ved normalfordelingen.<br />

E1 (Definition af normalfordelingen). Lad µ ∈ R og σ 2 > 0. En stokastisk variabel X er<br />

normalfordelt med parametre µ og σ 2 , kort X ∼ N(µ,σ 2 ), hvis X er absolut kontinuert<br />

med tæthed f givet ved<br />

f (x) =<br />

1<br />

− µ)2<br />

√ e−(x2σ 2πσ2 2<br />

, x ∈ R.<br />

E2 (Standard normalfordelingen). Fordelingen N(0,1) kaldes for standard normalfordelingen<br />

eller u-fordelingen, og i dette tilfælde er tæthed og fordelingsfunktion givet ved<br />

og<br />

ϕ(x) = 1<br />

√ 2π e −x2<br />

2 , x ∈ R<br />

Φ(x) =<br />

x<br />

−∞<br />

1<br />

√ 2π e −z2<br />

2 dz, x ∈ R.<br />

Bemærk at Φ er tabellagt. Tætheden ϕ for standard normalfordelingen er symmetrisk<br />

omkring 0:<br />

ϕ(−x) = ϕ(x), x ∈ R<br />

og dette medfører<br />

Φ(−x) = 1 − Φ(x), x ∈ R.<br />

E3 (Relationen mellem en vilkårlig normalfordeling og standard normalfordelingen). Hvis<br />

X ∼ N(µ,σ 2 ), kan tætheden f for X udtrykkes ved tætheden for N(0,1)-fordelingen som<br />

og fordelingsfunktionen F for X er<br />

Specielt ses, at<br />

X ∼ N(µ,σ 2 ) ⇔<br />

f (x) = 1 − µ<br />

ϕ(x<br />

σ σ )<br />

x − µ<br />

F(x) = Φ(<br />

σ ).<br />

X − µ<br />

σ<br />

∼ N(0,1).<br />

E4 (Middelværdi og varians). Antag at X ∼ N(µ,σ 2 ). Da gælder E X = µ og Var X = σ 2 .<br />

E5 (Affin transformation af normalfordeling). Antag X ∼ N(µ,σ 2 ). Da gælder a + bX ∼<br />

N(a + bµ,b 2 σ 2 ) for alle a ∈ R og b = 0.<br />

R.41


E6 (Summer af uafhængige normalfordelinger). Lad X1,...,Xn være uafhængige med Xi ∼<br />

N(µi,σ 2 i ), i = 1,...,n. Lad Y være givet ved<br />

hvor c0,...,cn er konstanter. Da gælder<br />

Y = c0 + c1X1 + ··· + cnXn<br />

Y ∼ N(c0 + c1µ1 + ··· + cnµn,c 2 1σ 2 1 + ··· + c 2 nσ 2 n). (1)<br />

E7 (Kvadratsummer i normalfordelingen). Antag X ∼ N(µ,σ 2 ). Da gælder<br />

(X − µ) 2 ∼ σ 2 χ 2 (1).<br />

Hvis, mere generelt, X1,...,Xn er uafhængige med Xi ∼ N(µi,σ 2 ), så gælder<br />

eller, ækvivalent,<br />

n (Xi − µi)<br />

∑<br />

i=1<br />

2<br />

σ2 ∼ χ 2 (n)<br />

n<br />

∑<br />

i=1<br />

(Xi − µi) 2 ∼ σ 2 χ 2 (n).<br />

E8 (Normalfordelingen og uafhængighed). I Kapitel 6 i BPT vises, at hvis stokastiske variable<br />

er uafhængige, så har de kovarians 0. (Under antagelse af at kovariansen eksisterer).<br />

Den omvendte implikation, at kovarians 0 medfører uafhængighed, gælder derimod ikke.<br />

Dog har vi følgende pæne resultat for normalfordelte stokastiske variable.<br />

Lad X1,...Xn være uafhængige med Xi ∼ N(µi,σ 2 i ) for i = 1,...,n. Lad Y1,...,Yk være<br />

defineret som linearkombinationer af X1,...,Xn, altså<br />

Y1 = a11X1 + ··· + a1nXn<br />

.<br />

Yk = ak1X1 + ··· + aknXn<br />

hvor ai jerne er konstanter. Da gælder, at Y1,...,Yk er uafhængige hvis og kun hvis Cov(Yi,Yj) =<br />

0 for i, j = 1,...,k og i = j.<br />

Dette resultat kan, i tilfældet k = n = 2, vises ved hjælp af transformationssætningen.<br />

E9 (Fraktiler). Lad up betegne p-fraktilen for N(0,1)-fordelingen; det vil sige up = Φ −1 (p).<br />

Da gælder up = −u1−p.<br />

R.42


Eksponentialfordelingen e(λ).<br />

Lad λ > 0. En stokastisk variabel X siges at være eksponentialfordelt med parameter λ, kort<br />

X ∼ e(λ), hvis X er absolut kontinuert med tæthed f givet ved<br />

<br />

λe−λx hvis x > 0.<br />

f (x) =<br />

0 hvis x ≤ 0.<br />

Alternativt kan man specificere fordelingsfunktionen F for X, som er<br />

<br />

0 hvis x ≤ 0<br />

F(x) =<br />

1 − e−λx hvis x > 0.<br />

Egenskaber:<br />

Antag X ∼ e(λ). Da gælder EX = 1<br />

1<br />

λ og VarX =<br />

λ2 . (Table 6.1 side 76 i BPT).<br />

Antag X ∼ e(λ) samt at β > 0. Da gælder βX ∼ e( λ<br />

β ).<br />

Antag at X1,...,Xn er uafhængige med Xi ∼ e(λ) for i = 1,...,k. Da gælder (Table 8.1<br />

side i BPT), at<br />

X1 + ··· + Xn ∼ Γ(n,λ).<br />

Anvendelse:<br />

Eksponentialfordelingen modellerer glemsomme stokastiske variable. Mere præcist har vi, at<br />

eksponentialfordelingen er glemsom (kontinuert tid). Det vil sige, at hvis X ∼ e(λ), så gælder<br />

P(X > s +t|X > s) = P(X > t), for s,t > 0.<br />

Denne egenskab karakteriserer eksponentialfordelingen; det vil sige, at hvis en positiv stokastisk<br />

variabel er glemsom, så er den også eksponentialfordelt e(λ) for et λ > 0.<br />

R.43


Gammafordelingen Γ(α,λ).<br />

Lad α,λ > 0. En stokastisk variabel siges at være gammafordelt med parametre α og λ, kort<br />

X ∼ Γ(α,λ), hvis X er absolut kontinuert med tæthed f givet ved<br />

Egenskaber:<br />

⎧<br />

⎨<br />

f (x) =<br />

⎩<br />

λ α<br />

Γ(α) xα−1 e −λx , hvis x > 0<br />

0 hvis x ≤ 0.<br />

Antag at X ∼ Γ(α,λ). Da gælder (Table 6.1 side 76 i BPT) EX = α<br />

λ<br />

Antag at X ∼ Γ(α,λ) og at β > 0. Da gælder βX ∼ Γ(α, λ<br />

β ).<br />

og VarX = α<br />

λ 2 .<br />

Antag at X1,...,Xn er uafhængige med Xi ∼ Γ(αi,λ) for i = 1,...,n. Da gælder (Table<br />

8.1 side i BPT), at<br />

X1 + ··· + Xn ∼ Γ(α1 + ··· + αn,λ).<br />

Anvendelser:<br />

Der er to vigtige specialtilfælde af gammafordelingen:<br />

eksponentialfordelingen e(λ), der svarer til en gammafordeling Γ(1,λ);<br />

σ2χ2 ( f )-fordelingen, der svarer til Γ( f 1<br />

2 ,<br />

2σ2 ).<br />

Husk på at eksponentialfordelingen modellerer glemsomhed samt at σ 2 χ 2 ( f )-fordelingen<br />

modellerer kvadratsummer i normalfordelingen.<br />

Desuden har vi, at hvis X1,...,Xn er uafhængige med Xi ∼ e(λ), så gælder<br />

X1 + ··· + Xn ∼ Γ(n,λ).<br />

R.44


σ 2 χ 2 ( f )-fordelingen.<br />

Lad f ,σ2 > 0. Da kaldes Γ( f 1<br />

2 ,<br />

2σ2 )-fordelingen også for en σ2χ2 ( f )-fordeling. (Tallet f om-<br />

tales som fordelingens frihedsgrader.) Specielt kaldes Γ( f<br />

2 , 1 2 )-fordelingen også for en χ2 ( f )fordeling.<br />

Egenskaber:<br />

Antag at X ∼ σ 2 χ 2 ( f ). Da gælder (Table 6.1 side i BPT) EX = σ 2 f samt VarX = 2σ 4 f .<br />

Der gælder X ∼ σ 2 χ 2 ( f ) hvis og kun hvis X<br />

σ 2 ∼ χ 2 ( f ).<br />

Antag at X1,...,Xn er uafhængige med Xi ∼ σ 2 χ 2 ( fi) for i = 1,...,n. Da gælder<br />

Anvendelse:<br />

X1 + ··· + Xn ∼ σ 2 χ 2 ( f1 + ··· + fn).<br />

σ 2 χ 2 ( f )-fordelingen benyttes til at modellere kvadratsummer i normalfordelingen (samt, ikke<br />

mindst, til at lave test inden for statistik, som vi skal se til foråret). Mere præcist har vi, at hvis<br />

X1,...,Xn er uafhængige med Xi ∼ N(µi,σ 2 ), så gælder<br />

eller, ækvivalent,<br />

n<br />

∑<br />

i=1<br />

(Xi − µi) 2 ∼ σ 2 χ 2 (n)<br />

n (Xi − µi)<br />

∑<br />

i=1<br />

2<br />

σ2 ∼ χ 2 (n)<br />

R.45

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!