Meddelelse 7 - Aarhus Universitet
Meddelelse 7 - Aarhus Universitet
Meddelelse 7 - Aarhus Universitet
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Institut for Matematiske Fag STATISTIK(2003-ordning)<br />
<strong>Aarhus</strong> <strong>Universitet</strong> Jens Ledet Jensen<br />
Jørgen Granfeldt<br />
10. marts 2006<br />
Forelæsningerne i uge 10 (6.3–12.3)<br />
<strong>Meddelelse</strong> 7<br />
I denne uge har jeg ved forelæsningerne mandag og onsdag gennemgået Section 3.1 One Sample<br />
i SABG frem til side 79, dog undtaget Section 3.1.4 The Likelihood Method, som først omtales<br />
senere. I forbindelse med gennemgangen omtalte jeg ogsådele af Supplement to Chapter 3 og<br />
beregning at testsandsynligheder ved hjælp af Statistical Tables.<br />
Fredag begynder jeg på Section 3.2.1 Two samples.<br />
Forelæsningerne i uge 11 (13.3–19.3)<br />
Gennemgangen af Chapter 3 fortsætter. Jeg når muligvis at afslutte Section 3.2 Two or more<br />
samples.<br />
Øvelserne i uge 11<br />
(13.3–19.3) Opgaverne 31, 32, 33, 35 og 36 i sandsynlighedsregning, Exercise 3.1 (side 170 i<br />
SABG) og Sommeren 2003, opgave 2.<br />
Øvelserne i uge 14<br />
(3.4–9.4første uge efter pausen mellem de to kvarterer) Følgende gamle eksamensopgaver, som<br />
alle vedrører to normalfordelte observationsrækker:<br />
Sommeren 2001, 3 Sommeren 2001 Reeksamen, 2<br />
Vinteren 2001/02, 2 Vinteren 1999/2000, 2<br />
Desuden regnes Exercise 3.4 i SABG (side 171).<br />
Afleveringsopgaver<br />
(uge 10) Opgave 34<br />
(uge 11) Opgave 40<br />
(uge 14, første uge efter pausen mellem de to kvarterer) Opgave 39 i sandsynlighedsregning.<br />
Fordelingskatalog<br />
1
Instruktorerne har efterspurgt et „fordelingskatalog“, hvor ofte anvendte egenskaber ved udvalgte<br />
fordelinger resumeres. I slutningen af denne meddelelse er et sådant katalog. Siderne er<br />
nummereret, så de passer med resuméerne af forelæsningerne over BPT.<br />
<strong>Meddelelse</strong>r som denne udleveres hver uge ved forelæsningen om fredagen.<br />
De kan desuden findes via kursushjemmesiden:<br />
http://www.imf.au.dk/kurser/statistik-2003ord/F06/<br />
Ugens StatiStikpille:<br />
En statistiker er en person, hvis livsdrøm er kun at tage fejl 5 pct. af tiden.<br />
Obligatoriske opgaver<br />
Anonym<br />
Til kurset hører tre obligatoriske opgaver, som skal godkendes, inden man kan få lov til at gå til<br />
eksamen.<br />
Opgaverne stilles og afleveres efter følgende plan.<br />
Opgave Stilles Afleveres<br />
1 <strong>Meddelelse</strong> 7 (uge 9) uge 15 senest tirsdag<br />
2 <strong>Meddelelse</strong> 9 (uge 14) uge 18<br />
3 <strong>Meddelelse</strong> 12 (uge 17) uge 20<br />
Det giver mindst to uger til hver opgave.<br />
Håndteringen af de obligatoriske opgaver De obligatoriske opgaver skal afleveres rimeligt<br />
pænt indskrevet på fortløbende nummerede sider.<br />
Besvarelsen skal forsynes med navn, årskortnummer og holdnummer.<br />
Besvarelsen omfatter, at der gøres rede for de anvendte modeller, de opstillede hypoteser, og<br />
hvordan de testes. Endvidere redegøres for den faglige konklusion.<br />
Derudover skal opgaven suppleres med en kommenteret SAS udskrift, hvor man viser, at man<br />
kan finde de størrelser, der er relevante for besvarelsen. Det understreges, at SAS udskriften er<br />
et supplement til besvarelsen. En SAS udskrift alene vil ikke blive godkendt som besvarelse.<br />
Heller ikke selv om man har understreget et par testsandsynligheder.<br />
Aflevering. Opgave 1 afleveres senest tirsdag før påske. Opgave 2 og 3 afleveres den dag jeres<br />
hold har øvelser i den relevante uge. Aflevering sker på informationskontoret på Institut for<br />
Matematiske Fag inden kl. 14. Afleveringsfristen skal overholdes. For sent afleverede opgaver<br />
modtages ikke.<br />
Konsultationstid. I forbindelse med de obligatoriske opgaver aftaler instruktorerne på de enkelte<br />
hold konsultationstid, hvor man kan træffe instruktoren og diskutere opgaven. Man opfordres<br />
2
indtrængende til at benytte konsultationstiden mindst én gang for hver opgave. Det letter arbejdet<br />
både for instruktor og student. Besvarelserne bliver bedre, og der bliver færre, som skal<br />
aflevere en ny besvarelse, for at få opgaven godkendt.<br />
Afviste opgaver. Hvis en opgave bliver afvist på grund af fejl og mangler, får man lejlighed<br />
til at aflevere en ny besvarelse med en frist, som aftales med instruktoren. Opgaverne rettes af<br />
instruktorerne, men det er læreren på kurset, som afgør om en opgave skal afvises, og hvor<br />
meget der skal laves om.<br />
Samarbejde er naturligvis tilladt, men hver deltager i kurset skal aflevere en personligt udarbejdet<br />
besvarelse.<br />
1. obligatoriske opgave til aflevering i uge 15 (senest tirsdag den 11. april på grund af påsken)<br />
er<br />
Opgave 1 fra Sommeren 2004 og opgave 2 fra Sommeren 2005.<br />
I opgave 2 fra Sommeren 2005 skal spørgsmålene 2 ◦ , 3 ◦ og 4 ◦ erstattes af følgende:<br />
2 ◦ Vis, at det kan antages, at variansen af vækstraten er den samme for population 1 og<br />
population 2.<br />
3 ◦ Vis, at det kan antages, at middelværdien af vækstraten er den samme for population 1 og<br />
population 2.<br />
4 ◦ Undersøg, om det kan antages at middelværdi og varians af vækstraten er den samme for<br />
population 3 som for population 1 og 2.<br />
5 ◦ Angiv estimater og 95 % konfidensintervaller for parametrene i slutmodellen. Herunder<br />
et 95 % konfidensinterval for differensen mellem middelværdien af middelværdien af<br />
vækstraten i population 2 og den fælles middelværdi i population 1 og 2.<br />
Ikke alt det stof, der er skal bruges til statistik opgaven, er gennemgået. Det vil være tilfældet i<br />
løbet af uge 11.<br />
3
Kørsel af programmer fra SABG<br />
SAS programmer til eksemplerne og opgaverne i SABG kan hentes på adressen<br />
http://www.imf.au.dk/biogeostatistics<br />
De fleste af disse programmer har i starten følgende smarte option<br />
OPTIONS SASAUTOS= ’c:\biogeostatistics\sasmacros’;<br />
der bevirker, at en macro kan benyttes uden et %INCLUDE statement, hvis blot den pågældende<br />
macro findes i det angivne katalog.<br />
Kørsel af programmer under WINDOWS på egen PC<br />
Det kan anbefales på PC-en at oprette kataloget<br />
’c:\biogeostatistics\sasmacros’;<br />
og kopiere bogens macroer over i dette katalog. Bogens macroer kan findes på adressen<br />
http://www.imf.au.dk/biogeostatistics/sasmacros<br />
Programmer til eksempler og opgaver skulle nu køre uden problemer.<br />
Vær dog opmærksom på, at programmer med grafik typisk indeholder en linje som<br />
FILENAME GSASFILE ’c:\biogeostatistics\chapter3\examples\eks31.ps’; der angiver,<br />
hvor grafik filer skal gemmes. Denne linje skal modificeres, så den refererer til et katalog<br />
på jeres PC.<br />
Kørsel af programmer under UNIX eller LINUX på IMF<br />
Erstat<br />
OPTIONS SASAUTOS= ’c:\biogeostatistics\sasmacros’;<br />
med<br />
OPTIONS SASAUTOS= ’∼statbib/biogeostatistics/sasmacros’;<br />
(Bemærk, at WINDOWS bruger \ i forbindelse med navne på kataloger, mens UNIX og LINUX<br />
bruger /.)<br />
Desuden skal GOPTIONS DEV=win rettes til GOPTIONS DEV=xcolor i programmer, der producerer<br />
grafik.<br />
Endelig gælder bemærkningen om FILENAME GSASFILE også i dette tilfælde.<br />
4
Fordelinger<br />
I det følgende opsummeres egenskaber ved nogle af de vigtigste fordelinger, som vi skal arbejde<br />
med. Gennemgangen er delt op efter vore to hovedtyper af stokastiske variable (diskrete og<br />
absolut kontinuerte), og omfatter følgende.<br />
• Diskrete fordelinger:<br />
– Binomialfordelingen b(n,π). (Side R.36).<br />
– Poissonfordelingen po(λ). (Side R.37).<br />
– Den geometriske fordeling geo(π). (Side R.38).<br />
– Multinomialfordelingen m(n,π). (Side R.39).<br />
• Absolut kontinuerte fordelinger:<br />
– Den uniforme fordeling R(a,b). (Side R.40).<br />
– Normalfordelingen N(µ,σ 2 ). (Side R.41).<br />
– Eksponentialfordelingen e(λ). (Side R.43).<br />
– Gammafordelingen Γ(α,λ). (Side R.44).<br />
– σ 2 χ 2 ( f )-fordelingen. (Side R.45).<br />
I det diskrete tilfælde angiver vi sandsynlighedsfunktionen, men ikke fordelingsfunktionen. I<br />
det absolut kontinuerte tilfælde angives tætheden, og undertiden også fordelingsfunktionen.<br />
R.35
Binomialfordelingen b(n,π).<br />
Lad π ∈]0,1[ og n = 1,2,.... Vi siger, at en stokastisk variabel X er binomialfordelt med antalsparameter<br />
n og sandsynlighedsparameter π, kort X ∼ b(n,π), hvis X er diskret og har sandsynlighedsfunktion<br />
f givet ved<br />
⎧ <br />
⎨ n<br />
π<br />
f (x) = x<br />
⎩<br />
x (1 − π) n−x hvis x ∈ {0,1,2,...,n}<br />
0 ellers.<br />
Egenskaber:<br />
X ∼ b(n,π) medfører EX = nπ og VarX = nπ(1 − π). (Table 6.1 side 76 i BPT).<br />
Antag at X1,...,Xk er uafhængige med Xi ∼ b(ni,π) for i = 1,...,k. Da gælder (se Table<br />
8.1 side 94 i BPT), at<br />
X1 + ··· + Xk ∼ b(n1 + ··· + nk,π)<br />
Anvendelse:<br />
Antag at en mønt kastes n gange, hvor der er sandsynlighed π for plat og kastene er uafhængige.<br />
Da gælder, at „antal plat“ er binomialfordelt b(n,π).<br />
R.36
Poissonfordelingen po(λ).<br />
Lad λ > 0. Vi siger, at en stokastisk variabel X er Poissonfordelt med parameter λ, kort X ∼<br />
po(λ), hvis X er diskret og har sandsynlighedsfunktion f givet ved<br />
Egenskaber:<br />
f (x) =<br />
<br />
e−λ λx x!<br />
hvis x ∈ {0,1,...}<br />
0 ellers.<br />
X ∼ po(λ) medfører EX = λ og VarX = λ. (Table 6.1 side 76 i BPT).<br />
Antag at X1,...,Xk er uafhængige med Xi ∼ po(λi) for i = 1,...,k. Da gælder (se Table<br />
8.1 side 94 i BPT)<br />
X1 + ··· + Xk ∼ po(λ1 + ··· + λk).<br />
Anvendelse:<br />
Grænsefordeling for binomialfordelingen. Benyttes som regel til at modellere „antal radioaktive<br />
henfald“, „antal telefonopkald“ og lignende.<br />
R.37
Den geometriske fordeling geo(π).<br />
Lad π ∈]0,1[. Vi siger, at en stokastisk variabel X er geometrisk fordelt med parameter π, kort<br />
X ∼ geo(π), hvis X er diskret og har sandsynlighedsfunktion f givet ved<br />
<br />
(1 − π)πx hvis x ∈ {0,1,...}<br />
f (x) =<br />
0 ellers.<br />
(Dette svarer til den negative binomialfordeling b − (1,π).)<br />
Egenskaber:<br />
X ∼ geo(π) medfører EX = π<br />
π<br />
1−π og VarX =<br />
(1−π) 2 . (Table 6.1 side 76 i BPT).<br />
Antag at X1,...,Xn er uafhængige med Xi ∼ geo(π) for i = 1,...,n. Da gælder (Table 8.1<br />
side 94 i BPT)<br />
X1 + ··· + Xn ∼ b − (n,π),<br />
hvor den negative binomialfordeling b − er defineret i BPT.<br />
Anvendelser:<br />
Antag at en mønt kastes igen og igen, hvor kastene er uafhængige og der er sandsynlighed<br />
π for at få plat. Da er „antal plat før første krone“ geometrisk fordelt geo(π).<br />
Den geometriske fordeling modellerer ikke-negative glemsomme stokastiske variable med<br />
diskret tid. Mere præcist har vi, at hvis X er geometrisk fordelt, så gælder<br />
P(X ≥ n + k | X ≥ n) = P(X ≥ k) for n,k = 0,1,...<br />
Omvendt har vi, at hvis en ikke-negativ heltallig stokastisk variabel opfylder ovenstående,<br />
så gælder at X er geometrisk fordelt.<br />
R.38
Multinomialfordelingen m(n,π).<br />
Lad n ∈ {1,2...}, k ∈ {2,3,...} og π = (π1,...,πk) være en k-dimensional vektor med π j > 0<br />
for j = 1,...,k og π1 + ··· + πk = 1.<br />
Vi siger, at en stokastisk vektor X = (X1,...,Xk) er multinomialfordelt med antalsparameter n<br />
og sandsynlighedsparameter π, kort X ∼ m(n,π), hvis X er diskret og har sandsynlighedsfunk-<br />
tion f givet ved<br />
<br />
n<br />
f (x) =<br />
x1 ...xk<br />
<br />
π x1<br />
1 ···πxk<br />
k<br />
når x = (x1,...,xk) opfylder at x1,...,xk er ikke-negative og heltallige med n = x1 + ··· + xk.<br />
Egenskaber:<br />
Antag X ∼ m(n,π). Da gælder (Table 6.1) EX = nπ og<br />
<br />
nπi(1 − πi) i = j<br />
Cov(Xi,Xj) =<br />
i = j.<br />
−nπiπ j<br />
Antag X ∼ m(n,π). Da gælder Xj ∼ b(n,πj) for j = 1,...,k.<br />
Antag at X1 og X2 er uafhængige med Xi ∼ m(ni,π) for i = 1,2. Da gælder<br />
Anvendelse:<br />
X 1 + X 2 ∼ m(n1 + n2,π).<br />
Antag at en k-sidet terning kastes n gange hvor kastene er uafhængige og der er sandsynlighed<br />
π j for at observere j øjne for j = 1,...,k. Lad Xj betegne antal gange vi ser j øjne for j =<br />
1,...,k. Da gælder<br />
X = (X1,...,Xk) ∼ m(n,π).<br />
R.39
Den uniforme fordeling R(a,b).<br />
Lad a < b være reelle tal. En stokastisk variabel X siges at være uniformt fordelt på intervallet<br />
[a,b], kort X ∼ R(a,b), hvis X er absolut kontinuert med tæthed f givet ved<br />
⎧<br />
⎪⎨<br />
f (x) =<br />
⎪⎩<br />
1<br />
b − a<br />
hvis x ∈ ]a,b[<br />
0 ellers.<br />
Alternativt kan man specificere den uniforme fordeling via fordelingsfunktionen F for X, som<br />
er<br />
⎧<br />
⎪⎨<br />
0<br />
x − a<br />
F(x) =<br />
⎪⎩ b − a<br />
1<br />
hvis x ≤ a<br />
hvis x ∈ ]a,b[<br />
hvis x ≥ b.<br />
Egenskaber:<br />
Antag at X ∼ R(a,b). Da gælder EX = a+b<br />
2<br />
og VarX = (b−a)2<br />
12 .<br />
X ∼ R(a,b) medfører α + βX ∼ R(α + βa,α + βb) for α ∈ R og β > 0.<br />
Anvendelse:<br />
Den uniforme fordeling er en model for en tilfældig udtrækning af et tal mellem a og b.<br />
R.40
Normalfordelingen N(µ,σ 2 ).<br />
Her opsummeres nogle af de vigtigste egenskaber ved normalfordelingen.<br />
E1 (Definition af normalfordelingen). Lad µ ∈ R og σ 2 > 0. En stokastisk variabel X er<br />
normalfordelt med parametre µ og σ 2 , kort X ∼ N(µ,σ 2 ), hvis X er absolut kontinuert<br />
med tæthed f givet ved<br />
f (x) =<br />
1<br />
− µ)2<br />
√ e−(x2σ 2πσ2 2<br />
, x ∈ R.<br />
E2 (Standard normalfordelingen). Fordelingen N(0,1) kaldes for standard normalfordelingen<br />
eller u-fordelingen, og i dette tilfælde er tæthed og fordelingsfunktion givet ved<br />
og<br />
ϕ(x) = 1<br />
√ 2π e −x2<br />
2 , x ∈ R<br />
Φ(x) =<br />
x<br />
−∞<br />
1<br />
√ 2π e −z2<br />
2 dz, x ∈ R.<br />
Bemærk at Φ er tabellagt. Tætheden ϕ for standard normalfordelingen er symmetrisk<br />
omkring 0:<br />
ϕ(−x) = ϕ(x), x ∈ R<br />
og dette medfører<br />
Φ(−x) = 1 − Φ(x), x ∈ R.<br />
E3 (Relationen mellem en vilkårlig normalfordeling og standard normalfordelingen). Hvis<br />
X ∼ N(µ,σ 2 ), kan tætheden f for X udtrykkes ved tætheden for N(0,1)-fordelingen som<br />
og fordelingsfunktionen F for X er<br />
Specielt ses, at<br />
X ∼ N(µ,σ 2 ) ⇔<br />
f (x) = 1 − µ<br />
ϕ(x<br />
σ σ )<br />
x − µ<br />
F(x) = Φ(<br />
σ ).<br />
X − µ<br />
σ<br />
∼ N(0,1).<br />
E4 (Middelværdi og varians). Antag at X ∼ N(µ,σ 2 ). Da gælder E X = µ og Var X = σ 2 .<br />
E5 (Affin transformation af normalfordeling). Antag X ∼ N(µ,σ 2 ). Da gælder a + bX ∼<br />
N(a + bµ,b 2 σ 2 ) for alle a ∈ R og b = 0.<br />
R.41
E6 (Summer af uafhængige normalfordelinger). Lad X1,...,Xn være uafhængige med Xi ∼<br />
N(µi,σ 2 i ), i = 1,...,n. Lad Y være givet ved<br />
hvor c0,...,cn er konstanter. Da gælder<br />
Y = c0 + c1X1 + ··· + cnXn<br />
Y ∼ N(c0 + c1µ1 + ··· + cnµn,c 2 1σ 2 1 + ··· + c 2 nσ 2 n). (1)<br />
E7 (Kvadratsummer i normalfordelingen). Antag X ∼ N(µ,σ 2 ). Da gælder<br />
(X − µ) 2 ∼ σ 2 χ 2 (1).<br />
Hvis, mere generelt, X1,...,Xn er uafhængige med Xi ∼ N(µi,σ 2 ), så gælder<br />
eller, ækvivalent,<br />
n (Xi − µi)<br />
∑<br />
i=1<br />
2<br />
σ2 ∼ χ 2 (n)<br />
n<br />
∑<br />
i=1<br />
(Xi − µi) 2 ∼ σ 2 χ 2 (n).<br />
E8 (Normalfordelingen og uafhængighed). I Kapitel 6 i BPT vises, at hvis stokastiske variable<br />
er uafhængige, så har de kovarians 0. (Under antagelse af at kovariansen eksisterer).<br />
Den omvendte implikation, at kovarians 0 medfører uafhængighed, gælder derimod ikke.<br />
Dog har vi følgende pæne resultat for normalfordelte stokastiske variable.<br />
Lad X1,...Xn være uafhængige med Xi ∼ N(µi,σ 2 i ) for i = 1,...,n. Lad Y1,...,Yk være<br />
defineret som linearkombinationer af X1,...,Xn, altså<br />
Y1 = a11X1 + ··· + a1nXn<br />
.<br />
Yk = ak1X1 + ··· + aknXn<br />
hvor ai jerne er konstanter. Da gælder, at Y1,...,Yk er uafhængige hvis og kun hvis Cov(Yi,Yj) =<br />
0 for i, j = 1,...,k og i = j.<br />
Dette resultat kan, i tilfældet k = n = 2, vises ved hjælp af transformationssætningen.<br />
E9 (Fraktiler). Lad up betegne p-fraktilen for N(0,1)-fordelingen; det vil sige up = Φ −1 (p).<br />
Da gælder up = −u1−p.<br />
R.42
Eksponentialfordelingen e(λ).<br />
Lad λ > 0. En stokastisk variabel X siges at være eksponentialfordelt med parameter λ, kort<br />
X ∼ e(λ), hvis X er absolut kontinuert med tæthed f givet ved<br />
<br />
λe−λx hvis x > 0.<br />
f (x) =<br />
0 hvis x ≤ 0.<br />
Alternativt kan man specificere fordelingsfunktionen F for X, som er<br />
<br />
0 hvis x ≤ 0<br />
F(x) =<br />
1 − e−λx hvis x > 0.<br />
Egenskaber:<br />
Antag X ∼ e(λ). Da gælder EX = 1<br />
1<br />
λ og VarX =<br />
λ2 . (Table 6.1 side 76 i BPT).<br />
Antag X ∼ e(λ) samt at β > 0. Da gælder βX ∼ e( λ<br />
β ).<br />
Antag at X1,...,Xn er uafhængige med Xi ∼ e(λ) for i = 1,...,k. Da gælder (Table 8.1<br />
side i BPT), at<br />
X1 + ··· + Xn ∼ Γ(n,λ).<br />
Anvendelse:<br />
Eksponentialfordelingen modellerer glemsomme stokastiske variable. Mere præcist har vi, at<br />
eksponentialfordelingen er glemsom (kontinuert tid). Det vil sige, at hvis X ∼ e(λ), så gælder<br />
P(X > s +t|X > s) = P(X > t), for s,t > 0.<br />
Denne egenskab karakteriserer eksponentialfordelingen; det vil sige, at hvis en positiv stokastisk<br />
variabel er glemsom, så er den også eksponentialfordelt e(λ) for et λ > 0.<br />
R.43
Gammafordelingen Γ(α,λ).<br />
Lad α,λ > 0. En stokastisk variabel siges at være gammafordelt med parametre α og λ, kort<br />
X ∼ Γ(α,λ), hvis X er absolut kontinuert med tæthed f givet ved<br />
Egenskaber:<br />
⎧<br />
⎨<br />
f (x) =<br />
⎩<br />
λ α<br />
Γ(α) xα−1 e −λx , hvis x > 0<br />
0 hvis x ≤ 0.<br />
Antag at X ∼ Γ(α,λ). Da gælder (Table 6.1 side 76 i BPT) EX = α<br />
λ<br />
Antag at X ∼ Γ(α,λ) og at β > 0. Da gælder βX ∼ Γ(α, λ<br />
β ).<br />
og VarX = α<br />
λ 2 .<br />
Antag at X1,...,Xn er uafhængige med Xi ∼ Γ(αi,λ) for i = 1,...,n. Da gælder (Table<br />
8.1 side i BPT), at<br />
X1 + ··· + Xn ∼ Γ(α1 + ··· + αn,λ).<br />
Anvendelser:<br />
Der er to vigtige specialtilfælde af gammafordelingen:<br />
eksponentialfordelingen e(λ), der svarer til en gammafordeling Γ(1,λ);<br />
σ2χ2 ( f )-fordelingen, der svarer til Γ( f 1<br />
2 ,<br />
2σ2 ).<br />
Husk på at eksponentialfordelingen modellerer glemsomhed samt at σ 2 χ 2 ( f )-fordelingen<br />
modellerer kvadratsummer i normalfordelingen.<br />
Desuden har vi, at hvis X1,...,Xn er uafhængige med Xi ∼ e(λ), så gælder<br />
X1 + ··· + Xn ∼ Γ(n,λ).<br />
R.44
σ 2 χ 2 ( f )-fordelingen.<br />
Lad f ,σ2 > 0. Da kaldes Γ( f 1<br />
2 ,<br />
2σ2 )-fordelingen også for en σ2χ2 ( f )-fordeling. (Tallet f om-<br />
tales som fordelingens frihedsgrader.) Specielt kaldes Γ( f<br />
2 , 1 2 )-fordelingen også for en χ2 ( f )fordeling.<br />
Egenskaber:<br />
Antag at X ∼ σ 2 χ 2 ( f ). Da gælder (Table 6.1 side i BPT) EX = σ 2 f samt VarX = 2σ 4 f .<br />
Der gælder X ∼ σ 2 χ 2 ( f ) hvis og kun hvis X<br />
σ 2 ∼ χ 2 ( f ).<br />
Antag at X1,...,Xn er uafhængige med Xi ∼ σ 2 χ 2 ( fi) for i = 1,...,n. Da gælder<br />
Anvendelse:<br />
X1 + ··· + Xn ∼ σ 2 χ 2 ( f1 + ··· + fn).<br />
σ 2 χ 2 ( f )-fordelingen benyttes til at modellere kvadratsummer i normalfordelingen (samt, ikke<br />
mindst, til at lave test inden for statistik, som vi skal se til foråret). Mere præcist har vi, at hvis<br />
X1,...,Xn er uafhængige med Xi ∼ N(µi,σ 2 ), så gælder<br />
eller, ækvivalent,<br />
n<br />
∑<br />
i=1<br />
(Xi − µi) 2 ∼ σ 2 χ 2 (n)<br />
n (Xi − µi)<br />
∑<br />
i=1<br />
2<br />
σ2 ∼ χ 2 (n)<br />
R.45