Meddelelse 7 - Aarhus Universitet

Institut for Matematiske Fag STATISTIK(2003-ordning) 

Aarhus Universitet Jens Ledet Jensen 

Jørgen Granfeldt 

10. marts 2006 

Forelæsningerne i uge 10 (6.3–12.3) 

Meddelelse 7 

I denne uge har jeg ved forelæsningerne mandag og onsdag gennemgået Section 3.1 One Sample 

i SABG frem til side 79, dog undtaget Section 3.1.4 The Likelihood Method, som først omtales 

senere. I forbindelse med gennemgangen omtalte jeg ogsådele af Supplement to Chapter 3 og 

beregning at testsandsynligheder ved hjælp af Statistical Tables. 

Fredag begynder jeg på Section 3.2.1 Two samples. 

Forelæsningerne i uge 11 (13.3–19.3) 

Gennemgangen af Chapter 3 fortsætter. Jeg når muligvis at afslutte Section 3.2 Two or more 

samples. 

Øvelserne i uge 11 

(13.3–19.3) Opgaverne 31, 32, 33, 35 og 36 i sandsynlighedsregning, Exercise 3.1 (side 170 i 

SABG) og Sommeren 2003, opgave 2. 

Øvelserne i uge 14 

(3.4–9.4første uge efter pausen mellem de to kvarterer) Følgende gamle eksamensopgaver, som 

alle vedrører to normalfordelte observationsrækker: 

Sommeren 2001, 3 Sommeren 2001 Reeksamen, 2 

Vinteren 2001/02, 2 Vinteren 1999/2000, 2 

Desuden regnes Exercise 3.4 i SABG (side 171). 

Afleveringsopgaver 

(uge 10) Opgave 34 

(uge 11) Opgave 40 

(uge 14, første uge efter pausen mellem de to kvarterer) Opgave 39 i sandsynlighedsregning. 

Fordelingskatalog 

1

Instruktorerne har efterspurgt et „fordelingskatalog“, hvor ofte anvendte egenskaber ved udvalgte 

fordelinger resumeres. I slutningen af denne meddelelse er et sådant katalog. Siderne er 

nummereret, så de passer med resuméerne af forelæsningerne over BPT. 

Meddelelser som denne udleveres hver uge ved forelæsningen om fredagen. 

De kan desuden findes via kursushjemmesiden: 

http://www.imf.au.dk/kurser/statistik-2003ord/F06/ 

Ugens StatiStikpille: 

En statistiker er en person, hvis livsdrøm er kun at tage fejl 5 pct. af tiden. 

Obligatoriske opgaver 

Anonym 

Til kurset hører tre obligatoriske opgaver, som skal godkendes, inden man kan få lov til at gå til 

eksamen. 

Opgaverne stilles og afleveres efter følgende plan. 

Opgave Stilles Afleveres 

1 Meddelelse 7 (uge 9) uge 15 senest tirsdag 

2 Meddelelse 9 (uge 14) uge 18 

3 Meddelelse 12 (uge 17) uge 20 

Det giver mindst to uger til hver opgave. 

Håndteringen af de obligatoriske opgaver De obligatoriske opgaver skal afleveres rimeligt 

pænt indskrevet på fortløbende nummerede sider. 

Besvarelsen skal forsynes med navn, årskortnummer og holdnummer. 

Besvarelsen omfatter, at der gøres rede for de anvendte modeller, de opstillede hypoteser, og 

hvordan de testes. Endvidere redegøres for den faglige konklusion. 

Derudover skal opgaven suppleres med en kommenteret SAS udskrift, hvor man viser, at man 

kan finde de størrelser, der er relevante for besvarelsen. Det understreges, at SAS udskriften er 

et supplement til besvarelsen. En SAS udskrift alene vil ikke blive godkendt som besvarelse. 

Heller ikke selv om man har understreget et par testsandsynligheder. 

Aflevering. Opgave 1 afleveres senest tirsdag før påske. Opgave 2 og 3 afleveres den dag jeres 

hold har øvelser i den relevante uge. Aflevering sker på informationskontoret på Institut for 

Matematiske Fag inden kl. 14. Afleveringsfristen skal overholdes. For sent afleverede opgaver 

modtages ikke. 

Konsultationstid. I forbindelse med de obligatoriske opgaver aftaler instruktorerne på de enkelte 

hold konsultationstid, hvor man kan træffe instruktoren og diskutere opgaven. Man opfordres 

2

indtrængende til at benytte konsultationstiden mindst én gang for hver opgave. Det letter arbejdet 

både for instruktor og student. Besvarelserne bliver bedre, og der bliver færre, som skal 

aflevere en ny besvarelse, for at få opgaven godkendt. 

Afviste opgaver. Hvis en opgave bliver afvist på grund af fejl og mangler, får man lejlighed 

til at aflevere en ny besvarelse med en frist, som aftales med instruktoren. Opgaverne rettes af 

instruktorerne, men det er læreren på kurset, som afgør om en opgave skal afvises, og hvor 

meget der skal laves om. 

Samarbejde er naturligvis tilladt, men hver deltager i kurset skal aflevere en personligt udarbejdet 

besvarelse. 

1. obligatoriske opgave til aflevering i uge 15 (senest tirsdag den 11. april på grund af påsken) 

er 

Opgave 1 fra Sommeren 2004 og opgave 2 fra Sommeren 2005. 

I opgave 2 fra Sommeren 2005 skal spørgsmålene 2 ◦ , 3 ◦ og 4 ◦ erstattes af følgende: 

2 ◦ Vis, at det kan antages, at variansen af vækstraten er den samme for population 1 og 

population 2. 

3 ◦ Vis, at det kan antages, at middelværdien af vækstraten er den samme for population 1 og 

population 2. 

4 ◦ Undersøg, om det kan antages at middelværdi og varians af vækstraten er den samme for 

population 3 som for population 1 og 2. 

5 ◦ Angiv estimater og 95 % konfidensintervaller for parametrene i slutmodellen. Herunder 

et 95 % konfidensinterval for differensen mellem middelværdien af middelværdien af 

vækstraten i population 2 og den fælles middelværdi i population 1 og 2. 

Ikke alt det stof, der er skal bruges til statistik opgaven, er gennemgået. Det vil være tilfældet i 

løbet af uge 11. 

3

Kørsel af programmer fra SABG 

SAS programmer til eksemplerne og opgaverne i SABG kan hentes på adressen 

http://www.imf.au.dk/biogeostatistics 

De fleste af disse programmer har i starten følgende smarte option 

OPTIONS SASAUTOS= ’c:\biogeostatistics\sasmacros’; 

der bevirker, at en macro kan benyttes uden et %INCLUDE statement, hvis blot den pågældende 

macro findes i det angivne katalog. 

Kørsel af programmer under WINDOWS på egen PC 

Det kan anbefales på PC-en at oprette kataloget 

’c:\biogeostatistics\sasmacros’; 

og kopiere bogens macroer over i dette katalog. Bogens macroer kan findes på adressen 

http://www.imf.au.dk/biogeostatistics/sasmacros 

Programmer til eksempler og opgaver skulle nu køre uden problemer. 

Vær dog opmærksom på, at programmer med grafik typisk indeholder en linje som 

FILENAME GSASFILE ’c:\biogeostatistics\chapter3\examples\eks31.ps’; der angiver, 

hvor grafik filer skal gemmes. Denne linje skal modificeres, så den refererer til et katalog 

på jeres PC. 

Kørsel af programmer under UNIX eller LINUX på IMF 

Erstat 

OPTIONS SASAUTOS= ’c:\biogeostatistics\sasmacros’; 

med 

OPTIONS SASAUTOS= ’∼statbib/biogeostatistics/sasmacros’; 

(Bemærk, at WINDOWS bruger \ i forbindelse med navne på kataloger, mens UNIX og LINUX 

bruger /.) 

Desuden skal GOPTIONS DEV=win rettes til GOPTIONS DEV=xcolor i programmer, der producerer 

grafik. 

Endelig gælder bemærkningen om FILENAME GSASFILE også i dette tilfælde. 

4

Fordelinger 

I det følgende opsummeres egenskaber ved nogle af de vigtigste fordelinger, som vi skal arbejde 

med. Gennemgangen er delt op efter vore to hovedtyper af stokastiske variable (diskrete og 

absolut kontinuerte), og omfatter følgende. 

• Diskrete fordelinger: 

– Binomialfordelingen b(n,π). (Side R.36). 

– Poissonfordelingen po(λ). (Side R.37). 

– Den geometriske fordeling geo(π). (Side R.38). 

– Multinomialfordelingen m(n,π). (Side R.39). 

• Absolut kontinuerte fordelinger: 

– Den uniforme fordeling R(a,b). (Side R.40). 

– Normalfordelingen N(µ,σ 2 ). (Side R.41). 

– Eksponentialfordelingen e(λ). (Side R.43). 

– Gammafordelingen Γ(α,λ). (Side R.44). 

– σ 2 χ 2 ( f )-fordelingen. (Side R.45). 

I det diskrete tilfælde angiver vi sandsynlighedsfunktionen, men ikke fordelingsfunktionen. I 

det absolut kontinuerte tilfælde angives tætheden, og undertiden også fordelingsfunktionen. 

R.35

Binomialfordelingen b(n,π). 

Lad π ∈]0,1[ og n = 1,2,.... Vi siger, at en stokastisk variabel X er binomialfordelt med antalsparameter 

n og sandsynlighedsparameter π, kort X ∼ b(n,π), hvis X er diskret og har sandsynlighedsfunktion 

f givet ved 

⎧ 

⎨ n 

π 

f (x) = x 

⎩ 

x (1 − π) n−x hvis x ∈ {0,1,2,...,n} 

0 ellers. 

Egenskaber: 

X ∼ b(n,π) medfører EX = nπ og VarX = nπ(1 − π). (Table 6.1 side 76 i BPT). 

Antag at X1,...,Xk er uafhængige med Xi ∼ b(ni,π) for i = 1,...,k. Da gælder (se Table 

8.1 side 94 i BPT), at 

X1 + ··· + Xk ∼ b(n1 + ··· + nk,π) 

Anvendelse: 

Antag at en mønt kastes n gange, hvor der er sandsynlighed π for plat og kastene er uafhængige. 

Da gælder, at „antal plat“ er binomialfordelt b(n,π). 

R.36

Poissonfordelingen po(λ). 

Lad λ > 0. Vi siger, at en stokastisk variabel X er Poissonfordelt med parameter λ, kort X ∼ 

po(λ), hvis X er diskret og har sandsynlighedsfunktion f givet ved 

Egenskaber: 

f (x) = 

 

e−λ λx x! 

hvis x ∈ {0,1,...} 

0 ellers. 

X ∼ po(λ) medfører EX = λ og VarX = λ. (Table 6.1 side 76 i BPT). 

Antag at X1,...,Xk er uafhængige med Xi ∼ po(λi) for i = 1,...,k. Da gælder (se Table 

8.1 side 94 i BPT) 

X1 + ··· + Xk ∼ po(λ1 + ··· + λk). 

Anvendelse: 

Grænsefordeling for binomialfordelingen. Benyttes som regel til at modellere „antal radioaktive 

henfald“, „antal telefonopkald“ og lignende. 

R.37

Den geometriske fordeling geo(π). 

Lad π ∈]0,1[. Vi siger, at en stokastisk variabel X er geometrisk fordelt med parameter π, kort 

X ∼ geo(π), hvis X er diskret og har sandsynlighedsfunktion f givet ved 

 

(1 − π)πx hvis x ∈ {0,1,...} 

f (x) = 

0 ellers. 

(Dette svarer til den negative binomialfordeling b − (1,π).) 

Egenskaber: 

X ∼ geo(π) medfører EX = π 

π 

1−π og VarX = 

(1−π) 2 . (Table 6.1 side 76 i BPT). 

Antag at X1,...,Xn er uafhængige med Xi ∼ geo(π) for i = 1,...,n. Da gælder (Table 8.1 

side 94 i BPT) 

X1 + ··· + Xn ∼ b − (n,π), 

hvor den negative binomialfordeling b − er defineret i BPT. 

Anvendelser: 

Antag at en mønt kastes igen og igen, hvor kastene er uafhængige og der er sandsynlighed 

π for at få plat. Da er „antal plat før første krone“ geometrisk fordelt geo(π). 

Den geometriske fordeling modellerer ikke-negative glemsomme stokastiske variable med 

diskret tid. Mere præcist har vi, at hvis X er geometrisk fordelt, så gælder 

P(X ≥ n + k | X ≥ n) = P(X ≥ k) for n,k = 0,1,... 

Omvendt har vi, at hvis en ikke-negativ heltallig stokastisk variabel opfylder ovenstående, 

så gælder at X er geometrisk fordelt. 

R.38

Multinomialfordelingen m(n,π). 

Lad n ∈ {1,2...}, k ∈ {2,3,...} og π = (π1,...,πk) være en k-dimensional vektor med π j > 0 

for j = 1,...,k og π1 + ··· + πk = 1. 

Vi siger, at en stokastisk vektor X = (X1,...,Xk) er multinomialfordelt med antalsparameter n 

og sandsynlighedsparameter π, kort X ∼ m(n,π), hvis X er diskret og har sandsynlighedsfunk- 

tion f givet ved 

 

n 

f (x) = 

x1 ...xk 

 

π x1 

1 ···πxk 

k 

når x = (x1,...,xk) opfylder at x1,...,xk er ikke-negative og heltallige med n = x1 + ··· + xk. 

Egenskaber: 

Antag X ∼ m(n,π). Da gælder (Table 6.1) EX = nπ og 

 

nπi(1 − πi) i = j 

Cov(Xi,Xj) = 

i = j. 

−nπiπ j 

Antag X ∼ m(n,π). Da gælder Xj ∼ b(n,πj) for j = 1,...,k. 

Antag at X1 og X2 er uafhængige med Xi ∼ m(ni,π) for i = 1,2. Da gælder 

Anvendelse: 

X 1 + X 2 ∼ m(n1 + n2,π). 

Antag at en k-sidet terning kastes n gange hvor kastene er uafhængige og der er sandsynlighed 

π j for at observere j øjne for j = 1,...,k. Lad Xj betegne antal gange vi ser j øjne for j = 

1,...,k. Da gælder 

X = (X1,...,Xk) ∼ m(n,π). 

R.39

Den uniforme fordeling R(a,b). 

Lad a 

[a,b], kort X ∼ R(a,b), hvis X er absolut kontinuert med tæthed f givet ved 

⎧ 

⎪⎨ 

f (x) = 

⎪⎩ 

1 

b − a 

hvis x ∈ ]a,b[ 

0 ellers. 

Alternativt kan man specificere den uniforme fordeling via fordelingsfunktionen F for X, som 

er 

⎧ 

⎪⎨ 

0 

x − a 

F(x) = 

⎪⎩ b − a 

1 

hvis x ≤ a 

hvis x ∈ ]a,b[ 

hvis x ≥ b. 

Egenskaber: 

Antag at X ∼ R(a,b). Da gælder EX = a+b 

2 

og VarX = (b−a)2 

12 . 

X ∼ R(a,b) medfører α + βX ∼ R(α + βa,α + βb) for α ∈ R og β > 0. 

Anvendelse: 

Den uniforme fordeling er en model for en tilfældig udtrækning af et tal mellem a og b. 

R.40

Normalfordelingen N(µ,σ 2 ). 

Her opsummeres nogle af de vigtigste egenskaber ved normalfordelingen. 

E1 (Definition af normalfordelingen). Lad µ ∈ R og σ 2 > 0. En stokastisk variabel X er 

normalfordelt med parametre µ og σ 2 , kort X ∼ N(µ,σ 2 ), hvis X er absolut kontinuert 

med tæthed f givet ved 

f (x) = 

1 

− µ)2 

√ e−(x2σ 2πσ2 2 

, x ∈ R. 

E2 (Standard normalfordelingen). Fordelingen N(0,1) kaldes for standard normalfordelingen 

eller u-fordelingen, og i dette tilfælde er tæthed og fordelingsfunktion givet ved 

og 

ϕ(x) = 1 

√ 2π e −x2 

2 , x ∈ R 

Φ(x) = 

x 

−∞ 

1 

√ 2π e −z2 

2 dz, x ∈ R. 

Bemærk at Φ er tabellagt. Tætheden ϕ for standard normalfordelingen er symmetrisk 

omkring 0: 

ϕ(−x) = ϕ(x), x ∈ R 

og dette medfører 

Φ(−x) = 1 − Φ(x), x ∈ R. 

E3 (Relationen mellem en vilkårlig normalfordeling og standard normalfordelingen). Hvis 

X ∼ N(µ,σ 2 ), kan tætheden f for X udtrykkes ved tætheden for N(0,1)-fordelingen som 

og fordelingsfunktionen F for X er 

Specielt ses, at 

X ∼ N(µ,σ 2 ) ⇔ 

f (x) = 1 − µ 

ϕ(x 

σ σ ) 

x − µ 

F(x) = Φ( 

σ ). 

X − µ 

σ 

∼ N(0,1). 

E4 (Middelværdi og varians). Antag at X ∼ N(µ,σ 2 ). Da gælder E X = µ og Var X = σ 2 . 

E5 (Affin transformation af normalfordeling). Antag X ∼ N(µ,σ 2 ). Da gælder a + bX ∼ 

N(a + bµ,b 2 σ 2 ) for alle a ∈ R og b = 0. 

R.41

E6 (Summer af uafhængige normalfordelinger). Lad X1,...,Xn være uafhængige med Xi ∼ 

N(µi,σ 2 i ), i = 1,...,n. Lad Y være givet ved 

hvor c0,...,cn er konstanter. Da gælder 

Y = c0 + c1X1 + ··· + cnXn 

Y ∼ N(c0 + c1µ1 + ··· + cnµn,c 2 1σ 2 1 + ··· + c 2 nσ 2 n). (1) 

E7 (Kvadratsummer i normalfordelingen). Antag X ∼ N(µ,σ 2 ). Da gælder 

(X − µ) 2 ∼ σ 2 χ 2 (1). 

Hvis, mere generelt, X1,...,Xn er uafhængige med Xi ∼ N(µi,σ 2 ), så gælder 

eller, ækvivalent, 

n (Xi − µi) 

∑ 

i=1 

2 

σ2 ∼ χ 2 (n) 

n 

∑ 

i=1 

(Xi − µi) 2 ∼ σ 2 χ 2 (n). 

E8 (Normalfordelingen og uafhængighed). I Kapitel 6 i BPT vises, at hvis stokastiske variable 

er uafhængige, så har de kovarians 0. (Under antagelse af at kovariansen eksisterer). 

Den omvendte implikation, at kovarians 0 medfører uafhængighed, gælder derimod ikke. 

Dog har vi følgende pæne resultat for normalfordelte stokastiske variable. 

Lad X1,...Xn være uafhængige med Xi ∼ N(µi,σ 2 i ) for i = 1,...,n. Lad Y1,...,Yk være 

defineret som linearkombinationer af X1,...,Xn, altså 

Y1 = a11X1 + ··· + a1nXn 

. 

Yk = ak1X1 + ··· + aknXn 

hvor ai jerne er konstanter. Da gælder, at Y1,...,Yk er uafhængige hvis og kun hvis Cov(Yi,Yj) = 

0 for i, j = 1,...,k og i = j. 

Dette resultat kan, i tilfældet k = n = 2, vises ved hjælp af transformationssætningen. 

E9 (Fraktiler). Lad up betegne p-fraktilen for N(0,1)-fordelingen; det vil sige up = Φ −1 (p). 

Da gælder up = −u1−p. 

R.42

Eksponentialfordelingen e(λ). 

Lad λ > 0. En stokastisk variabel X siges at være eksponentialfordelt med parameter λ, kort 

X ∼ e(λ), hvis X er absolut kontinuert med tæthed f givet ved 

 

λe−λx hvis x > 0. 

f (x) = 

0 hvis x ≤ 0. 

Alternativt kan man specificere fordelingsfunktionen F for X, som er 

 

0 hvis x ≤ 0 

F(x) = 

1 − e−λx hvis x > 0. 

Egenskaber: 

Antag X ∼ e(λ). Da gælder EX = 1 

1 

λ og VarX = 

λ2 . (Table 6.1 side 76 i BPT). 

Antag X ∼ e(λ) samt at β > 0. Da gælder βX ∼ e( λ 

β ). 

Antag at X1,...,Xn er uafhængige med Xi ∼ e(λ) for i = 1,...,k. Da gælder (Table 8.1 

side i BPT), at 

X1 + ··· + Xn ∼ Γ(n,λ). 

Anvendelse: 

Eksponentialfordelingen modellerer glemsomme stokastiske variable. Mere præcist har vi, at 

eksponentialfordelingen er glemsom (kontinuert tid). Det vil sige, at hvis X ∼ e(λ), så gælder 

P(X > s +t|X > s) = P(X > t), for s,t > 0. 

Denne egenskab karakteriserer eksponentialfordelingen; det vil sige, at hvis en positiv stokastisk 

variabel er glemsom, så er den også eksponentialfordelt e(λ) for et λ > 0. 

R.43

Gammafordelingen Γ(α,λ). 

Lad α,λ > 0. En stokastisk variabel siges at være gammafordelt med parametre α og λ, kort 

X ∼ Γ(α,λ), hvis X er absolut kontinuert med tæthed f givet ved 

Egenskaber: 

⎧ 

⎨ 

f (x) = 

⎩ 

λ α 

Γ(α) xα−1 e −λx , hvis x > 0 

0 hvis x ≤ 0. 

Antag at X ∼ Γ(α,λ). Da gælder (Table 6.1 side 76 i BPT) EX = α 

λ 

Antag at X ∼ Γ(α,λ) og at β > 0. Da gælder βX ∼ Γ(α, λ 

β ). 

og VarX = α 

λ 2 . 

Antag at X1,...,Xn er uafhængige med Xi ∼ Γ(αi,λ) for i = 1,...,n. Da gælder (Table 

8.1 side i BPT), at 

X1 + ··· + Xn ∼ Γ(α1 + ··· + αn,λ). 

Anvendelser: 

Der er to vigtige specialtilfælde af gammafordelingen: 

eksponentialfordelingen e(λ), der svarer til en gammafordeling Γ(1,λ); 

σ2χ2 ( f )-fordelingen, der svarer til Γ( f 1 

2 , 

2σ2 ). 

Husk på at eksponentialfordelingen modellerer glemsomhed samt at σ 2 χ 2 ( f )-fordelingen 

modellerer kvadratsummer i normalfordelingen. 

Desuden har vi, at hvis X1,...,Xn er uafhængige med Xi ∼ e(λ), så gælder 

X1 + ··· + Xn ∼ Γ(n,λ). 

R.44

σ 2 χ 2 ( f )-fordelingen. 

Lad f ,σ2 > 0. Da kaldes Γ( f 1 

2 , 

2σ2 )-fordelingen også for en σ2χ2 ( f )-fordeling. (Tallet f om- 

tales som fordelingens frihedsgrader.) Specielt kaldes Γ( f 

2 , 1 2 )-fordelingen også for en χ2 ( f )fordeling. 

Egenskaber: 

Antag at X ∼ σ 2 χ 2 ( f ). Da gælder (Table 6.1 side i BPT) EX = σ 2 f samt VarX = 2σ 4 f . 

Der gælder X ∼ σ 2 χ 2 ( f ) hvis og kun hvis X 

σ 2 ∼ χ 2 ( f ). 

Antag at X1,...,Xn er uafhængige med Xi ∼ σ 2 χ 2 ( fi) for i = 1,...,n. Da gælder 

Anvendelse: 

X1 + ··· + Xn ∼ σ 2 χ 2 ( f1 + ··· + fn). 

σ 2 χ 2 ( f )-fordelingen benyttes til at modellere kvadratsummer i normalfordelingen (samt, ikke 

mindst, til at lave test inden for statistik, som vi skal se til foråret). Mere præcist har vi, at hvis 

X1,...,Xn er uafhængige med Xi ∼ N(µi,σ 2 ), så gælder 

eller, ækvivalent, 

n 

∑ 

i=1 

(Xi − µi) 2 ∼ σ 2 χ 2 (n) 

n (Xi − µi) 

∑ 

i=1 

2 

σ2 ∼ χ 2 (n) 

R.45

Meddelelse 7 - Aarhus Universitet

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?