15.11.2014 Views

Betrouwbaarheidsintervallen en het testen van hypothesen

Betrouwbaarheidsintervallen en het testen van hypothesen

Betrouwbaarheidsintervallen en het testen van hypothesen

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Cahiers T 3 Europe<br />

Vlaander<strong>en</strong> nr. 8<br />

<strong>Betrouwbaarheidsintervall<strong>en</strong></strong> <strong>en</strong><br />

<strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong><br />

Van steekproef naar populatie<br />

Guido Herweyers


<strong>Betrouwbaarheidsintervall<strong>en</strong></strong> <strong>en</strong><br />

<strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong><br />

Van steekproef naar populatie<br />

Guido Herweyers


Inhoud<br />

<strong>Betrouwbaarheidsintervall<strong>en</strong></strong><br />

1 Inleiding 1<br />

2 De normale verdeling 1<br />

3 Betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale 5<br />

verdeling met gek<strong>en</strong>de standaardafwijking<br />

Simulatie <strong>van</strong> betrouwbaarheidsintervall<strong>en</strong> 11<br />

Opgav<strong>en</strong> 13<br />

4 Betrouwbaarheidsinterval voor e<strong>en</strong> proportie 15<br />

Opgave 18<br />

5 De normale verdeling met de TI-84 Plus: e<strong>en</strong> overzicht 19<br />

Het test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong> 22<br />

1 Inleiding 22<br />

2 K<strong>en</strong>nismaking: e<strong>en</strong>d<strong>en</strong> met voorkeur voor gro<strong>en</strong>? 22<br />

Antwoord<strong>en</strong> bij de werktekst 29<br />

3 B<strong>en</strong>ader<strong>en</strong>de test voor e<strong>en</strong> proportie bij e<strong>en</strong> grote steekproef 31<br />

Opgav<strong>en</strong> 32<br />

4 Test voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale verdeling met gek<strong>en</strong>de 34<br />

standaardafwijking<br />

5 De binomiale verdeling <strong>en</strong> de TI-84 Plus 38<br />

6 Bronn<strong>en</strong> 39


<strong>Betrouwbaarheidsintervall<strong>en</strong></strong><br />

1 Inleiding<br />

Statistische infer<strong>en</strong>tie of Statistische besluitvorming trekt aan de hand <strong>van</strong> steekproefdata<br />

conclusies over de populatie waar<strong>van</strong> de data afkomstig zijn.<br />

Deze conclusies zijn <strong>en</strong>kel betrouwbaar indi<strong>en</strong> de steekproefdata op e<strong>en</strong> correcte wijze<br />

werd<strong>en</strong> verkreg<strong>en</strong>, zodat we kunn<strong>en</strong> aannem<strong>en</strong> dat de populatie goed wordt verteg<strong>en</strong>woordigd<br />

door de steekproefdata. Eerst moet er dus veel aandacht gaan naar <strong>het</strong> verwerv<strong>en</strong> <strong>van</strong><br />

gegev<strong>en</strong>s; uit slordig verkreg<strong>en</strong> data kan m<strong>en</strong> ge<strong>en</strong> zinvol besluit formuler<strong>en</strong>. In wat volgt<br />

nem<strong>en</strong> we aan dat we werk<strong>en</strong> met e<strong>en</strong> <strong>en</strong>kelvoudige aselecte steekproef uit e<strong>en</strong> populatie,<br />

waarbij elke steekproef <strong>van</strong> dezelfde om<strong>van</strong>g dezelfde kans op selectie heeft.<br />

In de onderstaande tekst besprek<strong>en</strong> we twee belangrijke begripp<strong>en</strong> uit de statistische<br />

besluitvorming: betrouwbaarheidsintervall<strong>en</strong> <strong>en</strong> hypothesetest<strong>en</strong>. We beperk<strong>en</strong> ons hierbij tot<br />

toepassing<strong>en</strong> op de normale <strong>en</strong> de binomiale verdeling, verdeling<strong>en</strong> die word<strong>en</strong> bestudeerd in<br />

<strong>het</strong> secundair onderwijs.<br />

Het is de bedoeling om vertrouwd te gerak<strong>en</strong> met de begripp<strong>en</strong> <strong>en</strong> de toepassingsgebied<strong>en</strong> aan<br />

de hand <strong>van</strong> concrete voorbeeld<strong>en</strong>, hierbij word<strong>en</strong> <strong>het</strong> grafisch rek<strong>en</strong>toestel TI-84 Plus <strong>en</strong><br />

Java-applets <strong>van</strong> de K.U.Leuv<strong>en</strong> ingezet.<br />

2 De normale verdeling<br />

In deze paragraaf vatt<strong>en</strong> we eerst <strong>en</strong>kele eig<strong>en</strong>schapp<strong>en</strong> <strong>van</strong> de normale verdeling <strong>en</strong> <strong>van</strong><br />

toevalsvariabel<strong>en</strong> sam<strong>en</strong>. Voor e<strong>en</strong> overzicht <strong>van</strong> de normale verdeling met de TI-84 Plus<br />

verwijz<strong>en</strong> we naar paragraaf 5.<br />

1) Over de grafiek <strong>van</strong> de normale dichtheidsfunctie:<br />

•<br />

σ<br />

•<br />

µ − 3σ<br />

µ − 2σ<br />

µ − σ µ µ + σ µ + 2 σ µ + 3σ<br />

68%<br />

95%<br />

99.7%<br />

1


• Populatiedata word<strong>en</strong> o.a. gek<strong>en</strong>merkt door <strong>het</strong> populatiegemiddelde µ <strong>en</strong> de<br />

populatiestandaardafwijking σ , als maat voor de spreiding <strong>van</strong> de data t.o.v. µ .<br />

Vaak neemt <strong>het</strong> dichtheidshistogram <strong>van</strong> de populatiedata, getek<strong>en</strong>d met e<strong>en</strong> kleine<br />

klass<strong>en</strong>breedte, de klokvorm aan <strong>van</strong> de normale dichtheidsfunctie (zie voorgaande<br />

grafiek). We zegg<strong>en</strong> dan dat de populatiedata normaal verdeeld zijn.<br />

De normale dichtheidsfunctie is dus e<strong>en</strong> wiskundig model voor de verdeling <strong>van</strong><br />

dergelijke populatiedata.<br />

Relatieve frequ<strong>en</strong>ties of proporties <strong>van</strong> populatiedata <strong>van</strong> e<strong>en</strong> variabele X, geleg<strong>en</strong> in<br />

e<strong>en</strong> interval, word<strong>en</strong> g<strong>en</strong>oteerd met P( a< X < b) , P( X < a) , P( X > a)<br />

,… <strong>en</strong><br />

berek<strong>en</strong>d als oppervlakte onder de dichtheidskromme bov<strong>en</strong> <strong>het</strong> beschouwde interval.<br />

De aard <strong>van</strong> de beschouwde ongelijkhed<strong>en</strong> (al dan niet strikt) speelt hierbij ge<strong>en</strong> rol.<br />

• De oppervlakte <strong>van</strong> <strong>het</strong> gebied begr<strong>en</strong>sd door de dichtheidskromme <strong>en</strong> de x-as is gelijk<br />

aan 1.<br />

• De kromme is klokvormig <strong>en</strong> symmetrisch t.o.v. de rechte x = µ , <strong>het</strong> gemiddelde valt<br />

dus sam<strong>en</strong> met de mediaan: µ = Med .<br />

• Ook de standaardafwijking σ heeft e<strong>en</strong> meetkundige betek<strong>en</strong>is: de punt<strong>en</strong> op de<br />

kromme geleg<strong>en</strong> op e<strong>en</strong> afstand σ <strong>van</strong> de symmetrieas zijn de buigpunt<strong>en</strong> <strong>van</strong> de<br />

kromme. Dit zijn de punt<strong>en</strong> waar de vorm <strong>van</strong> de kromme overgaat <strong>van</strong> bol naar hol<br />

(opwaarts kijk<strong>en</strong>d naar de kromme) of omgekeerd. E<strong>en</strong> buigpunt wordt ook<br />

gek<strong>en</strong>merkt als e<strong>en</strong> punt waar de raaklijn <strong>het</strong> steilst is. De hoogte <strong>van</strong> <strong>het</strong> buigpunt is<br />

ongeveer 60% <strong>van</strong> de tophoogte.<br />

• De 68 - 95 - 99.7 regel:<br />

voor e<strong>en</strong> normale verdeling met gemiddelde µ <strong>en</strong> standaardafwijking σ geldt:<br />

• Ongeveer 68% <strong>van</strong> de waarneming<strong>en</strong> ligt binn<strong>en</strong> e<strong>en</strong> afstand σ <strong>van</strong> µ<br />

• Ongeveer 95% <strong>van</strong> de waarneming<strong>en</strong> ligt binn<strong>en</strong> e<strong>en</strong> afstand 2σ <strong>van</strong> µ<br />

• Ongeveer 99.7% <strong>van</strong> de waarneming<strong>en</strong> ligt binn<strong>en</strong> e<strong>en</strong> afstand 3σ <strong>van</strong> µ<br />

Deze regel illustreert de rol <strong>van</strong> σ als maat <strong>van</strong> de spreiding <strong>van</strong> de populatiedata<br />

omhe<strong>en</strong> <strong>het</strong> populatiegemiddelde µ .<br />

We verifiër<strong>en</strong> de 68 - 95 - 99.7 regel voor e<strong>en</strong> normale verdeling met gemiddelde<br />

µ = 10 <strong>en</strong> standaardafwijking σ = 2 . Na keuze <strong>van</strong> e<strong>en</strong> geschikt v<strong>en</strong>ster kan de<br />

oppervlakte ook word<strong>en</strong> gearceerd via 2nd[DISTR] 1:ShadeNorm( .<br />

2


2) Elke toevalsvariabele X (ook stochastische veranderlijke of stochast g<strong>en</strong>oemd) wordt<br />

gek<strong>en</strong>merkt door de volg<strong>en</strong>de getall<strong>en</strong>:<br />

• E ( X ) , ook g<strong>en</strong>oteerd met µ , d.i. de verwachtingswaarde of <strong>het</strong> gemiddelde <strong>van</strong> X .<br />

2<br />

( )<br />

• Var ( X ) E ( X µ )<br />

= − , ook g<strong>en</strong>oteerd met<br />

2<br />

σ , d.i. de variantie <strong>van</strong> X .<br />

• i.p.v. de variantie vermeldt m<strong>en</strong> vaak σ = Var( X ), d.i. de standaardafwijking <strong>van</strong> X.<br />

2<br />

De notatie µ voor E ( X ) <strong>en</strong> σ voor ( )<br />

is uit e<strong>en</strong> populatie, dan is E ( X ) <strong>het</strong> populatiegemiddelde µ <strong>en</strong> ( )<br />

populatievariantie<br />

Var X is verantwoord: als X e<strong>en</strong> lukrake trekking<br />

Var X de<br />

2<br />

σ . We sprek<strong>en</strong> dan kort over de populatie met variabele X.<br />

Voor e<strong>en</strong> normaal verdeelde populatie geeft de dichtheidskromme nu ook de<br />

kansverdeling aan <strong>van</strong> de toevalsvariabele X, met deze verdeling wordt <strong>het</strong><br />

toevalsmechanisme aangestuurd. In deze context is P ( a< X < b)<br />

nu de kans dat de<br />

variabele X , lukraak gekoz<strong>en</strong> uit de populatie, e<strong>en</strong> waarde aanneemt tuss<strong>en</strong> a <strong>en</strong> b. Na e<strong>en</strong><br />

lukrake keuze uit de populatie verkrijg<strong>en</strong> we e<strong>en</strong> concreet getal x, d.i. e<strong>en</strong> waarde die<br />

de variabele X door <strong>het</strong> toevalsmechanisme heeft aang<strong>en</strong>om<strong>en</strong>.<br />

Indi<strong>en</strong> we vaak e<strong>en</strong> lukrake trekking do<strong>en</strong> uit e<strong>en</strong> normaal verdeelde populatie (<strong>en</strong> <strong>het</strong><br />

verkreg<strong>en</strong> getal telk<strong>en</strong>s terugplaats<strong>en</strong> in de populatie), dan zal <strong>het</strong><br />

dichtheidshistogram <strong>van</strong> deze lukraak verkreg<strong>en</strong> data op de lange duur de vorm <strong>van</strong> de<br />

normale dichtheidsfunctie aannem<strong>en</strong> (als we e<strong>en</strong> kleine klass<strong>en</strong>breedte kiez<strong>en</strong>).<br />

Via simulatie kan m<strong>en</strong> op die manier de kansverdeling lat<strong>en</strong> ontstaan <strong>van</strong> e<strong>en</strong><br />

toevalsvariabele.<br />

Je kan <strong>het</strong> ook als volgt bekijk<strong>en</strong>: met simulatie <strong>van</strong> trekking<strong>en</strong> uit e<strong>en</strong> populatie A<br />

produceer je op de lange duur e<strong>en</strong> nieuwe populatie B met dezelfde verdeling (<strong>en</strong> dus<br />

2<br />

dezelfde µ <strong>en</strong> σ ) als populatie A.<br />

3) Als de toevalsvariabele X normaal verdeeld is met gemiddelde µ <strong>en</strong> standaardafwijking<br />

σ , dan noter<strong>en</strong> we dit als volgt: X N ( µ , σ )<br />

∼ .<br />

X − µ<br />

= ∼ (Z is standaard normaal verdeeld).<br />

σ<br />

Door deze transformatie wordt e<strong>en</strong> concrete waarde x <strong>van</strong> X getransformeerd in de waarde<br />

x − µ<br />

z = <strong>van</strong> Z . We noem<strong>en</strong> <strong>het</strong> getal z de standaardscore of z-score <strong>van</strong> x.<br />

σ<br />

4) Als X ∼ N ( µ , σ ) dan is Z N( 0,1)<br />

3


Uit de formule x = µ + z ⋅ σ ler<strong>en</strong> we dat de z-score aangeeft hoeveel standaardafwijking<strong>en</strong><br />

σ de waarde x verwijderd is <strong>van</strong> <strong>het</strong> gemiddelde µ .<br />

E<strong>en</strong> z-score tuss<strong>en</strong> -1 <strong>en</strong> 1 is "normaal" <strong>en</strong> e<strong>en</strong> z-score met e<strong>en</strong> absolute waarde groter dan<br />

2 is zeld<strong>en</strong> (zie ook volg<strong>en</strong>de figuur). De z-scores word<strong>en</strong> o.a. gebruikt om data <strong>van</strong><br />

verschill<strong>en</strong>de normale verdeling<strong>en</strong> te vergelijk<strong>en</strong>.<br />

•<br />

•<br />

µ − 3σ<br />

− 3<br />

µ − 2σ<br />

µ − σ µ µ + σ µ + 2 σ µ + 3σ<br />

− 2<br />

− 1<br />

0 1 2 3<br />

x<br />

z<br />

5) Gegev<strong>en</strong> e<strong>en</strong> populatie met variabele X , met gemiddelde µ <strong>en</strong> standaardafwijking σ .<br />

Beschouw e<strong>en</strong> steekproef X1, X2, X3, … Xn<br />

uit de populatie (dit zijn onafhankelijke<br />

toevalsvariabel<strong>en</strong> met dezelfde verdeling als X ), dan heeft <strong>het</strong> steekproefgemiddelde<br />

X1+ X2 + … + Xn<br />

σ<br />

X =<br />

ook gemiddelde µ maar standaardafwijking .<br />

n<br />

n<br />

a) Als X normaal verdeeld is, dan is ook X normaal verdeeld:<br />

X1+ X2 + … + X<br />

∼ dan is X<br />

n ⎛ σ ⎞<br />

= N µ ,<br />

n<br />

⎜ ⎟.<br />

⎝ n ⎠<br />

Als X N ( µ , σ )<br />

b) Als de populatie (met eindige variantie) niet normaal verdeeld is dan geldt toch bij<br />

σ<br />

b<strong>en</strong>adering dat X normaal verdeeld is met gemiddelde µ <strong>en</strong> standaardafwijking<br />

n<br />

als n voldo<strong>en</strong>de groot is (c<strong>en</strong>trale limietstelling).<br />

4


3 Betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale<br />

verdeling met gek<strong>en</strong>de standaardafwijking<br />

Met <strong>het</strong> TI-84 Plus commando randNorm( µ , σ ) kun je simulaties uitvoer<strong>en</strong> <strong>van</strong> lukrake<br />

trekking<strong>en</strong> uit e<strong>en</strong> normaal verdeelde populatie met gemiddelde µ <strong>en</strong> standaardafwijking σ .<br />

Je vindt <strong>het</strong> commando onder MATH 6: randNorm(<br />

Enkele simulaties ton<strong>en</strong> de variabiliteit <strong>van</strong> de verkreg<strong>en</strong> data bij trekking<strong>en</strong> uit e<strong>en</strong> normale<br />

verdeling met gemiddelde µ = 10 <strong>en</strong> standaardafwijking σ = 2 . De data schommel<strong>en</strong> rond<br />

<strong>het</strong> gemiddelde.<br />

Als X ∼ N( 10,2)<br />

, dan is P( X )<br />

9.8 < < 10.2 = 8.0% :<br />

We simuler<strong>en</strong> nu <strong>en</strong>kele steekproev<strong>en</strong> met grootte n = 25 uit de populatie, telk<strong>en</strong>s berek<strong>en</strong><strong>en</strong><br />

we hierbij <strong>het</strong> steekproefgemiddelde x , d.i. telk<strong>en</strong>s e<strong>en</strong> concreet verkreg<strong>en</strong> waarde <strong>van</strong> de<br />

toevalsvariabele X .<br />

We stell<strong>en</strong> vast dat er minder variabiliteit is bij de steekproefgemiddeld<strong>en</strong>, die tev<strong>en</strong>s<br />

schommel<strong>en</strong> rond <strong>het</strong> populatiegemiddelde µ = 10. Elk <strong>van</strong> die steekproefgemiddeld<strong>en</strong> is e<strong>en</strong><br />

(punt)schatting voor <strong>het</strong> populatiegemiddelde.<br />

X1+ X2 + … + X25 ⎛ 2 ⎞<br />

∼ dan is X = N 10,<br />

25<br />

⎜ ⎟<br />

⎝ 25 ⎠<br />

Als X N( 10,2)<br />

of X N( 10, 0.4)<br />

∼ .<br />

5


Nu is P( X )<br />

9.8 < < 10.2 = 38.3% :<br />

Wat is eig<strong>en</strong>lijk de betek<strong>en</strong>is <strong>van</strong> X N( 10, 0.4)<br />

∼ ?<br />

Beschouw alle mogelijke geord<strong>en</strong>de steekproev<strong>en</strong> (met teruglegg<strong>en</strong>) ( x1, x2, x3, , x25)<br />

… die je<br />

kunt vorm<strong>en</strong> uit de populatiedata <strong>en</strong> bepaal telk<strong>en</strong>s <strong>het</strong> steekproefgemiddelde x . De populatie<br />

<strong>van</strong> al deze steekproefgemiddeld<strong>en</strong> is normaal verdeeld met gemiddelde 10 <strong>en</strong><br />

standaardafwijking 0.4. Het gemiddelde <strong>van</strong> al die steekproefgemiddeld<strong>en</strong> is dus gelijk aan<br />

<strong>het</strong> gemiddelde <strong>van</strong> de oorspronkelijke populatie, maar de spreiding is verkleind met e<strong>en</strong><br />

factor 25 .<br />

De toevalsvariabele X wordt gestuurd door e<strong>en</strong> N ( 10, 0.4)<br />

-verdeling. Bij simulatie <strong>van</strong><br />

lukrake steekproeftrekking<strong>en</strong> zal de vorm <strong>van</strong> <strong>het</strong> dichtheidshistogram <strong>van</strong> de lukraak<br />

verkreg<strong>en</strong> steekproefgemiddeld<strong>en</strong> op de lange duur de vorm <strong>van</strong> N ( 10, 0.4)<br />

-<br />

dichtheidsfunctie aannem<strong>en</strong>.<br />

Meestal trekk<strong>en</strong> we echter maar één steekproef uit e<strong>en</strong> populatie.<br />

Beschouw <strong>het</strong> resultaat 10.195 (afgerond) <strong>van</strong> <strong>het</strong> eerste steekproefgemiddelde <strong>en</strong> stel dat je<br />

<strong>en</strong>kel weet dat de steekproef afkomstig is uit e<strong>en</strong> normaal verdeelde populatie met<br />

standaardafwijking σ = 2 , hoe goed is deze schatting x = 10.195 voor <strong>het</strong> ongek<strong>en</strong>de<br />

gemiddelde µ <strong>van</strong> de populatie?<br />

Hiertoe red<strong>en</strong>er<strong>en</strong> we grafisch:<br />

•<br />

σ<br />

n<br />

0.4<br />

•<br />

µ = ?<br />

x<br />

−3<br />

−2<br />

−1<br />

0 1 2 3<br />

z<br />

6


In de voorgaande figuur zi<strong>en</strong> we de verdeling <strong>van</strong> de steekproefgemiddeld<strong>en</strong> <strong>van</strong> alle<br />

mogelijke steekproev<strong>en</strong> met grootte n, <strong>het</strong> gemiddelde <strong>van</strong> al die steekproefgemiddeld<strong>en</strong> valt<br />

σ 2<br />

sam<strong>en</strong> met <strong>het</strong> populatiegemiddelde µ <strong>en</strong> de standaardafwijking is = = 0.4 . Op<br />

n 25<br />

basis <strong>van</strong> één lukraak verkreg<strong>en</strong> steekproefgemiddelde x = 10.195 w<strong>en</strong>s<strong>en</strong> we e<strong>en</strong> uitspraak<br />

te do<strong>en</strong> over <strong>het</strong> ongek<strong>en</strong>de populatiegemiddelde µ .<br />

We wet<strong>en</strong> dat ongeveer 95% <strong>van</strong> de steekproefgemiddeld<strong>en</strong> geleg<strong>en</strong> zijn binn<strong>en</strong> e<strong>en</strong> afstand<br />

σ<br />

<strong>van</strong> 2 standaardafwijking<strong>en</strong> <strong>van</strong> µ . Meer precies kunn<strong>en</strong> we zegg<strong>en</strong> dat 95% <strong>van</strong> de<br />

n<br />

σ<br />

steekproefgemiddeld<strong>en</strong> geleg<strong>en</strong> zijn in <strong>het</strong> interval µ ± 1.96 .<br />

n<br />

Met de functie invNorm vind<strong>en</strong> we immers de standaardscore z<br />

0.025<br />

= 1.96 ; <strong>het</strong> argum<strong>en</strong>t<br />

<strong>van</strong> deze functie is de oppervlakte 0.975 links <strong>van</strong> z 0.025<br />

onder de standaard normale<br />

verdeling:<br />

0.95<br />

0.025<br />

0.1<br />

0.025<br />

−1.96 0 1 1.96<br />

z 0.025<br />

De notatie z<br />

0.025<br />

wordt gebruikt om aan te gev<strong>en</strong> dat de oppervlakte rechts <strong>van</strong> z<br />

0.025<br />

gelijk is<br />

aan 0.025 .<br />

σ<br />

95% <strong>van</strong> de data x ligg<strong>en</strong> dus binn<strong>en</strong> e<strong>en</strong> afstand 1.96 <strong>van</strong> µ , maar dit betek<strong>en</strong>t ook dat<br />

n<br />

voor 95% <strong>van</strong> de steekproefgemiddeld<strong>en</strong> x <strong>het</strong> populatiegemiddelde µ zal geleg<strong>en</strong> zijn<br />

σ<br />

binn<strong>en</strong> e<strong>en</strong> afstand 1.96 <strong>van</strong> x !<br />

n<br />

7


Derhalve noem<strong>en</strong> we voor e<strong>en</strong> concrete observatie x <strong>het</strong> interval<br />

⎡ σ σ ⎤<br />

⎢x<br />

− 1.96 , x + 1.96 ⎥ e<strong>en</strong> 95% betrouwbaarheidsinterval voor µ , of e<strong>en</strong><br />

⎣ n n⎦<br />

betrouwbaarheidsinterval met betrouwbaarheidsniveau 95%.<br />

σ<br />

We noter<strong>en</strong> dit interval ook met x ± 1.96 .<br />

n<br />

-----------------------------------------------------------------------------------------------------------------<br />

Formeel loopt de bov<strong>en</strong>staande red<strong>en</strong>ering als volgt:<br />

X1+ X2 + … + X<br />

Aangezi<strong>en</strong> X<br />

n ⎛ σ ⎞<br />

= N µ ,<br />

n<br />

⎜ ⎟<br />

⎝ n ⎠<br />

X − µ<br />

σ<br />

is Z = ∼ N( 0,1)<br />

n<br />

Uit P( Z )<br />

−1.96 ≤ ≤ 1.96 = 0.95<br />

volgt dat<br />

X − µ<br />

P( −1.96 ≤ ≤ 1.96) = 0.95<br />

σ<br />

n<br />

of<br />

σ<br />

σ<br />

P( −1.96 ≤ X −µ<br />

≤ 1.96 ) = 0.95<br />

n<br />

n<br />

(1)<br />

uit (1) volgt nu<br />

σ<br />

σ<br />

P( µ −1.96 ≤ X ≤ µ + 1.96 ) = 0.95<br />

n<br />

n<br />

uit (1) volgt echter ook<br />

σ<br />

σ<br />

P( −X −1.96 ≤−µ<br />

≤− X + 1.96 ) = 0.95<br />

n<br />

n<br />

waaruit<br />

σ<br />

σ<br />

PX ( + 1.96 ≥ µ ≥ X− 1.96 ) = 0.95<br />

n<br />

n<br />

of<br />

σ<br />

σ<br />

PX ( −1.96 ≤ µ ≤ X+ 1.96 ) = 0.95<br />

n<br />

n<br />

bijgevolg noem<strong>en</strong> we<br />

⎡ σ<br />

⎢x<br />

− 1.96<br />

⎣ n<br />

, x + 1.96<br />

voor µ .<br />

σ ⎤<br />

⎥<br />

n⎦ e<strong>en</strong> 95% betrouwbaarheidsinterval<br />

-----------------------------------------------------------------------------------------------------------------<br />

8


Voor onze eerste observatie x = 10.195 verkrijg<strong>en</strong> µ = 10.195 ± 1.96⋅ 0.4 = 10.195 ± 0.784 als<br />

betrouwbaarheidsinterval met 95% betrouwbaarheid. Dit interval [ 9.411,10.979 ] bevat<br />

inderdaad <strong>het</strong> populatiegemiddelde µ = 10.<br />

Bij elke steekproef verkrijg<strong>en</strong> we meestal e<strong>en</strong> ander gemiddelde x <strong>en</strong> dus e<strong>en</strong> ander 95%<br />

betrouwbaarheidsinterval x ± 0.784 .<br />

Bij honderd steekproev<strong>en</strong> verkrijg<strong>en</strong> we honderd betrouwbaarheidsintervall<strong>en</strong>, waar<strong>van</strong> we<br />

mog<strong>en</strong> verwacht<strong>en</strong> dat er ongeveer 95 intervall<strong>en</strong> <strong>het</strong> populatiegemiddelde µ zull<strong>en</strong> bevatt<strong>en</strong>.<br />

Simuleer zelf <strong>en</strong>kele steekproev<strong>en</strong> <strong>en</strong> bepaal de bijbehor<strong>en</strong>de betrouwbaarheidsintervall<strong>en</strong><br />

voor µ , ga na welke intervall<strong>en</strong> inderdaad 10 µ = bevatt<strong>en</strong>.<br />

σ<br />

Merk op dat de foutmarge 1.96 = 0.784 voor elk interval ongewijzigd blijft (bij vaste σ<br />

n<br />

<strong>en</strong> n <strong>en</strong> 95% betrouwbaarheid), terwijl <strong>het</strong> c<strong>en</strong>trum x <strong>van</strong> <strong>het</strong> interval door <strong>het</strong> toeval varieert<br />

<strong>van</strong> steekproef tot steekproef.<br />

M<strong>en</strong> kan <strong>het</strong> betrouwbaarheidsniveau 95% = 0.95 wijzig<strong>en</strong> tot e<strong>en</strong> bepaalde waarde 1−<br />

α<br />

(met 0< α < 1 ). Het betrouwbaarheidsniveau wordt g<strong>en</strong>oteerd met 1− α omdat α kan<br />

word<strong>en</strong> geïnterpreteerd als <strong>het</strong> significanti<strong>en</strong>iveau <strong>van</strong> e<strong>en</strong> tweezijdige hypothesetest (zie<br />

volg<strong>en</strong>d hoofdstuk).<br />

E<strong>en</strong> betrouwbaarheidsinterval met betrouwbaarheidsniveau 1− α , voor <strong>het</strong> gemiddelde µ<br />

σ<br />

<strong>van</strong> e<strong>en</strong> normaal verdeelde populatie met gek<strong>en</strong>de standaardafwijking σ , is x ± zα<br />

/2<br />

⋅ ,<br />

n<br />

waarbij de oppervlakte rechts <strong>van</strong> z α /2<br />

onder de standaardnormale dichtheidskromme gelijk is<br />

aan α /2, zodat de oppervlakte tuss<strong>en</strong> − z α /2<br />

<strong>en</strong> z α /2<br />

gelijk is aan <strong>het</strong> gew<strong>en</strong>ste<br />

betrouwbaarheidsniveau 1− α .<br />

⎛ α ⎞<br />

Met de TI-84 Plus vind je z α /2<br />

= invNorm⎜1−<br />

⎟<br />

⎝ 2 ⎠ .<br />

1−α<br />

α /2<br />

0.1<br />

− z α /2 0 1 /2<br />

α /2<br />

z α<br />

9


σ<br />

Merk op dat de foutmarge zα<br />

/2<br />

⋅ afhankelijk is <strong>van</strong> <strong>het</strong> gekoz<strong>en</strong> betrouwbaarheidsniveau<br />

n<br />

1− α , de populatiestandaardafwijking σ <strong>en</strong> de steekproefgrootte n.<br />

• Hoe groter <strong>het</strong> betrouwbaarheidsniveau, hoe groter de foutmarge.<br />

Bij e<strong>en</strong> betrouwbaarheid <strong>van</strong> 90% is z 0.05<br />

= 1.645 , voor e<strong>en</strong> betrouwbaarheid <strong>van</strong> 99% is<br />

z<br />

0.005<br />

= 2.576 .<br />

Halveert de foutmarge als we <strong>het</strong> betrouwbaarheidsniveau halver<strong>en</strong> (bvb. <strong>van</strong> 90% naar<br />

45%)?<br />

• Hoe groter de populatiestandaardafwijking σ , hoe groter de foutmarge.<br />

Als σ verdubbelt, verdubbelt dan ook de foutmarge?<br />

• Hoe groter de steekproefgrootte n, hoe kleiner de foutmarge.<br />

Als n verdubbelt, halveert dan de foutmarge?<br />

<strong>Betrouwbaarheidsintervall<strong>en</strong></strong> kunn<strong>en</strong> ook rechtstreeks word<strong>en</strong> berek<strong>en</strong>d met de TI-84 Plus via<br />

STAT 7 : ZInterval : vul de gegev<strong>en</strong>s in, ga met de cursor naar Calculate <strong>en</strong><br />

druk ENTER.<br />

10


Simulatie <strong>van</strong> betrouwbaarheidsintervall<strong>en</strong><br />

Het programma CI simuleert ti<strong>en</strong> steekproev<strong>en</strong> <strong>van</strong> e<strong>en</strong>zelfde grootte uit e<strong>en</strong> populatie die<br />

normaal verdeeld is met µ = 10 <strong>en</strong> σ = 2 .<br />

Voor iedere steekproef wordt e<strong>en</strong> betrouwbaarheidsinterval berek<strong>en</strong>d <strong>en</strong> deze intervall<strong>en</strong><br />

word<strong>en</strong> grafisch voorgesteld sam<strong>en</strong> met de dichtheidsfunctie <strong>van</strong> de normale verdeling.<br />

Na <strong>het</strong> start<strong>en</strong> <strong>van</strong> <strong>het</strong> programma geef je de<br />

gegev<strong>en</strong>s in :<br />

N = steekproefgrootte,<br />

O/O = betrouwbaarheidsniveau<br />

Dit doe je door de waarde in te tikk<strong>en</strong> achter<br />

“ : ” <strong>en</strong> dan op ENTER te drukk<strong>en</strong>.<br />

Hier volg<strong>en</strong> <strong>en</strong>kele resultat<strong>en</strong> <strong>en</strong> <strong>het</strong> programma:<br />

** Input % **<br />

Input "N : ",N<br />

Input "O/O : ",P<br />

P/100→P<br />

** Trekk<strong>en</strong> <strong>van</strong> ti<strong>en</strong> steekproev<strong>en</strong> **<br />

For(I,1,10)<br />

randNorm(10,2,N)→L1<br />

ZInterval 2,L1,P<br />

lower→ L2(I)<br />

upper→L3(I)<br />

End<br />

** Definitie <strong>van</strong> <strong>het</strong> grafisch v<strong>en</strong>ster **<br />

FnOff<br />

PlotsOff<br />

4→Xmin<br />

16→Xmax<br />

1→Xscl<br />

−1.1→Ymin<br />

.25→Ymax<br />

0→Yscl<br />

1→Xres<br />

**Tek<strong>en</strong><strong>en</strong> <strong>van</strong> dichtheidsfunctie <strong>en</strong> intervall<strong>en</strong>**<br />

"normalpdf(X,10,2)"→Y1<br />

P*100→P<br />

Text(56,84,P)<br />

Vertical 10<br />

For(J,1,10)<br />

Line(L₂(J),J*−.1,L₃(J),J*−.1)<br />

End<br />

11


Met de Java-applets <strong>van</strong> de webpagina www.kuleuv<strong>en</strong>.be/ucs/java kun je ook<br />

betrouwbaarheidsintervall<strong>en</strong> simuler<strong>en</strong> via “Tests”, vervolg<strong>en</strong>s “Confid<strong>en</strong>ce interval for<br />

mean”.<br />

Bij “settings” stell<strong>en</strong> we µ = 10, σ = 2 <strong>en</strong> α = 5% voor e<strong>en</strong> 95% betrouwbaarheidsinterval.<br />

Als steekproefgrootte kiez<strong>en</strong> we 100 <strong>en</strong> voor <strong>het</strong> aantal steekproev<strong>en</strong> nem<strong>en</strong> we 1000.<br />

Nu levert “step” alvast e<strong>en</strong> eerste simulatie:<br />

We zi<strong>en</strong> de verdeling <strong>van</strong> de steekproefgegev<strong>en</strong>s <strong>en</strong> <strong>het</strong> bijbehor<strong>en</strong>de<br />

betrouwbaarheidsinterval, dat <strong>het</strong> populatiegemiddelde µ = 10 bevat. Het kader links kun je<br />

met de muis verplaats<strong>en</strong>.<br />

Nog e<strong>en</strong>s klikk<strong>en</strong> op “step” levert e<strong>en</strong> tweede steekproef met zijn betrouwbaarheidsinterval:<br />

Ook <strong>het</strong> tweede betrouwbaarheidsinterval bevat µ .<br />

Met “walk” zie je de volg<strong>en</strong>de steekproefresultat<strong>en</strong>, met “run” gebeurt dit in versneld tempo.<br />

Uiteindelijk verkrijg<strong>en</strong> we e<strong>en</strong> zicht op de laatste 100 betrouwbaarheidsintervall<strong>en</strong> <strong>en</strong> e<strong>en</strong><br />

sam<strong>en</strong>vatt<strong>en</strong>d overzicht in <strong>het</strong> kader:<br />

12


De betrouwbaarheidsintervall<strong>en</strong> die µ niet bevatt<strong>en</strong> word<strong>en</strong> op de website aangegev<strong>en</strong> in <strong>het</strong><br />

rood. In <strong>het</strong> kadertje lez<strong>en</strong> we af (“Accepted”) dat 95,60 % <strong>van</strong> de duiz<strong>en</strong>d<br />

betrouwbaarheidsintervall<strong>en</strong> µ bevatt<strong>en</strong>, dit is in overe<strong>en</strong>stemming met <strong>het</strong> gekoz<strong>en</strong><br />

betrouwbaarheidsniveau 95 %.<br />

Opgav<strong>en</strong><br />

1) E<strong>en</strong> test op <strong>het</strong> kaliumgehalte in bloed is niet helemaal nauwkeurig. Bov<strong>en</strong>di<strong>en</strong> varieert de<br />

feitelijke hoeveelheid kalium in iemands bloed <strong>van</strong> dag tot dag <strong>en</strong>igszins. Veronderstel dat<br />

herhaalde meting<strong>en</strong> op verschill<strong>en</strong>de dag<strong>en</strong> bij dezelfde persoon variër<strong>en</strong> volg<strong>en</strong>s e<strong>en</strong><br />

normale verdeling met standaardafwijking σ = 0.2 (in millimol per liter).<br />

(a) Het kaliumgehalte <strong>van</strong> Mark wordt één keer gemet<strong>en</strong>, <strong>het</strong> resultaat is x = 3.4 .<br />

Bepaal e<strong>en</strong> 95% betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde kaliumgehalte <strong>van</strong> de<br />

normale verdeling.<br />

(b) Als er op vier verschill<strong>en</strong>de dag<strong>en</strong> meting<strong>en</strong> werd<strong>en</strong> gedaan met gemiddelde x = 3.4 ,<br />

wat is dan <strong>het</strong> 95% betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde kaliumniveau <strong>van</strong><br />

de normale verdeling?<br />

2) E<strong>en</strong> labo analyseert de conc<strong>en</strong>tratie <strong>van</strong> e<strong>en</strong> actieve ingrediënt in e<strong>en</strong> g<strong>en</strong>eesmiddel. Drie<br />

verschill<strong>en</strong>de meting<strong>en</strong> <strong>van</strong> de conc<strong>en</strong>tratie levert als resultaat in g/l :<br />

0.8403 0.8363 0.8447<br />

Veronderstel hierbij dat de data afkomstig zijn uit e<strong>en</strong> normale verdeling met gek<strong>en</strong>de<br />

standaardafwijking σ = 0.0068 g/l <strong>en</strong> dat <strong>het</strong> gemiddelde <strong>van</strong> die verdeling de exacte<br />

conc<strong>en</strong>tratie is (<strong>het</strong> labo maakt ge<strong>en</strong> systematische fout<strong>en</strong>).<br />

(a) Bepaal e<strong>en</strong> 90 % betrouwbaarheidsinterval voor de exacte conc<strong>en</strong>tratie.<br />

(b) Hoeveel meting<strong>en</strong> moet m<strong>en</strong> do<strong>en</strong> om de exacte conc<strong>en</strong>tratie met 95% zekerheid te<br />

k<strong>en</strong>n<strong>en</strong> met e<strong>en</strong> maximale foutmarge <strong>van</strong> 0.005 ?<br />

13


Oplossing<strong>en</strong><br />

1) a) Met 1− α = 0.95 vind<strong>en</strong> we α = 0.05 <strong>en</strong> zα /2<br />

= z0.025<br />

= invNorm(0.975) = 1.96<br />

Bov<strong>en</strong>di<strong>en</strong> is σ = 0.2 <strong>en</strong> n = 1 zodat x = x .<br />

σ<br />

Het 95% betrouwbaarheidsinterval x ± zα<br />

/2<br />

⋅ wordt dan x± z α /2<br />

⋅ σ of<br />

n<br />

3.4 ± 1.96⋅ 0.2 of 3.4 0.392<br />

3.008,3.792 .<br />

± , dit is <strong>het</strong> interval [ ]<br />

σ<br />

b) Het 95% betrouwbaarheidsinterval x ± zα<br />

/2<br />

⋅ wordt<br />

n<br />

dit is <strong>het</strong> interval [ 3.204,3.596 ].<br />

0.2<br />

3.4 ± 1.96⋅ of 3.4 ± 0.196 ,<br />

4<br />

2) a) We berek<strong>en</strong><strong>en</strong> eerst <strong>het</strong> steekproefgemiddelde x = 0.8404 ,<br />

Met 1− α = 0.90 vind<strong>en</strong> we α = 0.10 <strong>en</strong> zα /2<br />

= z0.05<br />

= invNorm(0.95) = 1.64<br />

σ<br />

0.0068<br />

Het 90% betrouwbaarheidsinterval x ± zα<br />

/2<br />

⋅ wordt 0.8404 ± 1.64⋅ of<br />

n<br />

3<br />

0.8404 0.0064<br />

0.8340,0.8468<br />

± of <strong>het</strong> interval [ ]<br />

Met de TI-84 Plus kun je eerst de data ingev<strong>en</strong> in lijst L1 <strong>en</strong> <strong>het</strong> rek<strong>en</strong>toestel zelf <strong>het</strong><br />

gemiddelde lat<strong>en</strong> berek<strong>en</strong><strong>en</strong>:<br />

σ<br />

2) b) Er moet geld<strong>en</strong> dat zα<br />

/2<br />

⋅ ≤ 0.005 of<br />

n<br />

⎛ 0.0068 ⎞<br />

⎜1.96⋅<br />

⎟ ≤n<br />

⎝ 0.005 ⎠<br />

2<br />

0.0068<br />

1.96⋅ ≤ 0.005 of<br />

n<br />

zodat n ≥ 7.1 ; de steekproefgrootte n = 8 volstaat dus.<br />

14


Opmerking<br />

Het zwakke punt <strong>van</strong> onze red<strong>en</strong>ering is dat we veronderstell<strong>en</strong> dat de standaardafwijking σ<br />

σ<br />

<strong>van</strong> de populatie gek<strong>en</strong>d is, dit is echter zeld<strong>en</strong> <strong>het</strong> geval waardoor <strong>het</strong> interval x ± zα<br />

/2<br />

⋅<br />

n<br />

in de praktijk zeld<strong>en</strong> bruikbaar is. We veronderstell<strong>en</strong> tev<strong>en</strong>s dat de populatie normaal<br />

verdeeld is.<br />

Indi<strong>en</strong> we echter e<strong>en</strong> voldo<strong>en</strong>d grote steekproef (vuistregel n ≥ 30 ) nem<strong>en</strong> uit e<strong>en</strong> populatie<br />

met e<strong>en</strong> willekeurige verdeling <strong>en</strong> eindige standaardafwijking σ , dan zegt de c<strong>en</strong>trale<br />

X1+ X2 + … + Xn<br />

limietstelling dat <strong>het</strong> steekproefgemiddelde X =<br />

bij b<strong>en</strong>adering normaal<br />

n<br />

σ<br />

verdeeld is met gemiddelde µ <strong>en</strong> standaardafwijking .<br />

n<br />

Bov<strong>en</strong>di<strong>en</strong> zal de steekproefstandaardafwijking s dan dicht ligg<strong>en</strong> bij de ongek<strong>en</strong>de σ , zodat<br />

s<br />

x ± zα<br />

/2<br />

⋅ dan e<strong>en</strong> b<strong>en</strong>ader<strong>en</strong>d betrouwbaarheidsinterval geeft voor µ (indi<strong>en</strong> er ge<strong>en</strong><br />

n<br />

uitschieters zijn in de steekproef want deze beïnvloed<strong>en</strong> x <strong>en</strong> s sterk).<br />

Zo wordt de foutmarge <strong>van</strong> e<strong>en</strong> steekproef (uit e<strong>en</strong> willekeurige verdeling) <strong>van</strong> 100 data met<br />

e<strong>en</strong> steekproefstandaardafwijking s = 3 bij e<strong>en</strong> 95% betrouwbaarheidsinterval bij b<strong>en</strong>adering<br />

s 3<br />

gegev<strong>en</strong> door z0.025<br />

⋅ = 1.96⋅ = 0.588 .<br />

n 100<br />

4 Betrouwbaarheidsinterval voor e<strong>en</strong> proportie<br />

Om de proportie p <strong>van</strong> de Vlaming<strong>en</strong> met bloedgroep O te bepal<strong>en</strong>, word<strong>en</strong> 200 person<strong>en</strong><br />

onderzocht; 80 onder h<strong>en</strong> hebb<strong>en</strong> bloedgroep O.<br />

Als schatting voor p nem<strong>en</strong> we de steekproefproportie<br />

80<br />

p ˆ = = 0.40 .<br />

200<br />

We will<strong>en</strong> e<strong>en</strong> 95% betrouwbaarheidsinterval voor p bepal<strong>en</strong>, d.w.z. e<strong>en</strong> interval<br />

ˆp ± foutmarge waarbinn<strong>en</strong> p met 95% zekerheid geleg<strong>en</strong> is.<br />

15


-----------------------------------------------------------------------------------------------------------------<br />

Stel X <strong>het</strong> aantal person<strong>en</strong> met bloedgroep O bij e<strong>en</strong> steekproef <strong>van</strong> 200 person<strong>en</strong>, dan is X<br />

binomiaal verdeeld met parameters n = 200 <strong>en</strong> p = kans op succes (bloedgroep O) :<br />

X<br />

2<br />

∼ B( n,<br />

p)<br />

met E ( X) = µ<br />

X<br />

= np <strong>en</strong> Var ( X ) = σ<br />

X<br />

= np ( 1−<br />

p)<br />

Door de c<strong>en</strong>trale limietstelling wet<strong>en</strong> we dat X bij b<strong>en</strong>adering normaal verdeeld is met<br />

np 1− p .<br />

gemiddelde np <strong>en</strong> standaardafwijking ( )<br />

We kunn<strong>en</strong> X immers schrijv<strong>en</strong> als X = X1+ X2 + X3+… Xn<br />

, d.i. e<strong>en</strong> som <strong>van</strong><br />

n onafhankelijke toevalsvariabel<strong>en</strong> met e<strong>en</strong> Bernouilli verdeling met parameter p.<br />

Hierbij neemt X<br />

i<br />

de waarde 1 aan met kans p als de i-de persoon bloedgroep O heeft <strong>en</strong> de<br />

= p <strong>en</strong> Var ( X ) = p( 1− p)<br />

,<br />

waarde 0 als dit niet <strong>het</strong> geval is. M<strong>en</strong> rek<strong>en</strong>t vlug na dat E ( Xi<br />

)<br />

zodat E ( X) = E( X1) + E( X2) + … E( Xn<br />

) = np<br />

<strong>en</strong> Var ( X ) = Var ( X ) + Var ( X ) + … Var ( X ) = np ( − p)<br />

1 2 n<br />

1<br />

Hieruit volgt dat de toevalsvariabele X<br />

P = bij b<strong>en</strong>adering normaal verdeeld is met<br />

n<br />

p ( 1−<br />

p)<br />

gemiddelde p <strong>en</strong> standaardafwijking<br />

:<br />

n<br />

( ) ( )<br />

⎛ X ⎞ 1<br />

E ( P) = E⎜<br />

⎟= E( X)<br />

= p <strong>en</strong> ⎛ X ⎞ 1 p 1−<br />

p<br />

Var P = Var ⎜ ⎟= Var X =<br />

2<br />

⎝ n ⎠ n<br />

⎝ n ⎠ n n<br />

-----------------------------------------------------------------------------------------------------------------<br />

a) Exacte oplossing:<br />

i<br />

( )<br />

In 95% der gevall<strong>en</strong> neemt P dus e<strong>en</strong> waarde ˆp aan binn<strong>en</strong> 1.96 standaardafwijking<strong>en</strong> <strong>van</strong><br />

( 1 )<br />

<strong>het</strong> gemiddelde p of ˆ 1.96 p −<br />

p− p ≤ p met 95% zekerheid.<br />

n<br />

Concreet vond<strong>en</strong> we voor onze steekproef x = 80 <strong>en</strong> n = 200 zodat<br />

( 1−<br />

p)<br />

80<br />

p ˆ = = 0.40 <strong>en</strong><br />

200<br />

p<br />

0.4 − p ≤ 1.96 met 95% zekerheid. We loss<strong>en</strong> de ongelijkheid grafisch op:<br />

200<br />

Als interval verkrijg<strong>en</strong> we 0.3346 < p < 0.4692 met 95 % zekerheid.<br />

16


) B<strong>en</strong>ader<strong>en</strong>de oplossing:<br />

Met 95 % zekerheid is ˆp geleg<strong>en</strong> binn<strong>en</strong> 1.96 standaardafwijking<strong>en</strong> <strong>van</strong> <strong>het</strong> gemiddelde p<br />

of <strong>het</strong> gemiddelde p is geleg<strong>en</strong> binn<strong>en</strong> 1.96 standaardafwijking<strong>en</strong> <strong>van</strong> ˆp :<br />

( 1−<br />

) ( 1−<br />

)<br />

pˆ<br />

−1.96 p p ≤ p≤ pˆ<br />

+ 1.96<br />

p p<br />

n<br />

n<br />

We b<strong>en</strong>ader<strong>en</strong><br />

p<br />

( 1−<br />

p)<br />

n<br />

door<br />

pˆ<br />

( 1−<br />

pˆ)<br />

n<br />

, dit levert <strong>het</strong> 95 % betrouwbaarheidsinterval<br />

( 1−<br />

) ( 1−<br />

)<br />

ˆ ˆ ˆ ˆ<br />

pˆ<br />

−1.96 p p ≤ p≤ pˆ<br />

+ 1.96<br />

p p<br />

n<br />

n<br />

of 0.3321< p < 0.4679 (vergelijk met <strong>het</strong> exacte interval)<br />

Algeme<strong>en</strong> :<br />

E<strong>en</strong> b<strong>en</strong>ader<strong>en</strong>d betrouwbaarheidsinterval met betrouwbaarheidsniveau 1−<br />

α ,voor e<strong>en</strong><br />

populatieproportie p, wordt gegev<strong>en</strong> door<br />

steekproefproportie is.<br />

( 1−<br />

pˆ)<br />

pˆ<br />

pˆ<br />

± zα<br />

/2<br />

⋅ , waarbij ˆp e<strong>en</strong><br />

n<br />

De TI-84 Plus levert <strong>het</strong> betrouwbaarheidsinterval met STAT A: 1-PropZInterval ;<br />

vul de gegev<strong>en</strong>s in, ga met de cursor naar Calculate <strong>en</strong> druk ENTER:<br />

Opmerking<br />

Bov<strong>en</strong>staande werkwijze (a) of (b) mog<strong>en</strong> we niet gebruik<strong>en</strong> bij e<strong>en</strong> kleine steekproef,<br />

bijvoorbeeld n = 5, aangezi<strong>en</strong> de c<strong>en</strong>trale limietstelling dan niet <strong>van</strong> toepassing is; de<br />

steekproefproportie X<br />

P = is dan niet normaal verdeeld.<br />

n<br />

17


Opgave<br />

Van 20000 Belg<strong>en</strong> onderzoekt m<strong>en</strong> de bloedgroep met als resultaat:<br />

Bloedgroep A B AB O<br />

% 43.2 14.2 6 36.6<br />

a) Bepaal betrouwbaarheidsintervall<strong>en</strong> voor de proportie p der Belg<strong>en</strong> met bloedgroep O,<br />

met betrouwbaarheidsniveau’s 80% , 95% , 99% .<br />

b) Hoe groot moet e<strong>en</strong> (aselecte) steekproef zijn, om de proportie p der Belg<strong>en</strong> met<br />

bloedgroep O tot op 0.01 nauwkeurig te k<strong>en</strong>n<strong>en</strong> met 95% zekerheid?<br />

Oplossing<br />

a)<br />

Met 99% zekerheid kunn<strong>en</strong> we dus zegg<strong>en</strong> dat de ongek<strong>en</strong>de proportie p geleg<strong>en</strong> is<br />

tuss<strong>en</strong> 35.7% <strong>en</strong> 37.5% !<br />

18


( )<br />

b) Er moet geld<strong>en</strong> dat 1.96⋅ p 1−<br />

p<br />

n<br />

≤ 0.01 of n≥38416⋅p( 1− p)<br />

(1)<br />

We k<strong>en</strong>n<strong>en</strong> p niet maar<br />

2 2<br />

⎛<br />

2 ⎛ 1⎞ 1⎞<br />

1 ⎛ 1⎞<br />

p( 1 − p)<br />

=−( p − p)<br />

=− p− − = − p−<br />

⎜⎜ ⎟ 2 4⎟<br />

⎜ ⎟<br />

⎝⎝ ⎠ ⎠ 4 ⎝ 2⎠<br />

zodat<br />

1<br />

1<br />

p( 1− p)<br />

≤ (gelijkheid treedt op als p = ).<br />

4<br />

2<br />

Bijgevolg is p( p)<br />

38416 1− ≤ 9604<br />

zodat e<strong>en</strong> steekproefgrootte n = 9604 zeker volstaat.<br />

Schatt<strong>en</strong> we echter in (1) p met p ˆ = 0.366 dan vind<strong>en</strong> we<br />

n ≥38416⋅0.366⋅<br />

0.634<br />

of n ≥38416⋅<br />

0.232044<br />

of n ≥ 8914.2<br />

n = volstaat (de besparing is gering aangezi<strong>en</strong> pˆ( 1 pˆ)<br />

zodat 8915<br />

geleg<strong>en</strong> is).<br />

− dicht bij 1/4<br />

5 De normale verdeling met de TI-84 Plus: e<strong>en</strong> overzicht<br />

De commando's i.v.m. normale verdeling<strong>en</strong> op e<strong>en</strong> TI-84 (Plus) zijn terug te vind<strong>en</strong> onder<br />

a) 2nd [DISTR] 1: normalpdf(<br />

2nd [DISTR] 2: normalcdf(<br />

2nd [DISTR] 3: invNorm(<br />

b) 2nd [DISTR] 1: SchadeNorm(<br />

c) MATH 6: randNorm(<br />

Vooraf merk<strong>en</strong> we algeme<strong>en</strong> op dat de commando’s onder (a) <strong>en</strong> (b) eindig<strong>en</strong> met <strong>het</strong><br />

opgev<strong>en</strong> <strong>van</strong> de parameters µ <strong>en</strong> σ . Deze parameters mag je ook weglat<strong>en</strong> voor de standaard<br />

normale verdeling.<br />

19


5.1 normalpdf<br />

normalpdf is de dichtheidsfunctie <strong>van</strong> e<strong>en</strong> normale verdeling. De syntax voor de<br />

functiewaarde in <strong>het</strong> punt x is normalpdf(x , µ , σ ) .<br />

Om de grafiek te tek<strong>en</strong><strong>en</strong> <strong>van</strong> de normale verdeling met gemiddelde 15 <strong>en</strong> standaardafwijking<br />

2 bepaal je eerst e<strong>en</strong> geschikt v<strong>en</strong>ster met WINDOW : nag<strong>en</strong>oeg alle data bevind<strong>en</strong> zich in <strong>het</strong><br />

µ − 3 σ , µ + 3σ<br />

= 15 −3⋅ 2,15 + 3⋅ 2 = 9, 21 <strong>en</strong> de maximale functiewaarde is<br />

interval [ ] [ ] [ ]<br />

normalpdf ( µ , µ , σ ) = normalpdf (3 ,3 , 2)<br />

5.2 normalcdf<br />

Met normalcdf berek<strong>en</strong> je de proportie <strong>van</strong> de data geleg<strong>en</strong> in e<strong>en</strong> interval , de syntax is<br />

normalcdf (ondergr<strong>en</strong>s , bov<strong>en</strong>gr<strong>en</strong>s , µ , σ ) .<br />

99<br />

I.p.v. +∞ neem je 10 ^ 99 = 10 , i.p.v. −∞ neem je − 10 ^ 99 .<br />

Zo levert normalcdf( − 10 ^ 99 , x , µ , σ ) de verdelingsfunctie <strong>van</strong> de normale verdeling,<br />

d.i. de proportie <strong>van</strong> de data kleiner dan of gelijk aan x , of de oppervlakte onder de normale<br />

verdeling links <strong>van</strong> x.<br />

5.3 invNorm<br />

invNorm is de inverse functie <strong>van</strong> de verdelingsfunctie , de syntax is invNorm (y, µ , σ ) .<br />

Voor e<strong>en</strong> gegev<strong>en</strong> getal y tuss<strong>en</strong> 0 <strong>en</strong> 1 berek<strong>en</strong> je hiermee de gr<strong>en</strong>s x waarvoor de<br />

oppervlakte onder de normale verdeling links <strong>van</strong> x gelijk is aan y . Hiermee bepaal je o.a. de<br />

kwartiel<strong>en</strong> <strong>van</strong> e<strong>en</strong> normale verdeling.<br />

20


5.4 ShadeNorm<br />

Met ShadeNorm doe je <strong>het</strong>zelfde als normalcdf , bov<strong>en</strong>di<strong>en</strong> wordt de normale verdeling<br />

getek<strong>en</strong>d <strong>en</strong> de berek<strong>en</strong>de oppervlakte gearceerd. Je moet dus eerst de geschikte<br />

v<strong>en</strong>stergr<strong>en</strong>z<strong>en</strong> met WINDOW instell<strong>en</strong> <strong>en</strong> met Y= de eerder gedefinieerde functies uitzett<strong>en</strong>.<br />

De syntax is ShadeNorm (ondergr<strong>en</strong>s , bov<strong>en</strong>gr<strong>en</strong>s , µ , σ ) . De opdracht wordt gegev<strong>en</strong> in<br />

<strong>het</strong> basisscherm <strong>en</strong> dus pas uitgevoerd na <strong>het</strong> drukk<strong>en</strong> op ENTER.<br />

5.5 randNorm<br />

Met randNorm( µ , σ ) kun je simulaties uitvoer<strong>en</strong> <strong>van</strong> lukrake trekking<strong>en</strong> uit e<strong>en</strong> normaal<br />

verdeelde populatie met gemiddelde µ <strong>en</strong> standaardafwijking σ .<br />

Je vindt <strong>het</strong> commando onder MATH 6: randNorm(<br />

E<strong>en</strong> steekproef met grootte n uit e<strong>en</strong> normaal verdeelde populatie met gemiddelde µ <strong>en</strong><br />

standaardafwijking σ wordt als e<strong>en</strong> lijst <strong>van</strong> data geg<strong>en</strong>ereerd met randNorm ( µσ , ,n)<br />

.<br />

21


Het test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong><br />

1 Inleiding<br />

E<strong>en</strong> eerste k<strong>en</strong>nismaking met de basisprincipes <strong>van</strong> hypothesetest<strong>en</strong> gebeurt best met e<strong>en</strong><br />

e<strong>en</strong>voudig voorbeeld, waarbij mete<strong>en</strong> de context <strong>van</strong> <strong>het</strong> toepassingsgebied <strong>het</strong> uitgangspunt<br />

is: <strong>het</strong> bestaan <strong>van</strong> e<strong>en</strong> onderzoeksvraag, waarop e<strong>en</strong> antwoord moet word<strong>en</strong> geformuleerd.<br />

Met dit voorbeeld kan de stud<strong>en</strong>t stapsgewijs k<strong>en</strong>nismak<strong>en</strong> met de vele nieuwe begripp<strong>en</strong><br />

zoals statistische hypothes<strong>en</strong>, p-waarde, <strong>het</strong> significanti<strong>en</strong>iveau α , type I <strong>en</strong> type II fout,<br />

tweezijdig of e<strong>en</strong>zijdig test<strong>en</strong>, <strong>het</strong> al dan niet significant zijn <strong>van</strong> de steekproefdata, …<br />

De hele procedure <strong>van</strong> <strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong> komt hiermee aan bod als e<strong>en</strong> natuurlijk<br />

d<strong>en</strong>kproces, in plaats <strong>van</strong> e<strong>en</strong> opsomming <strong>van</strong> uit te voer<strong>en</strong> stapp<strong>en</strong> <strong>en</strong> te berek<strong>en</strong><strong>en</strong> formules.<br />

De volg<strong>en</strong>de k<strong>en</strong>nismaking gebruikt <strong>en</strong>kel de binomiale verdeling als vereiste voork<strong>en</strong>nis <strong>en</strong><br />

wordt aangebod<strong>en</strong> als e<strong>en</strong> werktekst. De antwoord<strong>en</strong> bij die tekst vind je aansluit<strong>en</strong>d op<br />

pagina 28. Paragraaf 5 toont e<strong>en</strong> overzicht <strong>van</strong> de TI-84 Plus commando’s voor de binomiale<br />

verdeling.<br />

2 K<strong>en</strong>nismaking: E<strong>en</strong>d<strong>en</strong> met voorkeur voor gro<strong>en</strong>?<br />

I De onderzoeksvraag<br />

E<strong>en</strong> stud<strong>en</strong>t biologie heeft als opdracht e<strong>en</strong> antwoord te vind<strong>en</strong> op de volg<strong>en</strong>de<br />

onderzoeksvraag:<br />

Bij e<strong>en</strong> bepaalde e<strong>en</strong>d<strong>en</strong>soort (de slobe<strong>en</strong>d , zie http://users.tel<strong>en</strong>et.be/subv/ ) hebb<strong>en</strong> de<br />

mannetjes e<strong>en</strong> mooie glanz<strong>en</strong>d gro<strong>en</strong>e kop, met als doel de vrouwtjes aan te trekk<strong>en</strong>. De vraag<br />

is of de vrouwtjese<strong>en</strong>d<strong>en</strong> ook aangetrokk<strong>en</strong> word<strong>en</strong> tot e<strong>en</strong> gro<strong>en</strong>e kleur in hun voedsel,<br />

bijvoorbeeld brood?<br />

II Statistische hypothes<strong>en</strong><br />

De onderzoeksvraag kan word<strong>en</strong> vertaald in de confrontatie <strong>van</strong> twee ideeën:<br />

1 ) vrouwtjese<strong>en</strong>d<strong>en</strong> zijn onverschillig voor gro<strong>en</strong> of gewoon brood<br />

of<br />

2) vrouwtjese<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> gro<strong>en</strong> brood bov<strong>en</strong> gewoon brood<br />

Als e<strong>en</strong> vrouwtjese<strong>en</strong>d <strong>van</strong> die e<strong>en</strong>d<strong>en</strong>soort geconfronteerd wordt met twee stukjes brood<br />

(gewoon <strong>en</strong> gro<strong>en</strong>) , dan noter<strong>en</strong> we de kans op de keuze <strong>van</strong> <strong>het</strong> gro<strong>en</strong>e brood met p.<br />

De ideeën word<strong>en</strong> dan kort:<br />

1) p = _________<br />

2) p > _________<br />

22


Deze confronter<strong>en</strong>de ideeën of uitsprak<strong>en</strong> noem<strong>en</strong> we statistische hypothes<strong>en</strong> , de eerste<br />

hypothese stelt dat de e<strong>en</strong>d<strong>en</strong> ev<strong>en</strong> graag gewoon als gro<strong>en</strong> brood et<strong>en</strong>. Dit noem<strong>en</strong> we de<br />

nulhypothese, voorgesteld door H<br />

0<br />

, aangezi<strong>en</strong> dit <strong>het</strong> idee verteg<strong>en</strong>woordigt dat er ge<strong>en</strong><br />

verschil is (Engelse term: ‘null-change’ ). Het tweede idee drukt wel degelijk e<strong>en</strong> verschil uit:<br />

de e<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> gro<strong>en</strong> brood i.p.v. gewoon brood. Daarom wordt dit de alternatieve<br />

hypothese g<strong>en</strong>oemd <strong>en</strong> g<strong>en</strong>oteerd met H<br />

1<br />

.<br />

We verkrijg<strong>en</strong> dus de volg<strong>en</strong>de hypothes<strong>en</strong>:<br />

H<br />

0<br />

: p = 1/2<br />

H : p > 1/2<br />

1<br />

De red<strong>en</strong> waarom we hier de alternatieve hypothese H<br />

1<br />

formuler<strong>en</strong> als p > 1/2 (éénzijdige<br />

test) <strong>en</strong> niet p ≠ 1/2 (tweezijdige test) is omdat de onderzoeksvraag <strong>en</strong>kel vraagt om na te<br />

gaan of de e<strong>en</strong>d<strong>en</strong> gro<strong>en</strong> brood verkiez<strong>en</strong> i.p.v. gewoon brood. M<strong>en</strong> gaat er dus a priori <strong>van</strong> uit<br />

dat de e<strong>en</strong>d<strong>en</strong> zeker ge<strong>en</strong> voorkeur hebb<strong>en</strong> voor <strong>het</strong> gewone brood.<br />

Uiteindelijk moet<strong>en</strong> we besliss<strong>en</strong> welke <strong>van</strong> de twee hypothes<strong>en</strong> voor ons de voorkeur krijgt;<br />

we moet<strong>en</strong> “kiez<strong>en</strong>” voor H<br />

0<br />

of H<br />

1<br />

, we zegg<strong>en</strong> dat we H<br />

0<br />

test<strong>en</strong> versus H<br />

1<br />

.<br />

Er zijn twee mogelijkhed<strong>en</strong> (let op de werkwoordkeuze bij de hypothes<strong>en</strong>):<br />

1) We verwerp<strong>en</strong> H<br />

0<br />

(we aanvaard<strong>en</strong> H<br />

1<br />

)<br />

of<br />

2) We verwerp<strong>en</strong> H<br />

0<br />

niet (we aanvaard<strong>en</strong> H<br />

1<br />

niet)<br />

De beslissing wordt meestal geformuleerd in term<strong>en</strong> <strong>van</strong> H 0<br />

: we verwerp<strong>en</strong> H 0<br />

of we<br />

verwerp<strong>en</strong> H<br />

0<br />

niet.<br />

III Bewijsmateriaal verzamel<strong>en</strong> om te kunn<strong>en</strong> besliss<strong>en</strong><br />

De stud<strong>en</strong>t ontwerpt e<strong>en</strong> experim<strong>en</strong>t om tot e<strong>en</strong> beslissing te kom<strong>en</strong>: zal hij H<br />

0<br />

verwerp<strong>en</strong> of<br />

niet verwerp<strong>en</strong>?<br />

Hij gaat naar e<strong>en</strong> meer in de omgeving <strong>van</strong> de campus, waar slobe<strong>en</strong>d<strong>en</strong> in grote aantall<strong>en</strong><br />

aanwezig zijn, <strong>en</strong> kiest lukraak 10 vrouwtjese<strong>en</strong>d<strong>en</strong>. Elke e<strong>en</strong>d krijgt twee stukk<strong>en</strong> brood<br />

aangebod<strong>en</strong>: e<strong>en</strong> gewoon stuk <strong>en</strong> e<strong>en</strong> stuk met e<strong>en</strong> gro<strong>en</strong> laagje verf. Hij vat <strong>het</strong> resultaat<br />

sam<strong>en</strong> in e<strong>en</strong> rapport waarin hij <strong>het</strong> aantal e<strong>en</strong>d<strong>en</strong> vermeldt die eerst naar <strong>het</strong> gro<strong>en</strong>e brood<br />

zwemm<strong>en</strong>.<br />

D<strong>en</strong>k na over de toevalsvariabele X = <strong>het</strong> aantal e<strong>en</strong>d<strong>en</strong> in de steekproef die gro<strong>en</strong> brood<br />

verkiez<strong>en</strong>. De steekproefgrootte is hier gelijk aan 10 n = .<br />

Als de e<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong> brood, wat is dan de verdeling <strong>van</strong> de<br />

variabele X ?<br />

________________________________<br />

23


IV De weg naar de beslissing<br />

Als de vrouwtjese<strong>en</strong>d<strong>en</strong> echt onverschillig zijn t.o.v. gro<strong>en</strong> of gewoon brood, hoeveel <strong>van</strong> de<br />

10 e<strong>en</strong>d<strong>en</strong> verwacht je dan die eerst naar <strong>het</strong> gro<strong>en</strong>e brood zwemm<strong>en</strong>? ________________<br />

Natuurlijk zal dit resultaat in werkelijkheid niet steeds hieraan gelijk zijn, ook al is de<br />

nulhypothese juist, omwille <strong>van</strong> de mogelijke variaties in de steekproev<strong>en</strong> te wijt<strong>en</strong> aan <strong>het</strong><br />

toeval.<br />

De stud<strong>en</strong>t biologie stelt vast dat 9 <strong>van</strong> de 10 e<strong>en</strong>d<strong>en</strong> in zijn steekproef <strong>het</strong> gro<strong>en</strong>e brood<br />

verkiez<strong>en</strong>. Stel dat de populatie <strong>van</strong> alle slobe<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong><br />

brood (stel dat H<br />

0<br />

waar is), wat is dan de kans om in e<strong>en</strong> steekproef <strong>van</strong> 10 e<strong>en</strong>d<strong>en</strong> er 9 aan te<br />

treff<strong>en</strong> die eerst <strong>het</strong> gro<strong>en</strong>e brood oppikk<strong>en</strong>? __________________________<br />

Neg<strong>en</strong> <strong>van</strong> de ti<strong>en</strong> lijkt erop te wijz<strong>en</strong> dat de e<strong>en</strong>d<strong>en</strong>populatie eerder <strong>het</strong> gro<strong>en</strong>e brood verkiest<br />

dan gewoon brood. Als er meer dan 9 e<strong>en</strong>d<strong>en</strong> <strong>het</strong> gro<strong>en</strong>e brood zoud<strong>en</strong> kiez<strong>en</strong>, dan zou dit<br />

nog meer wijz<strong>en</strong> op e<strong>en</strong> situatie verschill<strong>en</strong>d <strong>van</strong> de nulhypothese! Daarom zijn we<br />

geïnteresseerd in de kans dat er 9 (<strong>het</strong> geobserveerde aantal in de steekproef <strong>van</strong> de stud<strong>en</strong>t)<br />

of meer (nog overtuig<strong>en</strong>der wijz<strong>en</strong>d in de richting <strong>van</strong> de alternatieve hypothese)<br />

vrouwtjese<strong>en</strong>d<strong>en</strong> eerst <strong>het</strong> gro<strong>en</strong>e brood gaan kiez<strong>en</strong>. We will<strong>en</strong> dus de kans k<strong>en</strong>n<strong>en</strong> op e<strong>en</strong><br />

resultaat dat minst<strong>en</strong>s ev<strong>en</strong> groot is als <strong>het</strong> steekproefresultaat, in de veronderstelling dat de<br />

nulhypothese waar is. Berek<strong>en</strong> deze kans P( X ≥ 9)<br />

:<br />

_______________________________________________<br />

Deze kans om e<strong>en</strong> resultaat te verkrijg<strong>en</strong> gelijk aan <strong>het</strong> steekproefresultaat of nog extremer<br />

(wijz<strong>en</strong>d in de richting <strong>van</strong> de alternatieve hypothese) noem<strong>en</strong> we de ‘p-waarde’ of<br />

overschrijdingskans.<br />

Vind je deze p-waarde klein of groot? ______________________<br />

Geloof je dat de nulhypothese H<br />

0<br />

waar is, rek<strong>en</strong>ing houd<strong>en</strong>d met deze p-waarde? (omcirkel<br />

je antwoord).<br />

Ja<br />

Ne<strong>en</strong><br />

Welke hypothese krijgt dus je voorkeur, H<br />

0<br />

of H<br />

1<br />

? ________________<br />

Verwerp je H<br />

0<br />

of verwerp je H<br />

0<br />

niet? _____________________<br />

Formuleer je antwoord op de onderzoeksvraag:<br />

_____________________________________________________________________<br />

_____________________________________________________________________<br />

24


V Sam<strong>en</strong>vatting <strong>van</strong> <strong>het</strong> d<strong>en</strong>kproces<br />

Herlees de stapp<strong>en</strong> I tot IV , onze red<strong>en</strong>ering om tot e<strong>en</strong> beslissing te kom<strong>en</strong> kunn<strong>en</strong> we als<br />

volgt sam<strong>en</strong>vatt<strong>en</strong>:<br />

(a) Formuleer de onderzoeksvraag. (Verkiez<strong>en</strong> vrouwtjes slobe<strong>en</strong>d<strong>en</strong> gro<strong>en</strong> brood bov<strong>en</strong><br />

gewoon brood? )<br />

(b) Bepaal e<strong>en</strong> grootheid waar <strong>het</strong> onderzoek eig<strong>en</strong>lijk over gaat <strong>en</strong> waar<strong>van</strong> we de<br />

waarde niet k<strong>en</strong>n<strong>en</strong>. In dit voorbeeld is die grootheid de proportie <strong>van</strong> de<br />

vrouwtjese<strong>en</strong>d<strong>en</strong> die <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong> of de kans p dat e<strong>en</strong> lukraak<br />

gekoz<strong>en</strong> vrouwtjese<strong>en</strong>d <strong>het</strong> gro<strong>en</strong>e brood kiest. In <strong>het</strong> algeme<strong>en</strong> wordt die grootheid<br />

e<strong>en</strong> parameter g<strong>en</strong>oemd.<br />

(c) Schrijf de twee confronter<strong>en</strong>de statistische hypothes<strong>en</strong> in term<strong>en</strong> <strong>van</strong> de parameter<br />

waar <strong>het</strong> om gaat.<br />

In <strong>het</strong> voorbeeld zijn de statistische hypothes<strong>en</strong> H<br />

0<br />

: p = 1/2 <strong>en</strong> H<br />

1<br />

: p > 1/2.<br />

(d) Verzamel steekproefdata <strong>en</strong> berek<strong>en</strong> de verkreg<strong>en</strong> waarde <strong>van</strong> de teststatistiek (d.i.<br />

e<strong>en</strong> concreet getal verkreg<strong>en</strong> m.b.v. de steekproefgegev<strong>en</strong>s, in dit geval <strong>het</strong> aantal<br />

e<strong>en</strong>d<strong>en</strong> (9 op 10) die gro<strong>en</strong> brood verkiez<strong>en</strong>. De teststatistiek of testvariabele zelf is<br />

e<strong>en</strong> toevalsvariabele (<strong>het</strong> aantal e<strong>en</strong>d<strong>en</strong> X die <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong>) waar<strong>van</strong><br />

we de concrete waarde x = 9 hebb<strong>en</strong> geobserveerd.<br />

(e) Berek<strong>en</strong> de p-waarde, d.i. de kans dat we <strong>het</strong> resultaat <strong>van</strong> de steekproef verkrijg<strong>en</strong> of<br />

e<strong>en</strong> nog extremer resultaat (wijz<strong>en</strong>d in de richting <strong>van</strong> de alternatieve hypothese), in<br />

de veronderstelling dat de nulhypothese waar is.<br />

(f) Beslis of de p-waarde klein of groot is. In ons voorbeeld gaf de kleine p-waarde<br />

aanleiding tot <strong>het</strong> verwerp<strong>en</strong> <strong>van</strong> de nulhypothese.<br />

Deze red<strong>en</strong>eervorm wordt “test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong>” g<strong>en</strong>oemd. De red<strong>en</strong>eervorm kan word<strong>en</strong><br />

toegepast in verschill<strong>en</strong>de situaties waarin e<strong>en</strong> onderzoeksvraag over e<strong>en</strong> populatie wordt<br />

gesteld <strong>en</strong> steekproefdata word<strong>en</strong> verzameld om e<strong>en</strong> antwoord te kunn<strong>en</strong> gev<strong>en</strong> op de vraag.<br />

Het is duidelijk dat (f) e<strong>en</strong> delicaat punt is dat nog meer aandacht verdi<strong>en</strong>t, welke p-waarde<br />

kunn<strong>en</strong> we immers als “klein” beschouw<strong>en</strong>? Dit besprek<strong>en</strong> we in de volg<strong>en</strong>de paragraaf.<br />

VI Op hoeveel verschill<strong>en</strong>de manier<strong>en</strong> kunn<strong>en</strong> we e<strong>en</strong> verkeerde beslissing nem<strong>en</strong>?<br />

Bij <strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong> moet<strong>en</strong> we H<br />

0<br />

of H<br />

1<br />

selecter<strong>en</strong>. Natuurlijk nem<strong>en</strong> we graag<br />

de correcte beslissing, maar soms kunn<strong>en</strong> we ook e<strong>en</strong> foute beslissing nem<strong>en</strong>. Hoe zou je in<br />

woord<strong>en</strong> de volg<strong>en</strong>de situaties kunn<strong>en</strong> omschrijv<strong>en</strong>? Formuleer dit in term<strong>en</strong> <strong>van</strong> wat de<br />

e<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> <strong>en</strong> wat wij bewer<strong>en</strong> dat ze verkiez<strong>en</strong>.<br />

(1) We verwerp<strong>en</strong> de nulhypothese H<br />

0<br />

, terwijl H<br />

0<br />

in werkelijkheid waar is.<br />

__________________________________________________________<br />

__________________________________________________________<br />

(2) We verwerp<strong>en</strong> de nulhypothese H<br />

0<br />

niet, terwijl H<br />

0<br />

in werkelijkheid niet waar is.<br />

____________________________________________________________<br />

____________________________________________________________<br />

25


(1) noemt m<strong>en</strong> e<strong>en</strong> type I fout (onterecht H<br />

0<br />

verwerp<strong>en</strong>).<br />

(2) noemt m<strong>en</strong> e<strong>en</strong> type II fout (onterecht H<br />

0<br />

niet verwerp<strong>en</strong>).<br />

De volg<strong>en</strong>de tabel geeft e<strong>en</strong> overzicht <strong>van</strong> de mogelijke situaties:<br />

je verwerpt H<br />

0<br />

je verwerpt H<br />

0<br />

niet<br />

H<br />

0<br />

is waar Type I fout juiste beslissing<br />

H is niet waar juiste beslissing Type II fout<br />

0<br />

Natuurlijk w<strong>en</strong>s<strong>en</strong> we de kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> fout zeer klein te houd<strong>en</strong>.<br />

Onze aandacht gaat vooral uit naar <strong>het</strong> klein houd<strong>en</strong> <strong>van</strong> de kans op e<strong>en</strong> type I fout, omdat de<br />

nulhypothese e<strong>en</strong> ‘status quo’ of neutrale situatie inhoudt, e<strong>en</strong> traditionele situatie.<br />

Als we de nulhypothese verwerp<strong>en</strong>, dan zegg<strong>en</strong> we dat iets beter is of verkoz<strong>en</strong> wordt, of<br />

slechter, of verschill<strong>en</strong>d, afhankelijk <strong>van</strong> hoe de alternatieve hypothese geformuleerd is. Als<br />

bijvoorbeeld twee medicam<strong>en</strong>t<strong>en</strong> word<strong>en</strong> vergelek<strong>en</strong> in e<strong>en</strong> onderzoek, dan zou e<strong>en</strong> type I<br />

fout bewer<strong>en</strong> dat e<strong>en</strong> medicam<strong>en</strong>t beter is terwijl de medicam<strong>en</strong>t<strong>en</strong> in werkelijkheid<br />

gelijkaardige effect<strong>en</strong> hebb<strong>en</strong>. De nulhypothese is de ‘klassieke’ of ‘traditionele hypothese’<br />

<strong>en</strong> e<strong>en</strong> type I fout (<strong>het</strong> t<strong>en</strong> onrechte verwerp<strong>en</strong> <strong>van</strong> deze klassieke hypothese) beschouwt m<strong>en</strong><br />

dan erger dan e<strong>en</strong> type II fout (<strong>het</strong> t<strong>en</strong> onrechte niet verwerp<strong>en</strong> <strong>van</strong> de klassieke hypothese).<br />

De kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type I fout wordt <strong>het</strong> significanti<strong>en</strong>iveau g<strong>en</strong>oemd <strong>en</strong><br />

g<strong>en</strong>oteerd met α . We w<strong>en</strong>s<strong>en</strong> die kans α onder controle te hebb<strong>en</strong>, de keuze <strong>van</strong> α wordt<br />

mee bepaald door <strong>het</strong> belang <strong>en</strong> <strong>het</strong> gevolg <strong>van</strong> onze beslissing (cfr. e<strong>en</strong> rechtszaak: is de<br />

beschuldigde schuldig of niet? )<br />

Stel dat je op voorhand beslist de nulhypothese te verwerp<strong>en</strong> <strong>van</strong> zodra er minst<strong>en</strong>s 8 e<strong>en</strong>d<strong>en</strong><br />

<strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong>, wat is dan de kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type I fout?<br />

Of, anders geformuleerd, wat is de kans dat er minst<strong>en</strong>s 8 e<strong>en</strong>d<strong>en</strong> <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong><br />

als H<br />

0<br />

waar is?<br />

( 8)<br />

α = P X ≥ = ______________________<br />

Het is belangrijk dat de kans op e<strong>en</strong> type I fout op voorhand wordt vastgelegd, bij <strong>het</strong> begin<br />

<strong>van</strong> de studie, vooraleer de data word<strong>en</strong> verzameld <strong>en</strong> de teststatistiek wordt waarg<strong>en</strong>om<strong>en</strong>.<br />

E<strong>en</strong> keuze achteraf zou betek<strong>en</strong><strong>en</strong> dat je de beslissing ( H<br />

0<br />

verwerp<strong>en</strong> of niet) kunt aanpass<strong>en</strong><br />

zoals je zelf wil in plaats <strong>van</strong> te prober<strong>en</strong> om de waarheid te achterhal<strong>en</strong>.<br />

Voor welke p-waarde zull<strong>en</strong> we H<br />

0<br />

verwerp<strong>en</strong>, voor welke niet? Het significanti<strong>en</strong>iveau α<br />

geeft de gr<strong>en</strong>s aan. Duid in onderstaand interval [ 0,1 ] <strong>het</strong> gebied <strong>van</strong> p-waard<strong>en</strong> aan<br />

waarvoor H<br />

0<br />

wordt verworp<strong>en</strong> <strong>en</strong> <strong>het</strong> gebied <strong>van</strong> p-waard<strong>en</strong> waarvoor H 0<br />

niet wordt<br />

verworp<strong>en</strong>.<br />

• •<br />

0 α<br />

•<br />

1<br />

26


We verwerp<strong>en</strong> H 0<br />

als de p-waarde ________ α . In dit geval zegg<strong>en</strong> we dat de<br />

steekproefdata statistisch significant zijn (ze lever<strong>en</strong> <strong>het</strong> statistisch bewijs waarmee we de<br />

traditionele nulhypothese kunn<strong>en</strong> weerlegg<strong>en</strong>)<br />

We verwerp<strong>en</strong> H<br />

0<br />

niet als de p-waarde ________ α .<br />

D<strong>en</strong>k nu e<strong>en</strong>s na over <strong>het</strong> volg<strong>en</strong>de: als je overdrijft in je voorzichtigheid bij <strong>het</strong> vermijd<strong>en</strong><br />

<strong>van</strong> e<strong>en</strong> type I fout (door e<strong>en</strong> zeer kleine α te kiez<strong>en</strong>), welk effect heeft dit dan volg<strong>en</strong>s jou<br />

op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type II fout?<br />

_____________________________________________<br />

De kans op e<strong>en</strong> type II fout wordt β g<strong>en</strong>oemd. Om β onder controle te houd<strong>en</strong> mog<strong>en</strong> we α<br />

niet overdrev<strong>en</strong> klein mak<strong>en</strong>, t<strong>en</strong>zij we voldo<strong>en</strong>de bewijs (data) kunn<strong>en</strong> aanlever<strong>en</strong> om<br />

overtuig<strong>en</strong>d te kunn<strong>en</strong> besliss<strong>en</strong> (zie volg<strong>en</strong>de paragraaf).<br />

VII De invloed <strong>van</strong> de steekproefgrootte (optie 1)<br />

M<strong>en</strong> kiest vaak α = 5%,10% of 1% .<br />

Stud<strong>en</strong>t A werkt met 10 e<strong>en</strong>d<strong>en</strong>, stud<strong>en</strong>t B met 20 e<strong>en</strong>d<strong>en</strong>, stud<strong>en</strong>t C met 40 e<strong>en</strong>d<strong>en</strong>.<br />

Veronderstel dat de drie stud<strong>en</strong>t<strong>en</strong> de opdracht krijg<strong>en</strong> om te werk<strong>en</strong> met e<strong>en</strong><br />

significanti<strong>en</strong>iveau α ≃ 5% , zo dicht als mogelijk bij 5% (bij e<strong>en</strong> discrete testvariabele is<br />

α = 5% exact immers meestal niet mogelijk).<br />

Bepaal (met je rek<strong>en</strong>toestel) voor elk <strong>van</strong> de stud<strong>en</strong>t<strong>en</strong> <strong>het</strong> minimum aantal e<strong>en</strong>d<strong>en</strong> dat <strong>het</strong><br />

gro<strong>en</strong>e brood moet oppikk<strong>en</strong> om de nulhypothese H<br />

0<br />

te kunn<strong>en</strong> verwerp<strong>en</strong> (De p-waarde bij<br />

dit minimum is gelijk aan <strong>het</strong> significanti<strong>en</strong>iveau α ). Vul de volg<strong>en</strong>de tabel in, waarbij x <strong>het</strong><br />

aantal e<strong>en</strong>d<strong>en</strong> is dat eerst <strong>het</strong> gro<strong>en</strong>e brood oppikt.<br />

Stud<strong>en</strong>t n H<br />

0<br />

niet verwerp<strong>en</strong> als x ≤ H<br />

0<br />

verwerp<strong>en</strong> als x ≥<br />

A 10<br />

B 20<br />

C 40<br />

Veronderstel nu dat H<br />

0<br />

niet waar is; stel dat 80% <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong>populatie <strong>het</strong> gro<strong>en</strong>e<br />

brood verkiez<strong>en</strong>. Maak gebruik <strong>van</strong> de waard<strong>en</strong> <strong>van</strong> x die je in bov<strong>en</strong>staande tabel hebt<br />

g<strong>en</strong>oteerd <strong>en</strong> werk met je rek<strong>en</strong>toestel.<br />

Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.8 )<br />

A 10<br />

B 20<br />

C 40<br />

Schrijf e<strong>en</strong> kort verslag over de invloed <strong>van</strong> de steekproefgrootte op β .<br />

27


VIII Werd de nulhypothese terecht verworp<strong>en</strong>? (Optie 2)<br />

Het onderscheidingsvermog<strong>en</strong> 1− β <strong>van</strong> e<strong>en</strong> test (Engels: power ) geeft aan hoe goed de test<br />

in staat is om de nulhypothese terecht te verwerp<strong>en</strong> (de alternatieve hypothese is inderdaad<br />

waar). Bespreek, met de resultat<strong>en</strong> <strong>van</strong> voorgaande paragraaf, de invloed <strong>van</strong> de<br />

steekproefgrootte op <strong>het</strong> onderscheidingsvermog<strong>en</strong>.<br />

H<br />

0<br />

is waar<br />

H<br />

0<br />

is niet waar<br />

je verwerpt H<br />

0<br />

je verwerpt H<br />

0<br />

niet<br />

Type I fout<br />

juiste beslissing<br />

kans α =<br />

kans 1− α =<br />

significanti<strong>en</strong>iveau<br />

juiste beslissing<br />

kans 1− β =<br />

onderscheidingsvermog<strong>en</strong><br />

betrouwbaarheidsniveau<br />

Type II fout<br />

Kans β<br />

Veronderstel nu dat H<br />

0<br />

niet waar is, maar dat slechts 70% <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong>populatie <strong>het</strong><br />

gro<strong>en</strong>e brood verkiez<strong>en</strong>. Bepaal opnieuw de kans β op e<strong>en</strong> type II fout <strong>en</strong> <strong>het</strong><br />

onderscheidingsvermog<strong>en</strong> 1− β ? Vergelijk dit met de situatie p = 0.8<br />

Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.7 )<br />

A 10<br />

B 20<br />

C 40<br />

----------------------------------------------------------------------------------------------------------------<br />

We hebb<strong>en</strong> de basisbegripp<strong>en</strong> <strong>van</strong> hypothesetest<strong>en</strong> besprok<strong>en</strong>. Herlees nu de ope<strong>en</strong>volg<strong>en</strong>de<br />

stapp<strong>en</strong> (a) tot (f) in paragraaf V. Herinner je dat je vóór stap (d) e<strong>en</strong> significanti<strong>en</strong>iveau α<br />

moet vastlegg<strong>en</strong> waarmee je zal werk<strong>en</strong>. Herbekijk de nieuwe woord<strong>en</strong> (vetjes gedrukt) die<br />

werd<strong>en</strong> ingevoerd, begrijp je hun betek<strong>en</strong>is? De stapp<strong>en</strong> (a) tot (f), sam<strong>en</strong> met de<br />

vooropgestelde α , zull<strong>en</strong> nuttig zijn in andere situaties waarbij je e<strong>en</strong> antwoord moet zoek<strong>en</strong><br />

op e<strong>en</strong> onderzoeksvraag m.b.v. <strong>het</strong> uitvoer<strong>en</strong> <strong>van</strong> e<strong>en</strong> hypothesetest.<br />

28


Antwoord<strong>en</strong> bij de werktekst ( I tot VIII)<br />

II Statistische hypothes<strong>en</strong><br />

……..<br />

De ideeën word<strong>en</strong> dan kort:<br />

1) p = 1/2<br />

2) p > 1/2<br />

III Bewijsmateriaal verzamel<strong>en</strong> om te kunn<strong>en</strong> besliss<strong>en</strong><br />

……………..<br />

Als de e<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong> brood, wat is dan de verdeling <strong>van</strong> de<br />

variabele X ?<br />

X is binomiaal verdeeld met parameters n = 10 <strong>en</strong> 1/2 X ∼ B 10, 1/ 2<br />

IV De weg naar de beslissing<br />

p = : ( )<br />

Als de vrouwtjese<strong>en</strong>d<strong>en</strong> echt onverschillig zijn t.o.v. gro<strong>en</strong> of gewoon brood, hoeveel <strong>van</strong> de<br />

10 e<strong>en</strong>d<strong>en</strong> verwacht je dan die eerst naar <strong>het</strong> gro<strong>en</strong>e brood zwemm<strong>en</strong>?<br />

Vier of vijf of zes (ongeveer de helft). Het is natuurlijk maar e<strong>en</strong> steekproef dus <strong>het</strong><br />

hoeft niet exact vijf te zijn. Neg<strong>en</strong> of ti<strong>en</strong> verwacht<strong>en</strong> we zeker niet.<br />

……..<br />

Stel dat de populatie <strong>van</strong> alle slobe<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong> brood (stel<br />

dat H<br />

0<br />

waar is), wat is dan de kans om in e<strong>en</strong> steekproef <strong>van</strong> 10 e<strong>en</strong>d<strong>en</strong> er 9 aan te treff<strong>en</strong> die<br />

eerst <strong>het</strong> gro<strong>en</strong>e brood oppikk<strong>en</strong>?<br />

10 1<br />

9 1<br />

1 1<br />

10<br />

⎛ ⎞⎛ ⎞ ⎛ ⎞<br />

P( X = 9)<br />

= ⎜ 10 0.98%<br />

9<br />

⎟⎜ ⎟ ⎜ ⎟ = ⋅ <br />

⎝ ⎠⎝2⎠ ⎝2⎠<br />

2<br />

………We will<strong>en</strong> dus de kans k<strong>en</strong>n<strong>en</strong> op e<strong>en</strong> resultaat dat minst<strong>en</strong>s ev<strong>en</strong> groot is als <strong>het</strong><br />

steekproefresultaat, in de veronderstelling dat de nulhypothese waar is. Berek<strong>en</strong> deze kans<br />

10 1<br />

P( X ≥ 9) = P( X = 9) + P( X = 10) = + ≃ 1.07%<br />

10 10<br />

2 2<br />

……..<br />

Vind je deze p-waarde klein of groot? Deze kans is zeer klein<br />

Geloof je dat de nulhypothese H<br />

0<br />

waar is, rek<strong>en</strong>ing houd<strong>en</strong>d met deze p-waarde? (omcirkel<br />

je antwoord). Ne<strong>en</strong><br />

Welke hypothese krijgt dus je voorkeur, H<br />

0<br />

of H<br />

1<br />

? H<br />

1<br />

Verwerp je H<br />

0<br />

of verwerp je H<br />

0<br />

niet? Ik verwerp H<br />

0<br />

.<br />

Formuleer je antwoord op de onderzoeksvraag:<br />

De vrouwtjes slobe<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> gro<strong>en</strong> brood bov<strong>en</strong> gewoon brood.<br />

29


VI Op hoeveel verschill<strong>en</strong>de manier<strong>en</strong> kunn<strong>en</strong> we e<strong>en</strong> verkeerde beslissing nem<strong>en</strong>?<br />

……..<br />

(1) We verwerp<strong>en</strong> de nulhypothese H<br />

0<br />

, terwijl H<br />

0<br />

in werkelijkheid waar is.<br />

We bewer<strong>en</strong> dat de e<strong>en</strong>d<strong>en</strong> <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong> terwijl ze in werkelijkheid<br />

ge<strong>en</strong> voorkeur hebb<strong>en</strong> voor gro<strong>en</strong> of gewoon brood.<br />

(2) We verwerp<strong>en</strong> de nulhypothese H<br />

0<br />

niet, terwijl H<br />

0<br />

in werkelijkheid niet waar is.<br />

We bewer<strong>en</strong> dat de e<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gro<strong>en</strong> of gewoon brood, terwijl ze<br />

in werkelijkheid <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong>.<br />

……………….<br />

α = P X ≥ 8 = 1−P X ≤7 ≃ 5.5%<br />

…………..<br />

( ) ( )<br />

We verwerp<strong>en</strong> H<br />

0<br />

als de p-waarde<br />

We verwerp<strong>en</strong> H<br />

0<br />

niet als de p-waarde<br />

≤ α .<br />

> α .<br />

D<strong>en</strong>k nu e<strong>en</strong>s na over <strong>het</strong> volg<strong>en</strong>de: als je overdrijft in je voorzichtigheid bij <strong>het</strong> vermijd<strong>en</strong><br />

<strong>van</strong> e<strong>en</strong> type I fout (door e<strong>en</strong> zeer kleine α te kiez<strong>en</strong>), welk effect heeft dit dan volg<strong>en</strong>s jou<br />

op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type II fout?<br />

De kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type II fout wordt groter.<br />

VII De invloed <strong>van</strong> de steekproefgrootte (optie 1)<br />

Stud<strong>en</strong>t n H<br />

0<br />

niet verwerp<strong>en</strong> als x ≤ H<br />

0<br />

verwerp<strong>en</strong> als x ≥<br />

A 10 7 8 ( α ≃ 5.5% )<br />

B 20 13 14 ( α ≃ 5.8% )<br />

C 40 25 26 ( α ≃ 4.0% )<br />

Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.8 )<br />

A 10 P( X ≤ 7)<br />

=binomcdf (10, 0.8, 7) ≃ 32.2%<br />

B 20 P( X ≤ 13)<br />

=binomcdf (20, 0.8, 13) ≃ 8.7%<br />

C 40 P( X ≤ 25)<br />

=binomcdf (40, 0.8, 25) ≃ 0.8%<br />

De kans β op e<strong>en</strong> type II fout wordt gevoelig kleiner met to<strong>en</strong>em<strong>en</strong>de<br />

steekproefgrootte n, terwijl <strong>het</strong> significanti<strong>en</strong>iveau α of de kans op e<strong>en</strong> type I fout<br />

(nag<strong>en</strong>oeg) constant blijft.<br />

VIII Werd de nulhypothese terecht verworp<strong>en</strong>? (Optie 2)<br />

…..<br />

Bespreek, met de resultat<strong>en</strong> <strong>van</strong> voorgaande paragraaf, de invloed <strong>van</strong> de steekproefgrootte<br />

op <strong>het</strong> onderscheidingsvermog<strong>en</strong>.<br />

Het onderscheidingsvermog<strong>en</strong> 1− β neemt toe met to<strong>en</strong>em<strong>en</strong>de steekproefgrootte n<br />

(bij constante α ).<br />

30


Veronderstel nu dat H<br />

0<br />

niet waar is, maar dat slechts 70% <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong>populatie <strong>het</strong><br />

gro<strong>en</strong>e brood verkiez<strong>en</strong>. Bepaal opnieuw de kans β op e<strong>en</strong> type II fout <strong>en</strong> <strong>het</strong><br />

onderscheidingsvermog<strong>en</strong> 1− β ? Vergelijk dit met de situatie p = 0.8<br />

Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.7 )<br />

A 10 P( X ≤ 7)<br />

=binomcdf (10,0.7, 7) ≃ 61.7%<br />

B 20 P( X ≤ 13)<br />

=binomcdf (20,0.7, 13) ≃ 39.2%<br />

C 40 P( X ≤ 25)<br />

=binomcdf (40,0.7, 25) ≃ 19.3%<br />

Het onderscheidingsvermog<strong>en</strong> 1− β neemt af (bij vaste n <strong>en</strong> α ) naarmate <strong>het</strong><br />

werkelijke perc<strong>en</strong>tage <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong> die kiez<strong>en</strong> voor <strong>het</strong> gro<strong>en</strong>e brood dichter bij<br />

0.5 geleg<strong>en</strong> is.<br />

3 B<strong>en</strong>ader<strong>en</strong>de test voor e<strong>en</strong> proportie bij e<strong>en</strong> grote steekproef<br />

We w<strong>en</strong>s<strong>en</strong> na te gaan of e<strong>en</strong> individu uit de populatie e<strong>en</strong> bepaalde eig<strong>en</strong>schap bezit.<br />

aantal individu<strong>en</strong> in de populatie met de eig<strong>en</strong>schap<br />

p = is de populatieproportie.<br />

aantal individu<strong>en</strong> in de populatie<br />

De steekproefproportie is de toevalsvariabele :<br />

ˆ X aantal individu<strong>en</strong> in de steekproef met de eig<strong>en</strong>schap<br />

P = =<br />

n<br />

aantal individu<strong>en</strong> in de steekproef<br />

Merk op dat ˆP e<strong>en</strong> onvertek<strong>en</strong>de schatter is <strong>van</strong> p want E ( Pˆ<br />

)<br />

= p.<br />

Voor n voldo<strong>en</strong>de groot is de variabele Z =<br />

Pˆ<br />

− p X −np<br />

=<br />

p(1 − p) np(1 − p)<br />

bij b<strong>en</strong>adering standaard<br />

n<br />

normaal verdeeld omwille <strong>van</strong> de c<strong>en</strong>trale limietstelling (zie ook pagina 16).<br />

Als vuistregel voor n voldo<strong>en</strong>de groot nem<strong>en</strong> we de voorwaard<strong>en</strong> :<br />

⎧ np ≥ 5<br />

⎨<br />

⎩ n(1 − p) ≥5<br />

Pˆ<br />

− p0<br />

Het uitvoer<strong>en</strong> <strong>van</strong> de hypothesetest H 0 : p = p 0 versus b.v. H 1 : p < p 0 met Z =<br />

p0(1 − p0)<br />

n<br />

als testvariabele kan met de TI-84 Plus via <strong>het</strong> commando STAT 5:1-PropZTest.<br />

31


Opgav<strong>en</strong>:<br />

1) E<strong>en</strong> krant<strong>en</strong>artikel beweert dat 40% <strong>van</strong> de bevolking (leeftijdsgroep ≥ 12 jaar) rookt. Je<br />

vermoedt dat dit niet klopt; e<strong>en</strong> steekproef <strong>van</strong> 100 person<strong>en</strong> ( ≥ 12 jaar) levert 52 rokers.<br />

Test H 0 : p =0.4 versus H 1 : p ≠ 0.4 (tweezijdige test) op <strong>het</strong> significanti<strong>en</strong>iveau α = 5% .<br />

a) Exact met <strong>het</strong> aantal rokers X als teststatistiek met e<strong>en</strong> binomiale verdeling.<br />

b) B<strong>en</strong>ader<strong>en</strong>d met X als teststatistiek met e<strong>en</strong> bij b<strong>en</strong>adering normale verdeling.<br />

Pˆ<br />

− p0<br />

c) B<strong>en</strong>ader<strong>en</strong>d met Z =<br />

p0(1 − p0)<br />

n<br />

als teststatistiek met e<strong>en</strong> standaard normale verdeling<br />

d) Los de onderzoeksvraag (spreekt <strong>het</strong> artikel de waarheid?) op m.b.v. e<strong>en</strong><br />

betrouwbaarheidsinterval met betrouwbaarheidsniveau 1− α = 95%<br />

2) E<strong>en</strong> toets bestaat uit 10 meerkeuzevrag<strong>en</strong> met elk 3 mogelijke antwoord<strong>en</strong> waar<strong>van</strong> er<br />

één juist is. E<strong>en</strong> juist antwoord levert 1 punt op, e<strong>en</strong> fout antwoord 0.<br />

E<strong>en</strong> stud<strong>en</strong>t haalt 8 op 10 op die toets <strong>en</strong> beweert gegokt te hebb<strong>en</strong>.<br />

Geloof je hem?<br />

Oplossing<strong>en</strong><br />

H waar is dan geldt X ∼ B( 100, 0.4)<br />

⋅P( X ≥ ) = ⋅ −P( X ≤ ) . Merk op dat we hierbij ( 52)<br />

Vraag 1) a) Als<br />

0<br />

( )<br />

. Als p-waarde vind<strong>en</strong> we<br />

2 52 2 1 51 2.0%<br />

P X ≥ verdubbel<strong>en</strong><br />

omdat <strong>het</strong> e<strong>en</strong> tweezijdige test betreft: kleine steekproefresultat<strong>en</strong> die minder dan 40% do<strong>en</strong><br />

vermoed<strong>en</strong> (met dezelfde kans als grote resultat<strong>en</strong> ≥ 52 die meer dan 40% do<strong>en</strong> vermoed<strong>en</strong> )<br />

mak<strong>en</strong> H<br />

0<br />

ev<strong>en</strong> verdacht. Aangezi<strong>en</strong> de p-waarde ≤ 5% is verwerp<strong>en</strong> we H<br />

0<br />

.<br />

b) Aangezi<strong>en</strong> X ∼ B( 100, 0.4)<br />

is E( X) n p 40<br />

Var ( X ) n p ( 1 p)<br />

100 0.4 0.6 24<br />

= ⋅ = <strong>en</strong><br />

= ⋅ ⋅ − = ⋅ ⋅ = ; omwille <strong>van</strong> de c<strong>en</strong>trale limietstelling geldt bij<br />

b<strong>en</strong>adering X N( 40, 24 )<br />

∼ .<br />

Als p-waarde vind<strong>en</strong> we met deze normale verdeling 2⋅P( X ≥52)<br />

≃ 1.4% .<br />

Met continuïteitscorrectie verkrijg<strong>en</strong> we e<strong>en</strong> betere p-waarde P( X )<br />

= 2⋅ ≥51.5 1.9%<br />

32


Pˆ<br />

− p0<br />

c) De teststatistiek Z =<br />

p0(1 − p0)<br />

n<br />

pˆ − p0<br />

0.52 − 0.4<br />

neemt de waarde z = = 2.449 aan voor onze steekproef .<br />

p0(1 − p0) 0.4 ⋅0.6<br />

n 100<br />

2⋅P Z ≥2.449 ≃ 1.4% .<br />

De p-waarde is ( )<br />

d) E<strong>en</strong> b<strong>en</strong>ader<strong>en</strong>d betrouwbaarheidsinterval met betrouwbaarheidsniveau 1−<br />

α , voor e<strong>en</strong><br />

populatieproportie p, wordt gegev<strong>en</strong> door<br />

steekproefproportie is (zie pagina 17).<br />

( 1−<br />

pˆ)<br />

pˆ<br />

pˆ<br />

± zα<br />

/2<br />

⋅ , waarbij ˆp e<strong>en</strong><br />

n<br />

We vind<strong>en</strong> e<strong>en</strong> 95% betrouwbaarheidsinterval dat <strong>het</strong> getal 0.4 niet bevat. Bijgevolg<br />

verwerp<strong>en</strong> we H<br />

0<br />

.<br />

Vraag 2)<br />

Zij X <strong>het</strong> aantal juiste antwoord<strong>en</strong>, stel p de kans om e<strong>en</strong> vraag juist te beantwoord<strong>en</strong> (we<br />

veronderstell<strong>en</strong> dat alle vrag<strong>en</strong> dezelfde moeilijkheidsgraad hebb<strong>en</strong>).<br />

We test<strong>en</strong> H : 1/3<br />

0<br />

p= (de stud<strong>en</strong>t heeft gegokt)<br />

versus H : 1/3<br />

1<br />

p> (de stud<strong>en</strong>t heeft gestudeerd <strong>en</strong> niet gegokt).<br />

Als H<br />

0<br />

waar is dan geldt X ∼ B( 10, 1/ 3)<br />

.<br />

De p-waarde is P( X ) P( X )<br />

≥ 8 = 1− ≤7 ≃ 0.3% , dit is zeer klein.<br />

We hebb<strong>en</strong> e<strong>en</strong> overtuig<strong>en</strong>d bewijs teg<strong>en</strong> H<br />

0<br />

<strong>en</strong> gelov<strong>en</strong> de stud<strong>en</strong>t niet…<br />

33


4 Test voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale verdeling met gek<strong>en</strong>de<br />

standaardafwijking<br />

E<strong>en</strong> gezaghebb<strong>en</strong>d tijdschrift publiceert dat <strong>het</strong> geboortegewicht in Vlaander<strong>en</strong> normaal<br />

verdeeld is met e<strong>en</strong> gemiddelde <strong>van</strong> 3.3 kg <strong>en</strong> e<strong>en</strong> standaardafwijking <strong>van</strong><br />

0.55 kg.<br />

E<strong>en</strong> gynaecoloog heeft de indruk dat <strong>het</strong> gemiddelde geboortegewicht in zijn kliniek groter is<br />

dan 3.3 kg. Om zijn hypothese te test<strong>en</strong> houdt hij gegev<strong>en</strong>s bij <strong>van</strong> dertig kinder<strong>en</strong>.<br />

de hieronder afgebeelde data (in kg) <strong>van</strong> de gynaecoloog plaats<strong>en</strong> we in de lijst L1.<br />

3.54 3.67 3.13 3.76 3.99 4.13 3.22 1.63 2.77 3.36<br />

3.49 3.22 3.04 3.76 3.86 3.58 4.08 3.58 3.22 3.13<br />

2.72 3.22 3.4 4.31 3.76 3.36 4.58 3.13 4.08 3.76<br />

De gynaecoloog berek<strong>en</strong>t <strong>het</strong> gemiddelde <strong>van</strong> zijn steekproef <strong>en</strong> bekomt als resultaat<br />

x = 3.483 kg . Hij vraagt zich af of hij met dit resultaat mag besluit<strong>en</strong> dat <strong>het</strong> gemiddelde<br />

geboortegewicht in zijn kliniek groter is dan 3.3 kg.<br />

Om zijn veronderstelling te test<strong>en</strong>, start hij met <strong>het</strong> opstell<strong>en</strong> <strong>van</strong> e<strong>en</strong> kansmodel voor de<br />

populatie waaruit de steekproef werd getrokk<strong>en</strong>. De arts gaat er<strong>van</strong> uit dat de<br />

geboortegewicht<strong>en</strong> in zijn kliniek normaal verdeeld zijn met gemiddelde <strong>en</strong><br />

standaardafwijking deze <strong>van</strong> gans Vlaander<strong>en</strong>: σ = 0.55 kg<br />

Vervolg<strong>en</strong>s formuleert hij twee hypothes<strong>en</strong> over de parameter µ <strong>van</strong> de populatie:<br />

de nulhypothese H 0 (de norm die hij graag zou weerlegg<strong>en</strong>), <strong>en</strong> e<strong>en</strong> alternatieve hypothese H 1<br />

(zijn vermoed<strong>en</strong> dat hij graag zou will<strong>en</strong> aanton<strong>en</strong> of statistisch bewijz<strong>en</strong>). De alternatieve<br />

hypothese is dat <strong>het</strong> gemiddelde geboortegewicht in zijn kliniek groter is dan 3.3 kg. We<br />

noter<strong>en</strong> de hypothes<strong>en</strong> als volgt :<br />

⎧ H 0 : µ = 3.3 kg<br />

⎨<br />

⎩ H 1 : µ > 3.3 kg<br />

We test<strong>en</strong> H 0 : µ = 3.3 versus H 1 : µ > 3.3.<br />

De hypothesetest verloopt verder als volgt. We veronderstell<strong>en</strong> in de red<strong>en</strong>ering dat de<br />

nulhypothese H 0 waar is. Indi<strong>en</strong> <strong>het</strong> gemiddelde geboortegewicht x <strong>van</strong> de steekproef <strong>van</strong> de<br />

gynaecoloog te groot is, verwerp<strong>en</strong> we de nulhypothese H 0 <strong>en</strong> aanvaard<strong>en</strong> we de alternatieve<br />

hypothese H 1 .<br />

Wat betek<strong>en</strong>t te groot ?<br />

Zou je uit e<strong>en</strong> populatie met e<strong>en</strong> gemiddelde <strong>van</strong> 3.3 kg gemakkelijk e<strong>en</strong><br />

steekproefgemiddelde <strong>van</strong> 3.483 kg of zelfs meer kunn<strong>en</strong> verkrijg<strong>en</strong>?<br />

34


Het verkreg<strong>en</strong> steekproefgemiddelde<br />

x = 3.483 kg is e<strong>en</strong> door <strong>het</strong> toeval verkreg<strong>en</strong> waarde<br />

<strong>van</strong> de stochast of toevalsvariabele X = 1 ( X ... )<br />

1<br />

+ + X30<br />

, waarbij elke X<br />

i<br />

verdeeld is zoals<br />

30<br />

de populatievariabele X.<br />

Om e<strong>en</strong> uitspraak te do<strong>en</strong> over <strong>het</strong> al dan niet te groot zijn <strong>van</strong> de geobserveerde waarde<br />

x = 3.483, bekijk<strong>en</strong> we de ligging <strong>van</strong> x op de grafiek <strong>van</strong> de dichtheidsfunctie <strong>van</strong> X .<br />

Indi<strong>en</strong> we veronderstell<strong>en</strong> dat H 0 waar is, geldt :<br />

X ∼ N(3.3,0.55) <strong>en</strong><br />

0.55<br />

X ∼ N(3.3, ) of X ∼ N(3.3,0.1)<br />

30<br />

De toevalsvariabele X is de testvariabele, dit is e<strong>en</strong><br />

functie <strong>van</strong> de steekproef waarmee we gaan<br />

besliss<strong>en</strong> of we kiez<strong>en</strong> voor H 0 of H 1 .<br />

De waarde x = 3.483 bevindt zich erg rechts;<br />

x ligt zelfs zo ver naar rechts dat de kans (indi<strong>en</strong><br />

H 0 waar is) om zo’n geobserveerde waarde te<br />

krijg<strong>en</strong> of groter, zeer klein is.<br />

Dichtheidsfunctie <strong>van</strong> X<br />

E<strong>en</strong> dergelijke geobserveerde waarde onder de nulhypothese kan dus moeilijk verklaard<br />

word<strong>en</strong> door louter toeval.<br />

We zegg<strong>en</strong> dat de geobserveerde waarde x statistisch significant is <strong>en</strong> verwerp<strong>en</strong> de<br />

nulhypothese.<br />

Stel ev<strong>en</strong> dat de geobserveerde waarde x <strong>van</strong> de<br />

gynaecoloog 3.4 kg was. Op de grafiek <strong>van</strong> de<br />

dichtheidsfunctie <strong>van</strong> X zi<strong>en</strong> we dat in dit geval de<br />

kans (indi<strong>en</strong> H 0 waar is) om e<strong>en</strong> geobserveerde<br />

waarde <strong>van</strong> 3.4 kg of meer te verkrijg<strong>en</strong>, al heel<br />

wat groter is dan voor x = 3.483 kg . Het is niet<br />

Dichtheidsfunctie X<br />

meer zo evid<strong>en</strong>t om de nulhypothese te verwerp<strong>en</strong>.<br />

Hoe verder de geobserveerde waarde x zich bevindt in de positieve richting, hoe meer we<br />

g<strong>en</strong>eigd zijn om de nulhypothese te verwerp<strong>en</strong>.<br />

E<strong>en</strong> getal dat gebruikt wordt om weer te gev<strong>en</strong> hoe sterk de geobserveerde waarde afwijkt <strong>van</strong><br />

de nulhypothese, is de p-waarde (probability value of overschrijdingskans).<br />

De p-waarde is de kans, indi<strong>en</strong> de nulhypothese waar is, om e<strong>en</strong> waarde te verkrijg<strong>en</strong> <strong>van</strong> de<br />

toetsingsgrootheid die minst<strong>en</strong>s ev<strong>en</strong> extreem is als de geobserveerde waarde. Met extreem<br />

bedoel<strong>en</strong> we waard<strong>en</strong> die nog meer zoud<strong>en</strong> wijz<strong>en</strong> in de richting <strong>van</strong> de alternatieve<br />

hypothese.<br />

Voor de geobserveerde waarde <strong>van</strong> de gynaecoloog<br />

geeft dit :<br />

PX≥ ( 3.483) = 0.034 = 3.4%<br />

35


Deze kans is klein <strong>en</strong> vormt e<strong>en</strong> goed bewijs teg<strong>en</strong> de nulhypothese. Slechts in 34<br />

steekproev<strong>en</strong> op 1000 zal e<strong>en</strong> dergelijke gebeurt<strong>en</strong>is optred<strong>en</strong> onder de nulhypothese.<br />

Hoe kleiner de p-waarde hoe meer <strong>het</strong> aanneembaar is de nulhypothese te verwerp<strong>en</strong>. Hoe<br />

klein moet de p-waarde zijn om de nulhypothese te verwerp<strong>en</strong> ?<br />

Dit hangt af <strong>van</strong> de situatie <strong>en</strong> de belangrijkheid of de gevolg<strong>en</strong> <strong>van</strong> de beslissing.<br />

Om te besliss<strong>en</strong> hanteert m<strong>en</strong> de volg<strong>en</strong>de regel. M<strong>en</strong> kiest vooraf e<strong>en</strong> significanti<strong>en</strong>iveau α :<br />

verwerp H 0 bij e<strong>en</strong> p-waarde ≤ α (we zegg<strong>en</strong> dat de steekproefdata statistisch significant zijn<br />

op <strong>het</strong> α -niveau), verwerp H 0 niet bij e<strong>en</strong> p-waarde > α .<br />

Om historische red<strong>en</strong><strong>en</strong> kiest m<strong>en</strong> vaak α = 0.05 = 5% of α = 0.01 = 1% .<br />

De gynaecoloog had gekoz<strong>en</strong> voor α = 0.05 , op basis <strong>van</strong> de p-waarde = 0.034 verwerpt hij<br />

dus de nulhypothese <strong>en</strong> aanvaardt de alternatieve hypothese µ > 3.3 .<br />

De statisticus beperkt zich vaak tot <strong>het</strong> rapporter<strong>en</strong> <strong>van</strong> de p-waarde <strong>en</strong> laat de beslissing<br />

meestal over aan zijn opdrachtgever die zijn eig<strong>en</strong> significanti<strong>en</strong>iveau op voorhand bepaalde.<br />

De p-waarde geeft meer informatie dan <strong>het</strong> significanti<strong>en</strong>iveau dat alle<strong>en</strong> di<strong>en</strong>t om de gr<strong>en</strong>s te<br />

legg<strong>en</strong> tuss<strong>en</strong> aanvaard<strong>en</strong> <strong>en</strong> verwerp<strong>en</strong> <strong>van</strong> de nulhypothese. Zo zijn de steekproefdata <strong>van</strong><br />

de gynaecoloog significant op <strong>het</strong> 5 % niveau, ook op <strong>het</strong> 4 % of <strong>het</strong> 3.5 % niveau, maar niet<br />

op <strong>het</strong> 3 % niveau.<br />

De p-waarde is bijgevolg <strong>het</strong> kleinste significanti<strong>en</strong>iveau waarvoor de steekproefdata<br />

significant zijn.<br />

Wanneer m<strong>en</strong> <strong>en</strong>kel beschikt over statistische tabell<strong>en</strong> <strong>van</strong> de standaard normale verdeling is<br />

m<strong>en</strong> verplicht e<strong>en</strong> andere testgrootheid te nem<strong>en</strong> dan X , nl.<br />

X − 3.3<br />

Z = ∼ N(0,1)<br />

.<br />

0.55/ 30<br />

We sprek<strong>en</strong> dan over de Z-test. We berek<strong>en</strong><strong>en</strong> de p-waarde in dit geval als volgt :<br />

Met de TI-84 voer je deze test uit met <strong>het</strong> commando STAT 1: Z-Test.<br />

Vul dan <strong>het</strong> Z-Test-v<strong>en</strong>ster in zoals hiernaast is<br />

afgebeeld.<br />

Indi<strong>en</strong> de resultat<strong>en</strong> <strong>van</strong> de steekproef in e<strong>en</strong> lijst<br />

gegev<strong>en</strong> zijn, selecteer je voor <strong>het</strong> item Inpt de optie<br />

Data <strong>en</strong> als je <strong>en</strong>kel statistische k<strong>en</strong>getall<strong>en</strong> k<strong>en</strong>t<br />

<strong>van</strong> de steekproef, bv. x = 3.4 , selecteer je de optie<br />

Stats.<br />

⎛ X −3.3 x−3.3 ⎞ 3.483−3.3<br />

⎞<br />

P⎜ ≥ ⎟= P(<br />

Z≥<br />

⎟<br />

⎝ 0.55/ 30 0.55/ 30 ⎠ 0.55/ 30 ⎠<br />

( Z )<br />

= P ≥ 1.822 = 0.034<br />

36


Plaats de cursor op Calculate <strong>en</strong> druk op ENTER. Het resultaat vind je links op de<br />

onderstaande figuur.<br />

Activeer opnieuw <strong>het</strong> Z-Test-v<strong>en</strong>ster, selecteer Draw <strong>en</strong> druk op ENTER. Het resultaat vind je<br />

rechts op de onderstaande figuur.<br />

X − µ<br />

0<br />

x − µ<br />

0<br />

z is de geobserveerde waarde <strong>van</strong> de testgrootheid Z = , zodat z = .<br />

σ / n<br />

σ / n<br />

Voor <strong>het</strong> geval<br />

x = 3.4 kg vind je hieronder de resultat<strong>en</strong> <strong>van</strong> de Z-Test.<br />

De p-waarde bij x = 3.4 kg of z = 0.9958 is 0.1597. Dit is gevoelig groter dan 0.05 = 5% ,<br />

zodat we de nulhypothese niet kunn<strong>en</strong> verwerp<strong>en</strong> op e<strong>en</strong> 5% significanti<strong>en</strong>iveau. Let op de<br />

terminologie: we verwerp<strong>en</strong> de nulhypothese niet, <strong>het</strong> is dus mogelijk dat µ = 3.3 .<br />

We sprek<strong>en</strong> liever niet over <strong>het</strong> aanvaard<strong>en</strong> <strong>van</strong> de nulhypothese, aangezi<strong>en</strong> we niet hebb<strong>en</strong><br />

“bewez<strong>en</strong>” dat µ exact gelijk is aan 3.3.<br />

Bov<strong>en</strong>staande test noemt m<strong>en</strong> e<strong>en</strong> éénzijdige test omdat m<strong>en</strong> op voorhand vermoedt in welke<br />

richting e<strong>en</strong> afwijking <strong>van</strong> H 0 wordt verwacht.<br />

Indi<strong>en</strong> m<strong>en</strong> dit niet op voorhand vermoedt, dan nem<strong>en</strong> we als alternatieve hypothese dat de<br />

populatie verschilt <strong>van</strong> wat er in de nulhypothese gesteld wordt. We test<strong>en</strong> H 0 : µ = 3.3<br />

versus H 1 : µ ≠ 3.3. Dit noem<strong>en</strong> we e<strong>en</strong> tweezijdige test.<br />

Het uitvoer<strong>en</strong> <strong>van</strong> deze test verloopt analoog. Het resultaat <strong>van</strong> deze test is :<br />

Merk op dat in dit geval de p-waarde <strong>het</strong> dubbel is <strong>van</strong> de p-waarde <strong>van</strong> de éénzijdige test.<br />

Dit is zo omdat we voor e<strong>en</strong> tweezijdige test e<strong>en</strong> ev<strong>en</strong> extreme afwijking (d.w.z. met e<strong>en</strong>zelfde<br />

kans) in beide richting<strong>en</strong> beschouw<strong>en</strong>. Zowel te grote als te kleine waard<strong>en</strong> zijn nu verdacht.<br />

Voor de tweezijdige test is de p-waarde = 0.068 > 0.05 , we verwerp<strong>en</strong> de nulhypothese dus<br />

niet op <strong>het</strong> 5% significanti<strong>en</strong>iveau.<br />

37


Dit laatste kan verwarr<strong>en</strong>d overkom<strong>en</strong> daar de nulhypothese bij de éénzijdige test wordt<br />

verworp<strong>en</strong> <strong>en</strong> in <strong>het</strong> geval <strong>van</strong> e<strong>en</strong> tweezijdige niet. Welk besluit moet<strong>en</strong> we nem<strong>en</strong> ?<br />

Indi<strong>en</strong> we op voorhand ge<strong>en</strong> vermoed<strong>en</strong> hebb<strong>en</strong> over <strong>het</strong> gemiddelde voer<strong>en</strong> we e<strong>en</strong><br />

tweezijdige test uit m.b.v. e<strong>en</strong> steekproef (H 0 : µ = µ 0 versus H 1 : µ ≠ µ 0).<br />

Indi<strong>en</strong> we de geobserveerde waarde x uit de steekproef zoud<strong>en</strong> gebruik<strong>en</strong> om de alternatieve<br />

hypothese te verander<strong>en</strong> (bv. H 0 : µ = µ 0 versus H 1 : µ > µ 0 ) om dan e<strong>en</strong> éénzijdige test uit<br />

te voer<strong>en</strong> met dezelfde steekproef, zou dit statistisch oneerlijk zijn t.o.v. de onwet<strong>en</strong>dheid<br />

waarmee we gestart zijn.<br />

5 De binomiale verdeling <strong>en</strong> de TI-84 Plus<br />

Werp 20 keer e<strong>en</strong> dobbelste<strong>en</strong>. De kans dat hierbij<br />

- juist 4 keer e<strong>en</strong> zes geworp<strong>en</strong> wordt, is :<br />

- juist 8 keer “zes of drie” :<br />

- <strong>en</strong> hoogst<strong>en</strong>s 4 keer e<strong>en</strong> zes :<br />

8 12<br />

⎛20⎞⎛1 ⎞ ⎛2<br />

⎞<br />

⎜ 8 ⎟⎜ ⎟ ⎜ ⎟<br />

⎝ ⎠⎝3⎠ ⎝3⎠<br />

4 16<br />

⎛20⎞⎛1 ⎞ ⎛5<br />

⎞<br />

⎜ 4 ⎟⎜ ⎟ ⎜ ⎟<br />

⎝ ⎠⎝6⎠ ⎝6⎠<br />

= 0.148<br />

= 0.202 ,<br />

20−x<br />

4<br />

⎛20⎞⎛1 ⎞ ⎛5<br />

⎞<br />

PX ( ≤ 4) = ∑ ⎜ = 0.769<br />

x=<br />

0<br />

x ⎟⎜ ⎟ ⎜ ⎟<br />

⎝ ⎠⎝6⎠ ⎝6⎠<br />

x<br />

Je kan deze kans<strong>en</strong> met de TI-84 Plus berek<strong>en</strong><strong>en</strong> via :<br />

2nd[DISTR] 0:binompdf( <strong>en</strong> 2nd[DISTR] A:binomcdf(<br />

Voor X ~ B( n, p)is :<br />

binompdf(n,p,x) = P( X x)<br />

⎛n⎞<br />

⎜ ⎟<br />

⎝x<br />

⎠<br />

x<br />

= , d.i. de kansfunctie. Er geldt dat PX ( = x) = ⋅ p⋅( 1−<br />

p)<br />

x<br />

∑<br />

binomcdf(n,p,x) = P( X ≤ x) = P( X = k)<br />

d.i. de cumulatieve kansfunctie of de verdelings-<br />

functie.<br />

k = 0<br />

binompdf(n,p) g<strong>en</strong>ereert de kansverdeling <strong>van</strong> X in e<strong>en</strong> lijst (d.i. de lijst <strong>van</strong> getall<strong>en</strong><br />

P( X = x)<br />

met x = 0,1,2, …,<br />

n ) <strong>en</strong> binomcdf(n,p) levert de cumulatieve kansverdeling op <strong>van</strong><br />

X in e<strong>en</strong> lijst (d.i. de lijst <strong>van</strong> getall<strong>en</strong> P( X ≤ x)<br />

met x = 0,1,2, …,<br />

n ).<br />

n−x<br />

.<br />

38


E<strong>en</strong> lukrake waarde <strong>van</strong> de binomiaal verdeelde toevalsvariabele X verkrijg je met<br />

randBin(n,p) <strong>en</strong> e<strong>en</strong> lijst <strong>van</strong> k zo’n waard<strong>en</strong> met randBin(n,p,k). Zo simuleert<br />

randBin(10,0.5) <strong>het</strong> aantal keer kop bij ti<strong>en</strong> keer werp<strong>en</strong> <strong>van</strong> e<strong>en</strong> muntstuk.<br />

In wat volgt word<strong>en</strong> de binomiale kansverdeling<strong>en</strong> geg<strong>en</strong>ereerd voor<br />

p = 02 . , 05 . , 07 . . Op de volg<strong>en</strong>de wijze kun je ze grafisch voorstell<strong>en</strong> :<br />

n = 6 <strong>en</strong><br />

We verkrijg<strong>en</strong> e<strong>en</strong> symmetrische kansverdeling als p = 1/ 2.<br />

M<strong>en</strong> kan aanton<strong>en</strong> dat P( X = x)<br />

maximaal is voor x = int[( n +1 ) p]<br />

, d.i. <strong>het</strong> grootste geheel<br />

getal kleiner dan of gelijk aan (n+1)p. Deze maximale waarde treedt op in de buurt <strong>van</strong><br />

E( X)<br />

= np. Het laatste plaatje bevestigt dat E( X)<br />

= np.<br />

6 Bronn<strong>en</strong><br />

J. Beirlant, G. Dierckx, M. Hubert, Statistiek <strong>en</strong> wet<strong>en</strong>schap, Acco, Leuv<strong>en</strong>, 2005.<br />

E. Seier, C. Robe, Ducks and gre<strong>en</strong> - an introduction to the ideas of hypotheses testing, in<br />

Teaching Statistics, Vol. 24, Nr. 3, p 82- 85<br />

A. Engel, Wahrscheinlichkeitsrechnung und Statistik, Band 1, Ernst Klett Verlag, Stuttgart,<br />

1976.<br />

G. Herweyers, K. Stul<strong>en</strong>s, Statistiek met e<strong>en</strong> grafisch rek<strong>en</strong>toestel, Acco, Leuv<strong>en</strong>, 2000.<br />

D.S. Moore, G.P. McCabe, Statistiek in de Praktijk, Theorieboek, Academic Service,<br />

Schoonhov<strong>en</strong>, 2001.<br />

D.S. Moore, G.P. McCabe, Statistiek in de Praktijk, Opgav<strong>en</strong>boek, Academic Service,<br />

Schoonhov<strong>en</strong>, 2001.<br />

Java-applets :<br />

http://www.kuleuv<strong>en</strong>.ac.be/ucs/java<br />

39


Dit cahier behandelt betrouwbaarheidsintervall<strong>en</strong> <strong>en</strong> <strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong>, twee belangrijke<br />

begripp<strong>en</strong> uit de statistische besluitvorming, waarbij m<strong>en</strong> aan de hand <strong>van</strong> steekproefdata conclusies trekt<br />

over de populatie waar<strong>van</strong> de data afkomstig zijn.<br />

De voorbeeld<strong>en</strong> word<strong>en</strong> beperkt tot toepassing<strong>en</strong> op de normale <strong>en</strong> de binomiale verdeling:<br />

betrouwbaarheidsinterval <strong>en</strong> test voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale verdeling met gek<strong>en</strong>de<br />

standaardafwijking, betrouwbaarheidsinterval <strong>en</strong> test voor e<strong>en</strong> proportie.<br />

De begripp<strong>en</strong> word<strong>en</strong> helder aangebracht. Simulaties <strong>van</strong> steekproeftrekking<strong>en</strong> illustrer<strong>en</strong> de rol <strong>van</strong> <strong>het</strong><br />

toeval bij betrouwbaarheidsintervall<strong>en</strong>. E<strong>en</strong> werktekst introduceert de procedure bij hypothesetest<strong>en</strong> als<br />

e<strong>en</strong> natuurlijk d<strong>en</strong>kproces, waarbij de nieuwe terminologie stapsgewijs wordt ingevoerd.<br />

GUIDO HERWEYERS doceert wiskunde <strong>en</strong> statistiek aan <strong>het</strong> Departem<strong>en</strong>t Industriële Wet<strong>en</strong>schapp<strong>en</strong> <strong>en</strong><br />

technologie <strong>van</strong> de Katholieke Hogeschool Brugge-Oost<strong>en</strong>de <strong>en</strong> is wet<strong>en</strong>schappelijk medewerker aan de<br />

K.U.Leuv<strong>en</strong>.<br />

© 2006 Dit cahier is bedoeld als lesmateriaal, mag hiervoor vrij gekopieerd word<strong>en</strong><br />

<strong>en</strong> kan gedownload word<strong>en</strong> via de website www.t3vlaander<strong>en</strong>.be.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!