Betrouwbaarheidsintervallen en het testen van hypothesen
Betrouwbaarheidsintervallen en het testen van hypothesen
Betrouwbaarheidsintervallen en het testen van hypothesen
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Cahiers T 3 Europe<br />
Vlaander<strong>en</strong> nr. 8<br />
<strong>Betrouwbaarheidsintervall<strong>en</strong></strong> <strong>en</strong><br />
<strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong><br />
Van steekproef naar populatie<br />
Guido Herweyers
<strong>Betrouwbaarheidsintervall<strong>en</strong></strong> <strong>en</strong><br />
<strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong><br />
Van steekproef naar populatie<br />
Guido Herweyers
Inhoud<br />
<strong>Betrouwbaarheidsintervall<strong>en</strong></strong><br />
1 Inleiding 1<br />
2 De normale verdeling 1<br />
3 Betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale 5<br />
verdeling met gek<strong>en</strong>de standaardafwijking<br />
Simulatie <strong>van</strong> betrouwbaarheidsintervall<strong>en</strong> 11<br />
Opgav<strong>en</strong> 13<br />
4 Betrouwbaarheidsinterval voor e<strong>en</strong> proportie 15<br />
Opgave 18<br />
5 De normale verdeling met de TI-84 Plus: e<strong>en</strong> overzicht 19<br />
Het test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong> 22<br />
1 Inleiding 22<br />
2 K<strong>en</strong>nismaking: e<strong>en</strong>d<strong>en</strong> met voorkeur voor gro<strong>en</strong>? 22<br />
Antwoord<strong>en</strong> bij de werktekst 29<br />
3 B<strong>en</strong>ader<strong>en</strong>de test voor e<strong>en</strong> proportie bij e<strong>en</strong> grote steekproef 31<br />
Opgav<strong>en</strong> 32<br />
4 Test voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale verdeling met gek<strong>en</strong>de 34<br />
standaardafwijking<br />
5 De binomiale verdeling <strong>en</strong> de TI-84 Plus 38<br />
6 Bronn<strong>en</strong> 39
<strong>Betrouwbaarheidsintervall<strong>en</strong></strong><br />
1 Inleiding<br />
Statistische infer<strong>en</strong>tie of Statistische besluitvorming trekt aan de hand <strong>van</strong> steekproefdata<br />
conclusies over de populatie waar<strong>van</strong> de data afkomstig zijn.<br />
Deze conclusies zijn <strong>en</strong>kel betrouwbaar indi<strong>en</strong> de steekproefdata op e<strong>en</strong> correcte wijze<br />
werd<strong>en</strong> verkreg<strong>en</strong>, zodat we kunn<strong>en</strong> aannem<strong>en</strong> dat de populatie goed wordt verteg<strong>en</strong>woordigd<br />
door de steekproefdata. Eerst moet er dus veel aandacht gaan naar <strong>het</strong> verwerv<strong>en</strong> <strong>van</strong><br />
gegev<strong>en</strong>s; uit slordig verkreg<strong>en</strong> data kan m<strong>en</strong> ge<strong>en</strong> zinvol besluit formuler<strong>en</strong>. In wat volgt<br />
nem<strong>en</strong> we aan dat we werk<strong>en</strong> met e<strong>en</strong> <strong>en</strong>kelvoudige aselecte steekproef uit e<strong>en</strong> populatie,<br />
waarbij elke steekproef <strong>van</strong> dezelfde om<strong>van</strong>g dezelfde kans op selectie heeft.<br />
In de onderstaande tekst besprek<strong>en</strong> we twee belangrijke begripp<strong>en</strong> uit de statistische<br />
besluitvorming: betrouwbaarheidsintervall<strong>en</strong> <strong>en</strong> hypothesetest<strong>en</strong>. We beperk<strong>en</strong> ons hierbij tot<br />
toepassing<strong>en</strong> op de normale <strong>en</strong> de binomiale verdeling, verdeling<strong>en</strong> die word<strong>en</strong> bestudeerd in<br />
<strong>het</strong> secundair onderwijs.<br />
Het is de bedoeling om vertrouwd te gerak<strong>en</strong> met de begripp<strong>en</strong> <strong>en</strong> de toepassingsgebied<strong>en</strong> aan<br />
de hand <strong>van</strong> concrete voorbeeld<strong>en</strong>, hierbij word<strong>en</strong> <strong>het</strong> grafisch rek<strong>en</strong>toestel TI-84 Plus <strong>en</strong><br />
Java-applets <strong>van</strong> de K.U.Leuv<strong>en</strong> ingezet.<br />
2 De normale verdeling<br />
In deze paragraaf vatt<strong>en</strong> we eerst <strong>en</strong>kele eig<strong>en</strong>schapp<strong>en</strong> <strong>van</strong> de normale verdeling <strong>en</strong> <strong>van</strong><br />
toevalsvariabel<strong>en</strong> sam<strong>en</strong>. Voor e<strong>en</strong> overzicht <strong>van</strong> de normale verdeling met de TI-84 Plus<br />
verwijz<strong>en</strong> we naar paragraaf 5.<br />
1) Over de grafiek <strong>van</strong> de normale dichtheidsfunctie:<br />
•<br />
σ<br />
•<br />
µ − 3σ<br />
µ − 2σ<br />
µ − σ µ µ + σ µ + 2 σ µ + 3σ<br />
68%<br />
95%<br />
99.7%<br />
1
• Populatiedata word<strong>en</strong> o.a. gek<strong>en</strong>merkt door <strong>het</strong> populatiegemiddelde µ <strong>en</strong> de<br />
populatiestandaardafwijking σ , als maat voor de spreiding <strong>van</strong> de data t.o.v. µ .<br />
Vaak neemt <strong>het</strong> dichtheidshistogram <strong>van</strong> de populatiedata, getek<strong>en</strong>d met e<strong>en</strong> kleine<br />
klass<strong>en</strong>breedte, de klokvorm aan <strong>van</strong> de normale dichtheidsfunctie (zie voorgaande<br />
grafiek). We zegg<strong>en</strong> dan dat de populatiedata normaal verdeeld zijn.<br />
De normale dichtheidsfunctie is dus e<strong>en</strong> wiskundig model voor de verdeling <strong>van</strong><br />
dergelijke populatiedata.<br />
Relatieve frequ<strong>en</strong>ties of proporties <strong>van</strong> populatiedata <strong>van</strong> e<strong>en</strong> variabele X, geleg<strong>en</strong> in<br />
e<strong>en</strong> interval, word<strong>en</strong> g<strong>en</strong>oteerd met P( a< X < b) , P( X < a) , P( X > a)<br />
,… <strong>en</strong><br />
berek<strong>en</strong>d als oppervlakte onder de dichtheidskromme bov<strong>en</strong> <strong>het</strong> beschouwde interval.<br />
De aard <strong>van</strong> de beschouwde ongelijkhed<strong>en</strong> (al dan niet strikt) speelt hierbij ge<strong>en</strong> rol.<br />
• De oppervlakte <strong>van</strong> <strong>het</strong> gebied begr<strong>en</strong>sd door de dichtheidskromme <strong>en</strong> de x-as is gelijk<br />
aan 1.<br />
• De kromme is klokvormig <strong>en</strong> symmetrisch t.o.v. de rechte x = µ , <strong>het</strong> gemiddelde valt<br />
dus sam<strong>en</strong> met de mediaan: µ = Med .<br />
• Ook de standaardafwijking σ heeft e<strong>en</strong> meetkundige betek<strong>en</strong>is: de punt<strong>en</strong> op de<br />
kromme geleg<strong>en</strong> op e<strong>en</strong> afstand σ <strong>van</strong> de symmetrieas zijn de buigpunt<strong>en</strong> <strong>van</strong> de<br />
kromme. Dit zijn de punt<strong>en</strong> waar de vorm <strong>van</strong> de kromme overgaat <strong>van</strong> bol naar hol<br />
(opwaarts kijk<strong>en</strong>d naar de kromme) of omgekeerd. E<strong>en</strong> buigpunt wordt ook<br />
gek<strong>en</strong>merkt als e<strong>en</strong> punt waar de raaklijn <strong>het</strong> steilst is. De hoogte <strong>van</strong> <strong>het</strong> buigpunt is<br />
ongeveer 60% <strong>van</strong> de tophoogte.<br />
• De 68 - 95 - 99.7 regel:<br />
voor e<strong>en</strong> normale verdeling met gemiddelde µ <strong>en</strong> standaardafwijking σ geldt:<br />
• Ongeveer 68% <strong>van</strong> de waarneming<strong>en</strong> ligt binn<strong>en</strong> e<strong>en</strong> afstand σ <strong>van</strong> µ<br />
• Ongeveer 95% <strong>van</strong> de waarneming<strong>en</strong> ligt binn<strong>en</strong> e<strong>en</strong> afstand 2σ <strong>van</strong> µ<br />
• Ongeveer 99.7% <strong>van</strong> de waarneming<strong>en</strong> ligt binn<strong>en</strong> e<strong>en</strong> afstand 3σ <strong>van</strong> µ<br />
Deze regel illustreert de rol <strong>van</strong> σ als maat <strong>van</strong> de spreiding <strong>van</strong> de populatiedata<br />
omhe<strong>en</strong> <strong>het</strong> populatiegemiddelde µ .<br />
We verifiër<strong>en</strong> de 68 - 95 - 99.7 regel voor e<strong>en</strong> normale verdeling met gemiddelde<br />
µ = 10 <strong>en</strong> standaardafwijking σ = 2 . Na keuze <strong>van</strong> e<strong>en</strong> geschikt v<strong>en</strong>ster kan de<br />
oppervlakte ook word<strong>en</strong> gearceerd via 2nd[DISTR] 1:ShadeNorm( .<br />
2
2) Elke toevalsvariabele X (ook stochastische veranderlijke of stochast g<strong>en</strong>oemd) wordt<br />
gek<strong>en</strong>merkt door de volg<strong>en</strong>de getall<strong>en</strong>:<br />
• E ( X ) , ook g<strong>en</strong>oteerd met µ , d.i. de verwachtingswaarde of <strong>het</strong> gemiddelde <strong>van</strong> X .<br />
2<br />
( )<br />
• Var ( X ) E ( X µ )<br />
= − , ook g<strong>en</strong>oteerd met<br />
2<br />
σ , d.i. de variantie <strong>van</strong> X .<br />
• i.p.v. de variantie vermeldt m<strong>en</strong> vaak σ = Var( X ), d.i. de standaardafwijking <strong>van</strong> X.<br />
2<br />
De notatie µ voor E ( X ) <strong>en</strong> σ voor ( )<br />
is uit e<strong>en</strong> populatie, dan is E ( X ) <strong>het</strong> populatiegemiddelde µ <strong>en</strong> ( )<br />
populatievariantie<br />
Var X is verantwoord: als X e<strong>en</strong> lukrake trekking<br />
Var X de<br />
2<br />
σ . We sprek<strong>en</strong> dan kort over de populatie met variabele X.<br />
Voor e<strong>en</strong> normaal verdeelde populatie geeft de dichtheidskromme nu ook de<br />
kansverdeling aan <strong>van</strong> de toevalsvariabele X, met deze verdeling wordt <strong>het</strong><br />
toevalsmechanisme aangestuurd. In deze context is P ( a< X < b)<br />
nu de kans dat de<br />
variabele X , lukraak gekoz<strong>en</strong> uit de populatie, e<strong>en</strong> waarde aanneemt tuss<strong>en</strong> a <strong>en</strong> b. Na e<strong>en</strong><br />
lukrake keuze uit de populatie verkrijg<strong>en</strong> we e<strong>en</strong> concreet getal x, d.i. e<strong>en</strong> waarde die<br />
de variabele X door <strong>het</strong> toevalsmechanisme heeft aang<strong>en</strong>om<strong>en</strong>.<br />
Indi<strong>en</strong> we vaak e<strong>en</strong> lukrake trekking do<strong>en</strong> uit e<strong>en</strong> normaal verdeelde populatie (<strong>en</strong> <strong>het</strong><br />
verkreg<strong>en</strong> getal telk<strong>en</strong>s terugplaats<strong>en</strong> in de populatie), dan zal <strong>het</strong><br />
dichtheidshistogram <strong>van</strong> deze lukraak verkreg<strong>en</strong> data op de lange duur de vorm <strong>van</strong> de<br />
normale dichtheidsfunctie aannem<strong>en</strong> (als we e<strong>en</strong> kleine klass<strong>en</strong>breedte kiez<strong>en</strong>).<br />
Via simulatie kan m<strong>en</strong> op die manier de kansverdeling lat<strong>en</strong> ontstaan <strong>van</strong> e<strong>en</strong><br />
toevalsvariabele.<br />
Je kan <strong>het</strong> ook als volgt bekijk<strong>en</strong>: met simulatie <strong>van</strong> trekking<strong>en</strong> uit e<strong>en</strong> populatie A<br />
produceer je op de lange duur e<strong>en</strong> nieuwe populatie B met dezelfde verdeling (<strong>en</strong> dus<br />
2<br />
dezelfde µ <strong>en</strong> σ ) als populatie A.<br />
3) Als de toevalsvariabele X normaal verdeeld is met gemiddelde µ <strong>en</strong> standaardafwijking<br />
σ , dan noter<strong>en</strong> we dit als volgt: X N ( µ , σ )<br />
∼ .<br />
X − µ<br />
= ∼ (Z is standaard normaal verdeeld).<br />
σ<br />
Door deze transformatie wordt e<strong>en</strong> concrete waarde x <strong>van</strong> X getransformeerd in de waarde<br />
x − µ<br />
z = <strong>van</strong> Z . We noem<strong>en</strong> <strong>het</strong> getal z de standaardscore of z-score <strong>van</strong> x.<br />
σ<br />
4) Als X ∼ N ( µ , σ ) dan is Z N( 0,1)<br />
3
Uit de formule x = µ + z ⋅ σ ler<strong>en</strong> we dat de z-score aangeeft hoeveel standaardafwijking<strong>en</strong><br />
σ de waarde x verwijderd is <strong>van</strong> <strong>het</strong> gemiddelde µ .<br />
E<strong>en</strong> z-score tuss<strong>en</strong> -1 <strong>en</strong> 1 is "normaal" <strong>en</strong> e<strong>en</strong> z-score met e<strong>en</strong> absolute waarde groter dan<br />
2 is zeld<strong>en</strong> (zie ook volg<strong>en</strong>de figuur). De z-scores word<strong>en</strong> o.a. gebruikt om data <strong>van</strong><br />
verschill<strong>en</strong>de normale verdeling<strong>en</strong> te vergelijk<strong>en</strong>.<br />
•<br />
•<br />
µ − 3σ<br />
− 3<br />
µ − 2σ<br />
µ − σ µ µ + σ µ + 2 σ µ + 3σ<br />
− 2<br />
− 1<br />
0 1 2 3<br />
x<br />
z<br />
5) Gegev<strong>en</strong> e<strong>en</strong> populatie met variabele X , met gemiddelde µ <strong>en</strong> standaardafwijking σ .<br />
Beschouw e<strong>en</strong> steekproef X1, X2, X3, … Xn<br />
uit de populatie (dit zijn onafhankelijke<br />
toevalsvariabel<strong>en</strong> met dezelfde verdeling als X ), dan heeft <strong>het</strong> steekproefgemiddelde<br />
X1+ X2 + … + Xn<br />
σ<br />
X =<br />
ook gemiddelde µ maar standaardafwijking .<br />
n<br />
n<br />
a) Als X normaal verdeeld is, dan is ook X normaal verdeeld:<br />
X1+ X2 + … + X<br />
∼ dan is X<br />
n ⎛ σ ⎞<br />
= N µ ,<br />
n<br />
⎜ ⎟.<br />
⎝ n ⎠<br />
Als X N ( µ , σ )<br />
b) Als de populatie (met eindige variantie) niet normaal verdeeld is dan geldt toch bij<br />
σ<br />
b<strong>en</strong>adering dat X normaal verdeeld is met gemiddelde µ <strong>en</strong> standaardafwijking<br />
n<br />
als n voldo<strong>en</strong>de groot is (c<strong>en</strong>trale limietstelling).<br />
4
3 Betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale<br />
verdeling met gek<strong>en</strong>de standaardafwijking<br />
Met <strong>het</strong> TI-84 Plus commando randNorm( µ , σ ) kun je simulaties uitvoer<strong>en</strong> <strong>van</strong> lukrake<br />
trekking<strong>en</strong> uit e<strong>en</strong> normaal verdeelde populatie met gemiddelde µ <strong>en</strong> standaardafwijking σ .<br />
Je vindt <strong>het</strong> commando onder MATH 6: randNorm(<br />
Enkele simulaties ton<strong>en</strong> de variabiliteit <strong>van</strong> de verkreg<strong>en</strong> data bij trekking<strong>en</strong> uit e<strong>en</strong> normale<br />
verdeling met gemiddelde µ = 10 <strong>en</strong> standaardafwijking σ = 2 . De data schommel<strong>en</strong> rond<br />
<strong>het</strong> gemiddelde.<br />
Als X ∼ N( 10,2)<br />
, dan is P( X )<br />
9.8 < < 10.2 = 8.0% :<br />
We simuler<strong>en</strong> nu <strong>en</strong>kele steekproev<strong>en</strong> met grootte n = 25 uit de populatie, telk<strong>en</strong>s berek<strong>en</strong><strong>en</strong><br />
we hierbij <strong>het</strong> steekproefgemiddelde x , d.i. telk<strong>en</strong>s e<strong>en</strong> concreet verkreg<strong>en</strong> waarde <strong>van</strong> de<br />
toevalsvariabele X .<br />
We stell<strong>en</strong> vast dat er minder variabiliteit is bij de steekproefgemiddeld<strong>en</strong>, die tev<strong>en</strong>s<br />
schommel<strong>en</strong> rond <strong>het</strong> populatiegemiddelde µ = 10. Elk <strong>van</strong> die steekproefgemiddeld<strong>en</strong> is e<strong>en</strong><br />
(punt)schatting voor <strong>het</strong> populatiegemiddelde.<br />
X1+ X2 + … + X25 ⎛ 2 ⎞<br />
∼ dan is X = N 10,<br />
25<br />
⎜ ⎟<br />
⎝ 25 ⎠<br />
Als X N( 10,2)<br />
of X N( 10, 0.4)<br />
∼ .<br />
5
Nu is P( X )<br />
9.8 < < 10.2 = 38.3% :<br />
Wat is eig<strong>en</strong>lijk de betek<strong>en</strong>is <strong>van</strong> X N( 10, 0.4)<br />
∼ ?<br />
Beschouw alle mogelijke geord<strong>en</strong>de steekproev<strong>en</strong> (met teruglegg<strong>en</strong>) ( x1, x2, x3, , x25)<br />
… die je<br />
kunt vorm<strong>en</strong> uit de populatiedata <strong>en</strong> bepaal telk<strong>en</strong>s <strong>het</strong> steekproefgemiddelde x . De populatie<br />
<strong>van</strong> al deze steekproefgemiddeld<strong>en</strong> is normaal verdeeld met gemiddelde 10 <strong>en</strong><br />
standaardafwijking 0.4. Het gemiddelde <strong>van</strong> al die steekproefgemiddeld<strong>en</strong> is dus gelijk aan<br />
<strong>het</strong> gemiddelde <strong>van</strong> de oorspronkelijke populatie, maar de spreiding is verkleind met e<strong>en</strong><br />
factor 25 .<br />
De toevalsvariabele X wordt gestuurd door e<strong>en</strong> N ( 10, 0.4)<br />
-verdeling. Bij simulatie <strong>van</strong><br />
lukrake steekproeftrekking<strong>en</strong> zal de vorm <strong>van</strong> <strong>het</strong> dichtheidshistogram <strong>van</strong> de lukraak<br />
verkreg<strong>en</strong> steekproefgemiddeld<strong>en</strong> op de lange duur de vorm <strong>van</strong> N ( 10, 0.4)<br />
-<br />
dichtheidsfunctie aannem<strong>en</strong>.<br />
Meestal trekk<strong>en</strong> we echter maar één steekproef uit e<strong>en</strong> populatie.<br />
Beschouw <strong>het</strong> resultaat 10.195 (afgerond) <strong>van</strong> <strong>het</strong> eerste steekproefgemiddelde <strong>en</strong> stel dat je<br />
<strong>en</strong>kel weet dat de steekproef afkomstig is uit e<strong>en</strong> normaal verdeelde populatie met<br />
standaardafwijking σ = 2 , hoe goed is deze schatting x = 10.195 voor <strong>het</strong> ongek<strong>en</strong>de<br />
gemiddelde µ <strong>van</strong> de populatie?<br />
Hiertoe red<strong>en</strong>er<strong>en</strong> we grafisch:<br />
•<br />
σ<br />
n<br />
0.4<br />
•<br />
µ = ?<br />
x<br />
−3<br />
−2<br />
−1<br />
0 1 2 3<br />
z<br />
6
In de voorgaande figuur zi<strong>en</strong> we de verdeling <strong>van</strong> de steekproefgemiddeld<strong>en</strong> <strong>van</strong> alle<br />
mogelijke steekproev<strong>en</strong> met grootte n, <strong>het</strong> gemiddelde <strong>van</strong> al die steekproefgemiddeld<strong>en</strong> valt<br />
σ 2<br />
sam<strong>en</strong> met <strong>het</strong> populatiegemiddelde µ <strong>en</strong> de standaardafwijking is = = 0.4 . Op<br />
n 25<br />
basis <strong>van</strong> één lukraak verkreg<strong>en</strong> steekproefgemiddelde x = 10.195 w<strong>en</strong>s<strong>en</strong> we e<strong>en</strong> uitspraak<br />
te do<strong>en</strong> over <strong>het</strong> ongek<strong>en</strong>de populatiegemiddelde µ .<br />
We wet<strong>en</strong> dat ongeveer 95% <strong>van</strong> de steekproefgemiddeld<strong>en</strong> geleg<strong>en</strong> zijn binn<strong>en</strong> e<strong>en</strong> afstand<br />
σ<br />
<strong>van</strong> 2 standaardafwijking<strong>en</strong> <strong>van</strong> µ . Meer precies kunn<strong>en</strong> we zegg<strong>en</strong> dat 95% <strong>van</strong> de<br />
n<br />
σ<br />
steekproefgemiddeld<strong>en</strong> geleg<strong>en</strong> zijn in <strong>het</strong> interval µ ± 1.96 .<br />
n<br />
Met de functie invNorm vind<strong>en</strong> we immers de standaardscore z<br />
0.025<br />
= 1.96 ; <strong>het</strong> argum<strong>en</strong>t<br />
<strong>van</strong> deze functie is de oppervlakte 0.975 links <strong>van</strong> z 0.025<br />
onder de standaard normale<br />
verdeling:<br />
0.95<br />
0.025<br />
0.1<br />
0.025<br />
−1.96 0 1 1.96<br />
z 0.025<br />
De notatie z<br />
0.025<br />
wordt gebruikt om aan te gev<strong>en</strong> dat de oppervlakte rechts <strong>van</strong> z<br />
0.025<br />
gelijk is<br />
aan 0.025 .<br />
σ<br />
95% <strong>van</strong> de data x ligg<strong>en</strong> dus binn<strong>en</strong> e<strong>en</strong> afstand 1.96 <strong>van</strong> µ , maar dit betek<strong>en</strong>t ook dat<br />
n<br />
voor 95% <strong>van</strong> de steekproefgemiddeld<strong>en</strong> x <strong>het</strong> populatiegemiddelde µ zal geleg<strong>en</strong> zijn<br />
σ<br />
binn<strong>en</strong> e<strong>en</strong> afstand 1.96 <strong>van</strong> x !<br />
n<br />
7
Derhalve noem<strong>en</strong> we voor e<strong>en</strong> concrete observatie x <strong>het</strong> interval<br />
⎡ σ σ ⎤<br />
⎢x<br />
− 1.96 , x + 1.96 ⎥ e<strong>en</strong> 95% betrouwbaarheidsinterval voor µ , of e<strong>en</strong><br />
⎣ n n⎦<br />
betrouwbaarheidsinterval met betrouwbaarheidsniveau 95%.<br />
σ<br />
We noter<strong>en</strong> dit interval ook met x ± 1.96 .<br />
n<br />
-----------------------------------------------------------------------------------------------------------------<br />
Formeel loopt de bov<strong>en</strong>staande red<strong>en</strong>ering als volgt:<br />
X1+ X2 + … + X<br />
Aangezi<strong>en</strong> X<br />
n ⎛ σ ⎞<br />
= N µ ,<br />
n<br />
⎜ ⎟<br />
⎝ n ⎠<br />
X − µ<br />
σ<br />
is Z = ∼ N( 0,1)<br />
n<br />
Uit P( Z )<br />
−1.96 ≤ ≤ 1.96 = 0.95<br />
volgt dat<br />
X − µ<br />
P( −1.96 ≤ ≤ 1.96) = 0.95<br />
σ<br />
n<br />
of<br />
σ<br />
σ<br />
P( −1.96 ≤ X −µ<br />
≤ 1.96 ) = 0.95<br />
n<br />
n<br />
(1)<br />
uit (1) volgt nu<br />
σ<br />
σ<br />
P( µ −1.96 ≤ X ≤ µ + 1.96 ) = 0.95<br />
n<br />
n<br />
uit (1) volgt echter ook<br />
σ<br />
σ<br />
P( −X −1.96 ≤−µ<br />
≤− X + 1.96 ) = 0.95<br />
n<br />
n<br />
waaruit<br />
σ<br />
σ<br />
PX ( + 1.96 ≥ µ ≥ X− 1.96 ) = 0.95<br />
n<br />
n<br />
of<br />
σ<br />
σ<br />
PX ( −1.96 ≤ µ ≤ X+ 1.96 ) = 0.95<br />
n<br />
n<br />
bijgevolg noem<strong>en</strong> we<br />
⎡ σ<br />
⎢x<br />
− 1.96<br />
⎣ n<br />
, x + 1.96<br />
voor µ .<br />
σ ⎤<br />
⎥<br />
n⎦ e<strong>en</strong> 95% betrouwbaarheidsinterval<br />
-----------------------------------------------------------------------------------------------------------------<br />
8
Voor onze eerste observatie x = 10.195 verkrijg<strong>en</strong> µ = 10.195 ± 1.96⋅ 0.4 = 10.195 ± 0.784 als<br />
betrouwbaarheidsinterval met 95% betrouwbaarheid. Dit interval [ 9.411,10.979 ] bevat<br />
inderdaad <strong>het</strong> populatiegemiddelde µ = 10.<br />
Bij elke steekproef verkrijg<strong>en</strong> we meestal e<strong>en</strong> ander gemiddelde x <strong>en</strong> dus e<strong>en</strong> ander 95%<br />
betrouwbaarheidsinterval x ± 0.784 .<br />
Bij honderd steekproev<strong>en</strong> verkrijg<strong>en</strong> we honderd betrouwbaarheidsintervall<strong>en</strong>, waar<strong>van</strong> we<br />
mog<strong>en</strong> verwacht<strong>en</strong> dat er ongeveer 95 intervall<strong>en</strong> <strong>het</strong> populatiegemiddelde µ zull<strong>en</strong> bevatt<strong>en</strong>.<br />
Simuleer zelf <strong>en</strong>kele steekproev<strong>en</strong> <strong>en</strong> bepaal de bijbehor<strong>en</strong>de betrouwbaarheidsintervall<strong>en</strong><br />
voor µ , ga na welke intervall<strong>en</strong> inderdaad 10 µ = bevatt<strong>en</strong>.<br />
σ<br />
Merk op dat de foutmarge 1.96 = 0.784 voor elk interval ongewijzigd blijft (bij vaste σ<br />
n<br />
<strong>en</strong> n <strong>en</strong> 95% betrouwbaarheid), terwijl <strong>het</strong> c<strong>en</strong>trum x <strong>van</strong> <strong>het</strong> interval door <strong>het</strong> toeval varieert<br />
<strong>van</strong> steekproef tot steekproef.<br />
M<strong>en</strong> kan <strong>het</strong> betrouwbaarheidsniveau 95% = 0.95 wijzig<strong>en</strong> tot e<strong>en</strong> bepaalde waarde 1−<br />
α<br />
(met 0< α < 1 ). Het betrouwbaarheidsniveau wordt g<strong>en</strong>oteerd met 1− α omdat α kan<br />
word<strong>en</strong> geïnterpreteerd als <strong>het</strong> significanti<strong>en</strong>iveau <strong>van</strong> e<strong>en</strong> tweezijdige hypothesetest (zie<br />
volg<strong>en</strong>d hoofdstuk).<br />
E<strong>en</strong> betrouwbaarheidsinterval met betrouwbaarheidsniveau 1− α , voor <strong>het</strong> gemiddelde µ<br />
σ<br />
<strong>van</strong> e<strong>en</strong> normaal verdeelde populatie met gek<strong>en</strong>de standaardafwijking σ , is x ± zα<br />
/2<br />
⋅ ,<br />
n<br />
waarbij de oppervlakte rechts <strong>van</strong> z α /2<br />
onder de standaardnormale dichtheidskromme gelijk is<br />
aan α /2, zodat de oppervlakte tuss<strong>en</strong> − z α /2<br />
<strong>en</strong> z α /2<br />
gelijk is aan <strong>het</strong> gew<strong>en</strong>ste<br />
betrouwbaarheidsniveau 1− α .<br />
⎛ α ⎞<br />
Met de TI-84 Plus vind je z α /2<br />
= invNorm⎜1−<br />
⎟<br />
⎝ 2 ⎠ .<br />
1−α<br />
α /2<br />
0.1<br />
− z α /2 0 1 /2<br />
α /2<br />
z α<br />
9
σ<br />
Merk op dat de foutmarge zα<br />
/2<br />
⋅ afhankelijk is <strong>van</strong> <strong>het</strong> gekoz<strong>en</strong> betrouwbaarheidsniveau<br />
n<br />
1− α , de populatiestandaardafwijking σ <strong>en</strong> de steekproefgrootte n.<br />
• Hoe groter <strong>het</strong> betrouwbaarheidsniveau, hoe groter de foutmarge.<br />
Bij e<strong>en</strong> betrouwbaarheid <strong>van</strong> 90% is z 0.05<br />
= 1.645 , voor e<strong>en</strong> betrouwbaarheid <strong>van</strong> 99% is<br />
z<br />
0.005<br />
= 2.576 .<br />
Halveert de foutmarge als we <strong>het</strong> betrouwbaarheidsniveau halver<strong>en</strong> (bvb. <strong>van</strong> 90% naar<br />
45%)?<br />
• Hoe groter de populatiestandaardafwijking σ , hoe groter de foutmarge.<br />
Als σ verdubbelt, verdubbelt dan ook de foutmarge?<br />
• Hoe groter de steekproefgrootte n, hoe kleiner de foutmarge.<br />
Als n verdubbelt, halveert dan de foutmarge?<br />
<strong>Betrouwbaarheidsintervall<strong>en</strong></strong> kunn<strong>en</strong> ook rechtstreeks word<strong>en</strong> berek<strong>en</strong>d met de TI-84 Plus via<br />
STAT 7 : ZInterval : vul de gegev<strong>en</strong>s in, ga met de cursor naar Calculate <strong>en</strong><br />
druk ENTER.<br />
10
Simulatie <strong>van</strong> betrouwbaarheidsintervall<strong>en</strong><br />
Het programma CI simuleert ti<strong>en</strong> steekproev<strong>en</strong> <strong>van</strong> e<strong>en</strong>zelfde grootte uit e<strong>en</strong> populatie die<br />
normaal verdeeld is met µ = 10 <strong>en</strong> σ = 2 .<br />
Voor iedere steekproef wordt e<strong>en</strong> betrouwbaarheidsinterval berek<strong>en</strong>d <strong>en</strong> deze intervall<strong>en</strong><br />
word<strong>en</strong> grafisch voorgesteld sam<strong>en</strong> met de dichtheidsfunctie <strong>van</strong> de normale verdeling.<br />
Na <strong>het</strong> start<strong>en</strong> <strong>van</strong> <strong>het</strong> programma geef je de<br />
gegev<strong>en</strong>s in :<br />
N = steekproefgrootte,<br />
O/O = betrouwbaarheidsniveau<br />
Dit doe je door de waarde in te tikk<strong>en</strong> achter<br />
“ : ” <strong>en</strong> dan op ENTER te drukk<strong>en</strong>.<br />
Hier volg<strong>en</strong> <strong>en</strong>kele resultat<strong>en</strong> <strong>en</strong> <strong>het</strong> programma:<br />
** Input % **<br />
Input "N : ",N<br />
Input "O/O : ",P<br />
P/100→P<br />
** Trekk<strong>en</strong> <strong>van</strong> ti<strong>en</strong> steekproev<strong>en</strong> **<br />
For(I,1,10)<br />
randNorm(10,2,N)→L1<br />
ZInterval 2,L1,P<br />
lower→ L2(I)<br />
upper→L3(I)<br />
End<br />
** Definitie <strong>van</strong> <strong>het</strong> grafisch v<strong>en</strong>ster **<br />
FnOff<br />
PlotsOff<br />
4→Xmin<br />
16→Xmax<br />
1→Xscl<br />
−1.1→Ymin<br />
.25→Ymax<br />
0→Yscl<br />
1→Xres<br />
**Tek<strong>en</strong><strong>en</strong> <strong>van</strong> dichtheidsfunctie <strong>en</strong> intervall<strong>en</strong>**<br />
"normalpdf(X,10,2)"→Y1<br />
P*100→P<br />
Text(56,84,P)<br />
Vertical 10<br />
For(J,1,10)<br />
Line(L₂(J),J*−.1,L₃(J),J*−.1)<br />
End<br />
11
Met de Java-applets <strong>van</strong> de webpagina www.kuleuv<strong>en</strong>.be/ucs/java kun je ook<br />
betrouwbaarheidsintervall<strong>en</strong> simuler<strong>en</strong> via “Tests”, vervolg<strong>en</strong>s “Confid<strong>en</strong>ce interval for<br />
mean”.<br />
Bij “settings” stell<strong>en</strong> we µ = 10, σ = 2 <strong>en</strong> α = 5% voor e<strong>en</strong> 95% betrouwbaarheidsinterval.<br />
Als steekproefgrootte kiez<strong>en</strong> we 100 <strong>en</strong> voor <strong>het</strong> aantal steekproev<strong>en</strong> nem<strong>en</strong> we 1000.<br />
Nu levert “step” alvast e<strong>en</strong> eerste simulatie:<br />
We zi<strong>en</strong> de verdeling <strong>van</strong> de steekproefgegev<strong>en</strong>s <strong>en</strong> <strong>het</strong> bijbehor<strong>en</strong>de<br />
betrouwbaarheidsinterval, dat <strong>het</strong> populatiegemiddelde µ = 10 bevat. Het kader links kun je<br />
met de muis verplaats<strong>en</strong>.<br />
Nog e<strong>en</strong>s klikk<strong>en</strong> op “step” levert e<strong>en</strong> tweede steekproef met zijn betrouwbaarheidsinterval:<br />
Ook <strong>het</strong> tweede betrouwbaarheidsinterval bevat µ .<br />
Met “walk” zie je de volg<strong>en</strong>de steekproefresultat<strong>en</strong>, met “run” gebeurt dit in versneld tempo.<br />
Uiteindelijk verkrijg<strong>en</strong> we e<strong>en</strong> zicht op de laatste 100 betrouwbaarheidsintervall<strong>en</strong> <strong>en</strong> e<strong>en</strong><br />
sam<strong>en</strong>vatt<strong>en</strong>d overzicht in <strong>het</strong> kader:<br />
12
De betrouwbaarheidsintervall<strong>en</strong> die µ niet bevatt<strong>en</strong> word<strong>en</strong> op de website aangegev<strong>en</strong> in <strong>het</strong><br />
rood. In <strong>het</strong> kadertje lez<strong>en</strong> we af (“Accepted”) dat 95,60 % <strong>van</strong> de duiz<strong>en</strong>d<br />
betrouwbaarheidsintervall<strong>en</strong> µ bevatt<strong>en</strong>, dit is in overe<strong>en</strong>stemming met <strong>het</strong> gekoz<strong>en</strong><br />
betrouwbaarheidsniveau 95 %.<br />
Opgav<strong>en</strong><br />
1) E<strong>en</strong> test op <strong>het</strong> kaliumgehalte in bloed is niet helemaal nauwkeurig. Bov<strong>en</strong>di<strong>en</strong> varieert de<br />
feitelijke hoeveelheid kalium in iemands bloed <strong>van</strong> dag tot dag <strong>en</strong>igszins. Veronderstel dat<br />
herhaalde meting<strong>en</strong> op verschill<strong>en</strong>de dag<strong>en</strong> bij dezelfde persoon variër<strong>en</strong> volg<strong>en</strong>s e<strong>en</strong><br />
normale verdeling met standaardafwijking σ = 0.2 (in millimol per liter).<br />
(a) Het kaliumgehalte <strong>van</strong> Mark wordt één keer gemet<strong>en</strong>, <strong>het</strong> resultaat is x = 3.4 .<br />
Bepaal e<strong>en</strong> 95% betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde kaliumgehalte <strong>van</strong> de<br />
normale verdeling.<br />
(b) Als er op vier verschill<strong>en</strong>de dag<strong>en</strong> meting<strong>en</strong> werd<strong>en</strong> gedaan met gemiddelde x = 3.4 ,<br />
wat is dan <strong>het</strong> 95% betrouwbaarheidsinterval voor <strong>het</strong> gemiddelde kaliumniveau <strong>van</strong><br />
de normale verdeling?<br />
2) E<strong>en</strong> labo analyseert de conc<strong>en</strong>tratie <strong>van</strong> e<strong>en</strong> actieve ingrediënt in e<strong>en</strong> g<strong>en</strong>eesmiddel. Drie<br />
verschill<strong>en</strong>de meting<strong>en</strong> <strong>van</strong> de conc<strong>en</strong>tratie levert als resultaat in g/l :<br />
0.8403 0.8363 0.8447<br />
Veronderstel hierbij dat de data afkomstig zijn uit e<strong>en</strong> normale verdeling met gek<strong>en</strong>de<br />
standaardafwijking σ = 0.0068 g/l <strong>en</strong> dat <strong>het</strong> gemiddelde <strong>van</strong> die verdeling de exacte<br />
conc<strong>en</strong>tratie is (<strong>het</strong> labo maakt ge<strong>en</strong> systematische fout<strong>en</strong>).<br />
(a) Bepaal e<strong>en</strong> 90 % betrouwbaarheidsinterval voor de exacte conc<strong>en</strong>tratie.<br />
(b) Hoeveel meting<strong>en</strong> moet m<strong>en</strong> do<strong>en</strong> om de exacte conc<strong>en</strong>tratie met 95% zekerheid te<br />
k<strong>en</strong>n<strong>en</strong> met e<strong>en</strong> maximale foutmarge <strong>van</strong> 0.005 ?<br />
13
Oplossing<strong>en</strong><br />
1) a) Met 1− α = 0.95 vind<strong>en</strong> we α = 0.05 <strong>en</strong> zα /2<br />
= z0.025<br />
= invNorm(0.975) = 1.96<br />
Bov<strong>en</strong>di<strong>en</strong> is σ = 0.2 <strong>en</strong> n = 1 zodat x = x .<br />
σ<br />
Het 95% betrouwbaarheidsinterval x ± zα<br />
/2<br />
⋅ wordt dan x± z α /2<br />
⋅ σ of<br />
n<br />
3.4 ± 1.96⋅ 0.2 of 3.4 0.392<br />
3.008,3.792 .<br />
± , dit is <strong>het</strong> interval [ ]<br />
σ<br />
b) Het 95% betrouwbaarheidsinterval x ± zα<br />
/2<br />
⋅ wordt<br />
n<br />
dit is <strong>het</strong> interval [ 3.204,3.596 ].<br />
0.2<br />
3.4 ± 1.96⋅ of 3.4 ± 0.196 ,<br />
4<br />
2) a) We berek<strong>en</strong><strong>en</strong> eerst <strong>het</strong> steekproefgemiddelde x = 0.8404 ,<br />
Met 1− α = 0.90 vind<strong>en</strong> we α = 0.10 <strong>en</strong> zα /2<br />
= z0.05<br />
= invNorm(0.95) = 1.64<br />
σ<br />
0.0068<br />
Het 90% betrouwbaarheidsinterval x ± zα<br />
/2<br />
⋅ wordt 0.8404 ± 1.64⋅ of<br />
n<br />
3<br />
0.8404 0.0064<br />
0.8340,0.8468<br />
± of <strong>het</strong> interval [ ]<br />
Met de TI-84 Plus kun je eerst de data ingev<strong>en</strong> in lijst L1 <strong>en</strong> <strong>het</strong> rek<strong>en</strong>toestel zelf <strong>het</strong><br />
gemiddelde lat<strong>en</strong> berek<strong>en</strong><strong>en</strong>:<br />
σ<br />
2) b) Er moet geld<strong>en</strong> dat zα<br />
/2<br />
⋅ ≤ 0.005 of<br />
n<br />
⎛ 0.0068 ⎞<br />
⎜1.96⋅<br />
⎟ ≤n<br />
⎝ 0.005 ⎠<br />
2<br />
0.0068<br />
1.96⋅ ≤ 0.005 of<br />
n<br />
zodat n ≥ 7.1 ; de steekproefgrootte n = 8 volstaat dus.<br />
14
Opmerking<br />
Het zwakke punt <strong>van</strong> onze red<strong>en</strong>ering is dat we veronderstell<strong>en</strong> dat de standaardafwijking σ<br />
σ<br />
<strong>van</strong> de populatie gek<strong>en</strong>d is, dit is echter zeld<strong>en</strong> <strong>het</strong> geval waardoor <strong>het</strong> interval x ± zα<br />
/2<br />
⋅<br />
n<br />
in de praktijk zeld<strong>en</strong> bruikbaar is. We veronderstell<strong>en</strong> tev<strong>en</strong>s dat de populatie normaal<br />
verdeeld is.<br />
Indi<strong>en</strong> we echter e<strong>en</strong> voldo<strong>en</strong>d grote steekproef (vuistregel n ≥ 30 ) nem<strong>en</strong> uit e<strong>en</strong> populatie<br />
met e<strong>en</strong> willekeurige verdeling <strong>en</strong> eindige standaardafwijking σ , dan zegt de c<strong>en</strong>trale<br />
X1+ X2 + … + Xn<br />
limietstelling dat <strong>het</strong> steekproefgemiddelde X =<br />
bij b<strong>en</strong>adering normaal<br />
n<br />
σ<br />
verdeeld is met gemiddelde µ <strong>en</strong> standaardafwijking .<br />
n<br />
Bov<strong>en</strong>di<strong>en</strong> zal de steekproefstandaardafwijking s dan dicht ligg<strong>en</strong> bij de ongek<strong>en</strong>de σ , zodat<br />
s<br />
x ± zα<br />
/2<br />
⋅ dan e<strong>en</strong> b<strong>en</strong>ader<strong>en</strong>d betrouwbaarheidsinterval geeft voor µ (indi<strong>en</strong> er ge<strong>en</strong><br />
n<br />
uitschieters zijn in de steekproef want deze beïnvloed<strong>en</strong> x <strong>en</strong> s sterk).<br />
Zo wordt de foutmarge <strong>van</strong> e<strong>en</strong> steekproef (uit e<strong>en</strong> willekeurige verdeling) <strong>van</strong> 100 data met<br />
e<strong>en</strong> steekproefstandaardafwijking s = 3 bij e<strong>en</strong> 95% betrouwbaarheidsinterval bij b<strong>en</strong>adering<br />
s 3<br />
gegev<strong>en</strong> door z0.025<br />
⋅ = 1.96⋅ = 0.588 .<br />
n 100<br />
4 Betrouwbaarheidsinterval voor e<strong>en</strong> proportie<br />
Om de proportie p <strong>van</strong> de Vlaming<strong>en</strong> met bloedgroep O te bepal<strong>en</strong>, word<strong>en</strong> 200 person<strong>en</strong><br />
onderzocht; 80 onder h<strong>en</strong> hebb<strong>en</strong> bloedgroep O.<br />
Als schatting voor p nem<strong>en</strong> we de steekproefproportie<br />
80<br />
p ˆ = = 0.40 .<br />
200<br />
We will<strong>en</strong> e<strong>en</strong> 95% betrouwbaarheidsinterval voor p bepal<strong>en</strong>, d.w.z. e<strong>en</strong> interval<br />
ˆp ± foutmarge waarbinn<strong>en</strong> p met 95% zekerheid geleg<strong>en</strong> is.<br />
15
-----------------------------------------------------------------------------------------------------------------<br />
Stel X <strong>het</strong> aantal person<strong>en</strong> met bloedgroep O bij e<strong>en</strong> steekproef <strong>van</strong> 200 person<strong>en</strong>, dan is X<br />
binomiaal verdeeld met parameters n = 200 <strong>en</strong> p = kans op succes (bloedgroep O) :<br />
X<br />
2<br />
∼ B( n,<br />
p)<br />
met E ( X) = µ<br />
X<br />
= np <strong>en</strong> Var ( X ) = σ<br />
X<br />
= np ( 1−<br />
p)<br />
Door de c<strong>en</strong>trale limietstelling wet<strong>en</strong> we dat X bij b<strong>en</strong>adering normaal verdeeld is met<br />
np 1− p .<br />
gemiddelde np <strong>en</strong> standaardafwijking ( )<br />
We kunn<strong>en</strong> X immers schrijv<strong>en</strong> als X = X1+ X2 + X3+… Xn<br />
, d.i. e<strong>en</strong> som <strong>van</strong><br />
n onafhankelijke toevalsvariabel<strong>en</strong> met e<strong>en</strong> Bernouilli verdeling met parameter p.<br />
Hierbij neemt X<br />
i<br />
de waarde 1 aan met kans p als de i-de persoon bloedgroep O heeft <strong>en</strong> de<br />
= p <strong>en</strong> Var ( X ) = p( 1− p)<br />
,<br />
waarde 0 als dit niet <strong>het</strong> geval is. M<strong>en</strong> rek<strong>en</strong>t vlug na dat E ( Xi<br />
)<br />
zodat E ( X) = E( X1) + E( X2) + … E( Xn<br />
) = np<br />
<strong>en</strong> Var ( X ) = Var ( X ) + Var ( X ) + … Var ( X ) = np ( − p)<br />
1 2 n<br />
1<br />
Hieruit volgt dat de toevalsvariabele X<br />
P = bij b<strong>en</strong>adering normaal verdeeld is met<br />
n<br />
p ( 1−<br />
p)<br />
gemiddelde p <strong>en</strong> standaardafwijking<br />
:<br />
n<br />
( ) ( )<br />
⎛ X ⎞ 1<br />
E ( P) = E⎜<br />
⎟= E( X)<br />
= p <strong>en</strong> ⎛ X ⎞ 1 p 1−<br />
p<br />
Var P = Var ⎜ ⎟= Var X =<br />
2<br />
⎝ n ⎠ n<br />
⎝ n ⎠ n n<br />
-----------------------------------------------------------------------------------------------------------------<br />
a) Exacte oplossing:<br />
i<br />
( )<br />
In 95% der gevall<strong>en</strong> neemt P dus e<strong>en</strong> waarde ˆp aan binn<strong>en</strong> 1.96 standaardafwijking<strong>en</strong> <strong>van</strong><br />
( 1 )<br />
<strong>het</strong> gemiddelde p of ˆ 1.96 p −<br />
p− p ≤ p met 95% zekerheid.<br />
n<br />
Concreet vond<strong>en</strong> we voor onze steekproef x = 80 <strong>en</strong> n = 200 zodat<br />
( 1−<br />
p)<br />
80<br />
p ˆ = = 0.40 <strong>en</strong><br />
200<br />
p<br />
0.4 − p ≤ 1.96 met 95% zekerheid. We loss<strong>en</strong> de ongelijkheid grafisch op:<br />
200<br />
Als interval verkrijg<strong>en</strong> we 0.3346 < p < 0.4692 met 95 % zekerheid.<br />
16
) B<strong>en</strong>ader<strong>en</strong>de oplossing:<br />
Met 95 % zekerheid is ˆp geleg<strong>en</strong> binn<strong>en</strong> 1.96 standaardafwijking<strong>en</strong> <strong>van</strong> <strong>het</strong> gemiddelde p<br />
of <strong>het</strong> gemiddelde p is geleg<strong>en</strong> binn<strong>en</strong> 1.96 standaardafwijking<strong>en</strong> <strong>van</strong> ˆp :<br />
( 1−<br />
) ( 1−<br />
)<br />
pˆ<br />
−1.96 p p ≤ p≤ pˆ<br />
+ 1.96<br />
p p<br />
n<br />
n<br />
We b<strong>en</strong>ader<strong>en</strong><br />
p<br />
( 1−<br />
p)<br />
n<br />
door<br />
pˆ<br />
( 1−<br />
pˆ)<br />
n<br />
, dit levert <strong>het</strong> 95 % betrouwbaarheidsinterval<br />
( 1−<br />
) ( 1−<br />
)<br />
ˆ ˆ ˆ ˆ<br />
pˆ<br />
−1.96 p p ≤ p≤ pˆ<br />
+ 1.96<br />
p p<br />
n<br />
n<br />
of 0.3321< p < 0.4679 (vergelijk met <strong>het</strong> exacte interval)<br />
Algeme<strong>en</strong> :<br />
E<strong>en</strong> b<strong>en</strong>ader<strong>en</strong>d betrouwbaarheidsinterval met betrouwbaarheidsniveau 1−<br />
α ,voor e<strong>en</strong><br />
populatieproportie p, wordt gegev<strong>en</strong> door<br />
steekproefproportie is.<br />
( 1−<br />
pˆ)<br />
pˆ<br />
pˆ<br />
± zα<br />
/2<br />
⋅ , waarbij ˆp e<strong>en</strong><br />
n<br />
De TI-84 Plus levert <strong>het</strong> betrouwbaarheidsinterval met STAT A: 1-PropZInterval ;<br />
vul de gegev<strong>en</strong>s in, ga met de cursor naar Calculate <strong>en</strong> druk ENTER:<br />
Opmerking<br />
Bov<strong>en</strong>staande werkwijze (a) of (b) mog<strong>en</strong> we niet gebruik<strong>en</strong> bij e<strong>en</strong> kleine steekproef,<br />
bijvoorbeeld n = 5, aangezi<strong>en</strong> de c<strong>en</strong>trale limietstelling dan niet <strong>van</strong> toepassing is; de<br />
steekproefproportie X<br />
P = is dan niet normaal verdeeld.<br />
n<br />
17
Opgave<br />
Van 20000 Belg<strong>en</strong> onderzoekt m<strong>en</strong> de bloedgroep met als resultaat:<br />
Bloedgroep A B AB O<br />
% 43.2 14.2 6 36.6<br />
a) Bepaal betrouwbaarheidsintervall<strong>en</strong> voor de proportie p der Belg<strong>en</strong> met bloedgroep O,<br />
met betrouwbaarheidsniveau’s 80% , 95% , 99% .<br />
b) Hoe groot moet e<strong>en</strong> (aselecte) steekproef zijn, om de proportie p der Belg<strong>en</strong> met<br />
bloedgroep O tot op 0.01 nauwkeurig te k<strong>en</strong>n<strong>en</strong> met 95% zekerheid?<br />
Oplossing<br />
a)<br />
Met 99% zekerheid kunn<strong>en</strong> we dus zegg<strong>en</strong> dat de ongek<strong>en</strong>de proportie p geleg<strong>en</strong> is<br />
tuss<strong>en</strong> 35.7% <strong>en</strong> 37.5% !<br />
18
( )<br />
b) Er moet geld<strong>en</strong> dat 1.96⋅ p 1−<br />
p<br />
n<br />
≤ 0.01 of n≥38416⋅p( 1− p)<br />
(1)<br />
We k<strong>en</strong>n<strong>en</strong> p niet maar<br />
2 2<br />
⎛<br />
2 ⎛ 1⎞ 1⎞<br />
1 ⎛ 1⎞<br />
p( 1 − p)<br />
=−( p − p)<br />
=− p− − = − p−<br />
⎜⎜ ⎟ 2 4⎟<br />
⎜ ⎟<br />
⎝⎝ ⎠ ⎠ 4 ⎝ 2⎠<br />
zodat<br />
1<br />
1<br />
p( 1− p)<br />
≤ (gelijkheid treedt op als p = ).<br />
4<br />
2<br />
Bijgevolg is p( p)<br />
38416 1− ≤ 9604<br />
zodat e<strong>en</strong> steekproefgrootte n = 9604 zeker volstaat.<br />
Schatt<strong>en</strong> we echter in (1) p met p ˆ = 0.366 dan vind<strong>en</strong> we<br />
n ≥38416⋅0.366⋅<br />
0.634<br />
of n ≥38416⋅<br />
0.232044<br />
of n ≥ 8914.2<br />
n = volstaat (de besparing is gering aangezi<strong>en</strong> pˆ( 1 pˆ)<br />
zodat 8915<br />
geleg<strong>en</strong> is).<br />
− dicht bij 1/4<br />
5 De normale verdeling met de TI-84 Plus: e<strong>en</strong> overzicht<br />
De commando's i.v.m. normale verdeling<strong>en</strong> op e<strong>en</strong> TI-84 (Plus) zijn terug te vind<strong>en</strong> onder<br />
a) 2nd [DISTR] 1: normalpdf(<br />
2nd [DISTR] 2: normalcdf(<br />
2nd [DISTR] 3: invNorm(<br />
b) 2nd [DISTR] 1: SchadeNorm(<br />
c) MATH 6: randNorm(<br />
Vooraf merk<strong>en</strong> we algeme<strong>en</strong> op dat de commando’s onder (a) <strong>en</strong> (b) eindig<strong>en</strong> met <strong>het</strong><br />
opgev<strong>en</strong> <strong>van</strong> de parameters µ <strong>en</strong> σ . Deze parameters mag je ook weglat<strong>en</strong> voor de standaard<br />
normale verdeling.<br />
19
5.1 normalpdf<br />
normalpdf is de dichtheidsfunctie <strong>van</strong> e<strong>en</strong> normale verdeling. De syntax voor de<br />
functiewaarde in <strong>het</strong> punt x is normalpdf(x , µ , σ ) .<br />
Om de grafiek te tek<strong>en</strong><strong>en</strong> <strong>van</strong> de normale verdeling met gemiddelde 15 <strong>en</strong> standaardafwijking<br />
2 bepaal je eerst e<strong>en</strong> geschikt v<strong>en</strong>ster met WINDOW : nag<strong>en</strong>oeg alle data bevind<strong>en</strong> zich in <strong>het</strong><br />
µ − 3 σ , µ + 3σ<br />
= 15 −3⋅ 2,15 + 3⋅ 2 = 9, 21 <strong>en</strong> de maximale functiewaarde is<br />
interval [ ] [ ] [ ]<br />
normalpdf ( µ , µ , σ ) = normalpdf (3 ,3 , 2)<br />
5.2 normalcdf<br />
Met normalcdf berek<strong>en</strong> je de proportie <strong>van</strong> de data geleg<strong>en</strong> in e<strong>en</strong> interval , de syntax is<br />
normalcdf (ondergr<strong>en</strong>s , bov<strong>en</strong>gr<strong>en</strong>s , µ , σ ) .<br />
99<br />
I.p.v. +∞ neem je 10 ^ 99 = 10 , i.p.v. −∞ neem je − 10 ^ 99 .<br />
Zo levert normalcdf( − 10 ^ 99 , x , µ , σ ) de verdelingsfunctie <strong>van</strong> de normale verdeling,<br />
d.i. de proportie <strong>van</strong> de data kleiner dan of gelijk aan x , of de oppervlakte onder de normale<br />
verdeling links <strong>van</strong> x.<br />
5.3 invNorm<br />
invNorm is de inverse functie <strong>van</strong> de verdelingsfunctie , de syntax is invNorm (y, µ , σ ) .<br />
Voor e<strong>en</strong> gegev<strong>en</strong> getal y tuss<strong>en</strong> 0 <strong>en</strong> 1 berek<strong>en</strong> je hiermee de gr<strong>en</strong>s x waarvoor de<br />
oppervlakte onder de normale verdeling links <strong>van</strong> x gelijk is aan y . Hiermee bepaal je o.a. de<br />
kwartiel<strong>en</strong> <strong>van</strong> e<strong>en</strong> normale verdeling.<br />
20
5.4 ShadeNorm<br />
Met ShadeNorm doe je <strong>het</strong>zelfde als normalcdf , bov<strong>en</strong>di<strong>en</strong> wordt de normale verdeling<br />
getek<strong>en</strong>d <strong>en</strong> de berek<strong>en</strong>de oppervlakte gearceerd. Je moet dus eerst de geschikte<br />
v<strong>en</strong>stergr<strong>en</strong>z<strong>en</strong> met WINDOW instell<strong>en</strong> <strong>en</strong> met Y= de eerder gedefinieerde functies uitzett<strong>en</strong>.<br />
De syntax is ShadeNorm (ondergr<strong>en</strong>s , bov<strong>en</strong>gr<strong>en</strong>s , µ , σ ) . De opdracht wordt gegev<strong>en</strong> in<br />
<strong>het</strong> basisscherm <strong>en</strong> dus pas uitgevoerd na <strong>het</strong> drukk<strong>en</strong> op ENTER.<br />
5.5 randNorm<br />
Met randNorm( µ , σ ) kun je simulaties uitvoer<strong>en</strong> <strong>van</strong> lukrake trekking<strong>en</strong> uit e<strong>en</strong> normaal<br />
verdeelde populatie met gemiddelde µ <strong>en</strong> standaardafwijking σ .<br />
Je vindt <strong>het</strong> commando onder MATH 6: randNorm(<br />
E<strong>en</strong> steekproef met grootte n uit e<strong>en</strong> normaal verdeelde populatie met gemiddelde µ <strong>en</strong><br />
standaardafwijking σ wordt als e<strong>en</strong> lijst <strong>van</strong> data geg<strong>en</strong>ereerd met randNorm ( µσ , ,n)<br />
.<br />
21
Het test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong><br />
1 Inleiding<br />
E<strong>en</strong> eerste k<strong>en</strong>nismaking met de basisprincipes <strong>van</strong> hypothesetest<strong>en</strong> gebeurt best met e<strong>en</strong><br />
e<strong>en</strong>voudig voorbeeld, waarbij mete<strong>en</strong> de context <strong>van</strong> <strong>het</strong> toepassingsgebied <strong>het</strong> uitgangspunt<br />
is: <strong>het</strong> bestaan <strong>van</strong> e<strong>en</strong> onderzoeksvraag, waarop e<strong>en</strong> antwoord moet word<strong>en</strong> geformuleerd.<br />
Met dit voorbeeld kan de stud<strong>en</strong>t stapsgewijs k<strong>en</strong>nismak<strong>en</strong> met de vele nieuwe begripp<strong>en</strong><br />
zoals statistische hypothes<strong>en</strong>, p-waarde, <strong>het</strong> significanti<strong>en</strong>iveau α , type I <strong>en</strong> type II fout,<br />
tweezijdig of e<strong>en</strong>zijdig test<strong>en</strong>, <strong>het</strong> al dan niet significant zijn <strong>van</strong> de steekproefdata, …<br />
De hele procedure <strong>van</strong> <strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong> komt hiermee aan bod als e<strong>en</strong> natuurlijk<br />
d<strong>en</strong>kproces, in plaats <strong>van</strong> e<strong>en</strong> opsomming <strong>van</strong> uit te voer<strong>en</strong> stapp<strong>en</strong> <strong>en</strong> te berek<strong>en</strong><strong>en</strong> formules.<br />
De volg<strong>en</strong>de k<strong>en</strong>nismaking gebruikt <strong>en</strong>kel de binomiale verdeling als vereiste voork<strong>en</strong>nis <strong>en</strong><br />
wordt aangebod<strong>en</strong> als e<strong>en</strong> werktekst. De antwoord<strong>en</strong> bij die tekst vind je aansluit<strong>en</strong>d op<br />
pagina 28. Paragraaf 5 toont e<strong>en</strong> overzicht <strong>van</strong> de TI-84 Plus commando’s voor de binomiale<br />
verdeling.<br />
2 K<strong>en</strong>nismaking: E<strong>en</strong>d<strong>en</strong> met voorkeur voor gro<strong>en</strong>?<br />
I De onderzoeksvraag<br />
E<strong>en</strong> stud<strong>en</strong>t biologie heeft als opdracht e<strong>en</strong> antwoord te vind<strong>en</strong> op de volg<strong>en</strong>de<br />
onderzoeksvraag:<br />
Bij e<strong>en</strong> bepaalde e<strong>en</strong>d<strong>en</strong>soort (de slobe<strong>en</strong>d , zie http://users.tel<strong>en</strong>et.be/subv/ ) hebb<strong>en</strong> de<br />
mannetjes e<strong>en</strong> mooie glanz<strong>en</strong>d gro<strong>en</strong>e kop, met als doel de vrouwtjes aan te trekk<strong>en</strong>. De vraag<br />
is of de vrouwtjese<strong>en</strong>d<strong>en</strong> ook aangetrokk<strong>en</strong> word<strong>en</strong> tot e<strong>en</strong> gro<strong>en</strong>e kleur in hun voedsel,<br />
bijvoorbeeld brood?<br />
II Statistische hypothes<strong>en</strong><br />
De onderzoeksvraag kan word<strong>en</strong> vertaald in de confrontatie <strong>van</strong> twee ideeën:<br />
1 ) vrouwtjese<strong>en</strong>d<strong>en</strong> zijn onverschillig voor gro<strong>en</strong> of gewoon brood<br />
of<br />
2) vrouwtjese<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> gro<strong>en</strong> brood bov<strong>en</strong> gewoon brood<br />
Als e<strong>en</strong> vrouwtjese<strong>en</strong>d <strong>van</strong> die e<strong>en</strong>d<strong>en</strong>soort geconfronteerd wordt met twee stukjes brood<br />
(gewoon <strong>en</strong> gro<strong>en</strong>) , dan noter<strong>en</strong> we de kans op de keuze <strong>van</strong> <strong>het</strong> gro<strong>en</strong>e brood met p.<br />
De ideeën word<strong>en</strong> dan kort:<br />
1) p = _________<br />
2) p > _________<br />
22
Deze confronter<strong>en</strong>de ideeën of uitsprak<strong>en</strong> noem<strong>en</strong> we statistische hypothes<strong>en</strong> , de eerste<br />
hypothese stelt dat de e<strong>en</strong>d<strong>en</strong> ev<strong>en</strong> graag gewoon als gro<strong>en</strong> brood et<strong>en</strong>. Dit noem<strong>en</strong> we de<br />
nulhypothese, voorgesteld door H<br />
0<br />
, aangezi<strong>en</strong> dit <strong>het</strong> idee verteg<strong>en</strong>woordigt dat er ge<strong>en</strong><br />
verschil is (Engelse term: ‘null-change’ ). Het tweede idee drukt wel degelijk e<strong>en</strong> verschil uit:<br />
de e<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> gro<strong>en</strong> brood i.p.v. gewoon brood. Daarom wordt dit de alternatieve<br />
hypothese g<strong>en</strong>oemd <strong>en</strong> g<strong>en</strong>oteerd met H<br />
1<br />
.<br />
We verkrijg<strong>en</strong> dus de volg<strong>en</strong>de hypothes<strong>en</strong>:<br />
H<br />
0<br />
: p = 1/2<br />
H : p > 1/2<br />
1<br />
De red<strong>en</strong> waarom we hier de alternatieve hypothese H<br />
1<br />
formuler<strong>en</strong> als p > 1/2 (éénzijdige<br />
test) <strong>en</strong> niet p ≠ 1/2 (tweezijdige test) is omdat de onderzoeksvraag <strong>en</strong>kel vraagt om na te<br />
gaan of de e<strong>en</strong>d<strong>en</strong> gro<strong>en</strong> brood verkiez<strong>en</strong> i.p.v. gewoon brood. M<strong>en</strong> gaat er dus a priori <strong>van</strong> uit<br />
dat de e<strong>en</strong>d<strong>en</strong> zeker ge<strong>en</strong> voorkeur hebb<strong>en</strong> voor <strong>het</strong> gewone brood.<br />
Uiteindelijk moet<strong>en</strong> we besliss<strong>en</strong> welke <strong>van</strong> de twee hypothes<strong>en</strong> voor ons de voorkeur krijgt;<br />
we moet<strong>en</strong> “kiez<strong>en</strong>” voor H<br />
0<br />
of H<br />
1<br />
, we zegg<strong>en</strong> dat we H<br />
0<br />
test<strong>en</strong> versus H<br />
1<br />
.<br />
Er zijn twee mogelijkhed<strong>en</strong> (let op de werkwoordkeuze bij de hypothes<strong>en</strong>):<br />
1) We verwerp<strong>en</strong> H<br />
0<br />
(we aanvaard<strong>en</strong> H<br />
1<br />
)<br />
of<br />
2) We verwerp<strong>en</strong> H<br />
0<br />
niet (we aanvaard<strong>en</strong> H<br />
1<br />
niet)<br />
De beslissing wordt meestal geformuleerd in term<strong>en</strong> <strong>van</strong> H 0<br />
: we verwerp<strong>en</strong> H 0<br />
of we<br />
verwerp<strong>en</strong> H<br />
0<br />
niet.<br />
III Bewijsmateriaal verzamel<strong>en</strong> om te kunn<strong>en</strong> besliss<strong>en</strong><br />
De stud<strong>en</strong>t ontwerpt e<strong>en</strong> experim<strong>en</strong>t om tot e<strong>en</strong> beslissing te kom<strong>en</strong>: zal hij H<br />
0<br />
verwerp<strong>en</strong> of<br />
niet verwerp<strong>en</strong>?<br />
Hij gaat naar e<strong>en</strong> meer in de omgeving <strong>van</strong> de campus, waar slobe<strong>en</strong>d<strong>en</strong> in grote aantall<strong>en</strong><br />
aanwezig zijn, <strong>en</strong> kiest lukraak 10 vrouwtjese<strong>en</strong>d<strong>en</strong>. Elke e<strong>en</strong>d krijgt twee stukk<strong>en</strong> brood<br />
aangebod<strong>en</strong>: e<strong>en</strong> gewoon stuk <strong>en</strong> e<strong>en</strong> stuk met e<strong>en</strong> gro<strong>en</strong> laagje verf. Hij vat <strong>het</strong> resultaat<br />
sam<strong>en</strong> in e<strong>en</strong> rapport waarin hij <strong>het</strong> aantal e<strong>en</strong>d<strong>en</strong> vermeldt die eerst naar <strong>het</strong> gro<strong>en</strong>e brood<br />
zwemm<strong>en</strong>.<br />
D<strong>en</strong>k na over de toevalsvariabele X = <strong>het</strong> aantal e<strong>en</strong>d<strong>en</strong> in de steekproef die gro<strong>en</strong> brood<br />
verkiez<strong>en</strong>. De steekproefgrootte is hier gelijk aan 10 n = .<br />
Als de e<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong> brood, wat is dan de verdeling <strong>van</strong> de<br />
variabele X ?<br />
________________________________<br />
23
IV De weg naar de beslissing<br />
Als de vrouwtjese<strong>en</strong>d<strong>en</strong> echt onverschillig zijn t.o.v. gro<strong>en</strong> of gewoon brood, hoeveel <strong>van</strong> de<br />
10 e<strong>en</strong>d<strong>en</strong> verwacht je dan die eerst naar <strong>het</strong> gro<strong>en</strong>e brood zwemm<strong>en</strong>? ________________<br />
Natuurlijk zal dit resultaat in werkelijkheid niet steeds hieraan gelijk zijn, ook al is de<br />
nulhypothese juist, omwille <strong>van</strong> de mogelijke variaties in de steekproev<strong>en</strong> te wijt<strong>en</strong> aan <strong>het</strong><br />
toeval.<br />
De stud<strong>en</strong>t biologie stelt vast dat 9 <strong>van</strong> de 10 e<strong>en</strong>d<strong>en</strong> in zijn steekproef <strong>het</strong> gro<strong>en</strong>e brood<br />
verkiez<strong>en</strong>. Stel dat de populatie <strong>van</strong> alle slobe<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong><br />
brood (stel dat H<br />
0<br />
waar is), wat is dan de kans om in e<strong>en</strong> steekproef <strong>van</strong> 10 e<strong>en</strong>d<strong>en</strong> er 9 aan te<br />
treff<strong>en</strong> die eerst <strong>het</strong> gro<strong>en</strong>e brood oppikk<strong>en</strong>? __________________________<br />
Neg<strong>en</strong> <strong>van</strong> de ti<strong>en</strong> lijkt erop te wijz<strong>en</strong> dat de e<strong>en</strong>d<strong>en</strong>populatie eerder <strong>het</strong> gro<strong>en</strong>e brood verkiest<br />
dan gewoon brood. Als er meer dan 9 e<strong>en</strong>d<strong>en</strong> <strong>het</strong> gro<strong>en</strong>e brood zoud<strong>en</strong> kiez<strong>en</strong>, dan zou dit<br />
nog meer wijz<strong>en</strong> op e<strong>en</strong> situatie verschill<strong>en</strong>d <strong>van</strong> de nulhypothese! Daarom zijn we<br />
geïnteresseerd in de kans dat er 9 (<strong>het</strong> geobserveerde aantal in de steekproef <strong>van</strong> de stud<strong>en</strong>t)<br />
of meer (nog overtuig<strong>en</strong>der wijz<strong>en</strong>d in de richting <strong>van</strong> de alternatieve hypothese)<br />
vrouwtjese<strong>en</strong>d<strong>en</strong> eerst <strong>het</strong> gro<strong>en</strong>e brood gaan kiez<strong>en</strong>. We will<strong>en</strong> dus de kans k<strong>en</strong>n<strong>en</strong> op e<strong>en</strong><br />
resultaat dat minst<strong>en</strong>s ev<strong>en</strong> groot is als <strong>het</strong> steekproefresultaat, in de veronderstelling dat de<br />
nulhypothese waar is. Berek<strong>en</strong> deze kans P( X ≥ 9)<br />
:<br />
_______________________________________________<br />
Deze kans om e<strong>en</strong> resultaat te verkrijg<strong>en</strong> gelijk aan <strong>het</strong> steekproefresultaat of nog extremer<br />
(wijz<strong>en</strong>d in de richting <strong>van</strong> de alternatieve hypothese) noem<strong>en</strong> we de ‘p-waarde’ of<br />
overschrijdingskans.<br />
Vind je deze p-waarde klein of groot? ______________________<br />
Geloof je dat de nulhypothese H<br />
0<br />
waar is, rek<strong>en</strong>ing houd<strong>en</strong>d met deze p-waarde? (omcirkel<br />
je antwoord).<br />
Ja<br />
Ne<strong>en</strong><br />
Welke hypothese krijgt dus je voorkeur, H<br />
0<br />
of H<br />
1<br />
? ________________<br />
Verwerp je H<br />
0<br />
of verwerp je H<br />
0<br />
niet? _____________________<br />
Formuleer je antwoord op de onderzoeksvraag:<br />
_____________________________________________________________________<br />
_____________________________________________________________________<br />
24
V Sam<strong>en</strong>vatting <strong>van</strong> <strong>het</strong> d<strong>en</strong>kproces<br />
Herlees de stapp<strong>en</strong> I tot IV , onze red<strong>en</strong>ering om tot e<strong>en</strong> beslissing te kom<strong>en</strong> kunn<strong>en</strong> we als<br />
volgt sam<strong>en</strong>vatt<strong>en</strong>:<br />
(a) Formuleer de onderzoeksvraag. (Verkiez<strong>en</strong> vrouwtjes slobe<strong>en</strong>d<strong>en</strong> gro<strong>en</strong> brood bov<strong>en</strong><br />
gewoon brood? )<br />
(b) Bepaal e<strong>en</strong> grootheid waar <strong>het</strong> onderzoek eig<strong>en</strong>lijk over gaat <strong>en</strong> waar<strong>van</strong> we de<br />
waarde niet k<strong>en</strong>n<strong>en</strong>. In dit voorbeeld is die grootheid de proportie <strong>van</strong> de<br />
vrouwtjese<strong>en</strong>d<strong>en</strong> die <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong> of de kans p dat e<strong>en</strong> lukraak<br />
gekoz<strong>en</strong> vrouwtjese<strong>en</strong>d <strong>het</strong> gro<strong>en</strong>e brood kiest. In <strong>het</strong> algeme<strong>en</strong> wordt die grootheid<br />
e<strong>en</strong> parameter g<strong>en</strong>oemd.<br />
(c) Schrijf de twee confronter<strong>en</strong>de statistische hypothes<strong>en</strong> in term<strong>en</strong> <strong>van</strong> de parameter<br />
waar <strong>het</strong> om gaat.<br />
In <strong>het</strong> voorbeeld zijn de statistische hypothes<strong>en</strong> H<br />
0<br />
: p = 1/2 <strong>en</strong> H<br />
1<br />
: p > 1/2.<br />
(d) Verzamel steekproefdata <strong>en</strong> berek<strong>en</strong> de verkreg<strong>en</strong> waarde <strong>van</strong> de teststatistiek (d.i.<br />
e<strong>en</strong> concreet getal verkreg<strong>en</strong> m.b.v. de steekproefgegev<strong>en</strong>s, in dit geval <strong>het</strong> aantal<br />
e<strong>en</strong>d<strong>en</strong> (9 op 10) die gro<strong>en</strong> brood verkiez<strong>en</strong>. De teststatistiek of testvariabele zelf is<br />
e<strong>en</strong> toevalsvariabele (<strong>het</strong> aantal e<strong>en</strong>d<strong>en</strong> X die <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong>) waar<strong>van</strong><br />
we de concrete waarde x = 9 hebb<strong>en</strong> geobserveerd.<br />
(e) Berek<strong>en</strong> de p-waarde, d.i. de kans dat we <strong>het</strong> resultaat <strong>van</strong> de steekproef verkrijg<strong>en</strong> of<br />
e<strong>en</strong> nog extremer resultaat (wijz<strong>en</strong>d in de richting <strong>van</strong> de alternatieve hypothese), in<br />
de veronderstelling dat de nulhypothese waar is.<br />
(f) Beslis of de p-waarde klein of groot is. In ons voorbeeld gaf de kleine p-waarde<br />
aanleiding tot <strong>het</strong> verwerp<strong>en</strong> <strong>van</strong> de nulhypothese.<br />
Deze red<strong>en</strong>eervorm wordt “test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong>” g<strong>en</strong>oemd. De red<strong>en</strong>eervorm kan word<strong>en</strong><br />
toegepast in verschill<strong>en</strong>de situaties waarin e<strong>en</strong> onderzoeksvraag over e<strong>en</strong> populatie wordt<br />
gesteld <strong>en</strong> steekproefdata word<strong>en</strong> verzameld om e<strong>en</strong> antwoord te kunn<strong>en</strong> gev<strong>en</strong> op de vraag.<br />
Het is duidelijk dat (f) e<strong>en</strong> delicaat punt is dat nog meer aandacht verdi<strong>en</strong>t, welke p-waarde<br />
kunn<strong>en</strong> we immers als “klein” beschouw<strong>en</strong>? Dit besprek<strong>en</strong> we in de volg<strong>en</strong>de paragraaf.<br />
VI Op hoeveel verschill<strong>en</strong>de manier<strong>en</strong> kunn<strong>en</strong> we e<strong>en</strong> verkeerde beslissing nem<strong>en</strong>?<br />
Bij <strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong> moet<strong>en</strong> we H<br />
0<br />
of H<br />
1<br />
selecter<strong>en</strong>. Natuurlijk nem<strong>en</strong> we graag<br />
de correcte beslissing, maar soms kunn<strong>en</strong> we ook e<strong>en</strong> foute beslissing nem<strong>en</strong>. Hoe zou je in<br />
woord<strong>en</strong> de volg<strong>en</strong>de situaties kunn<strong>en</strong> omschrijv<strong>en</strong>? Formuleer dit in term<strong>en</strong> <strong>van</strong> wat de<br />
e<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> <strong>en</strong> wat wij bewer<strong>en</strong> dat ze verkiez<strong>en</strong>.<br />
(1) We verwerp<strong>en</strong> de nulhypothese H<br />
0<br />
, terwijl H<br />
0<br />
in werkelijkheid waar is.<br />
__________________________________________________________<br />
__________________________________________________________<br />
(2) We verwerp<strong>en</strong> de nulhypothese H<br />
0<br />
niet, terwijl H<br />
0<br />
in werkelijkheid niet waar is.<br />
____________________________________________________________<br />
____________________________________________________________<br />
25
(1) noemt m<strong>en</strong> e<strong>en</strong> type I fout (onterecht H<br />
0<br />
verwerp<strong>en</strong>).<br />
(2) noemt m<strong>en</strong> e<strong>en</strong> type II fout (onterecht H<br />
0<br />
niet verwerp<strong>en</strong>).<br />
De volg<strong>en</strong>de tabel geeft e<strong>en</strong> overzicht <strong>van</strong> de mogelijke situaties:<br />
je verwerpt H<br />
0<br />
je verwerpt H<br />
0<br />
niet<br />
H<br />
0<br />
is waar Type I fout juiste beslissing<br />
H is niet waar juiste beslissing Type II fout<br />
0<br />
Natuurlijk w<strong>en</strong>s<strong>en</strong> we de kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> fout zeer klein te houd<strong>en</strong>.<br />
Onze aandacht gaat vooral uit naar <strong>het</strong> klein houd<strong>en</strong> <strong>van</strong> de kans op e<strong>en</strong> type I fout, omdat de<br />
nulhypothese e<strong>en</strong> ‘status quo’ of neutrale situatie inhoudt, e<strong>en</strong> traditionele situatie.<br />
Als we de nulhypothese verwerp<strong>en</strong>, dan zegg<strong>en</strong> we dat iets beter is of verkoz<strong>en</strong> wordt, of<br />
slechter, of verschill<strong>en</strong>d, afhankelijk <strong>van</strong> hoe de alternatieve hypothese geformuleerd is. Als<br />
bijvoorbeeld twee medicam<strong>en</strong>t<strong>en</strong> word<strong>en</strong> vergelek<strong>en</strong> in e<strong>en</strong> onderzoek, dan zou e<strong>en</strong> type I<br />
fout bewer<strong>en</strong> dat e<strong>en</strong> medicam<strong>en</strong>t beter is terwijl de medicam<strong>en</strong>t<strong>en</strong> in werkelijkheid<br />
gelijkaardige effect<strong>en</strong> hebb<strong>en</strong>. De nulhypothese is de ‘klassieke’ of ‘traditionele hypothese’<br />
<strong>en</strong> e<strong>en</strong> type I fout (<strong>het</strong> t<strong>en</strong> onrechte verwerp<strong>en</strong> <strong>van</strong> deze klassieke hypothese) beschouwt m<strong>en</strong><br />
dan erger dan e<strong>en</strong> type II fout (<strong>het</strong> t<strong>en</strong> onrechte niet verwerp<strong>en</strong> <strong>van</strong> de klassieke hypothese).<br />
De kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type I fout wordt <strong>het</strong> significanti<strong>en</strong>iveau g<strong>en</strong>oemd <strong>en</strong><br />
g<strong>en</strong>oteerd met α . We w<strong>en</strong>s<strong>en</strong> die kans α onder controle te hebb<strong>en</strong>, de keuze <strong>van</strong> α wordt<br />
mee bepaald door <strong>het</strong> belang <strong>en</strong> <strong>het</strong> gevolg <strong>van</strong> onze beslissing (cfr. e<strong>en</strong> rechtszaak: is de<br />
beschuldigde schuldig of niet? )<br />
Stel dat je op voorhand beslist de nulhypothese te verwerp<strong>en</strong> <strong>van</strong> zodra er minst<strong>en</strong>s 8 e<strong>en</strong>d<strong>en</strong><br />
<strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong>, wat is dan de kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type I fout?<br />
Of, anders geformuleerd, wat is de kans dat er minst<strong>en</strong>s 8 e<strong>en</strong>d<strong>en</strong> <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong><br />
als H<br />
0<br />
waar is?<br />
( 8)<br />
α = P X ≥ = ______________________<br />
Het is belangrijk dat de kans op e<strong>en</strong> type I fout op voorhand wordt vastgelegd, bij <strong>het</strong> begin<br />
<strong>van</strong> de studie, vooraleer de data word<strong>en</strong> verzameld <strong>en</strong> de teststatistiek wordt waarg<strong>en</strong>om<strong>en</strong>.<br />
E<strong>en</strong> keuze achteraf zou betek<strong>en</strong><strong>en</strong> dat je de beslissing ( H<br />
0<br />
verwerp<strong>en</strong> of niet) kunt aanpass<strong>en</strong><br />
zoals je zelf wil in plaats <strong>van</strong> te prober<strong>en</strong> om de waarheid te achterhal<strong>en</strong>.<br />
Voor welke p-waarde zull<strong>en</strong> we H<br />
0<br />
verwerp<strong>en</strong>, voor welke niet? Het significanti<strong>en</strong>iveau α<br />
geeft de gr<strong>en</strong>s aan. Duid in onderstaand interval [ 0,1 ] <strong>het</strong> gebied <strong>van</strong> p-waard<strong>en</strong> aan<br />
waarvoor H<br />
0<br />
wordt verworp<strong>en</strong> <strong>en</strong> <strong>het</strong> gebied <strong>van</strong> p-waard<strong>en</strong> waarvoor H 0<br />
niet wordt<br />
verworp<strong>en</strong>.<br />
• •<br />
0 α<br />
•<br />
1<br />
26
We verwerp<strong>en</strong> H 0<br />
als de p-waarde ________ α . In dit geval zegg<strong>en</strong> we dat de<br />
steekproefdata statistisch significant zijn (ze lever<strong>en</strong> <strong>het</strong> statistisch bewijs waarmee we de<br />
traditionele nulhypothese kunn<strong>en</strong> weerlegg<strong>en</strong>)<br />
We verwerp<strong>en</strong> H<br />
0<br />
niet als de p-waarde ________ α .<br />
D<strong>en</strong>k nu e<strong>en</strong>s na over <strong>het</strong> volg<strong>en</strong>de: als je overdrijft in je voorzichtigheid bij <strong>het</strong> vermijd<strong>en</strong><br />
<strong>van</strong> e<strong>en</strong> type I fout (door e<strong>en</strong> zeer kleine α te kiez<strong>en</strong>), welk effect heeft dit dan volg<strong>en</strong>s jou<br />
op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type II fout?<br />
_____________________________________________<br />
De kans op e<strong>en</strong> type II fout wordt β g<strong>en</strong>oemd. Om β onder controle te houd<strong>en</strong> mog<strong>en</strong> we α<br />
niet overdrev<strong>en</strong> klein mak<strong>en</strong>, t<strong>en</strong>zij we voldo<strong>en</strong>de bewijs (data) kunn<strong>en</strong> aanlever<strong>en</strong> om<br />
overtuig<strong>en</strong>d te kunn<strong>en</strong> besliss<strong>en</strong> (zie volg<strong>en</strong>de paragraaf).<br />
VII De invloed <strong>van</strong> de steekproefgrootte (optie 1)<br />
M<strong>en</strong> kiest vaak α = 5%,10% of 1% .<br />
Stud<strong>en</strong>t A werkt met 10 e<strong>en</strong>d<strong>en</strong>, stud<strong>en</strong>t B met 20 e<strong>en</strong>d<strong>en</strong>, stud<strong>en</strong>t C met 40 e<strong>en</strong>d<strong>en</strong>.<br />
Veronderstel dat de drie stud<strong>en</strong>t<strong>en</strong> de opdracht krijg<strong>en</strong> om te werk<strong>en</strong> met e<strong>en</strong><br />
significanti<strong>en</strong>iveau α ≃ 5% , zo dicht als mogelijk bij 5% (bij e<strong>en</strong> discrete testvariabele is<br />
α = 5% exact immers meestal niet mogelijk).<br />
Bepaal (met je rek<strong>en</strong>toestel) voor elk <strong>van</strong> de stud<strong>en</strong>t<strong>en</strong> <strong>het</strong> minimum aantal e<strong>en</strong>d<strong>en</strong> dat <strong>het</strong><br />
gro<strong>en</strong>e brood moet oppikk<strong>en</strong> om de nulhypothese H<br />
0<br />
te kunn<strong>en</strong> verwerp<strong>en</strong> (De p-waarde bij<br />
dit minimum is gelijk aan <strong>het</strong> significanti<strong>en</strong>iveau α ). Vul de volg<strong>en</strong>de tabel in, waarbij x <strong>het</strong><br />
aantal e<strong>en</strong>d<strong>en</strong> is dat eerst <strong>het</strong> gro<strong>en</strong>e brood oppikt.<br />
Stud<strong>en</strong>t n H<br />
0<br />
niet verwerp<strong>en</strong> als x ≤ H<br />
0<br />
verwerp<strong>en</strong> als x ≥<br />
A 10<br />
B 20<br />
C 40<br />
Veronderstel nu dat H<br />
0<br />
niet waar is; stel dat 80% <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong>populatie <strong>het</strong> gro<strong>en</strong>e<br />
brood verkiez<strong>en</strong>. Maak gebruik <strong>van</strong> de waard<strong>en</strong> <strong>van</strong> x die je in bov<strong>en</strong>staande tabel hebt<br />
g<strong>en</strong>oteerd <strong>en</strong> werk met je rek<strong>en</strong>toestel.<br />
Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.8 )<br />
A 10<br />
B 20<br />
C 40<br />
Schrijf e<strong>en</strong> kort verslag over de invloed <strong>van</strong> de steekproefgrootte op β .<br />
27
VIII Werd de nulhypothese terecht verworp<strong>en</strong>? (Optie 2)<br />
Het onderscheidingsvermog<strong>en</strong> 1− β <strong>van</strong> e<strong>en</strong> test (Engels: power ) geeft aan hoe goed de test<br />
in staat is om de nulhypothese terecht te verwerp<strong>en</strong> (de alternatieve hypothese is inderdaad<br />
waar). Bespreek, met de resultat<strong>en</strong> <strong>van</strong> voorgaande paragraaf, de invloed <strong>van</strong> de<br />
steekproefgrootte op <strong>het</strong> onderscheidingsvermog<strong>en</strong>.<br />
H<br />
0<br />
is waar<br />
H<br />
0<br />
is niet waar<br />
je verwerpt H<br />
0<br />
je verwerpt H<br />
0<br />
niet<br />
Type I fout<br />
juiste beslissing<br />
kans α =<br />
kans 1− α =<br />
significanti<strong>en</strong>iveau<br />
juiste beslissing<br />
kans 1− β =<br />
onderscheidingsvermog<strong>en</strong><br />
betrouwbaarheidsniveau<br />
Type II fout<br />
Kans β<br />
Veronderstel nu dat H<br />
0<br />
niet waar is, maar dat slechts 70% <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong>populatie <strong>het</strong><br />
gro<strong>en</strong>e brood verkiez<strong>en</strong>. Bepaal opnieuw de kans β op e<strong>en</strong> type II fout <strong>en</strong> <strong>het</strong><br />
onderscheidingsvermog<strong>en</strong> 1− β ? Vergelijk dit met de situatie p = 0.8<br />
Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.7 )<br />
A 10<br />
B 20<br />
C 40<br />
----------------------------------------------------------------------------------------------------------------<br />
We hebb<strong>en</strong> de basisbegripp<strong>en</strong> <strong>van</strong> hypothesetest<strong>en</strong> besprok<strong>en</strong>. Herlees nu de ope<strong>en</strong>volg<strong>en</strong>de<br />
stapp<strong>en</strong> (a) tot (f) in paragraaf V. Herinner je dat je vóór stap (d) e<strong>en</strong> significanti<strong>en</strong>iveau α<br />
moet vastlegg<strong>en</strong> waarmee je zal werk<strong>en</strong>. Herbekijk de nieuwe woord<strong>en</strong> (vetjes gedrukt) die<br />
werd<strong>en</strong> ingevoerd, begrijp je hun betek<strong>en</strong>is? De stapp<strong>en</strong> (a) tot (f), sam<strong>en</strong> met de<br />
vooropgestelde α , zull<strong>en</strong> nuttig zijn in andere situaties waarbij je e<strong>en</strong> antwoord moet zoek<strong>en</strong><br />
op e<strong>en</strong> onderzoeksvraag m.b.v. <strong>het</strong> uitvoer<strong>en</strong> <strong>van</strong> e<strong>en</strong> hypothesetest.<br />
28
Antwoord<strong>en</strong> bij de werktekst ( I tot VIII)<br />
II Statistische hypothes<strong>en</strong><br />
……..<br />
De ideeën word<strong>en</strong> dan kort:<br />
1) p = 1/2<br />
2) p > 1/2<br />
III Bewijsmateriaal verzamel<strong>en</strong> om te kunn<strong>en</strong> besliss<strong>en</strong><br />
……………..<br />
Als de e<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong> brood, wat is dan de verdeling <strong>van</strong> de<br />
variabele X ?<br />
X is binomiaal verdeeld met parameters n = 10 <strong>en</strong> 1/2 X ∼ B 10, 1/ 2<br />
IV De weg naar de beslissing<br />
p = : ( )<br />
Als de vrouwtjese<strong>en</strong>d<strong>en</strong> echt onverschillig zijn t.o.v. gro<strong>en</strong> of gewoon brood, hoeveel <strong>van</strong> de<br />
10 e<strong>en</strong>d<strong>en</strong> verwacht je dan die eerst naar <strong>het</strong> gro<strong>en</strong>e brood zwemm<strong>en</strong>?<br />
Vier of vijf of zes (ongeveer de helft). Het is natuurlijk maar e<strong>en</strong> steekproef dus <strong>het</strong><br />
hoeft niet exact vijf te zijn. Neg<strong>en</strong> of ti<strong>en</strong> verwacht<strong>en</strong> we zeker niet.<br />
……..<br />
Stel dat de populatie <strong>van</strong> alle slobe<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gewoon of gro<strong>en</strong> brood (stel<br />
dat H<br />
0<br />
waar is), wat is dan de kans om in e<strong>en</strong> steekproef <strong>van</strong> 10 e<strong>en</strong>d<strong>en</strong> er 9 aan te treff<strong>en</strong> die<br />
eerst <strong>het</strong> gro<strong>en</strong>e brood oppikk<strong>en</strong>?<br />
10 1<br />
9 1<br />
1 1<br />
10<br />
⎛ ⎞⎛ ⎞ ⎛ ⎞<br />
P( X = 9)<br />
= ⎜ 10 0.98%<br />
9<br />
⎟⎜ ⎟ ⎜ ⎟ = ⋅ <br />
⎝ ⎠⎝2⎠ ⎝2⎠<br />
2<br />
………We will<strong>en</strong> dus de kans k<strong>en</strong>n<strong>en</strong> op e<strong>en</strong> resultaat dat minst<strong>en</strong>s ev<strong>en</strong> groot is als <strong>het</strong><br />
steekproefresultaat, in de veronderstelling dat de nulhypothese waar is. Berek<strong>en</strong> deze kans<br />
10 1<br />
P( X ≥ 9) = P( X = 9) + P( X = 10) = + ≃ 1.07%<br />
10 10<br />
2 2<br />
……..<br />
Vind je deze p-waarde klein of groot? Deze kans is zeer klein<br />
Geloof je dat de nulhypothese H<br />
0<br />
waar is, rek<strong>en</strong>ing houd<strong>en</strong>d met deze p-waarde? (omcirkel<br />
je antwoord). Ne<strong>en</strong><br />
Welke hypothese krijgt dus je voorkeur, H<br />
0<br />
of H<br />
1<br />
? H<br />
1<br />
Verwerp je H<br />
0<br />
of verwerp je H<br />
0<br />
niet? Ik verwerp H<br />
0<br />
.<br />
Formuleer je antwoord op de onderzoeksvraag:<br />
De vrouwtjes slobe<strong>en</strong>d<strong>en</strong> verkiez<strong>en</strong> gro<strong>en</strong> brood bov<strong>en</strong> gewoon brood.<br />
29
VI Op hoeveel verschill<strong>en</strong>de manier<strong>en</strong> kunn<strong>en</strong> we e<strong>en</strong> verkeerde beslissing nem<strong>en</strong>?<br />
……..<br />
(1) We verwerp<strong>en</strong> de nulhypothese H<br />
0<br />
, terwijl H<br />
0<br />
in werkelijkheid waar is.<br />
We bewer<strong>en</strong> dat de e<strong>en</strong>d<strong>en</strong> <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong> terwijl ze in werkelijkheid<br />
ge<strong>en</strong> voorkeur hebb<strong>en</strong> voor gro<strong>en</strong> of gewoon brood.<br />
(2) We verwerp<strong>en</strong> de nulhypothese H<br />
0<br />
niet, terwijl H<br />
0<br />
in werkelijkheid niet waar is.<br />
We bewer<strong>en</strong> dat de e<strong>en</strong>d<strong>en</strong> onverschillig zijn voor gro<strong>en</strong> of gewoon brood, terwijl ze<br />
in werkelijkheid <strong>het</strong> gro<strong>en</strong>e brood verkiez<strong>en</strong>.<br />
……………….<br />
α = P X ≥ 8 = 1−P X ≤7 ≃ 5.5%<br />
…………..<br />
( ) ( )<br />
We verwerp<strong>en</strong> H<br />
0<br />
als de p-waarde<br />
We verwerp<strong>en</strong> H<br />
0<br />
niet als de p-waarde<br />
≤ α .<br />
> α .<br />
D<strong>en</strong>k nu e<strong>en</strong>s na over <strong>het</strong> volg<strong>en</strong>de: als je overdrijft in je voorzichtigheid bij <strong>het</strong> vermijd<strong>en</strong><br />
<strong>van</strong> e<strong>en</strong> type I fout (door e<strong>en</strong> zeer kleine α te kiez<strong>en</strong>), welk effect heeft dit dan volg<strong>en</strong>s jou<br />
op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type II fout?<br />
De kans op <strong>het</strong> mak<strong>en</strong> <strong>van</strong> e<strong>en</strong> type II fout wordt groter.<br />
VII De invloed <strong>van</strong> de steekproefgrootte (optie 1)<br />
Stud<strong>en</strong>t n H<br />
0<br />
niet verwerp<strong>en</strong> als x ≤ H<br />
0<br />
verwerp<strong>en</strong> als x ≥<br />
A 10 7 8 ( α ≃ 5.5% )<br />
B 20 13 14 ( α ≃ 5.8% )<br />
C 40 25 26 ( α ≃ 4.0% )<br />
Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.8 )<br />
A 10 P( X ≤ 7)<br />
=binomcdf (10, 0.8, 7) ≃ 32.2%<br />
B 20 P( X ≤ 13)<br />
=binomcdf (20, 0.8, 13) ≃ 8.7%<br />
C 40 P( X ≤ 25)<br />
=binomcdf (40, 0.8, 25) ≃ 0.8%<br />
De kans β op e<strong>en</strong> type II fout wordt gevoelig kleiner met to<strong>en</strong>em<strong>en</strong>de<br />
steekproefgrootte n, terwijl <strong>het</strong> significanti<strong>en</strong>iveau α of de kans op e<strong>en</strong> type I fout<br />
(nag<strong>en</strong>oeg) constant blijft.<br />
VIII Werd de nulhypothese terecht verworp<strong>en</strong>? (Optie 2)<br />
…..<br />
Bespreek, met de resultat<strong>en</strong> <strong>van</strong> voorgaande paragraaf, de invloed <strong>van</strong> de steekproefgrootte<br />
op <strong>het</strong> onderscheidingsvermog<strong>en</strong>.<br />
Het onderscheidingsvermog<strong>en</strong> 1− β neemt toe met to<strong>en</strong>em<strong>en</strong>de steekproefgrootte n<br />
(bij constante α ).<br />
30
Veronderstel nu dat H<br />
0<br />
niet waar is, maar dat slechts 70% <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong>populatie <strong>het</strong><br />
gro<strong>en</strong>e brood verkiez<strong>en</strong>. Bepaal opnieuw de kans β op e<strong>en</strong> type II fout <strong>en</strong> <strong>het</strong><br />
onderscheidingsvermog<strong>en</strong> 1− β ? Vergelijk dit met de situatie p = 0.8<br />
Stud<strong>en</strong>t n β (met α ≃ 5% <strong>en</strong> p = 0.7 )<br />
A 10 P( X ≤ 7)<br />
=binomcdf (10,0.7, 7) ≃ 61.7%<br />
B 20 P( X ≤ 13)<br />
=binomcdf (20,0.7, 13) ≃ 39.2%<br />
C 40 P( X ≤ 25)<br />
=binomcdf (40,0.7, 25) ≃ 19.3%<br />
Het onderscheidingsvermog<strong>en</strong> 1− β neemt af (bij vaste n <strong>en</strong> α ) naarmate <strong>het</strong><br />
werkelijke perc<strong>en</strong>tage <strong>van</strong> de slobe<strong>en</strong>d<strong>en</strong> die kiez<strong>en</strong> voor <strong>het</strong> gro<strong>en</strong>e brood dichter bij<br />
0.5 geleg<strong>en</strong> is.<br />
3 B<strong>en</strong>ader<strong>en</strong>de test voor e<strong>en</strong> proportie bij e<strong>en</strong> grote steekproef<br />
We w<strong>en</strong>s<strong>en</strong> na te gaan of e<strong>en</strong> individu uit de populatie e<strong>en</strong> bepaalde eig<strong>en</strong>schap bezit.<br />
aantal individu<strong>en</strong> in de populatie met de eig<strong>en</strong>schap<br />
p = is de populatieproportie.<br />
aantal individu<strong>en</strong> in de populatie<br />
De steekproefproportie is de toevalsvariabele :<br />
ˆ X aantal individu<strong>en</strong> in de steekproef met de eig<strong>en</strong>schap<br />
P = =<br />
n<br />
aantal individu<strong>en</strong> in de steekproef<br />
Merk op dat ˆP e<strong>en</strong> onvertek<strong>en</strong>de schatter is <strong>van</strong> p want E ( Pˆ<br />
)<br />
= p.<br />
Voor n voldo<strong>en</strong>de groot is de variabele Z =<br />
Pˆ<br />
− p X −np<br />
=<br />
p(1 − p) np(1 − p)<br />
bij b<strong>en</strong>adering standaard<br />
n<br />
normaal verdeeld omwille <strong>van</strong> de c<strong>en</strong>trale limietstelling (zie ook pagina 16).<br />
Als vuistregel voor n voldo<strong>en</strong>de groot nem<strong>en</strong> we de voorwaard<strong>en</strong> :<br />
⎧ np ≥ 5<br />
⎨<br />
⎩ n(1 − p) ≥5<br />
Pˆ<br />
− p0<br />
Het uitvoer<strong>en</strong> <strong>van</strong> de hypothesetest H 0 : p = p 0 versus b.v. H 1 : p < p 0 met Z =<br />
p0(1 − p0)<br />
n<br />
als testvariabele kan met de TI-84 Plus via <strong>het</strong> commando STAT 5:1-PropZTest.<br />
31
Opgav<strong>en</strong>:<br />
1) E<strong>en</strong> krant<strong>en</strong>artikel beweert dat 40% <strong>van</strong> de bevolking (leeftijdsgroep ≥ 12 jaar) rookt. Je<br />
vermoedt dat dit niet klopt; e<strong>en</strong> steekproef <strong>van</strong> 100 person<strong>en</strong> ( ≥ 12 jaar) levert 52 rokers.<br />
Test H 0 : p =0.4 versus H 1 : p ≠ 0.4 (tweezijdige test) op <strong>het</strong> significanti<strong>en</strong>iveau α = 5% .<br />
a) Exact met <strong>het</strong> aantal rokers X als teststatistiek met e<strong>en</strong> binomiale verdeling.<br />
b) B<strong>en</strong>ader<strong>en</strong>d met X als teststatistiek met e<strong>en</strong> bij b<strong>en</strong>adering normale verdeling.<br />
Pˆ<br />
− p0<br />
c) B<strong>en</strong>ader<strong>en</strong>d met Z =<br />
p0(1 − p0)<br />
n<br />
als teststatistiek met e<strong>en</strong> standaard normale verdeling<br />
d) Los de onderzoeksvraag (spreekt <strong>het</strong> artikel de waarheid?) op m.b.v. e<strong>en</strong><br />
betrouwbaarheidsinterval met betrouwbaarheidsniveau 1− α = 95%<br />
2) E<strong>en</strong> toets bestaat uit 10 meerkeuzevrag<strong>en</strong> met elk 3 mogelijke antwoord<strong>en</strong> waar<strong>van</strong> er<br />
één juist is. E<strong>en</strong> juist antwoord levert 1 punt op, e<strong>en</strong> fout antwoord 0.<br />
E<strong>en</strong> stud<strong>en</strong>t haalt 8 op 10 op die toets <strong>en</strong> beweert gegokt te hebb<strong>en</strong>.<br />
Geloof je hem?<br />
Oplossing<strong>en</strong><br />
H waar is dan geldt X ∼ B( 100, 0.4)<br />
⋅P( X ≥ ) = ⋅ −P( X ≤ ) . Merk op dat we hierbij ( 52)<br />
Vraag 1) a) Als<br />
0<br />
( )<br />
. Als p-waarde vind<strong>en</strong> we<br />
2 52 2 1 51 2.0%<br />
P X ≥ verdubbel<strong>en</strong><br />
omdat <strong>het</strong> e<strong>en</strong> tweezijdige test betreft: kleine steekproefresultat<strong>en</strong> die minder dan 40% do<strong>en</strong><br />
vermoed<strong>en</strong> (met dezelfde kans als grote resultat<strong>en</strong> ≥ 52 die meer dan 40% do<strong>en</strong> vermoed<strong>en</strong> )<br />
mak<strong>en</strong> H<br />
0<br />
ev<strong>en</strong> verdacht. Aangezi<strong>en</strong> de p-waarde ≤ 5% is verwerp<strong>en</strong> we H<br />
0<br />
.<br />
b) Aangezi<strong>en</strong> X ∼ B( 100, 0.4)<br />
is E( X) n p 40<br />
Var ( X ) n p ( 1 p)<br />
100 0.4 0.6 24<br />
= ⋅ = <strong>en</strong><br />
= ⋅ ⋅ − = ⋅ ⋅ = ; omwille <strong>van</strong> de c<strong>en</strong>trale limietstelling geldt bij<br />
b<strong>en</strong>adering X N( 40, 24 )<br />
∼ .<br />
Als p-waarde vind<strong>en</strong> we met deze normale verdeling 2⋅P( X ≥52)<br />
≃ 1.4% .<br />
Met continuïteitscorrectie verkrijg<strong>en</strong> we e<strong>en</strong> betere p-waarde P( X )<br />
= 2⋅ ≥51.5 1.9%<br />
32
Pˆ<br />
− p0<br />
c) De teststatistiek Z =<br />
p0(1 − p0)<br />
n<br />
pˆ − p0<br />
0.52 − 0.4<br />
neemt de waarde z = = 2.449 aan voor onze steekproef .<br />
p0(1 − p0) 0.4 ⋅0.6<br />
n 100<br />
2⋅P Z ≥2.449 ≃ 1.4% .<br />
De p-waarde is ( )<br />
d) E<strong>en</strong> b<strong>en</strong>ader<strong>en</strong>d betrouwbaarheidsinterval met betrouwbaarheidsniveau 1−<br />
α , voor e<strong>en</strong><br />
populatieproportie p, wordt gegev<strong>en</strong> door<br />
steekproefproportie is (zie pagina 17).<br />
( 1−<br />
pˆ)<br />
pˆ<br />
pˆ<br />
± zα<br />
/2<br />
⋅ , waarbij ˆp e<strong>en</strong><br />
n<br />
We vind<strong>en</strong> e<strong>en</strong> 95% betrouwbaarheidsinterval dat <strong>het</strong> getal 0.4 niet bevat. Bijgevolg<br />
verwerp<strong>en</strong> we H<br />
0<br />
.<br />
Vraag 2)<br />
Zij X <strong>het</strong> aantal juiste antwoord<strong>en</strong>, stel p de kans om e<strong>en</strong> vraag juist te beantwoord<strong>en</strong> (we<br />
veronderstell<strong>en</strong> dat alle vrag<strong>en</strong> dezelfde moeilijkheidsgraad hebb<strong>en</strong>).<br />
We test<strong>en</strong> H : 1/3<br />
0<br />
p= (de stud<strong>en</strong>t heeft gegokt)<br />
versus H : 1/3<br />
1<br />
p> (de stud<strong>en</strong>t heeft gestudeerd <strong>en</strong> niet gegokt).<br />
Als H<br />
0<br />
waar is dan geldt X ∼ B( 10, 1/ 3)<br />
.<br />
De p-waarde is P( X ) P( X )<br />
≥ 8 = 1− ≤7 ≃ 0.3% , dit is zeer klein.<br />
We hebb<strong>en</strong> e<strong>en</strong> overtuig<strong>en</strong>d bewijs teg<strong>en</strong> H<br />
0<br />
<strong>en</strong> gelov<strong>en</strong> de stud<strong>en</strong>t niet…<br />
33
4 Test voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale verdeling met gek<strong>en</strong>de<br />
standaardafwijking<br />
E<strong>en</strong> gezaghebb<strong>en</strong>d tijdschrift publiceert dat <strong>het</strong> geboortegewicht in Vlaander<strong>en</strong> normaal<br />
verdeeld is met e<strong>en</strong> gemiddelde <strong>van</strong> 3.3 kg <strong>en</strong> e<strong>en</strong> standaardafwijking <strong>van</strong><br />
0.55 kg.<br />
E<strong>en</strong> gynaecoloog heeft de indruk dat <strong>het</strong> gemiddelde geboortegewicht in zijn kliniek groter is<br />
dan 3.3 kg. Om zijn hypothese te test<strong>en</strong> houdt hij gegev<strong>en</strong>s bij <strong>van</strong> dertig kinder<strong>en</strong>.<br />
de hieronder afgebeelde data (in kg) <strong>van</strong> de gynaecoloog plaats<strong>en</strong> we in de lijst L1.<br />
3.54 3.67 3.13 3.76 3.99 4.13 3.22 1.63 2.77 3.36<br />
3.49 3.22 3.04 3.76 3.86 3.58 4.08 3.58 3.22 3.13<br />
2.72 3.22 3.4 4.31 3.76 3.36 4.58 3.13 4.08 3.76<br />
De gynaecoloog berek<strong>en</strong>t <strong>het</strong> gemiddelde <strong>van</strong> zijn steekproef <strong>en</strong> bekomt als resultaat<br />
x = 3.483 kg . Hij vraagt zich af of hij met dit resultaat mag besluit<strong>en</strong> dat <strong>het</strong> gemiddelde<br />
geboortegewicht in zijn kliniek groter is dan 3.3 kg.<br />
Om zijn veronderstelling te test<strong>en</strong>, start hij met <strong>het</strong> opstell<strong>en</strong> <strong>van</strong> e<strong>en</strong> kansmodel voor de<br />
populatie waaruit de steekproef werd getrokk<strong>en</strong>. De arts gaat er<strong>van</strong> uit dat de<br />
geboortegewicht<strong>en</strong> in zijn kliniek normaal verdeeld zijn met gemiddelde <strong>en</strong><br />
standaardafwijking deze <strong>van</strong> gans Vlaander<strong>en</strong>: σ = 0.55 kg<br />
Vervolg<strong>en</strong>s formuleert hij twee hypothes<strong>en</strong> over de parameter µ <strong>van</strong> de populatie:<br />
de nulhypothese H 0 (de norm die hij graag zou weerlegg<strong>en</strong>), <strong>en</strong> e<strong>en</strong> alternatieve hypothese H 1<br />
(zijn vermoed<strong>en</strong> dat hij graag zou will<strong>en</strong> aanton<strong>en</strong> of statistisch bewijz<strong>en</strong>). De alternatieve<br />
hypothese is dat <strong>het</strong> gemiddelde geboortegewicht in zijn kliniek groter is dan 3.3 kg. We<br />
noter<strong>en</strong> de hypothes<strong>en</strong> als volgt :<br />
⎧ H 0 : µ = 3.3 kg<br />
⎨<br />
⎩ H 1 : µ > 3.3 kg<br />
We test<strong>en</strong> H 0 : µ = 3.3 versus H 1 : µ > 3.3.<br />
De hypothesetest verloopt verder als volgt. We veronderstell<strong>en</strong> in de red<strong>en</strong>ering dat de<br />
nulhypothese H 0 waar is. Indi<strong>en</strong> <strong>het</strong> gemiddelde geboortegewicht x <strong>van</strong> de steekproef <strong>van</strong> de<br />
gynaecoloog te groot is, verwerp<strong>en</strong> we de nulhypothese H 0 <strong>en</strong> aanvaard<strong>en</strong> we de alternatieve<br />
hypothese H 1 .<br />
Wat betek<strong>en</strong>t te groot ?<br />
Zou je uit e<strong>en</strong> populatie met e<strong>en</strong> gemiddelde <strong>van</strong> 3.3 kg gemakkelijk e<strong>en</strong><br />
steekproefgemiddelde <strong>van</strong> 3.483 kg of zelfs meer kunn<strong>en</strong> verkrijg<strong>en</strong>?<br />
34
Het verkreg<strong>en</strong> steekproefgemiddelde<br />
x = 3.483 kg is e<strong>en</strong> door <strong>het</strong> toeval verkreg<strong>en</strong> waarde<br />
<strong>van</strong> de stochast of toevalsvariabele X = 1 ( X ... )<br />
1<br />
+ + X30<br />
, waarbij elke X<br />
i<br />
verdeeld is zoals<br />
30<br />
de populatievariabele X.<br />
Om e<strong>en</strong> uitspraak te do<strong>en</strong> over <strong>het</strong> al dan niet te groot zijn <strong>van</strong> de geobserveerde waarde<br />
x = 3.483, bekijk<strong>en</strong> we de ligging <strong>van</strong> x op de grafiek <strong>van</strong> de dichtheidsfunctie <strong>van</strong> X .<br />
Indi<strong>en</strong> we veronderstell<strong>en</strong> dat H 0 waar is, geldt :<br />
X ∼ N(3.3,0.55) <strong>en</strong><br />
0.55<br />
X ∼ N(3.3, ) of X ∼ N(3.3,0.1)<br />
30<br />
De toevalsvariabele X is de testvariabele, dit is e<strong>en</strong><br />
functie <strong>van</strong> de steekproef waarmee we gaan<br />
besliss<strong>en</strong> of we kiez<strong>en</strong> voor H 0 of H 1 .<br />
De waarde x = 3.483 bevindt zich erg rechts;<br />
x ligt zelfs zo ver naar rechts dat de kans (indi<strong>en</strong><br />
H 0 waar is) om zo’n geobserveerde waarde te<br />
krijg<strong>en</strong> of groter, zeer klein is.<br />
Dichtheidsfunctie <strong>van</strong> X<br />
E<strong>en</strong> dergelijke geobserveerde waarde onder de nulhypothese kan dus moeilijk verklaard<br />
word<strong>en</strong> door louter toeval.<br />
We zegg<strong>en</strong> dat de geobserveerde waarde x statistisch significant is <strong>en</strong> verwerp<strong>en</strong> de<br />
nulhypothese.<br />
Stel ev<strong>en</strong> dat de geobserveerde waarde x <strong>van</strong> de<br />
gynaecoloog 3.4 kg was. Op de grafiek <strong>van</strong> de<br />
dichtheidsfunctie <strong>van</strong> X zi<strong>en</strong> we dat in dit geval de<br />
kans (indi<strong>en</strong> H 0 waar is) om e<strong>en</strong> geobserveerde<br />
waarde <strong>van</strong> 3.4 kg of meer te verkrijg<strong>en</strong>, al heel<br />
wat groter is dan voor x = 3.483 kg . Het is niet<br />
Dichtheidsfunctie X<br />
meer zo evid<strong>en</strong>t om de nulhypothese te verwerp<strong>en</strong>.<br />
Hoe verder de geobserveerde waarde x zich bevindt in de positieve richting, hoe meer we<br />
g<strong>en</strong>eigd zijn om de nulhypothese te verwerp<strong>en</strong>.<br />
E<strong>en</strong> getal dat gebruikt wordt om weer te gev<strong>en</strong> hoe sterk de geobserveerde waarde afwijkt <strong>van</strong><br />
de nulhypothese, is de p-waarde (probability value of overschrijdingskans).<br />
De p-waarde is de kans, indi<strong>en</strong> de nulhypothese waar is, om e<strong>en</strong> waarde te verkrijg<strong>en</strong> <strong>van</strong> de<br />
toetsingsgrootheid die minst<strong>en</strong>s ev<strong>en</strong> extreem is als de geobserveerde waarde. Met extreem<br />
bedoel<strong>en</strong> we waard<strong>en</strong> die nog meer zoud<strong>en</strong> wijz<strong>en</strong> in de richting <strong>van</strong> de alternatieve<br />
hypothese.<br />
Voor de geobserveerde waarde <strong>van</strong> de gynaecoloog<br />
geeft dit :<br />
PX≥ ( 3.483) = 0.034 = 3.4%<br />
35
Deze kans is klein <strong>en</strong> vormt e<strong>en</strong> goed bewijs teg<strong>en</strong> de nulhypothese. Slechts in 34<br />
steekproev<strong>en</strong> op 1000 zal e<strong>en</strong> dergelijke gebeurt<strong>en</strong>is optred<strong>en</strong> onder de nulhypothese.<br />
Hoe kleiner de p-waarde hoe meer <strong>het</strong> aanneembaar is de nulhypothese te verwerp<strong>en</strong>. Hoe<br />
klein moet de p-waarde zijn om de nulhypothese te verwerp<strong>en</strong> ?<br />
Dit hangt af <strong>van</strong> de situatie <strong>en</strong> de belangrijkheid of de gevolg<strong>en</strong> <strong>van</strong> de beslissing.<br />
Om te besliss<strong>en</strong> hanteert m<strong>en</strong> de volg<strong>en</strong>de regel. M<strong>en</strong> kiest vooraf e<strong>en</strong> significanti<strong>en</strong>iveau α :<br />
verwerp H 0 bij e<strong>en</strong> p-waarde ≤ α (we zegg<strong>en</strong> dat de steekproefdata statistisch significant zijn<br />
op <strong>het</strong> α -niveau), verwerp H 0 niet bij e<strong>en</strong> p-waarde > α .<br />
Om historische red<strong>en</strong><strong>en</strong> kiest m<strong>en</strong> vaak α = 0.05 = 5% of α = 0.01 = 1% .<br />
De gynaecoloog had gekoz<strong>en</strong> voor α = 0.05 , op basis <strong>van</strong> de p-waarde = 0.034 verwerpt hij<br />
dus de nulhypothese <strong>en</strong> aanvaardt de alternatieve hypothese µ > 3.3 .<br />
De statisticus beperkt zich vaak tot <strong>het</strong> rapporter<strong>en</strong> <strong>van</strong> de p-waarde <strong>en</strong> laat de beslissing<br />
meestal over aan zijn opdrachtgever die zijn eig<strong>en</strong> significanti<strong>en</strong>iveau op voorhand bepaalde.<br />
De p-waarde geeft meer informatie dan <strong>het</strong> significanti<strong>en</strong>iveau dat alle<strong>en</strong> di<strong>en</strong>t om de gr<strong>en</strong>s te<br />
legg<strong>en</strong> tuss<strong>en</strong> aanvaard<strong>en</strong> <strong>en</strong> verwerp<strong>en</strong> <strong>van</strong> de nulhypothese. Zo zijn de steekproefdata <strong>van</strong><br />
de gynaecoloog significant op <strong>het</strong> 5 % niveau, ook op <strong>het</strong> 4 % of <strong>het</strong> 3.5 % niveau, maar niet<br />
op <strong>het</strong> 3 % niveau.<br />
De p-waarde is bijgevolg <strong>het</strong> kleinste significanti<strong>en</strong>iveau waarvoor de steekproefdata<br />
significant zijn.<br />
Wanneer m<strong>en</strong> <strong>en</strong>kel beschikt over statistische tabell<strong>en</strong> <strong>van</strong> de standaard normale verdeling is<br />
m<strong>en</strong> verplicht e<strong>en</strong> andere testgrootheid te nem<strong>en</strong> dan X , nl.<br />
X − 3.3<br />
Z = ∼ N(0,1)<br />
.<br />
0.55/ 30<br />
We sprek<strong>en</strong> dan over de Z-test. We berek<strong>en</strong><strong>en</strong> de p-waarde in dit geval als volgt :<br />
Met de TI-84 voer je deze test uit met <strong>het</strong> commando STAT 1: Z-Test.<br />
Vul dan <strong>het</strong> Z-Test-v<strong>en</strong>ster in zoals hiernaast is<br />
afgebeeld.<br />
Indi<strong>en</strong> de resultat<strong>en</strong> <strong>van</strong> de steekproef in e<strong>en</strong> lijst<br />
gegev<strong>en</strong> zijn, selecteer je voor <strong>het</strong> item Inpt de optie<br />
Data <strong>en</strong> als je <strong>en</strong>kel statistische k<strong>en</strong>getall<strong>en</strong> k<strong>en</strong>t<br />
<strong>van</strong> de steekproef, bv. x = 3.4 , selecteer je de optie<br />
Stats.<br />
⎛ X −3.3 x−3.3 ⎞ 3.483−3.3<br />
⎞<br />
P⎜ ≥ ⎟= P(<br />
Z≥<br />
⎟<br />
⎝ 0.55/ 30 0.55/ 30 ⎠ 0.55/ 30 ⎠<br />
( Z )<br />
= P ≥ 1.822 = 0.034<br />
36
Plaats de cursor op Calculate <strong>en</strong> druk op ENTER. Het resultaat vind je links op de<br />
onderstaande figuur.<br />
Activeer opnieuw <strong>het</strong> Z-Test-v<strong>en</strong>ster, selecteer Draw <strong>en</strong> druk op ENTER. Het resultaat vind je<br />
rechts op de onderstaande figuur.<br />
X − µ<br />
0<br />
x − µ<br />
0<br />
z is de geobserveerde waarde <strong>van</strong> de testgrootheid Z = , zodat z = .<br />
σ / n<br />
σ / n<br />
Voor <strong>het</strong> geval<br />
x = 3.4 kg vind je hieronder de resultat<strong>en</strong> <strong>van</strong> de Z-Test.<br />
De p-waarde bij x = 3.4 kg of z = 0.9958 is 0.1597. Dit is gevoelig groter dan 0.05 = 5% ,<br />
zodat we de nulhypothese niet kunn<strong>en</strong> verwerp<strong>en</strong> op e<strong>en</strong> 5% significanti<strong>en</strong>iveau. Let op de<br />
terminologie: we verwerp<strong>en</strong> de nulhypothese niet, <strong>het</strong> is dus mogelijk dat µ = 3.3 .<br />
We sprek<strong>en</strong> liever niet over <strong>het</strong> aanvaard<strong>en</strong> <strong>van</strong> de nulhypothese, aangezi<strong>en</strong> we niet hebb<strong>en</strong><br />
“bewez<strong>en</strong>” dat µ exact gelijk is aan 3.3.<br />
Bov<strong>en</strong>staande test noemt m<strong>en</strong> e<strong>en</strong> éénzijdige test omdat m<strong>en</strong> op voorhand vermoedt in welke<br />
richting e<strong>en</strong> afwijking <strong>van</strong> H 0 wordt verwacht.<br />
Indi<strong>en</strong> m<strong>en</strong> dit niet op voorhand vermoedt, dan nem<strong>en</strong> we als alternatieve hypothese dat de<br />
populatie verschilt <strong>van</strong> wat er in de nulhypothese gesteld wordt. We test<strong>en</strong> H 0 : µ = 3.3<br />
versus H 1 : µ ≠ 3.3. Dit noem<strong>en</strong> we e<strong>en</strong> tweezijdige test.<br />
Het uitvoer<strong>en</strong> <strong>van</strong> deze test verloopt analoog. Het resultaat <strong>van</strong> deze test is :<br />
Merk op dat in dit geval de p-waarde <strong>het</strong> dubbel is <strong>van</strong> de p-waarde <strong>van</strong> de éénzijdige test.<br />
Dit is zo omdat we voor e<strong>en</strong> tweezijdige test e<strong>en</strong> ev<strong>en</strong> extreme afwijking (d.w.z. met e<strong>en</strong>zelfde<br />
kans) in beide richting<strong>en</strong> beschouw<strong>en</strong>. Zowel te grote als te kleine waard<strong>en</strong> zijn nu verdacht.<br />
Voor de tweezijdige test is de p-waarde = 0.068 > 0.05 , we verwerp<strong>en</strong> de nulhypothese dus<br />
niet op <strong>het</strong> 5% significanti<strong>en</strong>iveau.<br />
37
Dit laatste kan verwarr<strong>en</strong>d overkom<strong>en</strong> daar de nulhypothese bij de éénzijdige test wordt<br />
verworp<strong>en</strong> <strong>en</strong> in <strong>het</strong> geval <strong>van</strong> e<strong>en</strong> tweezijdige niet. Welk besluit moet<strong>en</strong> we nem<strong>en</strong> ?<br />
Indi<strong>en</strong> we op voorhand ge<strong>en</strong> vermoed<strong>en</strong> hebb<strong>en</strong> over <strong>het</strong> gemiddelde voer<strong>en</strong> we e<strong>en</strong><br />
tweezijdige test uit m.b.v. e<strong>en</strong> steekproef (H 0 : µ = µ 0 versus H 1 : µ ≠ µ 0).<br />
Indi<strong>en</strong> we de geobserveerde waarde x uit de steekproef zoud<strong>en</strong> gebruik<strong>en</strong> om de alternatieve<br />
hypothese te verander<strong>en</strong> (bv. H 0 : µ = µ 0 versus H 1 : µ > µ 0 ) om dan e<strong>en</strong> éénzijdige test uit<br />
te voer<strong>en</strong> met dezelfde steekproef, zou dit statistisch oneerlijk zijn t.o.v. de onwet<strong>en</strong>dheid<br />
waarmee we gestart zijn.<br />
5 De binomiale verdeling <strong>en</strong> de TI-84 Plus<br />
Werp 20 keer e<strong>en</strong> dobbelste<strong>en</strong>. De kans dat hierbij<br />
- juist 4 keer e<strong>en</strong> zes geworp<strong>en</strong> wordt, is :<br />
- juist 8 keer “zes of drie” :<br />
- <strong>en</strong> hoogst<strong>en</strong>s 4 keer e<strong>en</strong> zes :<br />
8 12<br />
⎛20⎞⎛1 ⎞ ⎛2<br />
⎞<br />
⎜ 8 ⎟⎜ ⎟ ⎜ ⎟<br />
⎝ ⎠⎝3⎠ ⎝3⎠<br />
4 16<br />
⎛20⎞⎛1 ⎞ ⎛5<br />
⎞<br />
⎜ 4 ⎟⎜ ⎟ ⎜ ⎟<br />
⎝ ⎠⎝6⎠ ⎝6⎠<br />
= 0.148<br />
= 0.202 ,<br />
20−x<br />
4<br />
⎛20⎞⎛1 ⎞ ⎛5<br />
⎞<br />
PX ( ≤ 4) = ∑ ⎜ = 0.769<br />
x=<br />
0<br />
x ⎟⎜ ⎟ ⎜ ⎟<br />
⎝ ⎠⎝6⎠ ⎝6⎠<br />
x<br />
Je kan deze kans<strong>en</strong> met de TI-84 Plus berek<strong>en</strong><strong>en</strong> via :<br />
2nd[DISTR] 0:binompdf( <strong>en</strong> 2nd[DISTR] A:binomcdf(<br />
Voor X ~ B( n, p)is :<br />
binompdf(n,p,x) = P( X x)<br />
⎛n⎞<br />
⎜ ⎟<br />
⎝x<br />
⎠<br />
x<br />
= , d.i. de kansfunctie. Er geldt dat PX ( = x) = ⋅ p⋅( 1−<br />
p)<br />
x<br />
∑<br />
binomcdf(n,p,x) = P( X ≤ x) = P( X = k)<br />
d.i. de cumulatieve kansfunctie of de verdelings-<br />
functie.<br />
k = 0<br />
binompdf(n,p) g<strong>en</strong>ereert de kansverdeling <strong>van</strong> X in e<strong>en</strong> lijst (d.i. de lijst <strong>van</strong> getall<strong>en</strong><br />
P( X = x)<br />
met x = 0,1,2, …,<br />
n ) <strong>en</strong> binomcdf(n,p) levert de cumulatieve kansverdeling op <strong>van</strong><br />
X in e<strong>en</strong> lijst (d.i. de lijst <strong>van</strong> getall<strong>en</strong> P( X ≤ x)<br />
met x = 0,1,2, …,<br />
n ).<br />
n−x<br />
.<br />
38
E<strong>en</strong> lukrake waarde <strong>van</strong> de binomiaal verdeelde toevalsvariabele X verkrijg je met<br />
randBin(n,p) <strong>en</strong> e<strong>en</strong> lijst <strong>van</strong> k zo’n waard<strong>en</strong> met randBin(n,p,k). Zo simuleert<br />
randBin(10,0.5) <strong>het</strong> aantal keer kop bij ti<strong>en</strong> keer werp<strong>en</strong> <strong>van</strong> e<strong>en</strong> muntstuk.<br />
In wat volgt word<strong>en</strong> de binomiale kansverdeling<strong>en</strong> geg<strong>en</strong>ereerd voor<br />
p = 02 . , 05 . , 07 . . Op de volg<strong>en</strong>de wijze kun je ze grafisch voorstell<strong>en</strong> :<br />
n = 6 <strong>en</strong><br />
We verkrijg<strong>en</strong> e<strong>en</strong> symmetrische kansverdeling als p = 1/ 2.<br />
M<strong>en</strong> kan aanton<strong>en</strong> dat P( X = x)<br />
maximaal is voor x = int[( n +1 ) p]<br />
, d.i. <strong>het</strong> grootste geheel<br />
getal kleiner dan of gelijk aan (n+1)p. Deze maximale waarde treedt op in de buurt <strong>van</strong><br />
E( X)<br />
= np. Het laatste plaatje bevestigt dat E( X)<br />
= np.<br />
6 Bronn<strong>en</strong><br />
J. Beirlant, G. Dierckx, M. Hubert, Statistiek <strong>en</strong> wet<strong>en</strong>schap, Acco, Leuv<strong>en</strong>, 2005.<br />
E. Seier, C. Robe, Ducks and gre<strong>en</strong> - an introduction to the ideas of hypotheses testing, in<br />
Teaching Statistics, Vol. 24, Nr. 3, p 82- 85<br />
A. Engel, Wahrscheinlichkeitsrechnung und Statistik, Band 1, Ernst Klett Verlag, Stuttgart,<br />
1976.<br />
G. Herweyers, K. Stul<strong>en</strong>s, Statistiek met e<strong>en</strong> grafisch rek<strong>en</strong>toestel, Acco, Leuv<strong>en</strong>, 2000.<br />
D.S. Moore, G.P. McCabe, Statistiek in de Praktijk, Theorieboek, Academic Service,<br />
Schoonhov<strong>en</strong>, 2001.<br />
D.S. Moore, G.P. McCabe, Statistiek in de Praktijk, Opgav<strong>en</strong>boek, Academic Service,<br />
Schoonhov<strong>en</strong>, 2001.<br />
Java-applets :<br />
http://www.kuleuv<strong>en</strong>.ac.be/ucs/java<br />
39
Dit cahier behandelt betrouwbaarheidsintervall<strong>en</strong> <strong>en</strong> <strong>het</strong> test<strong>en</strong> <strong>van</strong> hypothes<strong>en</strong>, twee belangrijke<br />
begripp<strong>en</strong> uit de statistische besluitvorming, waarbij m<strong>en</strong> aan de hand <strong>van</strong> steekproefdata conclusies trekt<br />
over de populatie waar<strong>van</strong> de data afkomstig zijn.<br />
De voorbeeld<strong>en</strong> word<strong>en</strong> beperkt tot toepassing<strong>en</strong> op de normale <strong>en</strong> de binomiale verdeling:<br />
betrouwbaarheidsinterval <strong>en</strong> test voor <strong>het</strong> gemiddelde <strong>van</strong> e<strong>en</strong> normale verdeling met gek<strong>en</strong>de<br />
standaardafwijking, betrouwbaarheidsinterval <strong>en</strong> test voor e<strong>en</strong> proportie.<br />
De begripp<strong>en</strong> word<strong>en</strong> helder aangebracht. Simulaties <strong>van</strong> steekproeftrekking<strong>en</strong> illustrer<strong>en</strong> de rol <strong>van</strong> <strong>het</strong><br />
toeval bij betrouwbaarheidsintervall<strong>en</strong>. E<strong>en</strong> werktekst introduceert de procedure bij hypothesetest<strong>en</strong> als<br />
e<strong>en</strong> natuurlijk d<strong>en</strong>kproces, waarbij de nieuwe terminologie stapsgewijs wordt ingevoerd.<br />
GUIDO HERWEYERS doceert wiskunde <strong>en</strong> statistiek aan <strong>het</strong> Departem<strong>en</strong>t Industriële Wet<strong>en</strong>schapp<strong>en</strong> <strong>en</strong><br />
technologie <strong>van</strong> de Katholieke Hogeschool Brugge-Oost<strong>en</strong>de <strong>en</strong> is wet<strong>en</strong>schappelijk medewerker aan de<br />
K.U.Leuv<strong>en</strong>.<br />
© 2006 Dit cahier is bedoeld als lesmateriaal, mag hiervoor vrij gekopieerd word<strong>en</strong><br />
<strong>en</strong> kan gedownload word<strong>en</strong> via de website www.t3vlaander<strong>en</strong>.be.