Hoe de p-waarde te gebruiken bij beslissingen Eerste ...
Hoe de p-waarde te gebruiken bij beslissingen Eerste ...
Hoe de p-waarde te gebruiken bij beslissingen Eerste ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
STAtOR<br />
periodiek van <strong>de</strong> VVS jaargang 12 nummer 2, juli 2011<br />
<strong>Hoe</strong> <strong>de</strong> p-waar<strong>de</strong> <strong>te</strong> <strong>gebruiken</strong><br />
<strong>bij</strong> <strong>beslissingen</strong><br />
Eers<strong>te</strong> Kamerverkiezingen<br />
<strong>Hoe</strong> optimalisatie in een aantal jaren<br />
in het DNA van TNT Express is gekomen<br />
Karl Pearson tussen statistiek en filosofie<br />
Rechtstreeks verwachtingen evalueren<br />
of <strong>de</strong> nul-hypothese toetsen?<br />
Generalized reliability in industriële<br />
user studies
STAtOR<br />
Jaargang 12, nummer 2, juli 2011<br />
STAtOR is een uitgave van <strong>de</strong> Vereniging voor Statistiek en<br />
Operationele Research (VVS). STAtOR wil le<strong>de</strong>n, bedrijven<br />
en overige geïn<strong>te</strong>resseer<strong>de</strong>n op <strong>de</strong> hoog<strong>te</strong> hou<strong>de</strong>n van<br />
ontwikkelingen en nieuws over toepassingen van statistiek<br />
en operationele research. Verschijnt 4 keer per jaar.<br />
Redactie<br />
Joaquim Gromicho (hoofdredac<strong>te</strong>ur), Ana Isabel Barros,<br />
Johan van Leeuwaar<strong>de</strong>n, Mirjam Moerbeek, Gerrit<br />
S<strong>te</strong>merdink (eindredac<strong>te</strong>ur), Hil<strong>de</strong> Tobi. Vas<strong>te</strong> me<strong>de</strong>werker:<br />
Fred S<strong>te</strong>u<strong>te</strong>l<br />
Kopij en reacties rich<strong>te</strong>n aan<br />
Prof. dr. J.A.S. Gromicho (hoofdredac<strong>te</strong>ur), Facul<strong>te</strong>it <strong>de</strong>r<br />
Economische We<strong>te</strong>nschappen en Bedrijfskun<strong>de</strong>, af<strong>de</strong>ling<br />
Econometrie, Vrije Universi<strong>te</strong>it, De Boelelaan 1105, 1081 HV<br />
Ams<strong>te</strong>rdam, <strong>te</strong>lefoon 020-5986010, mobiel 06-55886747,<br />
.<br />
Bestuur van <strong>de</strong> VVS<br />
Voorzit<strong>te</strong>r:<br />
prof. dr. Jacqueline Meulman <br />
Secretaris:<br />
dr. Irene Klugkist <br />
Penningmees<strong>te</strong>r:<br />
dr. Ad Rid<strong>de</strong>r <br />
Stu<strong>de</strong>ntlid:<br />
Maar<strong>te</strong>n Kampert (Bsc) <br />
Overige bestuursle<strong>de</strong>n:<br />
prof. dr. Fred van Eeuwijk (BMS), prof. dr. ir. Stan van <strong>Hoe</strong>sel<br />
& dr. John Poppelaars (NGB), dr. Eric Cator (SMS), dr. Michel<br />
van <strong>de</strong> Vel<strong>de</strong>n (ECS), dr. Andries van <strong>de</strong>r Ark (SWS),<br />
Le<strong>de</strong>n- en abonnemen<strong>te</strong>nadministratie van <strong>de</strong> VVS<br />
VVS, Postbus 244, 6700 AE Wageningen, <strong>te</strong>lefoon 0317 -<br />
419572, fax 0317 - 421364, .<br />
Raadpleeg onze websi<strong>te</strong> over hoe u lid kunt wor<strong>de</strong>n van<br />
<strong>de</strong> VVS of een abonnement kunt nemen op STAtOR of op<br />
een van <strong>de</strong> an<strong>de</strong>re periodieken.<br />
VVS-websi<strong>te</strong><br />
www.vvs-or.nl<br />
Adver<strong>te</strong>ntieacquisitie<br />
René Luijk, p/a Leids Universitair Medisch Centrum,<br />
af<strong>de</strong>ling Medische Statistiek en Bio-informatica,<br />
Postzone S5-P, Postbus 9600, 2300 RC Lei<strong>de</strong>n,<br />
06 244 32 892, . STAtOR<br />
verschijnt in maart, juni, sep<strong>te</strong>mber en <strong>de</strong>cember.<br />
Ontwerp en opmaak<br />
Pharos | M. van Hoo<strong>te</strong>gem, Nijmegen<br />
Druk<br />
Drukkerij Zoe<strong>te</strong>weij, Yerseke<br />
Uitgever<br />
© Vereniging voor Statistiek en Operationele Research<br />
ISSN 1567-3383<br />
Inhoud<br />
2<br />
STAtOR juli 2011|2<br />
3 Redactioneel<br />
4 <strong>Hoe</strong> <strong>de</strong> p-waar<strong>de</strong> <strong>te</strong> <strong>gebruiken</strong> <strong>bij</strong> <strong>beslissingen</strong>.<br />
Er zit significant <strong>te</strong> weinig verf in<br />
mijn potjes! Moet ik iets doen?<br />
Aart F. <strong>de</strong> Vos<br />
8 Eers<strong>te</strong> Kamerverkiezingen<br />
Jacob Jan Paulus & Jaap Praagman<br />
14 <strong>Hoe</strong> optimalisatie in een aantal jaren in<br />
het DNA van TNT Express is gekomen<br />
Hein Fleuren, Marco Hendriks &<br />
Annelies Wou<strong>te</strong>rsen<br />
17 Agenda<br />
18 Karl Pearson tussen statistiek en filosofie<br />
Richard Starmans<br />
22 Rechtstreeks verwachtingen evalueren of<br />
<strong>de</strong> nul-hypothese toetsen?<br />
Rens van <strong>de</strong> Schoot<br />
25 Words, words – column<br />
Fred S<strong>te</strong>u<strong>te</strong>l<br />
26 Generalized reliability in industriële user<br />
studies<br />
Jan Engel<br />
31 In Memoriam Joop Kemperman<br />
Fred S<strong>te</strong>u<strong>te</strong>l<br />
32 Buurtfeest – column<br />
Johan van Leeuwaar<strong>de</strong>n
Vakantie, een tijd vol keuzes<br />
Mensen zijn er in soor<strong>te</strong>n. Zo schijnen sommigen<br />
zich <strong>te</strong> kunnen ontspannen tij<strong>de</strong>ns vakanties en<br />
on<strong>de</strong>rvin<strong>de</strong>n an<strong>de</strong>ren juist stress vanwege <strong>de</strong> vele<br />
extra <strong>beslissingen</strong> die ze dan moe<strong>te</strong>n nemen. Men<br />
zou, overdreven ges<strong>te</strong>ld, kunnen zeggen dat <strong>de</strong><br />
vrijheid van <strong>de</strong> vakantie onlosmakelijk <strong>de</strong> dwang<br />
van <strong>de</strong> keuze met zich brengt.<br />
Statistici zijn net mensen: ook zij zijn er in soor-<br />
<strong>te</strong>n en ook zij zit<strong>te</strong>n voortdurend met keuzes. Een<br />
keuze die vaak voorkomt is of men vóór of <strong>te</strong>gen<br />
Bayes is. Aan dit probleem wor<strong>de</strong>n in dit nummer<br />
van Stator maar liefst twee artikelen gewijd. Aart<br />
<strong>de</strong> Vos laat zien dat ‘klassiek’ en Bayes elkaar niet<br />
hoeven <strong>te</strong> <strong>bij</strong><strong>te</strong>n, maar heel goed als elkaars aan-<br />
vulling beschouwd kunnen wor<strong>de</strong>n. En Rens van<br />
<strong>de</strong> Schoot gaat óók in in <strong>de</strong> complementaire func-<br />
tie van bei<strong>de</strong> metho<strong>de</strong>n. Voor wie toevallig in <strong>de</strong>ze<br />
vakantie naar Denemarken gaat: in <strong>de</strong> slotkapel<br />
van het kas<strong>te</strong>el Fre<strong>de</strong>riksborg in Hillerød hangen<br />
<strong>de</strong> wapenschil<strong>de</strong>n van <strong>de</strong> le<strong>de</strong>n van <strong>de</strong> Or<strong>de</strong> van<br />
<strong>de</strong> Olifant, <strong>de</strong> hoogs<strong>te</strong> Deense on<strong>de</strong>rscheiding.<br />
Een van die schil<strong>de</strong>n is van <strong>de</strong> beroem<strong>de</strong> Deense<br />
natuurkundige Niels Bohr en zijn wapenspreuk<br />
luidt ‘Contraria sunt Complementa’. Dit slaat op<br />
Bohr’s in<strong>te</strong>rpretatie van <strong>de</strong> quantummechanica,<br />
maar na het lezen van <strong>de</strong> artikelen van De Vos en<br />
Van <strong>de</strong> Schoot kan men het ook op <strong>de</strong> statistiek<br />
toepassen.<br />
Trouwens, over kiezen gesproken: <strong>de</strong> manier<br />
waarop <strong>de</strong> afgelopen maan<strong>de</strong>n <strong>de</strong> Eers<strong>te</strong> Kamer<br />
werd gekozen leek voor <strong>de</strong> gewone kiezer wel<br />
hogere wiskun<strong>de</strong>. De redactie is verheugd u een<br />
zeer actueel en verhel<strong>de</strong>rend overzicht van dit<br />
probleem <strong>te</strong> kunnen bie<strong>de</strong>n. Jacob Jan Paulus en<br />
Jaap Praagman <strong>te</strong>kenen daarvoor.<br />
3<br />
STAtOR juli 2011|2<br />
Een heel an<strong>de</strong>r artikel is geschreven door Hein<br />
Fleuren, Marco Hendriks en Annelies Wou<strong>te</strong>rsen.<br />
Zij beschrijven hoe TNT Express stapje voor stapje<br />
wordt veroverd door toepassingen van <strong>de</strong> OR.<br />
De filosoof Richard Starmans ver<strong>te</strong>lt over <strong>de</strong><br />
belangrijke rol van Karl Pearson in <strong>de</strong> ontwikke-<br />
ling van <strong>de</strong> statistiek. De redactie kijkt nu al uit<br />
naar enkele an<strong>de</strong>re artikelen die hij heeft toege-<br />
zegd <strong>te</strong> zullen schrijven over an<strong>de</strong>re groothe<strong>de</strong>n<br />
die aan <strong>de</strong> wording van ons vakgebied hebben<br />
<strong>bij</strong>gedragen. Zéér aanbevolen.<br />
Dit is nog niet alles, u kunt er ook voor kiezen<br />
om als eers<strong>te</strong> het artikel van Jan Engel <strong>te</strong> lezen.<br />
Dan zult u zien dat <strong>de</strong> beken<strong>de</strong> Cronbachs alpha<br />
metho<strong>de</strong> uit <strong>de</strong> sociale we<strong>te</strong>nschappen uits<strong>te</strong>-<br />
kend kan wor<strong>de</strong>n gegeneraliseerd naar industri-<br />
ele studies.<br />
En natuurlijk hebben ook onze vas<strong>te</strong> columnis-<br />
<strong>te</strong>n rekening gehou<strong>de</strong>n met <strong>de</strong> tijd van het jaar:<br />
hun <strong>bij</strong>dragen zijn luchtig en verstrooiend.<br />
Ten slot<strong>te</strong> een In Memoriam voor Joop<br />
Kemperman. Hij was een van <strong>de</strong> vier promo-<br />
vendi van David van Dantzig en is in Ne<strong>de</strong>rland<br />
wat min<strong>de</strong>r bekend gewor<strong>de</strong>n doordat hij al snel<br />
daarna naar Amerika verhuis<strong>de</strong>. Daar was hij een<br />
productief we<strong>te</strong>nschapper, met maar liefst 24 pro-<br />
movendi. Fred S<strong>te</strong>u<strong>te</strong>l her<strong>de</strong>nkt hem.<br />
Kortom, keus genoeg, maar laat het u niet tot<br />
stress voeren. Gooi <strong>de</strong>snoods een muntje op als u<br />
geen keus kunt maken, doet u in <strong>de</strong> vakantie toch<br />
nog aan kansrekening.<br />
De redactie wenst u veel leesplezier.<br />
Gerrit S<strong>te</strong>merdink
<strong>Hoe</strong> <strong>de</strong> p-waar<strong>de</strong><br />
<strong>te</strong> <strong>gebruiken</strong> <strong>bij</strong> <strong>beslissingen</strong><br />
ER zIT SIGNIfIcANT TE wEINIG VERf IN mIjN POTjES! mOET IK IETS DOEN?<br />
Aart F. <strong>de</strong> Vos<br />
Geen statistisch on<strong>de</strong>rwerp is zo controversieel<br />
als <strong>de</strong> p-waar<strong>de</strong>. Bayesianen drijven er <strong>de</strong> spot<br />
mee, maar het is een basiselement in ie<strong>de</strong>re stan-<br />
daardcursus statistiek. De p-waar<strong>de</strong> is <strong>de</strong> kans<br />
dat als <strong>de</strong> nulhypothese (H 0 ) waar is, <strong>de</strong> data zo<br />
extreem zijn als ze zijn, of nóg extremer. Dit krijgt<br />
be<strong>te</strong>kenis in vergelijking met een norm, het sig-<br />
nificantie niveau α, dat meestal 0,05 genomen<br />
wordt. Als p
meer mis. ‘Als verdach<strong>te</strong> onschuldig is (H 0 ) is het<br />
gebeur<strong>de</strong> ui<strong>te</strong>rst onwaarschijnlijk, dus zal ver-<br />
dach<strong>te</strong> wel schuldig zijn.’<br />
Ook stu<strong>de</strong>n<strong>te</strong>n die uitgebreid statistiek heb-<br />
ben gehad zijn ver<strong>bij</strong>s<strong>te</strong>rd als ik het volgen<strong>de</strong> een-<br />
voudige voorbeeld voorleg. Een stu<strong>de</strong>nt doet een<br />
multiple choice-<strong>te</strong>ntamen: 50 vragen met s<strong>te</strong>eds<br />
drie mogelijke antwoor<strong>de</strong>n. Er zijn 27 goe<strong>de</strong> ant-<br />
woor<strong>de</strong>n. Gegokt? Als <strong>de</strong> kans per vraag 1/3 is, is<br />
<strong>de</strong> kans op 27 of meer goed 0,002. Zeer significant.<br />
Dus niet gegokt? Als het een re<strong>de</strong>lijk goe<strong>de</strong> stu-<br />
<strong>de</strong>nt is die soms leert en soms feest, is 65% kans<br />
dat hij gegokt heeft re<strong>de</strong>lijk plausibel. 27 antwoor-<br />
5<br />
STAtOR juli 2011|2<br />
<strong>de</strong>n goed is nog onwaarschijnlijker als hij geleerd<br />
heeft (en zijn kans per vraag 0,75 is) dan als hij<br />
gegokt heeft. Het gaat om <strong>de</strong> aannemelijkheids-<br />
verhouding van <strong>de</strong> data (27 goed dus meer doet<br />
niet <strong>te</strong>r zake). Pos<strong>te</strong>rior odds is prior odds times<br />
likelihood ratio.<br />
Klassieke toets<br />
Dus weg met <strong>de</strong> p-waar<strong>de</strong>? Nee. Ik <strong>de</strong>nk een<br />
oplossing <strong>te</strong> hebben gevon<strong>de</strong>n (op zijn minst voor<br />
bedrijfseconomen) in <strong>de</strong> vorm van een economi-<br />
sche on<strong>de</strong>rbouwing van <strong>de</strong> klassieke toets. Mijn<br />
s<strong>te</strong>lling is dat er eenvoudige Bayesiaanse mo<strong>de</strong>l-<br />
len zijn waarin het format p
in kaart brengen van diverse <strong>beslissingen</strong>.<br />
De klassieke toets is typisch geschikt voor<br />
situaties met een hoge P(H 0 ), <strong>de</strong> prior kans dat er<br />
niets <strong>de</strong> hand is. En functioneert als een soort zelf-<br />
bescherming. Wij wor<strong>de</strong>n voortdurend bestormd<br />
door ‘significan<strong>te</strong>’ fei<strong>te</strong>n die iets zou<strong>de</strong>n kunnen<br />
be<strong>te</strong>kenen. Er over na<strong>de</strong>nken kost veel tijd en is<br />
daarom kostbaar. Meestal is het loos alarm. Dat is<br />
het geval in een fractie P(H 0 )(1-α) van alle geval-<br />
len, als je <strong>de</strong> <strong>de</strong> regel ‘<strong>de</strong>nk na als <strong>de</strong> p-waar<strong>de</strong><br />
kleiner is dan α han<strong>te</strong>ert.<br />
De klassieke toets s<strong>te</strong>lt ‘verwerp H 0 als pk<br />
(of S π(H0 ) L(1,0) = k (1)<br />
f(S|θ0 ) π(H1 ) L(0,1)<br />
(f = kansdichtheid; π = prior kans(dichtheid))<br />
Aan <strong>de</strong> linkerkant staat <strong>de</strong> ‘Bayes Factor’ (BF(S)).<br />
(= P(S|H 1 ) / P(S|H 0 )). Die is afhankelijk van ¼ (µ|H 1 ),<br />
<strong>de</strong> subjectieve voorver<strong>de</strong>ling van µ on<strong>de</strong>r H 1 . Of<strong>te</strong>-<br />
wel <strong>de</strong> lastige vraag: ‘Wat zou er aan <strong>de</strong> hand kun-<br />
nen zijn?’ Aan <strong>de</strong> rech<strong>te</strong>rkant <strong>de</strong> prior odds van<br />
<strong>de</strong> hypothesen, maal <strong>de</strong> ratio van <strong>de</strong> verwach<strong>te</strong><br />
verliezen <strong>bij</strong> het nemen van <strong>de</strong> twee mogelijke<br />
verkeer<strong>de</strong> <strong>beslissingen</strong>: L(1,0) iets doen <strong>te</strong>rwijl er<br />
niets aan <strong>de</strong> hand is) en L(0,1) (<strong>te</strong>n onrech<strong>te</strong> niets<br />
doen).<br />
De implicie<strong>te</strong> α in (1) is<br />
α im = P S|H0 (BF(S) > k) (2)<br />
een ongebruikelijk mengsel van frequentistisch<br />
(P S|H0 ) en Bayesiaans. Bayesianen kijken naar <strong>de</strong><br />
ongelijkheid BF(S) > k. Dat heeft als bezwaar dat<br />
aan bei<strong>de</strong> kan<strong>te</strong>n priors voorkomen. Het format<br />
p < α im heeft dit bezwaar niet. Het kan bovendien<br />
ook wor<strong>de</strong>n gebruikt wanneer L(0,1) afhangt van
µ, wat normali<strong>te</strong>r het geval zal zijn. De formule<br />
wordt dan α im = P S|H0 (S>k) waar<strong>bij</strong> k met <strong>de</strong> Baye-<br />
siaanse machinerie berekend kan wor<strong>de</strong>n.<br />
Een voorbeeld<br />
Volledig Bayesiaans beslissen is lastig. Maar ver-<br />
schillen<strong>de</strong> <strong>beslissingen</strong> on<strong>de</strong>rling coherent maken<br />
is eenvoudiger. S<strong>te</strong>l µ is <strong>de</strong> verwachting van het<br />
gemid<strong>de</strong>l<strong>de</strong> <strong>te</strong>kort aan verf in mijn potjes en S<br />
het gemid<strong>de</strong>l<strong>de</strong> <strong>te</strong>kort in mijn s<strong>te</strong>ekproef. Als het<br />
echt <strong>te</strong> weinig is krijg ik een boe<strong>te</strong>. Vergelijking (1)<br />
beschrijft <strong>de</strong> situatie.<br />
On<strong>de</strong>rstaan<strong>de</strong> tabel is gemaakt met (1) en (2).<br />
S ~ N(µ,1), ¼ (µ|H 1 ) = exp (-µ). S is data, S 0 |H 0 ~ N(µ 0 ,1)<br />
= N(0,1).<br />
S 0,91 1,5 1,645 2 2,193 2,63<br />
BF(S) 1,12 1,91 2,23 3,43 4,46 8,92<br />
P(S 0 > S|H 0 ) 0,181 0,067 0,050 0,023 0,014 0,006<br />
De α = 0,05 hoort <strong>bij</strong> S = 1,645, welbekend. S<strong>te</strong>l dat<br />
bekend is dat dit <strong>de</strong> optimale toetsdrempel is om<br />
nog een extra s<strong>te</strong>ekproef <strong>te</strong> trekken.<br />
Een <strong>de</strong>nkbare opgave voor het <strong>te</strong>ntamen statistiek<br />
voor bedrijfskundigen in 2020?<br />
a. laat zien dat als die extra s<strong>te</strong>ekproef 2 maal zo<br />
duur wordt men moet gaan werken met een α<br />
van 0,014.<br />
b. laat zien dat als ¼ (H1 ) stijgt van 1/(2n+1) naar 1/<br />
(n+1) α = 0,181 genomen moet wor<strong>de</strong>n.<br />
c. maak een voorbeeld van veran<strong>de</strong>ringen die α =<br />
0,006 opleveren.<br />
Tweezijdig toetsen<br />
Als mijn s<strong>te</strong>ekproef doet vermoe<strong>de</strong>n dat er <strong>te</strong> weinig<br />
verf in mijn potjes zit, met een p-waar<strong>de</strong> van<br />
0,03 moet ik dat dan negeren omdat er ook <strong>te</strong> veel<br />
verf in mijn potjes had kunnen zit<strong>te</strong>n? Economen<br />
leren dat ze moe<strong>te</strong>n be<strong>de</strong>nken of ze eenzijdig of<br />
tweezijdig moe<strong>te</strong>n toetsen en in het laats<strong>te</strong> geval<br />
<strong>de</strong> p-waar<strong>de</strong> met 2 moe<strong>te</strong>n vermenigvuldigen.<br />
Tamelijk onzinnig. Verschillen<strong>de</strong> waar<strong>de</strong>n van α<br />
zijn relevant voor <strong>te</strong> veel of <strong>te</strong> weinig verf. De verliesfuncties<br />
verschillen. En be<strong>te</strong>r na<strong>de</strong>nken ga je<br />
in dit geval alleen over <strong>de</strong> α die hoort <strong>bij</strong> <strong>te</strong> weinig.<br />
Meer in het algemeen geldt dat p-waar<strong>de</strong>n hun<br />
magische be<strong>te</strong>kenis verliezen als men beseft hoe<br />
onzeker men is over <strong>de</strong> relevan<strong>te</strong> α.<br />
conclusie<br />
De klassieke toets en Bayesiaans beslissen on<strong>de</strong>r<br />
onzekerheid kunnen geïn<strong>te</strong>greerd wor<strong>de</strong>n tot iets<br />
zinvols. En een gewoon voorbeeld over verf in<br />
potjes biedt een an<strong>de</strong>r perspectief dan abstrac<strong>te</strong><br />
pogingen tot verzoening van bei<strong>de</strong> richtingen<br />
(Andrews, 1994; Berger, 2003; zie ook De Vos &<br />
Francke, 2008). De groots<strong>te</strong> uitdaging is om stu<strong>de</strong>n<strong>te</strong>n<br />
<strong>te</strong> leren een re<strong>de</strong>lijke α <strong>te</strong> kiezen, zodat<br />
het huren van Bayesianen beperkt kan blijven tot<br />
echt belangrijke gevallen.<br />
Li<strong>te</strong>ratuur<br />
Andrews, D.W.K. (1994). The large sample correspon<strong>de</strong>nce<br />
between classical hypothesis <strong>te</strong>sts and Bayesian<br />
pos<strong>te</strong>rior odds <strong>te</strong>sts. Econometrica 62, 1207-1232.<br />
Berger, J.O. (2003). Could Fisher, Jeffreys and Neyman<br />
have agreed on <strong>te</strong>sting? Statistical Science 18, 1-32.<br />
<strong>de</strong> Vos, A.F. & Francke, M.K. (2008). Bayesian Unit Root<br />
Tests and Marginal Likelihood (www1.fee.uva.nl/pp/<br />
bin/1015full<strong>te</strong>xt.pdf)<br />
Aart <strong>de</strong> Vos is econometrist en verbon<strong>de</strong>n aan <strong>de</strong> facul<strong>te</strong>it<br />
<strong>de</strong>r economische we<strong>te</strong>nschappen en bedrijfskun<strong>de</strong> van <strong>de</strong><br />
Vrije Universi<strong>te</strong>it Ams<strong>te</strong>rdam. E-mail: <br />
Ter gelegenheid van zijn pensionering vindt op 30 sep<strong>te</strong>mber<br />
2011 een afscheidssymposium plaats over het<br />
on<strong>de</strong>rwerp van dit artikel. Topspecialis<strong>te</strong>n op dit gebied<br />
hebben hun me<strong>de</strong>werking toegezegd. Zie ook <strong>de</strong> websi<strong>te</strong><br />
.<br />
7<br />
STAtOR juli 2011|2
EERSTE KAMERVERKIEZINGEN<br />
Jacob Jan Paulus & Jaap Praagman<br />
De Eers<strong>te</strong> Kamer wordt gekozen via een getrap<strong>te</strong><br />
verkiezing, <strong>de</strong> burgers kiezen Provinciale Sta<strong>te</strong>nle-<br />
<strong>de</strong>n die vervolgens <strong>de</strong> Eers<strong>te</strong> Kamerle<strong>de</strong>n kiezen.<br />
Begin maart 2011 waren <strong>de</strong> verkiezingen voor <strong>de</strong><br />
Provinciale Sta<strong>te</strong>n en door <strong>de</strong> vraag of <strong>de</strong> gedoog-<br />
coalitie een meer<strong>de</strong>rheid zal halen is er dit jaar<br />
veel aandacht voor <strong>de</strong> Eers<strong>te</strong> Kamerverkiezing. In<br />
<strong>de</strong> lan<strong>de</strong>lijke media is er veel gespeculeerd over<br />
stra<strong>te</strong>gisch s<strong>te</strong>mmen [1,2]. Want door stra<strong>te</strong>gische<br />
samenwerking kunnen partijen meer Kamerze-<br />
<strong>te</strong>ls halen. Tijd voor een wiskundige analyse.<br />
Spelregels<br />
Bij <strong>de</strong> Eers<strong>te</strong> Kamer verkiezing op 23 mei 2011 mag<br />
elk Sta<strong>te</strong>nlid één s<strong>te</strong>m uitbrengen. Omdat het<br />
inwoneraantal per provincie verschilt, wor<strong>de</strong>n <strong>de</strong><br />
s<strong>te</strong>mmen gewogen. Deze weging, <strong>de</strong> zogenaam<strong>de</strong><br />
s<strong>te</strong>mwaar<strong>de</strong>, wordt per provincie bepaald door het<br />
inwoner aantal <strong>te</strong> <strong>de</strong>len door het hon<strong>de</strong>rdvoud<br />
van het aantal Sta<strong>te</strong>nle<strong>de</strong>n in die provincie. De<br />
s<strong>te</strong>mwaar<strong>de</strong> en het aantal Sta<strong>te</strong>nle<strong>de</strong>n per pro-<br />
vincie staan in figuur 1 weergegeven.<br />
De totale waar<strong>de</strong> van <strong>de</strong> s<strong>te</strong>mmen uitgebracht<br />
op een partij is het behaal<strong>de</strong> s<strong>te</strong>mcijfer van die<br />
partij. De s<strong>te</strong>mcijfers bepalen <strong>de</strong> ze<strong>te</strong>lver<strong>de</strong>ling in<br />
<strong>de</strong> Eers<strong>te</strong> Kamer en dat gaat als volgt [3,4]. Met <strong>de</strong><br />
kies<strong>de</strong>ler wor<strong>de</strong>n <strong>de</strong> zogenaam<strong>de</strong> kale ze<strong>te</strong>ls ver<strong>de</strong>eld.<br />
Het aantal kale ze<strong>te</strong>ls dat een partij krijgt is<br />
gelijk aan het naar bene<strong>de</strong>n afgeron<strong>de</strong> quotiënt<br />
van s<strong>te</strong>mcijfer en kies<strong>de</strong>ler. Deze kies<strong>de</strong>ler is <strong>de</strong><br />
som van <strong>de</strong> s<strong>te</strong>mcijfers ge<strong>de</strong>eld door het aantal<br />
Kamerze<strong>te</strong>ls. In 2011 is <strong>de</strong> kies<strong>de</strong>ler 166561/75. De<br />
res<strong>te</strong>ren<strong>de</strong> ze<strong>te</strong>ls wor<strong>de</strong>n vervolgens één voor één<br />
ver<strong>de</strong>eld zodanig dat <strong>de</strong> eerstvolgen<strong>de</strong> restze<strong>te</strong>l<br />
wordt toegekend aan die partij waarvoor na toekenning<br />
van die ze<strong>te</strong>l het quotiënt van s<strong>te</strong>mcijfer<br />
en aantal ze<strong>te</strong>ls het groots<strong>te</strong> is.<br />
Verkiezingen 2011<br />
In tabel 1 staat per provincie <strong>de</strong> ze<strong>te</strong>lver<strong>de</strong>ling van<br />
<strong>de</strong> Provinciale Sta<strong>te</strong>n na <strong>de</strong> verkiezing van maart<br />
2011. S<strong>te</strong>mt ie<strong>de</strong>r Sta<strong>te</strong>nlid <strong>bij</strong> <strong>de</strong> Eers<strong>te</strong> Kamer-<br />
8<br />
STAtOR juli 2011|2
Limburg (47)<br />
Noord-Brabant (55)<br />
Zeeland (39)<br />
Zuid-Holland (55)<br />
Noord-Holland (55)<br />
Utrecht (47)<br />
Gel<strong>de</strong>rland (54)<br />
Flevoland (39)<br />
Overijssel (47)<br />
Drenthe (41)<br />
Friesland (43)<br />
Groningen (43)<br />
verkiezing op <strong>de</strong> eigen partij dan resul<strong>te</strong>ert dat<br />
in <strong>de</strong> s<strong>te</strong>mcijfers zoals vermeld in <strong>de</strong> voorlaats<strong>te</strong><br />
kolom. Delen door <strong>de</strong> kies<strong>de</strong>ler en naar bene<strong>de</strong>n<br />
afron<strong>de</strong>n levert het aantal kale ze<strong>te</strong>ls in <strong>de</strong> laats<strong>te</strong><br />
kolom. (De lokale partijen zijn gebun<strong>de</strong>ld in <strong>de</strong><br />
Figuur 1. Provincie (aantal sta<strong>te</strong>nle<strong>de</strong>n) en s<strong>te</strong>mwaar<strong>de</strong><br />
9<br />
STAtOR juli 2011|2<br />
Onafhankelijke Senaats Fractie, OSF.)<br />
In totaal zijn daarmee 69 ze<strong>te</strong>ls ver<strong>de</strong>eld. De res-<br />
<strong>te</strong>ren<strong>de</strong> 6 ze<strong>te</strong>ls wor<strong>de</strong>n één voor één ver<strong>de</strong>eld vol-<br />
gens het hiervoor beschreven principe van groot-<br />
s<strong>te</strong> gemid<strong>de</strong>l<strong>de</strong> s<strong>te</strong>mcijfer per ze<strong>te</strong>l, zie tabel 2.<br />
GR FR DR OV FL GD UT NH ZH ZL NB LB S<strong>te</strong>m-cijfer Kale ze<strong>te</strong>ls<br />
CDA 5 8 6 11 4 9 6 5 6 6 10 10 24238 10<br />
VVD 6 6 9 8 9 11 11 13 12 7 12 8 34518 15<br />
PVV 3 4 4 4 6 6 5 6 8 5 8 10 21064 9<br />
PvdA 12 11 12 9 6 9 7 11 10 7 7 6 29639 13<br />
GroenLinks 3 2 2 2 2 4 4 5 3 1 3 3 10656 4<br />
D66 3 2 2 3 3 4 5 6 5 2 5 2 13781 6<br />
SP 6 3 4 4 3 5 4 5 5 3 8 6 16825 7<br />
Chris<strong>te</strong>nUnie 3 3 2 3 3 3 2 1 2 2 5708 2<br />
SGP 2 1 2 1 2 4 3248 1<br />
PvdD 1 1 1 1 1 1 1 2438 1<br />
50PLUS 1 1 1 1 1 1 1 2 3022 1<br />
OSF 1 4 1 2 1424 0<br />
Tabel 1. Ze<strong>te</strong>lver<strong>de</strong>ling van <strong>de</strong> Provinciale Sta<strong>te</strong>n na <strong>de</strong> verkiezing van maart 2011<br />
98<br />
101<br />
120<br />
151<br />
135<br />
239<br />
241<br />
261<br />
365<br />
446<br />
489<br />
0 100 200 300 400 500 600 700<br />
166561 69<br />
641
Rekenen<br />
In<strong>te</strong>ressant wordt het doordat <strong>de</strong> Sta<strong>te</strong>nle<strong>de</strong>n in<br />
principe vrij zijn in hun keuze en dus ook op een<br />
an<strong>de</strong>re partij mogen s<strong>te</strong>mmen. Dat biedt <strong>de</strong> moge-<br />
lijkheid om afspraken <strong>te</strong> maken tussen samen-<br />
werken<strong>de</strong> partijen en zo <strong>de</strong> ze<strong>te</strong>lver<strong>de</strong>ling <strong>te</strong> beïn-<br />
vloe<strong>de</strong>n. Al begin april was er sprake van een<br />
mogelijke afspraak tussen 50PLUS en <strong>de</strong> OSF. Als<br />
<strong>bij</strong>voorbeeld alle OSF s<strong>te</strong>mmen <strong>te</strong>recht komen <strong>bij</strong><br />
<strong>de</strong> 50PLUS partij, dan krijgt <strong>de</strong> 50PLUS partij een<br />
s<strong>te</strong>mcijfer van 3022+1424 = 4446. Wat direct twee<br />
kale ze<strong>te</strong>ls oplevert in plaats van één. Dit <strong>te</strong>n kos<strong>te</strong><br />
van <strong>de</strong> SP, omdat er dan nog maar vijf restze<strong>te</strong>ls <strong>te</strong><br />
ver<strong>de</strong>len zijn. Maar met een kleine verhoging van<br />
het s<strong>te</strong>mcijfer, <strong>bij</strong>voorbeeld doordat een Zeeuws<br />
GroenLinks Sta<strong>te</strong>nlid zijn s<strong>te</strong>m aan <strong>de</strong> SP geeft,<br />
kan <strong>de</strong> SP voor<strong>bij</strong> <strong>de</strong> PVV schuiven. Wat vervolgens<br />
voor <strong>de</strong> gedoogcoalitie CDA, VVD en PVV weer<br />
S<strong>te</strong>mcijfer/<br />
(ze<strong>te</strong>ls +1 )<br />
Ze<strong>te</strong>ls<br />
S<strong>te</strong>mcijfer/<br />
(ze<strong>te</strong>ls +1 )<br />
Ze<strong>te</strong>ls<br />
S<strong>te</strong>mcijfer/<br />
(ze<strong>te</strong>ls +1 )<br />
Ze<strong>te</strong>ls<br />
10<br />
STAtOR juli 2011|2<br />
aanleiding kan zijn om een <strong>de</strong>fensieve stra<strong>te</strong>gie<br />
<strong>te</strong> zoeken, et ce<strong>te</strong>ra. Dit vraagt om een wiskundige<br />
analyse naar <strong>de</strong> stra<strong>te</strong>gische s<strong>te</strong>mmogelijkhe<strong>de</strong>n.<br />
Geen vas<strong>te</strong> kies<strong>de</strong>ler<br />
Vanuit wiskundig perspectief is het werken met<br />
<strong>de</strong> kies<strong>de</strong>ler en vervolgens één voor één ver<strong>de</strong>len<br />
van <strong>de</strong> restze<strong>te</strong>ls onnodig ingewikkeld. Waar het in<br />
wezen om gaat is het s<strong>te</strong>mcijfer per ver<strong>de</strong>el<strong>de</strong> ze<strong>te</strong>l.<br />
In het eer<strong>de</strong>r genoem<strong>de</strong> voorbeeld, waar ie<strong>de</strong>re<br />
partij op zichzelf s<strong>te</strong>mt, krijgt <strong>de</strong> SP <strong>de</strong> laats<strong>te</strong> rest-<br />
ze<strong>te</strong>l met een s<strong>te</strong>mcijfer van 2103,13 per ze<strong>te</strong>l. Ie<strong>de</strong>re<br />
toegewezen ze<strong>te</strong>l represen<strong>te</strong>ert dus een s<strong>te</strong>mcijfer<br />
van 2103,13 of meer. Omgekeerd geldt dat ie<strong>de</strong>re<br />
partij ook voor elke 2103,13 aan s<strong>te</strong>mcijfer een ze<strong>te</strong>l<br />
toegewezen heeft gekregen. Kortom <strong>de</strong> ui<strong>te</strong>in<strong>de</strong>-<br />
lijke ze<strong>te</strong>lver<strong>de</strong>ling correspon<strong>de</strong>ert met <strong>de</strong> ze<strong>te</strong>l-<br />
CDA 2203,45 11 2019,83 11 2019,83 11 2019,83 11 2019,83 11 2019,83 11<br />
VVD 2157,38 15 2157,38 16 2030,47 16 2030,47 16 2030,47 16 2030,47 16<br />
PVV 2106,40 9 2106,40 9 2106,40 9 2106,40 9 2106,40 10 1914,91 10<br />
PvdA 2117,07 13 2117,07 13 2117,07 13 2117,07 14 1975,93 14 1975,93 14<br />
GroenLinks 2131,20 4 2131,20 4 2131,20 5 1776,00 5 1776,00 5 1776,00 5<br />
D66 1968,71 6 1968,71 6 1968,71 6 1968,71 6 1968,71 6 1968,71 6<br />
SP 2103,13 7 2103,13 7 2103,13 7 2103,13 7 2103,13 7 2103,13 8<br />
Chris<strong>te</strong>nUnie 1902,67 2 1902,67 2 1902,67 2 1902,67 2 1902,67 2 1902,67 2<br />
SGP 1624,00 1 1624,00 1 1624,00 1 1624,00 1 1624,00 1 1624,00 1<br />
PvdD 1219,00 1 1219,00 1 1219,00 1 1219,00 1 1219,00 1 1219,00 1<br />
50PLUS 1511,00 1 1511,00 1 1511,00 1 1511,00 1 1511,00 1 1511,00 1<br />
OSF 1424,00 0 1424,00 0 1424,00 0 1424,00 0 1424,00 0 1424,00 0<br />
S<strong>te</strong>mcijfer/<br />
(ze<strong>te</strong>ls +1 )<br />
Ze<strong>te</strong>ls<br />
S<strong>te</strong>mcijfer/<br />
(ze<strong>te</strong>ls +1 )<br />
Ze<strong>te</strong>ls<br />
S<strong>te</strong>mcijfer/<br />
(ze<strong>te</strong>ls +1 )<br />
70 71 72 73 74 75<br />
Tabel 2. Ver<strong>de</strong>ling van <strong>de</strong> restze<strong>te</strong>ls in <strong>de</strong> Eers<strong>te</strong> Kamer na <strong>de</strong> Provinciale Sta<strong>te</strong>nverkiezing van maart 2011<br />
Ze<strong>te</strong>ls
ver<strong>de</strong>ling die we krijgen als we 2103,13 als kies<strong>de</strong>ler<br />
han<strong>te</strong>ren. Het hele proces van berekenen van kale<br />
ze<strong>te</strong>ls en toekennen van restze<strong>te</strong>ls kunnen we dus<br />
vervangen door het kiezen van <strong>de</strong> <strong>de</strong>ler waar<strong>bij</strong><br />
precies 75 ze<strong>te</strong>ls wor<strong>de</strong>n ver<strong>de</strong>eld. Probleem is ech-<br />
<strong>te</strong>r dat <strong>de</strong>ze fei<strong>te</strong>lijk resul<strong>te</strong>ren<strong>de</strong> <strong>de</strong>ler van <strong>te</strong>voren<br />
onbekend is en afhankelijk van het s<strong>te</strong>mgedrag.<br />
In figuur 2 lich<strong>te</strong>n we dit op een iets an<strong>de</strong>re<br />
manier toe, waar het aantal aan een partij toe <strong>te</strong><br />
wijzen ze<strong>te</strong>ls is uitgezet <strong>te</strong>gen <strong>de</strong> <strong>de</strong>ler. Weer voor<br />
<strong>de</strong> situatie dat alle Sta<strong>te</strong>nle<strong>de</strong>n op hun eigen par-<br />
tij s<strong>te</strong>mmen. De partijen zijn gegroepeerd als coa-<br />
litie (CDA, VVD en PVV) en oppositie (alle an<strong>de</strong>re<br />
partijen). Bij <strong>de</strong> groene lijn, <strong>de</strong> officiële kies<strong>de</strong>ler,<br />
zijn 34 ze<strong>te</strong>ls aan <strong>de</strong> coalitie toegekend en 35 aan<br />
<strong>de</strong> oppositie. Door <strong>de</strong> <strong>de</strong>ler lager <strong>te</strong> kiezen dan <strong>de</strong><br />
kies<strong>de</strong>ler, wor<strong>de</strong>n er meer ze<strong>te</strong>ls ver<strong>de</strong>eld. Het pro-<br />
ces van restze<strong>te</strong>lver<strong>de</strong>ling komt dus overeen met<br />
het naar links verschuiven van <strong>de</strong> <strong>de</strong>ler totdat er<br />
precies 75 ze<strong>te</strong>ls zijn ver<strong>de</strong>eld.<br />
Door het kiezen van een an<strong>de</strong>re s<strong>te</strong>mstra<strong>te</strong>gie<br />
kan een groep partijen <strong>de</strong> eigen curve beïnvloe-<br />
<strong>de</strong>n. Als <strong>bij</strong>voorbeeld het CDA een s<strong>te</strong>m, en daar-<br />
mee s<strong>te</strong>mwaar<strong>de</strong>, aan <strong>de</strong> PVV geeft zal <strong>de</strong> tre<strong>de</strong><br />
5<strong>de</strong> restze<strong>te</strong>l PVV naar rechts verschuiven, maar<br />
40<br />
39<br />
38<br />
37<br />
36<br />
35<br />
34<br />
33<br />
32<br />
31<br />
6<strong>de</strong> restze<strong>te</strong>l SP<br />
5<strong>de</strong> restze<strong>te</strong>l PVV<br />
11<br />
STAtOR juli 2011|2<br />
<strong>de</strong> tre<strong>de</strong> 1s<strong>te</strong> restze<strong>te</strong>l CDA schuift juist naar links.<br />
De kans op een restze<strong>te</strong>l voor <strong>de</strong> PVV zou hiermee<br />
mogelijk verbe<strong>te</strong>ren omdat het s<strong>te</strong>mcijfer per<br />
ze<strong>te</strong>l wordt verhoogd. Ech<strong>te</strong>r, <strong>de</strong> kans op een rest-<br />
ze<strong>te</strong>l voor het CDA zal verslech<strong>te</strong>ren.<br />
wiskundig mo<strong>de</strong>l<br />
Om een optimale stra<strong>te</strong>gie <strong>te</strong> bepalen voor een<br />
groep partijen G mo<strong>de</strong>lleren we het probleem als<br />
volgt. Laat variabele X pij het aantal s<strong>te</strong>mmen zijn<br />
dat in provincie p door partij i uitgebracht is op<br />
partij j, en laat ω p <strong>de</strong> s<strong>te</strong>mwaar<strong>de</strong> zijn in provin-<br />
cie p. Dan is het verkregen s<strong>te</strong>mcijfer van partij j<br />
gelijk aan Σ p,i ω p X pij . Laat variabele D <strong>de</strong> <strong>de</strong>ler zijn<br />
en <strong>de</strong> variabele Z j het behaal<strong>de</strong> aantal ze<strong>te</strong>ls van<br />
partij j. Met α pi geven we het aantal sta<strong>te</strong>nle<strong>de</strong>n<br />
aan dat partij i in provincie p heeft. De randvoor-<br />
waar<strong>de</strong>n zijn als volgt. Er zijn 75 ze<strong>te</strong>ls <strong>te</strong> ver<strong>de</strong>len;<br />
Σ j Z j = 75. Het aantal s<strong>te</strong>mmen uitgebracht komt<br />
overeen met het aantal sta<strong>te</strong>nle<strong>de</strong>n; Σ j X pij = α pi .<br />
Het s<strong>te</strong>mcijfer geeft een boven- en on<strong>de</strong>rgrens op<br />
het aantal ze<strong>te</strong>ls van een partij;<br />
4<strong>de</strong> restze<strong>te</strong>l PvdA<br />
3<strong>de</strong> restze<strong>te</strong>l GL<br />
2<strong>de</strong> restze<strong>te</strong>l VVD<br />
1s<strong>te</strong> restze<strong>te</strong>l CDA<br />
Z j ≤ Σ p,i ω p X pij < Zj +1.<br />
D<br />
1950 2050 2150 2250 2350 2450<br />
Figuur 2. Het aantal aan een partij toe <strong>te</strong> wijzen ze<strong>te</strong>ls uitgezet <strong>te</strong>gen <strong>de</strong> <strong>de</strong>ler<br />
Coalitie<br />
Oppositie<br />
Kies<strong>de</strong>ler
Nu we dit mo<strong>de</strong>l geformuleerd hebben, lopen<br />
we <strong>te</strong>gen twee dingen aan. Wat <strong>te</strong> doen met het<br />
wiskundig gezien moeilijk oplosbare kwadratisch<br />
probleem en wat is <strong>de</strong> stra<strong>te</strong>gie van <strong>de</strong> partijen<br />
die niet in groep G zit<strong>te</strong>n? De sleu<strong>te</strong>l voor bei<strong>de</strong><br />
problemen zit in het tij<strong>de</strong>lijk vastzet<strong>te</strong>n van <strong>de</strong><br />
<strong>de</strong>ler.<br />
Door het vastzet<strong>te</strong>n van <strong>de</strong> <strong>de</strong>ler wordt het<br />
mo<strong>de</strong>l lineair en eenvoudiger om op <strong>te</strong> lossen. We<br />
la<strong>te</strong>n daarmee tij<strong>de</strong>lijk <strong>de</strong> eis vallen dat 75 ze<strong>te</strong>ls<br />
ver<strong>de</strong>eld moe<strong>te</strong>n wor<strong>de</strong>n. Wor<strong>de</strong>n er min<strong>de</strong>r dan<br />
75 ver<strong>de</strong>eld, dan is <strong>de</strong> <strong>de</strong>ler klaarblijkelijk <strong>te</strong> hoog<br />
gekozen. En als er meer dan 75 wor<strong>de</strong>n ver<strong>de</strong>eld,<br />
dan is <strong>de</strong> <strong>de</strong>ler <strong>te</strong> laag gekozen. Een binary search<br />
op <strong>de</strong> <strong>de</strong>ler leidt snel tot een goe<strong>de</strong> keuze.<br />
Voor een gegeven <strong>de</strong>ler kan een groep partijen<br />
nu haar bes<strong>te</strong> stra<strong>te</strong>gie bepalen, onafhankelijk van<br />
<strong>de</strong> stra<strong>te</strong>gie van <strong>de</strong> an<strong>de</strong>ren. Of <strong>bij</strong> die <strong>de</strong>ler precies<br />
75 ze<strong>te</strong>ls wor<strong>de</strong>n ver<strong>de</strong>eld, is ech<strong>te</strong>r wel afhanke-<br />
lijk van <strong>de</strong> stra<strong>te</strong>gie van <strong>de</strong> an<strong>de</strong>re partijen.<br />
Laat <strong>de</strong> parame<strong>te</strong>r β ij gelijk zijn aan 1 als par-<br />
tijen i en j tot <strong>de</strong>zelf<strong>de</strong> groep en 0 als dat niet zo<br />
is. En als we <strong>de</strong> variabele voor <strong>de</strong> <strong>de</strong>ler D vervan-<br />
gen door een vast getal δ, wordt het ILP mo<strong>de</strong>l als<br />
volgt:<br />
40<br />
39<br />
38<br />
37<br />
36<br />
35<br />
34<br />
33<br />
32<br />
31<br />
12<br />
STAtOR juli 2011|2<br />
X<br />
maximize zj j<br />
X<br />
s.t. Xpij = αpi p,i,<br />
j<br />
X pij ≤ α pi β ij p,i,j,<br />
Z j ≤ Σ p,i ω p X pij j<br />
δ<br />
X pij ,Z j in<strong>te</strong>ger.<br />
Uitkoms<strong>te</strong>n<br />
Zoals eer<strong>de</strong>r geschetst kan <strong>de</strong> gedoogcoalitie haar<br />
kans op een 37s<strong>te</strong> ze<strong>te</strong>l (<strong>de</strong> restze<strong>te</strong>l van <strong>de</strong> PVV)<br />
vers<strong>te</strong>vigen door een <strong>de</strong>el van het s<strong>te</strong>mcijfer van<br />
het CDA naar <strong>de</strong> PVV <strong>te</strong> verschuiven. Zoeken naar<br />
<strong>de</strong> groots<strong>te</strong> waar<strong>de</strong> van δ waarvoor <strong>de</strong> gedoogcoa-<br />
litie 37 ze<strong>te</strong>ls kan halen, levert <strong>de</strong> stra<strong>te</strong>gie op die<br />
staat afgebeeld in figuur 3. In <strong>de</strong>ze stra<strong>te</strong>gie gaat<br />
een s<strong>te</strong>mwaar<strong>de</strong> van 506 van het CDA naar <strong>de</strong><br />
PVV, door in <strong>de</strong> provincie Zuid-Holland één CDA-<br />
er <strong>te</strong> la<strong>te</strong>n s<strong>te</strong>mmen op <strong>de</strong> PVV en omgekeerd in<br />
<strong>de</strong> provincie Groningen één PVV-er op het CDA.<br />
1950 2050 2150 2250 2350 2450<br />
Figuur 3. Stra<strong>te</strong>gie voor het vin<strong>de</strong>n van <strong>de</strong> groots<strong>te</strong> waar<strong>de</strong> van δ waarvoor <strong>de</strong> gedoogcoalitie 37 ze<strong>te</strong>ls kan halen<br />
Coalitie<br />
Coalitie (37 max)<br />
Kies<strong>de</strong>ler
Voor elk ze<strong>te</strong>laantal kan gezocht wor<strong>de</strong>n naar<br />
een stra<strong>te</strong>gie die <strong>bij</strong> een zo groot mogelijke waar<strong>de</strong><br />
van δ dat ze<strong>te</strong>laantal behaalt. Ofwel, elk ze<strong>te</strong>laan-<br />
tal heeft een s<strong>te</strong>rks<strong>te</strong> stra<strong>te</strong>gie voor het halen van<br />
dat aantal ze<strong>te</strong>ls. Het resultaat staat weergegeven<br />
in figuur 4 als Coalitie (X max); het maximaal haal-<br />
bare ze<strong>te</strong>laantal gegeven een <strong>de</strong>ler. In <strong>de</strong> vorige<br />
grafieken correspon<strong>de</strong>er<strong>de</strong> een lijn met één stra-<br />
<strong>te</strong>gie, maar <strong>de</strong>ze lijn correspon<strong>de</strong>ert met het maxi-<br />
maal haalbare over alle mogelijke stra<strong>te</strong>gieën. De<br />
stra<strong>te</strong>gie verschilt dus per tre<strong>de</strong> in <strong>de</strong> grafiek.<br />
Voor <strong>de</strong> oppositie kan een vergelijkbare ana-<br />
lyse gemaakt wor<strong>de</strong>n. Het lijkt politiek gezien<br />
niet realistisch om <strong>de</strong> oppositie als één gro<strong>te</strong><br />
samenwerken<strong>de</strong> groep <strong>te</strong> beschouwen. Ter illu-<br />
stratie kiezen we hier voor vier subgroepen; Groep<br />
1 bestaat uit PvdA, SP, D66 en GroenLinks, groep 2<br />
uit Chris<strong>te</strong>nUnie en SGP, groep 3 uit alleen PvdD<br />
en groep 4 uit 50PLUS en OSF. Binnen <strong>de</strong>ze beper-<br />
king is het maximaal haalbare voor <strong>de</strong> oppositie<br />
afgebeeld in figuur 4, naast het eer<strong>de</strong>r bepaal<strong>de</strong><br />
maximaal haalbare voor <strong>de</strong> coalitie.<br />
Als alle partijen, gegeven <strong>de</strong>ze groepsin<strong>de</strong>ling,<br />
<strong>de</strong> bes<strong>te</strong> stra<strong>te</strong>gie volgen zal <strong>de</strong> coalitie 36 ze<strong>te</strong>ls<br />
krijgen en <strong>de</strong> oppositie 39 ze<strong>te</strong>ls. Het valt op dat<br />
40<br />
39<br />
38<br />
37<br />
36<br />
35<br />
34<br />
33<br />
32<br />
Figuur 4. Het maximaal haalbare ze<strong>te</strong>laantal gegeven een <strong>de</strong>ler<br />
13<br />
STAtOR juli 2011|2<br />
<strong>bij</strong> optimale stra<strong>te</strong>gieën <strong>de</strong> 74s<strong>te</strong> en 75s<strong>te</strong> ze<strong>te</strong>l<br />
wor<strong>de</strong>n ver<strong>de</strong>eld <strong>bij</strong> <strong>de</strong>lers die heel dicht <strong>bij</strong> <strong>de</strong><br />
officiële kies<strong>de</strong>ler liggen.<br />
Open eindjes<br />
De wiskundige kant van <strong>de</strong> verkiezing is hiermee<br />
belicht, er zijn ech<strong>te</strong>r nog wat losse eindjes. Een<br />
bewijs van NP-compleetheid en het bestaan van<br />
een puur Nash evenwicht zijn waarschijnlijk niet<br />
moeilijk <strong>te</strong> geven. Ech<strong>te</strong>r, groepsin<strong>de</strong>lingen en s<strong>te</strong>m-<br />
afspraken zijn politieke kwesties, die ongetwijfeld<br />
veel moeilijker zijn dan <strong>de</strong> beschreven wiskun<strong>de</strong>.<br />
Li<strong>te</strong>ratuur<br />
1. NOS dossier Strijd om <strong>de</strong> Eers<strong>te</strong> Kamer: http://nos.<br />
nl/dossier/210939-eers<strong>te</strong>-kamerverkiezingen-2011/<br />
thema/serie-strijd-om-<strong>de</strong>-eers<strong>te</strong>-kamer/<br />
2. Eén Vandaag uitzending Verkiezingen een strijd op<br />
lan<strong>de</strong>lijk niveau, 17 februari 2011: http://beta.uitzendinggemist.nl/afleveringen/1062892<br />
3. Websi<strong>te</strong> Eers<strong>te</strong> Kamer: www.eers<strong>te</strong>kamer.nl/<br />
4. Websi<strong>te</strong> Kiesraad: www.kiesraad.nl/<br />
Jacob Jan Paulus en Jaap Praagman zijn bei<strong>de</strong>n werkzaam<br />
<strong>bij</strong> Consultants in Quantitative Methods (CQM).<br />
E-mail: & <br />
31<br />
1950 2050 2150 2250 2350 2450<br />
Coalitie (X max)<br />
Oppositie (X max)<br />
Kies<strong>de</strong>ler
<strong>Hoe</strong> optimalisatie in<br />
een aantal jaren in het DNA<br />
van TNT Express is gekomen<br />
Hein Fleuren, Marco Hendriks & Annelies Wou<strong>te</strong>rsen<br />
We schrijven 2004, een jaar waarin s<strong>te</strong>vige groei<br />
voor TNT Express een soort natuurconstan<strong>te</strong> was.<br />
Op een namiddag heeft op het CentER for Applied<br />
Research een aantal mensen een kort overzichtje<br />
gemaakt wat <strong>de</strong> gro<strong>te</strong> 4 Express spelers (UPS,<br />
Fe<strong>de</strong>x, DHL en TNT Express) aan optimalisatie<br />
<strong>de</strong><strong>de</strong>n. Voor UPS en Fe<strong>de</strong>x is re<strong>de</strong>lijk wat in <strong>de</strong><br />
li<strong>te</strong>ratuur (business en we<strong>te</strong>nschappelijk) <strong>te</strong> vin-<br />
<strong>de</strong>n. Voor DHL ook nog wel wat maar voor TNT...<br />
Met <strong>de</strong>ze boodschap naar TNT getogen, alwaar<br />
we (ach<strong>te</strong>raf) blijkbaar op het juis<strong>te</strong> moment <strong>bij</strong><br />
<strong>de</strong> juis<strong>te</strong> man aan tafel kwamen: Marco Hen-<br />
driks, toen<strong>de</strong>rtijd verantwoor<strong>de</strong>lijk voor business<br />
improvement in Express’ netwerken. In dit artikel<br />
belich<strong>te</strong>n we wat er zoal <strong>bij</strong> komt kijken om Ope-<br />
rations Research succesvol toe <strong>te</strong> passen in een<br />
groot bedrijf als TNT.<br />
14<br />
STAtOR juli 2011|2<br />
wat is een Express netwerk?<br />
Gro<strong>te</strong> Express spelers vervoeren dagelijks mil-<br />
joenen pakjes wereldwijd van zakelijke adressen<br />
naar zakelijke adressen, en in toenemen<strong>de</strong> ma<strong>te</strong><br />
ook consumen<strong>te</strong>nadressen (e-commerce). Deze<br />
verzending kent specifieke tijdsrestricties, zowel<br />
in het aantal transit dagen als <strong>de</strong> tijd waarvoor<br />
het moet wor<strong>de</strong>n afgeleverd (voor 9:00 uur, voor<br />
12:00 uur of gehele dag). De algemene infrastruc-<br />
tuur die gekozen wordt is er een van vele <strong>de</strong>pots<br />
van waaruit busjes rondrij<strong>de</strong>n om zendingen<br />
op <strong>te</strong> halen en die naar het <strong>de</strong>pot <strong>te</strong> brengen.<br />
Vandaaruit wor<strong>de</strong>n ze met gro<strong>te</strong> trucks naar een<br />
hub, zeg maar een groot sor<strong>te</strong>ercentrum, gebracht<br />
waar ze ’s nachts ver<strong>de</strong>r wor<strong>de</strong>n gesor<strong>te</strong>erd naar,<br />
óf <strong>de</strong> volgen<strong>de</strong> hub, óf het eind<strong>de</strong>pot. De trucks
ij<strong>de</strong>n volgens een vooraf uitgedacht schema en<br />
vertrekken op tijd, of <strong>de</strong> truck nu vol is of niet.<br />
Eenmaal aangekomen op het eind<strong>de</strong>pot wor<strong>de</strong>n<br />
<strong>de</strong> pakjes weer met busjes vervoerd naar <strong>de</strong> afle-<br />
veradressen. Ophalen en wegbrengen dui<strong>de</strong>n we<br />
aan met PuD (Pickup & Delivery) en het verkeer<br />
tussen <strong>de</strong>pots en hubs met Linehaul. PuD-vans en<br />
linehaul-trucks wor<strong>de</strong>n over het algemeen alle-<br />
maal ingehuurd <strong>bij</strong> transportbedrijven die rij<strong>de</strong>n<br />
on<strong>de</strong>r TNT-vlag.<br />
Eers<strong>te</strong> project: Netwerk Italië<br />
Het i<strong>de</strong>e waarmee we aankwamen <strong>bij</strong> TNT was<br />
leuk maar moest eerst in het eigen jargon ver-<br />
taald wor<strong>de</strong>n en, TNT is commercieel, er kwam<br />
gewoon een <strong>te</strong>n<strong>de</strong>r waarop 5 bedrijven hebben<br />
gereageerd. Na selectie bleef <strong>de</strong> combinatie van<br />
<strong>de</strong> Universi<strong>te</strong>it van Tilburg en ORTEC over. We<br />
moch<strong>te</strong>n aan <strong>de</strong> slag met het linehaul-netwerk<br />
van Italië om onze bewering waar <strong>te</strong> maken dat<br />
met Operations Research voor<strong>de</strong>len <strong>te</strong> behalen<br />
waren.<br />
De verleiding is groot, zeker voor OR’ers, om<br />
direct in mo<strong>de</strong>llen <strong>te</strong> gaan <strong>de</strong>nken maar we heb-<br />
ben dit, ook met hulp van TNT, kunnen weerstaan.<br />
We zijn begonnen met een goe<strong>de</strong> data-analy-<br />
se. Met behulp van AIMMS hebben we diverse<br />
bestan<strong>de</strong>n van zendingen, linehaul-schema’s,<br />
voertuigen en geografische gegevens aan elkaar<br />
gekoppeld. Dit bleek, na <strong>de</strong> altijd weer nodige<br />
cleaning van gegevens, al snel een goudmijn <strong>te</strong><br />
zijn om allerlei snelle verbe<strong>te</strong>ringen <strong>te</strong> vin<strong>de</strong>n.<br />
Voorbeel<strong>de</strong>n zijn voertuigen die halfvol relatief<br />
dicht ach<strong>te</strong>r elkaar in <strong>de</strong>zelf<strong>de</strong> richting re<strong>de</strong>n,<br />
voertuigen die een <strong>te</strong> lage belading had<strong>de</strong>n maar<br />
waarvan <strong>de</strong> lading makkelijk via een an<strong>de</strong>re rou<strong>te</strong><br />
kon gaan. Dit lijkt triviaal maar is het zeker niet<br />
als men be<strong>de</strong>nkt dat er in dit netwerk zo’n 500 tot<br />
600 trucks elke nacht rondrij<strong>de</strong>n met dagelijks<br />
re<strong>de</strong>lijk wisselen<strong>de</strong> volumes. De netwerken met<br />
al hun aansluitingen die gehaald moe<strong>te</strong>n wor<strong>de</strong>n<br />
la<strong>te</strong>n zich goed vergelijken met een spoorboekje<br />
zoals dat <strong>bij</strong> <strong>de</strong> spoorwegen gehan<strong>te</strong>erd wordt.<br />
Na <strong>de</strong> data-analyse was het veel hel<strong>de</strong>r<strong>de</strong>r waar<br />
<strong>de</strong> gro<strong>te</strong> knelpun<strong>te</strong>n za<strong>te</strong>n en kon<strong>de</strong>n we gericht<br />
gaan optimaliseren. In dit netwerk is dit met<br />
Shortrec (rou<strong>te</strong>ringspakket van ORTEC) gebeurd,<br />
waar ui<strong>te</strong>raard <strong>de</strong> TNT-specifieke kenmerken<br />
moes<strong>te</strong>n wor<strong>de</strong>n ingebracht. In <strong>de</strong> optimalisatie<br />
hebben we ui<strong>te</strong>in<strong>de</strong>lijk gekozen om een lange lijst<br />
van locale verbe<strong>te</strong>ringen aan het management<br />
voor <strong>te</strong> leggen en niet het schema radicaal om <strong>te</strong><br />
gooien. Deze lange lijst van verbe<strong>te</strong>ringen is door<br />
<strong>de</strong> transport-managers van Italië geheel doorgenomen<br />
op haalbaarheid. Verschillen<strong>de</strong> aangedragen<br />
verbe<strong>te</strong>ringen sneuvel<strong>de</strong>n vanwege diverse<br />
praktijkre<strong>de</strong>nen, maar ui<strong>te</strong>in<strong>de</strong>lijk bleef een gro<strong>te</strong>r<br />
dan verwacht<strong>te</strong> besparing over: zo’n 5 procent<br />
op een netwerk van vele tientallen miljoenen<br />
kos<strong>te</strong>n per jaar. Eind 2005 was <strong>de</strong> eers<strong>te</strong> mutatie<br />
in het DNA van TNT een feit.<br />
Volgen<strong>de</strong> projec<strong>te</strong>n<br />
De in<strong>te</strong>resse was gewekt en volgen<strong>de</strong> netwerk<br />
linehaul-projec<strong>te</strong>n dien<strong>de</strong>n zich aan in lan<strong>de</strong>n<br />
als Frankrijk, Duitsland, Slovenië en Spanje. Ook<br />
<strong>de</strong>ze projec<strong>te</strong>n hebben we gedaan met <strong>de</strong> ontwikkel<strong>de</strong><br />
tools en methodologieën, maar daarnaast<br />
ontstond er een s<strong>te</strong>rke behoef<strong>te</strong> aan het <strong>de</strong>len<br />
van kennis op optimalisatiegebied maar ook op<br />
implementatiegebied. Met het laats<strong>te</strong> gaat het er<br />
met name om hoe een aangetoon<strong>de</strong> besparing<br />
ook werkelijk gerealiseerd kan wor<strong>de</strong>n en hoe<br />
<strong>de</strong> overgang zo soepel mogelijk kan verlopen. Dit<br />
resul<strong>te</strong>er<strong>de</strong> in <strong>de</strong> oprichting van een zogenaam<strong>de</strong><br />
COP (Community of Practice) waar diverse <strong>de</strong>elnemers<br />
uit <strong>de</strong> lan<strong>de</strong>n maar ook kennisorganisaties<br />
en zelfs het World Food Program <strong>bij</strong> aanschoof.<br />
Drie keer per jaar komen we voor twee dagen <strong>bij</strong><br />
elkaar om een specifiek on<strong>de</strong>rwerp van netwerk<br />
15<br />
STAtOR juli 2011|2
optimalisatie en alles wat daarmee samenhangt<br />
<strong>te</strong> bespreken. Belangrijk hier<strong>bij</strong> is dat een <strong>de</strong>r-<br />
gelijke kennisclub niet een theekransje wordt<br />
maar dat er ook ech<strong>te</strong> <strong>beslissingen</strong> wor<strong>de</strong>n voor-<br />
bereid die door het management kunnen wor-<br />
<strong>de</strong>n bekrachtigd (of verworpen). Dit vereist een<br />
behoorlijk s<strong>te</strong>rke aansturing aangezien specialis-<br />
<strong>te</strong>n nogal eens <strong>de</strong> neiging hebben uit <strong>te</strong> wij<strong>de</strong>n en<br />
erg veel <strong>de</strong>tails <strong>te</strong> willen meenemen.<br />
Belangrijk binnen elk optimalisatieproject<br />
van TNT is <strong>de</strong> driehoek: People & Organisation,<br />
Processes & Procedures en Tools & Technology.<br />
Aan alle <strong>de</strong>ze drie aspec<strong>te</strong>n moet ruim aandacht<br />
wor<strong>de</strong>n gegeven, het moet qua uitwerking goed<br />
op elkaar aanslui<strong>te</strong>n en als geheel wor<strong>de</strong>n afge-<br />
<strong>te</strong>kend door het management. Een paar voorbeel-<br />
<strong>de</strong>n: (optimalisatie)-tools kunnen nog zo goed zijn,<br />
als ze niet ingebed zijn in <strong>de</strong> (eventueel veran<strong>de</strong>r-<br />
<strong>de</strong>) processen dan werken ze niet. Als <strong>bij</strong> prachtige<br />
oplossingen <strong>de</strong> mensen niet meewerken, of <strong>de</strong><br />
organisatie heeft an<strong>de</strong>re performance indicato-<br />
ren, ook dan zal er weinig effect in <strong>de</strong> praktijk zijn.<br />
An<strong>de</strong>re gebie<strong>de</strong>n<br />
Na twee jaar veel in <strong>de</strong> netwerkhoek <strong>te</strong> hebben<br />
uitgebouwd, kwamen ook langzamerhand <strong>de</strong> vra-<br />
gen of ook in <strong>de</strong> an<strong>de</strong>re supply chain-on<strong>de</strong>r<strong>de</strong>len<br />
van TNT, namelijk PuD, <strong>de</strong> luchtvrachtdivisie en<br />
<strong>de</strong> <strong>de</strong>pots & hubs geoptimaliseerd kon wor<strong>de</strong>n.<br />
Op een zelf<strong>de</strong> wijze en met hetzelf<strong>de</strong> accent op <strong>de</strong><br />
hierboven beschreven driehoek zijn hier projec<strong>te</strong>n<br />
opgestart en COP’s opgezet.<br />
Nu wordt er met vehicle routing-software drif-<br />
tig geoptimaliseerd in het ophalen en afleveren<br />
van zendingen. De inzet van personeel in <strong>de</strong><br />
<strong>de</strong>pots en hubs wordt geoptimaliseerd. Er zijn<br />
tools die on<strong>de</strong>rs<strong>te</strong>unen <strong>bij</strong> het inrich<strong>te</strong>n en opzet-<br />
<strong>te</strong>n van nieuwe hubs en <strong>de</strong>pots. Comple<strong>te</strong> TNT-<br />
specifieke oplossingen zijn uitgewerkt voor <strong>de</strong><br />
netwerken en zware MIP-mo<strong>de</strong>llen gebouwd voor<br />
16<br />
STAtOR juli 2011|2<br />
<strong>de</strong> optimalisatie van <strong>de</strong> Express luchtvloot die<br />
ruim 40 vliegtuigen omvat.<br />
Om een indruk <strong>te</strong> geven: vorig jaar zijn in al<br />
<strong>de</strong>ze gebie<strong>de</strong>n samen ruim 100 kleinere en gro<strong>te</strong>re<br />
optimalisatieprojec<strong>te</strong>n uitgevoerd!<br />
Suboptimalisatie?<br />
Van het begin af aan hebben we ons gerealiseerd<br />
dat <strong>de</strong> comple<strong>te</strong> supply chain geoptimaliseerd<br />
moet wor<strong>de</strong>n. Maar als er nog veel opgebouwd<br />
moet wor<strong>de</strong>n is het toch verstandig om met <strong>de</strong><br />
supply chain on<strong>de</strong>r<strong>de</strong>len <strong>te</strong> beginnen. Supply<br />
chain <strong>de</strong>nken is lastig in een groot bedrijf waar<br />
één van <strong>de</strong> on<strong>de</strong>r<strong>de</strong>len al een wereld op zich is<br />
met een gro<strong>te</strong> complexi<strong>te</strong>it. Het zou <strong>bij</strong>voorbeeld<br />
kunnen be<strong>te</strong>kenen dat we moe<strong>te</strong>n inves<strong>te</strong>ren in<br />
mensen in <strong>de</strong>pots en hubs (of sor<strong>te</strong>ermachines)<br />
waardoor <strong>de</strong>ze duur<strong>de</strong>r wor<strong>de</strong>n <strong>te</strong>rwijl we <strong>de</strong><br />
voor<strong>de</strong>len in <strong>de</strong> netwerken en PuD behalen. Maar<br />
wat als <strong>de</strong> <strong>de</strong>pot/hub-manager on<strong>de</strong>r vrij zware<br />
targets staat?<br />
Enigszins geholpen door <strong>de</strong> crisis eind 2008<br />
zijn we <strong>de</strong> eers<strong>te</strong> comple<strong>te</strong> supply chain mo<strong>de</strong>llen<br />
gaan ontwikkelen. De eers<strong>te</strong> mo<strong>de</strong>llen zijn sim-<br />
pele ‘doorrekenmo<strong>de</strong>llen’ om <strong>de</strong> comple<strong>te</strong> ke<strong>te</strong>n<br />
in door TNT zelf aangedragen al<strong>te</strong>rnatieven door<br />
<strong>te</strong> rekenen. Maar schijn bedriegt hier: het doorre-<br />
kenmo<strong>de</strong>l van <strong>de</strong> ke<strong>te</strong>n bevat als on<strong>de</strong>r<strong>de</strong>len weer<br />
zo’n vier optimalisatiemo<strong>de</strong>llen en heel veel bere-<br />
keningen. Een gemid<strong>de</strong>l<strong>de</strong> run laadt 60 miljoen<br />
data-elemen<strong>te</strong>n en heeft een uurtje rekentijd op<br />
een zware PC nodig.<br />
Ver<strong>de</strong>re kennisopbouw<br />
Geduren<strong>de</strong> <strong>de</strong> afgelopen jaren ont<strong>de</strong>k<strong>te</strong>n we dat<br />
het heel lastig is om met me<strong>de</strong>werkers in het veld<br />
<strong>te</strong> werken die onvoldoen<strong>de</strong> <strong>de</strong> tools en <strong>de</strong> ach<strong>te</strong>r-<br />
liggen<strong>de</strong> i<strong>de</strong>eën begrijpen. Dit heeft geleid dat we,
<strong>te</strong>zamen met TiasNimbas, <strong>de</strong> GO-aca<strong>de</strong>my (GO van<br />
Global Optimisation) hebben opgezet. De GO-aca-<br />
<strong>de</strong>my kent 5 modules van elk vier dagen, welke na 2<br />
jaar tijd wordt afgerond met een afstu<strong>de</strong>eropdracht<br />
van een vijftal maan<strong>de</strong>n in <strong>de</strong> praktijk van <strong>de</strong> TNT-<br />
lan<strong>de</strong>n. In april 2011 hebben we <strong>de</strong> twee<strong>de</strong> lichting<br />
van veertig Supply Chain Mas<strong>te</strong>rs, let<strong>te</strong>rlijk vanuit<br />
<strong>de</strong> hele wereld, hun diploma kunnen overhandigen.<br />
De inhoud van <strong>de</strong> GO-aca<strong>de</strong>my wordt ook constant<br />
aangepast aan veran<strong>de</strong>ringen in <strong>de</strong> stra<strong>te</strong>gie van<br />
Express. Op dit moment zijn we bezig met <strong>de</strong> voor-<br />
bereiding van alweer het vijf<strong>de</strong> cohort. Dit be<strong>te</strong>kent<br />
dat we in enkele jaren tijd hon<strong>de</strong>r<strong>de</strong>n mensen op<br />
hetzelf<strong>de</strong> kennisniveau brengen die daarnaast ook<br />
nog eens eenzelf<strong>de</strong> ‘taal’ spreken.<br />
En nu ver<strong>de</strong>r?<br />
Wellicht is <strong>de</strong> indruk ontstaan dat we wel <strong>bij</strong>na<br />
klaar moe<strong>te</strong>n zijn. Niets is min<strong>de</strong>r waar. Er valt<br />
voor OR-ers nog heel veel <strong>te</strong> doen, vooral in het<br />
toepassen (<strong>de</strong>ployment) van alle kennis. Maar ook<br />
infrastructuuroptimalisatie, in<strong>te</strong>gratie van lean-<br />
concep<strong>te</strong>n en optimalisatie, supply chain <strong>de</strong>nken<br />
samen met <strong>de</strong> klant en geoptimaliseer<strong>de</strong> <strong>de</strong>pots &<br />
hubs staan nog maar aan het begin. Dit, ondanks<br />
dat TNT in een hoog <strong>te</strong>mpo gespecialiseer<strong>de</strong> af<strong>de</strong>-<br />
lingen hiervoor heeft opgezet. Het lijstje waarmee<br />
we vijf jaar gele<strong>de</strong>n naar TNT gingen is allang niet<br />
leeg meer maar helaas/gelukkig zit <strong>de</strong> concurren-<br />
tie ook niet stil...<br />
Hein Fleuren is hoogleraar Operations Research aan <strong>de</strong><br />
Universi<strong>te</strong>it van Tilburg en is gespecialiseerd in <strong>de</strong> praktische<br />
toepassing van Operations Research.<br />
E-mail: <br />
Marco Hendriks is als Director Optimisation &<br />
Engineering werkzaam <strong>bij</strong> TNT Express.<br />
E-mail: <br />
Annelies Wou<strong>te</strong>rsen is als Supply Chain Consultant<br />
werkzaam <strong>bij</strong> ORTEC.<br />
E-mail: <br />
A G E N D A<br />
21 tot en met 26 augustus 2011<br />
Het 58s<strong>te</strong> World Statistics Congress van het In<strong>te</strong>rnational<br />
Statistical Institu<strong>te</strong> (ISI) vindt in Dublin<br />
van 21 – 26 augustus 2011 plaats. Het we<strong>te</strong>nschappelijk<br />
programma omvat diverse, in<strong>te</strong>ressan<strong>te</strong><br />
on<strong>de</strong>rwerpen. Op 24 augustus is er een speciale<br />
themadag ‘Wa<strong>te</strong>r, quality and quantity’; statistische<br />
kwesties met betrekking tot wa<strong>te</strong>r en <strong>de</strong><br />
wa<strong>te</strong>rkwali<strong>te</strong>it staan dan centraal. Het tweejaarlijks<br />
congres wordt bezocht door statistici die op<br />
verschillen<strong>de</strong> <strong>te</strong>rreinen werkzaam zijn, zoals in <strong>de</strong><br />
financiële sector en het bedrijfsleven, <strong>bij</strong> <strong>de</strong> overheid<br />
en we<strong>te</strong>nschappelijk on<strong>de</strong>rzoeksinstitu<strong>te</strong>n<br />
of in het on<strong>de</strong>rwijs. Het congres wil een ontmoetingsplek<br />
zijn om ervaringen en expertise <strong>te</strong> <strong>de</strong>len<br />
en om tot nieuwe inzich<strong>te</strong>n <strong>te</strong> komen. Zie voor het<br />
hele programma, aanmelding en indienen van<br />
papers <strong>de</strong> websi<strong>te</strong> .<br />
17 tot en met 19 augustus 2011<br />
De tweejaarlijks conferentie van <strong>de</strong> In<strong>te</strong>rnational<br />
Association for Official Statistics (IAOS) die<br />
van 17 – 19 augustus in Belfast wordt gehou<strong>de</strong>n,<br />
kan gezien wor<strong>de</strong>n als een ‘sa<strong>te</strong>lli<strong>te</strong>’ van het ISIcongres<br />
in Dublin. Het thema van <strong>de</strong> conferentie<br />
is ‘The Demography of Ageing and Official Statistics’.<br />
Centraal staan <strong>de</strong> omvang en kenmerken<br />
van <strong>de</strong> vergrijzing en <strong>de</strong> impact op het sociale<br />
en economische beleid. IAOS wil <strong>de</strong> kennis over<br />
overheidsstatistieken bevor<strong>de</strong>ren en het gebruik<br />
van effectieve en efficiën<strong>te</strong> statistische diens<strong>te</strong>n<br />
wereldwijd stimuleren. De IAOS-conferentie is<br />
georganiseerd door het Northern Ireland Statistics<br />
and Research Agency (NISRA), in samenwerking<br />
met het Centre for Ageing Research and Development<br />
in Ireland (CARDI) en <strong>de</strong> Queen’s University<br />
in Belfast. Zie voor meer informatie <strong>de</strong> websi<strong>te</strong><br />
.<br />
17<br />
STAtOR juli 2011|2
Karl Pearson<br />
tussen Statistiek en filosofie<br />
Richard Starmans<br />
De Britse statisticus Karl Pearson (1857-1936)<br />
neemt in <strong>de</strong> geschie<strong>de</strong>nis van <strong>de</strong> statistiek een<br />
onwrikbare plaats in. Hij geldt met Francis Gal-<br />
ton en Ronald Fisher als <strong>de</strong> wegberei<strong>de</strong>r van <strong>de</strong><br />
mo<strong>de</strong>rne statistiek en was een belangrijk gang-<br />
maker van <strong>de</strong> probabilistische revolutie die zich<br />
eind negentien<strong>de</strong> eeuw in diverse disciplines vol-<br />
trok. Dat gebeur<strong>de</strong> in alou<strong>de</strong>, gevestig<strong>de</strong> we<strong>te</strong>n-<br />
schappen als <strong>de</strong> fysica (statistische mechanica<br />
van Boltzmann, Maxwell en Gibbs), maar ook in<br />
nieuwe, opkomen<strong>de</strong> disciplines, zoals <strong>de</strong> soci-<br />
ale we<strong>te</strong>nschappen (Que<strong>te</strong>let en la<strong>te</strong>r Durkheim),<br />
<strong>de</strong> psychologie en vooral <strong>de</strong> biologie (evolutie-<br />
theorie, genetica, zoölogie), die eerst in nauwe<br />
wisselwerking met <strong>de</strong> statistiek tot bloei kwam.<br />
18<br />
STAtOR juli 2011|2<br />
De biometricus Pearson en (la<strong>te</strong>r) <strong>de</strong> men<strong>de</strong>liaan<br />
Fisher namen daar<strong>bij</strong> het voortouw. Ook nu is <strong>de</strong><br />
naam van Pearson nog s<strong>te</strong>eds verbon<strong>de</strong>n aan vele<br />
statistische inzich<strong>te</strong>n en metho<strong>de</strong>n: correlatie- en<br />
regresssie-analyse, <strong>de</strong> Chi-kwadraat goodness-of-<br />
fitness toets, aan <strong>te</strong>rmen als standaar<strong>de</strong>viatie en<br />
kurtosis en ui<strong>te</strong>raard aan zijn fundamen<strong>te</strong>le werk<br />
op het gebied van (families van) scheve ver<strong>de</strong>lin-<br />
gen.<br />
filosofie en statistiek<br />
Pearsons in<strong>te</strong>llectuele erfenis overstijgt <strong>de</strong> sta-<br />
tistiek in engere zin. Hij was evenzeer een veel-
zijdig en vernieuwend filosoof, die blijk gaf van<br />
een diepgaand inzicht in <strong>de</strong> wijsgerige kernpro-<br />
blemen die het tijdsgewricht waarin hij leef<strong>de</strong><br />
bepaal<strong>de</strong>n. Hij hield zich actief bezig met <strong>de</strong><br />
grondslagen van we<strong>te</strong>nschapsgebie<strong>de</strong>n als wis-<br />
kun<strong>de</strong>, natuurkun<strong>de</strong> en evolutietheorie, maar<br />
bewoog zich eveneens moei<strong>te</strong>loos op het <strong>te</strong>rrein<br />
van politieke filosofie en let<strong>te</strong>rkun<strong>de</strong>. Vooral zijn<br />
lijvige The Grammar of Science (GoS), dat hij op<br />
35-jarige leeftijd in 1892 publiceer<strong>de</strong>, biedt een<br />
rijk palet aan we<strong>te</strong>nschapsfilosofische thema’s;<br />
het inductieprobleem en causali<strong>te</strong>it, <strong>de</strong> relativi<strong>te</strong>it<br />
van ruim<strong>te</strong> en tijd, <strong>de</strong> ontologische status van <strong>de</strong><br />
werkelijkheid, evolutietheorie en ethiek. Het werk<br />
beleef<strong>de</strong> vele herdrukken en ken<strong>de</strong> zowel befaam-<br />
<strong>de</strong> bewon<strong>de</strong>raars (Eins<strong>te</strong>in) als <strong>te</strong>genstan<strong>de</strong>rs (<strong>de</strong><br />
filosoof C.S. Peirce).<br />
Filosofie en statistiek vormen <strong>bij</strong> Pearson<br />
bovendien twee zij<strong>de</strong>n van <strong>de</strong> zelf<strong>de</strong> medaille.<br />
Kennis van <strong>de</strong> aard van <strong>de</strong>ze verbon<strong>de</strong>nheid is dan<br />
ook onontbeerlijk voor een juis<strong>te</strong> waar<strong>de</strong>ring van<br />
zijn nala<strong>te</strong>nschap. Vooral GoS geldt als <strong>de</strong> sleu-<br />
<strong>te</strong>l tot zijn statistische werk. Kennistheoretisch<br />
betoont Pearson zich in GoS een uitgesproken<br />
empirist. Hij schaart zich daarmee in een alou<strong>de</strong><br />
Britse, anti-metafysische traditie (Bacon, Locke,<br />
Hume), die ook in <strong>de</strong> negentien<strong>de</strong> eeuw vele aan-<br />
hangers ken<strong>de</strong> en waarvan John Stuart Mill en<br />
Herbert Spencer <strong>de</strong> invloedrijks<strong>te</strong> waren.<br />
Anti-causalist<br />
Maar Pearson ging ver<strong>de</strong>r dan zijn illus<strong>te</strong>re land-<br />
geno<strong>te</strong>n en beken<strong>de</strong> zich tot <strong>de</strong> fenomenalisti-<br />
sche filosofie van zijn vroegere leermees<strong>te</strong>r Ernst<br />
Mach, volgens welke doctrine <strong>de</strong> werkelijkheid<br />
bestaat uit elemen<strong>te</strong>n (kleuren, trillingen, tij<strong>de</strong>n),<br />
die zich manifes<strong>te</strong>ren in een stroom van sense<br />
data of direc<strong>te</strong> gewaarwordingen. Deze zijn neu-<br />
traal (noch gees<strong>te</strong>lijk, noch ma<strong>te</strong>rieel) en vanuit<br />
<strong>de</strong>ze gewaarwordingen kunnen zowel ma<strong>te</strong>riële<br />
19<br />
STAtOR juli 2011|2<br />
objec<strong>te</strong>n als bewustzijnsinhou<strong>de</strong>n wor<strong>de</strong>n gecon-<br />
strueerd. De we<strong>te</strong>nschap moet geen verklaringen<br />
nastreven of causale mechanismen postuleren,<br />
maar heeft primair een <strong>de</strong>nkeconomische functie;<br />
<strong>de</strong> stroom van primaire sensaties moet zo goed<br />
mogelijk in kaart wor<strong>de</strong>n gebracht en samenge-<br />
vat in een overzich<strong>te</strong>lijke taal. Empirische gene-<br />
ralisaties, zoals Boyle’s gaswet, waren nog wel<br />
toegestaan, <strong>de</strong> in die tijd net opgekomen kineti-<br />
sche gastheorie ui<strong>te</strong>raard niet. Ook Pearson stond<br />
huiverachtig <strong>te</strong>genover het toekennen van een<br />
ontologische status aan begrippen die niet direct<br />
gekoppeld waren aan zintuiglijke waarnemingen,<br />
zoals niet-verifieerbare theoretische construc<strong>te</strong>n<br />
en hij verwierp het zoeken naar een diepere of<br />
hogere werkelijkheid die schuilgaat ach<strong>te</strong>r <strong>de</strong><br />
verschijnselen.<br />
Na of naast Bertrand Russell werd hij <strong>de</strong><br />
belangrijks<strong>te</strong> anti-causalist van zijn tijd; ook zijn<br />
<strong>bij</strong>dragen aan <strong>de</strong> correlatieanalyse moe<strong>te</strong>n in<br />
dit licht wor<strong>de</strong>n bezien. Daarnaast legt Pearson<br />
in GoS een s<strong>te</strong>rk positivistische, om niet <strong>te</strong> zeg-<br />
gen sciëntistische visie aan <strong>de</strong> dag. Hij s<strong>te</strong>lt een<br />
<strong>bij</strong>kans onbegrensd vertrouwen in <strong>de</strong> mo<strong>de</strong>rne<br />
we<strong>te</strong>nschap als regulerend mechanisme voor <strong>de</strong><br />
samenleving, dat van mensen volwaardige bur-<br />
gers moest maken en <strong>de</strong> staat op we<strong>te</strong>nschappe-<br />
lijke leest zou schoeien. De verwantschap met <strong>de</strong><br />
grondlegger van het positivisme, August Com<strong>te</strong><br />
is in <strong>de</strong>ze onmiskenbaar. Pearson combineert dit<br />
alles tot slot met een i<strong>de</strong>alistische, dat wil zeg-<br />
gen antima<strong>te</strong>rialistische filosofie over <strong>de</strong> aard<br />
van <strong>de</strong> (kenbare) werkelijkheid. Deze bestaat niet<br />
onafhankelijk van <strong>de</strong> menselijke geest en Pearson<br />
beschouwt we<strong>te</strong>nschap vooral als een classifica-<br />
tie en analyse van <strong>de</strong> inhoud van <strong>de</strong> geest. Haar<br />
domein wordt daarmee veeleer het bewustzijn<br />
dan een onafhankelijk hiervan gegeven ex<strong>te</strong>rne<br />
wereld.<br />
Het belang van <strong>de</strong> Pearsoniaanse revolutie<br />
voor <strong>de</strong> i<strong>de</strong>eëngeschie<strong>de</strong>nis ligt <strong>de</strong>els in <strong>de</strong> wijze<br />
waarop hij <strong>de</strong>ze wijsgerige inzich<strong>te</strong>n uitwerkt
in een constructieve statistische methodologie.<br />
Mins<strong>te</strong>ns zo belangrijk is daar<strong>bij</strong> dat zijn werk het<br />
sluitstuk vormt van een nieuw wereldbeeld, dat<br />
tot stand kwam aan het eind van <strong>de</strong> negentien<strong>de</strong><br />
eeuw. Filosofisch gezien <strong>te</strong>ken<strong>de</strong> zich in die eeuw<br />
een historisering van <strong>de</strong> werkelijkheid af, kwam<br />
tweeduizend jaar substantie<strong>de</strong>nken on<strong>de</strong>r druk <strong>te</strong><br />
staan en vond volgens <strong>de</strong> filosoof Ian Hacking een<br />
‘erosie van het <strong>de</strong><strong>te</strong>rminisme’ plaats.<br />
Daaraan vooraf ging ech<strong>te</strong>r een ruim twee-<br />
duizend jaar durend emancipatieproces van <strong>de</strong><br />
verwan<strong>te</strong> en weerbarstige begrippen variatie en<br />
veran<strong>de</strong>ring, waarmee filosofen, we<strong>te</strong>nschappers<br />
en wiskundigen van oudsher hebben gewors<strong>te</strong>ld.<br />
Dat begon al <strong>bij</strong> <strong>de</strong> Griekse natuurfilosofen, die<br />
een verklaring zoch<strong>te</strong>n voor <strong>de</strong> verschillen<strong>de</strong><br />
aspec<strong>te</strong>n van veran<strong>de</strong>ring: veran<strong>de</strong>ring van plaats<br />
(beweging), ontstaan en vergaan, veran<strong>de</strong>ring<br />
van hoedanigheid en hoeveelheid. Het bestaan<br />
ervan werd dikwijls ontkend, onmogelijk geacht<br />
of gereduceerd tot non-veran<strong>de</strong>ring. Variatie werd<br />
beschouwd als afwijking van een regel of norm,<br />
die in het gunstigs<strong>te</strong> geval moest wor<strong>de</strong>n ver-<br />
klaard. De noties ston<strong>de</strong>n voor onvolmaaktheid<br />
en onvoorspelbaarheid en wer<strong>de</strong>n soms zelf inco-<br />
herent geacht op logische en metafysische gron-<br />
<strong>de</strong>n (Parmeni<strong>de</strong>s). Met name <strong>de</strong> grilligheid van <strong>de</strong><br />
(leven<strong>de</strong>) natuur en <strong>de</strong> veelvuldigheid van haar<br />
verschijningsvormen vorm<strong>de</strong>n een obstakel voor<br />
een <strong>de</strong><strong>te</strong>rministisch wereldbeeld en ston<strong>de</strong>n een<br />
wiskundige bena<strong>de</strong>ring van <strong>de</strong> verschijnselen in<br />
<strong>de</strong> weg. Zelfs pioniers van <strong>de</strong> statistiek als Laplace<br />
(‘errorfuncties’) en Que<strong>te</strong>let (‘l’homme moyen’)<br />
kon<strong>de</strong>n er slechts enige greep op krijgen door <strong>de</strong><br />
gegevens in het keurslijf van <strong>de</strong> normale ver<strong>de</strong>-<br />
ling <strong>te</strong> dwingen.<br />
Inferentiële statistiek<br />
Me<strong>de</strong> door <strong>de</strong> evolutietheorie van Wallace en<br />
Darwin kreeg <strong>de</strong> opvatting dat variatie inherent<br />
20<br />
STAtOR juli 2011|2<br />
is aan <strong>de</strong> natuur en <strong>de</strong> aar<strong>de</strong> een lange geschie<strong>de</strong>-<br />
nis van veran<strong>de</strong>ring kent, vas<strong>te</strong> grond on<strong>de</strong>r <strong>de</strong><br />
voe<strong>te</strong>n. Galton, onvermoeibaar pleitbezorger voor<br />
mathematisering van <strong>de</strong> we<strong>te</strong>nschap, overtuig<strong>de</strong><br />
zijn vriend Pearson dat variatie zich wel <strong>de</strong>gelijk<br />
voor een wiskundige behan<strong>de</strong>ling leen<strong>de</strong>, zon-<br />
<strong>de</strong>r pejoratieve duidingen van afwijkingen, error-<br />
functies, etce<strong>te</strong>ra. Pearson <strong>de</strong>ed daaraan recht<br />
door <strong>de</strong> variatie niet <strong>te</strong> i<strong>de</strong>ntificeren in ‘errors’,<br />
maar in <strong>de</strong> verschijnselen zelf (geco<strong>de</strong>erd in data),<br />
en <strong>te</strong>rug <strong>te</strong> voeren tot verschillen<strong>de</strong> (klassen van)<br />
kansver<strong>de</strong>lingen.<br />
Een cruciale stap zet<strong>te</strong> hij met zijn vroege<br />
werk over scheve ver<strong>de</strong>lingen. Op basis van gro<strong>te</strong><br />
aantallen door Galton verzamel<strong>de</strong> (biometrische)<br />
data zag hij in dat vele verschijnselen niet nor-<br />
maal, doch scheef waren ver<strong>de</strong>eld en met behulp<br />
van vier parame<strong>te</strong>rs (gemid<strong>de</strong>l<strong>de</strong>, standaardaf-<br />
wijking, scheefheid en welving) kon<strong>de</strong>n wor<strong>de</strong>n<br />
beschreven en geclassificeerd. Volgens Pearson<br />
kon zelfs <strong>de</strong> eenheid van <strong>de</strong> we<strong>te</strong>nschappen wor-<br />
<strong>de</strong>n gevon<strong>de</strong>n in <strong>de</strong>ze constructieve, zij het zeer<br />
arbeidsin<strong>te</strong>nsieve metho<strong>de</strong>. De variabili<strong>te</strong>it in <strong>de</strong><br />
natuur manifes<strong>te</strong>er<strong>de</strong> zich in een pun<strong>te</strong>nwolk van<br />
metingen en Pearson zocht naar het ‘best fitting’<br />
mo<strong>de</strong>l, <strong>de</strong> functie die het bes<strong>te</strong> pas<strong>te</strong> <strong>bij</strong> <strong>de</strong> data;<br />
veeleer een zuinige beschrijving, dan een causaal,<br />
on<strong>de</strong>rliggend mechanisme waardoor <strong>de</strong>ze data<br />
waren gegenereerd. Als eers<strong>te</strong> gaf hij daarmee<br />
kansver<strong>de</strong>lingen een volwaardige plaats in <strong>de</strong><br />
we<strong>te</strong>nschap en open<strong>de</strong> hij <strong>de</strong> <strong>de</strong>ur naar inferen-<br />
tiële statistiek.<br />
Pearson zag <strong>de</strong> wereld op een niveau van<br />
abstractie waar<strong>bij</strong> data, variatie in data, datage-<br />
nereren<strong>de</strong> mechanismen en parame<strong>te</strong>rs van <strong>de</strong><br />
ver<strong>de</strong>lingen <strong>de</strong> werkelijkheid veeleer co<strong>de</strong>ren en<br />
opbouwen en niet zozeer een (vermeen<strong>de</strong>) fysi-<br />
sche werkelijkheid represen<strong>te</strong>ren of afbeel<strong>de</strong>n.<br />
Ges<strong>te</strong>und door zijn macheaanse en i<strong>de</strong>alistische<br />
filosofie in<strong>te</strong>rpre<strong>te</strong>er<strong>de</strong> hij zijn kansver<strong>de</strong>lingen<br />
op een welhaast Pythagoreïsche manier, al werd<br />
Pearsons universum niet gerealiseerd door getal-
len, getalsverhoudingen en getallentypen, maar<br />
door kansver<strong>de</strong>lingen met <strong>bij</strong>behoren<strong>de</strong> para-<br />
me<strong>te</strong>rs en vorm<strong>de</strong>n <strong>de</strong> pun<strong>te</strong>nwolken <strong>de</strong> objec-<br />
<strong>te</strong>n van <strong>de</strong> we<strong>te</strong>nschap. Het wereldbeeld verloor<br />
weliswaar veel van zijn direc<strong>te</strong> aanschouwelijk-<br />
heid, maar paradoxaal genoeg was <strong>de</strong> werkelijk-<br />
heid als statistische ver<strong>de</strong>ling in macheaanse zin<br />
‘waarneembaar’, dicht<strong>bij</strong> <strong>de</strong> gegevens, kenbaar;<br />
een beschrijving van <strong>de</strong> fei<strong>te</strong>lijke data, een gro<strong>te</strong>,<br />
maar eindige <strong>de</strong>elverzameling van <strong>de</strong> verzame-<br />
ling van alle mogelijke metingen, alleen beschik-<br />
baar in een ‘i<strong>de</strong>ale’ situatie. Zolang <strong>de</strong>ze <strong>de</strong>elver-<br />
zameling groot genoeg was zou<strong>de</strong>n <strong>de</strong> bereken<strong>de</strong><br />
‘parame<strong>te</strong>rs’ <strong>de</strong>zelf<strong>de</strong> zijn als die van <strong>de</strong> gehele<br />
verzameling.<br />
Voor zover Pearson een concept van statisti-<br />
sche inferentie ken<strong>de</strong>, was dit vooral gebaseerd<br />
op het i<strong>de</strong>e van <strong>de</strong> goodness-of-fit. Van daad-<br />
werkelijk significance <strong>te</strong>sting of maximum like-<br />
lihood estimation, of zelfs van een volwassen<br />
statistisch mo<strong>de</strong>lbegrip is dan ui<strong>te</strong>raard nog geen<br />
sprake. Daartoe dien<strong>de</strong>n an<strong>de</strong>re wegen <strong>te</strong> wor<strong>de</strong>n<br />
ingeslagen. Dat <strong>de</strong>ed <strong>bij</strong> voorbeeld Pearsons jon-<br />
gere <strong>te</strong>genstrever Fisher, die niet werd beperkt<br />
door macheaanse doctrines en dieper in het<br />
Pythagoreïsche universum schouw<strong>de</strong>. Voor hem<br />
was <strong>de</strong> werkelijkheid een abstrac<strong>te</strong> wiskundige<br />
ver<strong>de</strong>ling, niet waarneembaar of samenvallend<br />
met <strong>de</strong> gegevens, welke slechts een (aselec<strong>te</strong>)<br />
s<strong>te</strong>ekproef vorm<strong>de</strong>n, met een eigen ver<strong>de</strong>ling.<br />
Waarheid was een vas<strong>te</strong>, maar onbeken<strong>de</strong>, popu-<br />
latiegrootheid en kon slechts wor<strong>de</strong>n geschat.<br />
Eers<strong>te</strong> filosoof van <strong>de</strong> statistiek<br />
Het is opmerkelijk dat Pearsons werk in <strong>de</strong> mo<strong>de</strong>r-<br />
ne epis<strong>te</strong>mologie allerminst tot <strong>de</strong> canon behoort.<br />
Allereerst was Pearson een wegberei<strong>de</strong>r van het<br />
logisch positivisme dat in <strong>de</strong> jaren twintig van <strong>de</strong><br />
vorige eeuw in Wenen en Berlijn opkwam. Boven-<br />
dien domineert in <strong>de</strong> con<strong>te</strong>mporaine we<strong>te</strong>n-<br />
21<br />
STAtOR juli 2011|2<br />
schapsfilosofie <strong>de</strong> ‘probabilistische invalshoek’.<br />
Waarschijnlijkheids-mo<strong>de</strong>llen spelen een cruciale<br />
rol in mo<strong>de</strong>rne bena<strong>de</strong>ringen van causali<strong>te</strong>it, in<br />
het We<strong>te</strong>nschappelijk Realisme Debat, en ui<strong>te</strong>r-<br />
aard in <strong>de</strong> (Bayesiaanse) confirmatietheorie, die<br />
al <strong>de</strong>cennia lang een toonaangevend paradigma<br />
vormt binnen <strong>de</strong> kennisleer. Klassieke filosofische<br />
vragen wor<strong>de</strong>n in probabilistische <strong>te</strong>rmen geduid.<br />
Kernvragen als: Wat is <strong>de</strong> werkelijkheid? Bestaat<br />
<strong>de</strong>ze onafhankelijk van <strong>de</strong> geest? Hebben we er<br />
toegang toe? Zo, ja, hoe? Kunnen we er ware uit-<br />
spraken over doen? Zo ja, wat is waarheid en hoe<br />
is <strong>de</strong>ze verbon<strong>de</strong>n met <strong>de</strong> werkelijkheid?<br />
Pearson was <strong>de</strong> eers<strong>te</strong> statisticus die ant-<br />
woor<strong>de</strong>n voors<strong>te</strong>l<strong>de</strong> op al <strong>de</strong>ze vragen, die hij<br />
combineer<strong>de</strong> met een constructieve statistische<br />
methodologie. Juist omdat hij zich bewoog op het<br />
snijvlak van statistiek, filosofie en methodologie<br />
werd hij fei<strong>te</strong>lijk <strong>de</strong> eers<strong>te</strong> filosoof van <strong>de</strong> statis-<br />
tiek. Immers, <strong>de</strong> filosoof van <strong>de</strong> statistiek zal nieu-<br />
we statistische theorieën en paradigma’s altijd<br />
trach<strong>te</strong>n <strong>te</strong> verankeren in <strong>de</strong>ze kernvragen en ze<br />
(me<strong>de</strong>) beschouwen en beoor<strong>de</strong>len als pogingen<br />
om <strong>de</strong>ze <strong>te</strong> beantwoor<strong>de</strong>n. Pearson stond niet<br />
alleen. Wellicht min<strong>de</strong>r expliciet, maar niet min-<br />
<strong>de</strong>r doorwrocht gaf <strong>de</strong> generatie na hem (Fisher,<br />
Jerzy Neyman en Egon Pearson, Bayesianen als<br />
Savage en De Finetti) zich rekenschap van <strong>de</strong>ze<br />
kwesties. De ‘Science of Data’ begon met <strong>de</strong> vraag<br />
naar <strong>de</strong> aard en status van data en vooral naar <strong>de</strong><br />
relatie met <strong>de</strong> werkelijkheid, waaraan zij toch op<br />
<strong>de</strong> een of an<strong>de</strong>re manier ontleend zijn, van waar-<br />
uit zij zijn gegenereerd, die zij moe<strong>te</strong>n represen<strong>te</strong>-<br />
ren, bena<strong>de</strong>ren, co<strong>de</strong>ren, simuleren, vervangen of<br />
wellicht zelfs overbodig maken; zulks afhankelijk<br />
van <strong>de</strong> ingenomen filosofische positie.<br />
Richard Starmans is verbon<strong>de</strong>n aan <strong>de</strong> Facul<strong>te</strong>it<br />
Bètawe<strong>te</strong>nschappen (Department of Information and<br />
Computing Sciences) van <strong>de</strong> Universi<strong>te</strong>it Utrecht. Hij<br />
doet on<strong>de</strong>rzoek op het snijvlak van filosofie, statistiek en<br />
informatica.<br />
E-mail:
RECHTSTREEKS VERWACHTINGEN EVALUEREN OF DE NUL HYPOTHESE TOETSEN?<br />
Rens van <strong>de</strong> Schoot<br />
In <strong>de</strong> we<strong>te</strong>nschappelijke li<strong>te</strong>ratuur wordt door<br />
vrijwel alle on<strong>de</strong>rzoekers klassieke nul hypothese<br />
toetsing (NHT) gebruikt om antwoord <strong>te</strong> geven op<br />
<strong>de</strong> on<strong>de</strong>rzoeksvraag. NHT hoeft ech<strong>te</strong>r niet per se<br />
<strong>de</strong> bes<strong>te</strong> keuze <strong>te</strong> zijn om <strong>de</strong> on<strong>de</strong>rzoeksvraag <strong>te</strong><br />
beantwoor<strong>de</strong>n. In dit artikel laat ik zien waarom<br />
en introduceer ik vervolgens een recent ontwikkel<strong>de</strong><br />
metho<strong>de</strong> die een veelbelovend al<strong>te</strong>rnatief<br />
biedt, namelijk Bayesiaanse Mo<strong>de</strong>l Selectie (BMS).<br />
Informatieve hypothesen<br />
On<strong>de</strong>rzoekers hebben vaak bepaal<strong>de</strong> verwachtingen<br />
over hoe <strong>de</strong> werkelijkheid er uit ziet. Verwachtingen<br />
en hypothesen kunnen gebaseerd zijn op<br />
eer<strong>de</strong>r (li<strong>te</strong>ratuur-) on<strong>de</strong>rzoek, of we<strong>te</strong>nschappelijk<br />
<strong>de</strong>bat. Het doel van veel on<strong>de</strong>rzoekers is het<br />
evalueren van <strong>de</strong>ze verwachtingen om <strong>te</strong> bepalen<br />
welke <strong>de</strong> bes<strong>te</strong> is. Met an<strong>de</strong>re woor<strong>de</strong>n, welke<br />
verwachting <strong>de</strong> mees<strong>te</strong> s<strong>te</strong>un krijgt van <strong>de</strong> verzamel<strong>de</strong><br />
data. Verwachtingen zijn geformuleerd<br />
in <strong>te</strong>rmen van wat ik informatieve hypothesen<br />
noem. Dit omdat er a priori, dat is voordat er data<br />
zijn verzameld, informatie bestaat over <strong>bij</strong>voorbeeld<br />
<strong>de</strong> or<strong>de</strong>ning tussen twee (of meer) groepsgemid<strong>de</strong>l<strong>de</strong>n<br />
gebaseerd op een eer<strong>de</strong>r gepubliceerd<br />
artikel: HA : μ1 < μ2 < μ3 < μ4 , waar<strong>bij</strong> het <strong>te</strong>ken ‘
traditionele p-waar<strong>de</strong> gebruikt om <strong>de</strong>ze <strong>te</strong> ver-<br />
werpen of niet <strong>te</strong> verwerpen. Het omslagpunt van<br />
<strong>de</strong>ze beslissing ligt meestal <strong>bij</strong> <strong>de</strong> welbeken<strong>de</strong><br />
waar<strong>de</strong> van p < ,05. Deze drempelwaar<strong>de</strong> van ,05 is<br />
niet alleen willekeurig gekozen, maar laat alleen<br />
ruim<strong>te</strong> voor <strong>de</strong> conclusie dat een nul hypothese<br />
wel of niet wordt verworpen met niks daar tus-<br />
senin. Dit kan lei<strong>de</strong>n tot vreem<strong>de</strong> <strong>beslissingen</strong>,<br />
<strong>bij</strong>voorbeeld in het geval dat p = ,051 of p = ,049.<br />
Het mag dui<strong>de</strong>lijk zijn dat bei<strong>de</strong> situaties niet<br />
veel van elkaar verschillen. En toch wordt H 0 in<br />
het eers<strong>te</strong> geval niet verworpen en in het twee<strong>de</strong><br />
geval wel.<br />
Wanneer H 0 wordt verworpen, we<strong>te</strong>n we<br />
eigenlijk nog s<strong>te</strong>eds niks over <strong>de</strong> informatieve<br />
hypothesen H A en H B , aangezien <strong>de</strong> al<strong>te</strong>rnatieve<br />
hypothese geen informatie bevat<strong>te</strong> over <strong>de</strong> or<strong>de</strong>-<br />
ning tussen <strong>de</strong> gemid<strong>de</strong>l<strong>de</strong>n. <strong>Hoe</strong> kan een on<strong>de</strong>r-<br />
zoeker dan toch uitspraken doen over <strong>de</strong> informa-<br />
tieve hypothesen?<br />
Kan het ook an<strong>de</strong>rs?<br />
Om erach<strong>te</strong>r <strong>te</strong> komen welke van een set van<br />
informatieve hypothesen het meest waarschijn-<br />
lijk is, gaan we <strong>de</strong>ze direct <strong>te</strong>gen elkaar afzet<strong>te</strong>n<br />
met behulp van Bayes Factors (BFs). BFs zijn een<br />
mo<strong>de</strong>l selectie maat en hou<strong>de</strong>n niet alleen reke-<br />
ning met hoe goed <strong>de</strong> hypothese <strong>bij</strong> <strong>de</strong> data past,<br />
maar ook hoe complex <strong>de</strong> hypothese is. Dit resul-<br />
<strong>te</strong>ert in een direc<strong>te</strong> vergelijking tussen <strong>de</strong> on<strong>de</strong>r-<br />
zoch<strong>te</strong> hypotheses. Een BF van 10 be<strong>te</strong>kent dat H A<br />
tien keer zo veel s<strong>te</strong>un van <strong>de</strong> data krijgt dan H B<br />
23<br />
STAtOR juli 2011|2<br />
en een BF van 1 be<strong>te</strong>kent dat bei<strong>de</strong> hypotheses<br />
even veel s<strong>te</strong>un van <strong>de</strong> data krijgen.<br />
Er is diverse software voor het uitvoeren van<br />
(M)AN(C)OVA’s, multipele multivaria<strong>te</strong> regressie<br />
analyse, kruistabel analyse, en la<strong>te</strong>n<strong>te</strong> klasse ana-<br />
lyse met BMS (zie www.fss.uu.nl/ms/informati-<br />
vehypothesis voor <strong>de</strong> gratis <strong>te</strong> downloa<strong>de</strong>n soft-<br />
ware). De gebruiker hoeft alleen <strong>de</strong> hypothesen<br />
<strong>te</strong> specificeren in <strong>te</strong>rmen van restricties tussen <strong>de</strong><br />
statistische parame<strong>te</strong>rs, zoals μ 1 < μ 2 , en <strong>de</strong> data-<br />
set aan <strong>te</strong> leveren, en <strong>de</strong> software levert <strong>de</strong> BFs<br />
automatisch uit. La<strong>te</strong>n we nu met een inhou<strong>de</strong>lijk<br />
voorbeeld bekijken hoe BMS werkt.<br />
Voorbeeld<br />
Merkwaardig genoeg is het ren<strong>de</strong>ment van door<br />
NWO toegeken<strong>de</strong> promotiesubsidies in Ne<strong>de</strong>rland<br />
tot nu toe niet on<strong>de</strong>rzocht. In een recent gepubli-<br />
ceer<strong>de</strong> artikel on<strong>de</strong>rzoch<strong>te</strong>n Van <strong>de</strong> Schoot, Sonne-<br />
veld en Lockhorst (2011) het al dan niet succesvolle<br />
verloop van <strong>de</strong> promotietrajec<strong>te</strong>n waarvoor in<br />
<strong>de</strong> jaren 1999 tot en met 2001 <strong>bij</strong> Maatschappij-<br />
en Gedragswe<strong>te</strong>nschappen een subsidieaanvraag<br />
werd ingediend die werd gehonoreerd. Succesvol<br />
staat hier voor: <strong>de</strong> bes<strong>te</strong>ding van <strong>de</strong> subsidie werd<br />
bekroond met <strong>de</strong> ver<strong>de</strong>diging van het proefschrift<br />
voor sep<strong>te</strong>mber 2010. Er werd een on<strong>de</strong>rscheid<br />
gemaakt tussen projec<strong>te</strong>n waarin <strong>de</strong> promovendi<br />
in een kleiner programmatisch verband werk<strong>te</strong>n<br />
(met collegae al dan niet op <strong>de</strong>zelf<strong>de</strong> werkplek) en<br />
individuele projec<strong>te</strong>n die men als stand alone zou<br />
kunnen beschouwen.<br />
n gepromoveerd niet-gepromoveerd ren<strong>de</strong>ment<br />
Totaal programma-projec<strong>te</strong>n 112 87 25 77,7%<br />
Individueel project 107 96 11 89,7%<br />
Tabel 1. Subsidieren<strong>de</strong>ment uitgesplitst naar ‘individueel project’/‘project <strong>de</strong>el uitmakend van het programma’
Er waren twee hypothesen geformuleerd:<br />
H 1 : er zijn procentueel evenveel succesvol<br />
afgeron<strong>de</strong> projec<strong>te</strong>n <strong>bij</strong> individuele subsi-<br />
dies als <strong>bij</strong> programmatische subsidies.<br />
Versus<br />
H 2 : er zijn relatief meer succesvol afgeron<strong>de</strong><br />
projec<strong>te</strong>n <strong>bij</strong> individuele subsidies dan <strong>bij</strong><br />
programmatische subsidies.<br />
Merk op dat <strong>de</strong> on<strong>de</strong>rzoekers in dit geval wel <strong>de</strong>ge-<br />
lijk waren geïn<strong>te</strong>resseerd in <strong>de</strong> nul hypothese,<br />
met als kant<strong>te</strong>kening dat BMS veron<strong>de</strong>rs<strong>te</strong>lt dat<br />
het verschil niet precies nul is, maar ongeveer nul.<br />
Uit <strong>de</strong> databestan<strong>de</strong>n van NWO is een lijst<br />
samenges<strong>te</strong>ld van alle promotieprojec<strong>te</strong>n waar-<br />
voor in <strong>de</strong> jaren 1999 tot en met 2001 een subsi-<br />
dieaanvraag werd gehonoreerd. Zie tabel 1 voor <strong>de</strong><br />
percentages geslaagd dan wel gefaald op <strong>de</strong> peil-<br />
datum. Er bestaat een on<strong>de</strong>rver<strong>te</strong>genwoordiging<br />
van programmatische subsidies <strong>bij</strong> het totaal<br />
aantal geslaag<strong>de</strong> projec<strong>te</strong>n. Maar is dit verschil<br />
ook significant en/of relevant?<br />
De klassieke metho<strong>de</strong> om <strong>de</strong>ze vraag <strong>te</strong> beant-<br />
woor<strong>de</strong>n is om een chi-kwadraat toets uit <strong>te</strong><br />
voeren. Dan blijkt dat er een significant verschil<br />
bestaat tussen geobserveer<strong>de</strong> en verwach<strong>te</strong> waar-<br />
<strong>de</strong>s, X2 1, 219 = 8,31; p = ,004. Aangezien het hieruit<br />
nog niet dui<strong>de</strong>lijk wordt waar precies <strong>de</strong> verschil-<br />
len zit<strong>te</strong>n, hebben we ook BMS gebruikt om <strong>de</strong><br />
hypotheses direct af <strong>te</strong> zet<strong>te</strong>n <strong>te</strong>gen elkaar. Uit<br />
<strong>de</strong>ze analyse blijkt dat <strong>de</strong> twee<strong>de</strong> hypothese 28<br />
keer zoveel s<strong>te</strong>un van <strong>de</strong> data krijgt als <strong>de</strong> eers<strong>te</strong><br />
hypothese. Of<strong>te</strong>wel, er is veel s<strong>te</strong>un in <strong>de</strong> data<br />
voor <strong>de</strong> hypothese dat er relatief meer succesvol<br />
afgeron<strong>de</strong> projec<strong>te</strong>n zijn <strong>bij</strong> individuele subsidies<br />
dan <strong>bij</strong> programmatische subsidies.<br />
Conclusie<br />
De resulta<strong>te</strong>n van nul hypothese toetsting geven<br />
vaak geen direct antwoord op <strong>de</strong> on<strong>de</strong>rzoeksvraag.<br />
24<br />
STAtOR juli 2011|2<br />
Informatieve hypothesen kunnen niet direct met<br />
elkaar vergeleken wor<strong>de</strong>n, iets dat met Bayesi-<br />
aanse Mo<strong>de</strong>l Selectie wel kan. Ook wanneer <strong>de</strong><br />
or<strong>de</strong>ning van <strong>de</strong> groepsgemid<strong>de</strong>l<strong>de</strong>n niet geheel<br />
overeen komt met één van <strong>de</strong> hypothesen, geeft<br />
BMS een in<strong>te</strong>rpre<strong>te</strong>erbaar resultaat. Zelfs <strong>bij</strong> veel<br />
complexere on<strong>de</strong>rzoeksvragen dan in dit artikel<br />
besproken, <strong>bij</strong>voorbeeld met meer<strong>de</strong>re (on)afhan-<br />
kelijke variabelen, meer<strong>de</strong>re meetmomen<strong>te</strong>n over<br />
<strong>de</strong> tijd heen, covaria<strong>te</strong>n, meer groepen, enz., geeft<br />
BMS nog s<strong>te</strong>eds een enkel in<strong>te</strong>rpre<strong>te</strong>erbaar getal<br />
per hypothese. BMS resul<strong>te</strong>ert dus in makkelijker<br />
<strong>te</strong> in<strong>te</strong>rpre<strong>te</strong>ren resulta<strong>te</strong>n dan NHT en geeft<br />
bovendien een direct antwoord op <strong>de</strong> on<strong>de</strong>rzoeks-<br />
vraag. BMS is daardoor een veelbelovend al<strong>te</strong>rna-<br />
tief voor NHT en zal s<strong>te</strong>eds vaker opduiken in <strong>de</strong><br />
we<strong>te</strong>nschappelijk li<strong>te</strong>ratuur.<br />
Het artikel is gro<strong>te</strong>n<strong>de</strong>els gebaseerd op het proefschrift<br />
van <strong>de</strong> au<strong>te</strong>ur en <strong>de</strong> genoem<strong>de</strong> li<strong>te</strong>ratuur.<br />
Li<strong>te</strong>ratuur<br />
Hoijtink, H., Klugkist, I., & Boelen, P. A. (Eds.). (2008).<br />
Bayesian evaluation of informative hypotheses in<br />
psychology. New-York: Springer.<br />
Van <strong>de</strong> Schoot, R., Hoijtink, H. & Doosje, S. (2009).<br />
Rechtstreeks Verwachtingen Evalueren of <strong>de</strong> Nul<br />
Hypothese Toetsen? Nul Hypothese Toetsing versus<br />
Bayesiaanse Mo<strong>de</strong>l Selectie. De Psycholoog 4, 196-203.<br />
Van <strong>de</strong> Schoot, R., Hoijtink, H., Mul<strong>de</strong>r, J., Van Aken, M. A. G.,<br />
Orobio <strong>de</strong> Castro, B., Meeus, W. & Romeijn, J.-W. (2011).<br />
Evaluating Expectations about Negative Emotional<br />
Sta<strong>te</strong>s of Aggressive Boys using Bayesian Mo<strong>de</strong>l<br />
Selection. Developmental Psychology, 47, 203-212<br />
Van <strong>de</strong> Schoot, R., Hoijtink, H., & Romeijn, J-W (2011).<br />
Moving beyond traditional null hypothesis <strong>te</strong>sting:<br />
Evaluating expectations directly. Frontiers in<br />
Quantitative Psychology and Measurement, 2:24. doi:<br />
10.3389/fpsyg.2011.00024<br />
Van <strong>de</strong> Schoot. R., Sonneveld, H., & Lockhorst, D. (2011).<br />
Het lot van promotieprojec<strong>te</strong>n: Ren<strong>de</strong>ment van<br />
magw/nwo-subsidies. De Psycholoog, 4, 10-18.<br />
Rens van <strong>de</strong> Schoot is als universitair docent verbon<strong>de</strong>n<br />
aan <strong>de</strong> Facul<strong>te</strong>it Sociale We<strong>te</strong>nschappen (af<strong>de</strong>ling<br />
Metho<strong>de</strong>n en Statistiek) van <strong>de</strong> Universi<strong>te</strong>it Utrecht<br />
E-mail:
Fred S<strong>te</strong>u<strong>te</strong>l c o l u m n<br />
wORDS, wORDS<br />
De combinatie statistiek en taal heeft een lange<br />
traditie. Het begon misschien met Markov, die<br />
het – na<strong>de</strong>rhand – naar hem genoem<strong>de</strong> begrip<br />
Markov-ke<strong>te</strong>n ontwikkel<strong>de</strong> aan <strong>de</strong> hand van <strong>de</strong><br />
opeenvolging van let<strong>te</strong>rs in een bekend Russisch<br />
gedicht. Wat la<strong>te</strong>r werd door statistici <strong>de</strong> frequentie<br />
van let<strong>te</strong>rs in <strong>te</strong>ks<strong>te</strong>n geturfd en geanalyseerd. De<br />
mo<strong>de</strong>rne <strong>te</strong>chniek biedt nieuwe mogelijkhe<strong>de</strong>n.<br />
Mijn vrouw en ik lossen ie<strong>de</strong>re week het Scryptogram<br />
in NRC Han<strong>de</strong>lsblad op. We <strong>gebruiken</strong><br />
daar<strong>bij</strong> soms een woor<strong>de</strong>nboek; om <strong>te</strong> kijken of<br />
een bedacht woord bestaat of om <strong>te</strong> zoeken naar<br />
woor<strong>de</strong>n die, <strong>bij</strong> voorbeeld, met ‘boer’ beginnen.<br />
In ui<strong>te</strong>rs<strong>te</strong> nood <strong>gebruiken</strong> wij een mo<strong>de</strong>rn<br />
wapen: <strong>de</strong> Dikke Van Dale op dvd. Die heeft een<br />
optie ’zoeken op woord(vormen)’. Daar kun je een<br />
woord invullen, waar<strong>bij</strong> <strong>de</strong> nog ontbreken<strong>de</strong> let<strong>te</strong>rs<br />
door vraag<strong>te</strong>kens zijn vervangen. Voorbeeld:<br />
‘?st???s?’. In dit geval is er maar één oplossing:<br />
‘as<strong>te</strong>risk’. Als je al flink wat let<strong>te</strong>rs hebt, is het<br />
aantal mogelijkhe<strong>de</strong>n niet meer dan enkele tientallen;<br />
als je weinig let<strong>te</strong>rs hebt, zijn er soms<br />
hon<strong>de</strong>r<strong>de</strong>n mogelijkhe<strong>de</strong>n. Een enkele keer, als je<br />
een fout gemaakt hebt of als <strong>de</strong> puzzelmaker een<br />
woord gebruikt dat Van Dale niet kent, krijg je <strong>de</strong><br />
me<strong>de</strong><strong>de</strong>ling ‘Er zijn geen artikelen met <strong>de</strong> door u<br />
gezoch<strong>te</strong> vorm’.<br />
Als je nog veel vraag<strong>te</strong>kens hebt, zijn er heel<br />
veel manieren om een woord <strong>te</strong> maken. Dat opent<br />
<strong>de</strong> mogelijkheid – wiskundigen zoeken graag<br />
naar extreme situaties – om het aantal woor<strong>de</strong>n<br />
<strong>te</strong> vin<strong>de</strong>n met een gegeven aantal let<strong>te</strong>rs. Dat<br />
gaat als volgt. Je tikt zeven vraag<strong>te</strong>kens, drukt op<br />
‘En<strong>te</strong>r’ en vindt 17.318 woor<strong>de</strong>n van zeven let<strong>te</strong>rs,<br />
van ‘aaibaar’ tot en met ‘zygenen’. Dat laats<strong>te</strong><br />
woord be<strong>te</strong>kent ‘gro<strong>te</strong> familie van vlin<strong>de</strong>rs, waartoe<br />
o.a. <strong>de</strong> sint-jansvlin<strong>de</strong>r behoort (Zygaenidae)’.<br />
Zo kunnen we <strong>de</strong> woor<strong>de</strong>n van alle mogelijke<br />
leng<strong>te</strong>n afwerken. Alleen, <strong>bij</strong> woor<strong>de</strong>n van drie of<br />
min<strong>de</strong>r let<strong>te</strong>rs bestaan veel van <strong>de</strong> resulta<strong>te</strong>n uit<br />
afkortingen, en <strong>bij</strong> woor<strong>de</strong>n met heel veel let<strong>te</strong>rs<br />
zijn <strong>de</strong> resulta<strong>te</strong>n vaak samens<strong>te</strong>llingen van meer<br />
dan één woord. Tussen <strong>de</strong>ze extremen in is het<br />
in<strong>te</strong>ressant. Het langs<strong>te</strong> ech<strong>te</strong> woord dat ik vond<br />
heeft 31 let<strong>te</strong>rs (hier<strong>bij</strong> geldt <strong>de</strong> ij als één let<strong>te</strong>r):<br />
me<strong>de</strong>verantwoor<strong>de</strong>lijkheidsheffing.<br />
Eén van <strong>de</strong> vragen die je kunt s<strong>te</strong>llen is: ‘Van<br />
welke leng<strong>te</strong> zijn er <strong>de</strong> mees<strong>te</strong> woor<strong>de</strong>n?’ Van Dale<br />
geeft <strong>bij</strong> ie<strong>de</strong>re leng<strong>te</strong> braaf het aantal woor<strong>de</strong>n, en<br />
het blijkt dat woor<strong>de</strong>n van tien let<strong>te</strong>rs het meest<br />
voorkomen; <strong>de</strong> leng<strong>te</strong>n 9, 10 en 11 leveren ach<strong>te</strong>reenvolgens<br />
32789, 33549 en 29398 woor<strong>de</strong>n. Zit hier<br />
nog een soort mo<strong>de</strong>l ach<strong>te</strong>r? Je kunt je voors<strong>te</strong>llen<br />
dat het aantal let<strong>te</strong>rs dat een woord <strong>te</strong>lt ongeveer<br />
een Poisson-ver<strong>de</strong>ling heeft met een gemid<strong>de</strong>l<strong>de</strong><br />
van 10. Omdat het totaal aantal woor<strong>de</strong>n in <strong>de</strong><br />
Dikke Van Dale ongeveer 240.000 is, komen <strong>de</strong><br />
fracties woor<strong>de</strong>n met respectievelijk 9, 10 en 11 let<strong>te</strong>rs<br />
uit op 0,1366; 0,1398 en 0,1225. Dat komt goed<br />
overeen met <strong>de</strong> kansen op 8, 9 en 10 in een Poissonver<strong>de</strong>ling<br />
met gemid<strong>de</strong>l<strong>de</strong> 9,5. Het aantal let<strong>te</strong>rs in<br />
een woord is natuurlijk mins<strong>te</strong>ns een, en dat aantal<br />
komt dan goed overeen met ‘één plus een Poissonver<strong>de</strong>el<strong>de</strong><br />
grootheid met gemid<strong>de</strong>l<strong>de</strong> 9,5’.<br />
Maar, <strong>de</strong> taal laat zich gelukkig slechts zeer <strong>te</strong>n<br />
<strong>de</strong>le in getallen vangen.<br />
Fred S<strong>te</strong>u<strong>te</strong>l is emeritus hoogleraar kansrekening aan<br />
<strong>de</strong> TU Eindhoven. E-mail: <br />
25<br />
STAtOR juli 2011|2
Generalized reliability<br />
in industriële user studies<br />
Jan Engel<br />
Love is the total absence of fear. Love asks no<br />
questions. Its natural sta<strong>te</strong> is one of ex<strong>te</strong>nsion<br />
and expansion, not comparison and<br />
measurement. – Gerald Jampolsky<br />
Ech<strong>te</strong>r, in alle an<strong>de</strong>re gevallen dan lief<strong>de</strong>, zullen<br />
we toch wel me<strong>te</strong>n. En dat niet alleen: het trekken<br />
van conclusies omtrent <strong>de</strong> werkelijkheid gaat het<br />
bes<strong>te</strong> als we ook precies genoeg kunnen me<strong>te</strong>n.<br />
Maar wat is precies genoeg? In dit artikel gaan<br />
we er van uit dat we in een industriële user studie<br />
een vergelijking willen maken tussen verschillen<strong>de</strong><br />
condities, <strong>bij</strong>voorbeeld tussen verschillen<strong>de</strong><br />
produc<strong>te</strong>n. Dit wordt gedaan door participan<strong>te</strong>n<br />
in een meetpanel die hun beoor<strong>de</strong>lingen vastleggen<br />
in een of meer meetschalen.<br />
Precies genoeg is dan in dit geval: kunnen <strong>de</strong><br />
participan<strong>te</strong>n voldoen<strong>de</strong> goed on<strong>de</strong>rscheid maken<br />
tussen <strong>de</strong> condities? Doen ze dat consis<strong>te</strong>nt?<br />
Dit artikel heeft <strong>de</strong> volgen<strong>de</strong> opbouw. Na<br />
een introductie van het begrip ‘reliability’ uit <strong>de</strong><br />
psychometrie zullen we dit generaliseren naar<br />
een versie die bruikbaar is voor het bepalen van<br />
meetprecisie in user studies, een generalized<br />
reliability die we G-reliability zullen noemen.<br />
Deze geeft antwoord op <strong>de</strong> vraag: hoe precies<br />
kan het panel, maar ook <strong>de</strong> individuele participant<br />
daarin, <strong>de</strong> verschillen tussen condities<br />
vasts<strong>te</strong>llen? Vervolgens la<strong>te</strong>n we aan <strong>de</strong> hand<br />
van een voorbeeld zien dat G-reliability een<br />
handige maat is voor <strong>de</strong> karak<strong>te</strong>risering van een<br />
meetpanel. G-reliability hangt nauw samen met<br />
het on<strong>de</strong>rscheidingsvermogen van <strong>de</strong> toets op<br />
conditieverschillen en dit zullen we illustreren.<br />
Een discussie besluit dit artikel.<br />
26<br />
STAtOR juli 2011|2<br />
meetprecisie van i<strong>te</strong>ms<br />
Bij het kwantificeren in empirisch on<strong>de</strong>rzoek<br />
wordt veelal <strong>de</strong> vraag ges<strong>te</strong>ld naar meetprecisie.<br />
In <strong>de</strong> psychometrie, met name in <strong>de</strong> klassieke <strong>te</strong>st<br />
theorie (CTT), han<strong>te</strong>ert men daarvoor het begrip<br />
‘reliability’. Hier<strong>bij</strong> wordt een eigenschap van <strong>de</strong><br />
participan<strong>te</strong>n in <strong>de</strong> studie geme<strong>te</strong>n op een eendimensionale<br />
meetschaal met K i<strong>te</strong>ms. Daar<strong>bij</strong><br />
wordt het volgen<strong>de</strong> meetmo<strong>de</strong>l veron<strong>de</strong>rs<strong>te</strong>ld<br />
(Spector, 1992):<br />
Foto: BoH, Ken<strong>te</strong>rschalm
Y = P + E<br />
Hierin is P <strong>de</strong> ech<strong>te</strong> waar<strong>de</strong> van een participant<br />
met variantie σ 2 , Y <strong>de</strong> geme<strong>te</strong>n versie ervan <strong>te</strong>r-<br />
P<br />
wijl E het verschil aangeeft, <strong>de</strong> error met variantie<br />
σ 2 .<br />
e<br />
<strong>Hoe</strong>wel on<strong>de</strong>rwerp van veel discussie, zie <strong>bij</strong>-<br />
voorbeeld Clarke and Watson (1995), is Cronbach<br />
α (Cronbach, 1947) een standaardmaat voor reli-<br />
ability. On<strong>de</strong>r bepaal<strong>de</strong> veron<strong>de</strong>rs<strong>te</strong>llingen in het<br />
meetmo<strong>de</strong>l kan wor<strong>de</strong>n aangetoond dat Cronbach<br />
α een schat<strong>te</strong>r is van <strong>de</strong> reliability<br />
σ 2<br />
P<br />
σ 2 + σ2 / K<br />
P e<br />
De reliability is een relatieve maat voor meet-<br />
precisie. Deze beantwoordt <strong>de</strong> vraag: hoe goed<br />
kunnen we <strong>de</strong> verschillen in P-waar<strong>de</strong>n van participan<strong>te</strong>n,<br />
geme<strong>te</strong>n door σ 2 , on<strong>de</strong>rschei<strong>de</strong>n op<br />
P<br />
grond van <strong>de</strong> gemid<strong>de</strong>l<strong>de</strong>n van <strong>de</strong> meetwaar<strong>de</strong>n<br />
Y aan <strong>de</strong> K i<strong>te</strong>ms, met variantie σ 2 + σ 2 / K. Het<br />
P e<br />
bepalen van reliability gebeurt overigens veelal<br />
pas in <strong>de</strong> (observatie) studie zelf. In industriële<br />
user studies is het veelal mogelijk, alvorens een<br />
experiment uit <strong>te</strong> voeren, een beeld <strong>te</strong> krijgen van<br />
<strong>de</strong> precisie waarmee gegevens wor<strong>de</strong>n verkregen.<br />
We zullen nu reliability generaliseren naar <strong>de</strong><br />
industriële setting.<br />
Generalisatie van reliability<br />
Bij het bepalen van reliability in CTT vraagt<br />
men zich in fei<strong>te</strong> af: hoe goed kan ik verschillen<br />
on<strong>de</strong>rschei<strong>de</strong>n tussen participan<strong>te</strong>n, gegeven <strong>de</strong><br />
meetvariatie van i<strong>te</strong>ms. Die participan<strong>te</strong>n zijn<br />
hier <strong>de</strong> meettarget. In een industriële user studie<br />
zijn participan<strong>te</strong>n geen meettarget, maar on<strong>de</strong>r-<br />
27<br />
STAtOR juli 2011|2<br />
<strong>de</strong>el van <strong>de</strong> meetmetho<strong>de</strong>. De meettarget wordt<br />
gevormd door <strong>de</strong> condities, <strong>de</strong> produc<strong>te</strong>n, die wor-<br />
<strong>de</strong>n aangebo<strong>de</strong>n aan <strong>de</strong> participan<strong>te</strong>n. Het begrip<br />
reliability is dan nog s<strong>te</strong>eds heel bruikbaar, maar<br />
we zullen het herformuleren. De vraag is dan: hoe<br />
precies kunnen we verschillen vasts<strong>te</strong>llen tussen<br />
<strong>de</strong> meetcondities gegeven <strong>de</strong> variatie van i<strong>te</strong>ms<br />
en van participan<strong>te</strong>n? Jammer genoeg ziet men<br />
dat ook in dit geval nog s<strong>te</strong>eds Cronbach α wordt<br />
berekend, maar dan nu over <strong>de</strong> hele dataset van<br />
participan<strong>te</strong>n en condities. Deze geeft helaas geen<br />
dui<strong>de</strong>lijk, en een soms zelfs mislei<strong>de</strong>nd, beeld van<br />
<strong>de</strong> reliability waar het echt om gaat: het me<strong>te</strong>n<br />
van verschillen tussen condities. De verschillen<br />
tussen participan<strong>te</strong>n zijn helemaal niet in<strong>te</strong>res-<br />
sant. Dat dit mis kan lopen zullen we la<strong>te</strong>n zien in<br />
een voorbeeld in <strong>de</strong> volgen<strong>de</strong> paragraaf.<br />
Om tot een generalized reliability <strong>te</strong> komen<br />
dienen we eerst een re<strong>de</strong>lijk statistisch mo<strong>de</strong>l <strong>te</strong><br />
formuleren voor <strong>de</strong> gegevens van een user studie.<br />
We gaan nu uit van het geval dat we één factor-<br />
condities <strong>te</strong>s<strong>te</strong>n op elke participant in een Within<br />
Subject Design (WSD), een veel voorkomend type<br />
user studie. Dan zou een re<strong>de</strong>lijk mo<strong>de</strong>l als volgt<br />
kunnen zijn:<br />
Y ijk = μ + P i + C j + PC ij + β k + e ijk<br />
In dit mo<strong>de</strong>l vin<strong>de</strong>n we <strong>de</strong> effec<strong>te</strong>n <strong>te</strong>rug van<br />
participan<strong>te</strong>n P i , i = 1,…,I; condities C j , j = 1,…,J; <strong>de</strong><br />
in<strong>te</strong>ractie van participan<strong>te</strong>n en condities PC ij , <strong>de</strong><br />
<strong>te</strong>st i<strong>te</strong>ms β k , k = 1,…,K en <strong>de</strong> residuele fout e ijk .<br />
We veron<strong>de</strong>rs<strong>te</strong>llen voorts dat <strong>de</strong> P i , PC ij en e ijk<br />
stochastisch zijn en on<strong>de</strong>rling onafhankelijk, met<br />
varianties σ 2 , σ 2 en σ 2 . Voorts han<strong>te</strong>ren we<br />
P PC e<br />
σ 2 = Σ(Cj - C) 2 / (J-1)<br />
C<br />
als maat voor <strong>de</strong> verschillen tussen condities. We<br />
gaan nu <strong>de</strong> reliability op twee manieren generaliseren.
on<strong>de</strong>rscheidingsvermogen in %<br />
on<strong>de</strong>rscheidingsvermogen in %<br />
Figuur 1. On<strong>de</strong>rscheidingsvermogen van <strong>de</strong> F-toets op condities <strong>te</strong>gen generalized reliability, voor vier panelgroot<strong>te</strong>n.<br />
Resulta<strong>te</strong>n zijn voor twee condities (J = 2)<br />
Geval 1: <strong>de</strong> G-reliability per participant,<br />
σ 2<br />
C<br />
σ 2 + σe<br />
2 / K<br />
C<br />
Deze vorm kennen we al uit <strong>de</strong> vorige paragraaf.<br />
Het enige verschil is dat we participant vervan-<br />
gen hebben door condities. Hiermee karak<strong>te</strong>rise-<br />
ren we <strong>de</strong> meetprecisie van een participant in het<br />
panel. <strong>Hoe</strong> goed kan <strong>de</strong>ze condities on<strong>de</strong>rschei-<br />
<strong>de</strong>n?<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
5 participan<strong>te</strong>n<br />
0,0 0,2 0,4 0,6 0,8 1,0<br />
generalized reliability<br />
15 participan<strong>te</strong>n<br />
0,0 0,2 0,4 0,6 0,8 1,0<br />
generalized reliability<br />
Geval 2: <strong>de</strong> G-reliability over het meetpanel van<br />
participan<strong>te</strong>n,<br />
σ 2<br />
C<br />
σ 2 + σ2 /I + σe<br />
2 /(I*K)<br />
C PC<br />
Deze expressie geeft het volgen<strong>de</strong> weer: hoe goed<br />
on<strong>de</strong>rschei<strong>de</strong>n we <strong>de</strong> verschillen tussen condities<br />
on<strong>de</strong>rscheidingsvermogen in %<br />
on<strong>de</strong>rscheidingsvermogen in %<br />
100<br />
80<br />
60<br />
40<br />
20<br />
zoals geme<strong>te</strong>n door σ 2 door het gemid<strong>de</strong>l<strong>de</strong> per<br />
C<br />
conditie van <strong>de</strong> data Y over i<strong>te</strong>ms én participan<strong>te</strong>n.<br />
Dit gemid<strong>de</strong>l<strong>de</strong> heeft variatie σ 2 + σ2 C PC / I + σ2 e<br />
/ (I*K). De aanpak is analoog aan het eers<strong>te</strong> geval,<br />
het resultaat is wat an<strong>de</strong>rs.<br />
Aardig is nu dat een eenvoudige momen<strong>te</strong>nschat<strong>te</strong>r<br />
van G-reliability wordt gegeven door <strong>de</strong><br />
grootheid (F-1)/F waar<strong>bij</strong> F <strong>de</strong> waar<strong>de</strong> is van <strong>de</strong><br />
F-toets van Anova voor het toetsen van condities.<br />
In het eers<strong>te</strong> geval toetsen we het effect van<br />
condities voor een bepaal<strong>de</strong> participant. In het<br />
twee<strong>de</strong> geval doen we dat voor alle participan<strong>te</strong>n<br />
samen. De F-toets wordt gebruikt als schat<strong>te</strong>r voor<br />
G-reliability. De resulta<strong>te</strong>n volgen uit <strong>de</strong> verwachtingswaar<strong>de</strong>n<br />
van <strong>de</strong> Mean Squares waaruit <strong>de</strong><br />
F-toets is opgebouwd, met an<strong>de</strong>re woor<strong>de</strong>n uit <strong>de</strong><br />
EMS tabel van <strong>de</strong> variantieanalyse.<br />
Er is een verband met een eer<strong>de</strong>r, en tamelijk<br />
onbekend resultaat. Hoyt (1941) liet al zien dat<br />
28<br />
STAtOR juli 2011|2<br />
0<br />
100<br />
80<br />
60<br />
40<br />
20<br />
0<br />
10 participan<strong>te</strong>n<br />
0,0 0,2 0,4 0,6 0,8 1,0<br />
generalized reliability<br />
20 participan<strong>te</strong>n<br />
0,0 0,2 0,4 0,6 0,8 1,0<br />
generalized reliability
Cronbach α ook kan wor<strong>de</strong>n bepaald door (F-1)/F<br />
voor het geval dat in CTT wordt bestu<strong>de</strong>erd, zie <strong>de</strong><br />
vorige paragraaf. Maar het geldt veel algemener!<br />
We kunnen dan eenvoudig G-reliability bepalen<br />
via <strong>de</strong> Anova F-toets, en standaard software is<br />
geschikt om dit uit <strong>te</strong> voeren.<br />
On<strong>de</strong>rscheidingsvermogen van <strong>de</strong> f-toets<br />
G-reliability in geval 2 heeft een relatie met het<br />
on<strong>de</strong>rscheidingsvermogen van <strong>de</strong> F-toets op con-<br />
dities. We kunnen dit als volgt inzien. We for-<br />
muleren <strong>de</strong> nulhypothese H 0 : C 1 =... = C J , en het<br />
al<strong>te</strong>rnatief H 1 : niet alle C j zijn gelijk. Indien H 0<br />
waar is heeft <strong>de</strong> F-toets een centrale F-ver<strong>de</strong>ling,<br />
als H 0 onwaar is heeft <strong>de</strong> F-toets een niet-centrale<br />
F-ver<strong>de</strong>ling, met niet-centrali<strong>te</strong>its (nc) parame<strong>te</strong>r<br />
die we λ noemen. Maar die parame<strong>te</strong>r λ kunnen<br />
we uitdrukken in <strong>de</strong> G-reliability , en is daarvan<br />
een monotoon stijgen<strong>de</strong> functie:<br />
λ = (J-1) (G-reliability /(1- G-reliability))<br />
<strong>Hoe</strong> gro<strong>te</strong>r G-reliability, hoe gro<strong>te</strong>r het on<strong>de</strong>r-<br />
scheidingsvermogen; zie figuur 1. G-reliability<br />
heeft direct een be<strong>te</strong>kenis voor <strong>de</strong> kwali<strong>te</strong>it van<br />
toetsen.<br />
Uit figuur 1 trekken we twee conclusies:<br />
1. gegeven een waar<strong>de</strong> van <strong>de</strong> generalized relia-<br />
bility is het aantal participan<strong>te</strong>n niet erg bepa-<br />
lend voor het on<strong>de</strong>rscheidingsvermogen van <strong>de</strong><br />
F-toets, en<br />
2. voor een on<strong>de</strong>rscheidingsvermogen van 80%<br />
is toch al snel een, relatief hoge, generalized<br />
reliability nodig van 0,90. Aan <strong>de</strong> Cronbach α<br />
wor<strong>de</strong>n vaak lagere eisen ges<strong>te</strong>ld.<br />
Voorbeeld: meetprecisie van een meetpanel<br />
Het voorgaan<strong>de</strong> geeft metho<strong>de</strong>n om <strong>de</strong> reliability<br />
van een meetpanel na <strong>te</strong> gaan. In het volgen<strong>de</strong>,<br />
29<br />
STAtOR juli 2011|2<br />
eenvoudige, voorbeeld heeft elk van vier partici-<br />
pan<strong>te</strong>n, on<strong>de</strong>r twee verschillen<strong>de</strong> condities, een<br />
oor<strong>de</strong>el gegeven op een 9-punts meetschaal met<br />
drie i<strong>te</strong>ms. Zie tabel 1.<br />
Na berekening blijkt Cronbach α = 0,924. Er<br />
lijkt dus, op grond van Cronbach α, niets aan <strong>de</strong><br />
hand, en onze meetschaal lijkt het doet <strong>te</strong> doen.<br />
Maar we me<strong>te</strong>n <strong>de</strong> verkeer<strong>de</strong> reliability: die van<br />
<strong>de</strong> totale variatie, dus van participan<strong>te</strong>n, condi-<br />
ties, <strong>de</strong> in<strong>te</strong>ractie, en niet van condities alleen!<br />
Voor <strong>de</strong> F-toets op condities vin<strong>de</strong>n we F = 1,343,<br />
en daarmee <strong>de</strong> G-reliability (F-1)/F = 0,26, en dat<br />
is direct een stuk min<strong>de</strong>r optimistisch. Kijken we<br />
naar <strong>de</strong> individuele G-reliability waar<strong>de</strong>n, geba-<br />
seerd op <strong>de</strong> F-toets uitkoms<strong>te</strong>n per participant,<br />
dan vin<strong>de</strong>n we 0,98, -12,00, 0,96 en 0,75. Daaruit<br />
blijkt dat <strong>de</strong> twee<strong>de</strong> participant het wel heel<br />
slecht doet. La<strong>te</strong>n we <strong>de</strong>ze weg, dan vin<strong>de</strong>n we<br />
ech<strong>te</strong>r een G-reliability van 0,14.<br />
Een en na<strong>de</strong>r wordt wellicht dui<strong>de</strong>lijk aan <strong>de</strong><br />
hand van <strong>de</strong> in<strong>te</strong>ractieplot van figuur 2. We zien<br />
hierin dat participant 2 in<strong>de</strong>rdaad slecht discri-<br />
mineert: een non-discriminator. Maar er is meer:<br />
<strong>de</strong> in<strong>te</strong>ractie is groot en daarmee <strong>de</strong> meetpreci-<br />
sie van het panel gering. Nog s<strong>te</strong>rker, door die<br />
gro<strong>te</strong> in<strong>te</strong>ractie is Cronbach α groot, maar voor<br />
het ech<strong>te</strong> doel, het bepalen van verschil tussen<br />
condities, is die in<strong>te</strong>ractie juist funest! De waar<strong>de</strong><br />
Participant conditie I<strong>te</strong>m 1 I<strong>te</strong>m 2 I<strong>te</strong>m 3<br />
1 1 2,00 1,00 2,00<br />
1 2 4,00 3,00 5,00<br />
2 1 5,00 6,00 5,00<br />
2 2 6,00 4,00 7,00<br />
3 1 3,00 2,00 3,00<br />
3 2 6,00 7,00 9,00<br />
4 1 3,00 4,00 2,00<br />
4 2 1,00 2,00 2,00<br />
Tabel 1. Meetgegevens op 9-punt schaal van vier participan<strong>te</strong>n,<br />
twee condities en drie i<strong>te</strong>ms
mean<br />
88<br />
77<br />
66<br />
55<br />
44<br />
33<br />
22<br />
11<br />
is heel laag. De gro<strong>te</strong> variantie van <strong>de</strong> in<strong>te</strong>ractie<br />
vin<strong>de</strong>n we <strong>te</strong>rug in <strong>de</strong> noemer van G-reliability.<br />
Een verbe<strong>te</strong>ring in <strong>de</strong> situatie? Wanneer dit een<br />
reële situatie is zou men kritisch moe<strong>te</strong>n kijken<br />
of <strong>de</strong> participan<strong>te</strong>n wel geschikt zijn voor hun<br />
taak, en of selectie/opleiding niet dui<strong>de</strong>lijk een<br />
noodzaak is. Zomaar meer participan<strong>te</strong>n opne-<br />
men vergroot <strong>de</strong> waar<strong>de</strong> van I, en daarmee <strong>de</strong><br />
G-reliability , maar is misschien niet <strong>de</strong> meest<br />
effectieve weg.<br />
Discussie<br />
1<br />
2<br />
conditie<br />
Figuur 2. In<strong>te</strong>ractie plot van participan<strong>te</strong>n en condities voor <strong>de</strong> gegevens van tabel 1<br />
1<br />
2<br />
3<br />
4<br />
van <strong>de</strong> G-reliability geeft dit a<strong>de</strong>quaat weer: die maar er is geen standaardisatie. Het aardige is<br />
De G-reliability geeft nuttige informatie om <strong>de</strong><br />
meetprecisie vast <strong>te</strong> s<strong>te</strong>llen in een industriële<br />
user studie. We hebben dit la<strong>te</strong>n zien aan <strong>de</strong><br />
hand van een WSD met één factorcondities.<br />
Overigens is dit resultaat natuurlijk eenvou-<br />
dig <strong>te</strong> generaliseren voor an<strong>de</strong>re <strong>de</strong>signs, zoals<br />
een WSD met meer<strong>de</strong>re factoren, of voor het<br />
Between Subject Design. De karak<strong>te</strong>risering van<br />
afzon<strong>de</strong>rlijke participan<strong>te</strong>n ziet men ook <strong>te</strong>rug in<br />
<strong>de</strong> sensometrie (Brockhoff en Skovgaard, 1994).<br />
Hier<strong>bij</strong> wordt ook <strong>de</strong> F-waar<strong>de</strong> van <strong>de</strong> individuele<br />
participant gehan<strong>te</strong>erd als maat voor kwali<strong>te</strong>it,<br />
6<br />
5<br />
4<br />
3<br />
2<br />
1<br />
1 2<br />
30<br />
STAtOR juli 2011|2<br />
1<br />
2<br />
3<br />
4<br />
dat nu <strong>de</strong> link wordt gelegd tussen <strong>de</strong>ze waar<strong>de</strong><br />
uit <strong>de</strong> sensometrie en <strong>de</strong> reliability uit <strong>de</strong> psy-<br />
chometrie. Ten slot<strong>te</strong> geldt dan ook een volgen<strong>de</strong><br />
spin-off: uit het betrouwbaarheids-in<strong>te</strong>rval voor<br />
<strong>de</strong> nc-parame<strong>te</strong>r λ kunnen we een betrouwbaar-<br />
heids-in<strong>te</strong>rval bepalen voor G-reliability. En nut-<br />
tige resulta<strong>te</strong>n hiervoor wor<strong>de</strong>n gegeven door<br />
<strong>bij</strong>voorbeeld S<strong>te</strong>iger (2004).<br />
Li<strong>te</strong>ratuur<br />
Brockhoff, P.M. & Skovgaard, I.M. (1994). Mo<strong>de</strong>lling individual<br />
differences between assessors in sensory<br />
evaluations. Food Quality and Preference, 5, 215-224.<br />
Clarke, L. A. & Watson, D. (1995). Constructing validity:<br />
basic issues in objective scale <strong>de</strong>velopment.<br />
Psychological Assessment, 7, 309-319.<br />
Cronbach, L.J. (1947). Test “reliability”: Its meaning and<br />
in<strong>te</strong>rpretation. Psychometrika, 12, 1-6.<br />
Hoyt, C. (1941). Test reliability by analysis of variance.<br />
Psychometrika , 6, 135-160.<br />
Spector, P.E. (1992). Summa<strong>te</strong>d rating scale construction.<br />
An introduction. Newbury Park: Sage publications.<br />
S<strong>te</strong>iger, J.H. (2004). Beyond the F <strong>te</strong>st: effect size confi<strong>de</strong>nce<br />
in<strong>te</strong>rvals and <strong>te</strong>sts of close fit in the analysis<br />
of variance and contrast analysis. Psychological<br />
Methods, 9, 164-182.<br />
Jan Engel is senior consultant <strong>bij</strong> CQM in Eindhoven.<br />
E-mail:
IN MEMORIAM<br />
jOOP KEmPERmAN (1924-2011)<br />
J.H.B. (Joop) Kemperman werd op 16 juli 1924 in<br />
Ams<strong>te</strong>rdam geboren. Hij stu<strong>de</strong>er<strong>de</strong> wiskun<strong>de</strong><br />
aan <strong>de</strong> Universi<strong>te</strong>it van Ams<strong>te</strong>rdam, waar hij in<br />
1948 doctoraal examen <strong>de</strong>ed. Hij werk<strong>te</strong> daarna<br />
aan het Mathematisch Centrum (CWI) on<strong>de</strong>r<br />
leiding van David van Dantzig, <strong>bij</strong> wie hij in 1950<br />
promoveer<strong>de</strong> op een proefschrift geti<strong>te</strong>ld ‘The<br />
General One-Dimensional Random Walk with<br />
Absorbing Barriers, with Applications to Sequen-<br />
tial Analysis’.<br />
In 1951 emigreer<strong>de</strong> hij naar <strong>de</strong> V.S. Hij was<br />
ach<strong>te</strong>reenvolgens hoogleraar aan <strong>de</strong> Purdue<br />
University, University of Roches<strong>te</strong>r en <strong>de</strong> Rutgers<br />
University.<br />
In 1970 ontmoe<strong>te</strong> ik hem voor het eerst in<br />
Roches<strong>te</strong>r tij<strong>de</strong>ns mijn bezoek aan Julian Keilson.<br />
Ik kwam daar aan na een lange rondrit door <strong>de</strong><br />
VS vanuit Austin, Texas. Hij had me zijn twee<strong>de</strong><br />
auto willen lenen – mijn auto was al verkocht –<br />
ware het niet dat hij die kort daarvoor al had uit-<br />
geleend en <strong>de</strong>fect had <strong>te</strong>ruggekregen.<br />
Dat <strong>te</strong>ken<strong>de</strong> hem: hij was heel genereus, in<br />
alle opzich<strong>te</strong>n, ook met zijn inzich<strong>te</strong>n in <strong>de</strong> wis-<br />
kun<strong>de</strong>. Hij had een opvallend algemeen advies<br />
voor wiskundigen: gebruik geen ongelijkhe<strong>de</strong>n.<br />
Bij het gebruik van ongelijkhe<strong>de</strong>n raak je altijd<br />
informatie kwijt. Laat dus altijd gelijkhe<strong>de</strong>n<br />
staan, ook al weet je van sommige groothe<strong>de</strong>n<br />
dat ze klein zijn.<br />
Ik kwam hem daarna regelmatig <strong>te</strong>gen op<br />
congressen en weer la<strong>te</strong>r, wat uitgebrei<strong>de</strong>r, <strong>bij</strong><br />
mijn twee<strong>de</strong> bezoek aan Keilson in Roches<strong>te</strong>r<br />
in 1972. Toen heb ik ook Joops vrouw Wilna ont-<br />
moet, een actieve, opgewek<strong>te</strong> vrouw. Zij stierf in<br />
31<br />
STAtOR juli 2011|2<br />
1995. De <strong>bij</strong>zetting van haar as in Alkmaar werd<br />
door veel collega’s van Joop <strong>bij</strong>gewoond. Zij was<br />
een vrolijke vrouw, en door <strong>de</strong> vele herinnerin-<br />
gen aan haar opgetogen leven kreeg <strong>de</strong> plechtig-<br />
heid een uitgesproken opgewekt karak<strong>te</strong>r.<br />
Kemperman was een heel veelzijdige wis-<br />
kundige. Hij werk<strong>te</strong> in <strong>de</strong> analyse, <strong>de</strong> discre<strong>te</strong><br />
wiskun<strong>de</strong>, en vooral, in <strong>de</strong> kansrekening en<br />
statistiek. Ver<strong>de</strong>r was hij redac<strong>te</strong>ur van ver-<br />
schillen<strong>de</strong> vaktijdschrif<strong>te</strong>n, waaron<strong>de</strong>r The<br />
Annals of Mathematical Statistics, The Annals of<br />
Probability, Stochastic Processes and Applications<br />
en, bui<strong>te</strong>n <strong>de</strong> stochastiek, van Aequationes<br />
Mathematicae. Hij had veel promovendi. Het<br />
Mathematics Genealogy Project geeft 24 namen;<br />
<strong>de</strong> eers<strong>te</strong> promoveer<strong>de</strong> in 1954, <strong>de</strong> laats<strong>te</strong> in 1994.<br />
Hij was correspon<strong>de</strong>rend lid van <strong>de</strong> Koninklijke<br />
Ne<strong>de</strong>rlandse Aca<strong>de</strong>mie van We<strong>te</strong>nschappen.<br />
Zijn eers<strong>te</strong> artikel verscheen in 1949 in<br />
Indagationes Mathematicae en schreef hij samen<br />
met J.G. van <strong>de</strong>r Corput. De ti<strong>te</strong>l luid<strong>de</strong> ‘The sec-<br />
ond pearl of the theory of numbers’. Zijn laats<strong>te</strong><br />
artikel schreef hij samen met Mark Brown en ver-<br />
scheen in 2009 in Probability in Engineering and<br />
Information Sciences: ‘Sharp two-si<strong>de</strong>d bounds<br />
for distributions un<strong>de</strong>r a hazard ra<strong>te</strong> constraint’.<br />
De laats<strong>te</strong> jaren leed hij aan <strong>de</strong> ziek<strong>te</strong> van<br />
Parkinson. Joop is op 12 juni in East Brunswick<br />
overle<strong>de</strong>n. Op 2 juli is op <strong>de</strong> Sint Barbara begraaf-<br />
plaats in Alkmaar zijn as met die van zijn vrouw<br />
verenigd.<br />
Fred S<strong>te</strong>u<strong>te</strong>l
Johan van Leeuwaar<strong>de</strong>n<br />
BUURTFEEST<br />
Terwijl ik met een bit<strong>te</strong>rbal op <strong>de</strong> maat van <strong>de</strong><br />
muziek mijn gehemel<strong>te</strong> kastijd zie ik uit mijn oog-<br />
hoek iemand na<strong>de</strong>ren.<br />
‘Leopold, aangenaam, <strong>de</strong> overbuurman’, zegt<br />
<strong>de</strong> zelfbewus<strong>te</strong> vijftiger.<br />
Bit<strong>te</strong>rgarnituur maakt je bena<strong>de</strong>rbaar.<br />
Leopold vervolgt: ‘Dus jij werkt aan <strong>de</strong> TU.’<br />
‘Klopt’, zeg ik aarzelend, niet we<strong>te</strong>n<strong>de</strong> wat <strong>de</strong>ze<br />
bevestiging <strong>te</strong>weeg zal brengen.<br />
‘Wat doe je dan precies?’<br />
Tja, <strong>de</strong>nk ik, daar gaan we weer. Maar het is<br />
feest, dus ik besluit het een kans <strong>te</strong> geven.<br />
‘Nou, ik doe wiskun<strong>de</strong>, <strong>de</strong>els lesgeven, <strong>de</strong>els<br />
on<strong>de</strong>rzoek.’<br />
‘Aha, on<strong>de</strong>rzoek. Dus je bent uitvin<strong>de</strong>r?’<br />
‘Niet echt. Ik probeer wel s<strong>te</strong>eds iets nieuws <strong>te</strong><br />
be<strong>de</strong>nken, maar geen uitvindingen.’<br />
‘Maar ik dacht dat ze aan <strong>de</strong> TU echt dingen<br />
uitvon<strong>de</strong>n, zoals MRI scans en elektrische auto’s?’<br />
‘Klopt, dat is ook zo.’<br />
‘Maar jij vindt geen dingen uit?’<br />
‘Nou, misschien toch wel, maar zo heb ik het<br />
niet eer<strong>de</strong>r bekeken.’<br />
‘Noem dan eens wat van je uitvindingen.’<br />
Voetbal was een be<strong>te</strong>r on<strong>de</strong>rwerp geweest,<br />
maar er is nu geen weg meer <strong>te</strong>rug.<br />
‘Kijk, ik werk eer<strong>de</strong>r aan wiskundige formules, of<br />
mo<strong>de</strong>llen, die an<strong>de</strong>ren dan weer kunnen <strong>gebruiken</strong><br />
<strong>bij</strong> het ontwikkelen van produc<strong>te</strong>n. Die mo<strong>de</strong>llen en<br />
formules zijn nieuw, en in die zin een uitvinding.’<br />
‘Maar wanneer an<strong>de</strong>ren jouw formules gebrui-<br />
ken, levert jou dat dan geld op?’<br />
‘Nee, want ie<strong>de</strong>reen mag die formules <strong>gebruiken</strong>.’<br />
32<br />
STAtOR juli 2011|2<br />
‘En die mo<strong>de</strong>llen, leveren die dan iets op?’<br />
‘Die mo<strong>de</strong>llen zijn abstracties van <strong>de</strong> werke-<br />
lijkheid. Ze geven wel inzicht, maar lei<strong>de</strong>n door-<br />
gaans niet tot een tastbaar product. Althans, mijn<br />
mo<strong>de</strong>llen niet.’<br />
‘Dus dat on<strong>de</strong>rzoek van jou levert niets op?’<br />
‘Geen geld nee. Wel die formules dus.’<br />
‘Ja, maar die formules geef je blijkbaar voor<br />
niets weg. Waarom houd je ze niet voor jezelf, en<br />
probeer je er iets mee <strong>te</strong> doen dat geld oplevert?’<br />
‘Maar dan zou ik een eigen bedrijf moe<strong>te</strong>n<br />
beginnen?’<br />
‘Dat klopt ja, en daar lijkt me niets mis mee.<br />
De kran<strong>te</strong>n staan vol met verhalen over <strong>de</strong> uni-<br />
versi<strong>te</strong>i<strong>te</strong>n. Er is een groot begrotings<strong>te</strong>kort, en<br />
het schijnt dat jullie je broek in <strong>de</strong> toekomst zelf<br />
moe<strong>te</strong>n ophou<strong>de</strong>n. Je kunt dus maar be<strong>te</strong>r zorgen<br />
dat je iets nuttigs doet, iets wat geld oplevert.’<br />
‘Ik heb het ook gelezen, maar…’<br />
‘En <strong>te</strong>recht ook’, on<strong>de</strong>rbreekt Leopold,‘wij maar<br />
geld in <strong>de</strong> universi<strong>te</strong>i<strong>te</strong>n pompen zon<strong>de</strong>r dat we er<br />
ooit iets van <strong>te</strong>rug zien.’<br />
‘Ik <strong>de</strong>nk dat je gelijk hebt’, zeg ik, <strong>te</strong>rwijl ik<br />
besluit me <strong>te</strong> rich<strong>te</strong>n op het volgen<strong>de</strong> buurtfeest.<br />
‘Goed dan’, zegt Leopold, ‘zal ik nog een biertje<br />
halen?’<br />
‘Doe mij maar iets s<strong>te</strong>rkers’, zeg ik, <strong>te</strong>rwijl ik<br />
weer overga tot mijn bit<strong>te</strong>rbal.<br />
c o l u m n<br />
Johan van Leeuwaar<strong>de</strong>n is werkzaam in <strong>de</strong> groep<br />
Stochastische Besliskun<strong>de</strong> <strong>bij</strong> <strong>de</strong> facul<strong>te</strong>it Wiskun<strong>de</strong> en<br />
Informatica van <strong>de</strong> Technische Universi<strong>te</strong>it Eindhoven.<br />
Tevens is hij research fellow <strong>bij</strong> EURANDOM.<br />
E-mail: