06.05.2013 Views

Hoe de p-waarde te gebruiken bij beslissingen Eerste ...

Hoe de p-waarde te gebruiken bij beslissingen Eerste ...

Hoe de p-waarde te gebruiken bij beslissingen Eerste ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

STAtOR<br />

periodiek van <strong>de</strong> VVS jaargang 12 nummer 2, juli 2011<br />

<strong>Hoe</strong> <strong>de</strong> p-waar<strong>de</strong> <strong>te</strong> <strong>gebruiken</strong><br />

<strong>bij</strong> <strong>beslissingen</strong><br />

Eers<strong>te</strong> Kamerverkiezingen<br />

<strong>Hoe</strong> optimalisatie in een aantal jaren<br />

in het DNA van TNT Express is gekomen<br />

Karl Pearson tussen statistiek en filosofie<br />

Rechtstreeks verwachtingen evalueren<br />

of <strong>de</strong> nul-hypothese toetsen?<br />

Generalized reliability in industriële<br />

user studies


STAtOR<br />

Jaargang 12, nummer 2, juli 2011<br />

STAtOR is een uitgave van <strong>de</strong> Vereniging voor Statistiek en<br />

Operationele Research (VVS). STAtOR wil le<strong>de</strong>n, bedrijven<br />

en overige geïn<strong>te</strong>resseer<strong>de</strong>n op <strong>de</strong> hoog<strong>te</strong> hou<strong>de</strong>n van<br />

ontwikkelingen en nieuws over toepassingen van statistiek<br />

en operationele research. Verschijnt 4 keer per jaar.<br />

Redactie<br />

Joaquim Gromicho (hoofdredac<strong>te</strong>ur), Ana Isabel Barros,<br />

Johan van Leeuwaar<strong>de</strong>n, Mirjam Moerbeek, Gerrit<br />

S<strong>te</strong>merdink (eindredac<strong>te</strong>ur), Hil<strong>de</strong> Tobi. Vas<strong>te</strong> me<strong>de</strong>werker:<br />

Fred S<strong>te</strong>u<strong>te</strong>l<br />

Kopij en reacties rich<strong>te</strong>n aan<br />

Prof. dr. J.A.S. Gromicho (hoofdredac<strong>te</strong>ur), Facul<strong>te</strong>it <strong>de</strong>r<br />

Economische We<strong>te</strong>nschappen en Bedrijfskun<strong>de</strong>, af<strong>de</strong>ling<br />

Econometrie, Vrije Universi<strong>te</strong>it, De Boelelaan 1105, 1081 HV<br />

Ams<strong>te</strong>rdam, <strong>te</strong>lefoon 020-5986010, mobiel 06-55886747,<br />

.<br />

Bestuur van <strong>de</strong> VVS<br />

Voorzit<strong>te</strong>r:<br />

prof. dr. Jacqueline Meulman <br />

Secretaris:<br />

dr. Irene Klugkist <br />

Penningmees<strong>te</strong>r:<br />

dr. Ad Rid<strong>de</strong>r <br />

Stu<strong>de</strong>ntlid:<br />

Maar<strong>te</strong>n Kampert (Bsc) <br />

Overige bestuursle<strong>de</strong>n:<br />

prof. dr. Fred van Eeuwijk (BMS), prof. dr. ir. Stan van <strong>Hoe</strong>sel<br />

& dr. John Poppelaars (NGB), dr. Eric Cator (SMS), dr. Michel<br />

van <strong>de</strong> Vel<strong>de</strong>n (ECS), dr. Andries van <strong>de</strong>r Ark (SWS),<br />

Le<strong>de</strong>n- en abonnemen<strong>te</strong>nadministratie van <strong>de</strong> VVS<br />

VVS, Postbus 244, 6700 AE Wageningen, <strong>te</strong>lefoon 0317 -<br />

419572, fax 0317 - 421364, .<br />

Raadpleeg onze websi<strong>te</strong> over hoe u lid kunt wor<strong>de</strong>n van<br />

<strong>de</strong> VVS of een abonnement kunt nemen op STAtOR of op<br />

een van <strong>de</strong> an<strong>de</strong>re periodieken.<br />

VVS-websi<strong>te</strong><br />

www.vvs-or.nl<br />

Adver<strong>te</strong>ntieacquisitie<br />

René Luijk, p/a Leids Universitair Medisch Centrum,<br />

af<strong>de</strong>ling Medische Statistiek en Bio-informatica,<br />

Postzone S5-P, Postbus 9600, 2300 RC Lei<strong>de</strong>n,<br />

06 244 32 892, . STAtOR<br />

verschijnt in maart, juni, sep<strong>te</strong>mber en <strong>de</strong>cember.<br />

Ontwerp en opmaak<br />

Pharos | M. van Hoo<strong>te</strong>gem, Nijmegen<br />

Druk<br />

Drukkerij Zoe<strong>te</strong>weij, Yerseke<br />

Uitgever<br />

© Vereniging voor Statistiek en Operationele Research<br />

ISSN 1567-3383<br />

Inhoud<br />

2<br />

STAtOR juli 2011|2<br />

3 Redactioneel<br />

4 <strong>Hoe</strong> <strong>de</strong> p-waar<strong>de</strong> <strong>te</strong> <strong>gebruiken</strong> <strong>bij</strong> <strong>beslissingen</strong>.<br />

Er zit significant <strong>te</strong> weinig verf in<br />

mijn potjes! Moet ik iets doen?<br />

Aart F. <strong>de</strong> Vos<br />

8 Eers<strong>te</strong> Kamerverkiezingen<br />

Jacob Jan Paulus & Jaap Praagman<br />

14 <strong>Hoe</strong> optimalisatie in een aantal jaren in<br />

het DNA van TNT Express is gekomen<br />

Hein Fleuren, Marco Hendriks &<br />

Annelies Wou<strong>te</strong>rsen<br />

17 Agenda<br />

18 Karl Pearson tussen statistiek en filosofie<br />

Richard Starmans<br />

22 Rechtstreeks verwachtingen evalueren of<br />

<strong>de</strong> nul-hypothese toetsen?<br />

Rens van <strong>de</strong> Schoot<br />

25 Words, words – column<br />

Fred S<strong>te</strong>u<strong>te</strong>l<br />

26 Generalized reliability in industriële user<br />

studies<br />

Jan Engel<br />

31 In Memoriam Joop Kemperman<br />

Fred S<strong>te</strong>u<strong>te</strong>l<br />

32 Buurtfeest – column<br />

Johan van Leeuwaar<strong>de</strong>n


Vakantie, een tijd vol keuzes<br />

Mensen zijn er in soor<strong>te</strong>n. Zo schijnen sommigen<br />

zich <strong>te</strong> kunnen ontspannen tij<strong>de</strong>ns vakanties en<br />

on<strong>de</strong>rvin<strong>de</strong>n an<strong>de</strong>ren juist stress vanwege <strong>de</strong> vele<br />

extra <strong>beslissingen</strong> die ze dan moe<strong>te</strong>n nemen. Men<br />

zou, overdreven ges<strong>te</strong>ld, kunnen zeggen dat <strong>de</strong><br />

vrijheid van <strong>de</strong> vakantie onlosmakelijk <strong>de</strong> dwang<br />

van <strong>de</strong> keuze met zich brengt.<br />

Statistici zijn net mensen: ook zij zijn er in soor-<br />

<strong>te</strong>n en ook zij zit<strong>te</strong>n voortdurend met keuzes. Een<br />

keuze die vaak voorkomt is of men vóór of <strong>te</strong>gen<br />

Bayes is. Aan dit probleem wor<strong>de</strong>n in dit nummer<br />

van Stator maar liefst twee artikelen gewijd. Aart<br />

<strong>de</strong> Vos laat zien dat ‘klassiek’ en Bayes elkaar niet<br />

hoeven <strong>te</strong> <strong>bij</strong><strong>te</strong>n, maar heel goed als elkaars aan-<br />

vulling beschouwd kunnen wor<strong>de</strong>n. En Rens van<br />

<strong>de</strong> Schoot gaat óók in in <strong>de</strong> complementaire func-<br />

tie van bei<strong>de</strong> metho<strong>de</strong>n. Voor wie toevallig in <strong>de</strong>ze<br />

vakantie naar Denemarken gaat: in <strong>de</strong> slotkapel<br />

van het kas<strong>te</strong>el Fre<strong>de</strong>riksborg in Hillerød hangen<br />

<strong>de</strong> wapenschil<strong>de</strong>n van <strong>de</strong> le<strong>de</strong>n van <strong>de</strong> Or<strong>de</strong> van<br />

<strong>de</strong> Olifant, <strong>de</strong> hoogs<strong>te</strong> Deense on<strong>de</strong>rscheiding.<br />

Een van die schil<strong>de</strong>n is van <strong>de</strong> beroem<strong>de</strong> Deense<br />

natuurkundige Niels Bohr en zijn wapenspreuk<br />

luidt ‘Contraria sunt Complementa’. Dit slaat op<br />

Bohr’s in<strong>te</strong>rpretatie van <strong>de</strong> quantummechanica,<br />

maar na het lezen van <strong>de</strong> artikelen van De Vos en<br />

Van <strong>de</strong> Schoot kan men het ook op <strong>de</strong> statistiek<br />

toepassen.<br />

Trouwens, over kiezen gesproken: <strong>de</strong> manier<br />

waarop <strong>de</strong> afgelopen maan<strong>de</strong>n <strong>de</strong> Eers<strong>te</strong> Kamer<br />

werd gekozen leek voor <strong>de</strong> gewone kiezer wel<br />

hogere wiskun<strong>de</strong>. De redactie is verheugd u een<br />

zeer actueel en verhel<strong>de</strong>rend overzicht van dit<br />

probleem <strong>te</strong> kunnen bie<strong>de</strong>n. Jacob Jan Paulus en<br />

Jaap Praagman <strong>te</strong>kenen daarvoor.<br />

3<br />

STAtOR juli 2011|2<br />

Een heel an<strong>de</strong>r artikel is geschreven door Hein<br />

Fleuren, Marco Hendriks en Annelies Wou<strong>te</strong>rsen.<br />

Zij beschrijven hoe TNT Express stapje voor stapje<br />

wordt veroverd door toepassingen van <strong>de</strong> OR.<br />

De filosoof Richard Starmans ver<strong>te</strong>lt over <strong>de</strong><br />

belangrijke rol van Karl Pearson in <strong>de</strong> ontwikke-<br />

ling van <strong>de</strong> statistiek. De redactie kijkt nu al uit<br />

naar enkele an<strong>de</strong>re artikelen die hij heeft toege-<br />

zegd <strong>te</strong> zullen schrijven over an<strong>de</strong>re groothe<strong>de</strong>n<br />

die aan <strong>de</strong> wording van ons vakgebied hebben<br />

<strong>bij</strong>gedragen. Zéér aanbevolen.<br />

Dit is nog niet alles, u kunt er ook voor kiezen<br />

om als eers<strong>te</strong> het artikel van Jan Engel <strong>te</strong> lezen.<br />

Dan zult u zien dat <strong>de</strong> beken<strong>de</strong> Cronbachs alpha<br />

metho<strong>de</strong> uit <strong>de</strong> sociale we<strong>te</strong>nschappen uits<strong>te</strong>-<br />

kend kan wor<strong>de</strong>n gegeneraliseerd naar industri-<br />

ele studies.<br />

En natuurlijk hebben ook onze vas<strong>te</strong> columnis-<br />

<strong>te</strong>n rekening gehou<strong>de</strong>n met <strong>de</strong> tijd van het jaar:<br />

hun <strong>bij</strong>dragen zijn luchtig en verstrooiend.<br />

Ten slot<strong>te</strong> een In Memoriam voor Joop<br />

Kemperman. Hij was een van <strong>de</strong> vier promo-<br />

vendi van David van Dantzig en is in Ne<strong>de</strong>rland<br />

wat min<strong>de</strong>r bekend gewor<strong>de</strong>n doordat hij al snel<br />

daarna naar Amerika verhuis<strong>de</strong>. Daar was hij een<br />

productief we<strong>te</strong>nschapper, met maar liefst 24 pro-<br />

movendi. Fred S<strong>te</strong>u<strong>te</strong>l her<strong>de</strong>nkt hem.<br />

Kortom, keus genoeg, maar laat het u niet tot<br />

stress voeren. Gooi <strong>de</strong>snoods een muntje op als u<br />

geen keus kunt maken, doet u in <strong>de</strong> vakantie toch<br />

nog aan kansrekening.<br />

De redactie wenst u veel leesplezier.<br />

Gerrit S<strong>te</strong>merdink


<strong>Hoe</strong> <strong>de</strong> p-waar<strong>de</strong><br />

<strong>te</strong> <strong>gebruiken</strong> <strong>bij</strong> <strong>beslissingen</strong><br />

ER zIT SIGNIfIcANT TE wEINIG VERf IN mIjN POTjES! mOET IK IETS DOEN?<br />

Aart F. <strong>de</strong> Vos<br />

Geen statistisch on<strong>de</strong>rwerp is zo controversieel<br />

als <strong>de</strong> p-waar<strong>de</strong>. Bayesianen drijven er <strong>de</strong> spot<br />

mee, maar het is een basiselement in ie<strong>de</strong>re stan-<br />

daardcursus statistiek. De p-waar<strong>de</strong> is <strong>de</strong> kans<br />

dat als <strong>de</strong> nulhypothese (H 0 ) waar is, <strong>de</strong> data zo<br />

extreem zijn als ze zijn, of nóg extremer. Dit krijgt<br />

be<strong>te</strong>kenis in vergelijking met een norm, het sig-<br />

nificantie niveau α, dat meestal 0,05 genomen<br />

wordt. Als p


meer mis. ‘Als verdach<strong>te</strong> onschuldig is (H 0 ) is het<br />

gebeur<strong>de</strong> ui<strong>te</strong>rst onwaarschijnlijk, dus zal ver-<br />

dach<strong>te</strong> wel schuldig zijn.’<br />

Ook stu<strong>de</strong>n<strong>te</strong>n die uitgebreid statistiek heb-<br />

ben gehad zijn ver<strong>bij</strong>s<strong>te</strong>rd als ik het volgen<strong>de</strong> een-<br />

voudige voorbeeld voorleg. Een stu<strong>de</strong>nt doet een<br />

multiple choice-<strong>te</strong>ntamen: 50 vragen met s<strong>te</strong>eds<br />

drie mogelijke antwoor<strong>de</strong>n. Er zijn 27 goe<strong>de</strong> ant-<br />

woor<strong>de</strong>n. Gegokt? Als <strong>de</strong> kans per vraag 1/3 is, is<br />

<strong>de</strong> kans op 27 of meer goed 0,002. Zeer significant.<br />

Dus niet gegokt? Als het een re<strong>de</strong>lijk goe<strong>de</strong> stu-<br />

<strong>de</strong>nt is die soms leert en soms feest, is 65% kans<br />

dat hij gegokt heeft re<strong>de</strong>lijk plausibel. 27 antwoor-<br />

5<br />

STAtOR juli 2011|2<br />

<strong>de</strong>n goed is nog onwaarschijnlijker als hij geleerd<br />

heeft (en zijn kans per vraag 0,75 is) dan als hij<br />

gegokt heeft. Het gaat om <strong>de</strong> aannemelijkheids-<br />

verhouding van <strong>de</strong> data (27 goed dus meer doet<br />

niet <strong>te</strong>r zake). Pos<strong>te</strong>rior odds is prior odds times<br />

likelihood ratio.<br />

Klassieke toets<br />

Dus weg met <strong>de</strong> p-waar<strong>de</strong>? Nee. Ik <strong>de</strong>nk een<br />

oplossing <strong>te</strong> hebben gevon<strong>de</strong>n (op zijn minst voor<br />

bedrijfseconomen) in <strong>de</strong> vorm van een economi-<br />

sche on<strong>de</strong>rbouwing van <strong>de</strong> klassieke toets. Mijn<br />

s<strong>te</strong>lling is dat er eenvoudige Bayesiaanse mo<strong>de</strong>l-<br />

len zijn waarin het format p


in kaart brengen van diverse <strong>beslissingen</strong>.<br />

De klassieke toets is typisch geschikt voor<br />

situaties met een hoge P(H 0 ), <strong>de</strong> prior kans dat er<br />

niets <strong>de</strong> hand is. En functioneert als een soort zelf-<br />

bescherming. Wij wor<strong>de</strong>n voortdurend bestormd<br />

door ‘significan<strong>te</strong>’ fei<strong>te</strong>n die iets zou<strong>de</strong>n kunnen<br />

be<strong>te</strong>kenen. Er over na<strong>de</strong>nken kost veel tijd en is<br />

daarom kostbaar. Meestal is het loos alarm. Dat is<br />

het geval in een fractie P(H 0 )(1-α) van alle geval-<br />

len, als je <strong>de</strong> <strong>de</strong> regel ‘<strong>de</strong>nk na als <strong>de</strong> p-waar<strong>de</strong><br />

kleiner is dan α han<strong>te</strong>ert.<br />

De klassieke toets s<strong>te</strong>lt ‘verwerp H 0 als pk<br />

(of S π(H0 ) L(1,0) = k (1)<br />

f(S|θ0 ) π(H1 ) L(0,1)<br />

(f = kansdichtheid; π = prior kans(dichtheid))<br />

Aan <strong>de</strong> linkerkant staat <strong>de</strong> ‘Bayes Factor’ (BF(S)).<br />

(= P(S|H 1 ) / P(S|H 0 )). Die is afhankelijk van ¼ (µ|H 1 ),<br />

<strong>de</strong> subjectieve voorver<strong>de</strong>ling van µ on<strong>de</strong>r H 1 . Of<strong>te</strong>-<br />

wel <strong>de</strong> lastige vraag: ‘Wat zou er aan <strong>de</strong> hand kun-<br />

nen zijn?’ Aan <strong>de</strong> rech<strong>te</strong>rkant <strong>de</strong> prior odds van<br />

<strong>de</strong> hypothesen, maal <strong>de</strong> ratio van <strong>de</strong> verwach<strong>te</strong><br />

verliezen <strong>bij</strong> het nemen van <strong>de</strong> twee mogelijke<br />

verkeer<strong>de</strong> <strong>beslissingen</strong>: L(1,0) iets doen <strong>te</strong>rwijl er<br />

niets aan <strong>de</strong> hand is) en L(0,1) (<strong>te</strong>n onrech<strong>te</strong> niets<br />

doen).<br />

De implicie<strong>te</strong> α in (1) is<br />

α im = P S|H0 (BF(S) > k) (2)<br />

een ongebruikelijk mengsel van frequentistisch<br />

(P S|H0 ) en Bayesiaans. Bayesianen kijken naar <strong>de</strong><br />

ongelijkheid BF(S) > k. Dat heeft als bezwaar dat<br />

aan bei<strong>de</strong> kan<strong>te</strong>n priors voorkomen. Het format<br />

p < α im heeft dit bezwaar niet. Het kan bovendien<br />

ook wor<strong>de</strong>n gebruikt wanneer L(0,1) afhangt van


µ, wat normali<strong>te</strong>r het geval zal zijn. De formule<br />

wordt dan α im = P S|H0 (S>k) waar<strong>bij</strong> k met <strong>de</strong> Baye-<br />

siaanse machinerie berekend kan wor<strong>de</strong>n.<br />

Een voorbeeld<br />

Volledig Bayesiaans beslissen is lastig. Maar ver-<br />

schillen<strong>de</strong> <strong>beslissingen</strong> on<strong>de</strong>rling coherent maken<br />

is eenvoudiger. S<strong>te</strong>l µ is <strong>de</strong> verwachting van het<br />

gemid<strong>de</strong>l<strong>de</strong> <strong>te</strong>kort aan verf in mijn potjes en S<br />

het gemid<strong>de</strong>l<strong>de</strong> <strong>te</strong>kort in mijn s<strong>te</strong>ekproef. Als het<br />

echt <strong>te</strong> weinig is krijg ik een boe<strong>te</strong>. Vergelijking (1)<br />

beschrijft <strong>de</strong> situatie.<br />

On<strong>de</strong>rstaan<strong>de</strong> tabel is gemaakt met (1) en (2).<br />

S ~ N(µ,1), ¼ (µ|H 1 ) = exp (-µ). S is data, S 0 |H 0 ~ N(µ 0 ,1)<br />

= N(0,1).<br />

S 0,91 1,5 1,645 2 2,193 2,63<br />

BF(S) 1,12 1,91 2,23 3,43 4,46 8,92<br />

P(S 0 > S|H 0 ) 0,181 0,067 0,050 0,023 0,014 0,006<br />

De α = 0,05 hoort <strong>bij</strong> S = 1,645, welbekend. S<strong>te</strong>l dat<br />

bekend is dat dit <strong>de</strong> optimale toetsdrempel is om<br />

nog een extra s<strong>te</strong>ekproef <strong>te</strong> trekken.<br />

Een <strong>de</strong>nkbare opgave voor het <strong>te</strong>ntamen statistiek<br />

voor bedrijfskundigen in 2020?<br />

a. laat zien dat als die extra s<strong>te</strong>ekproef 2 maal zo<br />

duur wordt men moet gaan werken met een α<br />

van 0,014.<br />

b. laat zien dat als ¼ (H1 ) stijgt van 1/(2n+1) naar 1/<br />

(n+1) α = 0,181 genomen moet wor<strong>de</strong>n.<br />

c. maak een voorbeeld van veran<strong>de</strong>ringen die α =<br />

0,006 opleveren.<br />

Tweezijdig toetsen<br />

Als mijn s<strong>te</strong>ekproef doet vermoe<strong>de</strong>n dat er <strong>te</strong> weinig<br />

verf in mijn potjes zit, met een p-waar<strong>de</strong> van<br />

0,03 moet ik dat dan negeren omdat er ook <strong>te</strong> veel<br />

verf in mijn potjes had kunnen zit<strong>te</strong>n? Economen<br />

leren dat ze moe<strong>te</strong>n be<strong>de</strong>nken of ze eenzijdig of<br />

tweezijdig moe<strong>te</strong>n toetsen en in het laats<strong>te</strong> geval<br />

<strong>de</strong> p-waar<strong>de</strong> met 2 moe<strong>te</strong>n vermenigvuldigen.<br />

Tamelijk onzinnig. Verschillen<strong>de</strong> waar<strong>de</strong>n van α<br />

zijn relevant voor <strong>te</strong> veel of <strong>te</strong> weinig verf. De verliesfuncties<br />

verschillen. En be<strong>te</strong>r na<strong>de</strong>nken ga je<br />

in dit geval alleen over <strong>de</strong> α die hoort <strong>bij</strong> <strong>te</strong> weinig.<br />

Meer in het algemeen geldt dat p-waar<strong>de</strong>n hun<br />

magische be<strong>te</strong>kenis verliezen als men beseft hoe<br />

onzeker men is over <strong>de</strong> relevan<strong>te</strong> α.<br />

conclusie<br />

De klassieke toets en Bayesiaans beslissen on<strong>de</strong>r<br />

onzekerheid kunnen geïn<strong>te</strong>greerd wor<strong>de</strong>n tot iets<br />

zinvols. En een gewoon voorbeeld over verf in<br />

potjes biedt een an<strong>de</strong>r perspectief dan abstrac<strong>te</strong><br />

pogingen tot verzoening van bei<strong>de</strong> richtingen<br />

(Andrews, 1994; Berger, 2003; zie ook De Vos &<br />

Francke, 2008). De groots<strong>te</strong> uitdaging is om stu<strong>de</strong>n<strong>te</strong>n<br />

<strong>te</strong> leren een re<strong>de</strong>lijke α <strong>te</strong> kiezen, zodat<br />

het huren van Bayesianen beperkt kan blijven tot<br />

echt belangrijke gevallen.<br />

Li<strong>te</strong>ratuur<br />

Andrews, D.W.K. (1994). The large sample correspon<strong>de</strong>nce<br />

between classical hypothesis <strong>te</strong>sts and Bayesian<br />

pos<strong>te</strong>rior odds <strong>te</strong>sts. Econometrica 62, 1207-1232.<br />

Berger, J.O. (2003). Could Fisher, Jeffreys and Neyman<br />

have agreed on <strong>te</strong>sting? Statistical Science 18, 1-32.<br />

<strong>de</strong> Vos, A.F. & Francke, M.K. (2008). Bayesian Unit Root<br />

Tests and Marginal Likelihood (www1.fee.uva.nl/pp/<br />

bin/1015full<strong>te</strong>xt.pdf)<br />

Aart <strong>de</strong> Vos is econometrist en verbon<strong>de</strong>n aan <strong>de</strong> facul<strong>te</strong>it<br />

<strong>de</strong>r economische we<strong>te</strong>nschappen en bedrijfskun<strong>de</strong> van <strong>de</strong><br />

Vrije Universi<strong>te</strong>it Ams<strong>te</strong>rdam. E-mail: <br />

Ter gelegenheid van zijn pensionering vindt op 30 sep<strong>te</strong>mber<br />

2011 een afscheidssymposium plaats over het<br />

on<strong>de</strong>rwerp van dit artikel. Topspecialis<strong>te</strong>n op dit gebied<br />

hebben hun me<strong>de</strong>werking toegezegd. Zie ook <strong>de</strong> websi<strong>te</strong><br />

.<br />

7<br />

STAtOR juli 2011|2


EERSTE KAMERVERKIEZINGEN<br />

Jacob Jan Paulus & Jaap Praagman<br />

De Eers<strong>te</strong> Kamer wordt gekozen via een getrap<strong>te</strong><br />

verkiezing, <strong>de</strong> burgers kiezen Provinciale Sta<strong>te</strong>nle-<br />

<strong>de</strong>n die vervolgens <strong>de</strong> Eers<strong>te</strong> Kamerle<strong>de</strong>n kiezen.<br />

Begin maart 2011 waren <strong>de</strong> verkiezingen voor <strong>de</strong><br />

Provinciale Sta<strong>te</strong>n en door <strong>de</strong> vraag of <strong>de</strong> gedoog-<br />

coalitie een meer<strong>de</strong>rheid zal halen is er dit jaar<br />

veel aandacht voor <strong>de</strong> Eers<strong>te</strong> Kamerverkiezing. In<br />

<strong>de</strong> lan<strong>de</strong>lijke media is er veel gespeculeerd over<br />

stra<strong>te</strong>gisch s<strong>te</strong>mmen [1,2]. Want door stra<strong>te</strong>gische<br />

samenwerking kunnen partijen meer Kamerze-<br />

<strong>te</strong>ls halen. Tijd voor een wiskundige analyse.<br />

Spelregels<br />

Bij <strong>de</strong> Eers<strong>te</strong> Kamer verkiezing op 23 mei 2011 mag<br />

elk Sta<strong>te</strong>nlid één s<strong>te</strong>m uitbrengen. Omdat het<br />

inwoneraantal per provincie verschilt, wor<strong>de</strong>n <strong>de</strong><br />

s<strong>te</strong>mmen gewogen. Deze weging, <strong>de</strong> zogenaam<strong>de</strong><br />

s<strong>te</strong>mwaar<strong>de</strong>, wordt per provincie bepaald door het<br />

inwoner aantal <strong>te</strong> <strong>de</strong>len door het hon<strong>de</strong>rdvoud<br />

van het aantal Sta<strong>te</strong>nle<strong>de</strong>n in die provincie. De<br />

s<strong>te</strong>mwaar<strong>de</strong> en het aantal Sta<strong>te</strong>nle<strong>de</strong>n per pro-<br />

vincie staan in figuur 1 weergegeven.<br />

De totale waar<strong>de</strong> van <strong>de</strong> s<strong>te</strong>mmen uitgebracht<br />

op een partij is het behaal<strong>de</strong> s<strong>te</strong>mcijfer van die<br />

partij. De s<strong>te</strong>mcijfers bepalen <strong>de</strong> ze<strong>te</strong>lver<strong>de</strong>ling in<br />

<strong>de</strong> Eers<strong>te</strong> Kamer en dat gaat als volgt [3,4]. Met <strong>de</strong><br />

kies<strong>de</strong>ler wor<strong>de</strong>n <strong>de</strong> zogenaam<strong>de</strong> kale ze<strong>te</strong>ls ver<strong>de</strong>eld.<br />

Het aantal kale ze<strong>te</strong>ls dat een partij krijgt is<br />

gelijk aan het naar bene<strong>de</strong>n afgeron<strong>de</strong> quotiënt<br />

van s<strong>te</strong>mcijfer en kies<strong>de</strong>ler. Deze kies<strong>de</strong>ler is <strong>de</strong><br />

som van <strong>de</strong> s<strong>te</strong>mcijfers ge<strong>de</strong>eld door het aantal<br />

Kamerze<strong>te</strong>ls. In 2011 is <strong>de</strong> kies<strong>de</strong>ler 166561/75. De<br />

res<strong>te</strong>ren<strong>de</strong> ze<strong>te</strong>ls wor<strong>de</strong>n vervolgens één voor één<br />

ver<strong>de</strong>eld zodanig dat <strong>de</strong> eerstvolgen<strong>de</strong> restze<strong>te</strong>l<br />

wordt toegekend aan die partij waarvoor na toekenning<br />

van die ze<strong>te</strong>l het quotiënt van s<strong>te</strong>mcijfer<br />

en aantal ze<strong>te</strong>ls het groots<strong>te</strong> is.<br />

Verkiezingen 2011<br />

In tabel 1 staat per provincie <strong>de</strong> ze<strong>te</strong>lver<strong>de</strong>ling van<br />

<strong>de</strong> Provinciale Sta<strong>te</strong>n na <strong>de</strong> verkiezing van maart<br />

2011. S<strong>te</strong>mt ie<strong>de</strong>r Sta<strong>te</strong>nlid <strong>bij</strong> <strong>de</strong> Eers<strong>te</strong> Kamer-<br />

8<br />

STAtOR juli 2011|2


Limburg (47)<br />

Noord-Brabant (55)<br />

Zeeland (39)<br />

Zuid-Holland (55)<br />

Noord-Holland (55)<br />

Utrecht (47)<br />

Gel<strong>de</strong>rland (54)<br />

Flevoland (39)<br />

Overijssel (47)<br />

Drenthe (41)<br />

Friesland (43)<br />

Groningen (43)<br />

verkiezing op <strong>de</strong> eigen partij dan resul<strong>te</strong>ert dat<br />

in <strong>de</strong> s<strong>te</strong>mcijfers zoals vermeld in <strong>de</strong> voorlaats<strong>te</strong><br />

kolom. Delen door <strong>de</strong> kies<strong>de</strong>ler en naar bene<strong>de</strong>n<br />

afron<strong>de</strong>n levert het aantal kale ze<strong>te</strong>ls in <strong>de</strong> laats<strong>te</strong><br />

kolom. (De lokale partijen zijn gebun<strong>de</strong>ld in <strong>de</strong><br />

Figuur 1. Provincie (aantal sta<strong>te</strong>nle<strong>de</strong>n) en s<strong>te</strong>mwaar<strong>de</strong><br />

9<br />

STAtOR juli 2011|2<br />

Onafhankelijke Senaats Fractie, OSF.)<br />

In totaal zijn daarmee 69 ze<strong>te</strong>ls ver<strong>de</strong>eld. De res-<br />

<strong>te</strong>ren<strong>de</strong> 6 ze<strong>te</strong>ls wor<strong>de</strong>n één voor één ver<strong>de</strong>eld vol-<br />

gens het hiervoor beschreven principe van groot-<br />

s<strong>te</strong> gemid<strong>de</strong>l<strong>de</strong> s<strong>te</strong>mcijfer per ze<strong>te</strong>l, zie tabel 2.<br />

GR FR DR OV FL GD UT NH ZH ZL NB LB S<strong>te</strong>m-cijfer Kale ze<strong>te</strong>ls<br />

CDA 5 8 6 11 4 9 6 5 6 6 10 10 24238 10<br />

VVD 6 6 9 8 9 11 11 13 12 7 12 8 34518 15<br />

PVV 3 4 4 4 6 6 5 6 8 5 8 10 21064 9<br />

PvdA 12 11 12 9 6 9 7 11 10 7 7 6 29639 13<br />

GroenLinks 3 2 2 2 2 4 4 5 3 1 3 3 10656 4<br />

D66 3 2 2 3 3 4 5 6 5 2 5 2 13781 6<br />

SP 6 3 4 4 3 5 4 5 5 3 8 6 16825 7<br />

Chris<strong>te</strong>nUnie 3 3 2 3 3 3 2 1 2 2 5708 2<br />

SGP 2 1 2 1 2 4 3248 1<br />

PvdD 1 1 1 1 1 1 1 2438 1<br />

50PLUS 1 1 1 1 1 1 1 2 3022 1<br />

OSF 1 4 1 2 1424 0<br />

Tabel 1. Ze<strong>te</strong>lver<strong>de</strong>ling van <strong>de</strong> Provinciale Sta<strong>te</strong>n na <strong>de</strong> verkiezing van maart 2011<br />

98<br />

101<br />

120<br />

151<br />

135<br />

239<br />

241<br />

261<br />

365<br />

446<br />

489<br />

0 100 200 300 400 500 600 700<br />

166561 69<br />

641


Rekenen<br />

In<strong>te</strong>ressant wordt het doordat <strong>de</strong> Sta<strong>te</strong>nle<strong>de</strong>n in<br />

principe vrij zijn in hun keuze en dus ook op een<br />

an<strong>de</strong>re partij mogen s<strong>te</strong>mmen. Dat biedt <strong>de</strong> moge-<br />

lijkheid om afspraken <strong>te</strong> maken tussen samen-<br />

werken<strong>de</strong> partijen en zo <strong>de</strong> ze<strong>te</strong>lver<strong>de</strong>ling <strong>te</strong> beïn-<br />

vloe<strong>de</strong>n. Al begin april was er sprake van een<br />

mogelijke afspraak tussen 50PLUS en <strong>de</strong> OSF. Als<br />

<strong>bij</strong>voorbeeld alle OSF s<strong>te</strong>mmen <strong>te</strong>recht komen <strong>bij</strong><br />

<strong>de</strong> 50PLUS partij, dan krijgt <strong>de</strong> 50PLUS partij een<br />

s<strong>te</strong>mcijfer van 3022+1424 = 4446. Wat direct twee<br />

kale ze<strong>te</strong>ls oplevert in plaats van één. Dit <strong>te</strong>n kos<strong>te</strong><br />

van <strong>de</strong> SP, omdat er dan nog maar vijf restze<strong>te</strong>ls <strong>te</strong><br />

ver<strong>de</strong>len zijn. Maar met een kleine verhoging van<br />

het s<strong>te</strong>mcijfer, <strong>bij</strong>voorbeeld doordat een Zeeuws<br />

GroenLinks Sta<strong>te</strong>nlid zijn s<strong>te</strong>m aan <strong>de</strong> SP geeft,<br />

kan <strong>de</strong> SP voor<strong>bij</strong> <strong>de</strong> PVV schuiven. Wat vervolgens<br />

voor <strong>de</strong> gedoogcoalitie CDA, VVD en PVV weer<br />

S<strong>te</strong>mcijfer/<br />

(ze<strong>te</strong>ls +1 )<br />

Ze<strong>te</strong>ls<br />

S<strong>te</strong>mcijfer/<br />

(ze<strong>te</strong>ls +1 )<br />

Ze<strong>te</strong>ls<br />

S<strong>te</strong>mcijfer/<br />

(ze<strong>te</strong>ls +1 )<br />

Ze<strong>te</strong>ls<br />

10<br />

STAtOR juli 2011|2<br />

aanleiding kan zijn om een <strong>de</strong>fensieve stra<strong>te</strong>gie<br />

<strong>te</strong> zoeken, et ce<strong>te</strong>ra. Dit vraagt om een wiskundige<br />

analyse naar <strong>de</strong> stra<strong>te</strong>gische s<strong>te</strong>mmogelijkhe<strong>de</strong>n.<br />

Geen vas<strong>te</strong> kies<strong>de</strong>ler<br />

Vanuit wiskundig perspectief is het werken met<br />

<strong>de</strong> kies<strong>de</strong>ler en vervolgens één voor één ver<strong>de</strong>len<br />

van <strong>de</strong> restze<strong>te</strong>ls onnodig ingewikkeld. Waar het in<br />

wezen om gaat is het s<strong>te</strong>mcijfer per ver<strong>de</strong>el<strong>de</strong> ze<strong>te</strong>l.<br />

In het eer<strong>de</strong>r genoem<strong>de</strong> voorbeeld, waar ie<strong>de</strong>re<br />

partij op zichzelf s<strong>te</strong>mt, krijgt <strong>de</strong> SP <strong>de</strong> laats<strong>te</strong> rest-<br />

ze<strong>te</strong>l met een s<strong>te</strong>mcijfer van 2103,13 per ze<strong>te</strong>l. Ie<strong>de</strong>re<br />

toegewezen ze<strong>te</strong>l represen<strong>te</strong>ert dus een s<strong>te</strong>mcijfer<br />

van 2103,13 of meer. Omgekeerd geldt dat ie<strong>de</strong>re<br />

partij ook voor elke 2103,13 aan s<strong>te</strong>mcijfer een ze<strong>te</strong>l<br />

toegewezen heeft gekregen. Kortom <strong>de</strong> ui<strong>te</strong>in<strong>de</strong>-<br />

lijke ze<strong>te</strong>lver<strong>de</strong>ling correspon<strong>de</strong>ert met <strong>de</strong> ze<strong>te</strong>l-<br />

CDA 2203,45 11 2019,83 11 2019,83 11 2019,83 11 2019,83 11 2019,83 11<br />

VVD 2157,38 15 2157,38 16 2030,47 16 2030,47 16 2030,47 16 2030,47 16<br />

PVV 2106,40 9 2106,40 9 2106,40 9 2106,40 9 2106,40 10 1914,91 10<br />

PvdA 2117,07 13 2117,07 13 2117,07 13 2117,07 14 1975,93 14 1975,93 14<br />

GroenLinks 2131,20 4 2131,20 4 2131,20 5 1776,00 5 1776,00 5 1776,00 5<br />

D66 1968,71 6 1968,71 6 1968,71 6 1968,71 6 1968,71 6 1968,71 6<br />

SP 2103,13 7 2103,13 7 2103,13 7 2103,13 7 2103,13 7 2103,13 8<br />

Chris<strong>te</strong>nUnie 1902,67 2 1902,67 2 1902,67 2 1902,67 2 1902,67 2 1902,67 2<br />

SGP 1624,00 1 1624,00 1 1624,00 1 1624,00 1 1624,00 1 1624,00 1<br />

PvdD 1219,00 1 1219,00 1 1219,00 1 1219,00 1 1219,00 1 1219,00 1<br />

50PLUS 1511,00 1 1511,00 1 1511,00 1 1511,00 1 1511,00 1 1511,00 1<br />

OSF 1424,00 0 1424,00 0 1424,00 0 1424,00 0 1424,00 0 1424,00 0<br />

S<strong>te</strong>mcijfer/<br />

(ze<strong>te</strong>ls +1 )<br />

Ze<strong>te</strong>ls<br />

S<strong>te</strong>mcijfer/<br />

(ze<strong>te</strong>ls +1 )<br />

Ze<strong>te</strong>ls<br />

S<strong>te</strong>mcijfer/<br />

(ze<strong>te</strong>ls +1 )<br />

70 71 72 73 74 75<br />

Tabel 2. Ver<strong>de</strong>ling van <strong>de</strong> restze<strong>te</strong>ls in <strong>de</strong> Eers<strong>te</strong> Kamer na <strong>de</strong> Provinciale Sta<strong>te</strong>nverkiezing van maart 2011<br />

Ze<strong>te</strong>ls


ver<strong>de</strong>ling die we krijgen als we 2103,13 als kies<strong>de</strong>ler<br />

han<strong>te</strong>ren. Het hele proces van berekenen van kale<br />

ze<strong>te</strong>ls en toekennen van restze<strong>te</strong>ls kunnen we dus<br />

vervangen door het kiezen van <strong>de</strong> <strong>de</strong>ler waar<strong>bij</strong><br />

precies 75 ze<strong>te</strong>ls wor<strong>de</strong>n ver<strong>de</strong>eld. Probleem is ech-<br />

<strong>te</strong>r dat <strong>de</strong>ze fei<strong>te</strong>lijk resul<strong>te</strong>ren<strong>de</strong> <strong>de</strong>ler van <strong>te</strong>voren<br />

onbekend is en afhankelijk van het s<strong>te</strong>mgedrag.<br />

In figuur 2 lich<strong>te</strong>n we dit op een iets an<strong>de</strong>re<br />

manier toe, waar het aantal aan een partij toe <strong>te</strong><br />

wijzen ze<strong>te</strong>ls is uitgezet <strong>te</strong>gen <strong>de</strong> <strong>de</strong>ler. Weer voor<br />

<strong>de</strong> situatie dat alle Sta<strong>te</strong>nle<strong>de</strong>n op hun eigen par-<br />

tij s<strong>te</strong>mmen. De partijen zijn gegroepeerd als coa-<br />

litie (CDA, VVD en PVV) en oppositie (alle an<strong>de</strong>re<br />

partijen). Bij <strong>de</strong> groene lijn, <strong>de</strong> officiële kies<strong>de</strong>ler,<br />

zijn 34 ze<strong>te</strong>ls aan <strong>de</strong> coalitie toegekend en 35 aan<br />

<strong>de</strong> oppositie. Door <strong>de</strong> <strong>de</strong>ler lager <strong>te</strong> kiezen dan <strong>de</strong><br />

kies<strong>de</strong>ler, wor<strong>de</strong>n er meer ze<strong>te</strong>ls ver<strong>de</strong>eld. Het pro-<br />

ces van restze<strong>te</strong>lver<strong>de</strong>ling komt dus overeen met<br />

het naar links verschuiven van <strong>de</strong> <strong>de</strong>ler totdat er<br />

precies 75 ze<strong>te</strong>ls zijn ver<strong>de</strong>eld.<br />

Door het kiezen van een an<strong>de</strong>re s<strong>te</strong>mstra<strong>te</strong>gie<br />

kan een groep partijen <strong>de</strong> eigen curve beïnvloe-<br />

<strong>de</strong>n. Als <strong>bij</strong>voorbeeld het CDA een s<strong>te</strong>m, en daar-<br />

mee s<strong>te</strong>mwaar<strong>de</strong>, aan <strong>de</strong> PVV geeft zal <strong>de</strong> tre<strong>de</strong><br />

5<strong>de</strong> restze<strong>te</strong>l PVV naar rechts verschuiven, maar<br />

40<br />

39<br />

38<br />

37<br />

36<br />

35<br />

34<br />

33<br />

32<br />

31<br />

6<strong>de</strong> restze<strong>te</strong>l SP<br />

5<strong>de</strong> restze<strong>te</strong>l PVV<br />

11<br />

STAtOR juli 2011|2<br />

<strong>de</strong> tre<strong>de</strong> 1s<strong>te</strong> restze<strong>te</strong>l CDA schuift juist naar links.<br />

De kans op een restze<strong>te</strong>l voor <strong>de</strong> PVV zou hiermee<br />

mogelijk verbe<strong>te</strong>ren omdat het s<strong>te</strong>mcijfer per<br />

ze<strong>te</strong>l wordt verhoogd. Ech<strong>te</strong>r, <strong>de</strong> kans op een rest-<br />

ze<strong>te</strong>l voor het CDA zal verslech<strong>te</strong>ren.<br />

wiskundig mo<strong>de</strong>l<br />

Om een optimale stra<strong>te</strong>gie <strong>te</strong> bepalen voor een<br />

groep partijen G mo<strong>de</strong>lleren we het probleem als<br />

volgt. Laat variabele X pij het aantal s<strong>te</strong>mmen zijn<br />

dat in provincie p door partij i uitgebracht is op<br />

partij j, en laat ω p <strong>de</strong> s<strong>te</strong>mwaar<strong>de</strong> zijn in provin-<br />

cie p. Dan is het verkregen s<strong>te</strong>mcijfer van partij j<br />

gelijk aan Σ p,i ω p X pij . Laat variabele D <strong>de</strong> <strong>de</strong>ler zijn<br />

en <strong>de</strong> variabele Z j het behaal<strong>de</strong> aantal ze<strong>te</strong>ls van<br />

partij j. Met α pi geven we het aantal sta<strong>te</strong>nle<strong>de</strong>n<br />

aan dat partij i in provincie p heeft. De randvoor-<br />

waar<strong>de</strong>n zijn als volgt. Er zijn 75 ze<strong>te</strong>ls <strong>te</strong> ver<strong>de</strong>len;<br />

Σ j Z j = 75. Het aantal s<strong>te</strong>mmen uitgebracht komt<br />

overeen met het aantal sta<strong>te</strong>nle<strong>de</strong>n; Σ j X pij = α pi .<br />

Het s<strong>te</strong>mcijfer geeft een boven- en on<strong>de</strong>rgrens op<br />

het aantal ze<strong>te</strong>ls van een partij;<br />

4<strong>de</strong> restze<strong>te</strong>l PvdA<br />

3<strong>de</strong> restze<strong>te</strong>l GL<br />

2<strong>de</strong> restze<strong>te</strong>l VVD<br />

1s<strong>te</strong> restze<strong>te</strong>l CDA<br />

Z j ≤ Σ p,i ω p X pij < Zj +1.<br />

D<br />

1950 2050 2150 2250 2350 2450<br />

Figuur 2. Het aantal aan een partij toe <strong>te</strong> wijzen ze<strong>te</strong>ls uitgezet <strong>te</strong>gen <strong>de</strong> <strong>de</strong>ler<br />

Coalitie<br />

Oppositie<br />

Kies<strong>de</strong>ler


Nu we dit mo<strong>de</strong>l geformuleerd hebben, lopen<br />

we <strong>te</strong>gen twee dingen aan. Wat <strong>te</strong> doen met het<br />

wiskundig gezien moeilijk oplosbare kwadratisch<br />

probleem en wat is <strong>de</strong> stra<strong>te</strong>gie van <strong>de</strong> partijen<br />

die niet in groep G zit<strong>te</strong>n? De sleu<strong>te</strong>l voor bei<strong>de</strong><br />

problemen zit in het tij<strong>de</strong>lijk vastzet<strong>te</strong>n van <strong>de</strong><br />

<strong>de</strong>ler.<br />

Door het vastzet<strong>te</strong>n van <strong>de</strong> <strong>de</strong>ler wordt het<br />

mo<strong>de</strong>l lineair en eenvoudiger om op <strong>te</strong> lossen. We<br />

la<strong>te</strong>n daarmee tij<strong>de</strong>lijk <strong>de</strong> eis vallen dat 75 ze<strong>te</strong>ls<br />

ver<strong>de</strong>eld moe<strong>te</strong>n wor<strong>de</strong>n. Wor<strong>de</strong>n er min<strong>de</strong>r dan<br />

75 ver<strong>de</strong>eld, dan is <strong>de</strong> <strong>de</strong>ler klaarblijkelijk <strong>te</strong> hoog<br />

gekozen. En als er meer dan 75 wor<strong>de</strong>n ver<strong>de</strong>eld,<br />

dan is <strong>de</strong> <strong>de</strong>ler <strong>te</strong> laag gekozen. Een binary search<br />

op <strong>de</strong> <strong>de</strong>ler leidt snel tot een goe<strong>de</strong> keuze.<br />

Voor een gegeven <strong>de</strong>ler kan een groep partijen<br />

nu haar bes<strong>te</strong> stra<strong>te</strong>gie bepalen, onafhankelijk van<br />

<strong>de</strong> stra<strong>te</strong>gie van <strong>de</strong> an<strong>de</strong>ren. Of <strong>bij</strong> die <strong>de</strong>ler precies<br />

75 ze<strong>te</strong>ls wor<strong>de</strong>n ver<strong>de</strong>eld, is ech<strong>te</strong>r wel afhanke-<br />

lijk van <strong>de</strong> stra<strong>te</strong>gie van <strong>de</strong> an<strong>de</strong>re partijen.<br />

Laat <strong>de</strong> parame<strong>te</strong>r β ij gelijk zijn aan 1 als par-<br />

tijen i en j tot <strong>de</strong>zelf<strong>de</strong> groep en 0 als dat niet zo<br />

is. En als we <strong>de</strong> variabele voor <strong>de</strong> <strong>de</strong>ler D vervan-<br />

gen door een vast getal δ, wordt het ILP mo<strong>de</strong>l als<br />

volgt:<br />

40<br />

39<br />

38<br />

37<br />

36<br />

35<br />

34<br />

33<br />

32<br />

31<br />

12<br />

STAtOR juli 2011|2<br />

X<br />

maximize zj j<br />

X<br />

s.t. Xpij = αpi p,i,<br />

j<br />

X pij ≤ α pi β ij p,i,j,<br />

Z j ≤ Σ p,i ω p X pij j<br />

δ<br />

X pij ,Z j in<strong>te</strong>ger.<br />

Uitkoms<strong>te</strong>n<br />

Zoals eer<strong>de</strong>r geschetst kan <strong>de</strong> gedoogcoalitie haar<br />

kans op een 37s<strong>te</strong> ze<strong>te</strong>l (<strong>de</strong> restze<strong>te</strong>l van <strong>de</strong> PVV)<br />

vers<strong>te</strong>vigen door een <strong>de</strong>el van het s<strong>te</strong>mcijfer van<br />

het CDA naar <strong>de</strong> PVV <strong>te</strong> verschuiven. Zoeken naar<br />

<strong>de</strong> groots<strong>te</strong> waar<strong>de</strong> van δ waarvoor <strong>de</strong> gedoogcoa-<br />

litie 37 ze<strong>te</strong>ls kan halen, levert <strong>de</strong> stra<strong>te</strong>gie op die<br />

staat afgebeeld in figuur 3. In <strong>de</strong>ze stra<strong>te</strong>gie gaat<br />

een s<strong>te</strong>mwaar<strong>de</strong> van 506 van het CDA naar <strong>de</strong><br />

PVV, door in <strong>de</strong> provincie Zuid-Holland één CDA-<br />

er <strong>te</strong> la<strong>te</strong>n s<strong>te</strong>mmen op <strong>de</strong> PVV en omgekeerd in<br />

<strong>de</strong> provincie Groningen één PVV-er op het CDA.<br />

1950 2050 2150 2250 2350 2450<br />

Figuur 3. Stra<strong>te</strong>gie voor het vin<strong>de</strong>n van <strong>de</strong> groots<strong>te</strong> waar<strong>de</strong> van δ waarvoor <strong>de</strong> gedoogcoalitie 37 ze<strong>te</strong>ls kan halen<br />

Coalitie<br />

Coalitie (37 max)<br />

Kies<strong>de</strong>ler


Voor elk ze<strong>te</strong>laantal kan gezocht wor<strong>de</strong>n naar<br />

een stra<strong>te</strong>gie die <strong>bij</strong> een zo groot mogelijke waar<strong>de</strong><br />

van δ dat ze<strong>te</strong>laantal behaalt. Ofwel, elk ze<strong>te</strong>laan-<br />

tal heeft een s<strong>te</strong>rks<strong>te</strong> stra<strong>te</strong>gie voor het halen van<br />

dat aantal ze<strong>te</strong>ls. Het resultaat staat weergegeven<br />

in figuur 4 als Coalitie (X max); het maximaal haal-<br />

bare ze<strong>te</strong>laantal gegeven een <strong>de</strong>ler. In <strong>de</strong> vorige<br />

grafieken correspon<strong>de</strong>er<strong>de</strong> een lijn met één stra-<br />

<strong>te</strong>gie, maar <strong>de</strong>ze lijn correspon<strong>de</strong>ert met het maxi-<br />

maal haalbare over alle mogelijke stra<strong>te</strong>gieën. De<br />

stra<strong>te</strong>gie verschilt dus per tre<strong>de</strong> in <strong>de</strong> grafiek.<br />

Voor <strong>de</strong> oppositie kan een vergelijkbare ana-<br />

lyse gemaakt wor<strong>de</strong>n. Het lijkt politiek gezien<br />

niet realistisch om <strong>de</strong> oppositie als één gro<strong>te</strong><br />

samenwerken<strong>de</strong> groep <strong>te</strong> beschouwen. Ter illu-<br />

stratie kiezen we hier voor vier subgroepen; Groep<br />

1 bestaat uit PvdA, SP, D66 en GroenLinks, groep 2<br />

uit Chris<strong>te</strong>nUnie en SGP, groep 3 uit alleen PvdD<br />

en groep 4 uit 50PLUS en OSF. Binnen <strong>de</strong>ze beper-<br />

king is het maximaal haalbare voor <strong>de</strong> oppositie<br />

afgebeeld in figuur 4, naast het eer<strong>de</strong>r bepaal<strong>de</strong><br />

maximaal haalbare voor <strong>de</strong> coalitie.<br />

Als alle partijen, gegeven <strong>de</strong>ze groepsin<strong>de</strong>ling,<br />

<strong>de</strong> bes<strong>te</strong> stra<strong>te</strong>gie volgen zal <strong>de</strong> coalitie 36 ze<strong>te</strong>ls<br />

krijgen en <strong>de</strong> oppositie 39 ze<strong>te</strong>ls. Het valt op dat<br />

40<br />

39<br />

38<br />

37<br />

36<br />

35<br />

34<br />

33<br />

32<br />

Figuur 4. Het maximaal haalbare ze<strong>te</strong>laantal gegeven een <strong>de</strong>ler<br />

13<br />

STAtOR juli 2011|2<br />

<strong>bij</strong> optimale stra<strong>te</strong>gieën <strong>de</strong> 74s<strong>te</strong> en 75s<strong>te</strong> ze<strong>te</strong>l<br />

wor<strong>de</strong>n ver<strong>de</strong>eld <strong>bij</strong> <strong>de</strong>lers die heel dicht <strong>bij</strong> <strong>de</strong><br />

officiële kies<strong>de</strong>ler liggen.<br />

Open eindjes<br />

De wiskundige kant van <strong>de</strong> verkiezing is hiermee<br />

belicht, er zijn ech<strong>te</strong>r nog wat losse eindjes. Een<br />

bewijs van NP-compleetheid en het bestaan van<br />

een puur Nash evenwicht zijn waarschijnlijk niet<br />

moeilijk <strong>te</strong> geven. Ech<strong>te</strong>r, groepsin<strong>de</strong>lingen en s<strong>te</strong>m-<br />

afspraken zijn politieke kwesties, die ongetwijfeld<br />

veel moeilijker zijn dan <strong>de</strong> beschreven wiskun<strong>de</strong>.<br />

Li<strong>te</strong>ratuur<br />

1. NOS dossier Strijd om <strong>de</strong> Eers<strong>te</strong> Kamer: http://nos.<br />

nl/dossier/210939-eers<strong>te</strong>-kamerverkiezingen-2011/<br />

thema/serie-strijd-om-<strong>de</strong>-eers<strong>te</strong>-kamer/<br />

2. Eén Vandaag uitzending Verkiezingen een strijd op<br />

lan<strong>de</strong>lijk niveau, 17 februari 2011: http://beta.uitzendinggemist.nl/afleveringen/1062892<br />

3. Websi<strong>te</strong> Eers<strong>te</strong> Kamer: www.eers<strong>te</strong>kamer.nl/<br />

4. Websi<strong>te</strong> Kiesraad: www.kiesraad.nl/<br />

Jacob Jan Paulus en Jaap Praagman zijn bei<strong>de</strong>n werkzaam<br />

<strong>bij</strong> Consultants in Quantitative Methods (CQM).<br />

E-mail: & <br />

31<br />

1950 2050 2150 2250 2350 2450<br />

Coalitie (X max)<br />

Oppositie (X max)<br />

Kies<strong>de</strong>ler


<strong>Hoe</strong> optimalisatie in<br />

een aantal jaren in het DNA<br />

van TNT Express is gekomen<br />

Hein Fleuren, Marco Hendriks & Annelies Wou<strong>te</strong>rsen<br />

We schrijven 2004, een jaar waarin s<strong>te</strong>vige groei<br />

voor TNT Express een soort natuurconstan<strong>te</strong> was.<br />

Op een namiddag heeft op het CentER for Applied<br />

Research een aantal mensen een kort overzichtje<br />

gemaakt wat <strong>de</strong> gro<strong>te</strong> 4 Express spelers (UPS,<br />

Fe<strong>de</strong>x, DHL en TNT Express) aan optimalisatie<br />

<strong>de</strong><strong>de</strong>n. Voor UPS en Fe<strong>de</strong>x is re<strong>de</strong>lijk wat in <strong>de</strong><br />

li<strong>te</strong>ratuur (business en we<strong>te</strong>nschappelijk) <strong>te</strong> vin-<br />

<strong>de</strong>n. Voor DHL ook nog wel wat maar voor TNT...<br />

Met <strong>de</strong>ze boodschap naar TNT getogen, alwaar<br />

we (ach<strong>te</strong>raf) blijkbaar op het juis<strong>te</strong> moment <strong>bij</strong><br />

<strong>de</strong> juis<strong>te</strong> man aan tafel kwamen: Marco Hen-<br />

driks, toen<strong>de</strong>rtijd verantwoor<strong>de</strong>lijk voor business<br />

improvement in Express’ netwerken. In dit artikel<br />

belich<strong>te</strong>n we wat er zoal <strong>bij</strong> komt kijken om Ope-<br />

rations Research succesvol toe <strong>te</strong> passen in een<br />

groot bedrijf als TNT.<br />

14<br />

STAtOR juli 2011|2<br />

wat is een Express netwerk?<br />

Gro<strong>te</strong> Express spelers vervoeren dagelijks mil-<br />

joenen pakjes wereldwijd van zakelijke adressen<br />

naar zakelijke adressen, en in toenemen<strong>de</strong> ma<strong>te</strong><br />

ook consumen<strong>te</strong>nadressen (e-commerce). Deze<br />

verzending kent specifieke tijdsrestricties, zowel<br />

in het aantal transit dagen als <strong>de</strong> tijd waarvoor<br />

het moet wor<strong>de</strong>n afgeleverd (voor 9:00 uur, voor<br />

12:00 uur of gehele dag). De algemene infrastruc-<br />

tuur die gekozen wordt is er een van vele <strong>de</strong>pots<br />

van waaruit busjes rondrij<strong>de</strong>n om zendingen<br />

op <strong>te</strong> halen en die naar het <strong>de</strong>pot <strong>te</strong> brengen.<br />

Vandaaruit wor<strong>de</strong>n ze met gro<strong>te</strong> trucks naar een<br />

hub, zeg maar een groot sor<strong>te</strong>ercentrum, gebracht<br />

waar ze ’s nachts ver<strong>de</strong>r wor<strong>de</strong>n gesor<strong>te</strong>erd naar,<br />

óf <strong>de</strong> volgen<strong>de</strong> hub, óf het eind<strong>de</strong>pot. De trucks


ij<strong>de</strong>n volgens een vooraf uitgedacht schema en<br />

vertrekken op tijd, of <strong>de</strong> truck nu vol is of niet.<br />

Eenmaal aangekomen op het eind<strong>de</strong>pot wor<strong>de</strong>n<br />

<strong>de</strong> pakjes weer met busjes vervoerd naar <strong>de</strong> afle-<br />

veradressen. Ophalen en wegbrengen dui<strong>de</strong>n we<br />

aan met PuD (Pickup & Delivery) en het verkeer<br />

tussen <strong>de</strong>pots en hubs met Linehaul. PuD-vans en<br />

linehaul-trucks wor<strong>de</strong>n over het algemeen alle-<br />

maal ingehuurd <strong>bij</strong> transportbedrijven die rij<strong>de</strong>n<br />

on<strong>de</strong>r TNT-vlag.<br />

Eers<strong>te</strong> project: Netwerk Italië<br />

Het i<strong>de</strong>e waarmee we aankwamen <strong>bij</strong> TNT was<br />

leuk maar moest eerst in het eigen jargon ver-<br />

taald wor<strong>de</strong>n en, TNT is commercieel, er kwam<br />

gewoon een <strong>te</strong>n<strong>de</strong>r waarop 5 bedrijven hebben<br />

gereageerd. Na selectie bleef <strong>de</strong> combinatie van<br />

<strong>de</strong> Universi<strong>te</strong>it van Tilburg en ORTEC over. We<br />

moch<strong>te</strong>n aan <strong>de</strong> slag met het linehaul-netwerk<br />

van Italië om onze bewering waar <strong>te</strong> maken dat<br />

met Operations Research voor<strong>de</strong>len <strong>te</strong> behalen<br />

waren.<br />

De verleiding is groot, zeker voor OR’ers, om<br />

direct in mo<strong>de</strong>llen <strong>te</strong> gaan <strong>de</strong>nken maar we heb-<br />

ben dit, ook met hulp van TNT, kunnen weerstaan.<br />

We zijn begonnen met een goe<strong>de</strong> data-analy-<br />

se. Met behulp van AIMMS hebben we diverse<br />

bestan<strong>de</strong>n van zendingen, linehaul-schema’s,<br />

voertuigen en geografische gegevens aan elkaar<br />

gekoppeld. Dit bleek, na <strong>de</strong> altijd weer nodige<br />

cleaning van gegevens, al snel een goudmijn <strong>te</strong><br />

zijn om allerlei snelle verbe<strong>te</strong>ringen <strong>te</strong> vin<strong>de</strong>n.<br />

Voorbeel<strong>de</strong>n zijn voertuigen die halfvol relatief<br />

dicht ach<strong>te</strong>r elkaar in <strong>de</strong>zelf<strong>de</strong> richting re<strong>de</strong>n,<br />

voertuigen die een <strong>te</strong> lage belading had<strong>de</strong>n maar<br />

waarvan <strong>de</strong> lading makkelijk via een an<strong>de</strong>re rou<strong>te</strong><br />

kon gaan. Dit lijkt triviaal maar is het zeker niet<br />

als men be<strong>de</strong>nkt dat er in dit netwerk zo’n 500 tot<br />

600 trucks elke nacht rondrij<strong>de</strong>n met dagelijks<br />

re<strong>de</strong>lijk wisselen<strong>de</strong> volumes. De netwerken met<br />

al hun aansluitingen die gehaald moe<strong>te</strong>n wor<strong>de</strong>n<br />

la<strong>te</strong>n zich goed vergelijken met een spoorboekje<br />

zoals dat <strong>bij</strong> <strong>de</strong> spoorwegen gehan<strong>te</strong>erd wordt.<br />

Na <strong>de</strong> data-analyse was het veel hel<strong>de</strong>r<strong>de</strong>r waar<br />

<strong>de</strong> gro<strong>te</strong> knelpun<strong>te</strong>n za<strong>te</strong>n en kon<strong>de</strong>n we gericht<br />

gaan optimaliseren. In dit netwerk is dit met<br />

Shortrec (rou<strong>te</strong>ringspakket van ORTEC) gebeurd,<br />

waar ui<strong>te</strong>raard <strong>de</strong> TNT-specifieke kenmerken<br />

moes<strong>te</strong>n wor<strong>de</strong>n ingebracht. In <strong>de</strong> optimalisatie<br />

hebben we ui<strong>te</strong>in<strong>de</strong>lijk gekozen om een lange lijst<br />

van locale verbe<strong>te</strong>ringen aan het management<br />

voor <strong>te</strong> leggen en niet het schema radicaal om <strong>te</strong><br />

gooien. Deze lange lijst van verbe<strong>te</strong>ringen is door<br />

<strong>de</strong> transport-managers van Italië geheel doorgenomen<br />

op haalbaarheid. Verschillen<strong>de</strong> aangedragen<br />

verbe<strong>te</strong>ringen sneuvel<strong>de</strong>n vanwege diverse<br />

praktijkre<strong>de</strong>nen, maar ui<strong>te</strong>in<strong>de</strong>lijk bleef een gro<strong>te</strong>r<br />

dan verwacht<strong>te</strong> besparing over: zo’n 5 procent<br />

op een netwerk van vele tientallen miljoenen<br />

kos<strong>te</strong>n per jaar. Eind 2005 was <strong>de</strong> eers<strong>te</strong> mutatie<br />

in het DNA van TNT een feit.<br />

Volgen<strong>de</strong> projec<strong>te</strong>n<br />

De in<strong>te</strong>resse was gewekt en volgen<strong>de</strong> netwerk<br />

linehaul-projec<strong>te</strong>n dien<strong>de</strong>n zich aan in lan<strong>de</strong>n<br />

als Frankrijk, Duitsland, Slovenië en Spanje. Ook<br />

<strong>de</strong>ze projec<strong>te</strong>n hebben we gedaan met <strong>de</strong> ontwikkel<strong>de</strong><br />

tools en methodologieën, maar daarnaast<br />

ontstond er een s<strong>te</strong>rke behoef<strong>te</strong> aan het <strong>de</strong>len<br />

van kennis op optimalisatiegebied maar ook op<br />

implementatiegebied. Met het laats<strong>te</strong> gaat het er<br />

met name om hoe een aangetoon<strong>de</strong> besparing<br />

ook werkelijk gerealiseerd kan wor<strong>de</strong>n en hoe<br />

<strong>de</strong> overgang zo soepel mogelijk kan verlopen. Dit<br />

resul<strong>te</strong>er<strong>de</strong> in <strong>de</strong> oprichting van een zogenaam<strong>de</strong><br />

COP (Community of Practice) waar diverse <strong>de</strong>elnemers<br />

uit <strong>de</strong> lan<strong>de</strong>n maar ook kennisorganisaties<br />

en zelfs het World Food Program <strong>bij</strong> aanschoof.<br />

Drie keer per jaar komen we voor twee dagen <strong>bij</strong><br />

elkaar om een specifiek on<strong>de</strong>rwerp van netwerk<br />

15<br />

STAtOR juli 2011|2


optimalisatie en alles wat daarmee samenhangt<br />

<strong>te</strong> bespreken. Belangrijk hier<strong>bij</strong> is dat een <strong>de</strong>r-<br />

gelijke kennisclub niet een theekransje wordt<br />

maar dat er ook ech<strong>te</strong> <strong>beslissingen</strong> wor<strong>de</strong>n voor-<br />

bereid die door het management kunnen wor-<br />

<strong>de</strong>n bekrachtigd (of verworpen). Dit vereist een<br />

behoorlijk s<strong>te</strong>rke aansturing aangezien specialis-<br />

<strong>te</strong>n nogal eens <strong>de</strong> neiging hebben uit <strong>te</strong> wij<strong>de</strong>n en<br />

erg veel <strong>de</strong>tails <strong>te</strong> willen meenemen.<br />

Belangrijk binnen elk optimalisatieproject<br />

van TNT is <strong>de</strong> driehoek: People & Organisation,<br />

Processes & Procedures en Tools & Technology.<br />

Aan alle <strong>de</strong>ze drie aspec<strong>te</strong>n moet ruim aandacht<br />

wor<strong>de</strong>n gegeven, het moet qua uitwerking goed<br />

op elkaar aanslui<strong>te</strong>n en als geheel wor<strong>de</strong>n afge-<br />

<strong>te</strong>kend door het management. Een paar voorbeel-<br />

<strong>de</strong>n: (optimalisatie)-tools kunnen nog zo goed zijn,<br />

als ze niet ingebed zijn in <strong>de</strong> (eventueel veran<strong>de</strong>r-<br />

<strong>de</strong>) processen dan werken ze niet. Als <strong>bij</strong> prachtige<br />

oplossingen <strong>de</strong> mensen niet meewerken, of <strong>de</strong><br />

organisatie heeft an<strong>de</strong>re performance indicato-<br />

ren, ook dan zal er weinig effect in <strong>de</strong> praktijk zijn.<br />

An<strong>de</strong>re gebie<strong>de</strong>n<br />

Na twee jaar veel in <strong>de</strong> netwerkhoek <strong>te</strong> hebben<br />

uitgebouwd, kwamen ook langzamerhand <strong>de</strong> vra-<br />

gen of ook in <strong>de</strong> an<strong>de</strong>re supply chain-on<strong>de</strong>r<strong>de</strong>len<br />

van TNT, namelijk PuD, <strong>de</strong> luchtvrachtdivisie en<br />

<strong>de</strong> <strong>de</strong>pots & hubs geoptimaliseerd kon wor<strong>de</strong>n.<br />

Op een zelf<strong>de</strong> wijze en met hetzelf<strong>de</strong> accent op <strong>de</strong><br />

hierboven beschreven driehoek zijn hier projec<strong>te</strong>n<br />

opgestart en COP’s opgezet.<br />

Nu wordt er met vehicle routing-software drif-<br />

tig geoptimaliseerd in het ophalen en afleveren<br />

van zendingen. De inzet van personeel in <strong>de</strong><br />

<strong>de</strong>pots en hubs wordt geoptimaliseerd. Er zijn<br />

tools die on<strong>de</strong>rs<strong>te</strong>unen <strong>bij</strong> het inrich<strong>te</strong>n en opzet-<br />

<strong>te</strong>n van nieuwe hubs en <strong>de</strong>pots. Comple<strong>te</strong> TNT-<br />

specifieke oplossingen zijn uitgewerkt voor <strong>de</strong><br />

netwerken en zware MIP-mo<strong>de</strong>llen gebouwd voor<br />

16<br />

STAtOR juli 2011|2<br />

<strong>de</strong> optimalisatie van <strong>de</strong> Express luchtvloot die<br />

ruim 40 vliegtuigen omvat.<br />

Om een indruk <strong>te</strong> geven: vorig jaar zijn in al<br />

<strong>de</strong>ze gebie<strong>de</strong>n samen ruim 100 kleinere en gro<strong>te</strong>re<br />

optimalisatieprojec<strong>te</strong>n uitgevoerd!<br />

Suboptimalisatie?<br />

Van het begin af aan hebben we ons gerealiseerd<br />

dat <strong>de</strong> comple<strong>te</strong> supply chain geoptimaliseerd<br />

moet wor<strong>de</strong>n. Maar als er nog veel opgebouwd<br />

moet wor<strong>de</strong>n is het toch verstandig om met <strong>de</strong><br />

supply chain on<strong>de</strong>r<strong>de</strong>len <strong>te</strong> beginnen. Supply<br />

chain <strong>de</strong>nken is lastig in een groot bedrijf waar<br />

één van <strong>de</strong> on<strong>de</strong>r<strong>de</strong>len al een wereld op zich is<br />

met een gro<strong>te</strong> complexi<strong>te</strong>it. Het zou <strong>bij</strong>voorbeeld<br />

kunnen be<strong>te</strong>kenen dat we moe<strong>te</strong>n inves<strong>te</strong>ren in<br />

mensen in <strong>de</strong>pots en hubs (of sor<strong>te</strong>ermachines)<br />

waardoor <strong>de</strong>ze duur<strong>de</strong>r wor<strong>de</strong>n <strong>te</strong>rwijl we <strong>de</strong><br />

voor<strong>de</strong>len in <strong>de</strong> netwerken en PuD behalen. Maar<br />

wat als <strong>de</strong> <strong>de</strong>pot/hub-manager on<strong>de</strong>r vrij zware<br />

targets staat?<br />

Enigszins geholpen door <strong>de</strong> crisis eind 2008<br />

zijn we <strong>de</strong> eers<strong>te</strong> comple<strong>te</strong> supply chain mo<strong>de</strong>llen<br />

gaan ontwikkelen. De eers<strong>te</strong> mo<strong>de</strong>llen zijn sim-<br />

pele ‘doorrekenmo<strong>de</strong>llen’ om <strong>de</strong> comple<strong>te</strong> ke<strong>te</strong>n<br />

in door TNT zelf aangedragen al<strong>te</strong>rnatieven door<br />

<strong>te</strong> rekenen. Maar schijn bedriegt hier: het doorre-<br />

kenmo<strong>de</strong>l van <strong>de</strong> ke<strong>te</strong>n bevat als on<strong>de</strong>r<strong>de</strong>len weer<br />

zo’n vier optimalisatiemo<strong>de</strong>llen en heel veel bere-<br />

keningen. Een gemid<strong>de</strong>l<strong>de</strong> run laadt 60 miljoen<br />

data-elemen<strong>te</strong>n en heeft een uurtje rekentijd op<br />

een zware PC nodig.<br />

Ver<strong>de</strong>re kennisopbouw<br />

Geduren<strong>de</strong> <strong>de</strong> afgelopen jaren ont<strong>de</strong>k<strong>te</strong>n we dat<br />

het heel lastig is om met me<strong>de</strong>werkers in het veld<br />

<strong>te</strong> werken die onvoldoen<strong>de</strong> <strong>de</strong> tools en <strong>de</strong> ach<strong>te</strong>r-<br />

liggen<strong>de</strong> i<strong>de</strong>eën begrijpen. Dit heeft geleid dat we,


<strong>te</strong>zamen met TiasNimbas, <strong>de</strong> GO-aca<strong>de</strong>my (GO van<br />

Global Optimisation) hebben opgezet. De GO-aca-<br />

<strong>de</strong>my kent 5 modules van elk vier dagen, welke na 2<br />

jaar tijd wordt afgerond met een afstu<strong>de</strong>eropdracht<br />

van een vijftal maan<strong>de</strong>n in <strong>de</strong> praktijk van <strong>de</strong> TNT-<br />

lan<strong>de</strong>n. In april 2011 hebben we <strong>de</strong> twee<strong>de</strong> lichting<br />

van veertig Supply Chain Mas<strong>te</strong>rs, let<strong>te</strong>rlijk vanuit<br />

<strong>de</strong> hele wereld, hun diploma kunnen overhandigen.<br />

De inhoud van <strong>de</strong> GO-aca<strong>de</strong>my wordt ook constant<br />

aangepast aan veran<strong>de</strong>ringen in <strong>de</strong> stra<strong>te</strong>gie van<br />

Express. Op dit moment zijn we bezig met <strong>de</strong> voor-<br />

bereiding van alweer het vijf<strong>de</strong> cohort. Dit be<strong>te</strong>kent<br />

dat we in enkele jaren tijd hon<strong>de</strong>r<strong>de</strong>n mensen op<br />

hetzelf<strong>de</strong> kennisniveau brengen die daarnaast ook<br />

nog eens eenzelf<strong>de</strong> ‘taal’ spreken.<br />

En nu ver<strong>de</strong>r?<br />

Wellicht is <strong>de</strong> indruk ontstaan dat we wel <strong>bij</strong>na<br />

klaar moe<strong>te</strong>n zijn. Niets is min<strong>de</strong>r waar. Er valt<br />

voor OR-ers nog heel veel <strong>te</strong> doen, vooral in het<br />

toepassen (<strong>de</strong>ployment) van alle kennis. Maar ook<br />

infrastructuuroptimalisatie, in<strong>te</strong>gratie van lean-<br />

concep<strong>te</strong>n en optimalisatie, supply chain <strong>de</strong>nken<br />

samen met <strong>de</strong> klant en geoptimaliseer<strong>de</strong> <strong>de</strong>pots &<br />

hubs staan nog maar aan het begin. Dit, ondanks<br />

dat TNT in een hoog <strong>te</strong>mpo gespecialiseer<strong>de</strong> af<strong>de</strong>-<br />

lingen hiervoor heeft opgezet. Het lijstje waarmee<br />

we vijf jaar gele<strong>de</strong>n naar TNT gingen is allang niet<br />

leeg meer maar helaas/gelukkig zit <strong>de</strong> concurren-<br />

tie ook niet stil...<br />

Hein Fleuren is hoogleraar Operations Research aan <strong>de</strong><br />

Universi<strong>te</strong>it van Tilburg en is gespecialiseerd in <strong>de</strong> praktische<br />

toepassing van Operations Research.<br />

E-mail: <br />

Marco Hendriks is als Director Optimisation &<br />

Engineering werkzaam <strong>bij</strong> TNT Express.<br />

E-mail: <br />

Annelies Wou<strong>te</strong>rsen is als Supply Chain Consultant<br />

werkzaam <strong>bij</strong> ORTEC.<br />

E-mail: <br />

A G E N D A<br />

21 tot en met 26 augustus 2011<br />

Het 58s<strong>te</strong> World Statistics Congress van het In<strong>te</strong>rnational<br />

Statistical Institu<strong>te</strong> (ISI) vindt in Dublin<br />

van 21 – 26 augustus 2011 plaats. Het we<strong>te</strong>nschappelijk<br />

programma omvat diverse, in<strong>te</strong>ressan<strong>te</strong><br />

on<strong>de</strong>rwerpen. Op 24 augustus is er een speciale<br />

themadag ‘Wa<strong>te</strong>r, quality and quantity’; statistische<br />

kwesties met betrekking tot wa<strong>te</strong>r en <strong>de</strong><br />

wa<strong>te</strong>rkwali<strong>te</strong>it staan dan centraal. Het tweejaarlijks<br />

congres wordt bezocht door statistici die op<br />

verschillen<strong>de</strong> <strong>te</strong>rreinen werkzaam zijn, zoals in <strong>de</strong><br />

financiële sector en het bedrijfsleven, <strong>bij</strong> <strong>de</strong> overheid<br />

en we<strong>te</strong>nschappelijk on<strong>de</strong>rzoeksinstitu<strong>te</strong>n<br />

of in het on<strong>de</strong>rwijs. Het congres wil een ontmoetingsplek<br />

zijn om ervaringen en expertise <strong>te</strong> <strong>de</strong>len<br />

en om tot nieuwe inzich<strong>te</strong>n <strong>te</strong> komen. Zie voor het<br />

hele programma, aanmelding en indienen van<br />

papers <strong>de</strong> websi<strong>te</strong> .<br />

17 tot en met 19 augustus 2011<br />

De tweejaarlijks conferentie van <strong>de</strong> In<strong>te</strong>rnational<br />

Association for Official Statistics (IAOS) die<br />

van 17 – 19 augustus in Belfast wordt gehou<strong>de</strong>n,<br />

kan gezien wor<strong>de</strong>n als een ‘sa<strong>te</strong>lli<strong>te</strong>’ van het ISIcongres<br />

in Dublin. Het thema van <strong>de</strong> conferentie<br />

is ‘The Demography of Ageing and Official Statistics’.<br />

Centraal staan <strong>de</strong> omvang en kenmerken<br />

van <strong>de</strong> vergrijzing en <strong>de</strong> impact op het sociale<br />

en economische beleid. IAOS wil <strong>de</strong> kennis over<br />

overheidsstatistieken bevor<strong>de</strong>ren en het gebruik<br />

van effectieve en efficiën<strong>te</strong> statistische diens<strong>te</strong>n<br />

wereldwijd stimuleren. De IAOS-conferentie is<br />

georganiseerd door het Northern Ireland Statistics<br />

and Research Agency (NISRA), in samenwerking<br />

met het Centre for Ageing Research and Development<br />

in Ireland (CARDI) en <strong>de</strong> Queen’s University<br />

in Belfast. Zie voor meer informatie <strong>de</strong> websi<strong>te</strong><br />

.<br />

17<br />

STAtOR juli 2011|2


Karl Pearson<br />

tussen Statistiek en filosofie<br />

Richard Starmans<br />

De Britse statisticus Karl Pearson (1857-1936)<br />

neemt in <strong>de</strong> geschie<strong>de</strong>nis van <strong>de</strong> statistiek een<br />

onwrikbare plaats in. Hij geldt met Francis Gal-<br />

ton en Ronald Fisher als <strong>de</strong> wegberei<strong>de</strong>r van <strong>de</strong><br />

mo<strong>de</strong>rne statistiek en was een belangrijk gang-<br />

maker van <strong>de</strong> probabilistische revolutie die zich<br />

eind negentien<strong>de</strong> eeuw in diverse disciplines vol-<br />

trok. Dat gebeur<strong>de</strong> in alou<strong>de</strong>, gevestig<strong>de</strong> we<strong>te</strong>n-<br />

schappen als <strong>de</strong> fysica (statistische mechanica<br />

van Boltzmann, Maxwell en Gibbs), maar ook in<br />

nieuwe, opkomen<strong>de</strong> disciplines, zoals <strong>de</strong> soci-<br />

ale we<strong>te</strong>nschappen (Que<strong>te</strong>let en la<strong>te</strong>r Durkheim),<br />

<strong>de</strong> psychologie en vooral <strong>de</strong> biologie (evolutie-<br />

theorie, genetica, zoölogie), die eerst in nauwe<br />

wisselwerking met <strong>de</strong> statistiek tot bloei kwam.<br />

18<br />

STAtOR juli 2011|2<br />

De biometricus Pearson en (la<strong>te</strong>r) <strong>de</strong> men<strong>de</strong>liaan<br />

Fisher namen daar<strong>bij</strong> het voortouw. Ook nu is <strong>de</strong><br />

naam van Pearson nog s<strong>te</strong>eds verbon<strong>de</strong>n aan vele<br />

statistische inzich<strong>te</strong>n en metho<strong>de</strong>n: correlatie- en<br />

regresssie-analyse, <strong>de</strong> Chi-kwadraat goodness-of-<br />

fitness toets, aan <strong>te</strong>rmen als standaar<strong>de</strong>viatie en<br />

kurtosis en ui<strong>te</strong>raard aan zijn fundamen<strong>te</strong>le werk<br />

op het gebied van (families van) scheve ver<strong>de</strong>lin-<br />

gen.<br />

filosofie en statistiek<br />

Pearsons in<strong>te</strong>llectuele erfenis overstijgt <strong>de</strong> sta-<br />

tistiek in engere zin. Hij was evenzeer een veel-


zijdig en vernieuwend filosoof, die blijk gaf van<br />

een diepgaand inzicht in <strong>de</strong> wijsgerige kernpro-<br />

blemen die het tijdsgewricht waarin hij leef<strong>de</strong><br />

bepaal<strong>de</strong>n. Hij hield zich actief bezig met <strong>de</strong><br />

grondslagen van we<strong>te</strong>nschapsgebie<strong>de</strong>n als wis-<br />

kun<strong>de</strong>, natuurkun<strong>de</strong> en evolutietheorie, maar<br />

bewoog zich eveneens moei<strong>te</strong>loos op het <strong>te</strong>rrein<br />

van politieke filosofie en let<strong>te</strong>rkun<strong>de</strong>. Vooral zijn<br />

lijvige The Grammar of Science (GoS), dat hij op<br />

35-jarige leeftijd in 1892 publiceer<strong>de</strong>, biedt een<br />

rijk palet aan we<strong>te</strong>nschapsfilosofische thema’s;<br />

het inductieprobleem en causali<strong>te</strong>it, <strong>de</strong> relativi<strong>te</strong>it<br />

van ruim<strong>te</strong> en tijd, <strong>de</strong> ontologische status van <strong>de</strong><br />

werkelijkheid, evolutietheorie en ethiek. Het werk<br />

beleef<strong>de</strong> vele herdrukken en ken<strong>de</strong> zowel befaam-<br />

<strong>de</strong> bewon<strong>de</strong>raars (Eins<strong>te</strong>in) als <strong>te</strong>genstan<strong>de</strong>rs (<strong>de</strong><br />

filosoof C.S. Peirce).<br />

Filosofie en statistiek vormen <strong>bij</strong> Pearson<br />

bovendien twee zij<strong>de</strong>n van <strong>de</strong> zelf<strong>de</strong> medaille.<br />

Kennis van <strong>de</strong> aard van <strong>de</strong>ze verbon<strong>de</strong>nheid is dan<br />

ook onontbeerlijk voor een juis<strong>te</strong> waar<strong>de</strong>ring van<br />

zijn nala<strong>te</strong>nschap. Vooral GoS geldt als <strong>de</strong> sleu-<br />

<strong>te</strong>l tot zijn statistische werk. Kennistheoretisch<br />

betoont Pearson zich in GoS een uitgesproken<br />

empirist. Hij schaart zich daarmee in een alou<strong>de</strong><br />

Britse, anti-metafysische traditie (Bacon, Locke,<br />

Hume), die ook in <strong>de</strong> negentien<strong>de</strong> eeuw vele aan-<br />

hangers ken<strong>de</strong> en waarvan John Stuart Mill en<br />

Herbert Spencer <strong>de</strong> invloedrijks<strong>te</strong> waren.<br />

Anti-causalist<br />

Maar Pearson ging ver<strong>de</strong>r dan zijn illus<strong>te</strong>re land-<br />

geno<strong>te</strong>n en beken<strong>de</strong> zich tot <strong>de</strong> fenomenalisti-<br />

sche filosofie van zijn vroegere leermees<strong>te</strong>r Ernst<br />

Mach, volgens welke doctrine <strong>de</strong> werkelijkheid<br />

bestaat uit elemen<strong>te</strong>n (kleuren, trillingen, tij<strong>de</strong>n),<br />

die zich manifes<strong>te</strong>ren in een stroom van sense<br />

data of direc<strong>te</strong> gewaarwordingen. Deze zijn neu-<br />

traal (noch gees<strong>te</strong>lijk, noch ma<strong>te</strong>rieel) en vanuit<br />

<strong>de</strong>ze gewaarwordingen kunnen zowel ma<strong>te</strong>riële<br />

19<br />

STAtOR juli 2011|2<br />

objec<strong>te</strong>n als bewustzijnsinhou<strong>de</strong>n wor<strong>de</strong>n gecon-<br />

strueerd. De we<strong>te</strong>nschap moet geen verklaringen<br />

nastreven of causale mechanismen postuleren,<br />

maar heeft primair een <strong>de</strong>nkeconomische functie;<br />

<strong>de</strong> stroom van primaire sensaties moet zo goed<br />

mogelijk in kaart wor<strong>de</strong>n gebracht en samenge-<br />

vat in een overzich<strong>te</strong>lijke taal. Empirische gene-<br />

ralisaties, zoals Boyle’s gaswet, waren nog wel<br />

toegestaan, <strong>de</strong> in die tijd net opgekomen kineti-<br />

sche gastheorie ui<strong>te</strong>raard niet. Ook Pearson stond<br />

huiverachtig <strong>te</strong>genover het toekennen van een<br />

ontologische status aan begrippen die niet direct<br />

gekoppeld waren aan zintuiglijke waarnemingen,<br />

zoals niet-verifieerbare theoretische construc<strong>te</strong>n<br />

en hij verwierp het zoeken naar een diepere of<br />

hogere werkelijkheid die schuilgaat ach<strong>te</strong>r <strong>de</strong><br />

verschijnselen.<br />

Na of naast Bertrand Russell werd hij <strong>de</strong><br />

belangrijks<strong>te</strong> anti-causalist van zijn tijd; ook zijn<br />

<strong>bij</strong>dragen aan <strong>de</strong> correlatieanalyse moe<strong>te</strong>n in<br />

dit licht wor<strong>de</strong>n bezien. Daarnaast legt Pearson<br />

in GoS een s<strong>te</strong>rk positivistische, om niet <strong>te</strong> zeg-<br />

gen sciëntistische visie aan <strong>de</strong> dag. Hij s<strong>te</strong>lt een<br />

<strong>bij</strong>kans onbegrensd vertrouwen in <strong>de</strong> mo<strong>de</strong>rne<br />

we<strong>te</strong>nschap als regulerend mechanisme voor <strong>de</strong><br />

samenleving, dat van mensen volwaardige bur-<br />

gers moest maken en <strong>de</strong> staat op we<strong>te</strong>nschappe-<br />

lijke leest zou schoeien. De verwantschap met <strong>de</strong><br />

grondlegger van het positivisme, August Com<strong>te</strong><br />

is in <strong>de</strong>ze onmiskenbaar. Pearson combineert dit<br />

alles tot slot met een i<strong>de</strong>alistische, dat wil zeg-<br />

gen antima<strong>te</strong>rialistische filosofie over <strong>de</strong> aard<br />

van <strong>de</strong> (kenbare) werkelijkheid. Deze bestaat niet<br />

onafhankelijk van <strong>de</strong> menselijke geest en Pearson<br />

beschouwt we<strong>te</strong>nschap vooral als een classifica-<br />

tie en analyse van <strong>de</strong> inhoud van <strong>de</strong> geest. Haar<br />

domein wordt daarmee veeleer het bewustzijn<br />

dan een onafhankelijk hiervan gegeven ex<strong>te</strong>rne<br />

wereld.<br />

Het belang van <strong>de</strong> Pearsoniaanse revolutie<br />

voor <strong>de</strong> i<strong>de</strong>eëngeschie<strong>de</strong>nis ligt <strong>de</strong>els in <strong>de</strong> wijze<br />

waarop hij <strong>de</strong>ze wijsgerige inzich<strong>te</strong>n uitwerkt


in een constructieve statistische methodologie.<br />

Mins<strong>te</strong>ns zo belangrijk is daar<strong>bij</strong> dat zijn werk het<br />

sluitstuk vormt van een nieuw wereldbeeld, dat<br />

tot stand kwam aan het eind van <strong>de</strong> negentien<strong>de</strong><br />

eeuw. Filosofisch gezien <strong>te</strong>ken<strong>de</strong> zich in die eeuw<br />

een historisering van <strong>de</strong> werkelijkheid af, kwam<br />

tweeduizend jaar substantie<strong>de</strong>nken on<strong>de</strong>r druk <strong>te</strong><br />

staan en vond volgens <strong>de</strong> filosoof Ian Hacking een<br />

‘erosie van het <strong>de</strong><strong>te</strong>rminisme’ plaats.<br />

Daaraan vooraf ging ech<strong>te</strong>r een ruim twee-<br />

duizend jaar durend emancipatieproces van <strong>de</strong><br />

verwan<strong>te</strong> en weerbarstige begrippen variatie en<br />

veran<strong>de</strong>ring, waarmee filosofen, we<strong>te</strong>nschappers<br />

en wiskundigen van oudsher hebben gewors<strong>te</strong>ld.<br />

Dat begon al <strong>bij</strong> <strong>de</strong> Griekse natuurfilosofen, die<br />

een verklaring zoch<strong>te</strong>n voor <strong>de</strong> verschillen<strong>de</strong><br />

aspec<strong>te</strong>n van veran<strong>de</strong>ring: veran<strong>de</strong>ring van plaats<br />

(beweging), ontstaan en vergaan, veran<strong>de</strong>ring<br />

van hoedanigheid en hoeveelheid. Het bestaan<br />

ervan werd dikwijls ontkend, onmogelijk geacht<br />

of gereduceerd tot non-veran<strong>de</strong>ring. Variatie werd<br />

beschouwd als afwijking van een regel of norm,<br />

die in het gunstigs<strong>te</strong> geval moest wor<strong>de</strong>n ver-<br />

klaard. De noties ston<strong>de</strong>n voor onvolmaaktheid<br />

en onvoorspelbaarheid en wer<strong>de</strong>n soms zelf inco-<br />

herent geacht op logische en metafysische gron-<br />

<strong>de</strong>n (Parmeni<strong>de</strong>s). Met name <strong>de</strong> grilligheid van <strong>de</strong><br />

(leven<strong>de</strong>) natuur en <strong>de</strong> veelvuldigheid van haar<br />

verschijningsvormen vorm<strong>de</strong>n een obstakel voor<br />

een <strong>de</strong><strong>te</strong>rministisch wereldbeeld en ston<strong>de</strong>n een<br />

wiskundige bena<strong>de</strong>ring van <strong>de</strong> verschijnselen in<br />

<strong>de</strong> weg. Zelfs pioniers van <strong>de</strong> statistiek als Laplace<br />

(‘errorfuncties’) en Que<strong>te</strong>let (‘l’homme moyen’)<br />

kon<strong>de</strong>n er slechts enige greep op krijgen door <strong>de</strong><br />

gegevens in het keurslijf van <strong>de</strong> normale ver<strong>de</strong>-<br />

ling <strong>te</strong> dwingen.<br />

Inferentiële statistiek<br />

Me<strong>de</strong> door <strong>de</strong> evolutietheorie van Wallace en<br />

Darwin kreeg <strong>de</strong> opvatting dat variatie inherent<br />

20<br />

STAtOR juli 2011|2<br />

is aan <strong>de</strong> natuur en <strong>de</strong> aar<strong>de</strong> een lange geschie<strong>de</strong>-<br />

nis van veran<strong>de</strong>ring kent, vas<strong>te</strong> grond on<strong>de</strong>r <strong>de</strong><br />

voe<strong>te</strong>n. Galton, onvermoeibaar pleitbezorger voor<br />

mathematisering van <strong>de</strong> we<strong>te</strong>nschap, overtuig<strong>de</strong><br />

zijn vriend Pearson dat variatie zich wel <strong>de</strong>gelijk<br />

voor een wiskundige behan<strong>de</strong>ling leen<strong>de</strong>, zon-<br />

<strong>de</strong>r pejoratieve duidingen van afwijkingen, error-<br />

functies, etce<strong>te</strong>ra. Pearson <strong>de</strong>ed daaraan recht<br />

door <strong>de</strong> variatie niet <strong>te</strong> i<strong>de</strong>ntificeren in ‘errors’,<br />

maar in <strong>de</strong> verschijnselen zelf (geco<strong>de</strong>erd in data),<br />

en <strong>te</strong>rug <strong>te</strong> voeren tot verschillen<strong>de</strong> (klassen van)<br />

kansver<strong>de</strong>lingen.<br />

Een cruciale stap zet<strong>te</strong> hij met zijn vroege<br />

werk over scheve ver<strong>de</strong>lingen. Op basis van gro<strong>te</strong><br />

aantallen door Galton verzamel<strong>de</strong> (biometrische)<br />

data zag hij in dat vele verschijnselen niet nor-<br />

maal, doch scheef waren ver<strong>de</strong>eld en met behulp<br />

van vier parame<strong>te</strong>rs (gemid<strong>de</strong>l<strong>de</strong>, standaardaf-<br />

wijking, scheefheid en welving) kon<strong>de</strong>n wor<strong>de</strong>n<br />

beschreven en geclassificeerd. Volgens Pearson<br />

kon zelfs <strong>de</strong> eenheid van <strong>de</strong> we<strong>te</strong>nschappen wor-<br />

<strong>de</strong>n gevon<strong>de</strong>n in <strong>de</strong>ze constructieve, zij het zeer<br />

arbeidsin<strong>te</strong>nsieve metho<strong>de</strong>. De variabili<strong>te</strong>it in <strong>de</strong><br />

natuur manifes<strong>te</strong>er<strong>de</strong> zich in een pun<strong>te</strong>nwolk van<br />

metingen en Pearson zocht naar het ‘best fitting’<br />

mo<strong>de</strong>l, <strong>de</strong> functie die het bes<strong>te</strong> pas<strong>te</strong> <strong>bij</strong> <strong>de</strong> data;<br />

veeleer een zuinige beschrijving, dan een causaal,<br />

on<strong>de</strong>rliggend mechanisme waardoor <strong>de</strong>ze data<br />

waren gegenereerd. Als eers<strong>te</strong> gaf hij daarmee<br />

kansver<strong>de</strong>lingen een volwaardige plaats in <strong>de</strong><br />

we<strong>te</strong>nschap en open<strong>de</strong> hij <strong>de</strong> <strong>de</strong>ur naar inferen-<br />

tiële statistiek.<br />

Pearson zag <strong>de</strong> wereld op een niveau van<br />

abstractie waar<strong>bij</strong> data, variatie in data, datage-<br />

nereren<strong>de</strong> mechanismen en parame<strong>te</strong>rs van <strong>de</strong><br />

ver<strong>de</strong>lingen <strong>de</strong> werkelijkheid veeleer co<strong>de</strong>ren en<br />

opbouwen en niet zozeer een (vermeen<strong>de</strong>) fysi-<br />

sche werkelijkheid represen<strong>te</strong>ren of afbeel<strong>de</strong>n.<br />

Ges<strong>te</strong>und door zijn macheaanse en i<strong>de</strong>alistische<br />

filosofie in<strong>te</strong>rpre<strong>te</strong>er<strong>de</strong> hij zijn kansver<strong>de</strong>lingen<br />

op een welhaast Pythagoreïsche manier, al werd<br />

Pearsons universum niet gerealiseerd door getal-


len, getalsverhoudingen en getallentypen, maar<br />

door kansver<strong>de</strong>lingen met <strong>bij</strong>behoren<strong>de</strong> para-<br />

me<strong>te</strong>rs en vorm<strong>de</strong>n <strong>de</strong> pun<strong>te</strong>nwolken <strong>de</strong> objec-<br />

<strong>te</strong>n van <strong>de</strong> we<strong>te</strong>nschap. Het wereldbeeld verloor<br />

weliswaar veel van zijn direc<strong>te</strong> aanschouwelijk-<br />

heid, maar paradoxaal genoeg was <strong>de</strong> werkelijk-<br />

heid als statistische ver<strong>de</strong>ling in macheaanse zin<br />

‘waarneembaar’, dicht<strong>bij</strong> <strong>de</strong> gegevens, kenbaar;<br />

een beschrijving van <strong>de</strong> fei<strong>te</strong>lijke data, een gro<strong>te</strong>,<br />

maar eindige <strong>de</strong>elverzameling van <strong>de</strong> verzame-<br />

ling van alle mogelijke metingen, alleen beschik-<br />

baar in een ‘i<strong>de</strong>ale’ situatie. Zolang <strong>de</strong>ze <strong>de</strong>elver-<br />

zameling groot genoeg was zou<strong>de</strong>n <strong>de</strong> bereken<strong>de</strong><br />

‘parame<strong>te</strong>rs’ <strong>de</strong>zelf<strong>de</strong> zijn als die van <strong>de</strong> gehele<br />

verzameling.<br />

Voor zover Pearson een concept van statisti-<br />

sche inferentie ken<strong>de</strong>, was dit vooral gebaseerd<br />

op het i<strong>de</strong>e van <strong>de</strong> goodness-of-fit. Van daad-<br />

werkelijk significance <strong>te</strong>sting of maximum like-<br />

lihood estimation, of zelfs van een volwassen<br />

statistisch mo<strong>de</strong>lbegrip is dan ui<strong>te</strong>raard nog geen<br />

sprake. Daartoe dien<strong>de</strong>n an<strong>de</strong>re wegen <strong>te</strong> wor<strong>de</strong>n<br />

ingeslagen. Dat <strong>de</strong>ed <strong>bij</strong> voorbeeld Pearsons jon-<br />

gere <strong>te</strong>genstrever Fisher, die niet werd beperkt<br />

door macheaanse doctrines en dieper in het<br />

Pythagoreïsche universum schouw<strong>de</strong>. Voor hem<br />

was <strong>de</strong> werkelijkheid een abstrac<strong>te</strong> wiskundige<br />

ver<strong>de</strong>ling, niet waarneembaar of samenvallend<br />

met <strong>de</strong> gegevens, welke slechts een (aselec<strong>te</strong>)<br />

s<strong>te</strong>ekproef vorm<strong>de</strong>n, met een eigen ver<strong>de</strong>ling.<br />

Waarheid was een vas<strong>te</strong>, maar onbeken<strong>de</strong>, popu-<br />

latiegrootheid en kon slechts wor<strong>de</strong>n geschat.<br />

Eers<strong>te</strong> filosoof van <strong>de</strong> statistiek<br />

Het is opmerkelijk dat Pearsons werk in <strong>de</strong> mo<strong>de</strong>r-<br />

ne epis<strong>te</strong>mologie allerminst tot <strong>de</strong> canon behoort.<br />

Allereerst was Pearson een wegberei<strong>de</strong>r van het<br />

logisch positivisme dat in <strong>de</strong> jaren twintig van <strong>de</strong><br />

vorige eeuw in Wenen en Berlijn opkwam. Boven-<br />

dien domineert in <strong>de</strong> con<strong>te</strong>mporaine we<strong>te</strong>n-<br />

21<br />

STAtOR juli 2011|2<br />

schapsfilosofie <strong>de</strong> ‘probabilistische invalshoek’.<br />

Waarschijnlijkheids-mo<strong>de</strong>llen spelen een cruciale<br />

rol in mo<strong>de</strong>rne bena<strong>de</strong>ringen van causali<strong>te</strong>it, in<br />

het We<strong>te</strong>nschappelijk Realisme Debat, en ui<strong>te</strong>r-<br />

aard in <strong>de</strong> (Bayesiaanse) confirmatietheorie, die<br />

al <strong>de</strong>cennia lang een toonaangevend paradigma<br />

vormt binnen <strong>de</strong> kennisleer. Klassieke filosofische<br />

vragen wor<strong>de</strong>n in probabilistische <strong>te</strong>rmen geduid.<br />

Kernvragen als: Wat is <strong>de</strong> werkelijkheid? Bestaat<br />

<strong>de</strong>ze onafhankelijk van <strong>de</strong> geest? Hebben we er<br />

toegang toe? Zo, ja, hoe? Kunnen we er ware uit-<br />

spraken over doen? Zo ja, wat is waarheid en hoe<br />

is <strong>de</strong>ze verbon<strong>de</strong>n met <strong>de</strong> werkelijkheid?<br />

Pearson was <strong>de</strong> eers<strong>te</strong> statisticus die ant-<br />

woor<strong>de</strong>n voors<strong>te</strong>l<strong>de</strong> op al <strong>de</strong>ze vragen, die hij<br />

combineer<strong>de</strong> met een constructieve statistische<br />

methodologie. Juist omdat hij zich bewoog op het<br />

snijvlak van statistiek, filosofie en methodologie<br />

werd hij fei<strong>te</strong>lijk <strong>de</strong> eers<strong>te</strong> filosoof van <strong>de</strong> statis-<br />

tiek. Immers, <strong>de</strong> filosoof van <strong>de</strong> statistiek zal nieu-<br />

we statistische theorieën en paradigma’s altijd<br />

trach<strong>te</strong>n <strong>te</strong> verankeren in <strong>de</strong>ze kernvragen en ze<br />

(me<strong>de</strong>) beschouwen en beoor<strong>de</strong>len als pogingen<br />

om <strong>de</strong>ze <strong>te</strong> beantwoor<strong>de</strong>n. Pearson stond niet<br />

alleen. Wellicht min<strong>de</strong>r expliciet, maar niet min-<br />

<strong>de</strong>r doorwrocht gaf <strong>de</strong> generatie na hem (Fisher,<br />

Jerzy Neyman en Egon Pearson, Bayesianen als<br />

Savage en De Finetti) zich rekenschap van <strong>de</strong>ze<br />

kwesties. De ‘Science of Data’ begon met <strong>de</strong> vraag<br />

naar <strong>de</strong> aard en status van data en vooral naar <strong>de</strong><br />

relatie met <strong>de</strong> werkelijkheid, waaraan zij toch op<br />

<strong>de</strong> een of an<strong>de</strong>re manier ontleend zijn, van waar-<br />

uit zij zijn gegenereerd, die zij moe<strong>te</strong>n represen<strong>te</strong>-<br />

ren, bena<strong>de</strong>ren, co<strong>de</strong>ren, simuleren, vervangen of<br />

wellicht zelfs overbodig maken; zulks afhankelijk<br />

van <strong>de</strong> ingenomen filosofische positie.<br />

Richard Starmans is verbon<strong>de</strong>n aan <strong>de</strong> Facul<strong>te</strong>it<br />

Bètawe<strong>te</strong>nschappen (Department of Information and<br />

Computing Sciences) van <strong>de</strong> Universi<strong>te</strong>it Utrecht. Hij<br />

doet on<strong>de</strong>rzoek op het snijvlak van filosofie, statistiek en<br />

informatica.<br />

E-mail:


RECHTSTREEKS VERWACHTINGEN EVALUEREN OF DE NUL HYPOTHESE TOETSEN?<br />

Rens van <strong>de</strong> Schoot<br />

In <strong>de</strong> we<strong>te</strong>nschappelijke li<strong>te</strong>ratuur wordt door<br />

vrijwel alle on<strong>de</strong>rzoekers klassieke nul hypothese<br />

toetsing (NHT) gebruikt om antwoord <strong>te</strong> geven op<br />

<strong>de</strong> on<strong>de</strong>rzoeksvraag. NHT hoeft ech<strong>te</strong>r niet per se<br />

<strong>de</strong> bes<strong>te</strong> keuze <strong>te</strong> zijn om <strong>de</strong> on<strong>de</strong>rzoeksvraag <strong>te</strong><br />

beantwoor<strong>de</strong>n. In dit artikel laat ik zien waarom<br />

en introduceer ik vervolgens een recent ontwikkel<strong>de</strong><br />

metho<strong>de</strong> die een veelbelovend al<strong>te</strong>rnatief<br />

biedt, namelijk Bayesiaanse Mo<strong>de</strong>l Selectie (BMS).<br />

Informatieve hypothesen<br />

On<strong>de</strong>rzoekers hebben vaak bepaal<strong>de</strong> verwachtingen<br />

over hoe <strong>de</strong> werkelijkheid er uit ziet. Verwachtingen<br />

en hypothesen kunnen gebaseerd zijn op<br />

eer<strong>de</strong>r (li<strong>te</strong>ratuur-) on<strong>de</strong>rzoek, of we<strong>te</strong>nschappelijk<br />

<strong>de</strong>bat. Het doel van veel on<strong>de</strong>rzoekers is het<br />

evalueren van <strong>de</strong>ze verwachtingen om <strong>te</strong> bepalen<br />

welke <strong>de</strong> bes<strong>te</strong> is. Met an<strong>de</strong>re woor<strong>de</strong>n, welke<br />

verwachting <strong>de</strong> mees<strong>te</strong> s<strong>te</strong>un krijgt van <strong>de</strong> verzamel<strong>de</strong><br />

data. Verwachtingen zijn geformuleerd<br />

in <strong>te</strong>rmen van wat ik informatieve hypothesen<br />

noem. Dit omdat er a priori, dat is voordat er data<br />

zijn verzameld, informatie bestaat over <strong>bij</strong>voorbeeld<br />

<strong>de</strong> or<strong>de</strong>ning tussen twee (of meer) groepsgemid<strong>de</strong>l<strong>de</strong>n<br />

gebaseerd op een eer<strong>de</strong>r gepubliceerd<br />

artikel: HA : μ1 < μ2 < μ3 < μ4 , waar<strong>bij</strong> het <strong>te</strong>ken ‘


traditionele p-waar<strong>de</strong> gebruikt om <strong>de</strong>ze <strong>te</strong> ver-<br />

werpen of niet <strong>te</strong> verwerpen. Het omslagpunt van<br />

<strong>de</strong>ze beslissing ligt meestal <strong>bij</strong> <strong>de</strong> welbeken<strong>de</strong><br />

waar<strong>de</strong> van p < ,05. Deze drempelwaar<strong>de</strong> van ,05 is<br />

niet alleen willekeurig gekozen, maar laat alleen<br />

ruim<strong>te</strong> voor <strong>de</strong> conclusie dat een nul hypothese<br />

wel of niet wordt verworpen met niks daar tus-<br />

senin. Dit kan lei<strong>de</strong>n tot vreem<strong>de</strong> <strong>beslissingen</strong>,<br />

<strong>bij</strong>voorbeeld in het geval dat p = ,051 of p = ,049.<br />

Het mag dui<strong>de</strong>lijk zijn dat bei<strong>de</strong> situaties niet<br />

veel van elkaar verschillen. En toch wordt H 0 in<br />

het eers<strong>te</strong> geval niet verworpen en in het twee<strong>de</strong><br />

geval wel.<br />

Wanneer H 0 wordt verworpen, we<strong>te</strong>n we<br />

eigenlijk nog s<strong>te</strong>eds niks over <strong>de</strong> informatieve<br />

hypothesen H A en H B , aangezien <strong>de</strong> al<strong>te</strong>rnatieve<br />

hypothese geen informatie bevat<strong>te</strong> over <strong>de</strong> or<strong>de</strong>-<br />

ning tussen <strong>de</strong> gemid<strong>de</strong>l<strong>de</strong>n. <strong>Hoe</strong> kan een on<strong>de</strong>r-<br />

zoeker dan toch uitspraken doen over <strong>de</strong> informa-<br />

tieve hypothesen?<br />

Kan het ook an<strong>de</strong>rs?<br />

Om erach<strong>te</strong>r <strong>te</strong> komen welke van een set van<br />

informatieve hypothesen het meest waarschijn-<br />

lijk is, gaan we <strong>de</strong>ze direct <strong>te</strong>gen elkaar afzet<strong>te</strong>n<br />

met behulp van Bayes Factors (BFs). BFs zijn een<br />

mo<strong>de</strong>l selectie maat en hou<strong>de</strong>n niet alleen reke-<br />

ning met hoe goed <strong>de</strong> hypothese <strong>bij</strong> <strong>de</strong> data past,<br />

maar ook hoe complex <strong>de</strong> hypothese is. Dit resul-<br />

<strong>te</strong>ert in een direc<strong>te</strong> vergelijking tussen <strong>de</strong> on<strong>de</strong>r-<br />

zoch<strong>te</strong> hypotheses. Een BF van 10 be<strong>te</strong>kent dat H A<br />

tien keer zo veel s<strong>te</strong>un van <strong>de</strong> data krijgt dan H B<br />

23<br />

STAtOR juli 2011|2<br />

en een BF van 1 be<strong>te</strong>kent dat bei<strong>de</strong> hypotheses<br />

even veel s<strong>te</strong>un van <strong>de</strong> data krijgen.<br />

Er is diverse software voor het uitvoeren van<br />

(M)AN(C)OVA’s, multipele multivaria<strong>te</strong> regressie<br />

analyse, kruistabel analyse, en la<strong>te</strong>n<strong>te</strong> klasse ana-<br />

lyse met BMS (zie www.fss.uu.nl/ms/informati-<br />

vehypothesis voor <strong>de</strong> gratis <strong>te</strong> downloa<strong>de</strong>n soft-<br />

ware). De gebruiker hoeft alleen <strong>de</strong> hypothesen<br />

<strong>te</strong> specificeren in <strong>te</strong>rmen van restricties tussen <strong>de</strong><br />

statistische parame<strong>te</strong>rs, zoals μ 1 < μ 2 , en <strong>de</strong> data-<br />

set aan <strong>te</strong> leveren, en <strong>de</strong> software levert <strong>de</strong> BFs<br />

automatisch uit. La<strong>te</strong>n we nu met een inhou<strong>de</strong>lijk<br />

voorbeeld bekijken hoe BMS werkt.<br />

Voorbeeld<br />

Merkwaardig genoeg is het ren<strong>de</strong>ment van door<br />

NWO toegeken<strong>de</strong> promotiesubsidies in Ne<strong>de</strong>rland<br />

tot nu toe niet on<strong>de</strong>rzocht. In een recent gepubli-<br />

ceer<strong>de</strong> artikel on<strong>de</strong>rzoch<strong>te</strong>n Van <strong>de</strong> Schoot, Sonne-<br />

veld en Lockhorst (2011) het al dan niet succesvolle<br />

verloop van <strong>de</strong> promotietrajec<strong>te</strong>n waarvoor in<br />

<strong>de</strong> jaren 1999 tot en met 2001 <strong>bij</strong> Maatschappij-<br />

en Gedragswe<strong>te</strong>nschappen een subsidieaanvraag<br />

werd ingediend die werd gehonoreerd. Succesvol<br />

staat hier voor: <strong>de</strong> bes<strong>te</strong>ding van <strong>de</strong> subsidie werd<br />

bekroond met <strong>de</strong> ver<strong>de</strong>diging van het proefschrift<br />

voor sep<strong>te</strong>mber 2010. Er werd een on<strong>de</strong>rscheid<br />

gemaakt tussen projec<strong>te</strong>n waarin <strong>de</strong> promovendi<br />

in een kleiner programmatisch verband werk<strong>te</strong>n<br />

(met collegae al dan niet op <strong>de</strong>zelf<strong>de</strong> werkplek) en<br />

individuele projec<strong>te</strong>n die men als stand alone zou<br />

kunnen beschouwen.<br />

n gepromoveerd niet-gepromoveerd ren<strong>de</strong>ment<br />

Totaal programma-projec<strong>te</strong>n 112 87 25 77,7%<br />

Individueel project 107 96 11 89,7%<br />

Tabel 1. Subsidieren<strong>de</strong>ment uitgesplitst naar ‘individueel project’/‘project <strong>de</strong>el uitmakend van het programma’


Er waren twee hypothesen geformuleerd:<br />

H 1 : er zijn procentueel evenveel succesvol<br />

afgeron<strong>de</strong> projec<strong>te</strong>n <strong>bij</strong> individuele subsi-<br />

dies als <strong>bij</strong> programmatische subsidies.<br />

Versus<br />

H 2 : er zijn relatief meer succesvol afgeron<strong>de</strong><br />

projec<strong>te</strong>n <strong>bij</strong> individuele subsidies dan <strong>bij</strong><br />

programmatische subsidies.<br />

Merk op dat <strong>de</strong> on<strong>de</strong>rzoekers in dit geval wel <strong>de</strong>ge-<br />

lijk waren geïn<strong>te</strong>resseerd in <strong>de</strong> nul hypothese,<br />

met als kant<strong>te</strong>kening dat BMS veron<strong>de</strong>rs<strong>te</strong>lt dat<br />

het verschil niet precies nul is, maar ongeveer nul.<br />

Uit <strong>de</strong> databestan<strong>de</strong>n van NWO is een lijst<br />

samenges<strong>te</strong>ld van alle promotieprojec<strong>te</strong>n waar-<br />

voor in <strong>de</strong> jaren 1999 tot en met 2001 een subsi-<br />

dieaanvraag werd gehonoreerd. Zie tabel 1 voor <strong>de</strong><br />

percentages geslaagd dan wel gefaald op <strong>de</strong> peil-<br />

datum. Er bestaat een on<strong>de</strong>rver<strong>te</strong>genwoordiging<br />

van programmatische subsidies <strong>bij</strong> het totaal<br />

aantal geslaag<strong>de</strong> projec<strong>te</strong>n. Maar is dit verschil<br />

ook significant en/of relevant?<br />

De klassieke metho<strong>de</strong> om <strong>de</strong>ze vraag <strong>te</strong> beant-<br />

woor<strong>de</strong>n is om een chi-kwadraat toets uit <strong>te</strong><br />

voeren. Dan blijkt dat er een significant verschil<br />

bestaat tussen geobserveer<strong>de</strong> en verwach<strong>te</strong> waar-<br />

<strong>de</strong>s, X2 1, 219 = 8,31; p = ,004. Aangezien het hieruit<br />

nog niet dui<strong>de</strong>lijk wordt waar precies <strong>de</strong> verschil-<br />

len zit<strong>te</strong>n, hebben we ook BMS gebruikt om <strong>de</strong><br />

hypotheses direct af <strong>te</strong> zet<strong>te</strong>n <strong>te</strong>gen elkaar. Uit<br />

<strong>de</strong>ze analyse blijkt dat <strong>de</strong> twee<strong>de</strong> hypothese 28<br />

keer zoveel s<strong>te</strong>un van <strong>de</strong> data krijgt als <strong>de</strong> eers<strong>te</strong><br />

hypothese. Of<strong>te</strong>wel, er is veel s<strong>te</strong>un in <strong>de</strong> data<br />

voor <strong>de</strong> hypothese dat er relatief meer succesvol<br />

afgeron<strong>de</strong> projec<strong>te</strong>n zijn <strong>bij</strong> individuele subsidies<br />

dan <strong>bij</strong> programmatische subsidies.<br />

Conclusie<br />

De resulta<strong>te</strong>n van nul hypothese toetsting geven<br />

vaak geen direct antwoord op <strong>de</strong> on<strong>de</strong>rzoeksvraag.<br />

24<br />

STAtOR juli 2011|2<br />

Informatieve hypothesen kunnen niet direct met<br />

elkaar vergeleken wor<strong>de</strong>n, iets dat met Bayesi-<br />

aanse Mo<strong>de</strong>l Selectie wel kan. Ook wanneer <strong>de</strong><br />

or<strong>de</strong>ning van <strong>de</strong> groepsgemid<strong>de</strong>l<strong>de</strong>n niet geheel<br />

overeen komt met één van <strong>de</strong> hypothesen, geeft<br />

BMS een in<strong>te</strong>rpre<strong>te</strong>erbaar resultaat. Zelfs <strong>bij</strong> veel<br />

complexere on<strong>de</strong>rzoeksvragen dan in dit artikel<br />

besproken, <strong>bij</strong>voorbeeld met meer<strong>de</strong>re (on)afhan-<br />

kelijke variabelen, meer<strong>de</strong>re meetmomen<strong>te</strong>n over<br />

<strong>de</strong> tijd heen, covaria<strong>te</strong>n, meer groepen, enz., geeft<br />

BMS nog s<strong>te</strong>eds een enkel in<strong>te</strong>rpre<strong>te</strong>erbaar getal<br />

per hypothese. BMS resul<strong>te</strong>ert dus in makkelijker<br />

<strong>te</strong> in<strong>te</strong>rpre<strong>te</strong>ren resulta<strong>te</strong>n dan NHT en geeft<br />

bovendien een direct antwoord op <strong>de</strong> on<strong>de</strong>rzoeks-<br />

vraag. BMS is daardoor een veelbelovend al<strong>te</strong>rna-<br />

tief voor NHT en zal s<strong>te</strong>eds vaker opduiken in <strong>de</strong><br />

we<strong>te</strong>nschappelijk li<strong>te</strong>ratuur.<br />

Het artikel is gro<strong>te</strong>n<strong>de</strong>els gebaseerd op het proefschrift<br />

van <strong>de</strong> au<strong>te</strong>ur en <strong>de</strong> genoem<strong>de</strong> li<strong>te</strong>ratuur.<br />

Li<strong>te</strong>ratuur<br />

Hoijtink, H., Klugkist, I., & Boelen, P. A. (Eds.). (2008).<br />

Bayesian evaluation of informative hypotheses in<br />

psychology. New-York: Springer.<br />

Van <strong>de</strong> Schoot, R., Hoijtink, H. & Doosje, S. (2009).<br />

Rechtstreeks Verwachtingen Evalueren of <strong>de</strong> Nul<br />

Hypothese Toetsen? Nul Hypothese Toetsing versus<br />

Bayesiaanse Mo<strong>de</strong>l Selectie. De Psycholoog 4, 196-203.<br />

Van <strong>de</strong> Schoot, R., Hoijtink, H., Mul<strong>de</strong>r, J., Van Aken, M. A. G.,<br />

Orobio <strong>de</strong> Castro, B., Meeus, W. & Romeijn, J.-W. (2011).<br />

Evaluating Expectations about Negative Emotional<br />

Sta<strong>te</strong>s of Aggressive Boys using Bayesian Mo<strong>de</strong>l<br />

Selection. Developmental Psychology, 47, 203-212<br />

Van <strong>de</strong> Schoot, R., Hoijtink, H., & Romeijn, J-W (2011).<br />

Moving beyond traditional null hypothesis <strong>te</strong>sting:<br />

Evaluating expectations directly. Frontiers in<br />

Quantitative Psychology and Measurement, 2:24. doi:<br />

10.3389/fpsyg.2011.00024<br />

Van <strong>de</strong> Schoot. R., Sonneveld, H., & Lockhorst, D. (2011).<br />

Het lot van promotieprojec<strong>te</strong>n: Ren<strong>de</strong>ment van<br />

magw/nwo-subsidies. De Psycholoog, 4, 10-18.<br />

Rens van <strong>de</strong> Schoot is als universitair docent verbon<strong>de</strong>n<br />

aan <strong>de</strong> Facul<strong>te</strong>it Sociale We<strong>te</strong>nschappen (af<strong>de</strong>ling<br />

Metho<strong>de</strong>n en Statistiek) van <strong>de</strong> Universi<strong>te</strong>it Utrecht<br />

E-mail:


Fred S<strong>te</strong>u<strong>te</strong>l c o l u m n<br />

wORDS, wORDS<br />

De combinatie statistiek en taal heeft een lange<br />

traditie. Het begon misschien met Markov, die<br />

het – na<strong>de</strong>rhand – naar hem genoem<strong>de</strong> begrip<br />

Markov-ke<strong>te</strong>n ontwikkel<strong>de</strong> aan <strong>de</strong> hand van <strong>de</strong><br />

opeenvolging van let<strong>te</strong>rs in een bekend Russisch<br />

gedicht. Wat la<strong>te</strong>r werd door statistici <strong>de</strong> frequentie<br />

van let<strong>te</strong>rs in <strong>te</strong>ks<strong>te</strong>n geturfd en geanalyseerd. De<br />

mo<strong>de</strong>rne <strong>te</strong>chniek biedt nieuwe mogelijkhe<strong>de</strong>n.<br />

Mijn vrouw en ik lossen ie<strong>de</strong>re week het Scryptogram<br />

in NRC Han<strong>de</strong>lsblad op. We <strong>gebruiken</strong><br />

daar<strong>bij</strong> soms een woor<strong>de</strong>nboek; om <strong>te</strong> kijken of<br />

een bedacht woord bestaat of om <strong>te</strong> zoeken naar<br />

woor<strong>de</strong>n die, <strong>bij</strong> voorbeeld, met ‘boer’ beginnen.<br />

In ui<strong>te</strong>rs<strong>te</strong> nood <strong>gebruiken</strong> wij een mo<strong>de</strong>rn<br />

wapen: <strong>de</strong> Dikke Van Dale op dvd. Die heeft een<br />

optie ’zoeken op woord(vormen)’. Daar kun je een<br />

woord invullen, waar<strong>bij</strong> <strong>de</strong> nog ontbreken<strong>de</strong> let<strong>te</strong>rs<br />

door vraag<strong>te</strong>kens zijn vervangen. Voorbeeld:<br />

‘?st???s?’. In dit geval is er maar één oplossing:<br />

‘as<strong>te</strong>risk’. Als je al flink wat let<strong>te</strong>rs hebt, is het<br />

aantal mogelijkhe<strong>de</strong>n niet meer dan enkele tientallen;<br />

als je weinig let<strong>te</strong>rs hebt, zijn er soms<br />

hon<strong>de</strong>r<strong>de</strong>n mogelijkhe<strong>de</strong>n. Een enkele keer, als je<br />

een fout gemaakt hebt of als <strong>de</strong> puzzelmaker een<br />

woord gebruikt dat Van Dale niet kent, krijg je <strong>de</strong><br />

me<strong>de</strong><strong>de</strong>ling ‘Er zijn geen artikelen met <strong>de</strong> door u<br />

gezoch<strong>te</strong> vorm’.<br />

Als je nog veel vraag<strong>te</strong>kens hebt, zijn er heel<br />

veel manieren om een woord <strong>te</strong> maken. Dat opent<br />

<strong>de</strong> mogelijkheid – wiskundigen zoeken graag<br />

naar extreme situaties – om het aantal woor<strong>de</strong>n<br />

<strong>te</strong> vin<strong>de</strong>n met een gegeven aantal let<strong>te</strong>rs. Dat<br />

gaat als volgt. Je tikt zeven vraag<strong>te</strong>kens, drukt op<br />

‘En<strong>te</strong>r’ en vindt 17.318 woor<strong>de</strong>n van zeven let<strong>te</strong>rs,<br />

van ‘aaibaar’ tot en met ‘zygenen’. Dat laats<strong>te</strong><br />

woord be<strong>te</strong>kent ‘gro<strong>te</strong> familie van vlin<strong>de</strong>rs, waartoe<br />

o.a. <strong>de</strong> sint-jansvlin<strong>de</strong>r behoort (Zygaenidae)’.<br />

Zo kunnen we <strong>de</strong> woor<strong>de</strong>n van alle mogelijke<br />

leng<strong>te</strong>n afwerken. Alleen, <strong>bij</strong> woor<strong>de</strong>n van drie of<br />

min<strong>de</strong>r let<strong>te</strong>rs bestaan veel van <strong>de</strong> resulta<strong>te</strong>n uit<br />

afkortingen, en <strong>bij</strong> woor<strong>de</strong>n met heel veel let<strong>te</strong>rs<br />

zijn <strong>de</strong> resulta<strong>te</strong>n vaak samens<strong>te</strong>llingen van meer<br />

dan één woord. Tussen <strong>de</strong>ze extremen in is het<br />

in<strong>te</strong>ressant. Het langs<strong>te</strong> ech<strong>te</strong> woord dat ik vond<br />

heeft 31 let<strong>te</strong>rs (hier<strong>bij</strong> geldt <strong>de</strong> ij als één let<strong>te</strong>r):<br />

me<strong>de</strong>verantwoor<strong>de</strong>lijkheidsheffing.<br />

Eén van <strong>de</strong> vragen die je kunt s<strong>te</strong>llen is: ‘Van<br />

welke leng<strong>te</strong> zijn er <strong>de</strong> mees<strong>te</strong> woor<strong>de</strong>n?’ Van Dale<br />

geeft <strong>bij</strong> ie<strong>de</strong>re leng<strong>te</strong> braaf het aantal woor<strong>de</strong>n, en<br />

het blijkt dat woor<strong>de</strong>n van tien let<strong>te</strong>rs het meest<br />

voorkomen; <strong>de</strong> leng<strong>te</strong>n 9, 10 en 11 leveren ach<strong>te</strong>reenvolgens<br />

32789, 33549 en 29398 woor<strong>de</strong>n. Zit hier<br />

nog een soort mo<strong>de</strong>l ach<strong>te</strong>r? Je kunt je voors<strong>te</strong>llen<br />

dat het aantal let<strong>te</strong>rs dat een woord <strong>te</strong>lt ongeveer<br />

een Poisson-ver<strong>de</strong>ling heeft met een gemid<strong>de</strong>l<strong>de</strong><br />

van 10. Omdat het totaal aantal woor<strong>de</strong>n in <strong>de</strong><br />

Dikke Van Dale ongeveer 240.000 is, komen <strong>de</strong><br />

fracties woor<strong>de</strong>n met respectievelijk 9, 10 en 11 let<strong>te</strong>rs<br />

uit op 0,1366; 0,1398 en 0,1225. Dat komt goed<br />

overeen met <strong>de</strong> kansen op 8, 9 en 10 in een Poissonver<strong>de</strong>ling<br />

met gemid<strong>de</strong>l<strong>de</strong> 9,5. Het aantal let<strong>te</strong>rs in<br />

een woord is natuurlijk mins<strong>te</strong>ns een, en dat aantal<br />

komt dan goed overeen met ‘één plus een Poissonver<strong>de</strong>el<strong>de</strong><br />

grootheid met gemid<strong>de</strong>l<strong>de</strong> 9,5’.<br />

Maar, <strong>de</strong> taal laat zich gelukkig slechts zeer <strong>te</strong>n<br />

<strong>de</strong>le in getallen vangen.<br />

Fred S<strong>te</strong>u<strong>te</strong>l is emeritus hoogleraar kansrekening aan<br />

<strong>de</strong> TU Eindhoven. E-mail: <br />

25<br />

STAtOR juli 2011|2


Generalized reliability<br />

in industriële user studies<br />

Jan Engel<br />

Love is the total absence of fear. Love asks no<br />

questions. Its natural sta<strong>te</strong> is one of ex<strong>te</strong>nsion<br />

and expansion, not comparison and<br />

measurement. – Gerald Jampolsky<br />

Ech<strong>te</strong>r, in alle an<strong>de</strong>re gevallen dan lief<strong>de</strong>, zullen<br />

we toch wel me<strong>te</strong>n. En dat niet alleen: het trekken<br />

van conclusies omtrent <strong>de</strong> werkelijkheid gaat het<br />

bes<strong>te</strong> als we ook precies genoeg kunnen me<strong>te</strong>n.<br />

Maar wat is precies genoeg? In dit artikel gaan<br />

we er van uit dat we in een industriële user studie<br />

een vergelijking willen maken tussen verschillen<strong>de</strong><br />

condities, <strong>bij</strong>voorbeeld tussen verschillen<strong>de</strong><br />

produc<strong>te</strong>n. Dit wordt gedaan door participan<strong>te</strong>n<br />

in een meetpanel die hun beoor<strong>de</strong>lingen vastleggen<br />

in een of meer meetschalen.<br />

Precies genoeg is dan in dit geval: kunnen <strong>de</strong><br />

participan<strong>te</strong>n voldoen<strong>de</strong> goed on<strong>de</strong>rscheid maken<br />

tussen <strong>de</strong> condities? Doen ze dat consis<strong>te</strong>nt?<br />

Dit artikel heeft <strong>de</strong> volgen<strong>de</strong> opbouw. Na<br />

een introductie van het begrip ‘reliability’ uit <strong>de</strong><br />

psychometrie zullen we dit generaliseren naar<br />

een versie die bruikbaar is voor het bepalen van<br />

meetprecisie in user studies, een generalized<br />

reliability die we G-reliability zullen noemen.<br />

Deze geeft antwoord op <strong>de</strong> vraag: hoe precies<br />

kan het panel, maar ook <strong>de</strong> individuele participant<br />

daarin, <strong>de</strong> verschillen tussen condities<br />

vasts<strong>te</strong>llen? Vervolgens la<strong>te</strong>n we aan <strong>de</strong> hand<br />

van een voorbeeld zien dat G-reliability een<br />

handige maat is voor <strong>de</strong> karak<strong>te</strong>risering van een<br />

meetpanel. G-reliability hangt nauw samen met<br />

het on<strong>de</strong>rscheidingsvermogen van <strong>de</strong> toets op<br />

conditieverschillen en dit zullen we illustreren.<br />

Een discussie besluit dit artikel.<br />

26<br />

STAtOR juli 2011|2<br />

meetprecisie van i<strong>te</strong>ms<br />

Bij het kwantificeren in empirisch on<strong>de</strong>rzoek<br />

wordt veelal <strong>de</strong> vraag ges<strong>te</strong>ld naar meetprecisie.<br />

In <strong>de</strong> psychometrie, met name in <strong>de</strong> klassieke <strong>te</strong>st<br />

theorie (CTT), han<strong>te</strong>ert men daarvoor het begrip<br />

‘reliability’. Hier<strong>bij</strong> wordt een eigenschap van <strong>de</strong><br />

participan<strong>te</strong>n in <strong>de</strong> studie geme<strong>te</strong>n op een eendimensionale<br />

meetschaal met K i<strong>te</strong>ms. Daar<strong>bij</strong><br />

wordt het volgen<strong>de</strong> meetmo<strong>de</strong>l veron<strong>de</strong>rs<strong>te</strong>ld<br />

(Spector, 1992):<br />

Foto: BoH, Ken<strong>te</strong>rschalm


Y = P + E<br />

Hierin is P <strong>de</strong> ech<strong>te</strong> waar<strong>de</strong> van een participant<br />

met variantie σ 2 , Y <strong>de</strong> geme<strong>te</strong>n versie ervan <strong>te</strong>r-<br />

P<br />

wijl E het verschil aangeeft, <strong>de</strong> error met variantie<br />

σ 2 .<br />

e<br />

<strong>Hoe</strong>wel on<strong>de</strong>rwerp van veel discussie, zie <strong>bij</strong>-<br />

voorbeeld Clarke and Watson (1995), is Cronbach<br />

α (Cronbach, 1947) een standaardmaat voor reli-<br />

ability. On<strong>de</strong>r bepaal<strong>de</strong> veron<strong>de</strong>rs<strong>te</strong>llingen in het<br />

meetmo<strong>de</strong>l kan wor<strong>de</strong>n aangetoond dat Cronbach<br />

α een schat<strong>te</strong>r is van <strong>de</strong> reliability<br />

σ 2<br />

P<br />

σ 2 + σ2 / K<br />

P e<br />

De reliability is een relatieve maat voor meet-<br />

precisie. Deze beantwoordt <strong>de</strong> vraag: hoe goed<br />

kunnen we <strong>de</strong> verschillen in P-waar<strong>de</strong>n van participan<strong>te</strong>n,<br />

geme<strong>te</strong>n door σ 2 , on<strong>de</strong>rschei<strong>de</strong>n op<br />

P<br />

grond van <strong>de</strong> gemid<strong>de</strong>l<strong>de</strong>n van <strong>de</strong> meetwaar<strong>de</strong>n<br />

Y aan <strong>de</strong> K i<strong>te</strong>ms, met variantie σ 2 + σ 2 / K. Het<br />

P e<br />

bepalen van reliability gebeurt overigens veelal<br />

pas in <strong>de</strong> (observatie) studie zelf. In industriële<br />

user studies is het veelal mogelijk, alvorens een<br />

experiment uit <strong>te</strong> voeren, een beeld <strong>te</strong> krijgen van<br />

<strong>de</strong> precisie waarmee gegevens wor<strong>de</strong>n verkregen.<br />

We zullen nu reliability generaliseren naar <strong>de</strong><br />

industriële setting.<br />

Generalisatie van reliability<br />

Bij het bepalen van reliability in CTT vraagt<br />

men zich in fei<strong>te</strong> af: hoe goed kan ik verschillen<br />

on<strong>de</strong>rschei<strong>de</strong>n tussen participan<strong>te</strong>n, gegeven <strong>de</strong><br />

meetvariatie van i<strong>te</strong>ms. Die participan<strong>te</strong>n zijn<br />

hier <strong>de</strong> meettarget. In een industriële user studie<br />

zijn participan<strong>te</strong>n geen meettarget, maar on<strong>de</strong>r-<br />

27<br />

STAtOR juli 2011|2<br />

<strong>de</strong>el van <strong>de</strong> meetmetho<strong>de</strong>. De meettarget wordt<br />

gevormd door <strong>de</strong> condities, <strong>de</strong> produc<strong>te</strong>n, die wor-<br />

<strong>de</strong>n aangebo<strong>de</strong>n aan <strong>de</strong> participan<strong>te</strong>n. Het begrip<br />

reliability is dan nog s<strong>te</strong>eds heel bruikbaar, maar<br />

we zullen het herformuleren. De vraag is dan: hoe<br />

precies kunnen we verschillen vasts<strong>te</strong>llen tussen<br />

<strong>de</strong> meetcondities gegeven <strong>de</strong> variatie van i<strong>te</strong>ms<br />

en van participan<strong>te</strong>n? Jammer genoeg ziet men<br />

dat ook in dit geval nog s<strong>te</strong>eds Cronbach α wordt<br />

berekend, maar dan nu over <strong>de</strong> hele dataset van<br />

participan<strong>te</strong>n en condities. Deze geeft helaas geen<br />

dui<strong>de</strong>lijk, en een soms zelfs mislei<strong>de</strong>nd, beeld van<br />

<strong>de</strong> reliability waar het echt om gaat: het me<strong>te</strong>n<br />

van verschillen tussen condities. De verschillen<br />

tussen participan<strong>te</strong>n zijn helemaal niet in<strong>te</strong>res-<br />

sant. Dat dit mis kan lopen zullen we la<strong>te</strong>n zien in<br />

een voorbeeld in <strong>de</strong> volgen<strong>de</strong> paragraaf.<br />

Om tot een generalized reliability <strong>te</strong> komen<br />

dienen we eerst een re<strong>de</strong>lijk statistisch mo<strong>de</strong>l <strong>te</strong><br />

formuleren voor <strong>de</strong> gegevens van een user studie.<br />

We gaan nu uit van het geval dat we één factor-<br />

condities <strong>te</strong>s<strong>te</strong>n op elke participant in een Within<br />

Subject Design (WSD), een veel voorkomend type<br />

user studie. Dan zou een re<strong>de</strong>lijk mo<strong>de</strong>l als volgt<br />

kunnen zijn:<br />

Y ijk = μ + P i + C j + PC ij + β k + e ijk<br />

In dit mo<strong>de</strong>l vin<strong>de</strong>n we <strong>de</strong> effec<strong>te</strong>n <strong>te</strong>rug van<br />

participan<strong>te</strong>n P i , i = 1,…,I; condities C j , j = 1,…,J; <strong>de</strong><br />

in<strong>te</strong>ractie van participan<strong>te</strong>n en condities PC ij , <strong>de</strong><br />

<strong>te</strong>st i<strong>te</strong>ms β k , k = 1,…,K en <strong>de</strong> residuele fout e ijk .<br />

We veron<strong>de</strong>rs<strong>te</strong>llen voorts dat <strong>de</strong> P i , PC ij en e ijk<br />

stochastisch zijn en on<strong>de</strong>rling onafhankelijk, met<br />

varianties σ 2 , σ 2 en σ 2 . Voorts han<strong>te</strong>ren we<br />

P PC e<br />

σ 2 = Σ(Cj - C) 2 / (J-1)<br />

C<br />

als maat voor <strong>de</strong> verschillen tussen condities. We<br />

gaan nu <strong>de</strong> reliability op twee manieren generaliseren.


on<strong>de</strong>rscheidingsvermogen in %<br />

on<strong>de</strong>rscheidingsvermogen in %<br />

Figuur 1. On<strong>de</strong>rscheidingsvermogen van <strong>de</strong> F-toets op condities <strong>te</strong>gen generalized reliability, voor vier panelgroot<strong>te</strong>n.<br />

Resulta<strong>te</strong>n zijn voor twee condities (J = 2)<br />

Geval 1: <strong>de</strong> G-reliability per participant,<br />

σ 2<br />

C<br />

σ 2 + σe<br />

2 / K<br />

C<br />

Deze vorm kennen we al uit <strong>de</strong> vorige paragraaf.<br />

Het enige verschil is dat we participant vervan-<br />

gen hebben door condities. Hiermee karak<strong>te</strong>rise-<br />

ren we <strong>de</strong> meetprecisie van een participant in het<br />

panel. <strong>Hoe</strong> goed kan <strong>de</strong>ze condities on<strong>de</strong>rschei-<br />

<strong>de</strong>n?<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

5 participan<strong>te</strong>n<br />

0,0 0,2 0,4 0,6 0,8 1,0<br />

generalized reliability<br />

15 participan<strong>te</strong>n<br />

0,0 0,2 0,4 0,6 0,8 1,0<br />

generalized reliability<br />

Geval 2: <strong>de</strong> G-reliability over het meetpanel van<br />

participan<strong>te</strong>n,<br />

σ 2<br />

C<br />

σ 2 + σ2 /I + σe<br />

2 /(I*K)<br />

C PC<br />

Deze expressie geeft het volgen<strong>de</strong> weer: hoe goed<br />

on<strong>de</strong>rschei<strong>de</strong>n we <strong>de</strong> verschillen tussen condities<br />

on<strong>de</strong>rscheidingsvermogen in %<br />

on<strong>de</strong>rscheidingsvermogen in %<br />

100<br />

80<br />

60<br />

40<br />

20<br />

zoals geme<strong>te</strong>n door σ 2 door het gemid<strong>de</strong>l<strong>de</strong> per<br />

C<br />

conditie van <strong>de</strong> data Y over i<strong>te</strong>ms én participan<strong>te</strong>n.<br />

Dit gemid<strong>de</strong>l<strong>de</strong> heeft variatie σ 2 + σ2 C PC / I + σ2 e<br />

/ (I*K). De aanpak is analoog aan het eers<strong>te</strong> geval,<br />

het resultaat is wat an<strong>de</strong>rs.<br />

Aardig is nu dat een eenvoudige momen<strong>te</strong>nschat<strong>te</strong>r<br />

van G-reliability wordt gegeven door <strong>de</strong><br />

grootheid (F-1)/F waar<strong>bij</strong> F <strong>de</strong> waar<strong>de</strong> is van <strong>de</strong><br />

F-toets van Anova voor het toetsen van condities.<br />

In het eers<strong>te</strong> geval toetsen we het effect van<br />

condities voor een bepaal<strong>de</strong> participant. In het<br />

twee<strong>de</strong> geval doen we dat voor alle participan<strong>te</strong>n<br />

samen. De F-toets wordt gebruikt als schat<strong>te</strong>r voor<br />

G-reliability. De resulta<strong>te</strong>n volgen uit <strong>de</strong> verwachtingswaar<strong>de</strong>n<br />

van <strong>de</strong> Mean Squares waaruit <strong>de</strong><br />

F-toets is opgebouwd, met an<strong>de</strong>re woor<strong>de</strong>n uit <strong>de</strong><br />

EMS tabel van <strong>de</strong> variantieanalyse.<br />

Er is een verband met een eer<strong>de</strong>r, en tamelijk<br />

onbekend resultaat. Hoyt (1941) liet al zien dat<br />

28<br />

STAtOR juli 2011|2<br />

0<br />

100<br />

80<br />

60<br />

40<br />

20<br />

0<br />

10 participan<strong>te</strong>n<br />

0,0 0,2 0,4 0,6 0,8 1,0<br />

generalized reliability<br />

20 participan<strong>te</strong>n<br />

0,0 0,2 0,4 0,6 0,8 1,0<br />

generalized reliability


Cronbach α ook kan wor<strong>de</strong>n bepaald door (F-1)/F<br />

voor het geval dat in CTT wordt bestu<strong>de</strong>erd, zie <strong>de</strong><br />

vorige paragraaf. Maar het geldt veel algemener!<br />

We kunnen dan eenvoudig G-reliability bepalen<br />

via <strong>de</strong> Anova F-toets, en standaard software is<br />

geschikt om dit uit <strong>te</strong> voeren.<br />

On<strong>de</strong>rscheidingsvermogen van <strong>de</strong> f-toets<br />

G-reliability in geval 2 heeft een relatie met het<br />

on<strong>de</strong>rscheidingsvermogen van <strong>de</strong> F-toets op con-<br />

dities. We kunnen dit als volgt inzien. We for-<br />

muleren <strong>de</strong> nulhypothese H 0 : C 1 =... = C J , en het<br />

al<strong>te</strong>rnatief H 1 : niet alle C j zijn gelijk. Indien H 0<br />

waar is heeft <strong>de</strong> F-toets een centrale F-ver<strong>de</strong>ling,<br />

als H 0 onwaar is heeft <strong>de</strong> F-toets een niet-centrale<br />

F-ver<strong>de</strong>ling, met niet-centrali<strong>te</strong>its (nc) parame<strong>te</strong>r<br />

die we λ noemen. Maar die parame<strong>te</strong>r λ kunnen<br />

we uitdrukken in <strong>de</strong> G-reliability , en is daarvan<br />

een monotoon stijgen<strong>de</strong> functie:<br />

λ = (J-1) (G-reliability /(1- G-reliability))<br />

<strong>Hoe</strong> gro<strong>te</strong>r G-reliability, hoe gro<strong>te</strong>r het on<strong>de</strong>r-<br />

scheidingsvermogen; zie figuur 1. G-reliability<br />

heeft direct een be<strong>te</strong>kenis voor <strong>de</strong> kwali<strong>te</strong>it van<br />

toetsen.<br />

Uit figuur 1 trekken we twee conclusies:<br />

1. gegeven een waar<strong>de</strong> van <strong>de</strong> generalized relia-<br />

bility is het aantal participan<strong>te</strong>n niet erg bepa-<br />

lend voor het on<strong>de</strong>rscheidingsvermogen van <strong>de</strong><br />

F-toets, en<br />

2. voor een on<strong>de</strong>rscheidingsvermogen van 80%<br />

is toch al snel een, relatief hoge, generalized<br />

reliability nodig van 0,90. Aan <strong>de</strong> Cronbach α<br />

wor<strong>de</strong>n vaak lagere eisen ges<strong>te</strong>ld.<br />

Voorbeeld: meetprecisie van een meetpanel<br />

Het voorgaan<strong>de</strong> geeft metho<strong>de</strong>n om <strong>de</strong> reliability<br />

van een meetpanel na <strong>te</strong> gaan. In het volgen<strong>de</strong>,<br />

29<br />

STAtOR juli 2011|2<br />

eenvoudige, voorbeeld heeft elk van vier partici-<br />

pan<strong>te</strong>n, on<strong>de</strong>r twee verschillen<strong>de</strong> condities, een<br />

oor<strong>de</strong>el gegeven op een 9-punts meetschaal met<br />

drie i<strong>te</strong>ms. Zie tabel 1.<br />

Na berekening blijkt Cronbach α = 0,924. Er<br />

lijkt dus, op grond van Cronbach α, niets aan <strong>de</strong><br />

hand, en onze meetschaal lijkt het doet <strong>te</strong> doen.<br />

Maar we me<strong>te</strong>n <strong>de</strong> verkeer<strong>de</strong> reliability: die van<br />

<strong>de</strong> totale variatie, dus van participan<strong>te</strong>n, condi-<br />

ties, <strong>de</strong> in<strong>te</strong>ractie, en niet van condities alleen!<br />

Voor <strong>de</strong> F-toets op condities vin<strong>de</strong>n we F = 1,343,<br />

en daarmee <strong>de</strong> G-reliability (F-1)/F = 0,26, en dat<br />

is direct een stuk min<strong>de</strong>r optimistisch. Kijken we<br />

naar <strong>de</strong> individuele G-reliability waar<strong>de</strong>n, geba-<br />

seerd op <strong>de</strong> F-toets uitkoms<strong>te</strong>n per participant,<br />

dan vin<strong>de</strong>n we 0,98, -12,00, 0,96 en 0,75. Daaruit<br />

blijkt dat <strong>de</strong> twee<strong>de</strong> participant het wel heel<br />

slecht doet. La<strong>te</strong>n we <strong>de</strong>ze weg, dan vin<strong>de</strong>n we<br />

ech<strong>te</strong>r een G-reliability van 0,14.<br />

Een en na<strong>de</strong>r wordt wellicht dui<strong>de</strong>lijk aan <strong>de</strong><br />

hand van <strong>de</strong> in<strong>te</strong>ractieplot van figuur 2. We zien<br />

hierin dat participant 2 in<strong>de</strong>rdaad slecht discri-<br />

mineert: een non-discriminator. Maar er is meer:<br />

<strong>de</strong> in<strong>te</strong>ractie is groot en daarmee <strong>de</strong> meetpreci-<br />

sie van het panel gering. Nog s<strong>te</strong>rker, door die<br />

gro<strong>te</strong> in<strong>te</strong>ractie is Cronbach α groot, maar voor<br />

het ech<strong>te</strong> doel, het bepalen van verschil tussen<br />

condities, is die in<strong>te</strong>ractie juist funest! De waar<strong>de</strong><br />

Participant conditie I<strong>te</strong>m 1 I<strong>te</strong>m 2 I<strong>te</strong>m 3<br />

1 1 2,00 1,00 2,00<br />

1 2 4,00 3,00 5,00<br />

2 1 5,00 6,00 5,00<br />

2 2 6,00 4,00 7,00<br />

3 1 3,00 2,00 3,00<br />

3 2 6,00 7,00 9,00<br />

4 1 3,00 4,00 2,00<br />

4 2 1,00 2,00 2,00<br />

Tabel 1. Meetgegevens op 9-punt schaal van vier participan<strong>te</strong>n,<br />

twee condities en drie i<strong>te</strong>ms


mean<br />

88<br />

77<br />

66<br />

55<br />

44<br />

33<br />

22<br />

11<br />

is heel laag. De gro<strong>te</strong> variantie van <strong>de</strong> in<strong>te</strong>ractie<br />

vin<strong>de</strong>n we <strong>te</strong>rug in <strong>de</strong> noemer van G-reliability.<br />

Een verbe<strong>te</strong>ring in <strong>de</strong> situatie? Wanneer dit een<br />

reële situatie is zou men kritisch moe<strong>te</strong>n kijken<br />

of <strong>de</strong> participan<strong>te</strong>n wel geschikt zijn voor hun<br />

taak, en of selectie/opleiding niet dui<strong>de</strong>lijk een<br />

noodzaak is. Zomaar meer participan<strong>te</strong>n opne-<br />

men vergroot <strong>de</strong> waar<strong>de</strong> van I, en daarmee <strong>de</strong><br />

G-reliability , maar is misschien niet <strong>de</strong> meest<br />

effectieve weg.<br />

Discussie<br />

1<br />

2<br />

conditie<br />

Figuur 2. In<strong>te</strong>ractie plot van participan<strong>te</strong>n en condities voor <strong>de</strong> gegevens van tabel 1<br />

1<br />

2<br />

3<br />

4<br />

van <strong>de</strong> G-reliability geeft dit a<strong>de</strong>quaat weer: die maar er is geen standaardisatie. Het aardige is<br />

De G-reliability geeft nuttige informatie om <strong>de</strong><br />

meetprecisie vast <strong>te</strong> s<strong>te</strong>llen in een industriële<br />

user studie. We hebben dit la<strong>te</strong>n zien aan <strong>de</strong><br />

hand van een WSD met één factorcondities.<br />

Overigens is dit resultaat natuurlijk eenvou-<br />

dig <strong>te</strong> generaliseren voor an<strong>de</strong>re <strong>de</strong>signs, zoals<br />

een WSD met meer<strong>de</strong>re factoren, of voor het<br />

Between Subject Design. De karak<strong>te</strong>risering van<br />

afzon<strong>de</strong>rlijke participan<strong>te</strong>n ziet men ook <strong>te</strong>rug in<br />

<strong>de</strong> sensometrie (Brockhoff en Skovgaard, 1994).<br />

Hier<strong>bij</strong> wordt ook <strong>de</strong> F-waar<strong>de</strong> van <strong>de</strong> individuele<br />

participant gehan<strong>te</strong>erd als maat voor kwali<strong>te</strong>it,<br />

6<br />

5<br />

4<br />

3<br />

2<br />

1<br />

1 2<br />

30<br />

STAtOR juli 2011|2<br />

1<br />

2<br />

3<br />

4<br />

dat nu <strong>de</strong> link wordt gelegd tussen <strong>de</strong>ze waar<strong>de</strong><br />

uit <strong>de</strong> sensometrie en <strong>de</strong> reliability uit <strong>de</strong> psy-<br />

chometrie. Ten slot<strong>te</strong> geldt dan ook een volgen<strong>de</strong><br />

spin-off: uit het betrouwbaarheids-in<strong>te</strong>rval voor<br />

<strong>de</strong> nc-parame<strong>te</strong>r λ kunnen we een betrouwbaar-<br />

heids-in<strong>te</strong>rval bepalen voor G-reliability. En nut-<br />

tige resulta<strong>te</strong>n hiervoor wor<strong>de</strong>n gegeven door<br />

<strong>bij</strong>voorbeeld S<strong>te</strong>iger (2004).<br />

Li<strong>te</strong>ratuur<br />

Brockhoff, P.M. & Skovgaard, I.M. (1994). Mo<strong>de</strong>lling individual<br />

differences between assessors in sensory<br />

evaluations. Food Quality and Preference, 5, 215-224.<br />

Clarke, L. A. & Watson, D. (1995). Constructing validity:<br />

basic issues in objective scale <strong>de</strong>velopment.<br />

Psychological Assessment, 7, 309-319.<br />

Cronbach, L.J. (1947). Test “reliability”: Its meaning and<br />

in<strong>te</strong>rpretation. Psychometrika, 12, 1-6.<br />

Hoyt, C. (1941). Test reliability by analysis of variance.<br />

Psychometrika , 6, 135-160.<br />

Spector, P.E. (1992). Summa<strong>te</strong>d rating scale construction.<br />

An introduction. Newbury Park: Sage publications.<br />

S<strong>te</strong>iger, J.H. (2004). Beyond the F <strong>te</strong>st: effect size confi<strong>de</strong>nce<br />

in<strong>te</strong>rvals and <strong>te</strong>sts of close fit in the analysis<br />

of variance and contrast analysis. Psychological<br />

Methods, 9, 164-182.<br />

Jan Engel is senior consultant <strong>bij</strong> CQM in Eindhoven.<br />

E-mail:


IN MEMORIAM<br />

jOOP KEmPERmAN (1924-2011)<br />

J.H.B. (Joop) Kemperman werd op 16 juli 1924 in<br />

Ams<strong>te</strong>rdam geboren. Hij stu<strong>de</strong>er<strong>de</strong> wiskun<strong>de</strong><br />

aan <strong>de</strong> Universi<strong>te</strong>it van Ams<strong>te</strong>rdam, waar hij in<br />

1948 doctoraal examen <strong>de</strong>ed. Hij werk<strong>te</strong> daarna<br />

aan het Mathematisch Centrum (CWI) on<strong>de</strong>r<br />

leiding van David van Dantzig, <strong>bij</strong> wie hij in 1950<br />

promoveer<strong>de</strong> op een proefschrift geti<strong>te</strong>ld ‘The<br />

General One-Dimensional Random Walk with<br />

Absorbing Barriers, with Applications to Sequen-<br />

tial Analysis’.<br />

In 1951 emigreer<strong>de</strong> hij naar <strong>de</strong> V.S. Hij was<br />

ach<strong>te</strong>reenvolgens hoogleraar aan <strong>de</strong> Purdue<br />

University, University of Roches<strong>te</strong>r en <strong>de</strong> Rutgers<br />

University.<br />

In 1970 ontmoe<strong>te</strong> ik hem voor het eerst in<br />

Roches<strong>te</strong>r tij<strong>de</strong>ns mijn bezoek aan Julian Keilson.<br />

Ik kwam daar aan na een lange rondrit door <strong>de</strong><br />

VS vanuit Austin, Texas. Hij had me zijn twee<strong>de</strong><br />

auto willen lenen – mijn auto was al verkocht –<br />

ware het niet dat hij die kort daarvoor al had uit-<br />

geleend en <strong>de</strong>fect had <strong>te</strong>ruggekregen.<br />

Dat <strong>te</strong>ken<strong>de</strong> hem: hij was heel genereus, in<br />

alle opzich<strong>te</strong>n, ook met zijn inzich<strong>te</strong>n in <strong>de</strong> wis-<br />

kun<strong>de</strong>. Hij had een opvallend algemeen advies<br />

voor wiskundigen: gebruik geen ongelijkhe<strong>de</strong>n.<br />

Bij het gebruik van ongelijkhe<strong>de</strong>n raak je altijd<br />

informatie kwijt. Laat dus altijd gelijkhe<strong>de</strong>n<br />

staan, ook al weet je van sommige groothe<strong>de</strong>n<br />

dat ze klein zijn.<br />

Ik kwam hem daarna regelmatig <strong>te</strong>gen op<br />

congressen en weer la<strong>te</strong>r, wat uitgebrei<strong>de</strong>r, <strong>bij</strong><br />

mijn twee<strong>de</strong> bezoek aan Keilson in Roches<strong>te</strong>r<br />

in 1972. Toen heb ik ook Joops vrouw Wilna ont-<br />

moet, een actieve, opgewek<strong>te</strong> vrouw. Zij stierf in<br />

31<br />

STAtOR juli 2011|2<br />

1995. De <strong>bij</strong>zetting van haar as in Alkmaar werd<br />

door veel collega’s van Joop <strong>bij</strong>gewoond. Zij was<br />

een vrolijke vrouw, en door <strong>de</strong> vele herinnerin-<br />

gen aan haar opgetogen leven kreeg <strong>de</strong> plechtig-<br />

heid een uitgesproken opgewekt karak<strong>te</strong>r.<br />

Kemperman was een heel veelzijdige wis-<br />

kundige. Hij werk<strong>te</strong> in <strong>de</strong> analyse, <strong>de</strong> discre<strong>te</strong><br />

wiskun<strong>de</strong>, en vooral, in <strong>de</strong> kansrekening en<br />

statistiek. Ver<strong>de</strong>r was hij redac<strong>te</strong>ur van ver-<br />

schillen<strong>de</strong> vaktijdschrif<strong>te</strong>n, waaron<strong>de</strong>r The<br />

Annals of Mathematical Statistics, The Annals of<br />

Probability, Stochastic Processes and Applications<br />

en, bui<strong>te</strong>n <strong>de</strong> stochastiek, van Aequationes<br />

Mathematicae. Hij had veel promovendi. Het<br />

Mathematics Genealogy Project geeft 24 namen;<br />

<strong>de</strong> eers<strong>te</strong> promoveer<strong>de</strong> in 1954, <strong>de</strong> laats<strong>te</strong> in 1994.<br />

Hij was correspon<strong>de</strong>rend lid van <strong>de</strong> Koninklijke<br />

Ne<strong>de</strong>rlandse Aca<strong>de</strong>mie van We<strong>te</strong>nschappen.<br />

Zijn eers<strong>te</strong> artikel verscheen in 1949 in<br />

Indagationes Mathematicae en schreef hij samen<br />

met J.G. van <strong>de</strong>r Corput. De ti<strong>te</strong>l luid<strong>de</strong> ‘The sec-<br />

ond pearl of the theory of numbers’. Zijn laats<strong>te</strong><br />

artikel schreef hij samen met Mark Brown en ver-<br />

scheen in 2009 in Probability in Engineering and<br />

Information Sciences: ‘Sharp two-si<strong>de</strong>d bounds<br />

for distributions un<strong>de</strong>r a hazard ra<strong>te</strong> constraint’.<br />

De laats<strong>te</strong> jaren leed hij aan <strong>de</strong> ziek<strong>te</strong> van<br />

Parkinson. Joop is op 12 juni in East Brunswick<br />

overle<strong>de</strong>n. Op 2 juli is op <strong>de</strong> Sint Barbara begraaf-<br />

plaats in Alkmaar zijn as met die van zijn vrouw<br />

verenigd.<br />

Fred S<strong>te</strong>u<strong>te</strong>l


Johan van Leeuwaar<strong>de</strong>n<br />

BUURTFEEST<br />

Terwijl ik met een bit<strong>te</strong>rbal op <strong>de</strong> maat van <strong>de</strong><br />

muziek mijn gehemel<strong>te</strong> kastijd zie ik uit mijn oog-<br />

hoek iemand na<strong>de</strong>ren.<br />

‘Leopold, aangenaam, <strong>de</strong> overbuurman’, zegt<br />

<strong>de</strong> zelfbewus<strong>te</strong> vijftiger.<br />

Bit<strong>te</strong>rgarnituur maakt je bena<strong>de</strong>rbaar.<br />

Leopold vervolgt: ‘Dus jij werkt aan <strong>de</strong> TU.’<br />

‘Klopt’, zeg ik aarzelend, niet we<strong>te</strong>n<strong>de</strong> wat <strong>de</strong>ze<br />

bevestiging <strong>te</strong>weeg zal brengen.<br />

‘Wat doe je dan precies?’<br />

Tja, <strong>de</strong>nk ik, daar gaan we weer. Maar het is<br />

feest, dus ik besluit het een kans <strong>te</strong> geven.<br />

‘Nou, ik doe wiskun<strong>de</strong>, <strong>de</strong>els lesgeven, <strong>de</strong>els<br />

on<strong>de</strong>rzoek.’<br />

‘Aha, on<strong>de</strong>rzoek. Dus je bent uitvin<strong>de</strong>r?’<br />

‘Niet echt. Ik probeer wel s<strong>te</strong>eds iets nieuws <strong>te</strong><br />

be<strong>de</strong>nken, maar geen uitvindingen.’<br />

‘Maar ik dacht dat ze aan <strong>de</strong> TU echt dingen<br />

uitvon<strong>de</strong>n, zoals MRI scans en elektrische auto’s?’<br />

‘Klopt, dat is ook zo.’<br />

‘Maar jij vindt geen dingen uit?’<br />

‘Nou, misschien toch wel, maar zo heb ik het<br />

niet eer<strong>de</strong>r bekeken.’<br />

‘Noem dan eens wat van je uitvindingen.’<br />

Voetbal was een be<strong>te</strong>r on<strong>de</strong>rwerp geweest,<br />

maar er is nu geen weg meer <strong>te</strong>rug.<br />

‘Kijk, ik werk eer<strong>de</strong>r aan wiskundige formules, of<br />

mo<strong>de</strong>llen, die an<strong>de</strong>ren dan weer kunnen <strong>gebruiken</strong><br />

<strong>bij</strong> het ontwikkelen van produc<strong>te</strong>n. Die mo<strong>de</strong>llen en<br />

formules zijn nieuw, en in die zin een uitvinding.’<br />

‘Maar wanneer an<strong>de</strong>ren jouw formules gebrui-<br />

ken, levert jou dat dan geld op?’<br />

‘Nee, want ie<strong>de</strong>reen mag die formules <strong>gebruiken</strong>.’<br />

32<br />

STAtOR juli 2011|2<br />

‘En die mo<strong>de</strong>llen, leveren die dan iets op?’<br />

‘Die mo<strong>de</strong>llen zijn abstracties van <strong>de</strong> werke-<br />

lijkheid. Ze geven wel inzicht, maar lei<strong>de</strong>n door-<br />

gaans niet tot een tastbaar product. Althans, mijn<br />

mo<strong>de</strong>llen niet.’<br />

‘Dus dat on<strong>de</strong>rzoek van jou levert niets op?’<br />

‘Geen geld nee. Wel die formules dus.’<br />

‘Ja, maar die formules geef je blijkbaar voor<br />

niets weg. Waarom houd je ze niet voor jezelf, en<br />

probeer je er iets mee <strong>te</strong> doen dat geld oplevert?’<br />

‘Maar dan zou ik een eigen bedrijf moe<strong>te</strong>n<br />

beginnen?’<br />

‘Dat klopt ja, en daar lijkt me niets mis mee.<br />

De kran<strong>te</strong>n staan vol met verhalen over <strong>de</strong> uni-<br />

versi<strong>te</strong>i<strong>te</strong>n. Er is een groot begrotings<strong>te</strong>kort, en<br />

het schijnt dat jullie je broek in <strong>de</strong> toekomst zelf<br />

moe<strong>te</strong>n ophou<strong>de</strong>n. Je kunt dus maar be<strong>te</strong>r zorgen<br />

dat je iets nuttigs doet, iets wat geld oplevert.’<br />

‘Ik heb het ook gelezen, maar…’<br />

‘En <strong>te</strong>recht ook’, on<strong>de</strong>rbreekt Leopold,‘wij maar<br />

geld in <strong>de</strong> universi<strong>te</strong>i<strong>te</strong>n pompen zon<strong>de</strong>r dat we er<br />

ooit iets van <strong>te</strong>rug zien.’<br />

‘Ik <strong>de</strong>nk dat je gelijk hebt’, zeg ik, <strong>te</strong>rwijl ik<br />

besluit me <strong>te</strong> rich<strong>te</strong>n op het volgen<strong>de</strong> buurtfeest.<br />

‘Goed dan’, zegt Leopold, ‘zal ik nog een biertje<br />

halen?’<br />

‘Doe mij maar iets s<strong>te</strong>rkers’, zeg ik, <strong>te</strong>rwijl ik<br />

weer overga tot mijn bit<strong>te</strong>rbal.<br />

c o l u m n<br />

Johan van Leeuwaar<strong>de</strong>n is werkzaam in <strong>de</strong> groep<br />

Stochastische Besliskun<strong>de</strong> <strong>bij</strong> <strong>de</strong> facul<strong>te</strong>it Wiskun<strong>de</strong> en<br />

Informatica van <strong>de</strong> Technische Universi<strong>te</strong>it Eindhoven.<br />

Tevens is hij research fellow <strong>bij</strong> EURANDOM.<br />

E-mail:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!