Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
3.7 MODELBOUW<br />
3.7.1 Selectie van e<strong>en</strong> goed model.<br />
App<strong>en</strong>dix 7. <strong>Statistisch</strong> <strong>analyseplan</strong>.doc<br />
Uit de verzameling van kandidaat regressor<strong>en</strong> (covariat<strong>en</strong>) will<strong>en</strong> we e<strong>en</strong> deelverzameling kiez<strong>en</strong> die<br />
het beste de variabiliteit in de uitkomstparameter verklaart. Helaas is er ge<strong>en</strong> éénduidig antwoord op<br />
de vraag wat de ‘beste’ deelverzameling is. Er zijn verschill<strong>en</strong>de criteria <strong>en</strong> die leid<strong>en</strong> niet noodzakelijk<br />
tot dezelfde conclusie. We opter<strong>en</strong> voor gebruik van automatische selectie procedures. De<br />
stapsgewijze procedure zal toegepast word<strong>en</strong>. De methode waarbij alle mogelijke regressiemodell<strong>en</strong><br />
vergelek<strong>en</strong> word<strong>en</strong> (bijv de R-square of Cp,...) is omwille van het groot aantal verklar<strong>en</strong>de<br />
parameters niet aangewez<strong>en</strong>. Toepassing van automatische selectieprocedures moet wel voorzichtig<br />
gebeur<strong>en</strong>; er di<strong>en</strong>t bijv. opgelet te word<strong>en</strong> dat de hoofdeffect<strong>en</strong> in het model opg<strong>en</strong>om<strong>en</strong> zijn indi<strong>en</strong><br />
de interactieterm significant is.<br />
3.7.2 Multicollineariteit<br />
M<strong>en</strong> spreekt van multicollineariteit indi<strong>en</strong> de onafhankelijke variabel<strong>en</strong> onderling gecorreleerd zijn.<br />
Multicollineariteit heeft e<strong>en</strong> effect op de interpretatie <strong>en</strong> het gebruik van e<strong>en</strong> gefit regressie model. De<br />
techniek van Variance Inflation Factors (VIF) zal toegepast word<strong>en</strong> om dit probleem te onderzoek<strong>en</strong>.<br />
3.7.3 Modelvalidatie<br />
Indi<strong>en</strong> beschikbaar zull<strong>en</strong> de resultat<strong>en</strong> vergelek<strong>en</strong> word<strong>en</strong> met theoretische verwachting<strong>en</strong> <strong>en</strong><br />
empirische resultat<strong>en</strong>. In e<strong>en</strong> tweede verwerkingsfase zal cross-validatie gebruikt word<strong>en</strong> om het<br />
regressiemodel te valider<strong>en</strong>. Bij cross-validatie wordt de dataset in twee sets verdeeld. De eerste,<br />
model-building, set wordt gebruikt om het model te ontwikkel<strong>en</strong>. De tweede set, validatie of predictie<br />
set, wordt als onafhankelijke data gebruikt om de predictieve waarde van het geselecteerde model te<br />
bestuder<strong>en</strong>.<br />
3.8 MEERVOUDIG TOETSEN<br />
Enkel indi<strong>en</strong> de globale vergelijking van de onderzoeksgebied<strong>en</strong> statistisch significant is op het 5%<br />
significanti<strong>en</strong>iveau, zull<strong>en</strong> verschill<strong>en</strong> met het laagste onderzoeksgebied<strong>en</strong> <strong>en</strong> de gewog<strong>en</strong><br />
refer<strong>en</strong>tiewaarde op hun significantie getest word<strong>en</strong>. Door deze twee-traps-procedure toe te pass<strong>en</strong><br />
is het niet nodig bij deze vergelijking<strong>en</strong> te corriger<strong>en</strong> voor de type I fout.<br />
3.9 MODEL MET MEERDERE BLOOTSTELLINGSMERKERS<br />
Om het effect van het sam<strong>en</strong>spel van de verschill<strong>en</strong>de blootstellingsmerkers op e<strong>en</strong> effectmerker in<br />
beeld te br<strong>en</strong>g<strong>en</strong> word<strong>en</strong> in e<strong>en</strong> tweede verwerkingsfaze meervoudige regressie modell<strong>en</strong> opgesteld<br />
16