Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
App<strong>en</strong>dix 7. <strong>Statistisch</strong> <strong>analyseplan</strong>.doc<br />
Bov<strong>en</strong>staande modell<strong>en</strong> kunn<strong>en</strong> gebruikt word<strong>en</strong> om gemiddeld<strong>en</strong> <strong>en</strong> kans<strong>en</strong> te voorspell<strong>en</strong>. Op basis<br />
van de verzamelde data schat m<strong>en</strong> de parameters in het model (α, β1, β2, β3,…). Vervolg<strong>en</strong>s kan m<strong>en</strong><br />
door middel van deze parameter-schatters e<strong>en</strong> voorspelling do<strong>en</strong> voor de gemiddelde waard<strong>en</strong> van Y<br />
(of de kans p) voor specifieke waard<strong>en</strong> van x1 , x2 <strong>en</strong> x3. Indi<strong>en</strong> bijvoorbeeld x1 de leeftijd van de<br />
moeder is, x2 het aantal sigarett<strong>en</strong> gemiddeld dagelijks gerookt voor de zwangerschap <strong>en</strong> x3 het<br />
aantal sigarett<strong>en</strong> dagelijks gerookt tijd<strong>en</strong>s de zwangerschap dan kan m<strong>en</strong> voor elke combinatie van x1,<br />
x2 <strong>en</strong> x3 de gemiddelde verwachtte waarde van Y berek<strong>en</strong><strong>en</strong>.<br />
Gemiddeld<strong>en</strong> voor de blootstellingmerkers die zo bekom<strong>en</strong> word<strong>en</strong> op basis van e<strong>en</strong> meervoudige<br />
regressie model waar naast het gebied ook de leeftijd <strong>en</strong> actief rookgedrag voor <strong>en</strong> tijd<strong>en</strong>s de<br />
zwangerschap opg<strong>en</strong>om<strong>en</strong> zijn, noem<strong>en</strong> we gecorrigeerde gemiddeld<strong>en</strong>.<br />
3.4 GEBIEDSVERSCHILLEN VOOR DE CONTINUE MERKERS<br />
3.4.1 Response<br />
De blootstellingmerkers word<strong>en</strong> volg<strong>en</strong>s de natuurlijke logaritmische functie getransformeerd.<br />
Deze getransformeerde gegev<strong>en</strong>s word<strong>en</strong> in de regressie modell<strong>en</strong> als response variabel<strong>en</strong> gebruikt.<br />
De red<strong>en</strong> hiervoor is dat de oorspronkelijke gegev<strong>en</strong>s niet normaal verdeeld zijn.<br />
3.4.2 Gecorrigeerde gemiddeld<strong>en</strong><br />
Met gecorrigeerde gegev<strong>en</strong>s bedoel<strong>en</strong> we dat we gemiddeld<strong>en</strong>/proporties per gebied berek<strong>en</strong><strong>en</strong><br />
waarbij we rek<strong>en</strong>ing houd<strong>en</strong> de sam<strong>en</strong>stelling van het gebied. In feite voorspell<strong>en</strong> we het gemiddelde<br />
(de proportie) dat we in e<strong>en</strong> bepaald gebied verwacht<strong>en</strong> voor e<strong>en</strong> bepaalde moeder. En dit do<strong>en</strong> we<br />
voor elk gebied voor dezelfde moeder. M.a.w. de verschill<strong>en</strong> die we dan nog tuss<strong>en</strong> de gebied<strong>en</strong> zi<strong>en</strong>,<br />
kunn<strong>en</strong> niet te wijt<strong>en</strong> zijn aan verschill<strong>en</strong> in de populaties van de gebied<strong>en</strong>. Merk op dat dit niet<br />
helemaal correct is; we corriger<strong>en</strong> immers slecht voor <strong>en</strong>kele populatiek<strong>en</strong>merk<strong>en</strong>.<br />
De factor<strong>en</strong> waarvoor we corriger<strong>en</strong> verschill<strong>en</strong> van merker tot merker (zie hiervoor sectie 7). Voor de<br />
blootstellingmerkers corriger<strong>en</strong> we steeds voor de leeftijd van de moeder <strong>en</strong> het actief rookgedrag<br />
voor <strong>en</strong> tijd<strong>en</strong>s de zwangerschap van de moeder.<br />
De gecorrigeerde gemiddeld<strong>en</strong> word<strong>en</strong> bekom<strong>en</strong> op basis van e<strong>en</strong> meervoudig regressie model waar<br />
vier parameters als verklar<strong>en</strong>de variabel<strong>en</strong> zijn opg<strong>en</strong>om<strong>en</strong>:<br />
- Leeftijd: in 5 klass<strong>en</strong>.<br />
- Pakjar<strong>en</strong> = totaal aantal sigarett<strong>en</strong> ooit gerookt (berek<strong>en</strong>d op basis van gemiddeld<strong>en</strong>): in 3<br />
klass<strong>en</strong>.<br />
- Roker tijd<strong>en</strong>s zwangerschap : ja/nee. Het aandeel vrouw<strong>en</strong> dat tijd<strong>en</strong>s de zwangerschap<br />
rookt is gelukkig laag. Maar hierdoor hebb<strong>en</strong> we niet zoveel informatie over de relatie tuss<strong>en</strong><br />
de blootstellingmerker <strong>en</strong> het aantal sigarett<strong>en</strong> dat dagelijks gerookt wordt tijd<strong>en</strong>s de<br />
11