08.09.2013 Views

Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid

Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid

Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

App<strong>en</strong>dix 7. <strong>Statistisch</strong> <strong>analyseplan</strong>.doc<br />

Bov<strong>en</strong>staande modell<strong>en</strong> kunn<strong>en</strong> gebruikt word<strong>en</strong> om gemiddeld<strong>en</strong> <strong>en</strong> kans<strong>en</strong> te voorspell<strong>en</strong>. Op basis<br />

van de verzamelde data schat m<strong>en</strong> de parameters in het model (α, β1, β2, β3,…). Vervolg<strong>en</strong>s kan m<strong>en</strong><br />

door middel van deze parameter-schatters e<strong>en</strong> voorspelling do<strong>en</strong> voor de gemiddelde waard<strong>en</strong> van Y<br />

(of de kans p) voor specifieke waard<strong>en</strong> van x1 , x2 <strong>en</strong> x3. Indi<strong>en</strong> bijvoorbeeld x1 de leeftijd van de<br />

moeder is, x2 het aantal sigarett<strong>en</strong> gemiddeld dagelijks gerookt voor de zwangerschap <strong>en</strong> x3 het<br />

aantal sigarett<strong>en</strong> dagelijks gerookt tijd<strong>en</strong>s de zwangerschap dan kan m<strong>en</strong> voor elke combinatie van x1,<br />

x2 <strong>en</strong> x3 de gemiddelde verwachtte waarde van Y berek<strong>en</strong><strong>en</strong>.<br />

Gemiddeld<strong>en</strong> voor de blootstellingmerkers die zo bekom<strong>en</strong> word<strong>en</strong> op basis van e<strong>en</strong> meervoudige<br />

regressie model waar naast het gebied ook de leeftijd <strong>en</strong> actief rookgedrag voor <strong>en</strong> tijd<strong>en</strong>s de<br />

zwangerschap opg<strong>en</strong>om<strong>en</strong> zijn, noem<strong>en</strong> we gecorrigeerde gemiddeld<strong>en</strong>.<br />

3.4 GEBIEDSVERSCHILLEN VOOR DE CONTINUE MERKERS<br />

3.4.1 Response<br />

De blootstellingmerkers word<strong>en</strong> volg<strong>en</strong>s de natuurlijke logaritmische functie getransformeerd.<br />

Deze getransformeerde gegev<strong>en</strong>s word<strong>en</strong> in de regressie modell<strong>en</strong> als response variabel<strong>en</strong> gebruikt.<br />

De red<strong>en</strong> hiervoor is dat de oorspronkelijke gegev<strong>en</strong>s niet normaal verdeeld zijn.<br />

3.4.2 Gecorrigeerde gemiddeld<strong>en</strong><br />

Met gecorrigeerde gegev<strong>en</strong>s bedoel<strong>en</strong> we dat we gemiddeld<strong>en</strong>/proporties per gebied berek<strong>en</strong><strong>en</strong><br />

waarbij we rek<strong>en</strong>ing houd<strong>en</strong> de sam<strong>en</strong>stelling van het gebied. In feite voorspell<strong>en</strong> we het gemiddelde<br />

(de proportie) dat we in e<strong>en</strong> bepaald gebied verwacht<strong>en</strong> voor e<strong>en</strong> bepaalde moeder. En dit do<strong>en</strong> we<br />

voor elk gebied voor dezelfde moeder. M.a.w. de verschill<strong>en</strong> die we dan nog tuss<strong>en</strong> de gebied<strong>en</strong> zi<strong>en</strong>,<br />

kunn<strong>en</strong> niet te wijt<strong>en</strong> zijn aan verschill<strong>en</strong> in de populaties van de gebied<strong>en</strong>. Merk op dat dit niet<br />

helemaal correct is; we corriger<strong>en</strong> immers slecht voor <strong>en</strong>kele populatiek<strong>en</strong>merk<strong>en</strong>.<br />

De factor<strong>en</strong> waarvoor we corriger<strong>en</strong> verschill<strong>en</strong> van merker tot merker (zie hiervoor sectie 7). Voor de<br />

blootstellingmerkers corriger<strong>en</strong> we steeds voor de leeftijd van de moeder <strong>en</strong> het actief rookgedrag<br />

voor <strong>en</strong> tijd<strong>en</strong>s de zwangerschap van de moeder.<br />

De gecorrigeerde gemiddeld<strong>en</strong> word<strong>en</strong> bekom<strong>en</strong> op basis van e<strong>en</strong> meervoudig regressie model waar<br />

vier parameters als verklar<strong>en</strong>de variabel<strong>en</strong> zijn opg<strong>en</strong>om<strong>en</strong>:<br />

- Leeftijd: in 5 klass<strong>en</strong>.<br />

- Pakjar<strong>en</strong> = totaal aantal sigarett<strong>en</strong> ooit gerookt (berek<strong>en</strong>d op basis van gemiddeld<strong>en</strong>): in 3<br />

klass<strong>en</strong>.<br />

- Roker tijd<strong>en</strong>s zwangerschap : ja/nee. Het aandeel vrouw<strong>en</strong> dat tijd<strong>en</strong>s de zwangerschap<br />

rookt is gelukkig laag. Maar hierdoor hebb<strong>en</strong> we niet zoveel informatie over de relatie tuss<strong>en</strong><br />

de blootstellingmerker <strong>en</strong> het aantal sigarett<strong>en</strong> dat dagelijks gerookt wordt tijd<strong>en</strong>s de<br />

11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!