08.09.2013 Views

Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid

Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid

Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

App<strong>en</strong>dix 7. <strong>Statistisch</strong> <strong>analyseplan</strong>.doc<br />

vastgelegd wordt door e<strong>en</strong> wiskundige functie f(x). Deze functie beschrijft hoe de gemiddelde<br />

response varieert met x:<br />

E(Yx) = f(x)<br />

De meest e<strong>en</strong>voudig situatie is deze waarbij f e<strong>en</strong> lineaire functie is: f(x)= α+β x. Dus<br />

E(Yx) = α+β x<br />

We sprek<strong>en</strong> van <strong>en</strong>kelvoudige regressie omdat we slechts één regressor variabele me<strong>en</strong>em<strong>en</strong>. De<br />

waard<strong>en</strong> van α <strong>en</strong> β word<strong>en</strong> geschat door middel van het criterium der kleinste kwadrat<strong>en</strong>. Deze<br />

methode berust er op dat m<strong>en</strong> hiermee de meest nauwkeurige te verwachte verandering van de<br />

respons-variabele Y kan schatt<strong>en</strong>, bij e<strong>en</strong> zekere constante waarde van de onafhankelijke x-variabele.<br />

Indi<strong>en</strong> we veronderstell<strong>en</strong> dat de Ei~N(0,σ 2 ), met andere woord<strong>en</strong> dat de storingsterm<strong>en</strong> normaal<br />

verdeeld zijn met gemiddelde 0 <strong>en</strong> met dezelfde variantie, dan kunn<strong>en</strong> betrouwbaarheidsintervall<strong>en</strong><br />

voor β opgesteld word<strong>en</strong>; <strong>en</strong> kunn<strong>en</strong> hypothes<strong>en</strong> getoetst word<strong>en</strong>.<br />

- Is β = 0 dan is sprake van e<strong>en</strong> monotone horizontale lijn, ev<strong>en</strong>wijdig met de X-as. Er is dus<br />

ge<strong>en</strong> verband tuss<strong>en</strong> X <strong>en</strong> Y.<br />

- Is β < 0 dan is sprake van e<strong>en</strong> omgekeerd ev<strong>en</strong>redig (dal<strong>en</strong>d) X,Y verband.<br />

- Is β > 0 dan is sprake van e<strong>en</strong> ev<strong>en</strong>redig (stijg<strong>en</strong>d) X,Y verband.<br />

b) Logistische regressie<br />

Indi<strong>en</strong> de response binair is werkt m<strong>en</strong> met kansverhouding<strong>en</strong>, die meestal met het Engelse woord<br />

odds wordt aangeduid. De odds is de verhouding tuss<strong>en</strong> de fracties bij twee mogelijke uitkomst<strong>en</strong>. Als<br />

p de kans op de eerste uitkomst is, dan is 1− p de kans op de tweede uitkomst <strong>en</strong> is de<br />

ODDS = p/(1− p)<br />

Bij logistische regressie zijn we geïnteresseerd in het modeller<strong>en</strong> van de kans p in term<strong>en</strong> van de<br />

verklar<strong>en</strong>de variabele x. We zoud<strong>en</strong> dit kunn<strong>en</strong> prober<strong>en</strong> met de relatie p = α + βx. Helaas is dit ge<strong>en</strong><br />

goed model. Zolang β ≠ 0 gev<strong>en</strong> zeer hoge of lage waard<strong>en</strong> van x voor α + βx e<strong>en</strong> waarde die niet<br />

in overe<strong>en</strong>stemming is met het gegev<strong>en</strong> dat 0 ≤ p ≤ 1. De bij logistische regressie gekoz<strong>en</strong> oplossing<br />

voor dit probleem is het transformer<strong>en</strong> van de kansverhouding p/(1 − p) met behulp van de<br />

natuurlijke logaritme. We gebruik<strong>en</strong> voor deze transformatie de term logaritmische kansverhouding of<br />

log odds. Deze modeller<strong>en</strong> we als e<strong>en</strong> lineaire functie van de verklar<strong>en</strong>de variabele:<br />

Log[p/(1 − p)] = α + βx<br />

De helling in dit logistische regressiemodel is het verschil tuss<strong>en</strong> de log(ODDS) voor e<strong>en</strong> e<strong>en</strong>heid<br />

to<strong>en</strong>ame in x (dus bijvoorbeeld het verschil tuss<strong>en</strong> de log(ODDS) van x <strong>en</strong> x+1). De interpretatie van<br />

de resultat<strong>en</strong> in term<strong>en</strong> van de helling van de regressielijn is moeilijk. Gewoonlijk wordt e<strong>en</strong><br />

transformatie toegepast die de situatie verduidelijkt. Met <strong>en</strong>ige algebra kan word<strong>en</strong> aangetoond dat<br />

9

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!