Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
Statistisch analyseplan.pdf - Steunpunt Milieu en Gezondheid
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
App<strong>en</strong>dix 7. <strong>Statistisch</strong> <strong>analyseplan</strong>.doc<br />
vastgelegd wordt door e<strong>en</strong> wiskundige functie f(x). Deze functie beschrijft hoe de gemiddelde<br />
response varieert met x:<br />
E(Yx) = f(x)<br />
De meest e<strong>en</strong>voudig situatie is deze waarbij f e<strong>en</strong> lineaire functie is: f(x)= α+β x. Dus<br />
E(Yx) = α+β x<br />
We sprek<strong>en</strong> van <strong>en</strong>kelvoudige regressie omdat we slechts één regressor variabele me<strong>en</strong>em<strong>en</strong>. De<br />
waard<strong>en</strong> van α <strong>en</strong> β word<strong>en</strong> geschat door middel van het criterium der kleinste kwadrat<strong>en</strong>. Deze<br />
methode berust er op dat m<strong>en</strong> hiermee de meest nauwkeurige te verwachte verandering van de<br />
respons-variabele Y kan schatt<strong>en</strong>, bij e<strong>en</strong> zekere constante waarde van de onafhankelijke x-variabele.<br />
Indi<strong>en</strong> we veronderstell<strong>en</strong> dat de Ei~N(0,σ 2 ), met andere woord<strong>en</strong> dat de storingsterm<strong>en</strong> normaal<br />
verdeeld zijn met gemiddelde 0 <strong>en</strong> met dezelfde variantie, dan kunn<strong>en</strong> betrouwbaarheidsintervall<strong>en</strong><br />
voor β opgesteld word<strong>en</strong>; <strong>en</strong> kunn<strong>en</strong> hypothes<strong>en</strong> getoetst word<strong>en</strong>.<br />
- Is β = 0 dan is sprake van e<strong>en</strong> monotone horizontale lijn, ev<strong>en</strong>wijdig met de X-as. Er is dus<br />
ge<strong>en</strong> verband tuss<strong>en</strong> X <strong>en</strong> Y.<br />
- Is β < 0 dan is sprake van e<strong>en</strong> omgekeerd ev<strong>en</strong>redig (dal<strong>en</strong>d) X,Y verband.<br />
- Is β > 0 dan is sprake van e<strong>en</strong> ev<strong>en</strong>redig (stijg<strong>en</strong>d) X,Y verband.<br />
b) Logistische regressie<br />
Indi<strong>en</strong> de response binair is werkt m<strong>en</strong> met kansverhouding<strong>en</strong>, die meestal met het Engelse woord<br />
odds wordt aangeduid. De odds is de verhouding tuss<strong>en</strong> de fracties bij twee mogelijke uitkomst<strong>en</strong>. Als<br />
p de kans op de eerste uitkomst is, dan is 1− p de kans op de tweede uitkomst <strong>en</strong> is de<br />
ODDS = p/(1− p)<br />
Bij logistische regressie zijn we geïnteresseerd in het modeller<strong>en</strong> van de kans p in term<strong>en</strong> van de<br />
verklar<strong>en</strong>de variabele x. We zoud<strong>en</strong> dit kunn<strong>en</strong> prober<strong>en</strong> met de relatie p = α + βx. Helaas is dit ge<strong>en</strong><br />
goed model. Zolang β ≠ 0 gev<strong>en</strong> zeer hoge of lage waard<strong>en</strong> van x voor α + βx e<strong>en</strong> waarde die niet<br />
in overe<strong>en</strong>stemming is met het gegev<strong>en</strong> dat 0 ≤ p ≤ 1. De bij logistische regressie gekoz<strong>en</strong> oplossing<br />
voor dit probleem is het transformer<strong>en</strong> van de kansverhouding p/(1 − p) met behulp van de<br />
natuurlijke logaritme. We gebruik<strong>en</strong> voor deze transformatie de term logaritmische kansverhouding of<br />
log odds. Deze modeller<strong>en</strong> we als e<strong>en</strong> lineaire functie van de verklar<strong>en</strong>de variabele:<br />
Log[p/(1 − p)] = α + βx<br />
De helling in dit logistische regressiemodel is het verschil tuss<strong>en</strong> de log(ODDS) voor e<strong>en</strong> e<strong>en</strong>heid<br />
to<strong>en</strong>ame in x (dus bijvoorbeeld het verschil tuss<strong>en</strong> de log(ODDS) van x <strong>en</strong> x+1). De interpretatie van<br />
de resultat<strong>en</strong> in term<strong>en</strong> van de helling van de regressielijn is moeilijk. Gewoonlijk wordt e<strong>en</strong><br />
transformatie toegepast die de situatie verduidelijkt. Met <strong>en</strong>ige algebra kan word<strong>en</strong> aangetoond dat<br />
9