Folien(pdf)
Folien(pdf)
Folien(pdf)
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Nachtrag zur Vorlesung vom 8.12.2005,<br />
allgemeine IxJ-Kontingenztafel<br />
2<br />
χ<br />
=<br />
I<br />
J<br />
∑∑<br />
⎛<br />
⎜<br />
⎝<br />
n<br />
−<br />
i+<br />
i= 1 j= 1 i+<br />
+ j<br />
ij<br />
n<br />
n<br />
n<br />
n<br />
n<br />
n<br />
+<br />
j<br />
⎞<br />
⎟<br />
⎠<br />
2<br />
=<br />
I<br />
J<br />
∑∑<br />
i= 1 j=<br />
1<br />
( ) n − e<br />
ij<br />
e<br />
ij<br />
ij<br />
2<br />
1<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Korrelation zweier stetiger Merkmale X und Y<br />
• Grafische Darstellung zweier Merkmale als<br />
Punktewolke / Scatterplot / Streudiagramm / X-Y-<br />
Diagramm<br />
• Geht man davon aus, dass X auf Y wirkt im Sinne<br />
einer Ursache-Wirkungs-Beziehung, so ist es<br />
sinnvoll, X auf der x-Achse und Y auf der y-Achse der<br />
Grafik abzutragen (wie bei einer mathematischen<br />
Funktion)<br />
• Beispiel: siehe Vorlesung vom 20.10.2005, EKG bei<br />
Leguanen<br />
• X: Temperatur, Y: Elek. Herzachse<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
2
Scatterplot / Streudiagramm<br />
150,0<br />
100,0<br />
Elek. Herzachse<br />
50,0<br />
0,0<br />
15,0 20,0 25,0 30,0 35,0<br />
Temperatur<br />
3<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson<br />
• Die Korrelation nach Bravais-Pearson ist ein Maß für<br />
den linearen Zusammenhang von X und Y<br />
• Exakter linearer Zusammenhang: y = a + bx (Gerade)<br />
• Exakte lineare Zusammenhänge sind bei<br />
empirischen Daten nicht zu erwarten. Bestenfalls<br />
erhält man eine Punktewolke, die einen<br />
approximativen linearen Zusammenhang nahe legt<br />
• Beispiel (nächste Folie): Linearer Zusammenhang in<br />
rechter Grafik „stärker“ als in linker Grafik<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
4
Korrelation nach Bravais-Pearson II<br />
150,0<br />
1,000000<br />
Elek. Herzachse<br />
100,0<br />
50,0<br />
II RT Intervall<br />
0,800000<br />
0,600000<br />
0,400000<br />
0,0<br />
0,200000<br />
15,0 20,0 25,0 30,0 35,0<br />
Temperatur<br />
0,00 1,00 2,00 3,00<br />
Gewicht<br />
5<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Korrelation nach Bravais-Pearson III<br />
• Visuelle Beurteilung genügt nicht. Wir brauchen eine Maßzahl<br />
• Der Korrelationskoeffizient nach Bravais-Pearson ist eine<br />
solche normierte Maßzahl<br />
• Definition:<br />
r<br />
XY<br />
=<br />
n<br />
n<br />
∑( x − x)( y − y)<br />
i<br />
i<br />
i=<br />
1<br />
∑( x − x) 2<br />
⋅∑( y − y)<br />
i<br />
i<br />
i= 1 i=<br />
1<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
n<br />
2<br />
6
Korrelation nach Bravais-Pearson IV<br />
x :<br />
y :<br />
Arithmetisches Mittel<br />
Arithmetisches Mittel<br />
von X<br />
von Y<br />
• Der Korrelationskoeffizient nimmt Werte im Bereich<br />
-1 ≤ r XY ≤ +1<br />
an.<br />
• r XY = +1 : Perfekter positiver linearer Zusammenhang, d.h.<br />
alle Punkte liegen exakt auf einer Geraden y = a+bx mit b>0<br />
• r XY = -1 : Perfekter negativer linearer Zusammenhang, d.h.<br />
alle Punkte liegen exakt auf einer Geraden y = a+bx mit b
Korrelation nach Bravais-Pearson V<br />
• r XY =0: Die Merkmale sind linear unabhängig<br />
• Hypothetische Datenbeispiele zur<br />
Veranschaulichung<br />
8<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Beispiel 1: r XY =+1, exakter positiver linearer<br />
Zusammenhang<br />
Daten:<br />
x y<br />
1 12<br />
2 14<br />
3 16<br />
4 18<br />
5 20<br />
6 22<br />
y=10+2 x<br />
9<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Beispiel 2: r XY =-1, exakter negativer linearer<br />
Zusammenhang<br />
Daten:<br />
x y<br />
1 8<br />
2 6<br />
3 4<br />
4 2<br />
5 0<br />
6 -2<br />
y=10-2 x<br />
10<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Beispiel 3: r XY =0.72, starker positiver linearer<br />
Zusammenhang<br />
Daten:<br />
x y<br />
1 12<br />
2 15<br />
3 13<br />
4 18<br />
5 17<br />
6 16<br />
11<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Beispiel 4: r XY ≈ 0, kein linearer Zusammenhang<br />
Daten:<br />
x y<br />
1 10<br />
2 12<br />
3 9<br />
4 10<br />
5 8.33<br />
6 12<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
12
Beispiel 5: r XY = 0, kein linearer Zusammenhang<br />
Daten:<br />
x y<br />
1 3.125<br />
2 1.125<br />
3 0.125<br />
4 0.125<br />
5 1.125<br />
6 3.125<br />
y<br />
=<br />
0.5⋅<br />
( x − x<br />
2<br />
)<br />
13<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Alternative: Rangkorrelationskoeffizient nach<br />
Spearman r Sp<br />
• Alternative zum Korrelationskoeffizienten nach<br />
Bravais-Pearson, wenn<br />
– X metrisch, Y ordinal<br />
– Y metrisch, X ordinal<br />
– X ordinal, Y ordinal<br />
– der Fokus nicht auf der Linearität des<br />
Zusammenhangs liegt, sondern nur interessiert,<br />
ob der Zusammenhang monoton ist<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
14
Definition von r Sp<br />
• Vorarbeit: Die Originaldaten werden durch Rangzahlen<br />
ersetzt<br />
• Die Berechnung erfolgt wie beim Korrelationskoeffizienten<br />
nach Bravais-Pearson, indem statt den Originaldaten ihre<br />
Ränge verwendet werden:<br />
r<br />
XY<br />
=<br />
n<br />
∑<br />
n<br />
∑<br />
i=<br />
1<br />
( Rang( x ) − Rang( x)<br />
)( Rang( y ) − Rang( y)<br />
)<br />
i<br />
( )<br />
2<br />
Rang( x ) − Rang( x)<br />
⋅ ( Rang( y ) − Rang( y)<br />
)<br />
∑<br />
i<br />
i= 1 i=<br />
1<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
n<br />
i<br />
i<br />
15<br />
2
Fortsetzung Beispiel 3 (Seite 11)<br />
i<br />
Originaldaten<br />
Rangdaten<br />
x<br />
y<br />
Rang(x)<br />
Rang(y)<br />
1<br />
1<br />
12<br />
1<br />
1<br />
2<br />
2<br />
15<br />
2<br />
3<br />
3<br />
3<br />
13<br />
3<br />
2<br />
4<br />
4<br />
18<br />
4<br />
6<br />
5<br />
5<br />
17<br />
5<br />
5<br />
6<br />
6<br />
16<br />
6<br />
4<br />
16<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Fortsetzung Beispiel 3 (II)<br />
Rang( x)<br />
=<br />
Rang( y)<br />
= 3.5 = (1 +<br />
2 + 3 + 4 + 5 + 6) / 6<br />
Zähler :<br />
(1 − 3.5) ⋅(1<br />
− 3.5) + (2 − 3.5) ⋅(3<br />
− 3.5) + (3 − 3.5) ⋅(2<br />
− 3.5) +<br />
(4 − 3.5) ⋅(6<br />
− 3.5) + (5 − 3.5) ⋅(5<br />
− 3.5) + (6 − 3.5) ⋅(4<br />
− 3.5) =<br />
6.25 + 0.75 + 0.75 + 1.25 + 2.25 + 1.25 = 12.5<br />
Nenner :<br />
r Sp<br />
17.5⋅17.5<br />
= 17.5<br />
= 12.5 /17.5 = 0.71<br />
17<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Hinweise<br />
• -1 ≤ r Sp ≤ +1<br />
• Sind alle (Original-)Werte von X und Y verschieden,<br />
so sind die Rangzahlen eindeutig zu vergeben. Man<br />
sagt: es treten keine Bindungen (no ties) auf<br />
• Kommen (Original-)Werte von X und/oder Y doppelt<br />
oder mehrmals vor, so wird folgender „Trick“<br />
angewendet (Verwendung von Durchschnittsrängen):<br />
Datenreihe y: 12 13 13 14 15 15 15 16<br />
Rangzahlen : 1 2.5 2.5 4 6 6 6 8<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
18
Hinweise (II)<br />
• Kommen keine Bindungen vor, so kann r Sp einfacher<br />
berechnet werden:<br />
r<br />
Sp<br />
mit<br />
=<br />
d<br />
i<br />
n<br />
1−<br />
i=<br />
1<br />
2<br />
=<br />
6<br />
∑<br />
n(<br />
n<br />
Rang<br />
d<br />
2<br />
i<br />
−1)<br />
( x ) − Rang( y )<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
i<br />
i<br />
19
Fortsetzung (II) Beispiel 3 (Seite 11)<br />
6<br />
∑<br />
i=<br />
1<br />
r<br />
Sp<br />
d<br />
2<br />
i<br />
=<br />
(1 −1)<br />
(4 −<br />
2<br />
6)<br />
= 0 + 1+<br />
1+<br />
+ (2 − 3)<br />
4 + 0 + 4<br />
= 10<br />
6⋅10<br />
= 1−<br />
= 0.71<br />
2<br />
6⋅(6<br />
−1)<br />
2<br />
2<br />
+ (5 − 5)<br />
+ (3 −<br />
2<br />
+ (6 −<br />
2)<br />
2<br />
4)<br />
2<br />
+<br />
20<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005
Noch ein Beispiel<br />
• Datenreihe x: 1 2 3 4 5 6<br />
• Datenreihe y: 1 4 9 16 25 36<br />
• y=x 2<br />
• Zusammenhang ist monoton (quadratisch), aber nicht<br />
linear<br />
• Rang(x i )=Rang(y i )<br />
• r Sp =1 (da d i =0 für alle Paare i)<br />
• r nach Bravais-Pearson ist 0.98<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
21
Scheinkorrelationen (Nonsens-Korr.)<br />
• Klassiker: Positive Korrelation zwischen der Anzahl<br />
beobachteter Störche und der Anzahl der Geburten<br />
in Regionen in Deutschland (Korrelation ≠ Kausalität)<br />
• Confounder-Problematik (u.a.)<br />
• Im Storchenbeispiel: es gibt andere Variablen<br />
(Urbanität, Sozialverhalten), die ihrerseits assoziert<br />
sein können und mit den untersuchten Variablen<br />
(Anzahl Störche, Anzahl Geburten) in Verbindung<br />
stehen<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
22
Weitere Anmerkungen<br />
• Auch das Gegenteil von Scheinkorrelation kann<br />
auftreten: Tatschlich vorhandene Korrelationen<br />
werden nicht erkannt<br />
• Vorzeichenumkehr: in der Gesamtpopulation wird<br />
eine (z.B.) positive Korrelation beobachtet. Zerlegt<br />
man die Gesamtpopulationen in Teilpopulationen, so<br />
kann der Fall eintreten, dass in jeder Teilpopulation<br />
eine negative Korrelation beobachtet wird<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
23
Zusammenfassung I (was Sie wissen sollten)<br />
• Der Korrelationskoeffizient nach Bravais-Pearson ist ein<br />
Maß für den linearen Zusammenhang von zwei stetigen<br />
Merkmalen (grafisch: Streudiagramm). Wert in [-1;1]<br />
• Der Rangkorrelationskoeffizient nach Spearman ist ein<br />
Maß für den monotonen Zusammenhang. Die beiden<br />
Merkmale können stetig und ordinal sein (alle<br />
Kombinationen erlaubt: stetig/stetig, stetig/ordinal,<br />
ordinal/ordinal). Er verwendet Ränge statt Originalwerte<br />
(Berechnungsformel wie bei Bravais-Pearson bzw.<br />
vereinfachte Formel, wenn keine Bindungen vorkommen)<br />
• Problematik: Schein-/verdeckte Korr., Vorzeichen<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
24
Zusammenfassung II (was Sie können sollten)<br />
• Streudiagramm zeichnen<br />
• Korrelationskoeffizient nach Bravais-Pearson<br />
berechnen<br />
• Ränge bilden (auch: bei Bindungen)<br />
• Korrelationskoeffizient nach Spearman berechnen<br />
• Interpretation: linearer Zusammenhang, monotoner<br />
Zusammenhang, positiver/negativer Zusammenhang<br />
Vorlesung: Biometrie für Studierende<br />
der Veterinärmedizin 15.12.2005<br />
25