29.07.2014 Aufrufe

Folien(pdf)

Folien(pdf)

Folien(pdf)

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Nachtrag zur Vorlesung vom 8.12.2005,<br />

allgemeine IxJ-Kontingenztafel<br />

2<br />

χ<br />

=<br />

I<br />

J<br />

∑∑<br />

⎛<br />

⎜<br />

⎝<br />

n<br />

−<br />

i+<br />

i= 1 j= 1 i+<br />

+ j<br />

ij<br />

n<br />

n<br />

n<br />

n<br />

n<br />

n<br />

+<br />

j<br />

⎞<br />

⎟<br />

⎠<br />

2<br />

=<br />

I<br />

J<br />

∑∑<br />

i= 1 j=<br />

1<br />

( ) n − e<br />

ij<br />

e<br />

ij<br />

ij<br />

2<br />

1<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Korrelation zweier stetiger Merkmale X und Y<br />

• Grafische Darstellung zweier Merkmale als<br />

Punktewolke / Scatterplot / Streudiagramm / X-Y-<br />

Diagramm<br />

• Geht man davon aus, dass X auf Y wirkt im Sinne<br />

einer Ursache-Wirkungs-Beziehung, so ist es<br />

sinnvoll, X auf der x-Achse und Y auf der y-Achse der<br />

Grafik abzutragen (wie bei einer mathematischen<br />

Funktion)<br />

• Beispiel: siehe Vorlesung vom 20.10.2005, EKG bei<br />

Leguanen<br />

• X: Temperatur, Y: Elek. Herzachse<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

2


Scatterplot / Streudiagramm<br />

150,0<br />

100,0<br />

Elek. Herzachse<br />

50,0<br />

0,0<br />

15,0 20,0 25,0 30,0 35,0<br />

Temperatur<br />

3<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Korrelation nach Bravais-Pearson<br />

• Die Korrelation nach Bravais-Pearson ist ein Maß für<br />

den linearen Zusammenhang von X und Y<br />

• Exakter linearer Zusammenhang: y = a + bx (Gerade)<br />

• Exakte lineare Zusammenhänge sind bei<br />

empirischen Daten nicht zu erwarten. Bestenfalls<br />

erhält man eine Punktewolke, die einen<br />

approximativen linearen Zusammenhang nahe legt<br />

• Beispiel (nächste Folie): Linearer Zusammenhang in<br />

rechter Grafik „stärker“ als in linker Grafik<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

4


Korrelation nach Bravais-Pearson II<br />

150,0<br />

1,000000<br />

Elek. Herzachse<br />

100,0<br />

50,0<br />

II RT Intervall<br />

0,800000<br />

0,600000<br />

0,400000<br />

0,0<br />

0,200000<br />

15,0 20,0 25,0 30,0 35,0<br />

Temperatur<br />

0,00 1,00 2,00 3,00<br />

Gewicht<br />

5<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Korrelation nach Bravais-Pearson III<br />

• Visuelle Beurteilung genügt nicht. Wir brauchen eine Maßzahl<br />

• Der Korrelationskoeffizient nach Bravais-Pearson ist eine<br />

solche normierte Maßzahl<br />

• Definition:<br />

r<br />

XY<br />

=<br />

n<br />

n<br />

∑( x − x)( y − y)<br />

i<br />

i<br />

i=<br />

1<br />

∑( x − x) 2<br />

⋅∑( y − y)<br />

i<br />

i<br />

i= 1 i=<br />

1<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

n<br />

2<br />

6


Korrelation nach Bravais-Pearson IV<br />

x :<br />

y :<br />

Arithmetisches Mittel<br />

Arithmetisches Mittel<br />

von X<br />

von Y<br />

• Der Korrelationskoeffizient nimmt Werte im Bereich<br />

-1 ≤ r XY ≤ +1<br />

an.<br />

• r XY = +1 : Perfekter positiver linearer Zusammenhang, d.h.<br />

alle Punkte liegen exakt auf einer Geraden y = a+bx mit b>0<br />

• r XY = -1 : Perfekter negativer linearer Zusammenhang, d.h.<br />

alle Punkte liegen exakt auf einer Geraden y = a+bx mit b


Korrelation nach Bravais-Pearson V<br />

• r XY =0: Die Merkmale sind linear unabhängig<br />

• Hypothetische Datenbeispiele zur<br />

Veranschaulichung<br />

8<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Beispiel 1: r XY =+1, exakter positiver linearer<br />

Zusammenhang<br />

Daten:<br />

x y<br />

1 12<br />

2 14<br />

3 16<br />

4 18<br />

5 20<br />

6 22<br />

y=10+2 x<br />

9<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Beispiel 2: r XY =-1, exakter negativer linearer<br />

Zusammenhang<br />

Daten:<br />

x y<br />

1 8<br />

2 6<br />

3 4<br />

4 2<br />

5 0<br />

6 -2<br />

y=10-2 x<br />

10<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Beispiel 3: r XY =0.72, starker positiver linearer<br />

Zusammenhang<br />

Daten:<br />

x y<br />

1 12<br />

2 15<br />

3 13<br />

4 18<br />

5 17<br />

6 16<br />

11<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Beispiel 4: r XY ≈ 0, kein linearer Zusammenhang<br />

Daten:<br />

x y<br />

1 10<br />

2 12<br />

3 9<br />

4 10<br />

5 8.33<br />

6 12<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

12


Beispiel 5: r XY = 0, kein linearer Zusammenhang<br />

Daten:<br />

x y<br />

1 3.125<br />

2 1.125<br />

3 0.125<br />

4 0.125<br />

5 1.125<br />

6 3.125<br />

y<br />

=<br />

0.5⋅<br />

( x − x<br />

2<br />

)<br />

13<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Alternative: Rangkorrelationskoeffizient nach<br />

Spearman r Sp<br />

• Alternative zum Korrelationskoeffizienten nach<br />

Bravais-Pearson, wenn<br />

– X metrisch, Y ordinal<br />

– Y metrisch, X ordinal<br />

– X ordinal, Y ordinal<br />

– der Fokus nicht auf der Linearität des<br />

Zusammenhangs liegt, sondern nur interessiert,<br />

ob der Zusammenhang monoton ist<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

14


Definition von r Sp<br />

• Vorarbeit: Die Originaldaten werden durch Rangzahlen<br />

ersetzt<br />

• Die Berechnung erfolgt wie beim Korrelationskoeffizienten<br />

nach Bravais-Pearson, indem statt den Originaldaten ihre<br />

Ränge verwendet werden:<br />

r<br />

XY<br />

=<br />

n<br />

∑<br />

n<br />

∑<br />

i=<br />

1<br />

( Rang( x ) − Rang( x)<br />

)( Rang( y ) − Rang( y)<br />

)<br />

i<br />

( )<br />

2<br />

Rang( x ) − Rang( x)<br />

⋅ ( Rang( y ) − Rang( y)<br />

)<br />

∑<br />

i<br />

i= 1 i=<br />

1<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

n<br />

i<br />

i<br />

15<br />

2


Fortsetzung Beispiel 3 (Seite 11)<br />

i<br />

Originaldaten<br />

Rangdaten<br />

x<br />

y<br />

Rang(x)<br />

Rang(y)<br />

1<br />

1<br />

12<br />

1<br />

1<br />

2<br />

2<br />

15<br />

2<br />

3<br />

3<br />

3<br />

13<br />

3<br />

2<br />

4<br />

4<br />

18<br />

4<br />

6<br />

5<br />

5<br />

17<br />

5<br />

5<br />

6<br />

6<br />

16<br />

6<br />

4<br />

16<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Fortsetzung Beispiel 3 (II)<br />

Rang( x)<br />

=<br />

Rang( y)<br />

= 3.5 = (1 +<br />

2 + 3 + 4 + 5 + 6) / 6<br />

Zähler :<br />

(1 − 3.5) ⋅(1<br />

− 3.5) + (2 − 3.5) ⋅(3<br />

− 3.5) + (3 − 3.5) ⋅(2<br />

− 3.5) +<br />

(4 − 3.5) ⋅(6<br />

− 3.5) + (5 − 3.5) ⋅(5<br />

− 3.5) + (6 − 3.5) ⋅(4<br />

− 3.5) =<br />

6.25 + 0.75 + 0.75 + 1.25 + 2.25 + 1.25 = 12.5<br />

Nenner :<br />

r Sp<br />

17.5⋅17.5<br />

= 17.5<br />

= 12.5 /17.5 = 0.71<br />

17<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Hinweise<br />

• -1 ≤ r Sp ≤ +1<br />

• Sind alle (Original-)Werte von X und Y verschieden,<br />

so sind die Rangzahlen eindeutig zu vergeben. Man<br />

sagt: es treten keine Bindungen (no ties) auf<br />

• Kommen (Original-)Werte von X und/oder Y doppelt<br />

oder mehrmals vor, so wird folgender „Trick“<br />

angewendet (Verwendung von Durchschnittsrängen):<br />

Datenreihe y: 12 13 13 14 15 15 15 16<br />

Rangzahlen : 1 2.5 2.5 4 6 6 6 8<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

18


Hinweise (II)<br />

• Kommen keine Bindungen vor, so kann r Sp einfacher<br />

berechnet werden:<br />

r<br />

Sp<br />

mit<br />

=<br />

d<br />

i<br />

n<br />

1−<br />

i=<br />

1<br />

2<br />

=<br />

6<br />

∑<br />

n(<br />

n<br />

Rang<br />

d<br />

2<br />

i<br />

−1)<br />

( x ) − Rang( y )<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

i<br />

i<br />

19


Fortsetzung (II) Beispiel 3 (Seite 11)<br />

6<br />

∑<br />

i=<br />

1<br />

r<br />

Sp<br />

d<br />

2<br />

i<br />

=<br />

(1 −1)<br />

(4 −<br />

2<br />

6)<br />

= 0 + 1+<br />

1+<br />

+ (2 − 3)<br />

4 + 0 + 4<br />

= 10<br />

6⋅10<br />

= 1−<br />

= 0.71<br />

2<br />

6⋅(6<br />

−1)<br />

2<br />

2<br />

+ (5 − 5)<br />

+ (3 −<br />

2<br />

+ (6 −<br />

2)<br />

2<br />

4)<br />

2<br />

+<br />

20<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005


Noch ein Beispiel<br />

• Datenreihe x: 1 2 3 4 5 6<br />

• Datenreihe y: 1 4 9 16 25 36<br />

• y=x 2<br />

• Zusammenhang ist monoton (quadratisch), aber nicht<br />

linear<br />

• Rang(x i )=Rang(y i )<br />

• r Sp =1 (da d i =0 für alle Paare i)<br />

• r nach Bravais-Pearson ist 0.98<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

21


Scheinkorrelationen (Nonsens-Korr.)<br />

• Klassiker: Positive Korrelation zwischen der Anzahl<br />

beobachteter Störche und der Anzahl der Geburten<br />

in Regionen in Deutschland (Korrelation ≠ Kausalität)<br />

• Confounder-Problematik (u.a.)<br />

• Im Storchenbeispiel: es gibt andere Variablen<br />

(Urbanität, Sozialverhalten), die ihrerseits assoziert<br />

sein können und mit den untersuchten Variablen<br />

(Anzahl Störche, Anzahl Geburten) in Verbindung<br />

stehen<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

22


Weitere Anmerkungen<br />

• Auch das Gegenteil von Scheinkorrelation kann<br />

auftreten: Tatschlich vorhandene Korrelationen<br />

werden nicht erkannt<br />

• Vorzeichenumkehr: in der Gesamtpopulation wird<br />

eine (z.B.) positive Korrelation beobachtet. Zerlegt<br />

man die Gesamtpopulationen in Teilpopulationen, so<br />

kann der Fall eintreten, dass in jeder Teilpopulation<br />

eine negative Korrelation beobachtet wird<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

23


Zusammenfassung I (was Sie wissen sollten)<br />

• Der Korrelationskoeffizient nach Bravais-Pearson ist ein<br />

Maß für den linearen Zusammenhang von zwei stetigen<br />

Merkmalen (grafisch: Streudiagramm). Wert in [-1;1]<br />

• Der Rangkorrelationskoeffizient nach Spearman ist ein<br />

Maß für den monotonen Zusammenhang. Die beiden<br />

Merkmale können stetig und ordinal sein (alle<br />

Kombinationen erlaubt: stetig/stetig, stetig/ordinal,<br />

ordinal/ordinal). Er verwendet Ränge statt Originalwerte<br />

(Berechnungsformel wie bei Bravais-Pearson bzw.<br />

vereinfachte Formel, wenn keine Bindungen vorkommen)<br />

• Problematik: Schein-/verdeckte Korr., Vorzeichen<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

24


Zusammenfassung II (was Sie können sollten)<br />

• Streudiagramm zeichnen<br />

• Korrelationskoeffizient nach Bravais-Pearson<br />

berechnen<br />

• Ränge bilden (auch: bei Bindungen)<br />

• Korrelationskoeffizient nach Spearman berechnen<br />

• Interpretation: linearer Zusammenhang, monotoner<br />

Zusammenhang, positiver/negativer Zusammenhang<br />

Vorlesung: Biometrie für Studierende<br />

der Veterinärmedizin 15.12.2005<br />

25

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!