30.01.2014 Aufrufe

Folien 67a - Fakultät Informatik/Mathematik

Folien 67a - Fakultät Informatik/Mathematik

Folien 67a - Fakultät Informatik/Mathematik

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Feststellung der Korrelation zweier Zufallsvariabler X und Y<br />

• Entnahme einer Stichprobe vom Umfang n aus der zweidimensionalen<br />

Grundgesamtheit ⇒ n geordnete Wertepaare<br />

(x 1 ; y 1 ), (x 2 ; y 2 ), . . . , (x n ; y n )<br />

• Darstellung dieser Wertepaare in einem rechtwinkligen kartesischen<br />

Koordinatensystem (”Punktwolke” im Streuungsdiagramm)<br />

• Kennzeichnung des Zusammenhangs zwischen den beiden Zufallsvariablen<br />

X und Y mit Hilfe der beiden Kennwerte:<br />

empirische Kovarianz: s xy = 1 n∑<br />

n − 1 · (x i − x)(y i − y)<br />

empirischer Korrelationskoeffizient: r = s xy<br />

s x · s y<br />

,<br />

wobei: x = 1 n ·<br />

n∑<br />

i=1<br />

• äquivalente Formeln:<br />

x i , y = 1 n ·<br />

n∑<br />

i=1<br />

( n∑<br />

)<br />

s xy = 1<br />

n − 1 · x i y i − n x y<br />

i=1<br />

y i , s 2 x = 1<br />

n−1 ·<br />

, r =<br />

i=1<br />

n∑<br />

(x i − x) 2 , s 2 y = 1<br />

i=1<br />

√ ( n ∑<br />

i=1<br />

n∑<br />

i=1<br />

x i y i − nx y<br />

x 2 i − n x2 ) ( n ∑<br />

i=1<br />

n−1 ·<br />

i=1<br />

y 2 i − n y2 )<br />

n∑<br />

(y i − y) 2<br />

<strong>Mathematik</strong> III - Folie <strong>67a</strong>


Feststellung der Korrelation zweier Zufallsvar. X und Y (Fortsetzung)<br />

Für den empirischen Korrelationskoeffizienten r gilt: −1 ≤ r ≤ 1. Aus der Größe<br />

von r können folgende Schlussfolgerungen gezogen werden:<br />

• Wenn sich r nur geringfügig von 1 oder -1 unterscheidet, liegen die Stichprobenpunkte<br />

(x i , y i ) nahezu auf einer Geraden (siehe Bild 1).<br />

• Falls |r| = 1 gilt, liegen die Stichprobenpunkte exakt auf einer Geraden.<br />

Es besteht eine exakte lineare Abhängigkeit zwischen den Zufallsvariablen<br />

X und Y . Für r = 1 hat die Gerade einen positiven Anstieg (siehe Bild 2a)),<br />

für r = −1 einen negativen Anstieg (siehe Bild 2b)).<br />

• Falls r = 0 gilt, besteht zwischen den Zufallsvariablen X und Y<br />

kein linearer Zusammenhang. Das bedeutet aber nicht, dass diese Zufallsvariablen<br />

stochastisch unabhängig sind.<br />

y<br />

✻<br />

✉ ✉ ✉ ✉ ✉ ✉<br />

y<br />

✻<br />

<br />

✉<br />

✉<br />

<br />

✉<br />

✉<br />

<br />

✉ ✉<br />

<br />

y<br />

✻<br />

❙✉<br />

❙ ✉<br />

❙<br />

❙✉<br />

❙<br />

❙<br />

❙✉<br />

❙ ✉<br />

❙<br />

❙<br />

✉<br />

❙<br />

✲<br />

x<br />

✲<br />

x<br />

✲<br />

x<br />

Bild 1<br />

Bild 2a<br />

Bild 2b<br />

<strong>Mathematik</strong> III - Folie 67b


Ein Beispiel zur Berechnung der empirischen Kovarianz und des<br />

empirischen Korrelationskoeffizienten<br />

Die Jahresproduktion einer Baufirma wird als Zufallsvariable X und die Jahresgesamtkosten<br />

dieser Firma als Zufallsvariable Y aufgefasst. Die Wahrscheinlichkeitsverteilung<br />

dieser ZV ist nicht bekannt. Auf insgesamt n = 10 Baustellen<br />

wurden folgende Daten erfasst:<br />

Baustelle i 1 2 3 4 5 6 7 8 9 10<br />

Jahresprod. (in 10 4 EUR) 12 15 18 18 20 21 24 25 36 37<br />

Jahresgesamtk. (in 10 4 EUR) 11 12 16 17 18 18 20 21 26 31<br />

Es gilt: x = 1<br />

10<br />

s 2 x = 1 9<br />

s xy = 1 9<br />

10∑<br />

i=1<br />

10∑<br />

i=1<br />

x i = 22.6, y = 1<br />

10<br />

10∑<br />

i=1<br />

y i = 19.0<br />

(x i − 22.6) 2 = 68.5, s 2 y = 1 9<br />

( 10 ∑<br />

i=1<br />

x i y i − 10 · 22.6 · 19.0<br />

)<br />

10∑<br />

i=1<br />

(y i − 19.0) 2 = 36.2<br />

= 48.6667, r = 48.6667<br />

√<br />

68.5 ·<br />

√<br />

36.2<br />

= 0.9771<br />

Berechnung der Regressionsgeraden:<br />

Regressionskoeffizient: a = r · sy<br />

s x<br />

= 0.9771 ·<br />

√<br />

36.2<br />

√<br />

68.5<br />

= 0.7106,<br />

Berechnung von b: b = 19.0 − 0.7106 · 22.6 = 2.941<br />

⇒ Regressionsgerade: y = 0.7106 · x + 2.941<br />

<strong>Mathematik</strong> III - Folie 68

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!