Folien 67a - Fakultät Informatik/Mathematik
Folien 67a - Fakultät Informatik/Mathematik
Folien 67a - Fakultät Informatik/Mathematik
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Feststellung der Korrelation zweier Zufallsvariabler X und Y<br />
• Entnahme einer Stichprobe vom Umfang n aus der zweidimensionalen<br />
Grundgesamtheit ⇒ n geordnete Wertepaare<br />
(x 1 ; y 1 ), (x 2 ; y 2 ), . . . , (x n ; y n )<br />
• Darstellung dieser Wertepaare in einem rechtwinkligen kartesischen<br />
Koordinatensystem (”Punktwolke” im Streuungsdiagramm)<br />
• Kennzeichnung des Zusammenhangs zwischen den beiden Zufallsvariablen<br />
X und Y mit Hilfe der beiden Kennwerte:<br />
empirische Kovarianz: s xy = 1 n∑<br />
n − 1 · (x i − x)(y i − y)<br />
empirischer Korrelationskoeffizient: r = s xy<br />
s x · s y<br />
,<br />
wobei: x = 1 n ·<br />
n∑<br />
i=1<br />
• äquivalente Formeln:<br />
x i , y = 1 n ·<br />
n∑<br />
i=1<br />
( n∑<br />
)<br />
s xy = 1<br />
n − 1 · x i y i − n x y<br />
i=1<br />
y i , s 2 x = 1<br />
n−1 ·<br />
, r =<br />
i=1<br />
n∑<br />
(x i − x) 2 , s 2 y = 1<br />
i=1<br />
√ ( n ∑<br />
i=1<br />
n∑<br />
i=1<br />
x i y i − nx y<br />
x 2 i − n x2 ) ( n ∑<br />
i=1<br />
n−1 ·<br />
i=1<br />
y 2 i − n y2 )<br />
n∑<br />
(y i − y) 2<br />
<strong>Mathematik</strong> III - Folie <strong>67a</strong>
Feststellung der Korrelation zweier Zufallsvar. X und Y (Fortsetzung)<br />
Für den empirischen Korrelationskoeffizienten r gilt: −1 ≤ r ≤ 1. Aus der Größe<br />
von r können folgende Schlussfolgerungen gezogen werden:<br />
• Wenn sich r nur geringfügig von 1 oder -1 unterscheidet, liegen die Stichprobenpunkte<br />
(x i , y i ) nahezu auf einer Geraden (siehe Bild 1).<br />
• Falls |r| = 1 gilt, liegen die Stichprobenpunkte exakt auf einer Geraden.<br />
Es besteht eine exakte lineare Abhängigkeit zwischen den Zufallsvariablen<br />
X und Y . Für r = 1 hat die Gerade einen positiven Anstieg (siehe Bild 2a)),<br />
für r = −1 einen negativen Anstieg (siehe Bild 2b)).<br />
• Falls r = 0 gilt, besteht zwischen den Zufallsvariablen X und Y<br />
kein linearer Zusammenhang. Das bedeutet aber nicht, dass diese Zufallsvariablen<br />
stochastisch unabhängig sind.<br />
y<br />
✻<br />
✉ ✉ ✉ ✉ ✉ ✉<br />
y<br />
✻<br />
<br />
✉<br />
✉<br />
<br />
✉<br />
✉<br />
<br />
✉ ✉<br />
<br />
y<br />
✻<br />
❙✉<br />
❙ ✉<br />
❙<br />
❙✉<br />
❙<br />
❙<br />
❙✉<br />
❙ ✉<br />
❙<br />
❙<br />
✉<br />
❙<br />
✲<br />
x<br />
✲<br />
x<br />
✲<br />
x<br />
Bild 1<br />
Bild 2a<br />
Bild 2b<br />
<strong>Mathematik</strong> III - Folie 67b
Ein Beispiel zur Berechnung der empirischen Kovarianz und des<br />
empirischen Korrelationskoeffizienten<br />
Die Jahresproduktion einer Baufirma wird als Zufallsvariable X und die Jahresgesamtkosten<br />
dieser Firma als Zufallsvariable Y aufgefasst. Die Wahrscheinlichkeitsverteilung<br />
dieser ZV ist nicht bekannt. Auf insgesamt n = 10 Baustellen<br />
wurden folgende Daten erfasst:<br />
Baustelle i 1 2 3 4 5 6 7 8 9 10<br />
Jahresprod. (in 10 4 EUR) 12 15 18 18 20 21 24 25 36 37<br />
Jahresgesamtk. (in 10 4 EUR) 11 12 16 17 18 18 20 21 26 31<br />
Es gilt: x = 1<br />
10<br />
s 2 x = 1 9<br />
s xy = 1 9<br />
10∑<br />
i=1<br />
10∑<br />
i=1<br />
x i = 22.6, y = 1<br />
10<br />
10∑<br />
i=1<br />
y i = 19.0<br />
(x i − 22.6) 2 = 68.5, s 2 y = 1 9<br />
( 10 ∑<br />
i=1<br />
x i y i − 10 · 22.6 · 19.0<br />
)<br />
10∑<br />
i=1<br />
(y i − 19.0) 2 = 36.2<br />
= 48.6667, r = 48.6667<br />
√<br />
68.5 ·<br />
√<br />
36.2<br />
= 0.9771<br />
Berechnung der Regressionsgeraden:<br />
Regressionskoeffizient: a = r · sy<br />
s x<br />
= 0.9771 ·<br />
√<br />
36.2<br />
√<br />
68.5<br />
= 0.7106,<br />
Berechnung von b: b = 19.0 − 0.7106 · 22.6 = 2.941<br />
⇒ Regressionsgerade: y = 0.7106 · x + 2.941<br />
<strong>Mathematik</strong> III - Folie 68