G:\Statistiske grundbegreber-v8\s1v8-forside.wpd
G:\Statistiske grundbegreber-v8\s1v8-forside.wpd
G:\Statistiske grundbegreber-v8\s1v8-forside.wpd
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
9.2 KOVARIANS OG KORRELATIONSKOEFFICIENT<br />
127<br />
9.1 Indledning<br />
Vi har omtalt, at hver stokastisk variabel har en varians. Men et par variable X 1 og X 2 kan have en tendens til at variere<br />
i overensstemmelse med hinanden (samvarians), således at afvigelserne X1 − µ 1 og X 2 − µ 2 overvejende har samme<br />
fortegn (positiv korrelation) eller overvejende har modsat fortegn (negativ korrelation). Eksempelvis kan en høj<br />
forekomst af ét vitamin i et levnedsmiddel ofte være ledsaget af en høj forekomst af et andet vitamin (positiv korrelation).<br />
Og studerendes højde og masse kan også have en positiv korrelation.<br />
r<br />
Vi betragter igen en k-dimensional stokastisk variabel X = ( X X X . For et par af variable og defineres<br />
1, 2,..., k )<br />
X X i j<br />
kovariansen (“samvariansen”)<br />
( µ µ )<br />
V( X , X ) ≡ E ( X − ) ⋅( X − )<br />
i j i i j j<br />
(den giver jo et vist mål for, om afvigelserne X i − µ og X i j − µ j i middel har samme fortegn eller modsat fortegn).<br />
Sættes i = j, fås V( Xi, Xi) = E( ( Xi<br />
− µ i)<br />
) , som er identisk med variansen for variablen<br />
2<br />
V( Xi) X i<br />
( )<br />
2 2<br />
Man kan vise (se nedenfor), at V( X , X ) = E X ⋅ X − ⋅ , som for i = j giver V( X ) = E X − µ .<br />
i j i j i j<br />
µ µ ( )<br />
i i i<br />
Bevis:<br />
V( Xi, X j) ≡ E( ( Xi − µ i) ⋅( X j − µ j) ) = E( XiX j − µ iX j − Xiµ<br />
j + µ iµ j)<br />
.<br />
Anvendes linearitetsreglen kan sidste led omformes:<br />
= E( X X ) − µ E( X ) − E( X ) µ + µ µ = E( X X ) − µ µ − µ µ + µ µ = E( X X ) − µµ<br />
i j i j i j i j i j i j i j i j<br />
i j i j<br />
For bedre at kunne vurdere hvor meget de variable varierer i “takt” med hinanden, divideres kovariansen med<br />
spredningerne, så man får den såkaldte korrelationskoefficient:<br />
V( Xi, X j)<br />
ρ(<br />
Xi, X j)<br />
≡<br />
σ ⋅ σ<br />
1 2<br />
Man kan vise (se nedenfor) , at −1≤ ρ( X , X ) ≤ 1.<br />
i j<br />
Bevis: Vi har<br />
0 ≤ E<br />
⎛⎜<br />
⎝ λ ⋅ Xi − µ i + X j − µ j<br />
2<br />
⎞ ( ) ⎟<br />
2 2 2<br />
( ) ( ) ⎠ = E( λ ⋅( Xi − µ i) + 2λ<br />
( Xi − µ i)( X j − µ j) + ( X j − µ j)<br />
)<br />
2<br />
( ( i i) ) 2 ( ( i i)( j j) ) ( ( j j)<br />
) = λ ⋅ V Xi + 2V<br />
Xi X j λ + V X j<br />
= λ ⋅ E X − µ + λ E X − µ X − µ + E X − µ<br />
2 2 2<br />
λ<br />
( ) ( , ) ( )<br />
Da dette andengradspolynomium i aldrig er negativt, kan diskriminanten ikke være positiv, dvs.<br />
( )<br />
2<br />
V( Xi, X j)<br />
2<br />
4( V( Xi, X j) ) −4⋅V( Xi) ⋅V( X j)<br />
≤0⇔ ≤1⇔ ( ρ( Xi, X j)<br />
) ≤1<br />
⇔−1≤ρ( Xi, X j)<br />
≤1<br />
.<br />
V( X ) ⋅V(<br />
X )<br />
i j<br />
2