26.07.2013 Views

G:\Statistiske grundbegreber-v8\s1v8-forside.wpd

G:\Statistiske grundbegreber-v8\s1v8-forside.wpd

G:\Statistiske grundbegreber-v8\s1v8-forside.wpd

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

9.2 KOVARIANS OG KORRELATIONSKOEFFICIENT<br />

127<br />

9.1 Indledning<br />

Vi har omtalt, at hver stokastisk variabel har en varians. Men et par variable X 1 og X 2 kan have en tendens til at variere<br />

i overensstemmelse med hinanden (samvarians), således at afvigelserne X1 − µ 1 og X 2 − µ 2 overvejende har samme<br />

fortegn (positiv korrelation) eller overvejende har modsat fortegn (negativ korrelation). Eksempelvis kan en høj<br />

forekomst af ét vitamin i et levnedsmiddel ofte være ledsaget af en høj forekomst af et andet vitamin (positiv korrelation).<br />

Og studerendes højde og masse kan også have en positiv korrelation.<br />

r<br />

Vi betragter igen en k-dimensional stokastisk variabel X = ( X X X . For et par af variable og defineres<br />

1, 2,..., k )<br />

X X i j<br />

kovariansen (“samvariansen”)<br />

( µ µ )<br />

V( X , X ) ≡ E ( X − ) ⋅( X − )<br />

i j i i j j<br />

(den giver jo et vist mål for, om afvigelserne X i − µ og X i j − µ j i middel har samme fortegn eller modsat fortegn).<br />

Sættes i = j, fås V( Xi, Xi) = E( ( Xi<br />

− µ i)<br />

) , som er identisk med variansen for variablen<br />

2<br />

V( Xi) X i<br />

( )<br />

2 2<br />

Man kan vise (se nedenfor), at V( X , X ) = E X ⋅ X − ⋅ , som for i = j giver V( X ) = E X − µ .<br />

i j i j i j<br />

µ µ ( )<br />

i i i<br />

Bevis:<br />

V( Xi, X j) ≡ E( ( Xi − µ i) ⋅( X j − µ j) ) = E( XiX j − µ iX j − Xiµ<br />

j + µ iµ j)<br />

.<br />

Anvendes linearitetsreglen kan sidste led omformes:<br />

= E( X X ) − µ E( X ) − E( X ) µ + µ µ = E( X X ) − µ µ − µ µ + µ µ = E( X X ) − µµ<br />

i j i j i j i j i j i j i j i j<br />

i j i j<br />

For bedre at kunne vurdere hvor meget de variable varierer i “takt” med hinanden, divideres kovariansen med<br />

spredningerne, så man får den såkaldte korrelationskoefficient:<br />

V( Xi, X j)<br />

ρ(<br />

Xi, X j)<br />

≡<br />

σ ⋅ σ<br />

1 2<br />

Man kan vise (se nedenfor) , at −1≤ ρ( X , X ) ≤ 1.<br />

i j<br />

Bevis: Vi har<br />

0 ≤ E<br />

⎛⎜<br />

⎝ λ ⋅ Xi − µ i + X j − µ j<br />

2<br />

⎞ ( ) ⎟<br />

2 2 2<br />

( ) ( ) ⎠ = E( λ ⋅( Xi − µ i) + 2λ<br />

( Xi − µ i)( X j − µ j) + ( X j − µ j)<br />

)<br />

2<br />

( ( i i) ) 2 ( ( i i)( j j) ) ( ( j j)<br />

) = λ ⋅ V Xi + 2V<br />

Xi X j λ + V X j<br />

= λ ⋅ E X − µ + λ E X − µ X − µ + E X − µ<br />

2 2 2<br />

λ<br />

( ) ( , ) ( )<br />

Da dette andengradspolynomium i aldrig er negativt, kan diskriminanten ikke være positiv, dvs.<br />

( )<br />

2<br />

V( Xi, X j)<br />

2<br />

4( V( Xi, X j) ) −4⋅V( Xi) ⋅V( X j)<br />

≤0⇔ ≤1⇔ ( ρ( Xi, X j)<br />

) ≤1<br />

⇔−1≤ρ( Xi, X j)<br />

≤1<br />

.<br />

V( X ) ⋅V(<br />

X )<br />

i j<br />

2

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!