06.08.2013 Views

Stokastiske variable

Stokastiske variable

Stokastiske variable

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Nanostatistik: Stokastisk variabel<br />

JLJ<br />

Nanostatistik: Stokastisk variabel – p. 1/29


Repetition<br />

Ω: udfaldsrummet: alle de mulige udfald af et experiment<br />

P(A): ss for hændelsen A = frekvens i uafhængige<br />

gentagelser<br />

P(A ∪ B) = P(A) + P(B) når A og B er disjunkte<br />

hændelser<br />

Ex: Kaster en terning to gange.<br />

Ω = {(1, 1), (1, 2),... , (6, 5), (6, 6)}<br />

P(max =3 eller sum = 7) = P((1, 3), (2, 3), (3, 3), (3, 2), (3, 1)<br />

eller (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1))<br />

= P(max =3) + P(sum = 7)<br />

Nanostatistik: Stokastisk variabel – p. 2/29


Stokastisk variabel<br />

Udfald ω ∈ Ω: et meget kompliceret objekt<br />

Experiment: måle nogle få egenskaber ved ω<br />

Ex: Ω = alle danske mænd over 20 år<br />

experiment: vælge en tilfældig person og måle højden<br />

Stokastisk variabel X: en egenskab ved ω der angives ved<br />

et reelt tal (vi bruger store bogstaver for stokastiske<br />

<strong>variable</strong>)<br />

Formelt: X er en afbildning fra Ω ind i de reelle tal<br />

Diskret stokastisk variabel: X kan kun antage heltallige<br />

værdier<br />

Kontinuert stokastisk variabel: X kan antage alle mulige<br />

værdier<br />

Nanostatistik: Stokastisk variabel – p. 3/29


Stokastisk variabel<br />

Ex1: Møntkast: X(pl) = 0, X(kr) = 1<br />

Ex2: Terningekast:<br />

<br />

X(m øjne) = m<br />

Y (m øjne) =<br />

0<br />

1<br />

hvis m er ulige<br />

hvis m er lige<br />

Ex3: Ω = alle mulige egetræer<br />

X(ω) = antallet af blade på træet ω (diskret)<br />

X(ω) = højden af træet ω (kontinuert)<br />

Nanostatistik: Stokastisk variabel – p. 4/29


Diskret stokastisk variabel<br />

X(ω) = i fortæller os ikke direkte hvad ω er<br />

Ex2: Y = 1 hvis et lige antal øjne på terning<br />

Y = 1 fortæller os at vi har fået enten 2, 4 eller 6 øjne<br />

X(ω) = i ⇔ ω ∈ Ωi = {˜ω|X(˜ω) = i}<br />

ss for X = i: P(X=i)<br />

= frekvens af værdien i i uafhængige gentagelser<br />

= frekvens hvormed vi får hændelsen Ωi = P(Ωi)<br />

Ex2: P(Y = 1) = P({2, 4, 6}) = 3 6<br />

Ex3: Kaste terning 2 gange.<br />

X = øjne i kast 1 - øjne i kast 2<br />

P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4<br />

36<br />

Nanostatistik: Stokastisk variabel – p. 5/29


ss-funktion<br />

Notation: sandsynlighedsfunktionen<br />

fX(i) = P(X = i)<br />

Da fX(i) = P(X = i) har vi<br />

( <br />

i fx(i) = <br />

i<br />

0 ≤ fX(i) ≤ 1 <br />

fX(i) = 1<br />

P(X = i) = <br />

i P(Ωi) = P(Ω) = 1)<br />

Notation: Den kumulerede ss-funktion =<br />

fordelingsfunktionen<br />

FX(x) = P(X ≤ x) = <br />

i≤x<br />

i<br />

P(X = i) = <br />

i≤x fX(i)<br />

Nanostatistik: Stokastisk variabel – p. 6/29


ss-funktion<br />

Regneregel: Hvis B er en delmængde af A gælder der<br />

P(A \ B) = P(A) − P(B)<br />

da A = B ∪ (A \ B) har vi P(A) = P(B) + P(A \ B)<br />

FX ↔ fX:<br />

fx(i) = P(X = i) = P(X ≤ i) − P(X ≤ i − 1)<br />

Mere generelt:<br />

VIS PLOT<br />

= FX(i) − FX(i − 1)<br />

P(a < X ≤ b) = FX(b) − FX(a)<br />

Nanostatistik: Stokastisk variabel – p. 7/29


eksempel<br />

Ex3: Kaste terning 2 gange.<br />

X = øjne i kast 1 - øjne i kast 2<br />

P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4<br />

36<br />

fX(0) = P(X = 0) = 6<br />

36<br />

fX(1) = P(X = 1) = 5<br />

36<br />

fX(2) = P(X = 2) = 4<br />

36<br />

.<br />

fX(5) = P(X = 5) = 1<br />

36<br />

Vis Plot<br />

= P(X = −1) = fX(−1)<br />

= P(X = −2) = fX(−2)<br />

= P(X = −5) = fX(−5)<br />

Nanostatistik: Stokastisk variabel – p. 8/29


Simultan ss<br />

X og Y : to stokastisk <strong>variable</strong> defineret på samme<br />

udfaldsrum Ω<br />

X : Ω → N Y : Ω → N<br />

Ex: Ω = danske mænd over 20 år<br />

X = højde i hele cm, Y = vægt i hele kg<br />

Den simultane sandsynlighed er<br />

fX,Y (i,j) = P(X = i,Y = j)<br />

= P({ω|X(ω) = i og Y (ω) = j)<br />

Læses: ss for at X = i og Y = j, dvs ss for fællesmængden<br />

{ω|X(ω) = i} ∩ {ω|Y (ω) = j}<br />

Nanostatistik: Stokastisk variabel – p. 9/29


Simultan ss<br />

Ex: Kaster to terninger<br />

Ω = {(i,j)|1 ≤ i,j ≤ 6}<br />

X = max af de to par øjne<br />

Y = summen af de to par øjne<br />

De mulige værdier af X er 1, 2, 3, 4, 5, 6<br />

og de mulige værdier af Y er 2, 3,...,12.<br />

VIS PLOT<br />

Lav tabel på tavlen<br />

P(X = 3,Y = 5) = P({(2, 3), (3, 2)}) = 2<br />

36<br />

Nanostatistik: Stokastisk variabel – p. 10/29


Marginal ss<br />

Fra P(X = i,Y = j) til P(X = i): Da<br />

{ω|X(ω) = i} = ∪j{ω|X(ω) = i,Y (ω) = j}<br />

og disse mængder er disjunkte har vi<br />

P(X = i) = <br />

P(X = i,Y = j)<br />

Ex: Kast med to terninger: X = max, Y = sum<br />

P(X = 3) = P(X = 3,Y = 2) + P(X = 3,Y = 3)<br />

VIS PLOT<br />

= 2<br />

36<br />

j<br />

+P(X = 3,Y = 4) + · · · + P(X = 3,Y = 12)<br />

+ 2<br />

36<br />

+ 1<br />

36<br />

Nanostatistik: Stokastisk variabel – p. 11/29


Betinget ss<br />

Ex: ss for flyulykke under start = antal ulykker / antal starter<br />

Køber billet hos Aeroflot: er det så den rigtige ss ?<br />

Istedet: antal ulykker med Aeroflot / antal starter med<br />

Aeroflot<br />

Dette kaldes en betinget ss: jeg betinger med at det er et<br />

Aeroflot fly. P(Y = j|X = i) læses: ss for at Y er j givet at<br />

X er i<br />

P(ulykke|Aeroflot) =<br />

=<br />

= P(ulykke og Aeroflot)<br />

#(ulykker og Aeroflot)<br />

#starter<br />

#(starter og Aeroflot)<br />

#starter<br />

P(Aeroflot)<br />

#(ulykker og Aeroflot)<br />

#(starter og Aeroflot)<br />

Nanostatistik: Stokastisk variabel – p. 12/29


Betinget ss<br />

Definition: P(X = i|Y = j) =<br />

P(X=i,Y =j)<br />

P(Y =j)<br />

Ex: Kast med to terninger: X = max, Y = sum<br />

P(Y = 5|X = 3) ?<br />

Givet X = 3 kan Y enten være 4, 5 eller 6: Vis plot<br />

der er 2 udfald der giver 4, to der giver 5 og 1 der giver 6, så<br />

P(Y = 5|X = 3) = 2 5<br />

P(X = 3,Y = 5) = 2<br />

36<br />

P(Y = 5|X = 3) = 2<br />

36<br />

5<br />

36<br />

= 2 5<br />

P(X = 3) = 5<br />

36<br />

Betinget ss = frekvens i den relevante delmængde af<br />

uafhængige gentagelser<br />

Nanostatistik: Stokastisk variabel – p. 13/29


Betinget ss<br />

Trækker 2 kort fra et spil kort med 52 kort. Hvad er den<br />

betingede ss for at kort 2 er en ruder givet at kort 1 var en<br />

spar?<br />

Ω = {(i,j)|1 ≤ i,j ≤ 52,j = i}, |Ω| = 52 · 51<br />

alle udfald har samme ss<br />

antal udfald med kort 1 en spar og kort 2 en ruder =<br />

13 · 13<br />

antal udfald med kort 1 en spar = 13 · 51<br />

betingede ss = 13·13<br />

52·51<br />

13·51<br />

52·51<br />

= 13<br />

51<br />

Nanostatistik: Stokastisk variabel – p. 14/29


Betinget ss<br />

Skriver vi rundt på definitionen har vi<br />

Heraf følger<br />

P(X = i,Y = j) = P(X = i|Y = j)P(Y = j)<br />

P(X = i) = <br />

P(X = i,Y = j) = <br />

P(X = i|Y = j)P(Y = j)<br />

j<br />

j<br />

Nanostatistik: Stokastisk variabel – p. 15/29


Uafhængighed<br />

X og Y er uafhængige: Viden om Y fortæller os ikke noget<br />

om X<br />

P(X = i|Y = j) = P(X = i) for alle i,j<br />

Dette er ækvivalent med<br />

eller<br />

P(X = i,Y = j)<br />

P(Y = j)<br />

= P(X = i) for alle i,j<br />

P(X = i,Y = j) = P(X = i)P(Y = j) for alle i,j<br />

Nanostatistik: Stokastisk variabel – p. 16/29


Uafhængighed<br />

Ubevidst brug af dette: To uafhængige kast med en terning:<br />

Alle 36 muligheder har samme ss.<br />

Hver mulighed har ss 1 36 = 1 6 · 1 6<br />

Ex: Kast med to terninger: X = max, Y = sum<br />

P(Y = 5) = P({(1, 4), (2, 3), (3, 2), (4, 1)}) = 4<br />

36 = 1 9<br />

P(Y = 5|X = 3) = 2 18<br />

5 = 45<br />

Altså er Y og X ikke uafhængige:<br />

viden om X giver os viden om Y<br />

= 5<br />

45<br />

Nanostatistik: Stokastisk variabel – p. 17/29


Kontinuert stokastisk variabel<br />

Ex: registreret eet klik i geigertæller i tidsintervallet [0,T]<br />

Hvornår kom klikket? X er tidspunktet<br />

Alle tidspunkter i [0,T] er mulige, ingen er mere oplagte end<br />

andre<br />

[0,T/2] og [T/2,T] har samme ss 1 2 .<br />

Halverer vi igen får vi 4 intervaller der er lige sandsynlige:<br />

X er uniformt fordelt på [0,T]<br />

P(X = x) = 0: alle intervaller af længe 1 n<br />

må have ss T/n<br />

Nanostatistik: Stokastisk variabel – p. 18/29


Kontinuert stokastisk variabel<br />

Istedet beskriver vi X ved dens fordelingsfunktion<br />

FX(x) = P(X ≤ x)<br />

Ud fra denne kan vi finde ss for ethvert interval<br />

P(X ∈ (a,b]) = P(X ≤ b) − P(X ≤ a) = FX(b) − FX(a)<br />

Uniforme fordeling:<br />

P(a < X ≤ b) er proportional med intervallængden<br />

P(a < X ≤ b) = b−a<br />

T<br />

FX(x) = P(X ≤ x) =<br />

⎧<br />

⎪⎨<br />

⎪⎩<br />

0 x ≤ 0<br />

x<br />

T 0 ≤ x ≤ T<br />

1 x > T<br />

Nanostatistik: Stokastisk variabel – p. 19/29


Tæthed<br />

Hvis FX er differentiabel kaldes<br />

for tætheden af X, og vi har<br />

fX(x) = F ′ X (x)<br />

P(X ∈ (a,b)) = FX(b) − FX(a) =<br />

Tæthed intutitivt:<br />

for ɛ lille<br />

b<br />

P(X ∈ [x − ɛ ɛ<br />

,x +<br />

2 2 ]) ≈ fX(x) · ɛ<br />

a<br />

fX(x)dx<br />

Nanostatistik: Stokastisk variabel – p. 20/29


Tæthed<br />

EX: Uniforme fordeling på [0,T]<br />

<br />

1T 0 ≤ x ≤ T<br />

fX(x) =<br />

0 ellers<br />

Nanostatistik: Stokastisk variabel – p. 21/29


Simultan fordeling<br />

X og Y begge kontinuerte <strong>variable</strong>. Fordelingsfunktion<br />

FX,Y (x,y) = P(X ≤ x,Y ≤ y)<br />

Udregning af P(a < X ≤ b,c < Y ≤ d):<br />

VIS PLOT<br />

{a < X ≤ b,c < Y ≤ d}<br />

= {a < X ≤ b,Y ≤ d} \ {a < X ≤ b,Y ≤ c}<br />

= ({X ≤ b,Y ≤ d} \ {X ≤ a,Y ≤ d}) \<br />

({X ≤ b,Y ≤ c} \ {X ≤ a,Y ≤ c})<br />

Nanostatistik: Stokastisk variabel – p. 22/29


Simultan fordeling<br />

Udregning af P(a < X ≤ b,c < Y ≤ d):<br />

P(a < X ≤ b,c < Y ≤ d)<br />

= [F(b,d) − F(a,d)] − [F(b,c) − F(a,c)]<br />

= F(b,d) − F(a,d) − F(b,c) + F(a,c)<br />

Nanostatistik: Stokastisk variabel – p. 23/29


Intuitivt:<br />

Simultan tæthed<br />

fX,Y (x,y) = ∂FX,Y (x,y)<br />

∂x∂y<br />

P(a < X ≤ b,c < Y ≤ d) =<br />

b<br />

a<br />

d<br />

c<br />

fX,Y (u,v)dvdu<br />

P(X ∈ [x − ɛ ɛ ɛ ɛ<br />

,x + ],Y ∈ [y − ,y +<br />

2 2 2 2 ]) ≈ fX,Y (x,y) · ɛ 2<br />

Nanostatistik: Stokastisk variabel – p. 24/29


Marginal tæthed<br />

fX(x) =<br />

fY (y) =<br />

P(a < X ≤ b) =<br />

∞<br />

−∞<br />

∞<br />

−∞<br />

b<br />

a<br />

fX,Y (x,y)dy<br />

fX,Y (x,y)dx<br />

fX(x)dx<br />

Nanostatistik: Stokastisk variabel – p. 25/29


P(a < X ≤ b,c < Y ≤ d) =<br />

Uafhængighed<br />

Betinget tæthed<br />

f X|Y (x|y) = fX,Y (x,y)<br />

fY (y)<br />

d<br />

c<br />

b<br />

fX,Y (x,y) = fX(x) · fY (y)<br />

a<br />

f X|Y (x|y)dx<br />

<br />

fY (y)dy<br />

Nanostatistik: Stokastisk variabel – p. 26/29


Eksempel<br />

Lad Ω = {(x,y)|0 ≤ x,y ≤ 1} være enhedskvadratet, og lad<br />

P være den uniforme fordeling, dvs P(A) er arealet af A<br />

Lad X være 1. koordinaten, Y 2. koordinaten, og lad<br />

U = X + Y<br />

Finde betingede tæthed for X givet U<br />

=<br />

FX,U(x,u)<br />

⎧<br />

⎨<br />

⎩<br />

FU(u) =<br />

⎧<br />

⎨<br />

⎩<br />

1<br />

2 u2 u < 1<br />

1 − 1<br />

2 (2 − u)2 1 ≤ u ≤ 2,<br />

ux − 1<br />

2 x2 u < 1, 0 ≤ x ≤ u<br />

x 2 + (1 − u)(1 − x) + 1<br />

2 (1 − x)2 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />

Nanostatistik: Stokastisk variabel – p. 27/29


fU(u) =<br />

fX,U(x,u) =<br />

f X|U(x|u) =<br />

⎧<br />

⎨<br />

⎩<br />

⎧<br />

⎨<br />

⎩<br />

⎧<br />

⎨<br />

⎩<br />

Eksempel<br />

u u < 1<br />

(2 − u) 1 ≤ u ≤ 2,<br />

1 u < 1, 0 ≤ x ≤ u<br />

1 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />

1<br />

u<br />

1<br />

2−u<br />

u < 1, 0 ≤ x ≤ u<br />

1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />

Nanostatistik: Stokastisk variabel – p. 28/29


Resume<br />

Stokastisk variabel: funktion fra udfaldsrum over i de hele<br />

tal eller over i de reelle tal<br />

Sandsynlighedsfunktion (tæthed) og fordelingsfunktion<br />

To stokastiske <strong>variable</strong>: simultan sandsynlighed og betinget<br />

sandsynlighed<br />

Nanostatistik: Stokastisk variabel – p. 29/29

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!