Stokastiske variable
Stokastiske variable
Stokastiske variable
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Nanostatistik: Stokastisk variabel<br />
JLJ<br />
Nanostatistik: Stokastisk variabel – p. 1/29
Repetition<br />
Ω: udfaldsrummet: alle de mulige udfald af et experiment<br />
P(A): ss for hændelsen A = frekvens i uafhængige<br />
gentagelser<br />
P(A ∪ B) = P(A) + P(B) når A og B er disjunkte<br />
hændelser<br />
Ex: Kaster en terning to gange.<br />
Ω = {(1, 1), (1, 2),... , (6, 5), (6, 6)}<br />
P(max =3 eller sum = 7) = P((1, 3), (2, 3), (3, 3), (3, 2), (3, 1)<br />
eller (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1))<br />
= P(max =3) + P(sum = 7)<br />
Nanostatistik: Stokastisk variabel – p. 2/29
Stokastisk variabel<br />
Udfald ω ∈ Ω: et meget kompliceret objekt<br />
Experiment: måle nogle få egenskaber ved ω<br />
Ex: Ω = alle danske mænd over 20 år<br />
experiment: vælge en tilfældig person og måle højden<br />
Stokastisk variabel X: en egenskab ved ω der angives ved<br />
et reelt tal (vi bruger store bogstaver for stokastiske<br />
<strong>variable</strong>)<br />
Formelt: X er en afbildning fra Ω ind i de reelle tal<br />
Diskret stokastisk variabel: X kan kun antage heltallige<br />
værdier<br />
Kontinuert stokastisk variabel: X kan antage alle mulige<br />
værdier<br />
Nanostatistik: Stokastisk variabel – p. 3/29
Stokastisk variabel<br />
Ex1: Møntkast: X(pl) = 0, X(kr) = 1<br />
Ex2: Terningekast:<br />
<br />
X(m øjne) = m<br />
Y (m øjne) =<br />
0<br />
1<br />
hvis m er ulige<br />
hvis m er lige<br />
Ex3: Ω = alle mulige egetræer<br />
X(ω) = antallet af blade på træet ω (diskret)<br />
X(ω) = højden af træet ω (kontinuert)<br />
Nanostatistik: Stokastisk variabel – p. 4/29
Diskret stokastisk variabel<br />
X(ω) = i fortæller os ikke direkte hvad ω er<br />
Ex2: Y = 1 hvis et lige antal øjne på terning<br />
Y = 1 fortæller os at vi har fået enten 2, 4 eller 6 øjne<br />
X(ω) = i ⇔ ω ∈ Ωi = {˜ω|X(˜ω) = i}<br />
ss for X = i: P(X=i)<br />
= frekvens af værdien i i uafhængige gentagelser<br />
= frekvens hvormed vi får hændelsen Ωi = P(Ωi)<br />
Ex2: P(Y = 1) = P({2, 4, 6}) = 3 6<br />
Ex3: Kaste terning 2 gange.<br />
X = øjne i kast 1 - øjne i kast 2<br />
P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4<br />
36<br />
Nanostatistik: Stokastisk variabel – p. 5/29
ss-funktion<br />
Notation: sandsynlighedsfunktionen<br />
fX(i) = P(X = i)<br />
Da fX(i) = P(X = i) har vi<br />
( <br />
i fx(i) = <br />
i<br />
0 ≤ fX(i) ≤ 1 <br />
fX(i) = 1<br />
P(X = i) = <br />
i P(Ωi) = P(Ω) = 1)<br />
Notation: Den kumulerede ss-funktion =<br />
fordelingsfunktionen<br />
FX(x) = P(X ≤ x) = <br />
i≤x<br />
i<br />
P(X = i) = <br />
i≤x fX(i)<br />
Nanostatistik: Stokastisk variabel – p. 6/29
ss-funktion<br />
Regneregel: Hvis B er en delmængde af A gælder der<br />
P(A \ B) = P(A) − P(B)<br />
da A = B ∪ (A \ B) har vi P(A) = P(B) + P(A \ B)<br />
FX ↔ fX:<br />
fx(i) = P(X = i) = P(X ≤ i) − P(X ≤ i − 1)<br />
Mere generelt:<br />
VIS PLOT<br />
= FX(i) − FX(i − 1)<br />
P(a < X ≤ b) = FX(b) − FX(a)<br />
Nanostatistik: Stokastisk variabel – p. 7/29
eksempel<br />
Ex3: Kaste terning 2 gange.<br />
X = øjne i kast 1 - øjne i kast 2<br />
P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4<br />
36<br />
fX(0) = P(X = 0) = 6<br />
36<br />
fX(1) = P(X = 1) = 5<br />
36<br />
fX(2) = P(X = 2) = 4<br />
36<br />
.<br />
fX(5) = P(X = 5) = 1<br />
36<br />
Vis Plot<br />
= P(X = −1) = fX(−1)<br />
= P(X = −2) = fX(−2)<br />
= P(X = −5) = fX(−5)<br />
Nanostatistik: Stokastisk variabel – p. 8/29
Simultan ss<br />
X og Y : to stokastisk <strong>variable</strong> defineret på samme<br />
udfaldsrum Ω<br />
X : Ω → N Y : Ω → N<br />
Ex: Ω = danske mænd over 20 år<br />
X = højde i hele cm, Y = vægt i hele kg<br />
Den simultane sandsynlighed er<br />
fX,Y (i,j) = P(X = i,Y = j)<br />
= P({ω|X(ω) = i og Y (ω) = j)<br />
Læses: ss for at X = i og Y = j, dvs ss for fællesmængden<br />
{ω|X(ω) = i} ∩ {ω|Y (ω) = j}<br />
Nanostatistik: Stokastisk variabel – p. 9/29
Simultan ss<br />
Ex: Kaster to terninger<br />
Ω = {(i,j)|1 ≤ i,j ≤ 6}<br />
X = max af de to par øjne<br />
Y = summen af de to par øjne<br />
De mulige værdier af X er 1, 2, 3, 4, 5, 6<br />
og de mulige værdier af Y er 2, 3,...,12.<br />
VIS PLOT<br />
Lav tabel på tavlen<br />
P(X = 3,Y = 5) = P({(2, 3), (3, 2)}) = 2<br />
36<br />
Nanostatistik: Stokastisk variabel – p. 10/29
Marginal ss<br />
Fra P(X = i,Y = j) til P(X = i): Da<br />
{ω|X(ω) = i} = ∪j{ω|X(ω) = i,Y (ω) = j}<br />
og disse mængder er disjunkte har vi<br />
P(X = i) = <br />
P(X = i,Y = j)<br />
Ex: Kast med to terninger: X = max, Y = sum<br />
P(X = 3) = P(X = 3,Y = 2) + P(X = 3,Y = 3)<br />
VIS PLOT<br />
= 2<br />
36<br />
j<br />
+P(X = 3,Y = 4) + · · · + P(X = 3,Y = 12)<br />
+ 2<br />
36<br />
+ 1<br />
36<br />
Nanostatistik: Stokastisk variabel – p. 11/29
Betinget ss<br />
Ex: ss for flyulykke under start = antal ulykker / antal starter<br />
Køber billet hos Aeroflot: er det så den rigtige ss ?<br />
Istedet: antal ulykker med Aeroflot / antal starter med<br />
Aeroflot<br />
Dette kaldes en betinget ss: jeg betinger med at det er et<br />
Aeroflot fly. P(Y = j|X = i) læses: ss for at Y er j givet at<br />
X er i<br />
P(ulykke|Aeroflot) =<br />
=<br />
= P(ulykke og Aeroflot)<br />
#(ulykker og Aeroflot)<br />
#starter<br />
#(starter og Aeroflot)<br />
#starter<br />
P(Aeroflot)<br />
#(ulykker og Aeroflot)<br />
#(starter og Aeroflot)<br />
Nanostatistik: Stokastisk variabel – p. 12/29
Betinget ss<br />
Definition: P(X = i|Y = j) =<br />
P(X=i,Y =j)<br />
P(Y =j)<br />
Ex: Kast med to terninger: X = max, Y = sum<br />
P(Y = 5|X = 3) ?<br />
Givet X = 3 kan Y enten være 4, 5 eller 6: Vis plot<br />
der er 2 udfald der giver 4, to der giver 5 og 1 der giver 6, så<br />
P(Y = 5|X = 3) = 2 5<br />
P(X = 3,Y = 5) = 2<br />
36<br />
P(Y = 5|X = 3) = 2<br />
36<br />
5<br />
36<br />
= 2 5<br />
P(X = 3) = 5<br />
36<br />
Betinget ss = frekvens i den relevante delmængde af<br />
uafhængige gentagelser<br />
Nanostatistik: Stokastisk variabel – p. 13/29
Betinget ss<br />
Trækker 2 kort fra et spil kort med 52 kort. Hvad er den<br />
betingede ss for at kort 2 er en ruder givet at kort 1 var en<br />
spar?<br />
Ω = {(i,j)|1 ≤ i,j ≤ 52,j = i}, |Ω| = 52 · 51<br />
alle udfald har samme ss<br />
antal udfald med kort 1 en spar og kort 2 en ruder =<br />
13 · 13<br />
antal udfald med kort 1 en spar = 13 · 51<br />
betingede ss = 13·13<br />
52·51<br />
13·51<br />
52·51<br />
= 13<br />
51<br />
Nanostatistik: Stokastisk variabel – p. 14/29
Betinget ss<br />
Skriver vi rundt på definitionen har vi<br />
Heraf følger<br />
P(X = i,Y = j) = P(X = i|Y = j)P(Y = j)<br />
P(X = i) = <br />
P(X = i,Y = j) = <br />
P(X = i|Y = j)P(Y = j)<br />
j<br />
j<br />
Nanostatistik: Stokastisk variabel – p. 15/29
Uafhængighed<br />
X og Y er uafhængige: Viden om Y fortæller os ikke noget<br />
om X<br />
P(X = i|Y = j) = P(X = i) for alle i,j<br />
Dette er ækvivalent med<br />
eller<br />
P(X = i,Y = j)<br />
P(Y = j)<br />
= P(X = i) for alle i,j<br />
P(X = i,Y = j) = P(X = i)P(Y = j) for alle i,j<br />
Nanostatistik: Stokastisk variabel – p. 16/29
Uafhængighed<br />
Ubevidst brug af dette: To uafhængige kast med en terning:<br />
Alle 36 muligheder har samme ss.<br />
Hver mulighed har ss 1 36 = 1 6 · 1 6<br />
Ex: Kast med to terninger: X = max, Y = sum<br />
P(Y = 5) = P({(1, 4), (2, 3), (3, 2), (4, 1)}) = 4<br />
36 = 1 9<br />
P(Y = 5|X = 3) = 2 18<br />
5 = 45<br />
Altså er Y og X ikke uafhængige:<br />
viden om X giver os viden om Y<br />
= 5<br />
45<br />
Nanostatistik: Stokastisk variabel – p. 17/29
Kontinuert stokastisk variabel<br />
Ex: registreret eet klik i geigertæller i tidsintervallet [0,T]<br />
Hvornår kom klikket? X er tidspunktet<br />
Alle tidspunkter i [0,T] er mulige, ingen er mere oplagte end<br />
andre<br />
[0,T/2] og [T/2,T] har samme ss 1 2 .<br />
Halverer vi igen får vi 4 intervaller der er lige sandsynlige:<br />
X er uniformt fordelt på [0,T]<br />
P(X = x) = 0: alle intervaller af længe 1 n<br />
må have ss T/n<br />
Nanostatistik: Stokastisk variabel – p. 18/29
Kontinuert stokastisk variabel<br />
Istedet beskriver vi X ved dens fordelingsfunktion<br />
FX(x) = P(X ≤ x)<br />
Ud fra denne kan vi finde ss for ethvert interval<br />
P(X ∈ (a,b]) = P(X ≤ b) − P(X ≤ a) = FX(b) − FX(a)<br />
Uniforme fordeling:<br />
P(a < X ≤ b) er proportional med intervallængden<br />
P(a < X ≤ b) = b−a<br />
T<br />
FX(x) = P(X ≤ x) =<br />
⎧<br />
⎪⎨<br />
⎪⎩<br />
0 x ≤ 0<br />
x<br />
T 0 ≤ x ≤ T<br />
1 x > T<br />
Nanostatistik: Stokastisk variabel – p. 19/29
Tæthed<br />
Hvis FX er differentiabel kaldes<br />
for tætheden af X, og vi har<br />
fX(x) = F ′ X (x)<br />
P(X ∈ (a,b)) = FX(b) − FX(a) =<br />
Tæthed intutitivt:<br />
for ɛ lille<br />
b<br />
P(X ∈ [x − ɛ ɛ<br />
,x +<br />
2 2 ]) ≈ fX(x) · ɛ<br />
a<br />
fX(x)dx<br />
Nanostatistik: Stokastisk variabel – p. 20/29
Tæthed<br />
EX: Uniforme fordeling på [0,T]<br />
<br />
1T 0 ≤ x ≤ T<br />
fX(x) =<br />
0 ellers<br />
Nanostatistik: Stokastisk variabel – p. 21/29
Simultan fordeling<br />
X og Y begge kontinuerte <strong>variable</strong>. Fordelingsfunktion<br />
FX,Y (x,y) = P(X ≤ x,Y ≤ y)<br />
Udregning af P(a < X ≤ b,c < Y ≤ d):<br />
VIS PLOT<br />
{a < X ≤ b,c < Y ≤ d}<br />
= {a < X ≤ b,Y ≤ d} \ {a < X ≤ b,Y ≤ c}<br />
= ({X ≤ b,Y ≤ d} \ {X ≤ a,Y ≤ d}) \<br />
({X ≤ b,Y ≤ c} \ {X ≤ a,Y ≤ c})<br />
Nanostatistik: Stokastisk variabel – p. 22/29
Simultan fordeling<br />
Udregning af P(a < X ≤ b,c < Y ≤ d):<br />
P(a < X ≤ b,c < Y ≤ d)<br />
= [F(b,d) − F(a,d)] − [F(b,c) − F(a,c)]<br />
= F(b,d) − F(a,d) − F(b,c) + F(a,c)<br />
Nanostatistik: Stokastisk variabel – p. 23/29
Intuitivt:<br />
Simultan tæthed<br />
fX,Y (x,y) = ∂FX,Y (x,y)<br />
∂x∂y<br />
P(a < X ≤ b,c < Y ≤ d) =<br />
b<br />
a<br />
d<br />
c<br />
fX,Y (u,v)dvdu<br />
P(X ∈ [x − ɛ ɛ ɛ ɛ<br />
,x + ],Y ∈ [y − ,y +<br />
2 2 2 2 ]) ≈ fX,Y (x,y) · ɛ 2<br />
Nanostatistik: Stokastisk variabel – p. 24/29
Marginal tæthed<br />
fX(x) =<br />
fY (y) =<br />
P(a < X ≤ b) =<br />
∞<br />
−∞<br />
∞<br />
−∞<br />
b<br />
a<br />
fX,Y (x,y)dy<br />
fX,Y (x,y)dx<br />
fX(x)dx<br />
Nanostatistik: Stokastisk variabel – p. 25/29
P(a < X ≤ b,c < Y ≤ d) =<br />
Uafhængighed<br />
Betinget tæthed<br />
f X|Y (x|y) = fX,Y (x,y)<br />
fY (y)<br />
d<br />
c<br />
b<br />
fX,Y (x,y) = fX(x) · fY (y)<br />
a<br />
f X|Y (x|y)dx<br />
<br />
fY (y)dy<br />
Nanostatistik: Stokastisk variabel – p. 26/29
Eksempel<br />
Lad Ω = {(x,y)|0 ≤ x,y ≤ 1} være enhedskvadratet, og lad<br />
P være den uniforme fordeling, dvs P(A) er arealet af A<br />
Lad X være 1. koordinaten, Y 2. koordinaten, og lad<br />
U = X + Y<br />
Finde betingede tæthed for X givet U<br />
=<br />
FX,U(x,u)<br />
⎧<br />
⎨<br />
⎩<br />
FU(u) =<br />
⎧<br />
⎨<br />
⎩<br />
1<br />
2 u2 u < 1<br />
1 − 1<br />
2 (2 − u)2 1 ≤ u ≤ 2,<br />
ux − 1<br />
2 x2 u < 1, 0 ≤ x ≤ u<br />
x 2 + (1 − u)(1 − x) + 1<br />
2 (1 − x)2 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />
Nanostatistik: Stokastisk variabel – p. 27/29
fU(u) =<br />
fX,U(x,u) =<br />
f X|U(x|u) =<br />
⎧<br />
⎨<br />
⎩<br />
⎧<br />
⎨<br />
⎩<br />
⎧<br />
⎨<br />
⎩<br />
Eksempel<br />
u u < 1<br />
(2 − u) 1 ≤ u ≤ 2,<br />
1 u < 1, 0 ≤ x ≤ u<br />
1 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />
1<br />
u<br />
1<br />
2−u<br />
u < 1, 0 ≤ x ≤ u<br />
1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1<br />
Nanostatistik: Stokastisk variabel – p. 28/29
Resume<br />
Stokastisk variabel: funktion fra udfaldsrum over i de hele<br />
tal eller over i de reelle tal<br />
Sandsynlighedsfunktion (tæthed) og fordelingsfunktion<br />
To stokastiske <strong>variable</strong>: simultan sandsynlighed og betinget<br />
sandsynlighed<br />
Nanostatistik: Stokastisk variabel – p. 29/29