Stokastiske variable

Nanostatistik: Stokastisk variabel 

JLJ 

Nanostatistik: Stokastisk variabel – p. 1/29

Repetition 

Ω: udfaldsrummet: alle de mulige udfald af et experiment 

P(A): ss for hændelsen A = frekvens i uafhængige 

gentagelser 

P(A ∪ B) = P(A) + P(B) når A og B er disjunkte 

hændelser 

Ex: Kaster en terning to gange. 

Ω = {(1, 1), (1, 2),... , (6, 5), (6, 6)} 

P(max =3 eller sum = 7) = P((1, 3), (2, 3), (3, 3), (3, 2), (3, 1) 

eller (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1)) 

= P(max =3) + P(sum = 7) 


Stokastisk variabel 

Udfald ω ∈ Ω: et meget kompliceret objekt 

Experiment: måle nogle få egenskaber ved ω 

Ex: Ω = alle danske mænd over 20 år 

experiment: vælge en tilfældig person og måle højden 

Stokastisk variabel X: en egenskab ved ω der angives ved 

et reelt tal (vi bruger store bogstaver for stokastiske 

variable) 

Formelt: X er en afbildning fra Ω ind i de reelle tal 

Diskret stokastisk variabel: X kan kun antage heltallige 

værdier 

Kontinuert stokastisk variabel: X kan antage alle mulige 

værdier 


Stokastisk variabel 

Ex1: Møntkast: X(pl) = 0, X(kr) = 1 

Ex2: Terningekast: 

 

X(m øjne) = m 

Y (m øjne) = 

0 

1 

hvis m er ulige 

hvis m er lige 

Ex3: Ω = alle mulige egetræer 

X(ω) = antallet af blade på træet ω (diskret) 

X(ω) = højden af træet ω (kontinuert) 


Diskret stokastisk variabel 

X(ω) = i fortæller os ikke direkte hvad ω er 

Ex2: Y = 1 hvis et lige antal øjne på terning 

Y = 1 fortæller os at vi har fået enten 2, 4 eller 6 øjne 

X(ω) = i ⇔ ω ∈ Ωi = {˜ω|X(˜ω) = i} 

ss for X = i: P(X=i) 

= frekvens af værdien i i uafhængige gentagelser 

= frekvens hvormed vi får hændelsen Ωi = P(Ωi) 

Ex2: P(Y = 1) = P({2, 4, 6}) = 3 6 

Ex3: Kaste terning 2 gange. 

X = øjne i kast 1 - øjne i kast 2 

P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4 

36 


ss-funktion 

Notation: sandsynlighedsfunktionen 

fX(i) = P(X = i) 

Da fX(i) = P(X = i) har vi 

( 

i fx(i) = 

i 

0 ≤ fX(i) ≤ 1 

fX(i) = 1 

P(X = i) = 

i P(Ωi) = P(Ω) = 1) 

Notation: Den kumulerede ss-funktion = 

fordelingsfunktionen 

FX(x) = P(X ≤ x) = 

i≤x 

i 

P(X = i) = 

i≤x fX(i) 


ss-funktion 

Regneregel: Hvis B er en delmængde af A gælder der 

P(A \ B) = P(A) − P(B) 

da A = B ∪ (A \ B) har vi P(A) = P(B) + P(A \ B) 

FX ↔ fX: 

fx(i) = P(X = i) = P(X ≤ i) − P(X ≤ i − 1) 

Mere generelt: 

VIS PLOT 

= FX(i) − FX(i − 1) 

P(a < X ≤ b) = FX(b) − FX(a) 


eksempel 

Ex3: Kaste terning 2 gange. 

X = øjne i kast 1 - øjne i kast 2 

P(X = 2) = P((3, 1), (4, 2), (5, 3), (6, 4)}) = 4 

36 

fX(0) = P(X = 0) = 6 

36 

fX(1) = P(X = 1) = 5 

36 

fX(2) = P(X = 2) = 4 

36 

. 

fX(5) = P(X = 5) = 1 

36 

Vis Plot 

= P(X = −1) = fX(−1) 

= P(X = −2) = fX(−2) 

= P(X = −5) = fX(−5) 


Simultan ss 

X og Y : to stokastisk variable defineret på samme 

udfaldsrum Ω 

X : Ω → N Y : Ω → N 

Ex: Ω = danske mænd over 20 år 

X = højde i hele cm, Y = vægt i hele kg 

Den simultane sandsynlighed er 

fX,Y (i,j) = P(X = i,Y = j) 

= P({ω|X(ω) = i og Y (ω) = j) 

Læses: ss for at X = i og Y = j, dvs ss for fællesmængden 

{ω|X(ω) = i} ∩ {ω|Y (ω) = j} 


Simultan ss 

Ex: Kaster to terninger 

Ω = {(i,j)|1 ≤ i,j ≤ 6} 

X = max af de to par øjne 

Y = summen af de to par øjne 

De mulige værdier af X er 1, 2, 3, 4, 5, 6 

og de mulige værdier af Y er 2, 3,...,12. 

VIS PLOT 

Lav tabel på tavlen 

P(X = 3,Y = 5) = P({(2, 3), (3, 2)}) = 2 

36 


Marginal ss 

Fra P(X = i,Y = j) til P(X = i): Da 

{ω|X(ω) = i} = ∪j{ω|X(ω) = i,Y (ω) = j} 

og disse mængder er disjunkte har vi 

P(X = i) = 

P(X = i,Y = j) 

Ex: Kast med to terninger: X = max, Y = sum 

P(X = 3) = P(X = 3,Y = 2) + P(X = 3,Y = 3) 

VIS PLOT 

= 2 

36 

j 

+P(X = 3,Y = 4) + · · · + P(X = 3,Y = 12) 

+ 2 

36 

+ 1 

36 


Betinget ss 

Ex: ss for flyulykke under start = antal ulykker / antal starter 

Køber billet hos Aeroflot: er det så den rigtige ss ? 

Istedet: antal ulykker med Aeroflot / antal starter med 

Aeroflot 

Dette kaldes en betinget ss: jeg betinger med at det er et 

Aeroflot fly. P(Y = j|X = i) læses: ss for at Y er j givet at 

X er i 

P(ulykke|Aeroflot) = 

= 

= P(ulykke og Aeroflot) 

#(ulykker og Aeroflot) 

#starter 

#(starter og Aeroflot) 

#starter 

P(Aeroflot) 

#(ulykker og Aeroflot) 

#(starter og Aeroflot) 


Betinget ss 

Definition: P(X = i|Y = j) = 

P(X=i,Y =j) 

P(Y =j) 


P(Y = 5|X = 3) ? 

Givet X = 3 kan Y enten være 4, 5 eller 6: Vis plot 

der er 2 udfald der giver 4, to der giver 5 og 1 der giver 6, så 

P(Y = 5|X = 3) = 2 5 

P(X = 3,Y = 5) = 2 

36 

P(Y = 5|X = 3) = 2 

36 

5 

36 

= 2 5 

P(X = 3) = 5 

36 

Betinget ss = frekvens i den relevante delmængde af 

uafhængige gentagelser 


Betinget ss 

Trækker 2 kort fra et spil kort med 52 kort. Hvad er den 

betingede ss for at kort 2 er en ruder givet at kort 1 var en 

spar? 

Ω = {(i,j)|1 ≤ i,j ≤ 52,j = i}, |Ω| = 52 · 51 

alle udfald har samme ss 

antal udfald med kort 1 en spar og kort 2 en ruder = 

13 · 13 

antal udfald med kort 1 en spar = 13 · 51 

betingede ss = 13·13 

52·51 

13·51 

52·51 

= 13 

51 


Betinget ss 

Skriver vi rundt på definitionen har vi 

Heraf følger 

P(X = i,Y = j) = P(X = i|Y = j)P(Y = j) 

P(X = i) = 

P(X = i,Y = j) = 

P(X = i|Y = j)P(Y = j) 

j 

j 


Uafhængighed 

X og Y er uafhængige: Viden om Y fortæller os ikke noget 

om X 

P(X = i|Y = j) = P(X = i) for alle i,j 

Dette er ækvivalent med 

eller 

P(X = i,Y = j) 

P(Y = j) 

= P(X = i) for alle i,j 

P(X = i,Y = j) = P(X = i)P(Y = j) for alle i,j 


Uafhængighed 

Ubevidst brug af dette: To uafhængige kast med en terning: 

Alle 36 muligheder har samme ss. 

Hver mulighed har ss 1 36 = 1 6 · 1 6 


P(Y = 5) = P({(1, 4), (2, 3), (3, 2), (4, 1)}) = 4 

36 = 1 9 

P(Y = 5|X = 3) = 2 18 

5 = 45 

Altså er Y og X ikke uafhængige: 

viden om X giver os viden om Y 

= 5 

45 


Kontinuert stokastisk variabel 

Ex: registreret eet klik i geigertæller i tidsintervallet [0,T] 

Hvornår kom klikket? X er tidspunktet 

Alle tidspunkter i [0,T] er mulige, ingen er mere oplagte end 

andre 

[0,T/2] og [T/2,T] har samme ss 1 2 . 

Halverer vi igen får vi 4 intervaller der er lige sandsynlige: 

X er uniformt fordelt på [0,T] 

P(X = x) = 0: alle intervaller af længe 1 n 

må have ss T/n 


Kontinuert stokastisk variabel 

Istedet beskriver vi X ved dens fordelingsfunktion 

FX(x) = P(X ≤ x) 

Ud fra denne kan vi finde ss for ethvert interval 

P(X ∈ (a,b]) = P(X ≤ b) − P(X ≤ a) = FX(b) − FX(a) 

Uniforme fordeling: 

P(a < X ≤ b) er proportional med intervallængden 

P(a < X ≤ b) = b−a 

T 

FX(x) = P(X ≤ x) = 

⎧ 

⎪⎨ 

⎪⎩ 

0 x ≤ 0 

x 

T 0 ≤ x ≤ T 

1 x > T 


Tæthed 

Hvis FX er differentiabel kaldes 

for tætheden af X, og vi har 

fX(x) = F ′ X (x) 

P(X ∈ (a,b)) = FX(b) − FX(a) = 

Tæthed intutitivt: 

for ɛ lille 

b 

P(X ∈ [x − ɛ ɛ 

,x + 

2 2 ]) ≈ fX(x) · ɛ 

a 

fX(x)dx 


Tæthed 

EX: Uniforme fordeling på [0,T] 

 

1T 0 ≤ x ≤ T 

fX(x) = 

0 ellers 


Simultan fordeling 

X og Y begge kontinuerte variable. Fordelingsfunktion 

FX,Y (x,y) = P(X ≤ x,Y ≤ y) 

Udregning af P(a < X ≤ b,c < Y ≤ d): 

VIS PLOT 

{a < X ≤ b,c < Y ≤ d} 

= {a < X ≤ b,Y ≤ d} \ {a < X ≤ b,Y ≤ c} 

= ({X ≤ b,Y ≤ d} \ {X ≤ a,Y ≤ d}) \ 

({X ≤ b,Y ≤ c} \ {X ≤ a,Y ≤ c}) 


Simultan fordeling 

Udregning af P(a < X ≤ b,c < Y ≤ d): 

P(a < X ≤ b,c < Y ≤ d) 

= [F(b,d) − F(a,d)] − [F(b,c) − F(a,c)] 

= F(b,d) − F(a,d) − F(b,c) + F(a,c) 


Intuitivt: 

Simultan tæthed 

fX,Y (x,y) = ∂FX,Y (x,y) 

∂x∂y 

P(a < X ≤ b,c < Y ≤ d) = 

b 

a 

d 

c 

fX,Y (u,v)dvdu 

P(X ∈ [x − ɛ ɛ ɛ ɛ 

,x + ],Y ∈ [y − ,y + 

2 2 2 2 ]) ≈ fX,Y (x,y) · ɛ 2 


Marginal tæthed 

fX(x) = 

fY (y) = 

P(a < X ≤ b) = 

∞ 

−∞ 

∞ 

−∞ 

b 

a 

fX,Y (x,y)dy 

fX,Y (x,y)dx 

fX(x)dx 


P(a < X ≤ b,c < Y ≤ d) = 

Uafhængighed 

Betinget tæthed 

f X|Y (x|y) = fX,Y (x,y) 

fY (y) 

d 

c 

b 

fX,Y (x,y) = fX(x) · fY (y) 

a 

f X|Y (x|y)dx 

 

fY (y)dy 


Eksempel 

Lad Ω = {(x,y)|0 ≤ x,y ≤ 1} være enhedskvadratet, og lad 

P være den uniforme fordeling, dvs P(A) er arealet af A 

Lad X være 1. koordinaten, Y 2. koordinaten, og lad 

U = X + Y 

Finde betingede tæthed for X givet U 

= 

FX,U(x,u) 

⎧ 

⎨ 

⎩ 

FU(u) = 

⎧ 

⎨ 

⎩ 

1 

2 u2 u < 1 

1 − 1 

2 (2 − u)2 1 ≤ u ≤ 2, 

ux − 1 

2 x2 u < 1, 0 ≤ x ≤ u 

x 2 + (1 − u)(1 − x) + 1 

2 (1 − x)2 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1 


fU(u) = 

fX,U(x,u) = 

f X|U(x|u) = 

⎧ 

⎨ 

⎩ 

⎧ 

⎨ 

⎩ 

⎧ 

⎨ 

⎩ 

Eksempel 

u u < 1 

(2 − u) 1 ≤ u ≤ 2, 

1 u < 1, 0 ≤ x ≤ u 

1 1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1 

1 

u 

1 

2−u 

u < 1, 0 ≤ x ≤ u 

1 ≤ u ≤ 2, u − 1 ≤ x ≤ 1 


Resume 

Stokastisk variabel: funktion fra udfaldsrum over i de hele 

tal eller over i de reelle tal 

Sandsynlighedsfunktion (tæthed) og fordelingsfunktion 

To stokastiske variable: simultan sandsynlighed og betinget 

sandsynlighed

Stokastiske variable

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?