hÃ¤r - IDA

Kapitel 4 

Sannolikhetsfördelningar 

Sid 79-124 

Föreläsningsunderlagen är baserade på underlag skrivna av Karl 

Wahlin

Slumpvariabel 

En variabel för vilken slumpen bestämmer utfallet. 

Exempel: 

Slantsingling, tärningskast, längden på en slumpmässigt 

utvald person 

Väntevärde: 

Varians: 

Standardavvikelse: 

( X ) m = x p( x ) 

E = å i 

× 

Var 

g 

i=1 

g 

i 

2 

2 2 

( X ) = s = p( x ) × ( x - m ) = x × p( x ) 

å 

i= 

1 

2 

( ) s 

s = Var X = 

i 

i 

g 

å 

i= 

1 

i 

i 

2 

- m 

2

Linjära variabeltransformationer 

Låt X vara en variabel med väntevärde m X och standardavvikelse 

σ X och låt en annan variabel 

Y = a + b× 

X 

Då gäller att 

E 

( Y ) = m 

Y 

= E( a + b × X ) = a + b × m 

X 

2 

2 2 

( Y ) = s = Var( a + b × X ) = b × s 

Var 

Y 

X 

Exempel: En firma ska beräkna kostnaden för ett visst projekt. 

Materialkostnaden är 25000 kr, dessutom tillkommer en 

arbetskostnad på 900 kr per dag. Utifrån erfarenhet vet man att ett 

sådant projekt tar i genomsnitt 11.9 dagar att utföra med en 

varians på 1.29 dagar. Beräkna väntevärde och varians för 

kostnaden för projektet. 

3

Sannolikhetsfördelning 

Sammanställning av vilka värden en slumpvariabel kan anta och 

hur ofta respektive värde antas. På teoretisk väg eller genom att 

studera ett stickprovs fördelning för en variabel kan vi härleda 

variabeln till att tillhöra en viss sannolikhetsfördelning. 

Detta möjliggör annars mycket komplicerade 

sannolikhetsberäkningar vilket i sin tur ger möjlighet att dra 

slutsatser om populationen som stickprovet dragits ur. 

• Diskret sannolikhetsfördelning: när slumpvariabeln endast kan 

anta ett ändligt antal värden, eller ett oändligt men uppräkneligt 

antal 

• Kontinuerlig sannolikhetsfördelning: när slumpvariabeln kan 

anta ett oändligt antal värden 

4

Diskret sannolikhetsfördelning 

Diskreta sannolikhetsfördelningar är sannolikhetsfördelningar för 

variabler som endast kan anta ett uppräkneligt antal värden. 

De vanligaste diskreta sannolikhetsfördelningarna är uppbyggda 

av ett eller flera delförsök och för varje delförsök studerar vi om 

experimentet har lyckats eller inte. 

Varje delförsök sägs följa Bernoullifördelningen men man 

använder även beteckningen tvåpunktsfördelning eller säger att 

utfallet av varje delförsök är binärt. Innebörden är att varje 

delförsök endast kan anta ett av två möjliga värden (lyckat eller 

misslyckat delförsök). 

Exempel: 

Vi definierar händelsen 

A = sex ögon upp vid tärningskast 

och kastar en tärning. Varje tärningskast är då ett delförsök som 

antingen kan lyckas (sex ögon upp) eller inte lyckas (ej sex ögon 

upp) och kan därmed betraktas som Bernoullifördelat. 

5

Binomialfördelning 

Exempel: 

Grobarheten hos en viss typ av frön är 60%. Vi planterar 5 frön 

under samma förutsättningar och frågar oss: vad är 

sannolikheten för att två av fröna gror? 

Låt X vara en slumpvariabel. Givet att följande krav är uppfyllda: 

1. alla delförsök är oberoende av varandra 

2. varje delförsök är Bernoullifördelat med sannolikhet att lyckas= p 

gäller att X är binomialfördelad enligt 

X ~ bin(n; π) 

Sannolikheten för k lyckade utfall bland n beräknas då enligt 

ænö 

k 

( ) n - 

Pr( X = k) 

= ç ÷ p 1- 

p 

k 

èk 

ø 

Beskrivande mått för en binomialfördelad slumpvariabel: 

2 

( X ) = m np 

Var( 

X ) = s = np 

( 1- 

p ) 

E = 

6

Hypergeometrisk fördelning 

Exempel: 

Vad är sannolikheten för triss i ess på en pokerhand? 

Givet att 

1. varje delförsök är Bernoullifördelat 

2. Ej oberoende mellan dragningarna 

gäller att slumpvariabeln X är hypergeometriskt fördelad enligt 

X ~ hyp(n; π; N) 

Sannolikheten för k lyckade utfall bland n beräknas då enligt 

Pr 

( X = k ) 

æ Np 

ö æ N - Np 

ö 

ç ÷ × ç ÷ 

è k ø è n - k 

= 

ø 

æ N ö 

ç ÷ 

è n ø 

Beskrivande mått: 

( X ) = m np 

E = 

Var 

2 

( X ) = s = np 

( 1 - p ) 

N 

N 

- 

- 

n 

1 

7

Poissonfördelning 

Används för att beskriva händelser som inträffar oberoende av varandra och där 

väntevärdet är detsamma som variansen. Kan användas för att approximera 

sannolikheten för k lyckade utfall bland n för en binomialfördelad slumpvariabel X 

när n är stort (minst 20) och π är litet (mindre än 0.05). 

Pr( X 

k 

m -m 

= k) 

= e 

k! 

där µ = nπ 

X ~ poi(µ) 

Sannolikheten för k lyckade utfall bland n beräknas enligt 

Exempel: 

Enligt SCB:s statistik fanns det den 24 oktober 2011 75217 personer i 

Sverige med efternamnet Gustafsson. Vid samma tidpunkt var antalet 

svenska medborgare 9 428 054 personer. Vi drar ett OSU om 1000 personer 

ur befolkningsregistret. 

Vad är sannolikheten för att minst 2 av dessa heter Gustafsson i 

efternamn? 


( X ) = m np 

Var ( X ) = s 

2 = m = np 

E = 

8

Geometrisk fördelning 

Exempel: 

En person singlar slant, tills hon första gången får krona. 

Vad är sannolikheten att första kronan kommer på tredje kastet? 

Givet att 

1. alla delförsök är oberoende av varandra 

2. varje delförsök är Bernoullifördelat 

är slumpvariabeln X geometriskt fördelad enligt 

X ~ geo(π) 

Sannolikheten för att försöket lyckas vid delförsök k bestäms enligt 

Pr( X 

= k) 

= 

k-1 

( 1- p ) × p 


E 

( X ) 

Var 

( X ) 

= m = 

= s 

1 

p 

= 

2 1 

( - p ) 

2 

p 

Kraven är desamma vid 

binomialfördelning och 

geometrisk fördelning, men 

frågeställningarna olika! 

9

Kontinuerlig sannolikhetsfördelning 

Kontinuerliga sannolikhetsfördelningar är fördelningar för variabler som 

kan anta ett oändligt antal värden. 

Vi känner till att fördelningen för en kontinuerlig kvantitativ variabel 

beskrivs med histogram. Histogrammen baseras dock i allmänhet på 

stickprov, men genom att utgå från histogrammets utseende kan man 

”sammanfatta” variabelns utseende med en matematisk funktion, i syfte 

att generalisera resultaten till populationen och göra 

sannolikhetsberäkningar om denna. Det man gör kan liknas vid att lägga 

en mjuk kurva över histogrammet. Kurvan kallas för en täthetsfunktion. Vi 

kan uppfatta täthetsfunktionen som ett 

histogram, där varje stapel är oändligt 

tunn och där staplarna ligger oändligt 

tätt intill varandra. Täthetsfunktionen 

konstrueras så att arean under kurvan 

blir 1: detta gör det möjligt att använda 

den för sannolikhetsberäkningar. 

10

Normalfördelningen 

En mycket viktig kontinuerlig fördelning, därför att den väldigt ofta 

återkommer i statistiska beräkningar och spelar en mycket stor roll inom 

statistiken. 

Normalfördelningen är symmetrisk 

kring sitt väntevärde 

m - 3s 

m - 2s 

m - s 

m 

m + s 

m + 2s 

m + 3s 

f 

( x) 

1 

= × e 

s 2p 

2 

1æ x-m 

ö 

- ç ÷ 

2è 

s ø 

Den funktion som beskriver normalfördelningen 

11

Att söka en sannolikhet för givet X 

Normalfördelning 

Exempel: 

Inom skidskytte är det känt att det avstånd från centrum av tavlan en 

slumpmässigt vald skytt träffar är en normalfördelad slumpvariabel 

med väntevärde 30 mm och standardavvikelse 10 mm. Hur stor andel 

av skotten kan förväntas träffa inom 20 mm från centrum? 

Standardiseringsformel: 

z 

= x - m 

s 

där 

µ och σ är den normalfördelade variabeln X parametrar och 

x är det värde vi är intresserade av. 

12

Att söka X för en given sannolikhet 

Normalfördelning 

Exempel: 

Vi fortsätter att betrakta skidskyttarna, för vilka det är känt att det 

avstånd för vilket en slumpmässigt vald skytt träffar centrum på 

tavlan är en normalfördelad slumpvariabel med väntevärde 30 mm 

och standardavvikelse 10 mm, och frågar oss: om vi vill rita en 

markering där 60% av skotten ska hamna innanför, hur långt från 

centrum ska då den cirkeln gå? 

13

Normalfördelningsapproximation av 

binomialfördelning 

Låt X vara en binomialfördelad slumpvariabel enligt 

X ~ bin(n; π) 

Givet att 

nπ(1 – π) > 5 

kan X approximeras enligt 

X 

( m = np; s = np 

( -p 

)) 

» N 

1 

Approximationens syfte: underlätta beräkningar som annars skulle 

vara mycket tunga. 

Exempel: 

Vi definierar händelsen 

A = sexa vid tärningskast 

och kastar tärning 100 gånger. Vad är sannolikheten för att vi 

ska få sexa fler än 20 gånger? 

14

Normalfördelningsapproximation av 

binomialfördelning 

5 

10 

15 

20 

25 

30 

X 

Kontinuitetskorrektion: 

Metod för att förbättra approximationen. Tanken bakom kontinuitetskorrektion är att 

betrakta varje värde hos den binomialfördelade variabeln som ett intervall. Om vi 

exempelvis vill beräkna sannolikheten för att fler än 20 av 100 försök lyckas, så betraktar 

vi talet 21 som ett intervall [20.5; 21.5]. Principen är att vi inkluderar hela intervallet 

i sannolikhetsberäkningen. 

15

hÃ¤r - IDA

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?