05.09.2013 Views

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

168 KAPITEL 3 SLUMPVARIABLER<br />

2007-10-08 – sida 168 – # 172<br />

METOD 3.4 (APPROXIMATION AV HYPERGEOMETRISK FÖRDELNING)<br />

Antag att X ∼ Hyp(N, n, m) där n/N < 0.1. Då gäller att X kan approximeras<br />

<strong>med</strong> Bin(n, m/N), dvs att<br />

pX(k) ≈<br />

n<br />

k<br />

<br />

m<br />

N<br />

<br />

k<br />

n−k<br />

N − m<br />

.<br />

N<br />

ANMÄRKNING 3.51<br />

Att en approximation över huvud taget behövs beror på att binomialuttrycken<br />

i den hypergeometriska fördelningen är numeriskt instabila <strong>och</strong><br />

även moderna datorer kan ha problem när N > 10 6 vilket ofta förekommer<br />

i <strong>tillämpningar</strong> (t.ex. i opinionsmätningar då man brukar dra ett par<br />

tusen individer ur Sveriges röstberättigade befolkning.<br />

Ovan approximeras den hypergeometriska fördelningen <strong>med</strong> binomialfördelningen,<br />

vars fördelning i denna bok betecknas <strong>med</strong> Bin(n, p). Även denna<br />

fördelning kan dock behöva approximeras om n (<strong>och</strong> k) är stort. Det som är<br />

lite svårare i detta fall är att det finns två alternativa approximationer beroende<br />

på värdet av p.<br />

Vi börjar <strong>med</strong> fallet att p är litet (eller nära 1) <strong>och</strong> n är någorlunda stort. Vi<br />

har alltså ett försök som lyckas <strong>med</strong> liten sannolikhet p <strong>och</strong> som upprepas n<br />

oberoende gånger, <strong>och</strong> Y anger antalet försök som lyckas. Sannolikhetsfunktionen<br />

ges av pY (k) = n k pk (1 − p) n−k . Förväntat antal lyckade försök är np<br />

<strong>och</strong> variansen är np(1 − p) ≈ np eftersom p är litet. När Poissonfördelningen<br />

presenterades (Avsnitt 3.7.7 på sidan 90) nämndes att Poissonfördelningen<br />

kan användas för att approximera binomialfördelningen då p är litet. I själva<br />

verket kan Poissonfördelningen Po(λ) sägas vara gränsfördelningen av<br />

Bin(n, p) när n → ∞ <strong>och</strong> p → 0 så att np → λ. Vi visar inte detta strikt, men<br />

det följer om man betraktar sannolikhetsfunktionen för binomialfördelningen<br />

för ett fixt k <strong>och</strong> antar att n är stort <strong>och</strong> p = λ/n:<br />

pY (k) =<br />

<br />

n<br />

p<br />

k<br />

k (1 − p) n−k ≈ nk<br />

k!<br />

k <br />

λ<br />

1 −<br />

n<br />

λ<br />

n−k ≈<br />

n<br />

λk<br />

k! e−λ ,<br />

<strong>och</strong> högerledet är sannolikhetsfunktionen för Po(λ). Det viktigaste för att<br />

approximation skall fungera är att p är litet eftersom Poissonsannolikheten att<br />

överstiga n (vilket är omöjligt i binomialfallet!) är mycket liten. Parametern n<br />

bör dock även vara ganska stor eftersom det annars inte är några problem att

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!