STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar
STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar
STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
168 KAPITEL 3 SLUMPVARIABLER<br />
2007-10-08 – sida 168 – # 172<br />
METOD 3.4 (APPROXIMATION AV HYPERGEOMETRISK FÖRDELNING)<br />
Antag att X ∼ Hyp(N, n, m) där n/N < 0.1. Då gäller att X kan approximeras<br />
<strong>med</strong> Bin(n, m/N), dvs att<br />
pX(k) ≈<br />
n<br />
k<br />
<br />
m<br />
N<br />
<br />
k<br />
n−k<br />
N − m<br />
.<br />
N<br />
ANMÄRKNING 3.51<br />
Att en approximation över huvud taget behövs beror på att binomialuttrycken<br />
i den hypergeometriska fördelningen är numeriskt instabila <strong>och</strong><br />
även moderna datorer kan ha problem när N > 10 6 vilket ofta förekommer<br />
i <strong>tillämpningar</strong> (t.ex. i opinionsmätningar då man brukar dra ett par<br />
tusen individer ur Sveriges röstberättigade befolkning.<br />
Ovan approximeras den hypergeometriska fördelningen <strong>med</strong> binomialfördelningen,<br />
vars fördelning i denna bok betecknas <strong>med</strong> Bin(n, p). Även denna<br />
fördelning kan dock behöva approximeras om n (<strong>och</strong> k) är stort. Det som är<br />
lite svårare i detta fall är att det finns två alternativa approximationer beroende<br />
på värdet av p.<br />
Vi börjar <strong>med</strong> fallet att p är litet (eller nära 1) <strong>och</strong> n är någorlunda stort. Vi<br />
har alltså ett försök som lyckas <strong>med</strong> liten sannolikhet p <strong>och</strong> som upprepas n<br />
oberoende gånger, <strong>och</strong> Y anger antalet försök som lyckas. Sannolikhetsfunktionen<br />
ges av pY (k) = n k pk (1 − p) n−k . Förväntat antal lyckade försök är np<br />
<strong>och</strong> variansen är np(1 − p) ≈ np eftersom p är litet. När Poissonfördelningen<br />
presenterades (Avsnitt 3.7.7 på sidan 90) nämndes att Poissonfördelningen<br />
kan användas för att approximera binomialfördelningen då p är litet. I själva<br />
verket kan Poissonfördelningen Po(λ) sägas vara gränsfördelningen av<br />
Bin(n, p) när n → ∞ <strong>och</strong> p → 0 så att np → λ. Vi visar inte detta strikt, men<br />
det följer om man betraktar sannolikhetsfunktionen för binomialfördelningen<br />
för ett fixt k <strong>och</strong> antar att n är stort <strong>och</strong> p = λ/n:<br />
pY (k) =<br />
<br />
n<br />
p<br />
k<br />
k (1 − p) n−k ≈ nk<br />
k!<br />
k <br />
λ<br />
1 −<br />
n<br />
λ<br />
n−k ≈<br />
n<br />
λk<br />
k! e−λ ,<br />
<strong>och</strong> högerledet är sannolikhetsfunktionen för Po(λ). Det viktigaste för att<br />
approximation skall fungera är att p är litet eftersom Poissonsannolikheten att<br />
överstiga n (vilket är omöjligt i binomialfallet!) är mycket liten. Parametern n<br />
bör dock även vara ganska stor eftersom det annars inte är några problem att