Matematika 4B - Katedra matematiky FEL ČVUT
Matematika 4B - Katedra matematiky FEL ČVUT
Matematika 4B - Katedra matematiky FEL ČVUT
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Matematika</strong> <strong>4B</strong><br />
Prof. RNDr. Jan Hamhalter, CSc.<br />
katedra <strong>matematiky</strong> <strong>FEL</strong> <strong>ČVUT</strong><br />
e-mail: hamhalte@math.feld.cvut.cz<br />
tel: 224353587<br />
web:<br />
http://math.feld.cvut.cz//hamhalte<br />
11. ledna 2007<br />
16:56<br />
1
• V.Rogalewicz: Pravděpodobnost a statistika pro inženýry,<br />
skripta, Vydavatelství <strong>ČVUT</strong>, 1998.<br />
• K.Zvára a J.Štěpán: Pravděpodobnost a matematická<br />
statistika, matfyzpress, Praha 2002.<br />
• J.Anděl: <strong>Matematika</strong> náhody, matfyzpress, Praha 2003.<br />
• J.Anděl: Statistické metody, matfyzpress, Praha 2003.<br />
• V.Dupač a M.Hušková: Pravděpodobnost a matematická<br />
statistika, Nakladatelství Karolinum, 1999.<br />
• Z.Prášková: Základy náhodných procesů II, Nakladatelství<br />
Karolinum, 2004.<br />
• A. Rényi: Teorie pravděpodobnosti, Academia, Praha<br />
1972.<br />
2
1 Historie a podstata<br />
teorie pravděpodobnosti<br />
teorie pravděpodobnosti = matematika náhody, systémy s<br />
nedostatkem informace<br />
svět 19. století – deterministický systém, hodinový stroj<br />
svět 20. století – svět náhody (evoluce není možná bez náhody,<br />
mikrosvět se řídí pravděpodobnostními zákony, teorie<br />
chaosu, apod.)<br />
• Úloha o rozdělení sázky<br />
Pochází od Arabů. Nedávno objevena v rukopise z r. 1380.<br />
Dva hráči hrají sérii partií. Výsledky jednotlivých her jsou<br />
nezávislé. Vyhrává ten kdo poprvé zvítězí v šesti partiích.<br />
Pravděpodobnost výhry je pro každého hráče stejná, t.j.<br />
1/2. Hra je přerušena ve chvíli kdy hráč A vyhrál 5x a hráč<br />
B 3x. Jak si rozdělí výhru?<br />
Úloha byla vyřešena nezávisle Pascalem a Fermatem (1654).<br />
Všechny možnosti pokračování (hra bude trvat nejvýše tři<br />
další partie):<br />
AAA AAB ABA ABB<br />
BAA BAB BBA BBB<br />
Pouze v jednom případě vítězí B, pravděpodobnost výhry<br />
hráče B je 1:8, výhra by se měla rozdělit v poměru 7:1.<br />
3
• Huygens (1657) : On Reasoning in Games of Dice<br />
• Laplace (1812): Analytic Theory of Probabilities<br />
nestačí kombinatorické metody, je třeba uvažovat nekonečné<br />
soubory možností<br />
statistická fyzika, Brownův pohyb, teorie míry a integrace<br />
• A. Kolmogorov (1930): Axiomatické základy teorie pravděpodobnosti<br />
• současný stav a perspektivy: nové obory založené na pravděpodobnostním<br />
přístupu – kvantová teorie informace,<br />
teorie her v ekonomii, teorie chaosu, ...<br />
4
2 Pravděpodobnostní prostor<br />
pravděpodobnostní model má dvě komponenty:<br />
• struktura náhodných jevů<br />
• pravděpodobnost jako kvantitativní funkce na jevech<br />
2.1. Příklad. Střelba na terč<br />
Ω = kruh o poloměru r<br />
náhodné jevy = podmnožiny Ω<br />
pravděpodobnost(A) = obsah(A)<br />
πr 2<br />
5<br />
.
2.2. Příklad. Sportka<br />
Ω = {{1, 2, 3, 4, 5, 6}, {1, 3, 4, 6, 2, 17}, . . . } =<br />
{ šestiprvkové podmnožiny množiny {1, 2, . . . , 49}}<br />
tyto šestice tvoří elementární jevy s pravděpodobností<br />
1 1<br />
= = 0, 7151138242 · 10−7<br />
13983816<br />
49<br />
6<br />
jev= podmnožina Ω<br />
pravděpodobnost jevu A ⊂ Ω.<br />
P (A) = velikost(A)<br />
.<br />
49<br />
6<br />
konkrétní výpočet v tomto modelu – spočtěte pravděpodobnost,<br />
že uhodnete (právě) tři čísla.<br />
P (A) =<br />
6 3 49 6<br />
43<br />
· 3 = 0, 1765040387<br />
6
náhodné jevy musíme umět kombinovat<br />
„jev A nebo jev B, ...<br />
2.3. Definice. Nechť Ω je neprázdná množina. Systém<br />
A podmnožin množiny Ω se nazývá σ-algebra náhodných<br />
jevů, jestliže platí<br />
(i) Ω ∈ A.<br />
(ii) Jestliže A1, A2, . . . jsou množiny v A, pak<br />
∞<br />
i=1 Ai ∈ A<br />
(iii) Je-li A ∈ A, pak A c = Ω \ A ∈ A<br />
Terminologie:<br />
A c ... opačný jev k jevu A<br />
A, B jsou navzájem vylučující se (disjunktní) jevy jestliže<br />
A ∩ B = ∅<br />
7
2.4. Tvrzení. Je-li A σ-algebra podmnožin Ω pak<br />
(i) A1, A2, . . . ∈ A =⇒ ∞<br />
i=1 Ai ∈ A.<br />
(ii) A, B ∈ A =⇒ A ∩ B c ∈ A.<br />
Důkaz:<br />
(i) Ac 1, Ac 2, . . . ∈ A, =⇒ ∞ i=1 Aci (de Morganova pravidla)<br />
<br />
∞<br />
c ∞<br />
= Ai ∈ A .<br />
i=1<br />
A c i<br />
i=1<br />
(ii) A, B c ∈ A =⇒ A ∩ B c ∈ A .<br />
8<br />
∈ A =⇒
pravděpodobnost modeluje relativní četnost, měla by respektovat<br />
stejná pravidla jako počet prvků množiny<br />
2.5. Definice. Předpokládejme, že A je σ-algebra podmnožin<br />
množiny Ω. Pravděpodobnost P je zobrazení<br />
P : A → [0, 1] ,<br />
pro které platí<br />
(i) P (Ω) = 1<br />
(ii) P ( ∞ i=1 Ai) = ∞ i=1 P (Ai),<br />
jestliže A1, A2, .... jsou navzájem disjunktní množiny<br />
v A.<br />
Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor.<br />
9
Základní vlastnosti pravděpodobnosti<br />
(i) A ∩ B = ∅ =⇒ P (A ∪ B) = P (A) + P (B)<br />
(ii) P (∅) = 0<br />
(⇐= P (Ω) + P (∅) = P (Ω))<br />
(iii) P (A c ) = 1 − P (A)<br />
(⇐= P (A) + P (A c ) = P (Ω) = 1.)<br />
(iv) A ⊂ B =⇒ P (B ∩ A c ) = P (B) − P (A)<br />
(⇐= P (B) = P (A) + P (B ∩ A c ))<br />
(v) P (A ∪ B) = P (A) + P (B) − P (A ∩ B).<br />
odvození: X = A ∩ (A ∩ B) c , Y = B ∩ (A ∩ B) c<br />
P (X) + P (Y ) + P (A ∩ B) = P (A ∪ B)<br />
P (A)−P (A∩B)+P (B)−P (A∩B)+P (A∩B) = P (A∪B)<br />
P (A) + P (B) = P (A ∪ B) + P (A ∩ B)<br />
10
Tato základní pravidla jsou často užitečná při konkrétních<br />
výpočtech.<br />
2.6. Příklad. Určete pravděpodobnost, že při tahu Sportky<br />
bude vylosováno buďto číslo 7 nebo číslo 20.<br />
Řešení: A ... taženo číslo 7, B ... taženo číslo 20.<br />
Tedy<br />
P (A) = P (B) =<br />
P (A ∩ B) =<br />
47 4 49 6<br />
P (A ∪ B) = 2 ·<br />
<br />
<br />
48 5 49 6<br />
48 5 49 6<br />
<br />
<br />
<br />
−<br />
11<br />
47 4 49 6<br />
<br />
= 13<br />
= 0, 232148571 .<br />
56
Důležité typy pravděpodobnostních prostorů:<br />
• klasický pravděpodobnostní prostor<br />
• konečný pravděpodobnostní prostor<br />
• diskrétní nekonečný pravděpodobnostní prostor<br />
• geometrický pravděpodobnostní prostor<br />
12
Klasický pravděpodobnostní prostor<br />
Ω = {ω1, . . . , ωn}<br />
A = všechny podmnožiny množiny Ω<br />
P (A) = |A| |A|<br />
=<br />
|Ω| n .<br />
V tomto modelu mají elementární jevy stejnou šanci = 1<br />
n .<br />
Někdy je těžké nalézt dobrý model slovní úlohy, často se<br />
setkáme se složitou kombinatorikou.<br />
13
2.7. Příklad. Hodíme n krát mincí, rub i líc v jednom<br />
hodu mají stejnou šanci, tj. 1<br />
2 . Jaká je pravděpodobnost že<br />
padne právě k krát líc?<br />
Řešení: elementární jevy – posloupnosti nul a jedniček délky<br />
n kódující výsledky hodů.<br />
|Ω| = 2 n<br />
Ω = {ω1, . . . , ω2 n}<br />
Ak .... posloupnost obsahuje právě k jedniček.<br />
Tedy<br />
|Ak| =<br />
<br />
n<br />
k<br />
P (Ak) = 1<br />
2n <br />
n<br />
.<br />
k<br />
Poznámka: Hodíme n krát mincí, kde n je sudé. Jaká je<br />
pravděpodobnost, že padne stejný počet nul jako jedniček?<br />
<br />
n<br />
n/2<br />
P (A n/2) = 1<br />
2 n<br />
Pomocí tzv. Stirlingova vzorce lze dokázat, že<br />
P (A n/2) ≈<br />
1<br />
πn/2 → 0 pro n → ∞ .<br />
14
2.8. Příklad. Narozeninový problém<br />
Jaká je pravděpodobnost, že ve třídě s n žáky se najde<br />
dvojice mající narozeniny ve stejný den? (n ≤ 365).<br />
Řešení:<br />
Ω = {posloupnosti délky n<br />
prvků množiny {1, 2, . . . , 365}}<br />
Elementární jevy kódují den narozenin 1. až n-tého žáka.<br />
A ... sledovaný jev<br />
A c ... jev opačný, všichni mají narozeniny v jiný den.<br />
|Ω| = 365 n<br />
|A c | = 365 · 364 · 363 · · · (365 − n + 1)<br />
365 · 364 · 363 · · · (365 − n + 1)<br />
P (A) = 1 −<br />
365n =<br />
n−1 <br />
<br />
= 1 − 1 − j<br />
<br />
365<br />
Nečekané numerické hodnoty:<br />
již pro n = 23 je P (A) > 1/2,<br />
pro n = 56 je P (A) = 0, 99.<br />
15<br />
j=1
Konečný pravděpodobnostní prostor<br />
Ω = {ω1, . . . , ωn}<br />
A = všechny podmnožiny Ω<br />
p1, . . . , pn > 0 . . . váhy<br />
n<br />
pi = 1<br />
• Z toho vyplývá že<br />
P (A) = <br />
{i|ωi∈A}<br />
pro všechny A ⊂ Ω.<br />
i=1<br />
P ({ωi}) = pi<br />
pi ,<br />
• Klasický pravděpodobnostní prostor je speciálním případem,<br />
ve kterém jsou všechny váhy stejné:<br />
p1 = p2 = · · · = pn = 1<br />
n .<br />
16
2.9. Příklad. Ω = {ω1, ω2, ω3}<br />
p1 = P ({ω1}) = 1<br />
2<br />
p2 = P ({ω2}) = 1<br />
4<br />
p3 = P ({ω3}) = 1<br />
4<br />
ω1 ω2 ω3<br />
1<br />
2<br />
1<br />
4<br />
Je tedy např.<br />
1<br />
4<br />
P ({ω1, ω2}) = p1 + p2 = 1 1 3<br />
+ =<br />
2 4 4 .<br />
17
Bernoulliovo schéma<br />
Máme jev A (zdar) s pravděpodobností 0 < p < 1<br />
a jev B (nezdar) s pravděpodobností 0 < 1 − p < 1.<br />
V náhodném pokusu nastane právě jeden z jevů A a B s<br />
příslušnou pravděpodobností. Provedeme sérii n těchto náhodných<br />
pokusů, jejichž výsledky se navzájem neovlivňují.<br />
Možné výstupy pro n = 4: ABAA, BBBA, ...<br />
kódovány posloupnostmi 0 a 1: 1011, 0001, ...<br />
Elementární jevy —- posloupnosti nul a jedniček délky n<br />
Nezávislost znamená, že pravděpodobnosti se násobí:<br />
P (1011) = p · (1 − p) · p · p = p 3 · (1 − p)<br />
P (0001) = (1 − p) · (1 − p) · (1 − p) · p = p · (1 − p) 3<br />
18
To nás vede k následujícímu modelu:<br />
Ω= všechny posloupnosti nul a jedniček délky n<br />
|Ω| = 2 n .<br />
P (posloupnost ) = ppočet 1 počet 0<br />
· (1 − p)<br />
Ověříme, že součet vah je 1:<br />
<br />
pi =<br />
2 n<br />
i=1<br />
n<br />
k=0<br />
<br />
n<br />
p<br />
k<br />
k (1 − p) n−k =<br />
= (p + (1 − p)) n = 1.<br />
Důležitý je jev, Ak, že v sérii n pokusů nastane jev A právě<br />
k krát.<br />
|Ak| = n<br />
k .<br />
P (Ak) =<br />
<br />
n<br />
p<br />
k<br />
k (1 − p) n−k .<br />
Konkrétní příklady: hod mincí, hod kostkou, ankety, statistické<br />
šetření, apod.<br />
2.10. Příklad. Terč zasáhneme s pravděpodobností 1/3.<br />
Jaká je pravděpodobnost, že se dvakrát strefíme při čtyřech<br />
pokusech.<br />
P (A2) =<br />
<br />
4 1<br />
2 32 2 2<br />
=<br />
3<br />
48<br />
= 0, 2963 .<br />
161<br />
19
Nekonečný diskrétní pravděpodobnostní prostor<br />
Ω = {ω1, ω2, . . . }<br />
A = všechny podmnožiny Ω<br />
(pn) ∞ n=1 . . . posloupnost vah<br />
∞<br />
n=1<br />
pn = 1, pn ≥ 0<br />
P ({ωn}) = pn pro n = 1, 2, . . .<br />
• Z toho vyplývá, že<br />
P (A) = <br />
{n|ωn∈A}<br />
pro všechny A ⊂ Ω.<br />
pn ,<br />
20
Poissonův zákon<br />
Ω = {ω0, ω1, ω2 . . . }<br />
λ > 0 parametr<br />
pn = λn<br />
n! e−λ , n = 0, 1, . . .<br />
Ověříme korektnost zadání:<br />
∞<br />
∞<br />
n=0<br />
λ n<br />
n! e−λ = e −λ<br />
n=0<br />
λ n<br />
n! = e−λ e λ = 1 .<br />
2.11. Příklad. Za danou časovou jednotku volá na ústřednu<br />
průměrně λ > 0 účastníků. Pravděpodobnost pn, že zavolá<br />
právě n účastníků se řídí Poissonovým zákonem:<br />
pn = λn<br />
n! e−λ<br />
Pravděpodobnost, že zavolá alespoň někdo je 1 − e −λ .<br />
21
Geometrický pravděpodobnostní prostor<br />
pravděpodobnost je dána geometrickou kvantitou (délka,<br />
obsah, objem)<br />
Ω ⊂ R, R 2 , R 3 , . . . ,<br />
0 < velikost (Ω) < ∞ ,<br />
P (A) =<br />
pro A ⊂ Ω.<br />
velikost (A)<br />
velikost (Ω)<br />
2.12. Příklad. Terč má poloměr 30 cm. Jaká je pravděpodobnost,<br />
že se trefíme do středu o poloměru 5cm ?<br />
Řešení:<br />
p = 25π<br />
= 0, 02777 . . . .<br />
900π<br />
22
2.13. Příklad. Buffonova úloha<br />
V rovině je dán systém rovnoběžek majících vzdálenost d.<br />
Na rovinu hodíme jehlu o velikosti l, l < d. Jaká je pravděpodobnost,<br />
že protne některou rovnoběžku?<br />
Řešení: Polohu jehly vůči rovnoběžné síti popíšeme dvěma<br />
parametry:<br />
x ... vzdálenost středu jehly od nejbližší rovnoběžky<br />
x ∈< 0, d<br />
2 ><br />
ϕ ... úhel, který jehla svírá s rovnoběžnou sítí<br />
ϕ ∈< 0, π > .<br />
Podmínka protnutí:<br />
l<br />
2<br />
sin ϕ > x<br />
P = 1<br />
π d/2<br />
= 2l<br />
πd .<br />
π<br />
0<br />
π l<br />
l<br />
sin ϕdϕ = − cos ϕ =<br />
2 πd<br />
0<br />
23
Další vlastnosti pravděpodobnosti:<br />
Princip inkluze a exkluze<br />
Opakování: P (A ∪ B) = P (A) + P (B) − P (A ∩ B).<br />
Mějme nyní tři jevy A, B, C ∈ A.<br />
P (A ∪ B ∪ C) = P [(A ∪ B) ∪ C] =<br />
P (A ∪ B) + P (C) − P ((A ∩ C) ∪ (B ∩ C))<br />
= P (A) + P (B) − P (A ∩ B) + P (C)<br />
− P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)<br />
= P (A) + P (B) + P (C)<br />
− P (A ∩ C) − P (B ∩ C) − P (A ∩ B)<br />
24<br />
+ P (A ∩ B ∩ C)
Zobecnění se dá dokázat indukcí:<br />
2.14. Věta. Princip inkluze a exkluze<br />
Předpokládejme, že A1, . . . , An ∈ A, kde (Ω, A, P ) je<br />
pravděpodobnostní prostor. Pak platí<br />
P (A1∪A2∪· · ·∪An) = <br />
+<br />
<br />
1≤i
2.15. Příklad. Roztržitá šatnářka<br />
n hostů restaurace si přichází odložit svůj kabát. Šatnářka<br />
vydává kabáty chaoticky. Jaká je pravděpodobnost, že alespoň<br />
jeden z hostů dostane svůj kabát?<br />
Řešení: Elementární jevy jsou permutace n prvkové množiny.<br />
<br />
1 2 . . . n<br />
k1 k2 . . . kn<br />
Všechny mají stejnou pravděpodobnost, tj. 1<br />
n! .<br />
kde<br />
A = {(k1, . . . , kn) | existuje 1 ≤ i ≤ n tak že ki = i} .<br />
A = A1 ∪ A2 ∪ · · · ∪ An ,<br />
Ai = {(k1, . . . , kn) | ki = i}<br />
(i-tý host je v pořádku)<br />
(n − 1)!<br />
P (Ai) =<br />
n!<br />
(n − 2)!<br />
P (Ai ∩ Aj) = , i = j<br />
n!<br />
P (A1 ∩ A2 ∩ · · · ∩ An) = 1<br />
n!<br />
26
n (n − 2)!<br />
P (A) = 1−<br />
2 n! +<br />
<br />
n (n − 3)!<br />
1<br />
−· · ·+(−1)n+1<br />
3 n! n!<br />
= 1 − 1 1<br />
1<br />
+ − · · · + (−1)n+1<br />
2! 3! n!<br />
numerické hodnoty:<br />
n 1 2 3 4 5 6 7<br />
P (A) 1 0,5 0,6667 0,625 0,6333 0,6319 0,6321<br />
asymptoticky:<br />
e −1 = 1 − 1 1 1<br />
+ − + · · ·<br />
1! 2! 3!<br />
lim<br />
n→∞ P (A) = 1 − e−1 = 0, 6321....<br />
27
Zacházení s nekonečnými posloupnostmi jevů, spojitost pravděpodobnosti:<br />
2.16. Věta. Předpokládejme, že (Ω, A, P ) je pravděpodobnostní<br />
prostor.<br />
(i) Je-li A1 ⊂ A2 ⊂ · · · pro A1, A2, · · · z A, pak<br />
<br />
∞<br />
P<br />
i=1<br />
Ai<br />
<br />
= lim<br />
i→∞ P (Ai)<br />
(ii) Je-li A1 ⊃ A2 ⊃ · · · pro A1, A2, · · · z A, pak<br />
<br />
∞<br />
P<br />
i=1<br />
Ai<br />
<br />
Důkaz: (An) splňuje (i)<br />
= lim<br />
i→∞ P (Ai)<br />
An = A1 ∪ (A2 \ A1) ∪ (A3 \ A2) ∪ · · · ∪ (An \ An−1)<br />
je disjunktní sjednocení. Pak<br />
P (An) = P (A1) + P (A2 \ A1) + P (A3 \ A2) +<br />
Dále platí<br />
+ · · · + P (An \ An−1) .<br />
∞<br />
An = A1 ∪ (A2 \ A1) ∪ (A3 \ A2) ∪ · · ·<br />
n=1<br />
28
∞<br />
P<br />
n=1<br />
An<br />
<br />
∞<br />
P<br />
n=1<br />
<br />
P (An)<br />
<br />
= P (A1) + P (A2 \ A1) + · · · + P (An \ An−1) + · · · =<br />
An<br />
<br />
= lim P (An)<br />
n→∞<br />
= lim P (An)<br />
n→∞<br />
(ii) obdobným způsobem, nebo z (i) přechodem k množinovému<br />
komplementu.<br />
29
3 Nezávislé jevy a podmíněná pravděpodobnost<br />
Pravděpodobnostní model se mění dostaneme-li částečnou<br />
informaci o systému. Víme, že nastal jev B. Pak pravděpodobnost,<br />
že nastane jev A je<br />
P (A ∩ B)<br />
P (B)<br />
.<br />
———————————————————————<br />
3.1. Definice. Je dán pravděpodobnostní prostor (Ω, A, P )<br />
a B ∈ A s P (B) > 0. Podmíněná pravděpodobnost náhodného<br />
jevu A za podmínky B je definována jako<br />
Tedy<br />
P (A|B) =<br />
P (A ∩ B)<br />
P (B)<br />
.<br />
P (A ∩ B) = P (A|B)P (B) = P (B|A)P (A) .<br />
30
3.2. Příklad. Skříňka má tři zásuvky. V první jsou dvě<br />
zlaté mince, ve druhé zlatá a stříbrná mince a ve třetí dvě<br />
stříbrné mince.<br />
•z1<br />
•z3<br />
◦s2<br />
• z2<br />
◦ s1<br />
◦ s3<br />
Náhodně jsme vybrali zásuvku a náhodně z ní vytáhli minci.<br />
Tažená mince je stříbrná. Jaká je pravděpodobnost, že<br />
druhá mince ve vytažené zásuvce je zlatá?<br />
Řešení: naivní odpověď 1/2 není správná.<br />
Dvě fáze náhodného procesu:<br />
1. volba zásuvky 2. volba mince<br />
Ω = {(1, z1), (1, z2), (2, z3), (2, s1), (3, s2), (3, s3), }<br />
Všechny tyto jevy mají stejnou šanci, tj. 1/6.<br />
Z ... v otevřené zásuvce je zlatá mince<br />
S ... vyjmuli jsme stříbrnou minci (tento jev nastal).<br />
Hledáme p = P (Z|S)<br />
P (S) = P {(2, s1), (3, s2), (3, s3)} = 3 1<br />
=<br />
6 2 .<br />
P (Z ∩ S) = P {(2, s1)} = 1/6 .<br />
p = 1/6 1<br />
=<br />
3/6 3 .<br />
31
Formální vlastnosti podmíněné pravděpodobnosti:<br />
(i) P (B|B) = 1<br />
(ii) P (A1 ∪ A2|B) = P (A1|B) + P (A2|B)<br />
jsou-li A1, A2 ∈ A disjunktní.<br />
————————————————-<br />
3.3. Tvrzení. Je-li (Ω, A, P ) pravděpodobnostní prostor<br />
a B ∈ A s P (B) > 0, pak (Ω, A, P ((·|B)) je také pravděpodobnostní<br />
prostor.<br />
————————————————————–<br />
V pravděpodobnostním prostoru (Ω, A, P ((·|B)) mají jevy<br />
disjunktní s B nulovou pravděpodobnost, podmnožiny v B<br />
mají pravděpodobnost normovanou pravděpodobností jevu<br />
B.<br />
32
Nezávislé jevy jsou jevy jejichž podmíněné pravděpodobnosti<br />
se neovlivňují:<br />
P (A), P (B) > 0<br />
P (A) = P (A|B) =<br />
P (A ∩ B) = P (A) · P (B) .<br />
P (A ∩ B)<br />
P (B)<br />
——————————————————-<br />
3.4. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor.<br />
Jevy A a B ∈ A nazýváme nezávislé, jestliže<br />
P (A ∩ B) = P (A) · P (B) .<br />
———————————————————-<br />
3.5. Příklad. Dvakrát hodíme mincí. Všechny výsledky<br />
jsou stejně pravděpodobné. Ukažte, že výsledky v prvním<br />
a druhém hodu jsou nezávislé.<br />
Řešení: R... rub, L ... líc<br />
Ω = {RL, RR, LR, LL}<br />
P ({RL, RR}) = 1<br />
2<br />
P ({RL, LL}) = 1<br />
2<br />
P ({RL}) = 1 1 1<br />
= ·<br />
4 2 2 .<br />
33
Obecnější definice:<br />
3.6. Definice. Jevy A1, . . . , An v pravděpodobnostní prostor<br />
(Ω, A, P ) jsou nezávislé, jestliže<br />
P (Ai1 ∩ Ai2 ∩ · · · ∩ Aik ) = P (Ai1)P (Ai2) · · · P (Aik )<br />
pro všechna i1 < i2 < · · · < ik, k ≤ n.<br />
Bernoulliovo schéma (revisited)<br />
Výsledky pokusů v Bernoulliově schématu jsou nezávislé<br />
jevy. Bernoulliovo schéma tedy můžeme chápat jako sérii<br />
nezávislých pokusů se dvěma možnými výsledky, které mají<br />
doplňkovou pravděpodobnost.<br />
34
3.7. Příklad. Elektrický obvod znázorněný na obrázku je<br />
náhodně přerušován pěti nezávislými spínači. V jedné větvi<br />
jsou tři spínače a ve druhé dva. Jaká je pravděpodobnost<br />
že obvodem prochází proud? Každý spínač je přerušen s<br />
pravděpodobností 1/2.<br />
Řešení: Ai ... i-tý vypínač je sepnut<br />
p = P [(A1 ∩ A2 ∩ A3) ∪ (A4 ∩ A5)] =<br />
= P (A1 ∩ A2 ∩ A3) + P (A4 ∩ A5)<br />
− P (A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5) =<br />
= 1 1 1 11<br />
+ − = = 0, 34375 .<br />
23 22 25 25 3.8. Tvrzení. Jsou-li jevy A1, . . . , An v pravděpodobnostním<br />
prostoru nezávislé, pak jsou nezávislé i jevy<br />
A c 1, A2, . . . , An.<br />
Důkaz:<br />
P (A c 1 ∩ A2 ∩ · · · ∩ An) = P (A2 ∩ A3 ∩ · · · ∩ An) −<br />
− P (A1 ∩ A2 ∩ · · · ∩ An) =<br />
P (A2)P (A3) · · · P (An)−P (A1)P (A2) · · · P (An) =<br />
= (1 − P (A1))P (A2) · · · P (An) =<br />
= P (A c 1)P (A2)P (A3) · · · P (An) .<br />
Důsledek: Nahradíme-li v nezávislém systému jevů některé<br />
jevy jejich opakem, dostaneme opět nezávislý systém.<br />
35
Situace: A1, . . . , An disjunktní jevy, takové že<br />
P (A1) + P (A2) + · · · + P (An) = 1<br />
a P (Ai) > 0 pro všechna i. Pak<br />
P ((A1 ∪ A2 ∪ · · · ∪ An) c ) = 0 .<br />
Pro každé B ∈ A máme<br />
P (B) = P (B ∩ A1) + P (B ∩ A2) + P (B ∩ A3) +<br />
· · · + P (B ∩ An) + 0 =<br />
= P (B|A1)P (A1)+P (B|A2)P (A2)+· · ·+P (B|An)P (An) .<br />
———————————————————–<br />
3.9. Definice. Posloupnost A1, . . . , An disjunktních jevů<br />
v pravděpodobnostním prostoru (Ω, A, P ) se nazývá úplný<br />
systém jevů jestliže A1, . . . , An jsou disjunktní, P (Ai) > 0<br />
pro všechna i a<br />
P (A1) + P (A2) + · · · + P (An) = 1 .<br />
3.10. Věta. (Věta o úplné pravděpodobnosti)<br />
Předpokládejme že A1, . . . , An je úplný systém jevů<br />
v pravděpodobnostním prostoru (Ω, A, P ) takový, že<br />
P (Ai) > 0 pro všechna i = 1, . . . n. Pro každé B ∈ A<br />
platí<br />
P (B) = P (B|A1)P (A1) + P (B|A2)P (A2) +<br />
+ · · · + P (B|An)P (An)<br />
36
„P (B) je kombinace pravděpodobností P (A1), . . . , P (An)<br />
s váhami danými podmíněnými pravděpodobnostmi<br />
3.11. Příklad. V urně č.1 je 50 černých a 60 bílých kuliček.<br />
V urně č.2 je 60 černých a 50 bílých kuliček. Hodíme si<br />
hrací kostkou. Padne-li šestka vybereme urnu č. 1. V opačném<br />
případě urnu č.2. Z vybrané urny vybereme náhodně<br />
kuličku. Jaká je pravděpodobnost, že je bílá?<br />
Řešení:<br />
50 • 60◦ 60 • 50◦ (1)<br />
A1...padne šestka A2...nepadne šestka<br />
P (A1) = 1/6 P (A2) = 5/6<br />
B ... vytažená kulička je bílá<br />
P (B|A1) = 60<br />
110<br />
P (B|A2) = 50<br />
110 .<br />
p = 60 1 50 5 1 25 31<br />
· + · = + =<br />
110 6 110 6 11 66 66 =<br />
= 0, 4697.<br />
37
Bayesův vzorec<br />
Bayes (1761) ... stejné apriorní pravděpodobnosti<br />
Laplace (1774) ... obecný případ<br />
věta o úplné pravděpodobnosti:<br />
P (Ai), P (B|Ai) → P (B)<br />
nyní určíme P (Ai|B):<br />
3.12. Věta. Bayesův vzorec<br />
Je-li A1, . . . , An úplný systém jevů v pravděpodobnostním<br />
prostoru (Ω, A, P ) a B ∈ A s P (B) > 0 pak<br />
P (Aj|B) =<br />
pro všechna j = 1, 2, . . . , n.<br />
Důkaz:<br />
P (B|Aj)P (Aj)<br />
n<br />
i=1 P (B|Ai)P (Ai)<br />
P (Aj|B) = P (Aj ∩ B)<br />
P (B)<br />
=<br />
P (B|Aj)P (Aj)<br />
n<br />
i=1 P (B|Ai)P (Ai)<br />
—————————————————————–<br />
vstup:<br />
P (A1), P (A2), . . . P (An) ... apriorní pravděpodobnosti<br />
P (B|A1), P (B|A2), . . . P (B|An) ... podmíněné pravděpodobnosti<br />
B ... přináší novou informaci o stavu systému<br />
výstup: P (A1|B), P (A2|B), . . . P (An|B) —— upřesněná<br />
informace<br />
38
3.13. Příklad. Máme dvě krabice s bílými a černými kuličkami.<br />
V krabici č. 1 je jedna bílá a devět černých kuliček.<br />
V krabici č.2 je jedna černá a devět bílých kuliček.<br />
1 ◦ 9• č.1<br />
1 • 9◦ č.2<br />
Za plentou byla vylosována jedna z krabic. Náhodně jsme<br />
z ní vytáhli jednu kuličku. Byla bíla. Jaká je pravděpodobnost,<br />
že máme před sebou krabici č.1. ?<br />
A1 . . . první krabice P (A1) = 1<br />
2<br />
A2 . . . druhá krabice P (A2) = 1<br />
2<br />
B . . . tažena bílá kulička P (B|A1) = 1<br />
10<br />
P (B|A2) = 9<br />
10 .<br />
P (A1|B) =<br />
P (B|A1)P (A1)<br />
P (B|A1)P (A1) + P (B|A2)P (A2)<br />
=<br />
1<br />
10<br />
1 1<br />
10 · 2<br />
· 1<br />
2<br />
39<br />
+ 9<br />
10<br />
· 1<br />
2<br />
=<br />
1 1<br />
10 · 2<br />
1<br />
2<br />
= 1<br />
10 .
3.14. Příklad. Diagnóza nemoci<br />
Senzitivita testu: 0,95 (tj. má-li osoba AIDS je test pozitivní<br />
v 95% případů)<br />
specificita testu: 0,95 (tj. nemá-li osoba AIDS je test negativní<br />
v 95% případů)<br />
prevalence nemoci: 0,005 (tj. 0,5% populace je nakaženo)<br />
Jaká je pravděpodobnost, že osoba s pozitivním testem je<br />
nakažena virem HIV?<br />
(Naivní odpověď 0,95 je úplně mimo.)<br />
AIDS NE-AIDS<br />
0,005 0,995<br />
+, - .... výsledky testu<br />
P (+|AIDS) = 0, 95 P (+|NEAIDS) = 0, 05<br />
P (−|AIDS) = 0, 05 P (−|NEAIDS) = 0, 95<br />
P (AIDS|+) =<br />
P (+|AIDS)P (AIDS)<br />
=<br />
P (+|AIDS)P (AIDS) + P (+|NEAIDS)P (NEAIDS)<br />
0, 95 · 0, 005<br />
=<br />
= 0, 087 .<br />
0, 95 · 0, 005 + 0, 05 · 0, 995<br />
apriorní pravděpodobnosti → aposteriorní pravděpodobnosti<br />
(0, 005, 0, 995) → (0, 087, 0, 913) .<br />
40
Test opakujeme znovu. Testovaná osoba je opět pozitivní.<br />
Jaká je nyní pravděpodobnost že má AIDS ?<br />
Opakujeme postup s<br />
P (AIDS) = 0, 087 P (NEAIDS) = 0, 913 .<br />
numerické výsledky:<br />
i ... počet pozitivních testů,<br />
Pi ... pravděpodobnost, že daná osoba má AIDS.<br />
i 0 1 2 3 4 5<br />
Pi 0,005 0,087 0,645 0,972 0,998 0,9992<br />
41
4 Náhodná veličina<br />
• Zajímá nás pouze sledovaná numerická veličina, nikoliv<br />
celý pravděpodobnostní prostor: počet zákazníků, cena akcie,<br />
hodnota měření napětí, ...<br />
• Podstatné je stanovit pravděpodobnost, že náhodná veličina<br />
má hodnoty v daném rozmezí.<br />
——————————————————–<br />
Značení:<br />
I ... interval na reálné ose, zahrnujeme i jednobodové množiny.<br />
X : Ω → R ... funkce definovaná na množině Ω.<br />
[X ∈ I] = {ω ∈ Ω | X(ω) ∈ I} .<br />
4.1. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor.<br />
Funkce X definovaná na Ω se nazývá náhodná veličina<br />
jestliže<br />
[X ∈ I] ∈ A<br />
pro všechny intervaly I ⊂ R.<br />
42
Všechny funkce na konečném nebo diskrétním pravděpodobnostním<br />
prostoru jsou náhodné veličiny.<br />
Náhodné veličiny popisujeme kvantitativně pomocí jejich<br />
distribučních funkcí:<br />
P [X ≤ x] = P ({ω | X(ω) ≤ x}) .<br />
4.2. Definice. Předpokládejme, že X je náhodná veličina<br />
na pravděpodobnostním prostoru (Ω, A, P ).<br />
Distribuční funkce, FX, náhodné veličiny X je funkce<br />
FX(x) = P [X ≤ x], x ∈ R .<br />
43
4.3. Příklad. X ... počet ok při hodu kostkou<br />
X nabývá šesti hodnot, 1,2,3,4,5,6; distribuční funkce je<br />
po částech spojitá funkce.<br />
4.4. Příklad. X ... poloha ručičky hodinek při náhodném<br />
zastavení:<br />
⎧<br />
⎪⎨<br />
x<br />
2 π x ∈< 0, 2π ><br />
F (x) = 0<br />
⎪⎩<br />
1<br />
x ≤ 0<br />
x ≥ 2π .<br />
4.5. Příklad. Vlak projíždí přejezdem jedenkrát za hodinu,<br />
Závory jsou staženy na dvanáct minut. Náhodná veličina<br />
X je doba čekání.<br />
P [X = 0] =<br />
60 − 12<br />
60<br />
Pro x ∈ (0, 12 > máme:<br />
Tedy<br />
48<br />
= = 0, 8 .<br />
60<br />
P [X ≤ x] = P [X = 0] + P [0 < X ≤ x] = 0, 8 + x<br />
60 .<br />
⎧<br />
0 x < 0<br />
⎪⎨<br />
0, 8 x = 0<br />
FX(x) =<br />
⎪⎩<br />
0, 8 + x<br />
60 x ∈ (0, 12 ><br />
1 x ≥ 12<br />
44
4.6. Věta. Distribuční funkce FX náhodné veličiny X<br />
splňuje následující podmínky:<br />
(i) 0 ≤ FX ≤ 1<br />
(ii) FX je neklesající<br />
(iii) FX je zprava spojitá<br />
(iv) limx→−∞ FX(x) = 0, limx→∞ FX(x) = 1 .<br />
Dukaz: (ii) Je-li x ≤ y, pak [X ≤ x] ⊂ [X ≤ y], a tedy<br />
FX(x) ≤ FX(y) .<br />
(iii) Volme (δn) klesající posloupnost kladných čísel s nulovou<br />
limitou a a ∈ R. Uvažujme množiny<br />
Platí<br />
An = [X ≤ a + δn] .<br />
∞<br />
An = [X ≤ a] .<br />
n=1<br />
Dle spojitosti pravděpodobnosti Věta 2.16 platí<br />
P [X ≤ a] = lim<br />
n→∞ P (An) .<br />
Jinými slovy<br />
FX(a) = lim<br />
n→∞ FX(a + δn) ,<br />
a proto<br />
FX(a) = lim<br />
x→a+ FX(x) .<br />
45
(iv)<br />
An = [X ≤ −n] , n = 1, 2 . . .<br />
Pak An je klesající posloupnost množin s prázdným průnikem.<br />
Dle Věty 2.16 máme<br />
lim<br />
n→∞ FX(−n) = lim<br />
n→∞ P (An) = P (∅) = 0 .<br />
FX je neklesající, a proto musí mít v −∞ limitu nula.<br />
(Druhá limita podobně.)<br />
V distribuční funkci FX jsou všechny relevantní informace<br />
o náhodné veličině X:<br />
•<br />
•<br />
•<br />
•<br />
P [X > a] = 1 − P [X ≤ a] = 1 − FX(a) .<br />
P [X ∈ (a, b >] = P [(X ≤ b) ∧ (X ≤ a) c ] =<br />
Odtud<br />
= P [X ≤ b] − P [X ≤ a] = FX(b) − FX(a) .<br />
P [X < a] = lim<br />
n→∞ P<br />
<br />
X ≤ a − 1<br />
<br />
= lim<br />
n n→∞ FX<br />
<br />
a − 1<br />
<br />
= lim<br />
n x→a− FX(x) .<br />
P [X = a] + P [X < a] = P [X ≤ a] .<br />
P [X = a] = FX(a) − lim<br />
x→a− FX(x) .<br />
(Velikost případného skoku.)<br />
46
4.7. Věta. Ke každé zprava spojité, neklesající funkci<br />
F (x) na R, s limitami limx→−∞ F (x) = 0,<br />
limx→∞ F (x) = 1, existuje náhodná veličina X tak, že<br />
FX = F .<br />
Důkaz je mimo naše možnosti – teorie míry.<br />
distribuční funkce (náhodná rozdělení) = náhodné veličiny.<br />
Typy náhodných veličin:<br />
• diskrétní rozdělení<br />
• spojité rozdělení<br />
• smíšené rozdělení<br />
47
4.8. Definice. Náhodná veličina X se nazývá diskrétní,<br />
jestliže existuje konečná nebo nekonečná posloupnost (xn)<br />
taková, že<br />
<br />
P [X = xn] = 1 .<br />
n<br />
Daná tabulkou resp. pravděpodobnostní funkcí:<br />
x1 x2 x3 · · ·<br />
p1 p2 p3 · · ·<br />
P [X = xi] = pi , (xn)n . . . uzly<br />
4.9. Příklad. X ... počet ok při hodu hrací kostkou<br />
1 2 3 4 5 6<br />
1/6 1/6 1/6 1/6 1/6 1/6<br />
4.10. Příklad. X ... doba kdy poprvé padne líc při sérii<br />
hodů symetrickou mincí.<br />
1 2 3 · · ·<br />
· · ·<br />
1<br />
2<br />
1<br />
4<br />
1<br />
3<br />
P [X = n] = 1<br />
.<br />
2n ∞ 1<br />
= 1 .<br />
2n n=1<br />
48
4.11. Tvrzení. Má-li náhodná veličina X diskrétní rozdělení<br />
s pravděpodobnostní funkcí (xn, pn)n, pak pro<br />
M ⊂ R platí<br />
P [X ∈ M] =<br />
<br />
pn .<br />
{n | xn∈M}<br />
4.12. Příklad. Jaká je pravděpodobnost, že při házení<br />
symetrickou mincí padne líc poprvé po sudém počtu hodů<br />
?<br />
X z Příkladu 4.10.<br />
P [X = sudé] = 1 1 1<br />
+ +<br />
4 16 64<br />
49<br />
1<br />
+ · · · =<br />
4<br />
1<br />
1 − 1<br />
4<br />
= 1<br />
3 .
4.13. Definice. Náhodná veličina X se nazývá spojitá,<br />
jestliže existuje nezáporná funkce f taková, že<br />
FX(x) =<br />
x<br />
−∞<br />
f(t) dt .<br />
Funkce f se přitom nazývá hustotou náhodné veličiny X.<br />
• Funkce f je hustotou náhodné veličiny právě tehdy<br />
f(t) dt = 1.<br />
když je nezáporná a ∞<br />
−∞<br />
• Je-li x bod spojitosti hustoty f, pak f(x) = FX(x) ′ .<br />
Je-li f hustota náhodné veličiny X, pak<br />
P [a ≤ X ≤ b] =<br />
b<br />
a<br />
f(x) dx .<br />
Hustota dává preference hodnotám.<br />
50
4.14. Příklad. f(x) =<br />
(Rovnoměrné rozdělení)<br />
Pro x ∈< 0, 1 ><br />
x<br />
FX(x) = dt = x .<br />
0<br />
⎧<br />
⎪⎨ 0 x ≤ 0<br />
FX(x) = x<br />
⎪⎩<br />
1<br />
x ∈< 0, 1 ><br />
x ≥ 1<br />
4.15. Příklad. f(x) =<br />
<br />
1 x ∈< 0, 1 ><br />
0 jinak<br />
x+1<br />
2<br />
x ∈< −1, 1 ><br />
0 jinak<br />
Pro distribuční funkci F (x) na intervalu < −1, 1 > platí<br />
FX(x) =<br />
x<br />
−1<br />
t + 1<br />
2<br />
2 t<br />
dt =<br />
4<br />
= x2<br />
4<br />
x t<br />
+ =<br />
2 −1<br />
x 1 (x + 1)2<br />
+ + = .<br />
2 4 4<br />
Pravděpodobnost roste s kvadratickou rychlostí. Pro distribuční<br />
funkci máme<br />
⎧<br />
⎪⎨ 0 x < −1<br />
(x+1) FX(x) =<br />
⎪⎩<br />
2<br />
4 x ∈< −1, 1 ><br />
1 x ≥ 1<br />
51
⎧<br />
⎪⎨ x + 1 x ∈< −1, 0 ><br />
4.16. Příklad.<br />
Pro x ∈< −1, 0 ><br />
f(x) = 1 − x<br />
⎪⎩<br />
0<br />
x ∈< 0, 1 ><br />
jinak<br />
FX(x) =<br />
x<br />
−1<br />
Pro x ∈< 0, 1 ><br />
FX(x) = 1<br />
2 +<br />
2 t<br />
(t + 1) dt =<br />
2<br />
x<br />
4.17. Příklad. (Semicircular law)<br />
f(x) =<br />
0<br />
x + t =<br />
−1<br />
x2 1<br />
+ x +<br />
2 2 .<br />
(1 − t) dt = 1<br />
2 +<br />
<br />
t − t2<br />
x = −<br />
2 0<br />
x2 1<br />
+ x +<br />
2 2 .<br />
√<br />
1<br />
2π 4 − x2 x ∈< −2, 2 ><br />
0 jinak<br />
4 1<br />
− x2 dx =<br />
2 (x4 − x2 + 4 arcsin x<br />
) + c .<br />
2<br />
Pro x ∈< −2, 2 > tedy máme:<br />
FX(x) = 1<br />
4π x4 − x2 + 1 x 1<br />
arcsin +<br />
π 2 2 .<br />
52
4.18. Příklad. f(x) = 1<br />
2 e−|x| .<br />
Pro x < 0<br />
Pro x ≥ 0<br />
FX(x) = 1<br />
2<br />
x<br />
−∞<br />
FX(x) = 1 1<br />
+<br />
2 2<br />
e t dt = ex<br />
2 .<br />
x<br />
0<br />
e −t dt = 1 1<br />
−<br />
2 2 e−x + 1 1<br />
= 1 −<br />
2 2 e−x .<br />
53
4.19. Příklad. Střílíme na terč o poloměru r. Výhra je<br />
dána vzdáleností zásahu d od středu terče vzorcem<br />
X = 10(r − d) .<br />
Nalezněte hustotu veličiny X.<br />
Řešení:<br />
Pro 0 ≤ x ≤ 10r<br />
<br />
P [X ≤ x] = P [10r − 10d ≤ x] = P d ≥ r − x<br />
<br />
= 1−P d ≤ r− x<br />
<br />
= 1−<br />
10<br />
x π(r − 10 )2<br />
π r2 = 1−<br />
<br />
=<br />
10<br />
x (r − 10 )2<br />
r2 .<br />
Hustota pro x ∈ (0, 10r >:<br />
f(x) = F ′ x −2(r − 10<br />
X(x) = )<br />
r2 · −1 1<br />
=<br />
10 5r2 <br />
r − x<br />
<br />
.<br />
10<br />
Hustota je nulová mimo interval < 0, 10r >.<br />
54
Důležité je reprezentovat náhodnou veličinu číselnými charakteristikami.<br />
Jednou z nich je střední hodnota.<br />
Motivace: Ve škole je N žáků z toho<br />
n1 má prospěch x1 = 1<br />
n2 má prospěch x2 = 2<br />
n3 má prospěch x3 = 3<br />
n4 má prospěch x3 = 4<br />
n5 má prospěch x5 = 5<br />
pi = ni<br />
N<br />
... relativní četnost.<br />
Průměrný prospěch =<br />
= n1x1 + n2x2 + n3x3 + n4x4 + n5x5<br />
=<br />
N<br />
= n1<br />
N x1 + n2<br />
N x2 + n3<br />
N x3 + n4<br />
N x4 + n5<br />
N x5 =<br />
= x1p1 + x2p2 + x3p3 + x4p4 + x5p5 .<br />
55
4.20. Definice. Nechť X je diskrétní náhodná veličina,<br />
která nabývá hodnot x1, x2, . . . s pravděpodobnostmi<br />
P [X = xi] = pi,<br />
<br />
pi = 1 .<br />
Předpokládejme, že<br />
<br />
|xi| pi < ∞ .<br />
i<br />
Střední hodnota, EX, veličiny X je definovaná vztahem<br />
EX = <br />
i<br />
xi pi .<br />
4.21. Definice. Nechť X je náhodná veličina s hustotou<br />
f(x) taková, že<br />
∞<br />
−∞<br />
|x|f(x) dx < ∞ .<br />
Střední hodnota, EX, veličiny X je definována vztahem:<br />
EX =<br />
∞<br />
−∞<br />
x f(x) dx .<br />
i<br />
56
4.22. Příklad. Konstantní náhodná veličina<br />
P [X = c] = 1<br />
EX = c · 1 = c .<br />
4.23. Příklad. Počet ok při hodu hrací kostkou<br />
EX = 1<br />
(1 + 2 + 3 + 4 + 5 + 6) = 3, 5 .<br />
6<br />
4.24. Příklad. Alternativní rozdělení<br />
EX = 0 · (1 − p) + 1 · p = p .<br />
0 1<br />
1 − p p<br />
V tomto případě splývá střední hodnota s pravděpodobností<br />
p.<br />
57
4.25. Příklad. Házíme symetrickou mincí. X je počet<br />
hodů než padne první líc.<br />
P [X = n] = 1<br />
, n = 1, 2, . . .<br />
2n EX =<br />
∞<br />
n=1<br />
n<br />
.<br />
2n Při výpočtu si pomůžeme teorií mocninných řad.<br />
∞<br />
n=0<br />
x n = 1<br />
, pro |x| < 1 .<br />
1 − x<br />
Derivace člen po členu:<br />
∞<br />
n x n−1 =<br />
n=1<br />
Pronásobením x<br />
∞<br />
n x n x<br />
=<br />
(1 − x) 2<br />
n=1<br />
Dosazením x = 1<br />
2<br />
EX =<br />
∞<br />
n=1<br />
′<br />
1 1<br />
= .<br />
1 − x (1 − x) 2<br />
n 2<br />
= = 2 .<br />
2n 1<br />
58
Na každá náhodná veličina má definovánu střední hodnotu.<br />
Např. diskrétní veličina s pravděpodobnostní funkcí<br />
P [X = 2 n ] = 1<br />
, n = 1, 2 . . .<br />
2n nemá střední hodnotu neboť<br />
∞ ∞<br />
1 = ∞ .<br />
n=1<br />
2n =<br />
2n n=1<br />
4.26. Příklad. Hustota<br />
f(x) =<br />
x+1<br />
2<br />
EX =<br />
x ∈< −1, 1 ><br />
0 jinak<br />
1<br />
−1<br />
3 1<br />
x + 1 x x2<br />
x dx = + =<br />
2 6 4 −1<br />
1<br />
3 .<br />
59
4.27. Příklad. Semicircular law<br />
EX = 1<br />
2π<br />
2<br />
−2<br />
x 1 − x 2 dx = 0 .<br />
4.28. Věta. Jsou-li X1 a X2 náhodné veličiny na pravděpodobnostním<br />
prostoru (Ω, A, P ), pak<br />
(i) E(X1 + X2) = EX1 + EX2,<br />
(ii) E(αX1) = αE(X1) , α ∈ R .<br />
(iii) E(X1) ≥ 0 je-li X1 ≥ 0.<br />
60
Podrobnější popis rozložení hodnot kolem střední hodnoty<br />
poskytuje rozptyl<br />
4.29. Definice. Rozptyl (variance) náhodné veličiny<br />
X, pro kterou existuje EX a EX 2 je definován<br />
varX = E[(X − EX) 2 ] .<br />
Značení: var(X), D(X),<br />
Směrodatná odchylka: var(X).<br />
E[(X − EX) 2 ] = E[X 2 − 2 X · (EX) + (EX) 2 ] =<br />
Způsob výpočtu:<br />
EX 2 = <br />
EX 2 =<br />
i<br />
∞<br />
<br />
−∞<br />
= E(X 2 ) − (EX) 2 .<br />
x 2 i pi . . . diskrétní veličina<br />
x 2 f(x) dx . . . spojitá veličina<br />
61
4.30. Příklad. Alternativní rozdělení X<br />
0 1<br />
1 − p p<br />
X 2 :<br />
0 1<br />
1 − p p<br />
var(X) = EX 2 − (EX) 2 = p − p 2 = p(1 − p) .<br />
var(X) ≤ 1<br />
4<br />
Nejvyšší možná hodnota rozptylu je pro p = 1<br />
2<br />
62<br />
a to 1<br />
4 .
4.31. Definice. Nechť FX(x) je distribuční funkce náhodné<br />
veličiny X. Předpokládejme, že pro každé α ∈ (0, 1)<br />
existuje právě jedno β tak, že F (β) = α.<br />
α-kvantil náhodné veličiny X je číslo, pro které platí<br />
FX(xα) = α .<br />
α = P [X ≤ xα] .<br />
Je-li FX prostá, pak xα = F −1<br />
X (α) .<br />
se v tomto případě nazývá kvantilová funkce.<br />
F −1<br />
X<br />
Významné kvantily:<br />
x0,5 . . . medián<br />
x0,75 . . . horní kvartil<br />
x0,25 . . . dolní kvartil<br />
x0,9 . . . horní decil<br />
x0,1 . . . dolní decil<br />
x0,99 . . . horní percentil<br />
Statistické tabulky: Průměrný čistý plat v ČR na osobu v<br />
domácnosti v roce 2003 byl 8175 KČ.<br />
Dolní decil x0,1=4524 KČ.<br />
63
4.32. Příklad. X je spojité rozdělení s hustotou<br />
f(x) = x+1<br />
2 , x ∈< −1, 1 > a nula jinak.<br />
Viz Příklad 4.15.<br />
F (x) = 1<br />
4 (x + 1)2 , x ∈< −1, 1 > .<br />
α ∈ (0, 1)<br />
F (x) = 1<br />
4 (x + 1)2 = α<br />
|x + 1| = √ 4α<br />
Např. medián<br />
xα = 2 √ α − 1<br />
x0,5 = 2 1/2 − 1 .<br />
64
4.33. Příklad. Doba rozpadu radioaktivního atomu je<br />
náhodná veličina s hustotou<br />
<br />
λ e<br />
f(x) =<br />
−λx x ≥ 0<br />
0 x < 0 ,<br />
kde λ > 0. Určete poločas rozpadu.<br />
Řešení:<br />
Poločas rozpadu je medián. Pro distribuční funkci máme<br />
F (x) =<br />
x<br />
0<br />
1 − e −λx = 0, 5<br />
λe −λt dt = [−e −λt ] x 0 = 1 − e −λx .<br />
e −λx = 0, 5<br />
−λx = − ln 2<br />
x =<br />
ln 2<br />
λ<br />
Poločas rozpadu je medián<br />
x0,5 =<br />
ln 2<br />
λ .<br />
65
4.34. Tvrzení. Platí-li pro náhodné veličiny X a Y vztah<br />
pak<br />
Y = aX + b , a, b ∈ R, a > 0 ,<br />
yα = axα + b<br />
pro všechna α ∈ (0, 1).<br />
Důkaz:<br />
α = P [X ≤ xα] = P [aX + b ≤ axα + b] = P [Y ≤ axα + b]<br />
.<br />
<br />
66<br />
yα
5 Důležitá rozdělení<br />
Diskrétní rozdělení<br />
Alternativní rozdělení A(p), 0 < p < 1.<br />
0 1<br />
1 − p p<br />
EX = p<br />
varX = p(1 − p) .<br />
Binomické rozdělení Bi(n, p), n ∈ N, 0 < p < 1.<br />
0 1 2 . . . n<br />
p0 p1 p2 . . . pn<br />
P [X = k] = pk =<br />
<br />
n<br />
p<br />
k<br />
k (1 − p) n−k<br />
67<br />
k = 0, 1, . . . , n .
X = počet zdarů v sérii n pokusů<br />
Bernoulliova schématu.<br />
• počet líců v sérii n hodů<br />
• počet osob volící daný politický subjekt z n<br />
dotázaných<br />
• počet osob sledujících daný TV pořad z n<br />
sledovaných<br />
• počet částic v náhodně zvolené příhrádce z n<br />
příhrádek<br />
• počet vadných sučástek z n náhodně vybraných<br />
součástek<br />
<br />
1 nastal-li zdar v i − tém pokusu<br />
Xi =<br />
0 jinak<br />
Xi má rozdělení A(p).<br />
X = X1 + X2 + · · · + Xn .<br />
68
5.1. Příklad. S.Pepys (1693), náruživý hráč v<br />
kostky. Co je pravděodobnější, že šesti kostkami<br />
hodíme alespoň jednu šestku (jev A), nebo že dvanácti<br />
kostkami hodíme alespoň dvě šestky (jev B)?<br />
Vyřešil Newton.<br />
počet šestek při hodu šesti kostkami ... Bi(6, 1/6).<br />
(p = 1<br />
6 )<br />
P (A) =<br />
6<br />
k=1<br />
<br />
6<br />
p<br />
k<br />
k (1 − p) n−k =<br />
<br />
6<br />
1 − p<br />
0<br />
0 (1 − p) 6 = 0, 6651 .<br />
počet šestek při hodu dvanácti kostkami ... Bi(12, 1/6).<br />
(p = 1<br />
6 )<br />
12<br />
P (B) =<br />
k=2<br />
<br />
12<br />
1−<br />
0<br />
<br />
12<br />
p<br />
6<br />
k (1 − p) n−k =<br />
<br />
p 0 (1−p) 12 −<br />
69<br />
12<br />
1<br />
<br />
p(1−p) 11 = 0, 6189 .
Domácí cvičení: Pravděpodovbnost, že 18 kostkami<br />
hodíme alespoň 3 šestky je 0,5973.<br />
5.2. Příklad. Náhodná procházka<br />
Částice se pohybuje po ose x. Začíná v bodě 0.<br />
V daném stádiu se rozhodne s pravděpodobností<br />
1/2 jít doprava a s pravděpodobností 1/2 doleva.<br />
Sn je poloha částice v čase n. Jaké je rozdělení Sn?<br />
Bernoulliovo schéma, n pokusů; p = 1<br />
2 .<br />
1.. jdeme doprava, -1... jdeme doleva.<br />
Je-li k jedniček a n − k -jedniček, pak je poloha<br />
k − (n − k) = 2k − n k = 0, . . . n .<br />
<br />
n<br />
P [Sn = 2k − n] = 2<br />
k<br />
−n .<br />
(Dá se ukázat, že částice s pravděpodobnosí jedna<br />
navštíví každý bod. Totéž pro dvě dimenze, ne<br />
však pro tři.)<br />
70
5.3. Příklad.<br />
Maxwellovo-Boltzmanovo schéma<br />
Máme n částic a r příhrádek. Každá částice si<br />
vybírá nějakou příhrádku. Všechny možnosti mají<br />
stejnou šanci. Jaké je rozložení počtu částic v pevně<br />
zvolené příhrádce?<br />
Bernoulliovo schéma: vybraná částice si zvolí danou<br />
přihrádku, celkem n pokusů (máme n částic).<br />
Šance zdaru je 1<br />
r .<br />
Náhodná veličina má rozdělení Bi(n, 1<br />
r ).<br />
Konkrétní situace:<br />
5.4. Příklad. Máme n = 500 osob a r = 365<br />
příhrádek (narozeniny). Počet osob mající narozeniny<br />
dne 18.7. (jako přednášející) se řídí Bi(500, 1<br />
365 ).<br />
Tabulka numerických hodnot:<br />
počet 0 1 2 3 4 5 6<br />
pravděpodobnost 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023<br />
71
Pravděpodobnost, že tři osoby mají narozeniny 18.7.<br />
je 0,1089 .<br />
další modely: osoby obsazující vagóny, výsledky<br />
hodu kostkou padající do 6 možností, . . .<br />
72
Charakteristiky Bi(n, k).<br />
X = X1 + X2 + · · · + Xn<br />
Xi . . . A(p), EXi = p.<br />
EX = EX1 + EX2 + · · · + EXn = np .<br />
E(X 2 ) = E(X1+X2+· · ·+Xn) 2 = EX 2 1+EX 2 2 · · ·+EX 2 n+<br />
+ 2E(X1X2) + 2E(X1X3) + · · · .<br />
Je-li i = j máme pro Xi Xj rozdělení<br />
0 1<br />
1 − p 2 p 2<br />
Tedy E(XiXj) = p2 , což znamená, že<br />
EX 2 <br />
n<br />
= np + 2 · p<br />
2<br />
2 .<br />
Konečně,<br />
var(X) = EX 2 −(EX) 2 = np+2·<br />
np+2<br />
<br />
n<br />
2<br />
<br />
p 2 −n 2 p 2 =<br />
n(n − 1)<br />
p<br />
2<br />
2 −n 2 p 2 = np−np 2 = np(1−p) .<br />
73
Má-li X rozdělení Bi(n, p), pak<br />
EX = np varX = np(1 − p)<br />
Průměrný počet šestek při sérii n hodů hrací kostkou<br />
je n<br />
6 .<br />
Průměrný počet částic v jedné přihrádce u 500<br />
částic náhodně rozptýlených v 365 příhrádkách je<br />
= 1, 369863014.<br />
500<br />
365<br />
. . .<br />
74
Co se děje s binomickým rozdělením, jestliže se<br />
nemění střední hodnota, ale počet pokusů jde do<br />
nekonečna?<br />
5.5. Věta. Poissonova věta<br />
Předpokládejme, že (Xn) ∞ n=1 je posloupnost náhodných<br />
veličin majících rozdělení Bi(n, λ),<br />
kde n<br />
λ > 0. (Tj. EXn = λ pro všechna n.) Pak<br />
Důkaz:<br />
lim<br />
n→∞ P [Xn = k] = λk<br />
k! e−λ .<br />
pn = λ<br />
n .<br />
P [Xn = k] =<br />
= 1<br />
k!<br />
lim<br />
n→∞<br />
<br />
n<br />
p<br />
k<br />
k n(1 − pn) n−k =<br />
npn · (n − 1)pn · · · (n − k + 1)pn<br />
(1 − pn) k<br />
npn<br />
1 − pn<br />
(n − 1)pn<br />
lim<br />
n→∞ 1 − pn<br />
= lim<br />
n→∞<br />
λ<br />
1 − λ<br />
n<br />
= λ .<br />
λ −<br />
= lim<br />
n→∞<br />
λ<br />
n<br />
1 − λ<br />
n<br />
75<br />
= λ .<br />
<br />
1− λ<br />
n .<br />
n
Tedy<br />
lim<br />
n→∞ P [Xn = k] = λk<br />
<br />
lim 1 −<br />
k! n→∞<br />
λ<br />
n =<br />
n<br />
λk<br />
k! e−λ .<br />
Aproximujeme pro n velké a pn malé<br />
P [X = k] ∼ λk<br />
k! e−λ .<br />
5.6. Příklad. Stroj produkuje 1% zmetků. Jaká<br />
je pravděpodobnost, že z 200 náhodně vybraných<br />
výrobků neni žádný zmetek?<br />
X ∼ Bi(200, 1<br />
100 )<br />
P [X = 0] = 0, 99 200 = 0, 1340 .<br />
Aproximace pomocí Poissonovy věty:<br />
λ = 200 · 1<br />
100<br />
= 2<br />
P [X = 0] . = e −2 = 0, 1353.<br />
76
n částic se náhodně rozděluje do r příhrádek, při-<br />
čemž n, r → ∞ při konstantním poměru λ = n<br />
r .<br />
Počet částic v pevně zvolené příhrádce se asymtoticky<br />
řídí Poissonovým zákonem s parametrem λ.<br />
5.7. Příklad. X ∼ Bi(500, 365) ... viz Příklad 5.4.<br />
počet 0 1 2 3 4 5 6<br />
binomický zákon 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023<br />
Poissonův zákon 0,2541 0,3481 0,2385 0,1089 0,0372 0,0102 0,0023<br />
77
Poissonovo rozdělení<br />
Náhodná veličina X, která nabývá hodnot 0, 1, . . .<br />
s pravděpodobnostmi<br />
P [Xn = n] = λn<br />
n! e−λ , n = 0, 1, . . .<br />
P o(λ)<br />
P [X = 0] = e −λ<br />
P [X > 0] = 1 − e −λ .<br />
5.8. Příklad. Lahve se vyrábějí ze skloviny obsahující<br />
kazy, keré jsou rozděly nepravidelně tak, že<br />
v každém metrickém centu skloviny je průměrně<br />
x kazů. Láhev váží 1 kg a je vadná obsahuje-li jeden<br />
či více kazů. Stanovte procento vadných lahví.<br />
Řešení Z M metrických centů se vyrobí 100M<br />
lahví, které budou obsahovat přibližně xM kazů.<br />
Pro počet kazů v jedné lahvi tedy máme rozdělení<br />
Bi(xM,<br />
1<br />
) .<br />
100M<br />
EX = λ = xM 1<br />
100M<br />
78<br />
= x<br />
100 .
Pro M → ∞ máme rozdělení<br />
<br />
x<br />
P o<br />
100<br />
Pravděpodobnost, že láhev bude bez kazu je<br />
x<br />
−<br />
1 − e 100 .<br />
Je-li například x = 30, pak procento vadných lahví<br />
bude 1 − e −0,3 = 0, 2592.<br />
Při velkém počtu kazů je výhodnější vyrábět menší<br />
lahve. Je-li např. váha lahve 0, 25kg je procento<br />
zmetků 7, 22%.<br />
79
Charakteristiky P (λ):<br />
EX =<br />
EX 2 =<br />
Tedy<br />
∞<br />
n=0<br />
= e −λ<br />
∞<br />
n=0<br />
n λn<br />
n! e−λ <br />
∞<br />
λ<br />
= λ<br />
n=1<br />
n−1 <br />
e<br />
(n − 1)!<br />
−λ =<br />
= λe λ e −λ = λ .<br />
2 λn<br />
n<br />
∞<br />
n=2<br />
n! e−λ =<br />
∞<br />
n=2<br />
λ n<br />
(n − 2)! +λ = e−λ λ 2<br />
n(n−1) λn<br />
n! e−λ +<br />
∞<br />
n=2<br />
= e −λ λ 2 e λ + λ = λ 2 + λ .<br />
=λ<br />
<br />
∞<br />
n=0<br />
n λn<br />
n! e−λ =<br />
λn−2 +λ =<br />
(n − 2)!<br />
var(X) = EX 2 − (EX) 2 = λ 2 + λ − λ 2 = λ .<br />
E(X) = λ<br />
var(X) = λ<br />
80
Příklady Poissonova rozdělení: (homogenní chaos<br />
v prostoru nebo čase)<br />
• počet volání na telofonní ústřednu za jednotku<br />
času<br />
• počet atomů radioaktivní látky rozpadlých za<br />
jednotku času<br />
• počet hvězd v daném objemu galaxie<br />
• počet létavic meteorického roje za jednotku<br />
času<br />
• počet střel zasahující danou oblast<br />
• počet defektů kola (bad luck) za jednotku<br />
času<br />
• počet zákazníků za jednotku času<br />
81
Geometrické rozdělení Ge(p), 0 < p < 1.<br />
X je počet zdarů v Bernoulliově schématu před<br />
prvním nezdarem.<br />
P [X = 0] = 1 − p .<br />
P [X = 1] = (1 − p)p .<br />
P [X = 2] = (1 − p)p 2 .<br />
...................................<br />
P [X = k] = (1 − p)p k<br />
82<br />
k = 0, 1, . . . .
5.9. Příklad. Dva hráči se střídají a házejí hrací<br />
kostkou. Vyhrává ten komu padne šestka. Jaká je<br />
pravděpodobnost výhry u jednotlivých hráčů?<br />
X . . . geometrické rozdělení s p = 5<br />
6 .<br />
A ... vyhrává hráč, který začíná<br />
P (A) = P [X = sudé] =<br />
= 1<br />
1 + 5<br />
6<br />
∞<br />
(1−p)p 2k ∞<br />
= (1−p) p 2k =<br />
k=0<br />
1 1<br />
= (1 − p) =<br />
1 − p2 1 + p =<br />
= 6<br />
= 0, 54545455 .<br />
11<br />
83<br />
k=0
Střední hodnota geometrického rozdělení:<br />
EX =<br />
∞<br />
n (1 − p) p n ∞<br />
= (1 − p) n p n =<br />
n=0<br />
= (1−p) p d<br />
dp<br />
∞ <br />
n=0<br />
n=0<br />
p n<br />
<br />
= (1−p)p d<br />
<br />
1<br />
=<br />
dp 1 − p<br />
1 p<br />
= (1 − p)p =<br />
(1 − p) 2 1 − p .<br />
5.10. Příklad. Žák umí 90% látky. Kolik přežije<br />
průměrně otázek?<br />
Ge(p), p = 0, 9<br />
EX =<br />
0, 9<br />
1 − 0, 9<br />
= 9 .<br />
84
Rozptyl<br />
d 2<br />
dp 2<br />
∞<br />
p n =<br />
n=0<br />
E(X 2 ) − EX =<br />
2 d2<br />
= (1−p)p<br />
dp2 ∞<br />
n(n − 1)p n−2 .<br />
n=0<br />
∞<br />
n(n − 1)(1 − p)p n =<br />
n=0<br />
∞<br />
n=0<br />
p n = (1−p)p 2<br />
′′<br />
1<br />
=<br />
1 − p<br />
= (1 − p)p 2 2 2p2<br />
= .<br />
(1 − p) 3 (1 − p) 2<br />
E(X 2 )−(EX) 2 = 2p2<br />
p p2<br />
+ − =<br />
(1 − p) 2 1 − p (1 − p) 2<br />
p2 p<br />
+<br />
(1 − p) 2 1 − p = p2 + p(1 − p)<br />
(1 − p) 2<br />
85<br />
=<br />
=<br />
p<br />
.<br />
(1 − p) 2
EX =<br />
varX =<br />
p<br />
1 − p<br />
p<br />
.<br />
(1 − p) 2<br />
Rovnoměrné rozdělení na < a, b ><br />
R < a, b >.<br />
Hustota:<br />
f(x) =<br />
1<br />
b−a<br />
Distribuční funkce:<br />
x ∈< a, b ><br />
0 jinak<br />
⎧<br />
⎪⎨<br />
x−a<br />
b−a x ∈< a, b ><br />
F (x) = 0<br />
⎪⎩<br />
1<br />
x < a<br />
x > b<br />
86
EX = x 1<br />
2 b<br />
1 x<br />
dx = =<br />
b − a b − a 2<br />
a<br />
EX 2 = 1<br />
b<br />
b − a<br />
a<br />
= b2 − a 2<br />
2(b − a)<br />
x 2 dx = 1 b<br />
b − a<br />
3 − a3 3<br />
a<br />
= a + b<br />
2<br />
=<br />
= a2 + ab + b 2<br />
3<br />
var(X) = E(X 2 )−(EX) 2 = a2 + ab + b 2<br />
= a2 − 2ab + b 2<br />
12<br />
a + b<br />
EX =<br />
2<br />
varX = 1<br />
12 (b − a)2 .<br />
87<br />
−<br />
3<br />
a2 + 2ab + b2 4<br />
= 1<br />
12 (b − a)2 .<br />
.<br />
.<br />
=
Normální rozdělení (Gaussovo rozdělení)<br />
N(µ, σ 2 ).<br />
µ ∈ R, σ 2 > 0.<br />
hustota:<br />
f(x) = 1 (x−µ)2<br />
−<br />
√ e 2σ<br />
2πσ 2<br />
Vychází z Laplaceova integrálu:<br />
∞<br />
−∞<br />
e −x2<br />
dx = √ π .<br />
standardní, normované normální rozdělení: N(0, 1).<br />
značení:<br />
Φ(x) = 1<br />
√ 2π<br />
x<br />
−∞<br />
t2<br />
−<br />
e 2 dt<br />
počítá se numericky, tabelována.<br />
88
Souvislost mezi normálními rozděleními různých<br />
parametrů.<br />
• Má-li Y rozdělení N(0, 1) =⇒ X = µ+σ Y má<br />
rozdělení N(µ, σ 2 ).<br />
Odvození:<br />
FX(x) = P [X ≤ x] = P [µ + σ Y ≤ x] =<br />
<br />
x − µ x − µ<br />
= P Y ≤ = Φ<br />
σ<br />
σ<br />
d<br />
dx FX(x) = 1<br />
√ e<br />
2π<br />
x−µ<br />
(<br />
− σ )2<br />
2 · 1<br />
σ =<br />
= 1 (x−µ)2<br />
−<br />
√ e 2σ<br />
2πσ 2 .<br />
• Má-li X rozdělení N(µ, σ), pak Y = X−µ<br />
σ má<br />
rozdělení N(0, 1).<br />
89
5.11. Příklad. S jakou pravěpodobností má veličina<br />
X s rozdělením N(1, 4) hodnotu v intervalu<br />
< 3, 5 > ?<br />
<br />
5 − 1 3 − 1<br />
P [3 ≤ X ≤ 5] = Φ − Φ =<br />
2<br />
2<br />
= Φ(2)−Φ(1) = 0, 97250−0, 841345 = 0, 131155.<br />
5.12. Tvrzení. Vzhledem k tomu, že hustota standardního<br />
normálního rozdělení je sudá funkce, platí<br />
Φ(x) = 1 − Φ(−x) x ∈ R .<br />
90
5.13. Příklad. Spočtěte pravděpodobnost, že veličina<br />
X s rozdělením N(0, σ 2 ) má hodnotu v intervalu<br />
< −a, a >, kde a > 0.<br />
Řešení:<br />
P [−a ≤ X ≤ a] = P [− a X a<br />
≤ ≤ ] =<br />
σ σ σ<br />
a<br />
= Φ −Φ −<br />
σ<br />
a<br />
<br />
a<br />
a<br />
= Φ − 1−Φ =<br />
σ σ<br />
σ<br />
<br />
a<br />
2Φ − 1 .<br />
σ<br />
Střední hodnota a rozptyl normálního rozdělení:<br />
Pro Y s rozdělením N(0, 1) platí<br />
EY = 1<br />
√ 2π<br />
∞<br />
−∞<br />
x2<br />
−<br />
xe 2 dx = 0 .<br />
91
1 = 1<br />
√ 2π<br />
∞<br />
−∞<br />
x2<br />
−<br />
e 2 dx .<br />
Použijeme metodu per partes pro<br />
u ′ x2<br />
− = 1 v = e 2<br />
a dostaneme<br />
u = x v ′ x2<br />
− = −xe 2<br />
1 = 1<br />
<br />
√ xe<br />
2π<br />
Odtud plyne, že<br />
x2<br />
− 2<br />
∞<br />
−∞<br />
<br />
=0<br />
var(Y ) = E(Y 2 ) = 1 .<br />
+ 1<br />
√ 2π<br />
Obecně: X má rozdělení N(µ, σ 2 )<br />
a proto<br />
X = σY + µ ,<br />
EX = σEY + µ = µ .<br />
92<br />
∞<br />
−∞<br />
x 2 x2<br />
−<br />
e 2 dx .
Závěr:<br />
X 2 = σ 2 Y 2 + 2µσY + µ 2<br />
EX 2 = σ 2 + 0 + µ 2 .<br />
varX = E(X 2 ) − (EX) 2 = σ 2 + µ 2 − µ 2 = σ 2 .<br />
EX = µ<br />
var(X) = σ 2 .<br />
93
kvantilová funkce a kvantily<br />
uα ... α-kvantil N(0, 1).<br />
kvantilová funke je inverzní funkce Φ −1 .<br />
Některé numerické hodnoty:<br />
u0,5 = 0,<br />
u0,95 = 1, 644,<br />
u0,975 = 1, 95996<br />
u0,999 = 3, 09023<br />
Pro α → 1 jde uα → ∞.<br />
5.14. Tvrzení.<br />
(i) u1−α = −uα pro všechna α ∈ (0, 1).<br />
(ii) Pro α-kvantil xα rozdělení N(µ, σ 2 ) platí<br />
xα = µ + σ uα .<br />
94
5.15. Příklad. Určete interval < −a, a > tak,<br />
aby náhodná veličina Y s rozdělením N(0, 1) měla<br />
v tomto intervalu hodnotu s pravděpodobností 0,95.<br />
a = u0,975<br />
.<br />
= 1, 96 .<br />
Pravidlo 3σ<br />
Máme rozdělení X typu N(µ, σ 2 ). Určeme<br />
Řešení:<br />
P [|X − µ| ≤ 3σ] .<br />
<br />
|X − µ|<br />
P<br />
σ<br />
<br />
≤ 3 = Φ(3) − Φ(−3) =<br />
= 2Φ(3)−1 = 2·0, 99865−1 = 0, 99730 .<br />
Po třech σ zbývají asi tři promile případů.<br />
95
5.16. Příklad. Pro oděvní továrnu je neziskové<br />
vyrábět šaty pro velmi malé a velmi velké muže.<br />
Záměr je nevyrábět pro 7,5% největších a 7,5%<br />
nejmenších mužů. Ví se, že výška mužů (v palcích)<br />
má rozdělení N(69, 2, 8 2 ). Nalezněte největší<br />
a nejmenší výšku pro kterou vyrábět.<br />
Řešení<br />
u0,925 = 1, 43953 .<br />
x0,925 = 69 + 2, 8 · 1, 43953 = 73, 03068<br />
x0,075 = 69 − 2, 8 · 1, 43953 = 64, 96932<br />
96
5.17. Příklad. Výsledky přijímacích zkoušek se<br />
řídí normálním rozdělením s rozptylem 100. Je přijato<br />
30% uchazečů. Hranice pro přijetí je 85 bodů.<br />
Jaký je průměrný výsledek u zkoušky?<br />
Řešení:<br />
N(µ, σ 2 )<br />
x0,7 = µ + 10 · u0.7<br />
µ = 85 − 10 · u0,7 = 85 − 10 · 0, 52440 . = 79, 8 .<br />
5.18. Příklad. Máme rozdělení N(µ, 0, 5). Jak<br />
zvolit střední hodnotu, aby<br />
Řešení:<br />
P [X ≥ 2] = 0, 01 .<br />
<br />
X − µ<br />
P √ ≥<br />
0, 5<br />
2 − µ<br />
√ 0, 5 = u0,99<br />
µ = 2 − 0, 5 · u0,99<br />
<br />
2 − µ<br />
√ = 0, 01<br />
0, 5<br />
97<br />
.<br />
= 0, 355023643
Exponenciální rozdělení<br />
hustota:<br />
Exp(λ) λ > 0<br />
f(x) =<br />
distribuční funkce:<br />
x ≥ 0<br />
F (x) =<br />
funkce přežití:<br />
<br />
λ e −λx x ≥ 0<br />
0 x < 0 .<br />
x<br />
0<br />
−λ x<br />
P [X ≥ x] = e<br />
λ e −λx dx = 1 − e −λ x .<br />
Exponenciální rozdělení popisuje čas do první ”poruchy”<br />
u systému ”bez paměti”<br />
98
Odvození:<br />
Hledáme funkci přežití<br />
R(t) = P [X ≥ t]<br />
tak, aby byly splněny následující předpoklady:<br />
(i) R(0) = 1<br />
(ii) P [X ≥ t + h|X ≥ t] = P [X ≥ h] pro<br />
všechna x, h ≥ 0.<br />
(iii) R je diferencovatelná klesající funkce<br />
Z toho plyne:<br />
P [X ≥ t + h] = P [X ≥ t] · P [X ≥ h] .<br />
R(t + h) = R(t)R(h)<br />
R(t + h) − R(t)<br />
h<br />
= R(t)R(h) − R(t)<br />
=<br />
h<br />
R(h) − 1<br />
= R(t)<br />
h<br />
99
Limitním přechodem h → 0+ dostaneme<br />
R ′ (t) = R(t) · R ′ (0)<br />
R(0) = 1<br />
Diferenciální rovnice s počáteční podmínkou.<br />
Označme<br />
R ′ (0) = −λ (λ > 0).<br />
Řešení (jediné):<br />
R(t) = e −λt .<br />
R(t) tedy vede na exponenciální rozdělení.<br />
100
Střední hodnotu a rozptyl získáme integrací (per<br />
partes)<br />
E(X) = 1<br />
λ<br />
var(X) = 1<br />
λ 2<br />
λ ... ”intenzita poruch”<br />
Příklady exponenciálního rozdělení:<br />
• doba rozpadu atomu<br />
• doba do registrace zákazníka<br />
• doba do příletu létavice v meteorickém roji<br />
101
5.19. Příklad. Na přílet meteoritu se průměrně<br />
čaká deset minut. Jaká je pravděpodobnost, že budeme<br />
na ”padající hvězdu” čekat dvě minuty?<br />
Řešení:<br />
1<br />
= 10 λ = 0, 1<br />
λ<br />
F (2) = 1 − e −2·0,1 = 1 − e −0,2 . = 0, 18127 .<br />
102
6 Transformace náhodných<br />
veličin<br />
Nutnost přepočítat distrubuční funkci. Například<br />
máme měření rychlosti a chceme ho přepočítat na<br />
energii.<br />
Obecná úloha: X je náhodná veličina, h : R ↦→ R<br />
Y = h(X)<br />
• Diskrétní náhodná veličina se vždy zobrazí na<br />
diskrétní<br />
6.1. Příklad. Diskrétní rozdělení X s pravděpo-<br />
dobnostní funkcí -1 0 1<br />
0,3 0,2 0,5<br />
Y = X 2 ... 1 0 1<br />
0,3 0,2 0,5<br />
Y ...<br />
0 1<br />
0,2 0,8<br />
103
Obecně stanovíme transformaci pomocí distribuční<br />
funkce:<br />
Y = h(X)<br />
FY (y) = P [h(X) ≤ y]<br />
6.2. Příklad. Rychlost molekul plynu má rozdělení<br />
N(0, 1). Molekula má hmotnost m. Nalezněte<br />
distribuční funkci a hustotu energie částice.<br />
X ∼ N(0, 1)<br />
Y = 1<br />
2 mX2<br />
Nerovnice 1<br />
2 mX2 ≤ y má řešení pouze pro y ≥ 0.<br />
y ≥ 0<br />
FY (y) = P [ 1<br />
2 mX2 <br />
2<br />
≤ y] = P [X ∈< −<br />
m y,<br />
<br />
2<br />
y >] =<br />
m<br />
<br />
2<br />
= Φ<br />
m y<br />
<br />
2<br />
−Φ −<br />
m y<br />
<br />
2<br />
= 2 Φ<br />
m y<br />
<br />
−1 .<br />
104
Hustota je pro y > 0 derivací distribuční funkce:<br />
g(y) = 2 1<br />
√ e<br />
2π − 2 m y<br />
<br />
2<br />
2 ·<br />
m ·<br />
Pro y ≤ 0 je g(y) = 0 .<br />
1<br />
2 √ y =<br />
Důležitý je případ lineární transformace.<br />
a > 0<br />
a < 0<br />
Y = aX + b, a = 0<br />
<br />
FY (y) = P [aX + b ≤ y] = P X ≤<br />
<br />
FY (y) = P [aX + b ≤ y] = P X ≥<br />
105<br />
1 y<br />
−<br />
√ e m<br />
mπy<br />
<br />
y − b<br />
= FX<br />
a<br />
y − b<br />
a<br />
<br />
.<br />
<br />
y − b<br />
y − b<br />
= 1 − FX<br />
a<br />
a −<br />
<br />
.
Užitečné je aplikovat toto pravidlo na spojité rozdělení<br />
6.3. Tvrzení. Je-li X spojitá náhodná veličina s<br />
hustotou f(x), pak náhodná veličina<br />
Y = aX + b , a = 0<br />
je spojitá a má hustotu<br />
g(y) = 1<br />
|a| f<br />
<br />
y − b<br />
.<br />
a<br />
Důkaz:<br />
a > 0<br />
<br />
y − b<br />
FY (y) = F<br />
a<br />
Derivací podle y:<br />
a < 0<br />
g(y) = 1<br />
a f<br />
y − b<br />
a<br />
<br />
.<br />
<br />
y − b<br />
FY (y) = 1 − F<br />
a<br />
106
Derivací podle y:<br />
g(y) = − 1<br />
a f<br />
y − b<br />
a<br />
<br />
.<br />
6.4. Příklad. X má rovnoměrné rozdělení na intervalu<br />
< 0, 3 >. Určete hustotu<br />
Y = 2X + 1<br />
g(y) = 1<br />
2 f<br />
<br />
y − 1<br />
.<br />
2<br />
y − 1<br />
2<br />
g(y) =<br />
∈< 0, 3 > ⇐⇒ y ∈< 1, 7 > .<br />
<br />
1/6 y ∈< 1, 7 ><br />
0 jinak<br />
Y má rovnoměrné rozdělení na intervalu < 1, 7 >.<br />
107
6.5. Příklad. Y = −X, kde X má rozdělení<br />
N(0, 1).<br />
g(y) = 1 (−y)2<br />
− √ e 2 =<br />
2π 1 y2<br />
− √ e 2<br />
2π<br />
Y má také rozdělení N(0, 1).<br />
6.6. Příklad. X má rozdělení Exp(1). Určete<br />
rozdělení −X.<br />
g(y) = f(−y)<br />
<br />
e<br />
g(y) =<br />
y y ≤ 0<br />
0 y > 0 .<br />
108
Nelineární transformace náhodné veličiny<br />
Předpoklady: X má hustotu f(x) soustředěnou na<br />
intervalu I a h je rostoucí diferencovatelná funkce<br />
definovaná na I, jejíž obor hodnot je interval J.<br />
Y = h(X)<br />
Pro y /∈ J bude hustota nulová.<br />
Pro y ∈ J<br />
FY (y) =<br />
<br />
h −1 (y)<br />
−∞<br />
f(x) dx<br />
Substituce: t = h(x), x = h −1 (t), dt = h ′ (x) dx.<br />
FY (y) =<br />
y<br />
−∞<br />
f(h −1 (t))<br />
dt<br />
h ′ (h −1 (t))<br />
Podobně lze postupovat v případě, kdy h je klesající,<br />
nebo je možno použít −(−h).<br />
109
Závěr:<br />
g(y) = f(h−1 (y))<br />
|h ′ (h −1 (y))| .<br />
pro y ∈ J a nula jinak.<br />
6.7. Příklad. Logaritmicko-normální rozdělení<br />
Y = e X ,<br />
kde X má rozdělení N(µ, σ 2 ).<br />
h(x) = e x , h −1 (x) = ln x , J = h(R) = (0, ∞) .<br />
g(y) =<br />
pro y > 0; a nula jinak.<br />
f(ln y) 1 (ln y−µ)2<br />
−<br />
= √ e 2σ<br />
eln y<br />
2πσ 2<br />
1<br />
y ,<br />
110
K výpočtu střední hodnoty transformované veličiny<br />
nepotřebujeme znát rozdělení transformace:<br />
6.8. Věta. Předpokládejme, že X je náhodná veličina<br />
a Y = h(X). Pak<br />
(i) E(Y ) = <br />
h(xi)pi ,<br />
i∈I<br />
je-li X diskrétní náhodná veličina s pravděpodobnostní<br />
funkcí (xi, pi)i∈I.<br />
(ii) E(Y ) =<br />
Důkaz:<br />
∞<br />
−∞<br />
f(x)h(x) dx<br />
je-li X spojitá náhodná veličina s hustotou<br />
f(x).<br />
(i) h(Y ) má (včetně násobnosti) pravděpodobnostní<br />
funkci (h(xi), pi)i∈I, a proto<br />
E(Y ) = <br />
h(xi)pi .<br />
i∈I<br />
(ii) je spojitou verzí.<br />
111
6.9. Příklad. Určete střední hodnotu třetí mocniny<br />
rozdělení Exp(1).<br />
E(Y ) =<br />
∞<br />
0<br />
x 3 e −x dx = 6 .<br />
112
7 Náhodné vektory<br />
Značení: x = (x1, x2, . . . xn) ∈ C n<br />
7.1. Definice. Nechť (Ω, A, P ) je pravděpodobnostní<br />
prostor. Zobrazení X : Ω → R n<br />
X(ω) = (X1(ω), X2(ω), . . . , Xn(ω)) ,<br />
kde X1, . . . , Xn jsou náhodné veličiny na Ω, se<br />
nazývá náhodný vektor. Veličiny X1, . . . , Xn se<br />
nazývají marginální rozdělení vektoru X.<br />
Nestačí znát marginální distribuční funkce, ale distribuční<br />
funkci sdruženou.<br />
Značení:<br />
[X ≤ x] = [X1 ≤ x1 ∧ X2 ≤ x2 ∧ · · · ∧ Xn ≤ xn].<br />
7.2. Definice. Je-li X : Ω → R n náhodný vektor,<br />
pak distribuční funkci FX : R n → R definujeme<br />
jako<br />
FX(x) = P [X ≤ x] .<br />
113
7.3. Příklad. X má distribuční funkci F . Určete<br />
distribuční funkci náhodného vektoru<br />
X = (X, X)<br />
FX(x, y) = P [X ≤ x ∧ X ≤ y] =<br />
= P [X ≤ min(x, y)] = F (min(x, y))<br />
Pomocí distribuční funkce spočítáme všechny relevantní<br />
pravděpodobnosti:<br />
např.<br />
X = (X, Y )<br />
P [(a < X ≤ b) ∧ (c < Y ≤ d)] =<br />
= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) .<br />
114
Základní vlastnosti vícerozměrné distribuční funkce:<br />
7.4. Věta. Je-li F (x1, . . . , xn) sdružená distribuční<br />
funkce náhodných veličin X1, . . . , Xn, pak<br />
(i) limx1→∞,x2→∞,... ,xn→∞ F (x1, . . . , xn) = 1<br />
(ii) lim<br />
x1→−∞,x2→−∞,... ,xn→−∞ F (x1, . . . , xn) = 0<br />
(iii) F je zprava spojitá a neklesající v každé proměnné.<br />
Tyto vlastnosti nestačí k tomu, aby F byla distribuční<br />
funkcí. Musí splňovat složitejší podmínku<br />
pro hodnoty ve vrcholech vícerozměrných intervalů.<br />
Jak spočítat marginální rozdělení vektoru<br />
X = (X1, . . . , Xn)?<br />
FX1(x) = lim<br />
x2→∞,x3→∞,... ,xn→∞ FX(x, x2, x3, . . . , xn) .<br />
115
7.5. Příklad. X má rovnoměrné rozdělení na jednotkovém<br />
kruhu se středem v počátku. Nalezněte<br />
marginální rozdělení.<br />
X = (X, Y )<br />
Pro −1 < x < 1.<br />
FX(x) = 2<br />
x<br />
π<br />
−1<br />
<br />
√ 2 1<br />
1 − t2 dt =<br />
π<br />
= x√ 1 − x 2<br />
π<br />
+ arcsin x<br />
2 t√1 − t2 + 1<br />
arcsin t<br />
2<br />
π<br />
+ 1<br />
2 .<br />
7.6. Definice. Náhodný vektor se nazývá diskrétní,<br />
jestliže všechny jeho složky mají diskrétní rozdělení.<br />
Diskrétní vektor je dán pravděpodobnostní funkcí:<br />
(x1, p1); (x2, p2); (x3, p3), . . .<br />
n<br />
pi > 0 , pi = 1 .<br />
i=1<br />
116<br />
x<br />
−1<br />
=
7.7. Příklad. Pravděpodobnost soustředěná ve<br />
vrcholech čtverce:<br />
P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,<br />
P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2<br />
tabulka:<br />
Y/X 0 1<br />
0 1/8 1/4<br />
1 1/8 1/2<br />
Diskrétní rozdělení pro X<br />
P [X = 0] = 1/8 + 1/4 = 3/8<br />
P [X = 1] = 1/8 + 1/2 = 5/8<br />
X ∼ A(5/8).<br />
Podobně Y ∼ A(3/4).<br />
117
• Distribuční funkce diskrétního vektoru je po částech<br />
konstantní.<br />
• Má-li X diskrétní rozdělení je<br />
P [X ∈ A] = <br />
{i | xi∈A}<br />
pi .<br />
• Marginální rozdělení diskrétního rozdělení má<br />
pravděpodobnostní funkci<br />
P [X1 = a] = <br />
{i | xi∈A}<br />
kde A = {xi | (xi)1 = a}.<br />
118<br />
pi ,
7.8. Definice. Nechť f(x1, . . . , xn) ≥ 0 je funkce<br />
definovaná na Rn s<br />
<br />
f(x) dx = 1 .<br />
R n<br />
Náhodný vektor X = (X1, . . . , Xn) má spojité<br />
rozdělení s hustotou f, jestliže<br />
x1<br />
x2<br />
xn<br />
FX(x1, . . . , xn) = · · · f(t1, . . . , tn)dt1 · · · dtn .<br />
•<br />
−∞ −∞<br />
−∞<br />
f(x1, . . . , xn) = ∂n FX(x1, . . . , xn)<br />
∂x1∂x2 · · · ∂xn<br />
v bodech spojitosti funkce f<br />
•<br />
<br />
P [X ∈ A] =<br />
A<br />
Například: X = (X, Y )<br />
f(x) dx .<br />
P [X ∈ (a, b > ∧Y ∈ (c, d >] =<br />
119<br />
b<br />
a<br />
d<br />
c<br />
f(x, y) dxdy .
7.9. Příklad. Rovnoměrné rozdělení na jednotkové<br />
kouli se středem v počátku má hustotu<br />
f(x, y, z) =<br />
1<br />
4/3π<br />
0 jinak<br />
pro x 2 + y 2 + z 2 ≤ 1<br />
7.10. Příklad. Dvourozměrná distribuční funkce<br />
F (x, y) =<br />
Pro x, y > 0<br />
<br />
(1 − e −x )(1 − e −y ) je-li x, y > 0<br />
0 jinak<br />
f(x, y) = ∂2<br />
∂x∂y (1 − e−x )(1 − e −y ) =<br />
= e −x e −y .<br />
(Jinak je f(x, y) nulová.) Je správně neboť<br />
f(x, y) =<br />
∞<br />
0<br />
∞<br />
0<br />
e −x e −y = 1 .<br />
120
Marginální rozdělení:<br />
X = (X1, . . . , Xn) má hustotu f(x1, . . . , xn).<br />
Pak X1 má distribuční funkci:<br />
FX1(x) =<br />
=<br />
x<br />
−∞<br />
x<br />
∞<br />
−∞ −∞<br />
∞<br />
−∞<br />
· · ·<br />
∞<br />
−∞<br />
<br />
(n−1)×<br />
<br />
· · ·<br />
∞<br />
−∞<br />
<br />
(n−1)×<br />
Hustota tedy bude<br />
fX1(x) =<br />
∞<br />
−∞<br />
· · ·<br />
∞<br />
−∞<br />
<br />
(n−1)×<br />
f(t1, . . . , tn) dt1 · · · dtn =<br />
f(t1, . . . , tn) dt2 · · · dtn<br />
121<br />
<br />
dt1<br />
f(x, t2, · · · tn) dt2 · · · dtn .
7.11. Příklad. Dvourozměrné Gaussovo rozdělení<br />
hustota:<br />
f(x, y) = 1<br />
2π e− x2 +y 2<br />
2 .<br />
X, Y ∼ N(0, 1)<br />
FX(x, y) = Φ(x)Φ(y) .<br />
Např.<br />
P [X ≤ 3∧Y ≤ 5] = Φ(3)Φ(5) = 0, 9986498158.<br />
Jaká je pravděpodobnost, že (X, Y ) ∈ A, kde A<br />
je mezikruží<br />
A = {(x, y) | 4 ≤ x 2 + y 2 ≤ 9}?<br />
P = 1<br />
<br />
2π<br />
A<br />
Substituce:<br />
x = ϱ sin ϕ, y = ϱ cos ϕ,<br />
Jakobián: dxdy = ϱ dϱ dϕ.<br />
122<br />
e − x2 +y 2<br />
2 dxdy
P = 1<br />
2π<br />
<br />
2π<br />
0<br />
2<br />
3<br />
e −ϱ2 /2 ϱ dϱ dϕ =<br />
= 1<br />
2π 2π[−e−ϱ2 /2 ] 3 2 = e −2 −e −9/2 = 0, 12422 .<br />
Nezávislost náhodných veličin<br />
7.12. Definice. Náhodné veličiny X1, . . . , Xn na<br />
pravděpodobnostním prostoru (Ω, A, P ) jsou nezávislé,<br />
jestliže sdružená distribuční funkce vektoru<br />
X = (X1, . . . , Xn)<br />
je součinem marginálních distribučních funkcí.<br />
123
7.13. Tvrzení. Náhodné veličiny X1, . . . , Xn jsou<br />
nezávislé právě tehdy když<br />
P [(X1 ∈ I1) ∧ (X2 ∈ I2) ∧ · · · ∧ (Xn ∈ In)] =<br />
= P [X1 ∈ I1] · P [X2 ∈ I2] · · · P [Xn ∈ In]<br />
pro všechny možné výběry intervalů I1, . . . , In ⊂<br />
R.<br />
Zdůvodnění pro X = (X, Y ), kde X, Y jsou nezávislé<br />
:<br />
P [X ∈ (a, b > ∧Y ∈ (c, d >] =<br />
= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) =<br />
= FX(b)Fy(d)−FX(a)FY (d)−FX(b)FY (c)+FX(a)FY (c) =<br />
= (FX(b) − FX(a))(FY (d) − FY (c)) .<br />
7.14. Příklad. X = (X, Y ) je rovnoměrné rozdělení<br />
na čtverci < 0, 1 > × < 0, 1 >. Pak X a<br />
Y jsou nezávislé:<br />
0 ≤ x, y ≤ 1<br />
FX(x, y) = xy = FX(x) · FY (y)<br />
124
7.15. Tvrzení. Diskrétní náhodné veličiny<br />
X1, . . . , Xn jsou nezávislé právě tehdy když všechny<br />
jevy<br />
[X1 = x1], [X2 = x2], . . . , [Xn = xn] ,<br />
kde x1, . . . , xn ∈ R, jsou nezávislé.<br />
7.16. Příklad. Pravděpodobnost soustředěná ve<br />
vrcholech čtverce:<br />
P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,<br />
P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2<br />
tabulka:<br />
Y/X 0 1<br />
0 1/8 1/4<br />
1 1/8 1/2<br />
X a Y nejsou nezávislé, protože<br />
P [X = 0 ∧ Y = 0] = 1/8 = P [X = 0]P [Y = 0] = 3/8 · 1/4 .<br />
125
X = (X1, . . . , Xn)<br />
náhodné veličiny v Bernoulliově schématu. Tyto<br />
veličiny jsou nezávislé.<br />
Binomické rozdělení Bi(n, p) je součtem n nezávislých<br />
alternativních rozdělení A(p).<br />
126
7.17. Tvrzení. Spojité vícerozměrné rozdělení je<br />
rozdělení nezávislých veličin právě tehdy když sdružená<br />
hustota je součinem hustot marginálních.<br />
Důvod: hustota je derivací distribuční funkce.<br />
7.18. Příklad. Je-li (X, Y ) rovnoměrné rozdělení<br />
na jednotkovém kruhu, pak X a Y nejsou<br />
nezávislé, protože součin marginálních hustot je<br />
nenulový v každém bodě čtverce<br />
< 0, 1 > × < 0, 1 >.<br />
7.19. Příklad. X a Y jsou nezávislé náhodné<br />
veličiny s rozděleními N(0, σ 2 1), N(0, σ 2 2). Jaká je<br />
hustota součinu?<br />
f(x, y) =<br />
1<br />
2πσ1σ2<br />
Gaussovská plocha.<br />
x2<br />
−<br />
2σ e 2 −<br />
1<br />
y2<br />
2σ2 2<br />
127
charakteristiky nezávislých veličin:<br />
7.20. Věta. Jsou-li X1, . . . , Xn nezávislé náhodné<br />
veličiny na pravděpodobnostním prostoru (Ω, A, P ),<br />
pak<br />
E(X1X2 · · · Xn) = E(X1)E(X2) · · · E(Xn) .<br />
Důkaz: pro diskrétní rozdělení<br />
X má pravděpodobnostní funkci (xi, pi)i∈I<br />
Y má pravděpodobnostní funkci (yj, pj)j∈J<br />
E(XY ) = <br />
= <br />
i∈I,j∈J<br />
i∈I<br />
i∈I,j∈J<br />
xi yjP [X = xi ∧ Y = yj] =<br />
xi yjP [X = xi]P [Y = yj] =<br />
<br />
<br />
<br />
<br />
<br />
= xiP [Y = xi] · yjP [Y = yj] =<br />
128<br />
j∈J<br />
= E(X)E(Y )
7.21. Věta. Jsou-li X1, . . . , Xn nezávislé náhodné<br />
veličiny na pravděpodobnostním prostoru (Ω, A, P ),<br />
pak<br />
var(X1 + X2 + · · · + Xn) = var(X1) + var(X2) + · · · + var(Xn) .<br />
Důkaz pro n = 2<br />
Víme, že E(X1X2) = E(X1)E(X2).<br />
var(X1+X2) = E[(X1+X2) 2 ]−(E(X1)+E(X2)) 2 =<br />
= E(X 2 1) + E(X 2 2) + 2E(X1X2) −<br />
−(E(X1)) 2 −(E(X2)) 2 −2E(X1)E(X2) =<br />
E(X1) 2 −(E(X1)) 2 +E(X2) 2 −(E(X2)) 2 =<br />
= var(X1) + var(X2) .<br />
129
7.22. Příklad. Pro X s rozdělením Bi(n, p) a<br />
Y s rozdělením A(p) platí<br />
var(X) = n var(Y ) = np(1 − p) .<br />
Funkce nezávislých náhodných veličin<br />
7.23. Příklad. Doba kdy lano vydrží zátěž se<br />
řídí exponeniálním rozdělením Exp(1). Dvě lana<br />
zapojíme a) paralelně b) sériově. Určete rozdělení<br />
doby po kterou systém lan vydrží v obou případech<br />
a stanovte střední hodnotu těchto náhodných veličin.<br />
X a Y jsou nezávislé náhodné veličiny s rozdělením<br />
Exp(1).<br />
a) Zpar = max(X, Y )<br />
b) Zserie = min(X, Y ) .<br />
130
a) paralelně<br />
Distribuční funkce je nulová pro t < 0. Pro t > 0 je<br />
FZpar = (1 − e −t )(1 − e −t ) = (1 − e −t ) 2<br />
Hustota pro t > 0:<br />
f(t) = 2(1 − e −t )e −t<br />
Střední hodnota<br />
<br />
EZpar = 2<br />
0<br />
∞<br />
te −t <br />
dt − 2<br />
131<br />
0<br />
∞<br />
te −2t dt = 1, 5 .
a) sériově<br />
Distribuční funkce je nulová pro t < 0. Pro t > 0 je<br />
FZpar = 1 − e −t e −t = 1 − e −2t<br />
Hustota pro t < 0:<br />
g(t) = 2e −2t<br />
Střední hodnota<br />
<br />
EZserie = 2<br />
0<br />
∞<br />
e −2t dt = 0, 5 .<br />
132
Rozdělení součtu spojitých nezávislých<br />
náhodných veličin<br />
Z = X + Y ,<br />
kde X a Y jsou nezávislé, X má hustotu f(x) a<br />
Y má hustotu g(x).<br />
Úlohou je stanovit hustotu náhodné veličiny Z.<br />
Sdružená hustota vektoru (X, Y ) je funkce<br />
h(x, y) = f(x)g(y).<br />
P [Z ≤ z] = P [X+Y ≤ z] =<br />
∞<br />
−∞<br />
<br />
{(x,y) | x+y≤z}<br />
z−x<br />
<br />
f(x)g(y) dy dx .<br />
−∞<br />
Substituce ve vnitřním integrálu<br />
y = v − x, dv = dy<br />
133<br />
f(x)g(y) dxdy =
=<br />
∞<br />
−∞<br />
z<br />
−∞<br />
<br />
f(x) g(v − x) dv dx =<br />
=<br />
z<br />
−∞<br />
∞<br />
<br />
f(x)g(v − x) dx<br />
−∞<br />
<br />
hustota h(v)<br />
<br />
Závěr: Hustota součtu X + Y je funkce<br />
h(y) =<br />
∞<br />
−∞<br />
f(x)g(y − x) dx .<br />
Terminologie : funkce h je konvolutivní součin funkcí<br />
f a g.<br />
134<br />
dv
7.24. Příklad. Čas do první poruchy daného zařízení<br />
se řídí exponenciálním zákonem Exp(λ). Náhodná<br />
veličina Z je čas do druhé poruchy. Určete<br />
její hustotu.<br />
Z = X + Y ,<br />
kde X a Y jsou nezávislé s rozdělením Exp(λ).<br />
Hustota h(y) je<br />
h(y) =<br />
∞<br />
−∞<br />
f(x)g(y−x) dx =<br />
pro y ≥ 0 a nula jinak.<br />
= λ 2 e −λy<br />
135<br />
<br />
0<br />
y<br />
0<br />
y<br />
λe −λx λe −λ(y−x) dx =<br />
dx = λ 2 ye −λy
7.25. Příklad. Souprava metra přijíždí kdykoliv<br />
během jedné minuty. Dvakrát přestupujeme. Jaká<br />
je hustota čekací doby? Která hodnota je nejvíc<br />
preferována?<br />
Z = X + Y ,<br />
kde X a Y jsou nezávislé náhodné veličiny s rozdělením<br />
R < 0, 1 >.<br />
h(y) =<br />
∞<br />
−∞<br />
f(x)g(y − x) dx ,<br />
kde f a g jsou chrakteristické funkce intervalu<br />
< 0, 1 >.<br />
Tento integrál je délkou průniku intervalu < 0, 1 ><br />
s intervalem < y − 1, y >. Tedy<br />
⎧<br />
0 y ≤ 0<br />
⎪⎨<br />
y 0 ≤ y ≤ 1<br />
h(y) =<br />
2 − y 1 ≤ y ≤ 2<br />
⎪⎩<br />
0 y ≥ 2<br />
Trojúhelníkové rozdělení, preferována je čekací doba<br />
1.<br />
136
8 Kovariance a korelace náhodných<br />
vektorů<br />
Je-li X náhodný vektor, je vektor středních hodnot<br />
vektor<br />
EX = (EX1, EX2, . . . EXn) .<br />
Nepopisuje interakci mezi náhodnými veličinami.<br />
8.1. Definice. Nechť X a Y jsou náhodné veličiny<br />
na pravděpodobnostním prostoru (Ω, A, P ),<br />
které mají rozptyl. Kovariance náhodných veličin<br />
X a Y je definována<br />
cov(X, Y ) = E[(X − EX)(Y − EY )] .<br />
137
• cov(X, X) = var(X)<br />
• cov(X, Y ) = cov(Y, X)<br />
• cov(X, Y ) = E(XY ) − E(X)E(Y ) :<br />
E[(X−EX)(Y −EY )] = E(XY )−2EX·EY +EX·EY =<br />
= E(XY ) − E(X)E(Y )<br />
Pro výpočet potřebujeme:<br />
1. Diskrétní vektor (X, Y ) s pravděpodobnostní<br />
funkcí ((xi, yi); pi)i∈I.<br />
EX = <br />
i∈I<br />
EY = <br />
i∈I<br />
xi pi<br />
yi pi<br />
E(XY ) = <br />
i∈I<br />
xiyi pi<br />
138
1. Spojitý vektor (X, Y ) se sdruženou hustotou<br />
f(x, y).<br />
<br />
EX =<br />
R 2<br />
<br />
EY =<br />
R 2<br />
<br />
E(XY ) =<br />
xf(x, y) dxdy<br />
yf(x, y) dxdy<br />
R 2<br />
xyf(x, y) dxdy<br />
8.2. Příklad. X má rovnoměrné rozdělení na intervalu<br />
< 0, 1 >. Určete cov(X, X 2 ) .<br />
cov(X, X 2 ) = EX 3 − EX · EX 2<br />
EX 3 =<br />
EX 2 =<br />
1<br />
0<br />
1<br />
<br />
0<br />
x 3 dx = 1<br />
4<br />
x 2 dx = 1<br />
3<br />
cov(X, X 2 ) = 1 1 1<br />
− ·<br />
4 2 3<br />
139<br />
= 1<br />
12 .<br />
EX = 1<br />
2 .
8.3. Příklad. X = (X, Y ) má rovnoměrné rozdělení<br />
na jednotkovém kruhu. Stanovte cov(X, Y ).<br />
EX =<br />
E(XY ) =<br />
<br />
K<br />
<br />
K<br />
cov(X, Y ) = 0 .<br />
x dxdy = 0<br />
xy dxdy = 0 .<br />
140
8.4. Věta. Jsou-li X a Y nezávislé náhodné veličiny<br />
je cov(X, Y ) = 0.<br />
Důkaz:<br />
Jsou-li X a Y nezávislé, pak E(XY ) = EX ·EY .<br />
Veličiny X, Y souřadnice rovnoměrného rozdělení<br />
na jednotkovém kruhu mají nulovou kovarianci, a<br />
přesto nejsou nezávislé.<br />
Normování náhodné veličiny X : X−EX<br />
√ varX má nulovou<br />
střední hodnotu a jednotkový rozptyl.<br />
<br />
X − EX Y − EY<br />
cov √ , √ =<br />
varX varY<br />
cov(X, Y )<br />
√ varX √ varY .<br />
8.5. Definice. Předpokládejme, že X a Y jsou<br />
náhodné veličiny s nenulovým rozptylem. Korelace<br />
ϱ(X, Y ) je definována vztahem<br />
ϱ(X, Y ) =<br />
cov(X, Y )<br />
√ varX √ varY .<br />
141
8.6. Příklad. (X, Y ) má diskrétní rozdělení s pravděpodobnostní<br />
funkcí<br />
((x1, y1), 1/3); ((x2, y2), 1/3); ((x3, y3), 1/3);<br />
Předpokládejme dále, že<br />
x1 + x2 + x3 = 0 y1 + y2 + y3 = 0 .<br />
cov(X, Y ) =<br />
=<br />
1<br />
3 x1y1 + 1<br />
1<br />
3 (x2 1 + x 2 2 + x 2 3)<br />
<br />
1<br />
3 (y2 1 + y2 2 + y2 =<br />
3)<br />
3x2y2 + 1<br />
3x3y3 x1y1 + x2y2 + x3y3<br />
<br />
2 x1 + x2 2 + x2 <br />
2<br />
3 y1 + y2 2 + y2 3<br />
= cos ϕ ,<br />
kde ϕ je úhel mezi vektory<br />
x = (x1, x2, x3) a y = (y1, y2, y3).<br />
Pokud je tedy cov(X, Y ) = 1 je y kladným násobkem<br />
x, pokud je cov(X, Y ) = −1 je y záporným<br />
násobkem x<br />
142
8.7. Věta. Pro korelaci ϱ(X, Y ) náhodných veličin<br />
X a Y platí<br />
|ϱ(X, Y )| ≤ 1 .<br />
Přitom ϱ(X, Y ) = 1 právě tehdy když hodnoty X<br />
a Y leží s pravděpodobností 1 na jedné přímce s<br />
kladnou směrnicí.<br />
ϱ(X, Y ) = −1 právě tehdy když hodnoty X a Y<br />
leží s pravděpodobností 1 na jedné přímce se zápornou<br />
směrnicí.<br />
Důkaz:<br />
Pro všechna t ∈ R máme<br />
<br />
X − EX Y − EY<br />
0 ≤ var √ + t √ =<br />
varX varY<br />
= 1 + 2tϱ(X, Y ) + t 2 . (2)<br />
Diskuse kvadratického výrazu:<br />
a tedy<br />
4ϱ 2 (X, Y ) − 4 ≤ 0<br />
|ϱ(X, Y )| ≤ 1 .<br />
143
Předpokládejme, že cov(X, Y ) = 1. Pak v nerovnosti<br />
(2) nastane rovnost a to může nastat právě<br />
když t = −1. Dosazením t = −1 pak vede k<br />
Tedy<br />
X − EX Y − EY<br />
√ − √ = konst .<br />
varX varY<br />
Y =<br />
√ varY<br />
√ varX · X + konstanta .<br />
ϱ(X, Y ) je míra lineární závislosti X a Y .<br />
144
9 Asymptotické vlastnosti<br />
náhodných veličin<br />
Větou asymptotického typu byla již věta Poissonova:<br />
binomické rozdělení s počtem pokusů jdoucím<br />
k nekonečnu a střední hodnotou jdoucí k λ se<br />
blíží Poissonově rozdělení P o(λ).<br />
Základní otázka: Co se děje s Bi(n, p), jestliže<br />
n → ∞ a p se nemění?<br />
Orientační odhady poskytuje Čebyševova nerovnost.<br />
9.1. Věta. Čebyševova nerovnost<br />
Nehť X je náhodná veličina s E(X 2 ) < ∞. Potom<br />
platí<br />
P [|X| ≥ ε] ≤ E(X2 )<br />
ε 2<br />
Speciálně, má-li X rozptyl, pak<br />
P [ |X − EX| ≥ ε] ≤ var(X)<br />
ε 2<br />
145<br />
.<br />
.
Důkaz pro spojité rozdělení s hustotou f(x).<br />
E(X 2 ) =<br />
≥<br />
∞<br />
−∞<br />
<br />
{x | |x|≥ε}<br />
P [ |X| ≥ ε] =<br />
x 2 f(x) dx =<br />
<br />
{x | |x|≥ε}<br />
<br />
{x | |x|≥ε}<br />
f(x) dx<br />
x 2 <br />
f(x) dx+<br />
ε 2 f(x) dx = ε 2 P [ |X| ≥ ε] .<br />
9.2. Důsledek. Je-li Xn náhodná veličina s rozdělením<br />
Bi(n, p), pak pro každé ε > 0 platí<br />
<br />
Xn <br />
P − p<br />
n ≥ ε → 0 pro n → ∞ .<br />
Důkaz:<br />
E<br />
<br />
Xn<br />
=<br />
n<br />
np<br />
n<br />
= p<br />
146<br />
−ε<br />
ε<br />
x 2 f(x) dx ≥
Xn<br />
var<br />
n<br />
Dle Čebyševovy nerovnosti<br />
<br />
Xn <br />
P − p<br />
n ≥ ε ≤<br />
= 1<br />
1<br />
np(1 − p) ≤<br />
n2 4n<br />
Xn var( n )<br />
ε2 ≤ 1<br />
.<br />
4nε2 9.3. Příklad. Kolika respondentů je třeba se zeptat,<br />
abychom odhadli volební preference p s tolerancí<br />
1% s pravděpodobností alespoň 90% ?<br />
n ... počet osob<br />
Xn ... Bi(n, p) (počet osob volících danou stranu)<br />
p ≈ Xn<br />
n (aproximace)<br />
Chceme:<br />
<br />
Xn<br />
P<br />
n<br />
<br />
<br />
− p<br />
<br />
<br />
< 0, 01 ≥ 0, 9 .<br />
Nebo-li<br />
<br />
Xn <br />
P − p<br />
n ≥ 0, 01 ≤ 0, 1<br />
<br />
1<br />
≤<br />
4n(0,01) 2<br />
147
1<br />
≤ 0, 1<br />
4n(0, 01) 2<br />
n ≥ 105<br />
4<br />
= 25000.<br />
Je pesimistický, nicméně jistý horní odhad.<br />
9.4. Věta. Centrální limitní věta<br />
Nehť X1, X2, X3, . . . je posloupnost nezávislých<br />
náhodných veličin, pro které platí<br />
EXi = µ , varXi = σ 2 , E|Xi| 3 < ∞ .<br />
pro všechna i ∈ N. Pro veličinu Sn (normovaný<br />
součet),<br />
platí<br />
Sn = X1 + X2 + · · · + Xn − nµ<br />
√ nσ<br />
lim<br />
n→∞ P [ Sn ≤ x] = Φ(x) ,<br />
pro všechna x ∈ R.<br />
148<br />
,
Tedy X1 + X2 + · · · + Xn má přibližně rozdělení<br />
N(nµ, nσ 2 ).<br />
9.5. Věta. Moaivrova-Laplaceova věta<br />
Pro náhodnou veličinu Xn s rozdělením Bi(n, p)<br />
platí<br />
lim<br />
n→∞ P<br />
<br />
Xn − np<br />
≤ x = Φ(x)<br />
np(1 − p)<br />
pro každé x ∈ R.<br />
Důkaz:<br />
Binomické rozdělení je součtem nezávislých alternativních<br />
rozdělení.<br />
Bi(n, p) ≈ N(np, np(1 − p))<br />
Empiriké pravidlo pro velikost n :<br />
np ≥ 5, n(1 − p) ≥ 5.<br />
149
9.6. Příklad. 250 krát hodíme symetrickou mincí.<br />
Určete pravděpodobnost, že rub padne 100 až 150<br />
krát.<br />
X250 − 125<br />
√ 250 · 0, 25 ≈ N(0, 1)<br />
P [100 ≤ X250 ≤ 150] =<br />
<br />
−25<br />
= P √ ≤<br />
250 · 0, 25 X250<br />
<br />
− 125 25<br />
√ ≤ √ =<br />
250 · 0, 25 250 · 0, 25<br />
<br />
25 · 2<br />
= 2Φ √ −1 = 2Φ(<br />
250<br />
√ 10)−1 . = 2Φ(3, 16)−1 . =<br />
= 0, 99842 .<br />
250 1<br />
k 2250 Přesně: 150<br />
k=125<br />
9.7. Příklad. Kolika respondentů je třeba se zeptat,<br />
abychom odhadli volební preference p s tolerancí<br />
1% a to s pravděpodobností alespoň 90%.<br />
<br />
Xn<br />
P<br />
n<br />
<br />
<br />
− p<br />
<br />
<br />
≤ 0, 01 ≥ 0, 9<br />
150
|Xn − np|<br />
P [ |Xn−np| ≤ 0, 01n] = P ≤<br />
np(1 − p)<br />
√ <br />
. 0, 01 · n<br />
= 2Φ −1 ≥ 2Φ<br />
p(1 − p)<br />
Volíme n tak aby<br />
2Φ(0, 02 √ n) − 1 ≥ 0, 9<br />
Φ(0, 02 √ n) ≥ 0, 95<br />
0, 02 √ n ≥ u0,95<br />
0, 01 · √ n<br />
1/2<br />
= 2Φ(0, 02 √ n) − 1 .<br />
√ u0,95<br />
n ≥<br />
0, 02<br />
2 2 u0,95 1, 644 .=<br />
n ≥ =<br />
6763, 8586<br />
0, 02 0, 02<br />
Pro srovnání při 5% toleranci potřebujeme 270 respondentů.<br />
151<br />
<br />
0, 01n .=<br />
<br />
np(1 − p)<br />
<br />
−1 =
10 Statistika<br />
Základní výběrové statistiky<br />
10.1. Definice. Náhodný výběr z rozdělení s distribuční<br />
funkcí F (x) je vektor<br />
X = (X1, . . . , Xn) ,<br />
kde X1, . . . , Xn jsou nezávislé náhodné veličiny<br />
mající stejnou distribuční funkci F (x).<br />
Základní výběrové statistiky:<br />
Výběrový průměr<br />
Xn = 1<br />
n (X1 + X2 + · · · Xn)<br />
Výběrový rozptyl<br />
S 2 n = 1<br />
n − 1<br />
n<br />
(Xi − Xn) 2<br />
i=1<br />
Výběrová směrodatná odchylka<br />
Sn<br />
152
Výběrové maximum<br />
max(X1, . . . , Xn)<br />
Výběrové minimum<br />
min(X1, . . . , Xn)<br />
Výběrové rozpětí<br />
max(X1, . . . , Xn) − min(X1, . . . , Xn)<br />
Výběrový průměr<br />
EX = µ, var(X) = σ 2<br />
E = E( 1<br />
n (X1 + · · · + Xn)) = nµ<br />
= µ .<br />
n<br />
<br />
X1 + · · · + Xn<br />
var(Xn) = var<br />
n<br />
E(Xn) = µ<br />
var(Xn) = σ2<br />
n<br />
153<br />
= 1<br />
n 2 nσ2 = σ2<br />
n .
Důležité je, že var(Xn) → 0 pro n → ∞.<br />
Čebyševova nerovnost:<br />
P [ |Xn − µ| ≥ ε] ≤ σ2<br />
.<br />
nε2 Výběrový rozptyl<br />
S 2 n = 1<br />
n − 1<br />
pomocný výpočet:<br />
n<br />
(Xi − Xn) 2 .<br />
i=1<br />
n<br />
(Xi − Xn) 2 =<br />
i=1<br />
=<br />
=<br />
n<br />
n<br />
i=1<br />
(X 2 i − 2XiXn + Xn<br />
n<br />
n<br />
X<br />
i=1<br />
2 i − 2Xn Xi +<br />
i=1 i=1<br />
n<br />
i=1<br />
X 2 2 2<br />
i −2nXn +nXn =<br />
154<br />
2<br />
Xn =<br />
n<br />
i=1<br />
2 ) =<br />
X 2 2<br />
i −nXn .
Výpočet střední hodnoty:<br />
(n−1)E(S 2 <br />
n<br />
n) = E<br />
=<br />
n<br />
i=1<br />
i=1<br />
X 2 <br />
2<br />
i −nXn =<br />
n<br />
i=1<br />
E(X 2 2<br />
i )−nE(Xn ) =<br />
(var(Xi)+E 2 (Xi))−n(var(Xn)+E 2 (Xn)) =<br />
= nσ 2 + nµ 2 − n σ2<br />
n − nµ2 = (n − 1)σ 2<br />
E(S 2 n) = σ 2 .<br />
Výběrové statistiky odvozené od normálního<br />
rozdělení.<br />
10.2. Tvrzení. Výběrový průměr z rozdělení N(µ, σ 2 )<br />
má rozdělení N(µ, σ2<br />
n ).<br />
Důkaz je založen na tom, že součet nezávislých<br />
normálních rozdělení je normální rozdělení, což se<br />
dá dokázt pomocí konvoluce gaussovských funkcí.<br />
Pro popis S 2 n potřebujeme zavést nové rozdělení<br />
155
10.3. Definice. Nechť X1, . . . , Xn jsou nezávislé<br />
veličiny s normovaným normálním rozdělením. Rozdělení<br />
χ 2 o n stupních volnosti je rozdělení náhodné<br />
veličiny<br />
Y = X 2 1 + X 2 2 + · · · + X 2 n<br />
Značení : χ 2 n<br />
kvantily: χ 2 n,α χ 2 n(α)<br />
Má-li X rozdělení χ 2 n, pak<br />
EX = n var(X) = 2n .<br />
10.4. Příklad. X, Y, Z jsou nezávislé náhodné<br />
veličiny s rozdělením N(0, 1). Stanovte r tak, aby<br />
P [ √ X 2 + Y 2 + Z 2 ≤ r] = 0, 995<br />
(Legenda: složky rychlosti molekul plynu)<br />
r =<br />
<br />
χ 2 3(0, 995) = 12, 838 = 3, 58<br />
156
Základní věta klasické statistiky<br />
10.5. Věta. Nechť X = (X1, . . . , Xn) je náhodný<br />
výběr z rozdělení N(µ, σ 2 ). Pak<br />
(i) Xn a S 2 n jsou nezávislé náhodné veličiny<br />
(ii) (n−1)S2 n<br />
σ 2<br />
má rozdělení χ 2 n−1.<br />
Statistická varianta normování veličiny:<br />
Xn − µ<br />
Sn/ √ n<br />
10.6. Definice. Nechť X = (X1, . . . , Xn) je náhodný<br />
výběr z rozdělení N(µ, σ 2 ). Studentovo rozděleni<br />
s n − 1 stupni volnosti je rozdělení náhodné<br />
veličiny<br />
Xn − µ<br />
Sn/ √ n<br />
Značení: tn−1, kvantily tn−1, α; tn−1(α).<br />
157
W. Gosset – pseudonym Student, Studentovo rozdělení<br />
tn má sudou hustotu, fn(x), která pro n →<br />
∞ konverguje bodově k Φ(x). (Aproximuje se obvykle<br />
pro n ≥ 31)<br />
158
Intervalové odhady<br />
Lokalizace neznámého parametru pomocí dat<br />
10.7. Definice. Nechť X = (X1, . . . , Xn) je náhodný<br />
výběr z rozdělení s neznámým parametrem<br />
θ a α ∈ (0, 1).<br />
(i) Interval < TD(X), TH(X) > se nazývá<br />
100(1 − α)% oboustranným intervalem spolehlivosti<br />
parametru θ jestliže<br />
P [ TD(X) ≤ θ ≤ TH(X) ] = 1 − α<br />
(ii) Interval < TD(X), ∞) se nazývá<br />
dolním 100(1 − α)% intervalem spolehlivosti<br />
parametru θ, jestliže<br />
P [θ ≥ TD(X)] = 1 − α<br />
(iii) Interval (−∞, TH(X) > se nazývá<br />
horním 100(1 − α)% intervalem spolehlivosti<br />
parametru θ, jestliže<br />
P [θ ≤ TH(X)] = 1 − α<br />
159
Pro odvození intervalových odhadů pro parametry<br />
µ a σ 2 používáme statistiky<br />
Z = Xn − µ<br />
σ/ √ n<br />
T = Xn − µ<br />
Sn/ √ n<br />
(n − 1)S 2 n<br />
σ 2<br />
∼ N(0, 1)<br />
∼ tn−1<br />
∼ χ 2 n−1<br />
10.8. Věta. Nechť X = (X1, . . . , Xn) je náhodný<br />
výběr z rozdělení N(µ, σ2 ). Pak<br />
σ<br />
σ<br />
(i) P [ Xn − u1−α/2 √ ≤ µ ≤ Xn + u1−α/2 √ ] = 1 − α<br />
n n<br />
Sn<br />
(ii) P [ Xn − tn−1,1−α/2 √ ≤ µ ≤ Xn + tn−1,1−α/2 √ ] = 1 − α<br />
n n<br />
Důkaz: (i) Z = Xn−µ<br />
σ/ √ n<br />
∼ N(0, 1)<br />
P [uα/2 ≤ Z ≤ u1−α/2] = 1 − α .<br />
σ<br />
√ n uα/2 ≤ Xn − µ ≤ σ √ n u1−α/2<br />
160<br />
Sn
(ii) Totéž s využitím statistiky T = Xn−µ<br />
Sn/ √ n<br />
∼ tn−1.<br />
10.9. Příklad. Je měřena výška 16 rostlin. Průměr<br />
naměřených hodnot je 72,5 cm, výběrová směrodatná<br />
odchylka je 4,5 cm. Nalezněte 90% interval<br />
spolehlivosti pro střední výšku.<br />
1 − α = 0, 9; α = 0, 1; 1 − α/2 = 0, 95<br />
t15(0, 95) = 1, 75<br />
r = 1, 75 4,5<br />
√ 16 = 1, 97<br />
(70, 53; 74, 47)<br />
10.10. Příklad. X ∼ N(µ, σ 2 ). Při padesáti měření<br />
byla získána směrodatná odchylka<br />
S50 = 2, 192<br />
Určete horní 95% interval spolehlivosti pro σ 2 .<br />
(n − 1)σ 2<br />
σ 2<br />
∼ χ 2 n−1<br />
161
2 (n − 1)Sn P<br />
σ 2<br />
≥ χ 2 n−1,α<br />
<br />
P σ 2 ≤ (n − 1)S2 n<br />
χ2 n−1,α<br />
χ 2 49(0, 05) = 33, 930<br />
49 · 2, 192<br />
33, 930<br />
Interval: (0, 3,166).<br />
= 3, 166 .<br />
<br />
= 1 − α<br />
<br />
= 1 − α<br />
Přibližné intervalové odhady: Xn má podle Centrální<br />
limitní věty pro velké n přibližně normální<br />
rozdělení:<br />
X1 + X2 + · · · + Xn − nµ<br />
√ nσ<br />
= Xn − µ<br />
σ/ √ n<br />
má přibližně rozdělení N(0, 1). Dá se použít intervalový<br />
odhad pro normální rozdělení:<br />
Sn<br />
Xn − u1−α/2<br />
Sn<br />
√ ≤ E(X) ≤ Xn + u1−α/2 √<br />
n n<br />
162
s pravděpodobností 1 − α.<br />
U alternativního rozdělení A(p) se navíc aproximuje<br />
σ 2 hodnotou<br />
Xn(1 − Xn)<br />
Xn − u1−α/2<br />
<br />
Xn(1 − Xn)<br />
√ n<br />
s pravděpodobností 1 − α.<br />
≤ p ≤ Xn + u1−α/2<br />
10.11. Příklad. Při průzkumu se zjistilo, že z<br />
1500 oslovených osob poslouchá rádiovou stanici<br />
kvůli hudbě 63%. Určete 98% interval spolehlivosti<br />
pro skutečné procento takovýchto posluchačů.<br />
interval<br />
X1500 = 0, 63<br />
<br />
0, 63 · 0, 37<br />
r = u0,99 ·<br />
= 0, 029<br />
1500<br />
(60, 1%; 65, 9%)<br />
163<br />
<br />
Xn(1 − Xn)<br />
√ n
11 Testování statistických<br />
hypotéz<br />
statistické rozhodování při neúplné informaci, vždy<br />
s jistým rizikem.<br />
H0 ... nulová hypotéza:<br />
k−tice parametrů (θ1, . . . , θk) ∈ A ⊂ R n<br />
H1 ... alternatvní hypotéza:<br />
k−tice parametrů (θ1, . . . , θk) ∈ B ⊂ R n<br />
A ∩ B = ∅<br />
kritický obor:<br />
W ⊂ R n<br />
naměřená data: X = (X1, . . . , Xn).<br />
H0 zamítneme ve prospěch H1 pokud X ∈ W ,<br />
volí se tak, aby<br />
P [X ∈ W |H0] ≤ α<br />
164
α ... hladina významnosti<br />
standardy: α = 0, 5; 0, 01<br />
Chyba prvního druhu: H0 platí a test ji zamítá<br />
Chyba druhého druhu: H0 neplatí a test ji nezamítá<br />
11.1. Příklad. V roce 1951 byla naměřena průměrná<br />
výška 10 letých chlapců v ČSSR 136,1 cm.<br />
V roce 1961 se u 15 náhodně vybraných 10 letých<br />
chlapců zjistila průměrná výška<br />
X15 = 139, 133cm<br />
V obou případech je σ = 6, 4cm<br />
Vzrostla výška?<br />
Výška v r. 1961, N(µ, 6, 4 2 )<br />
H0 : µ = 136, 1 = µ0<br />
H1 : µ > 136, 1<br />
165
Hypotézu H0 zamítneme pokud X15 bude příliš<br />
velký, tj. pokud X15 > c, kde c je vhodně zvolená<br />
konstanta.<br />
Platí-li H0, pak X15 má rozdělení N(µ0, 6,42<br />
). Tedy<br />
15<br />
Z = X15 − µ0<br />
σ/ √ 15<br />
∼ N(0, 1) .<br />
Zamítáme na hladině α jestliže Z > u1−α<br />
Volme α = 0, 05. u0,95<br />
Z =<br />
.<br />
= 1, 64<br />
139, 133 − 136, 1<br />
6, 4/ √ 15<br />
.<br />
= 1, 835<br />
Protože Z > u0,95 zamítáme hypotézu H0 na hladině<br />
významnosti 5%.<br />
Kritický obor: {x ∈ R 15 | 1<br />
15 (x1 + · · · + x15) ≥ c}<br />
c = 136, 1 + u0,95 · 6, 4 √ 15 = 136, 1 + 1, 838 = 137, 938<br />
166
Lze volit mnoho kritických oborů. Existuje matematický<br />
výsledek (Neymannovo-Pearsonovo lemma)<br />
říkající, že tento test má největší sílu.<br />
Síla testu: pravděpodobnost s jakou zamítneme<br />
nulovou hypotézu když platí hypotéza alternativní.<br />
Vztah mezi chybou prvního a druhého druhu α a<br />
β. Pokud H0 neplatí, pak α → 0 implikuje β → 1.<br />
Testy o střední hodnotě normálního rozdělení<br />
X = (X1, . . . , Xn)<br />
... náhodný výběr z rozdělení N(µ, σ 2 ).<br />
H0 : µ = µ0<br />
H1 : µ = µ0...oboustranný test<br />
H2 : µ > µ0...jednostranný test<br />
H3 : µ < µ0...jednostranný test<br />
167
Z-test<br />
známe σ<br />
Z = Xn − µ0<br />
σ/ √ n<br />
má za podmínky H0 rozdělení N(0, 1).<br />
H0 zamítneme na hladině významnosti α<br />
a) proti H1: pokud |Z| > u1−α/2<br />
b) proti H2: pokud Z > u1−α<br />
a) proti H3: pokud Z < uα = −u1−α<br />
168
t-test<br />
neznáme σ<br />
T = Xn − µ0<br />
Sn/ √ n<br />
má za podmínky H0 rozdělení tn−1.<br />
H0 zamítneme na hladině významnosti α<br />
a) proti H1: pokud |T | > tn−1(1 − α/2)<br />
b) proti H2: pokud T > tn−1(1 − α)<br />
a) proti H3: pokud T < tn−1(α) = −tn−1(1 − α)<br />
Pro velké n aproximujeme tn−1 rozdělením N(0, 1).<br />
169
11.2. Příklad. Automat plní krabice práškem. Norma<br />
je 2kg. Náhodně bylo vybráno 6 krabic. Zjistily se<br />
následující odchylky od normy v dkg.<br />
−5, 1, −1, −8, 7, −6<br />
Testujeme správnost funkce automatu.<br />
H0 : µ = 0<br />
H1 : µ = 0 .<br />
n = 6, X6 = −2, S 2 6 = 30, 4<br />
T =<br />
−2 − 0<br />
√ 30, 4/ √ 6<br />
t5(0, 975) = 2, 5706<br />
|T | < 2, 5706<br />
Závěr: H0 nezamítáme.<br />
.<br />
= −0, 889 .<br />
170
Párový t-test: Sledujeme související veličiny, předpokládáme,<br />
že rozdíl má normální rozdělení.<br />
11.3. Příklad.<br />
váha osob před dietou 82 70 91<br />
váha osob po dietě 81 69,5 89<br />
Má dieta efekt ?<br />
Rozdíly před a po:<br />
1— 0,5— 2<br />
H0 : µ = 0<br />
H1 : µ > 0<br />
X3 = 1, 167<br />
S 2 3 = 0, 583<br />
T =<br />
1, 167<br />
S3/ √ 3<br />
t2(0, 95) = 2, 92<br />
= 2, 647 .<br />
171
Závěr: nezamítáme nulovou hypotézu, pokles váhy<br />
neni průkazný. (I když se zdá být ztráta váhy velká,<br />
máme málo pokusných osob).<br />
172
Asymtotický test proporce<br />
A(p) ... alternativní rozdělení<br />
Centrální limitní věta: Xn se aproximuje rozdělením<br />
N(p, p(1−p)<br />
n ).<br />
H0 : p ≤ p0<br />
H1 : p > p0<br />
H0 zamítáme, jestliže Xn > c. Volíme vhodně c<br />
tak, aby<br />
P [Xn > c|H0] ≤ α<br />
<br />
.= c − p<br />
P Xn > c|H0 1 − Φ<br />
√ p(1−p)<br />
√ n<br />
<br />
=<br />
√ <br />
n(c − p)<br />
= 1 − Φ <br />
p(1 − p)<br />
p(1 − p) ≤ 1/2 c − p ≥ c − p0<br />
implikuje<br />
√ n(c − p)<br />
p(1 − p) ≥ 2 √ n(c − p0)<br />
173
Tedy<br />
√ <br />
n(c − p)<br />
1 − Φ ≤ 1 − Φ(2<br />
p(1 − p)<br />
√ n(c − p0))<br />
Podmmínce vyhovíme, jestliže<br />
1 − Φ(2 √ n(c − p0)) ≤ α<br />
Φ(2 √ n(c − p0)) ≥ 1 − α<br />
2 √ n(c − p0) ≥ u1−α<br />
c ≥ p0 + u1−α<br />
2 √ n<br />
Závěr: H0 zamítáme ve prospěch H1 jestliže<br />
Xn ≥ p0 + u1−α<br />
2 √ n<br />
174
11.4. Příklad. Průzkum zahrnuje 1600 osob. Kolik<br />
procent z tohoto vzorku má daná koalice získat<br />
hlasů, abychom na hladině významnosti 1% potvrdili<br />
hypotézu, že koalice vyhraje volby.<br />
X1600 ≥ 0, 5 + u0,99<br />
80<br />
. 2, 326<br />
= 0, 5 +<br />
80<br />
= 0, 529 .<br />
Musíme tedy získat 0, 529 · 1600 . = 847 hlasů.<br />
Musíme vždy získat o asi 2, 9% více než je daná<br />
mez.<br />
175
Test rozptylu normálního rozdělení<br />
X = (X1, . . . , Xn) ... náhodný výběr z rozdělení<br />
N(µ, σ 2 )<br />
H0 : σ 2 = σ 2 0<br />
H1 : σ 2 > σ 2 0<br />
Využíváme statistiku<br />
S = (n − 1)S2 n<br />
σ 2 0<br />
která má za předpokladu H0 rozdělení χ 2 n−1.<br />
Hypotézu H0 zamítáme ve prospěch H1 při hladině<br />
významnosti α jestliže<br />
(n − 1)S 2 n<br />
σ 2 0<br />
> χ 2 n−1(1 − α) .<br />
176
Testy dobré shody<br />
(Ω, A, P ) ... pravděpodobnostní prostor<br />
A1, . . . , Ak ... úplný systém jevů<br />
P (Ai) = pi<br />
A1 A2 · · · Ak<br />
p1 p2 · · · pk<br />
k<br />
pi = 1 .<br />
i=1<br />
Odpovídá rozdělení dat do disjunktních tříd. pi<br />
jsou apriorní pravděpodobnosti. Testujeme jejich<br />
shodu s empirickými daty.<br />
H0 : P (Ai) = pi<br />
(k = 2) máme vpodstatě alternativní rozdělení.<br />
Učiníme sérii n pokusů, v každém indikujeme jeden<br />
z jevů A1, . . . , Ak. Počítáme kolikrát který jev<br />
nastane. Při k = 2 tak máme binomické rozdělení.<br />
177
Značení:<br />
n ... počet nezávislých pokusů<br />
Oi ... počet výskytů jevu Ai v sérii n pokusů.<br />
Náhodná veličina – empirická četnost.<br />
n pi ... teoretická četnost<br />
(k = 2 pak Oi ∼ Bi(n, pi))<br />
Testujeme shodu npi ≈ Oi<br />
11.5. Věta. Náhodná veličina<br />
k (Oi − npi) 2<br />
i=1<br />
npi<br />
má při n → ∞ přibližně rozdělení χ 2 k−1 .<br />
Důkaz je založen na centrální limitní větě<br />
Hypotézu H0 o apriorních pravděpodobnostech zamítáme<br />
na hladině významnosti α, pokud<br />
k (Oi − npi) 2<br />
i=1<br />
npi<br />
> χ 2 k−1(1 − α)<br />
178
Tento test se nazývá χ 2 test, nebo též Pearsonův<br />
test. Tento test je asymptotický, doporučuje se ho<br />
použít pro n tak velké, že<br />
npi > 5 pro všechna i = 1, . . . , k .<br />
11.6. Příklad. Testujeme zda hrací kostka neni<br />
falešná. Provedeno 120 hodů. Výsledky jsou<br />
hodnota 1 2 3 4 5 6<br />
četnost 15 16 25 31 15 18<br />
= 20.<br />
n = 120, pi = 1/6, npi = 120 · 1<br />
6<br />
6 (Oi − npi) 2<br />
=<br />
npi<br />
i=1<br />
= 52 42 52 112 52 22<br />
+ + + + +<br />
20 20 20 20 20 20<br />
χ 2 5(0, 95) = 11, 07 .<br />
= 10, 8 .<br />
Závěr: nelze zamítnout hypotézu, že kostka je falešná.<br />
179
Často se používá na test typu rozdělení:<br />
11.7. Příklad. Testujeme hypotézu, že data pocházejí<br />
z rozdělení N(0, 1). Provedeno je 1000 měření,<br />
data jsou rozdělena do tří skupin<br />
u0,8 = 0, 84162<br />
250 hodnot v (−∞, −u0,8)<br />
550 hodnot v (−u0,8, u0,8)<br />
200 hodnot v (u0,8, ∞)<br />
H0 : p1 = 0, 2; p2 = 0, 6; p3 = 0, 2<br />
np1 = 200<br />
np2 = 600<br />
np3 = 200<br />
3 (Oi − npi) 2<br />
i=1<br />
npi<br />
χ 2 2(0, 95) = 5, 9915<br />
= 502 502 0<br />
+ +<br />
200 600 200<br />
Závěr: Hypotézu o rozdělení N(0, 1) zamítáme.<br />
180<br />
= 16, 667 .
Testy shody při neznámých parametrech<br />
Testujeme zda data pocházejí z rozdělení s neznámými<br />
parametry.<br />
Je-li l počet odhadnutých parametrů, pak<br />
k (Oi − npi) 2<br />
i=1<br />
npi<br />
má asymptoticky rozdělení χ 2 k−1−l .<br />
Postup:<br />
1. Neznámé parametry odhadneme z dat.<br />
2. Pomocí nich spočítáme apriorní pravděpodobnosti<br />
3. Hypotézu o daném rozdělení zamítneme, jestliže<br />
k (Oi − npi) 2<br />
i=1<br />
npi<br />
> χ 2 k−1−l(1 − α)<br />
181
11.8. Příklad. Za války byl Londýn bombardován<br />
střelami V1 a V2. Hypotéza je, že střely dopadaly<br />
náhodně (bez zaměřování) do jednotlivých<br />
lokalit.<br />
Celkem na Londýn dopadlo 537 raket.<br />
Území města bylo rozděleno na 24 2 = 576 čtverců<br />
stejné velikosti.<br />
Empirická data:<br />
počet zásahů: 0 1 2 3 4 a více<br />
počet oblastí: 229 211 93 35 8<br />
X: počet zásahů v náhodně vybrané oblasti:<br />
<br />
Bi počet střel ,<br />
1. Odhadneme:<br />
λ . = 537<br />
<br />
=<br />
576<br />
počet střel<br />
2. Platí-li H0 je<br />
P [X = i] = λi e −λ<br />
<br />
1<br />
≈ P o počet střel ·<br />
počet oblastí<br />
<br />
.<br />
počet oblastí<br />
i!<br />
.<br />
182<br />
<br />
1<br />
.<br />
počet oblastí
počet pokusů = počet oblastí<br />
n = 576<br />
537<br />
−<br />
nP [X = 0] = 576 e 576<br />
.<br />
= 226, 7 .<br />
nP [X = 1] = 576 · 537 537<br />
e− 576<br />
576<br />
nP [X = 2] . = 98, 5 .<br />
nP [X = 3] . = 30, 6 .<br />
nP [X ≥ 4] . = 8, 7 .<br />
.<br />
= 211, 4 .<br />
počet zásahů: 0 1 2 3 4 a více<br />
skutečnost: 229 211 93 35 8<br />
teorie: 226,7 211,4 98,5 30,6 8,7<br />
Numerický výpočet:<br />
5 (0i − npi) 2<br />
= 1, 569<br />
npi<br />
i=1<br />
χ 2 5−1−1(0, 95) = 7, 81 .<br />
Závěr: Na hladině významnosti 5% potvrzujeme<br />
hypotézu H0.<br />
183