20.07.2013 Views

Matematika 4B - Katedra matematiky FEL ČVUT

Matematika 4B - Katedra matematiky FEL ČVUT

Matematika 4B - Katedra matematiky FEL ČVUT

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Matematika</strong> <strong>4B</strong><br />

Prof. RNDr. Jan Hamhalter, CSc.<br />

katedra <strong>matematiky</strong> <strong>FEL</strong> <strong>ČVUT</strong><br />

e-mail: hamhalte@math.feld.cvut.cz<br />

tel: 224353587<br />

web:<br />

http://math.feld.cvut.cz//hamhalte<br />

11. ledna 2007<br />

16:56<br />

1


• V.Rogalewicz: Pravděpodobnost a statistika pro inženýry,<br />

skripta, Vydavatelství <strong>ČVUT</strong>, 1998.<br />

• K.Zvára a J.Štěpán: Pravděpodobnost a matematická<br />

statistika, matfyzpress, Praha 2002.<br />

• J.Anděl: <strong>Matematika</strong> náhody, matfyzpress, Praha 2003.<br />

• J.Anděl: Statistické metody, matfyzpress, Praha 2003.<br />

• V.Dupač a M.Hušková: Pravděpodobnost a matematická<br />

statistika, Nakladatelství Karolinum, 1999.<br />

• Z.Prášková: Základy náhodných procesů II, Nakladatelství<br />

Karolinum, 2004.<br />

• A. Rényi: Teorie pravděpodobnosti, Academia, Praha<br />

1972.<br />

2


1 Historie a podstata<br />

teorie pravděpodobnosti<br />

teorie pravděpodobnosti = matematika náhody, systémy s<br />

nedostatkem informace<br />

svět 19. století – deterministický systém, hodinový stroj<br />

svět 20. století – svět náhody (evoluce není možná bez náhody,<br />

mikrosvět se řídí pravděpodobnostními zákony, teorie<br />

chaosu, apod.)<br />

• Úloha o rozdělení sázky<br />

Pochází od Arabů. Nedávno objevena v rukopise z r. 1380.<br />

Dva hráči hrají sérii partií. Výsledky jednotlivých her jsou<br />

nezávislé. Vyhrává ten kdo poprvé zvítězí v šesti partiích.<br />

Pravděpodobnost výhry je pro každého hráče stejná, t.j.<br />

1/2. Hra je přerušena ve chvíli kdy hráč A vyhrál 5x a hráč<br />

B 3x. Jak si rozdělí výhru?<br />

Úloha byla vyřešena nezávisle Pascalem a Fermatem (1654).<br />

Všechny možnosti pokračování (hra bude trvat nejvýše tři<br />

další partie):<br />

AAA AAB ABA ABB<br />

BAA BAB BBA BBB<br />

Pouze v jednom případě vítězí B, pravděpodobnost výhry<br />

hráče B je 1:8, výhra by se měla rozdělit v poměru 7:1.<br />

3


• Huygens (1657) : On Reasoning in Games of Dice<br />

• Laplace (1812): Analytic Theory of Probabilities<br />

nestačí kombinatorické metody, je třeba uvažovat nekonečné<br />

soubory možností<br />

statistická fyzika, Brownův pohyb, teorie míry a integrace<br />

• A. Kolmogorov (1930): Axiomatické základy teorie pravděpodobnosti<br />

• současný stav a perspektivy: nové obory založené na pravděpodobnostním<br />

přístupu – kvantová teorie informace,<br />

teorie her v ekonomii, teorie chaosu, ...<br />

4


2 Pravděpodobnostní prostor<br />

pravděpodobnostní model má dvě komponenty:<br />

• struktura náhodných jevů<br />

• pravděpodobnost jako kvantitativní funkce na jevech<br />

2.1. Příklad. Střelba na terč<br />

Ω = kruh o poloměru r<br />

náhodné jevy = podmnožiny Ω<br />

pravděpodobnost(A) = obsah(A)<br />

πr 2<br />

5<br />

.


2.2. Příklad. Sportka<br />

Ω = {{1, 2, 3, 4, 5, 6}, {1, 3, 4, 6, 2, 17}, . . . } =<br />

{ šestiprvkové podmnožiny množiny {1, 2, . . . , 49}}<br />

tyto šestice tvoří elementární jevy s pravděpodobností<br />

1 1<br />

= = 0, 7151138242 · 10−7<br />

13983816<br />

49<br />

6<br />

jev= podmnožina Ω<br />

pravděpodobnost jevu A ⊂ Ω.<br />

P (A) = velikost(A)<br />

.<br />

49<br />

6<br />

konkrétní výpočet v tomto modelu – spočtěte pravděpodobnost,<br />

že uhodnete (právě) tři čísla.<br />

P (A) =<br />

6 3 49 6<br />

43<br />

· 3 = 0, 1765040387<br />

6


náhodné jevy musíme umět kombinovat<br />

„jev A nebo jev B, ...<br />

2.3. Definice. Nechť Ω je neprázdná množina. Systém<br />

A podmnožin množiny Ω se nazývá σ-algebra náhodných<br />

jevů, jestliže platí<br />

(i) Ω ∈ A.<br />

(ii) Jestliže A1, A2, . . . jsou množiny v A, pak<br />

∞<br />

i=1 Ai ∈ A<br />

(iii) Je-li A ∈ A, pak A c = Ω \ A ∈ A<br />

Terminologie:<br />

A c ... opačný jev k jevu A<br />

A, B jsou navzájem vylučující se (disjunktní) jevy jestliže<br />

A ∩ B = ∅<br />

7


2.4. Tvrzení. Je-li A σ-algebra podmnožin Ω pak<br />

(i) A1, A2, . . . ∈ A =⇒ ∞<br />

i=1 Ai ∈ A.<br />

(ii) A, B ∈ A =⇒ A ∩ B c ∈ A.<br />

Důkaz:<br />

(i) Ac 1, Ac 2, . . . ∈ A, =⇒ ∞ i=1 Aci (de Morganova pravidla)<br />

<br />

∞<br />

c ∞<br />

= Ai ∈ A .<br />

i=1<br />

A c i<br />

i=1<br />

(ii) A, B c ∈ A =⇒ A ∩ B c ∈ A .<br />

8<br />

∈ A =⇒


pravděpodobnost modeluje relativní četnost, měla by respektovat<br />

stejná pravidla jako počet prvků množiny<br />

2.5. Definice. Předpokládejme, že A je σ-algebra podmnožin<br />

množiny Ω. Pravděpodobnost P je zobrazení<br />

P : A → [0, 1] ,<br />

pro které platí<br />

(i) P (Ω) = 1<br />

(ii) P ( ∞ i=1 Ai) = ∞ i=1 P (Ai),<br />

jestliže A1, A2, .... jsou navzájem disjunktní množiny<br />

v A.<br />

Trojice (Ω, A, P ) se nazývá pravděpodobnostní prostor.<br />

9


Základní vlastnosti pravděpodobnosti<br />

(i) A ∩ B = ∅ =⇒ P (A ∪ B) = P (A) + P (B)<br />

(ii) P (∅) = 0<br />

(⇐= P (Ω) + P (∅) = P (Ω))<br />

(iii) P (A c ) = 1 − P (A)<br />

(⇐= P (A) + P (A c ) = P (Ω) = 1.)<br />

(iv) A ⊂ B =⇒ P (B ∩ A c ) = P (B) − P (A)<br />

(⇐= P (B) = P (A) + P (B ∩ A c ))<br />

(v) P (A ∪ B) = P (A) + P (B) − P (A ∩ B).<br />

odvození: X = A ∩ (A ∩ B) c , Y = B ∩ (A ∩ B) c<br />

P (X) + P (Y ) + P (A ∩ B) = P (A ∪ B)<br />

P (A)−P (A∩B)+P (B)−P (A∩B)+P (A∩B) = P (A∪B)<br />

P (A) + P (B) = P (A ∪ B) + P (A ∩ B)<br />

10


Tato základní pravidla jsou často užitečná při konkrétních<br />

výpočtech.<br />

2.6. Příklad. Určete pravděpodobnost, že při tahu Sportky<br />

bude vylosováno buďto číslo 7 nebo číslo 20.<br />

Řešení: A ... taženo číslo 7, B ... taženo číslo 20.<br />

Tedy<br />

P (A) = P (B) =<br />

P (A ∩ B) =<br />

47 4 49 6<br />

P (A ∪ B) = 2 ·<br />

<br />

<br />

48 5 49 6<br />

48 5 49 6<br />

<br />

<br />

<br />

−<br />

11<br />

47 4 49 6<br />

<br />

= 13<br />

= 0, 232148571 .<br />

56


Důležité typy pravděpodobnostních prostorů:<br />

• klasický pravděpodobnostní prostor<br />

• konečný pravděpodobnostní prostor<br />

• diskrétní nekonečný pravděpodobnostní prostor<br />

• geometrický pravděpodobnostní prostor<br />

12


Klasický pravděpodobnostní prostor<br />

Ω = {ω1, . . . , ωn}<br />

A = všechny podmnožiny množiny Ω<br />

P (A) = |A| |A|<br />

=<br />

|Ω| n .<br />

V tomto modelu mají elementární jevy stejnou šanci = 1<br />

n .<br />

Někdy je těžké nalézt dobrý model slovní úlohy, často se<br />

setkáme se složitou kombinatorikou.<br />

13


2.7. Příklad. Hodíme n krát mincí, rub i líc v jednom<br />

hodu mají stejnou šanci, tj. 1<br />

2 . Jaká je pravděpodobnost že<br />

padne právě k krát líc?<br />

Řešení: elementární jevy – posloupnosti nul a jedniček délky<br />

n kódující výsledky hodů.<br />

|Ω| = 2 n<br />

Ω = {ω1, . . . , ω2 n}<br />

Ak .... posloupnost obsahuje právě k jedniček.<br />

Tedy<br />

|Ak| =<br />

<br />

n<br />

k<br />

P (Ak) = 1<br />

2n <br />

n<br />

.<br />

k<br />

Poznámka: Hodíme n krát mincí, kde n je sudé. Jaká je<br />

pravděpodobnost, že padne stejný počet nul jako jedniček?<br />

<br />

n<br />

n/2<br />

P (A n/2) = 1<br />

2 n<br />

Pomocí tzv. Stirlingova vzorce lze dokázat, že<br />

P (A n/2) ≈<br />

1<br />

πn/2 → 0 pro n → ∞ .<br />

14


2.8. Příklad. Narozeninový problém<br />

Jaká je pravděpodobnost, že ve třídě s n žáky se najde<br />

dvojice mající narozeniny ve stejný den? (n ≤ 365).<br />

Řešení:<br />

Ω = {posloupnosti délky n<br />

prvků množiny {1, 2, . . . , 365}}<br />

Elementární jevy kódují den narozenin 1. až n-tého žáka.<br />

A ... sledovaný jev<br />

A c ... jev opačný, všichni mají narozeniny v jiný den.<br />

|Ω| = 365 n<br />

|A c | = 365 · 364 · 363 · · · (365 − n + 1)<br />

365 · 364 · 363 · · · (365 − n + 1)<br />

P (A) = 1 −<br />

365n =<br />

n−1 <br />

<br />

= 1 − 1 − j<br />

<br />

365<br />

Nečekané numerické hodnoty:<br />

již pro n = 23 je P (A) > 1/2,<br />

pro n = 56 je P (A) = 0, 99.<br />

15<br />

j=1


Konečný pravděpodobnostní prostor<br />

Ω = {ω1, . . . , ωn}<br />

A = všechny podmnožiny Ω<br />

p1, . . . , pn > 0 . . . váhy<br />

n<br />

pi = 1<br />

• Z toho vyplývá že<br />

P (A) = <br />

{i|ωi∈A}<br />

pro všechny A ⊂ Ω.<br />

i=1<br />

P ({ωi}) = pi<br />

pi ,<br />

• Klasický pravděpodobnostní prostor je speciálním případem,<br />

ve kterém jsou všechny váhy stejné:<br />

p1 = p2 = · · · = pn = 1<br />

n .<br />

16


2.9. Příklad. Ω = {ω1, ω2, ω3}<br />

p1 = P ({ω1}) = 1<br />

2<br />

p2 = P ({ω2}) = 1<br />

4<br />

p3 = P ({ω3}) = 1<br />

4<br />

ω1 ω2 ω3<br />

1<br />

2<br />

1<br />

4<br />

Je tedy např.<br />

1<br />

4<br />

P ({ω1, ω2}) = p1 + p2 = 1 1 3<br />

+ =<br />

2 4 4 .<br />

17


Bernoulliovo schéma<br />

Máme jev A (zdar) s pravděpodobností 0 < p < 1<br />

a jev B (nezdar) s pravděpodobností 0 < 1 − p < 1.<br />

V náhodném pokusu nastane právě jeden z jevů A a B s<br />

příslušnou pravděpodobností. Provedeme sérii n těchto náhodných<br />

pokusů, jejichž výsledky se navzájem neovlivňují.<br />

Možné výstupy pro n = 4: ABAA, BBBA, ...<br />

kódovány posloupnostmi 0 a 1: 1011, 0001, ...<br />

Elementární jevy —- posloupnosti nul a jedniček délky n<br />

Nezávislost znamená, že pravděpodobnosti se násobí:<br />

P (1011) = p · (1 − p) · p · p = p 3 · (1 − p)<br />

P (0001) = (1 − p) · (1 − p) · (1 − p) · p = p · (1 − p) 3<br />

18


To nás vede k následujícímu modelu:<br />

Ω= všechny posloupnosti nul a jedniček délky n<br />

|Ω| = 2 n .<br />

P (posloupnost ) = ppočet 1 počet 0<br />

· (1 − p)<br />

Ověříme, že součet vah je 1:<br />

<br />

pi =<br />

2 n<br />

i=1<br />

n<br />

k=0<br />

<br />

n<br />

p<br />

k<br />

k (1 − p) n−k =<br />

= (p + (1 − p)) n = 1.<br />

Důležitý je jev, Ak, že v sérii n pokusů nastane jev A právě<br />

k krát.<br />

|Ak| = n<br />

k .<br />

P (Ak) =<br />

<br />

n<br />

p<br />

k<br />

k (1 − p) n−k .<br />

Konkrétní příklady: hod mincí, hod kostkou, ankety, statistické<br />

šetření, apod.<br />

2.10. Příklad. Terč zasáhneme s pravděpodobností 1/3.<br />

Jaká je pravděpodobnost, že se dvakrát strefíme při čtyřech<br />

pokusech.<br />

P (A2) =<br />

<br />

4 1<br />

2 32 2 2<br />

=<br />

3<br />

48<br />

= 0, 2963 .<br />

161<br />

19


Nekonečný diskrétní pravděpodobnostní prostor<br />

Ω = {ω1, ω2, . . . }<br />

A = všechny podmnožiny Ω<br />

(pn) ∞ n=1 . . . posloupnost vah<br />

∞<br />

n=1<br />

pn = 1, pn ≥ 0<br />

P ({ωn}) = pn pro n = 1, 2, . . .<br />

• Z toho vyplývá, že<br />

P (A) = <br />

{n|ωn∈A}<br />

pro všechny A ⊂ Ω.<br />

pn ,<br />

20


Poissonův zákon<br />

Ω = {ω0, ω1, ω2 . . . }<br />

λ > 0 parametr<br />

pn = λn<br />

n! e−λ , n = 0, 1, . . .<br />

Ověříme korektnost zadání:<br />

∞<br />

∞<br />

n=0<br />

λ n<br />

n! e−λ = e −λ<br />

n=0<br />

λ n<br />

n! = e−λ e λ = 1 .<br />

2.11. Příklad. Za danou časovou jednotku volá na ústřednu<br />

průměrně λ > 0 účastníků. Pravděpodobnost pn, že zavolá<br />

právě n účastníků se řídí Poissonovým zákonem:<br />

pn = λn<br />

n! e−λ<br />

Pravděpodobnost, že zavolá alespoň někdo je 1 − e −λ .<br />

21


Geometrický pravděpodobnostní prostor<br />

pravděpodobnost je dána geometrickou kvantitou (délka,<br />

obsah, objem)<br />

Ω ⊂ R, R 2 , R 3 , . . . ,<br />

0 < velikost (Ω) < ∞ ,<br />

P (A) =<br />

pro A ⊂ Ω.<br />

velikost (A)<br />

velikost (Ω)<br />

2.12. Příklad. Terč má poloměr 30 cm. Jaká je pravděpodobnost,<br />

že se trefíme do středu o poloměru 5cm ?<br />

Řešení:<br />

p = 25π<br />

= 0, 02777 . . . .<br />

900π<br />

22


2.13. Příklad. Buffonova úloha<br />

V rovině je dán systém rovnoběžek majících vzdálenost d.<br />

Na rovinu hodíme jehlu o velikosti l, l < d. Jaká je pravděpodobnost,<br />

že protne některou rovnoběžku?<br />

Řešení: Polohu jehly vůči rovnoběžné síti popíšeme dvěma<br />

parametry:<br />

x ... vzdálenost středu jehly od nejbližší rovnoběžky<br />

x ∈< 0, d<br />

2 ><br />

ϕ ... úhel, který jehla svírá s rovnoběžnou sítí<br />

ϕ ∈< 0, π > .<br />

Podmínka protnutí:<br />

l<br />

2<br />

sin ϕ > x<br />

P = 1<br />

π d/2<br />

= 2l<br />

πd .<br />

π<br />

0<br />

π l<br />

l<br />

sin ϕdϕ = − cos ϕ =<br />

2 πd<br />

0<br />

23


Další vlastnosti pravděpodobnosti:<br />

Princip inkluze a exkluze<br />

Opakování: P (A ∪ B) = P (A) + P (B) − P (A ∩ B).<br />

Mějme nyní tři jevy A, B, C ∈ A.<br />

P (A ∪ B ∪ C) = P [(A ∪ B) ∪ C] =<br />

P (A ∪ B) + P (C) − P ((A ∩ C) ∪ (B ∩ C))<br />

= P (A) + P (B) − P (A ∩ B) + P (C)<br />

− P (A ∩ C) − P (B ∩ C) + P (A ∩ B ∩ C)<br />

= P (A) + P (B) + P (C)<br />

− P (A ∩ C) − P (B ∩ C) − P (A ∩ B)<br />

24<br />

+ P (A ∩ B ∩ C)


Zobecnění se dá dokázat indukcí:<br />

2.14. Věta. Princip inkluze a exkluze<br />

Předpokládejme, že A1, . . . , An ∈ A, kde (Ω, A, P ) je<br />

pravděpodobnostní prostor. Pak platí<br />

P (A1∪A2∪· · ·∪An) = <br />

+<br />

<br />

1≤i


2.15. Příklad. Roztržitá šatnářka<br />

n hostů restaurace si přichází odložit svůj kabát. Šatnářka<br />

vydává kabáty chaoticky. Jaká je pravděpodobnost, že alespoň<br />

jeden z hostů dostane svůj kabát?<br />

Řešení: Elementární jevy jsou permutace n prvkové množiny.<br />

<br />

1 2 . . . n<br />

k1 k2 . . . kn<br />

Všechny mají stejnou pravděpodobnost, tj. 1<br />

n! .<br />

kde<br />

A = {(k1, . . . , kn) | existuje 1 ≤ i ≤ n tak že ki = i} .<br />

A = A1 ∪ A2 ∪ · · · ∪ An ,<br />

Ai = {(k1, . . . , kn) | ki = i}<br />

(i-tý host je v pořádku)<br />

(n − 1)!<br />

P (Ai) =<br />

n!<br />

(n − 2)!<br />

P (Ai ∩ Aj) = , i = j<br />

n!<br />

P (A1 ∩ A2 ∩ · · · ∩ An) = 1<br />

n!<br />

26


n (n − 2)!<br />

P (A) = 1−<br />

2 n! +<br />

<br />

n (n − 3)!<br />

1<br />

−· · ·+(−1)n+1<br />

3 n! n!<br />

= 1 − 1 1<br />

1<br />

+ − · · · + (−1)n+1<br />

2! 3! n!<br />

numerické hodnoty:<br />

n 1 2 3 4 5 6 7<br />

P (A) 1 0,5 0,6667 0,625 0,6333 0,6319 0,6321<br />

asymptoticky:<br />

e −1 = 1 − 1 1 1<br />

+ − + · · ·<br />

1! 2! 3!<br />

lim<br />

n→∞ P (A) = 1 − e−1 = 0, 6321....<br />

27


Zacházení s nekonečnými posloupnostmi jevů, spojitost pravděpodobnosti:<br />

2.16. Věta. Předpokládejme, že (Ω, A, P ) je pravděpodobnostní<br />

prostor.<br />

(i) Je-li A1 ⊂ A2 ⊂ · · · pro A1, A2, · · · z A, pak<br />

<br />

∞<br />

P<br />

i=1<br />

Ai<br />

<br />

= lim<br />

i→∞ P (Ai)<br />

(ii) Je-li A1 ⊃ A2 ⊃ · · · pro A1, A2, · · · z A, pak<br />

<br />

∞<br />

P<br />

i=1<br />

Ai<br />

<br />

Důkaz: (An) splňuje (i)<br />

= lim<br />

i→∞ P (Ai)<br />

An = A1 ∪ (A2 \ A1) ∪ (A3 \ A2) ∪ · · · ∪ (An \ An−1)<br />

je disjunktní sjednocení. Pak<br />

P (An) = P (A1) + P (A2 \ A1) + P (A3 \ A2) +<br />

Dále platí<br />

+ · · · + P (An \ An−1) .<br />

∞<br />

An = A1 ∪ (A2 \ A1) ∪ (A3 \ A2) ∪ · · ·<br />

n=1<br />

28


∞<br />

P<br />

n=1<br />

An<br />

<br />

∞<br />

P<br />

n=1<br />

<br />

P (An)<br />

<br />

= P (A1) + P (A2 \ A1) + · · · + P (An \ An−1) + · · · =<br />

An<br />

<br />

= lim P (An)<br />

n→∞<br />

= lim P (An)<br />

n→∞<br />

(ii) obdobným způsobem, nebo z (i) přechodem k množinovému<br />

komplementu.<br />

29


3 Nezávislé jevy a podmíněná pravděpodobnost<br />

Pravděpodobnostní model se mění dostaneme-li částečnou<br />

informaci o systému. Víme, že nastal jev B. Pak pravděpodobnost,<br />

že nastane jev A je<br />

P (A ∩ B)<br />

P (B)<br />

.<br />

———————————————————————<br />

3.1. Definice. Je dán pravděpodobnostní prostor (Ω, A, P )<br />

a B ∈ A s P (B) > 0. Podmíněná pravděpodobnost náhodného<br />

jevu A za podmínky B je definována jako<br />

Tedy<br />

P (A|B) =<br />

P (A ∩ B)<br />

P (B)<br />

.<br />

P (A ∩ B) = P (A|B)P (B) = P (B|A)P (A) .<br />

30


3.2. Příklad. Skříňka má tři zásuvky. V první jsou dvě<br />

zlaté mince, ve druhé zlatá a stříbrná mince a ve třetí dvě<br />

stříbrné mince.<br />

•z1<br />

•z3<br />

◦s2<br />

• z2<br />

◦ s1<br />

◦ s3<br />

Náhodně jsme vybrali zásuvku a náhodně z ní vytáhli minci.<br />

Tažená mince je stříbrná. Jaká je pravděpodobnost, že<br />

druhá mince ve vytažené zásuvce je zlatá?<br />

Řešení: naivní odpověď 1/2 není správná.<br />

Dvě fáze náhodného procesu:<br />

1. volba zásuvky 2. volba mince<br />

Ω = {(1, z1), (1, z2), (2, z3), (2, s1), (3, s2), (3, s3), }<br />

Všechny tyto jevy mají stejnou šanci, tj. 1/6.<br />

Z ... v otevřené zásuvce je zlatá mince<br />

S ... vyjmuli jsme stříbrnou minci (tento jev nastal).<br />

Hledáme p = P (Z|S)<br />

P (S) = P {(2, s1), (3, s2), (3, s3)} = 3 1<br />

=<br />

6 2 .<br />

P (Z ∩ S) = P {(2, s1)} = 1/6 .<br />

p = 1/6 1<br />

=<br />

3/6 3 .<br />

31


Formální vlastnosti podmíněné pravděpodobnosti:<br />

(i) P (B|B) = 1<br />

(ii) P (A1 ∪ A2|B) = P (A1|B) + P (A2|B)<br />

jsou-li A1, A2 ∈ A disjunktní.<br />

————————————————-<br />

3.3. Tvrzení. Je-li (Ω, A, P ) pravděpodobnostní prostor<br />

a B ∈ A s P (B) > 0, pak (Ω, A, P ((·|B)) je také pravděpodobnostní<br />

prostor.<br />

————————————————————–<br />

V pravděpodobnostním prostoru (Ω, A, P ((·|B)) mají jevy<br />

disjunktní s B nulovou pravděpodobnost, podmnožiny v B<br />

mají pravděpodobnost normovanou pravděpodobností jevu<br />

B.<br />

32


Nezávislé jevy jsou jevy jejichž podmíněné pravděpodobnosti<br />

se neovlivňují:<br />

P (A), P (B) > 0<br />

P (A) = P (A|B) =<br />

P (A ∩ B) = P (A) · P (B) .<br />

P (A ∩ B)<br />

P (B)<br />

——————————————————-<br />

3.4. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor.<br />

Jevy A a B ∈ A nazýváme nezávislé, jestliže<br />

P (A ∩ B) = P (A) · P (B) .<br />

———————————————————-<br />

3.5. Příklad. Dvakrát hodíme mincí. Všechny výsledky<br />

jsou stejně pravděpodobné. Ukažte, že výsledky v prvním<br />

a druhém hodu jsou nezávislé.<br />

Řešení: R... rub, L ... líc<br />

Ω = {RL, RR, LR, LL}<br />

P ({RL, RR}) = 1<br />

2<br />

P ({RL, LL}) = 1<br />

2<br />

P ({RL}) = 1 1 1<br />

= ·<br />

4 2 2 .<br />

33


Obecnější definice:<br />

3.6. Definice. Jevy A1, . . . , An v pravděpodobnostní prostor<br />

(Ω, A, P ) jsou nezávislé, jestliže<br />

P (Ai1 ∩ Ai2 ∩ · · · ∩ Aik ) = P (Ai1)P (Ai2) · · · P (Aik )<br />

pro všechna i1 < i2 < · · · < ik, k ≤ n.<br />

Bernoulliovo schéma (revisited)<br />

Výsledky pokusů v Bernoulliově schématu jsou nezávislé<br />

jevy. Bernoulliovo schéma tedy můžeme chápat jako sérii<br />

nezávislých pokusů se dvěma možnými výsledky, které mají<br />

doplňkovou pravděpodobnost.<br />

34


3.7. Příklad. Elektrický obvod znázorněný na obrázku je<br />

náhodně přerušován pěti nezávislými spínači. V jedné větvi<br />

jsou tři spínače a ve druhé dva. Jaká je pravděpodobnost<br />

že obvodem prochází proud? Každý spínač je přerušen s<br />

pravděpodobností 1/2.<br />

Řešení: Ai ... i-tý vypínač je sepnut<br />

p = P [(A1 ∩ A2 ∩ A3) ∪ (A4 ∩ A5)] =<br />

= P (A1 ∩ A2 ∩ A3) + P (A4 ∩ A5)<br />

− P (A1 ∩ A2 ∩ A3 ∩ A4 ∩ A5) =<br />

= 1 1 1 11<br />

+ − = = 0, 34375 .<br />

23 22 25 25 3.8. Tvrzení. Jsou-li jevy A1, . . . , An v pravděpodobnostním<br />

prostoru nezávislé, pak jsou nezávislé i jevy<br />

A c 1, A2, . . . , An.<br />

Důkaz:<br />

P (A c 1 ∩ A2 ∩ · · · ∩ An) = P (A2 ∩ A3 ∩ · · · ∩ An) −<br />

− P (A1 ∩ A2 ∩ · · · ∩ An) =<br />

P (A2)P (A3) · · · P (An)−P (A1)P (A2) · · · P (An) =<br />

= (1 − P (A1))P (A2) · · · P (An) =<br />

= P (A c 1)P (A2)P (A3) · · · P (An) .<br />

Důsledek: Nahradíme-li v nezávislém systému jevů některé<br />

jevy jejich opakem, dostaneme opět nezávislý systém.<br />

35


Situace: A1, . . . , An disjunktní jevy, takové že<br />

P (A1) + P (A2) + · · · + P (An) = 1<br />

a P (Ai) > 0 pro všechna i. Pak<br />

P ((A1 ∪ A2 ∪ · · · ∪ An) c ) = 0 .<br />

Pro každé B ∈ A máme<br />

P (B) = P (B ∩ A1) + P (B ∩ A2) + P (B ∩ A3) +<br />

· · · + P (B ∩ An) + 0 =<br />

= P (B|A1)P (A1)+P (B|A2)P (A2)+· · ·+P (B|An)P (An) .<br />

———————————————————–<br />

3.9. Definice. Posloupnost A1, . . . , An disjunktních jevů<br />

v pravděpodobnostním prostoru (Ω, A, P ) se nazývá úplný<br />

systém jevů jestliže A1, . . . , An jsou disjunktní, P (Ai) > 0<br />

pro všechna i a<br />

P (A1) + P (A2) + · · · + P (An) = 1 .<br />

3.10. Věta. (Věta o úplné pravděpodobnosti)<br />

Předpokládejme že A1, . . . , An je úplný systém jevů<br />

v pravděpodobnostním prostoru (Ω, A, P ) takový, že<br />

P (Ai) > 0 pro všechna i = 1, . . . n. Pro každé B ∈ A<br />

platí<br />

P (B) = P (B|A1)P (A1) + P (B|A2)P (A2) +<br />

+ · · · + P (B|An)P (An)<br />

36


„P (B) je kombinace pravděpodobností P (A1), . . . , P (An)<br />

s váhami danými podmíněnými pravděpodobnostmi<br />

3.11. Příklad. V urně č.1 je 50 černých a 60 bílých kuliček.<br />

V urně č.2 je 60 černých a 50 bílých kuliček. Hodíme si<br />

hrací kostkou. Padne-li šestka vybereme urnu č. 1. V opačném<br />

případě urnu č.2. Z vybrané urny vybereme náhodně<br />

kuličku. Jaká je pravděpodobnost, že je bílá?<br />

Řešení:<br />

50 • 60◦ 60 • 50◦ (1)<br />

A1...padne šestka A2...nepadne šestka<br />

P (A1) = 1/6 P (A2) = 5/6<br />

B ... vytažená kulička je bílá<br />

P (B|A1) = 60<br />

110<br />

P (B|A2) = 50<br />

110 .<br />

p = 60 1 50 5 1 25 31<br />

· + · = + =<br />

110 6 110 6 11 66 66 =<br />

= 0, 4697.<br />

37


Bayesův vzorec<br />

Bayes (1761) ... stejné apriorní pravděpodobnosti<br />

Laplace (1774) ... obecný případ<br />

věta o úplné pravděpodobnosti:<br />

P (Ai), P (B|Ai) → P (B)<br />

nyní určíme P (Ai|B):<br />

3.12. Věta. Bayesův vzorec<br />

Je-li A1, . . . , An úplný systém jevů v pravděpodobnostním<br />

prostoru (Ω, A, P ) a B ∈ A s P (B) > 0 pak<br />

P (Aj|B) =<br />

pro všechna j = 1, 2, . . . , n.<br />

Důkaz:<br />

P (B|Aj)P (Aj)<br />

n<br />

i=1 P (B|Ai)P (Ai)<br />

P (Aj|B) = P (Aj ∩ B)<br />

P (B)<br />

=<br />

P (B|Aj)P (Aj)<br />

n<br />

i=1 P (B|Ai)P (Ai)<br />

—————————————————————–<br />

vstup:<br />

P (A1), P (A2), . . . P (An) ... apriorní pravděpodobnosti<br />

P (B|A1), P (B|A2), . . . P (B|An) ... podmíněné pravděpodobnosti<br />

B ... přináší novou informaci o stavu systému<br />

výstup: P (A1|B), P (A2|B), . . . P (An|B) —— upřesněná<br />

informace<br />

38


3.13. Příklad. Máme dvě krabice s bílými a černými kuličkami.<br />

V krabici č. 1 je jedna bílá a devět černých kuliček.<br />

V krabici č.2 je jedna černá a devět bílých kuliček.<br />

1 ◦ 9• č.1<br />

1 • 9◦ č.2<br />

Za plentou byla vylosována jedna z krabic. Náhodně jsme<br />

z ní vytáhli jednu kuličku. Byla bíla. Jaká je pravděpodobnost,<br />

že máme před sebou krabici č.1. ?<br />

A1 . . . první krabice P (A1) = 1<br />

2<br />

A2 . . . druhá krabice P (A2) = 1<br />

2<br />

B . . . tažena bílá kulička P (B|A1) = 1<br />

10<br />

P (B|A2) = 9<br />

10 .<br />

P (A1|B) =<br />

P (B|A1)P (A1)<br />

P (B|A1)P (A1) + P (B|A2)P (A2)<br />

=<br />

1<br />

10<br />

1 1<br />

10 · 2<br />

· 1<br />

2<br />

39<br />

+ 9<br />

10<br />

· 1<br />

2<br />

=<br />

1 1<br />

10 · 2<br />

1<br />

2<br />

= 1<br />

10 .


3.14. Příklad. Diagnóza nemoci<br />

Senzitivita testu: 0,95 (tj. má-li osoba AIDS je test pozitivní<br />

v 95% případů)<br />

specificita testu: 0,95 (tj. nemá-li osoba AIDS je test negativní<br />

v 95% případů)<br />

prevalence nemoci: 0,005 (tj. 0,5% populace je nakaženo)<br />

Jaká je pravděpodobnost, že osoba s pozitivním testem je<br />

nakažena virem HIV?<br />

(Naivní odpověď 0,95 je úplně mimo.)<br />

AIDS NE-AIDS<br />

0,005 0,995<br />

+, - .... výsledky testu<br />

P (+|AIDS) = 0, 95 P (+|NEAIDS) = 0, 05<br />

P (−|AIDS) = 0, 05 P (−|NEAIDS) = 0, 95<br />

P (AIDS|+) =<br />

P (+|AIDS)P (AIDS)<br />

=<br />

P (+|AIDS)P (AIDS) + P (+|NEAIDS)P (NEAIDS)<br />

0, 95 · 0, 005<br />

=<br />

= 0, 087 .<br />

0, 95 · 0, 005 + 0, 05 · 0, 995<br />

apriorní pravděpodobnosti → aposteriorní pravděpodobnosti<br />

(0, 005, 0, 995) → (0, 087, 0, 913) .<br />

40


Test opakujeme znovu. Testovaná osoba je opět pozitivní.<br />

Jaká je nyní pravděpodobnost že má AIDS ?<br />

Opakujeme postup s<br />

P (AIDS) = 0, 087 P (NEAIDS) = 0, 913 .<br />

numerické výsledky:<br />

i ... počet pozitivních testů,<br />

Pi ... pravděpodobnost, že daná osoba má AIDS.<br />

i 0 1 2 3 4 5<br />

Pi 0,005 0,087 0,645 0,972 0,998 0,9992<br />

41


4 Náhodná veličina<br />

• Zajímá nás pouze sledovaná numerická veličina, nikoliv<br />

celý pravděpodobnostní prostor: počet zákazníků, cena akcie,<br />

hodnota měření napětí, ...<br />

• Podstatné je stanovit pravděpodobnost, že náhodná veličina<br />

má hodnoty v daném rozmezí.<br />

——————————————————–<br />

Značení:<br />

I ... interval na reálné ose, zahrnujeme i jednobodové množiny.<br />

X : Ω → R ... funkce definovaná na množině Ω.<br />

[X ∈ I] = {ω ∈ Ω | X(ω) ∈ I} .<br />

4.1. Definice. Nechť (Ω, A, P ) je pravděpodobnostní prostor.<br />

Funkce X definovaná na Ω se nazývá náhodná veličina<br />

jestliže<br />

[X ∈ I] ∈ A<br />

pro všechny intervaly I ⊂ R.<br />

42


Všechny funkce na konečném nebo diskrétním pravděpodobnostním<br />

prostoru jsou náhodné veličiny.<br />

Náhodné veličiny popisujeme kvantitativně pomocí jejich<br />

distribučních funkcí:<br />

P [X ≤ x] = P ({ω | X(ω) ≤ x}) .<br />

4.2. Definice. Předpokládejme, že X je náhodná veličina<br />

na pravděpodobnostním prostoru (Ω, A, P ).<br />

Distribuční funkce, FX, náhodné veličiny X je funkce<br />

FX(x) = P [X ≤ x], x ∈ R .<br />

43


4.3. Příklad. X ... počet ok při hodu kostkou<br />

X nabývá šesti hodnot, 1,2,3,4,5,6; distribuční funkce je<br />

po částech spojitá funkce.<br />

4.4. Příklad. X ... poloha ručičky hodinek při náhodném<br />

zastavení:<br />

⎧<br />

⎪⎨<br />

x<br />

2 π x ∈< 0, 2π ><br />

F (x) = 0<br />

⎪⎩<br />

1<br />

x ≤ 0<br />

x ≥ 2π .<br />

4.5. Příklad. Vlak projíždí přejezdem jedenkrát za hodinu,<br />

Závory jsou staženy na dvanáct minut. Náhodná veličina<br />

X je doba čekání.<br />

P [X = 0] =<br />

60 − 12<br />

60<br />

Pro x ∈ (0, 12 > máme:<br />

Tedy<br />

48<br />

= = 0, 8 .<br />

60<br />

P [X ≤ x] = P [X = 0] + P [0 < X ≤ x] = 0, 8 + x<br />

60 .<br />

⎧<br />

0 x < 0<br />

⎪⎨<br />

0, 8 x = 0<br />

FX(x) =<br />

⎪⎩<br />

0, 8 + x<br />

60 x ∈ (0, 12 ><br />

1 x ≥ 12<br />

44


4.6. Věta. Distribuční funkce FX náhodné veličiny X<br />

splňuje následující podmínky:<br />

(i) 0 ≤ FX ≤ 1<br />

(ii) FX je neklesající<br />

(iii) FX je zprava spojitá<br />

(iv) limx→−∞ FX(x) = 0, limx→∞ FX(x) = 1 .<br />

Dukaz: (ii) Je-li x ≤ y, pak [X ≤ x] ⊂ [X ≤ y], a tedy<br />

FX(x) ≤ FX(y) .<br />

(iii) Volme (δn) klesající posloupnost kladných čísel s nulovou<br />

limitou a a ∈ R. Uvažujme množiny<br />

Platí<br />

An = [X ≤ a + δn] .<br />

∞<br />

An = [X ≤ a] .<br />

n=1<br />

Dle spojitosti pravděpodobnosti Věta 2.16 platí<br />

P [X ≤ a] = lim<br />

n→∞ P (An) .<br />

Jinými slovy<br />

FX(a) = lim<br />

n→∞ FX(a + δn) ,<br />

a proto<br />

FX(a) = lim<br />

x→a+ FX(x) .<br />

45


(iv)<br />

An = [X ≤ −n] , n = 1, 2 . . .<br />

Pak An je klesající posloupnost množin s prázdným průnikem.<br />

Dle Věty 2.16 máme<br />

lim<br />

n→∞ FX(−n) = lim<br />

n→∞ P (An) = P (∅) = 0 .<br />

FX je neklesající, a proto musí mít v −∞ limitu nula.<br />

(Druhá limita podobně.)<br />

V distribuční funkci FX jsou všechny relevantní informace<br />

o náhodné veličině X:<br />

•<br />

•<br />

•<br />

•<br />

P [X > a] = 1 − P [X ≤ a] = 1 − FX(a) .<br />

P [X ∈ (a, b >] = P [(X ≤ b) ∧ (X ≤ a) c ] =<br />

Odtud<br />

= P [X ≤ b] − P [X ≤ a] = FX(b) − FX(a) .<br />

P [X < a] = lim<br />

n→∞ P<br />

<br />

X ≤ a − 1<br />

<br />

= lim<br />

n n→∞ FX<br />

<br />

a − 1<br />

<br />

= lim<br />

n x→a− FX(x) .<br />

P [X = a] + P [X < a] = P [X ≤ a] .<br />

P [X = a] = FX(a) − lim<br />

x→a− FX(x) .<br />

(Velikost případného skoku.)<br />

46


4.7. Věta. Ke každé zprava spojité, neklesající funkci<br />

F (x) na R, s limitami limx→−∞ F (x) = 0,<br />

limx→∞ F (x) = 1, existuje náhodná veličina X tak, že<br />

FX = F .<br />

Důkaz je mimo naše možnosti – teorie míry.<br />

distribuční funkce (náhodná rozdělení) = náhodné veličiny.<br />

Typy náhodných veličin:<br />

• diskrétní rozdělení<br />

• spojité rozdělení<br />

• smíšené rozdělení<br />

47


4.8. Definice. Náhodná veličina X se nazývá diskrétní,<br />

jestliže existuje konečná nebo nekonečná posloupnost (xn)<br />

taková, že<br />

<br />

P [X = xn] = 1 .<br />

n<br />

Daná tabulkou resp. pravděpodobnostní funkcí:<br />

x1 x2 x3 · · ·<br />

p1 p2 p3 · · ·<br />

P [X = xi] = pi , (xn)n . . . uzly<br />

4.9. Příklad. X ... počet ok při hodu hrací kostkou<br />

1 2 3 4 5 6<br />

1/6 1/6 1/6 1/6 1/6 1/6<br />

4.10. Příklad. X ... doba kdy poprvé padne líc při sérii<br />

hodů symetrickou mincí.<br />

1 2 3 · · ·<br />

· · ·<br />

1<br />

2<br />

1<br />

4<br />

1<br />

3<br />

P [X = n] = 1<br />

.<br />

2n ∞ 1<br />

= 1 .<br />

2n n=1<br />

48


4.11. Tvrzení. Má-li náhodná veličina X diskrétní rozdělení<br />

s pravděpodobnostní funkcí (xn, pn)n, pak pro<br />

M ⊂ R platí<br />

P [X ∈ M] =<br />

<br />

pn .<br />

{n | xn∈M}<br />

4.12. Příklad. Jaká je pravděpodobnost, že při házení<br />

symetrickou mincí padne líc poprvé po sudém počtu hodů<br />

?<br />

X z Příkladu 4.10.<br />

P [X = sudé] = 1 1 1<br />

+ +<br />

4 16 64<br />

49<br />

1<br />

+ · · · =<br />

4<br />

1<br />

1 − 1<br />

4<br />

= 1<br />

3 .


4.13. Definice. Náhodná veličina X se nazývá spojitá,<br />

jestliže existuje nezáporná funkce f taková, že<br />

FX(x) =<br />

x<br />

−∞<br />

f(t) dt .<br />

Funkce f se přitom nazývá hustotou náhodné veličiny X.<br />

• Funkce f je hustotou náhodné veličiny právě tehdy<br />

f(t) dt = 1.<br />

když je nezáporná a ∞<br />

−∞<br />

• Je-li x bod spojitosti hustoty f, pak f(x) = FX(x) ′ .<br />

Je-li f hustota náhodné veličiny X, pak<br />

P [a ≤ X ≤ b] =<br />

b<br />

a<br />

f(x) dx .<br />

Hustota dává preference hodnotám.<br />

50


4.14. Příklad. f(x) =<br />

(Rovnoměrné rozdělení)<br />

Pro x ∈< 0, 1 ><br />

x<br />

FX(x) = dt = x .<br />

0<br />

⎧<br />

⎪⎨ 0 x ≤ 0<br />

FX(x) = x<br />

⎪⎩<br />

1<br />

x ∈< 0, 1 ><br />

x ≥ 1<br />

4.15. Příklad. f(x) =<br />

<br />

1 x ∈< 0, 1 ><br />

0 jinak<br />

x+1<br />

2<br />

x ∈< −1, 1 ><br />

0 jinak<br />

Pro distribuční funkci F (x) na intervalu < −1, 1 > platí<br />

FX(x) =<br />

x<br />

−1<br />

t + 1<br />

2<br />

2 t<br />

dt =<br />

4<br />

= x2<br />

4<br />

x t<br />

+ =<br />

2 −1<br />

x 1 (x + 1)2<br />

+ + = .<br />

2 4 4<br />

Pravděpodobnost roste s kvadratickou rychlostí. Pro distribuční<br />

funkci máme<br />

⎧<br />

⎪⎨ 0 x < −1<br />

(x+1) FX(x) =<br />

⎪⎩<br />

2<br />

4 x ∈< −1, 1 ><br />

1 x ≥ 1<br />

51


⎧<br />

⎪⎨ x + 1 x ∈< −1, 0 ><br />

4.16. Příklad.<br />

Pro x ∈< −1, 0 ><br />

f(x) = 1 − x<br />

⎪⎩<br />

0<br />

x ∈< 0, 1 ><br />

jinak<br />

FX(x) =<br />

x<br />

−1<br />

Pro x ∈< 0, 1 ><br />

FX(x) = 1<br />

2 +<br />

2 t<br />

(t + 1) dt =<br />

2<br />

x<br />

4.17. Příklad. (Semicircular law)<br />

f(x) =<br />

0<br />

x + t =<br />

−1<br />

x2 1<br />

+ x +<br />

2 2 .<br />

(1 − t) dt = 1<br />

2 +<br />

<br />

t − t2<br />

x = −<br />

2 0<br />

x2 1<br />

+ x +<br />

2 2 .<br />

√<br />

1<br />

2π 4 − x2 x ∈< −2, 2 ><br />

0 jinak<br />

4 1<br />

− x2 dx =<br />

2 (x4 − x2 + 4 arcsin x<br />

) + c .<br />

2<br />

Pro x ∈< −2, 2 > tedy máme:<br />

FX(x) = 1<br />

4π x4 − x2 + 1 x 1<br />

arcsin +<br />

π 2 2 .<br />

52


4.18. Příklad. f(x) = 1<br />

2 e−|x| .<br />

Pro x < 0<br />

Pro x ≥ 0<br />

FX(x) = 1<br />

2<br />

x<br />

−∞<br />

FX(x) = 1 1<br />

+<br />

2 2<br />

e t dt = ex<br />

2 .<br />

x<br />

0<br />

e −t dt = 1 1<br />

−<br />

2 2 e−x + 1 1<br />

= 1 −<br />

2 2 e−x .<br />

53


4.19. Příklad. Střílíme na terč o poloměru r. Výhra je<br />

dána vzdáleností zásahu d od středu terče vzorcem<br />

X = 10(r − d) .<br />

Nalezněte hustotu veličiny X.<br />

Řešení:<br />

Pro 0 ≤ x ≤ 10r<br />

<br />

P [X ≤ x] = P [10r − 10d ≤ x] = P d ≥ r − x<br />

<br />

= 1−P d ≤ r− x<br />

<br />

= 1−<br />

10<br />

x π(r − 10 )2<br />

π r2 = 1−<br />

<br />

=<br />

10<br />

x (r − 10 )2<br />

r2 .<br />

Hustota pro x ∈ (0, 10r >:<br />

f(x) = F ′ x −2(r − 10<br />

X(x) = )<br />

r2 · −1 1<br />

=<br />

10 5r2 <br />

r − x<br />

<br />

.<br />

10<br />

Hustota je nulová mimo interval < 0, 10r >.<br />

54


Důležité je reprezentovat náhodnou veličinu číselnými charakteristikami.<br />

Jednou z nich je střední hodnota.<br />

Motivace: Ve škole je N žáků z toho<br />

n1 má prospěch x1 = 1<br />

n2 má prospěch x2 = 2<br />

n3 má prospěch x3 = 3<br />

n4 má prospěch x3 = 4<br />

n5 má prospěch x5 = 5<br />

pi = ni<br />

N<br />

... relativní četnost.<br />

Průměrný prospěch =<br />

= n1x1 + n2x2 + n3x3 + n4x4 + n5x5<br />

=<br />

N<br />

= n1<br />

N x1 + n2<br />

N x2 + n3<br />

N x3 + n4<br />

N x4 + n5<br />

N x5 =<br />

= x1p1 + x2p2 + x3p3 + x4p4 + x5p5 .<br />

55


4.20. Definice. Nechť X je diskrétní náhodná veličina,<br />

která nabývá hodnot x1, x2, . . . s pravděpodobnostmi<br />

P [X = xi] = pi,<br />

<br />

pi = 1 .<br />

Předpokládejme, že<br />

<br />

|xi| pi < ∞ .<br />

i<br />

Střední hodnota, EX, veličiny X je definovaná vztahem<br />

EX = <br />

i<br />

xi pi .<br />

4.21. Definice. Nechť X je náhodná veličina s hustotou<br />

f(x) taková, že<br />

∞<br />

−∞<br />

|x|f(x) dx < ∞ .<br />

Střední hodnota, EX, veličiny X je definována vztahem:<br />

EX =<br />

∞<br />

−∞<br />

x f(x) dx .<br />

i<br />

56


4.22. Příklad. Konstantní náhodná veličina<br />

P [X = c] = 1<br />

EX = c · 1 = c .<br />

4.23. Příklad. Počet ok při hodu hrací kostkou<br />

EX = 1<br />

(1 + 2 + 3 + 4 + 5 + 6) = 3, 5 .<br />

6<br />

4.24. Příklad. Alternativní rozdělení<br />

EX = 0 · (1 − p) + 1 · p = p .<br />

0 1<br />

1 − p p<br />

V tomto případě splývá střední hodnota s pravděpodobností<br />

p.<br />

57


4.25. Příklad. Házíme symetrickou mincí. X je počet<br />

hodů než padne první líc.<br />

P [X = n] = 1<br />

, n = 1, 2, . . .<br />

2n EX =<br />

∞<br />

n=1<br />

n<br />

.<br />

2n Při výpočtu si pomůžeme teorií mocninných řad.<br />

∞<br />

n=0<br />

x n = 1<br />

, pro |x| < 1 .<br />

1 − x<br />

Derivace člen po členu:<br />

∞<br />

n x n−1 =<br />

n=1<br />

Pronásobením x<br />

∞<br />

n x n x<br />

=<br />

(1 − x) 2<br />

n=1<br />

Dosazením x = 1<br />

2<br />

EX =<br />

∞<br />

n=1<br />

′<br />

1 1<br />

= .<br />

1 − x (1 − x) 2<br />

n 2<br />

= = 2 .<br />

2n 1<br />

58


Na každá náhodná veličina má definovánu střední hodnotu.<br />

Např. diskrétní veličina s pravděpodobnostní funkcí<br />

P [X = 2 n ] = 1<br />

, n = 1, 2 . . .<br />

2n nemá střední hodnotu neboť<br />

∞ ∞<br />

1 = ∞ .<br />

n=1<br />

2n =<br />

2n n=1<br />

4.26. Příklad. Hustota<br />

f(x) =<br />

x+1<br />

2<br />

EX =<br />

x ∈< −1, 1 ><br />

0 jinak<br />

1<br />

−1<br />

3 1<br />

x + 1 x x2<br />

x dx = + =<br />

2 6 4 −1<br />

1<br />

3 .<br />

59


4.27. Příklad. Semicircular law<br />

EX = 1<br />

2π<br />

2<br />

−2<br />

x 1 − x 2 dx = 0 .<br />

4.28. Věta. Jsou-li X1 a X2 náhodné veličiny na pravděpodobnostním<br />

prostoru (Ω, A, P ), pak<br />

(i) E(X1 + X2) = EX1 + EX2,<br />

(ii) E(αX1) = αE(X1) , α ∈ R .<br />

(iii) E(X1) ≥ 0 je-li X1 ≥ 0.<br />

60


Podrobnější popis rozložení hodnot kolem střední hodnoty<br />

poskytuje rozptyl<br />

4.29. Definice. Rozptyl (variance) náhodné veličiny<br />

X, pro kterou existuje EX a EX 2 je definován<br />

varX = E[(X − EX) 2 ] .<br />

Značení: var(X), D(X),<br />

Směrodatná odchylka: var(X).<br />

E[(X − EX) 2 ] = E[X 2 − 2 X · (EX) + (EX) 2 ] =<br />

Způsob výpočtu:<br />

EX 2 = <br />

EX 2 =<br />

i<br />

∞<br />

<br />

−∞<br />

= E(X 2 ) − (EX) 2 .<br />

x 2 i pi . . . diskrétní veličina<br />

x 2 f(x) dx . . . spojitá veličina<br />

61


4.30. Příklad. Alternativní rozdělení X<br />

0 1<br />

1 − p p<br />

X 2 :<br />

0 1<br />

1 − p p<br />

var(X) = EX 2 − (EX) 2 = p − p 2 = p(1 − p) .<br />

var(X) ≤ 1<br />

4<br />

Nejvyšší možná hodnota rozptylu je pro p = 1<br />

2<br />

62<br />

a to 1<br />

4 .


4.31. Definice. Nechť FX(x) je distribuční funkce náhodné<br />

veličiny X. Předpokládejme, že pro každé α ∈ (0, 1)<br />

existuje právě jedno β tak, že F (β) = α.<br />

α-kvantil náhodné veličiny X je číslo, pro které platí<br />

FX(xα) = α .<br />

α = P [X ≤ xα] .<br />

Je-li FX prostá, pak xα = F −1<br />

X (α) .<br />

se v tomto případě nazývá kvantilová funkce.<br />

F −1<br />

X<br />

Významné kvantily:<br />

x0,5 . . . medián<br />

x0,75 . . . horní kvartil<br />

x0,25 . . . dolní kvartil<br />

x0,9 . . . horní decil<br />

x0,1 . . . dolní decil<br />

x0,99 . . . horní percentil<br />

Statistické tabulky: Průměrný čistý plat v ČR na osobu v<br />

domácnosti v roce 2003 byl 8175 KČ.<br />

Dolní decil x0,1=4524 KČ.<br />

63


4.32. Příklad. X je spojité rozdělení s hustotou<br />

f(x) = x+1<br />

2 , x ∈< −1, 1 > a nula jinak.<br />

Viz Příklad 4.15.<br />

F (x) = 1<br />

4 (x + 1)2 , x ∈< −1, 1 > .<br />

α ∈ (0, 1)<br />

F (x) = 1<br />

4 (x + 1)2 = α<br />

|x + 1| = √ 4α<br />

Např. medián<br />

xα = 2 √ α − 1<br />

x0,5 = 2 1/2 − 1 .<br />

64


4.33. Příklad. Doba rozpadu radioaktivního atomu je<br />

náhodná veličina s hustotou<br />

<br />

λ e<br />

f(x) =<br />

−λx x ≥ 0<br />

0 x < 0 ,<br />

kde λ > 0. Určete poločas rozpadu.<br />

Řešení:<br />

Poločas rozpadu je medián. Pro distribuční funkci máme<br />

F (x) =<br />

x<br />

0<br />

1 − e −λx = 0, 5<br />

λe −λt dt = [−e −λt ] x 0 = 1 − e −λx .<br />

e −λx = 0, 5<br />

−λx = − ln 2<br />

x =<br />

ln 2<br />

λ<br />

Poločas rozpadu je medián<br />

x0,5 =<br />

ln 2<br />

λ .<br />

65


4.34. Tvrzení. Platí-li pro náhodné veličiny X a Y vztah<br />

pak<br />

Y = aX + b , a, b ∈ R, a > 0 ,<br />

yα = axα + b<br />

pro všechna α ∈ (0, 1).<br />

Důkaz:<br />

α = P [X ≤ xα] = P [aX + b ≤ axα + b] = P [Y ≤ axα + b]<br />

.<br />

<br />

66<br />


5 Důležitá rozdělení<br />

Diskrétní rozdělení<br />

Alternativní rozdělení A(p), 0 < p < 1.<br />

0 1<br />

1 − p p<br />

EX = p<br />

varX = p(1 − p) .<br />

Binomické rozdělení Bi(n, p), n ∈ N, 0 < p < 1.<br />

0 1 2 . . . n<br />

p0 p1 p2 . . . pn<br />

P [X = k] = pk =<br />

<br />

n<br />

p<br />

k<br />

k (1 − p) n−k<br />

67<br />

k = 0, 1, . . . , n .


X = počet zdarů v sérii n pokusů<br />

Bernoulliova schématu.<br />

• počet líců v sérii n hodů<br />

• počet osob volící daný politický subjekt z n<br />

dotázaných<br />

• počet osob sledujících daný TV pořad z n<br />

sledovaných<br />

• počet částic v náhodně zvolené příhrádce z n<br />

příhrádek<br />

• počet vadných sučástek z n náhodně vybraných<br />

součástek<br />

<br />

1 nastal-li zdar v i − tém pokusu<br />

Xi =<br />

0 jinak<br />

Xi má rozdělení A(p).<br />

X = X1 + X2 + · · · + Xn .<br />

68


5.1. Příklad. S.Pepys (1693), náruživý hráč v<br />

kostky. Co je pravděodobnější, že šesti kostkami<br />

hodíme alespoň jednu šestku (jev A), nebo že dvanácti<br />

kostkami hodíme alespoň dvě šestky (jev B)?<br />

Vyřešil Newton.<br />

počet šestek při hodu šesti kostkami ... Bi(6, 1/6).<br />

(p = 1<br />

6 )<br />

P (A) =<br />

6<br />

k=1<br />

<br />

6<br />

p<br />

k<br />

k (1 − p) n−k =<br />

<br />

6<br />

1 − p<br />

0<br />

0 (1 − p) 6 = 0, 6651 .<br />

počet šestek při hodu dvanácti kostkami ... Bi(12, 1/6).<br />

(p = 1<br />

6 )<br />

12<br />

P (B) =<br />

k=2<br />

<br />

12<br />

1−<br />

0<br />

<br />

12<br />

p<br />

6<br />

k (1 − p) n−k =<br />

<br />

p 0 (1−p) 12 −<br />

69<br />

12<br />

1<br />

<br />

p(1−p) 11 = 0, 6189 .


Domácí cvičení: Pravděpodovbnost, že 18 kostkami<br />

hodíme alespoň 3 šestky je 0,5973.<br />

5.2. Příklad. Náhodná procházka<br />

Částice se pohybuje po ose x. Začíná v bodě 0.<br />

V daném stádiu se rozhodne s pravděpodobností<br />

1/2 jít doprava a s pravděpodobností 1/2 doleva.<br />

Sn je poloha částice v čase n. Jaké je rozdělení Sn?<br />

Bernoulliovo schéma, n pokusů; p = 1<br />

2 .<br />

1.. jdeme doprava, -1... jdeme doleva.<br />

Je-li k jedniček a n − k -jedniček, pak je poloha<br />

k − (n − k) = 2k − n k = 0, . . . n .<br />

<br />

n<br />

P [Sn = 2k − n] = 2<br />

k<br />

−n .<br />

(Dá se ukázat, že částice s pravděpodobnosí jedna<br />

navštíví každý bod. Totéž pro dvě dimenze, ne<br />

však pro tři.)<br />

70


5.3. Příklad.<br />

Maxwellovo-Boltzmanovo schéma<br />

Máme n částic a r příhrádek. Každá částice si<br />

vybírá nějakou příhrádku. Všechny možnosti mají<br />

stejnou šanci. Jaké je rozložení počtu částic v pevně<br />

zvolené příhrádce?<br />

Bernoulliovo schéma: vybraná částice si zvolí danou<br />

přihrádku, celkem n pokusů (máme n částic).<br />

Šance zdaru je 1<br />

r .<br />

Náhodná veličina má rozdělení Bi(n, 1<br />

r ).<br />

Konkrétní situace:<br />

5.4. Příklad. Máme n = 500 osob a r = 365<br />

příhrádek (narozeniny). Počet osob mající narozeniny<br />

dne 18.7. (jako přednášející) se řídí Bi(500, 1<br />

365 ).<br />

Tabulka numerických hodnot:<br />

počet 0 1 2 3 4 5 6<br />

pravděpodobnost 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023<br />

71


Pravděpodobnost, že tři osoby mají narozeniny 18.7.<br />

je 0,1089 .<br />

další modely: osoby obsazující vagóny, výsledky<br />

hodu kostkou padající do 6 možností, . . .<br />

72


Charakteristiky Bi(n, k).<br />

X = X1 + X2 + · · · + Xn<br />

Xi . . . A(p), EXi = p.<br />

EX = EX1 + EX2 + · · · + EXn = np .<br />

E(X 2 ) = E(X1+X2+· · ·+Xn) 2 = EX 2 1+EX 2 2 · · ·+EX 2 n+<br />

+ 2E(X1X2) + 2E(X1X3) + · · · .<br />

Je-li i = j máme pro Xi Xj rozdělení<br />

0 1<br />

1 − p 2 p 2<br />

Tedy E(XiXj) = p2 , což znamená, že<br />

EX 2 <br />

n<br />

= np + 2 · p<br />

2<br />

2 .<br />

Konečně,<br />

var(X) = EX 2 −(EX) 2 = np+2·<br />

np+2<br />

<br />

n<br />

2<br />

<br />

p 2 −n 2 p 2 =<br />

n(n − 1)<br />

p<br />

2<br />

2 −n 2 p 2 = np−np 2 = np(1−p) .<br />

73


Má-li X rozdělení Bi(n, p), pak<br />

EX = np varX = np(1 − p)<br />

Průměrný počet šestek při sérii n hodů hrací kostkou<br />

je n<br />

6 .<br />

Průměrný počet částic v jedné přihrádce u 500<br />

částic náhodně rozptýlených v 365 příhrádkách je<br />

= 1, 369863014.<br />

500<br />

365<br />

. . .<br />

74


Co se děje s binomickým rozdělením, jestliže se<br />

nemění střední hodnota, ale počet pokusů jde do<br />

nekonečna?<br />

5.5. Věta. Poissonova věta<br />

Předpokládejme, že (Xn) ∞ n=1 je posloupnost náhodných<br />

veličin majících rozdělení Bi(n, λ),<br />

kde n<br />

λ > 0. (Tj. EXn = λ pro všechna n.) Pak<br />

Důkaz:<br />

lim<br />

n→∞ P [Xn = k] = λk<br />

k! e−λ .<br />

pn = λ<br />

n .<br />

P [Xn = k] =<br />

= 1<br />

k!<br />

lim<br />

n→∞<br />

<br />

n<br />

p<br />

k<br />

k n(1 − pn) n−k =<br />

npn · (n − 1)pn · · · (n − k + 1)pn<br />

(1 − pn) k<br />

npn<br />

1 − pn<br />

(n − 1)pn<br />

lim<br />

n→∞ 1 − pn<br />

= lim<br />

n→∞<br />

λ<br />

1 − λ<br />

n<br />

= λ .<br />

λ −<br />

= lim<br />

n→∞<br />

λ<br />

n<br />

1 − λ<br />

n<br />

75<br />

= λ .<br />

<br />

1− λ<br />

n .<br />

n


Tedy<br />

lim<br />

n→∞ P [Xn = k] = λk<br />

<br />

lim 1 −<br />

k! n→∞<br />

λ<br />

n =<br />

n<br />

λk<br />

k! e−λ .<br />

Aproximujeme pro n velké a pn malé<br />

P [X = k] ∼ λk<br />

k! e−λ .<br />

5.6. Příklad. Stroj produkuje 1% zmetků. Jaká<br />

je pravděpodobnost, že z 200 náhodně vybraných<br />

výrobků neni žádný zmetek?<br />

X ∼ Bi(200, 1<br />

100 )<br />

P [X = 0] = 0, 99 200 = 0, 1340 .<br />

Aproximace pomocí Poissonovy věty:<br />

λ = 200 · 1<br />

100<br />

= 2<br />

P [X = 0] . = e −2 = 0, 1353.<br />

76


n částic se náhodně rozděluje do r příhrádek, při-<br />

čemž n, r → ∞ při konstantním poměru λ = n<br />

r .<br />

Počet částic v pevně zvolené příhrádce se asymtoticky<br />

řídí Poissonovým zákonem s parametrem λ.<br />

5.7. Příklad. X ∼ Bi(500, 365) ... viz Příklad 5.4.<br />

počet 0 1 2 3 4 5 6<br />

binomický zákon 0,2537 0,3484 0,2388 0,1089 0,0372 0,0101 0,0023<br />

Poissonův zákon 0,2541 0,3481 0,2385 0,1089 0,0372 0,0102 0,0023<br />

77


Poissonovo rozdělení<br />

Náhodná veličina X, která nabývá hodnot 0, 1, . . .<br />

s pravděpodobnostmi<br />

P [Xn = n] = λn<br />

n! e−λ , n = 0, 1, . . .<br />

P o(λ)<br />

P [X = 0] = e −λ<br />

P [X > 0] = 1 − e −λ .<br />

5.8. Příklad. Lahve se vyrábějí ze skloviny obsahující<br />

kazy, keré jsou rozděly nepravidelně tak, že<br />

v každém metrickém centu skloviny je průměrně<br />

x kazů. Láhev váží 1 kg a je vadná obsahuje-li jeden<br />

či více kazů. Stanovte procento vadných lahví.<br />

Řešení Z M metrických centů se vyrobí 100M<br />

lahví, které budou obsahovat přibližně xM kazů.<br />

Pro počet kazů v jedné lahvi tedy máme rozdělení<br />

Bi(xM,<br />

1<br />

) .<br />

100M<br />

EX = λ = xM 1<br />

100M<br />

78<br />

= x<br />

100 .


Pro M → ∞ máme rozdělení<br />

<br />

x<br />

P o<br />

100<br />

Pravděpodobnost, že láhev bude bez kazu je<br />

x<br />

−<br />

1 − e 100 .<br />

Je-li například x = 30, pak procento vadných lahví<br />

bude 1 − e −0,3 = 0, 2592.<br />

Při velkém počtu kazů je výhodnější vyrábět menší<br />

lahve. Je-li např. váha lahve 0, 25kg je procento<br />

zmetků 7, 22%.<br />

79


Charakteristiky P (λ):<br />

EX =<br />

EX 2 =<br />

Tedy<br />

∞<br />

n=0<br />

= e −λ<br />

∞<br />

n=0<br />

n λn<br />

n! e−λ <br />

∞<br />

λ<br />

= λ<br />

n=1<br />

n−1 <br />

e<br />

(n − 1)!<br />

−λ =<br />

= λe λ e −λ = λ .<br />

2 λn<br />

n<br />

∞<br />

n=2<br />

n! e−λ =<br />

∞<br />

n=2<br />

λ n<br />

(n − 2)! +λ = e−λ λ 2<br />

n(n−1) λn<br />

n! e−λ +<br />

∞<br />

n=2<br />

= e −λ λ 2 e λ + λ = λ 2 + λ .<br />

=λ<br />

<br />

∞<br />

n=0<br />

n λn<br />

n! e−λ =<br />

λn−2 +λ =<br />

(n − 2)!<br />

var(X) = EX 2 − (EX) 2 = λ 2 + λ − λ 2 = λ .<br />

E(X) = λ<br />

var(X) = λ<br />

80


Příklady Poissonova rozdělení: (homogenní chaos<br />

v prostoru nebo čase)<br />

• počet volání na telofonní ústřednu za jednotku<br />

času<br />

• počet atomů radioaktivní látky rozpadlých za<br />

jednotku času<br />

• počet hvězd v daném objemu galaxie<br />

• počet létavic meteorického roje za jednotku<br />

času<br />

• počet střel zasahující danou oblast<br />

• počet defektů kola (bad luck) za jednotku<br />

času<br />

• počet zákazníků za jednotku času<br />

81


Geometrické rozdělení Ge(p), 0 < p < 1.<br />

X je počet zdarů v Bernoulliově schématu před<br />

prvním nezdarem.<br />

P [X = 0] = 1 − p .<br />

P [X = 1] = (1 − p)p .<br />

P [X = 2] = (1 − p)p 2 .<br />

...................................<br />

P [X = k] = (1 − p)p k<br />

82<br />

k = 0, 1, . . . .


5.9. Příklad. Dva hráči se střídají a házejí hrací<br />

kostkou. Vyhrává ten komu padne šestka. Jaká je<br />

pravděpodobnost výhry u jednotlivých hráčů?<br />

X . . . geometrické rozdělení s p = 5<br />

6 .<br />

A ... vyhrává hráč, který začíná<br />

P (A) = P [X = sudé] =<br />

= 1<br />

1 + 5<br />

6<br />

∞<br />

(1−p)p 2k ∞<br />

= (1−p) p 2k =<br />

k=0<br />

1 1<br />

= (1 − p) =<br />

1 − p2 1 + p =<br />

= 6<br />

= 0, 54545455 .<br />

11<br />

83<br />

k=0


Střední hodnota geometrického rozdělení:<br />

EX =<br />

∞<br />

n (1 − p) p n ∞<br />

= (1 − p) n p n =<br />

n=0<br />

= (1−p) p d<br />

dp<br />

∞ <br />

n=0<br />

n=0<br />

p n<br />

<br />

= (1−p)p d<br />

<br />

1<br />

=<br />

dp 1 − p<br />

1 p<br />

= (1 − p)p =<br />

(1 − p) 2 1 − p .<br />

5.10. Příklad. Žák umí 90% látky. Kolik přežije<br />

průměrně otázek?<br />

Ge(p), p = 0, 9<br />

EX =<br />

0, 9<br />

1 − 0, 9<br />

= 9 .<br />

84


Rozptyl<br />

d 2<br />

dp 2<br />

∞<br />

p n =<br />

n=0<br />

E(X 2 ) − EX =<br />

2 d2<br />

= (1−p)p<br />

dp2 ∞<br />

n(n − 1)p n−2 .<br />

n=0<br />

∞<br />

n(n − 1)(1 − p)p n =<br />

n=0<br />

∞<br />

n=0<br />

p n = (1−p)p 2<br />

′′<br />

1<br />

=<br />

1 − p<br />

= (1 − p)p 2 2 2p2<br />

= .<br />

(1 − p) 3 (1 − p) 2<br />

E(X 2 )−(EX) 2 = 2p2<br />

p p2<br />

+ − =<br />

(1 − p) 2 1 − p (1 − p) 2<br />

p2 p<br />

+<br />

(1 − p) 2 1 − p = p2 + p(1 − p)<br />

(1 − p) 2<br />

85<br />

=<br />

=<br />

p<br />

.<br />

(1 − p) 2


EX =<br />

varX =<br />

p<br />

1 − p<br />

p<br />

.<br />

(1 − p) 2<br />

Rovnoměrné rozdělení na < a, b ><br />

R < a, b >.<br />

Hustota:<br />

f(x) =<br />

1<br />

b−a<br />

Distribuční funkce:<br />

x ∈< a, b ><br />

0 jinak<br />

⎧<br />

⎪⎨<br />

x−a<br />

b−a x ∈< a, b ><br />

F (x) = 0<br />

⎪⎩<br />

1<br />

x < a<br />

x > b<br />

86


EX = x 1<br />

2 b<br />

1 x<br />

dx = =<br />

b − a b − a 2<br />

a<br />

EX 2 = 1<br />

b<br />

b − a<br />

a<br />

= b2 − a 2<br />

2(b − a)<br />

x 2 dx = 1 b<br />

b − a<br />

3 − a3 3<br />

a<br />

= a + b<br />

2<br />

=<br />

= a2 + ab + b 2<br />

3<br />

var(X) = E(X 2 )−(EX) 2 = a2 + ab + b 2<br />

= a2 − 2ab + b 2<br />

12<br />

a + b<br />

EX =<br />

2<br />

varX = 1<br />

12 (b − a)2 .<br />

87<br />

−<br />

3<br />

a2 + 2ab + b2 4<br />

= 1<br />

12 (b − a)2 .<br />

.<br />

.<br />

=


Normální rozdělení (Gaussovo rozdělení)<br />

N(µ, σ 2 ).<br />

µ ∈ R, σ 2 > 0.<br />

hustota:<br />

f(x) = 1 (x−µ)2<br />

−<br />

√ e 2σ<br />

2πσ 2<br />

Vychází z Laplaceova integrálu:<br />

∞<br />

−∞<br />

e −x2<br />

dx = √ π .<br />

standardní, normované normální rozdělení: N(0, 1).<br />

značení:<br />

Φ(x) = 1<br />

√ 2π<br />

x<br />

−∞<br />

t2<br />

−<br />

e 2 dt<br />

počítá se numericky, tabelována.<br />

88


Souvislost mezi normálními rozděleními různých<br />

parametrů.<br />

• Má-li Y rozdělení N(0, 1) =⇒ X = µ+σ Y má<br />

rozdělení N(µ, σ 2 ).<br />

Odvození:<br />

FX(x) = P [X ≤ x] = P [µ + σ Y ≤ x] =<br />

<br />

x − µ x − µ<br />

= P Y ≤ = Φ<br />

σ<br />

σ<br />

d<br />

dx FX(x) = 1<br />

√ e<br />

2π<br />

x−µ<br />

(<br />

− σ )2<br />

2 · 1<br />

σ =<br />

= 1 (x−µ)2<br />

−<br />

√ e 2σ<br />

2πσ 2 .<br />

• Má-li X rozdělení N(µ, σ), pak Y = X−µ<br />

σ má<br />

rozdělení N(0, 1).<br />

89


5.11. Příklad. S jakou pravěpodobností má veličina<br />

X s rozdělením N(1, 4) hodnotu v intervalu<br />

< 3, 5 > ?<br />

<br />

5 − 1 3 − 1<br />

P [3 ≤ X ≤ 5] = Φ − Φ =<br />

2<br />

2<br />

= Φ(2)−Φ(1) = 0, 97250−0, 841345 = 0, 131155.<br />

5.12. Tvrzení. Vzhledem k tomu, že hustota standardního<br />

normálního rozdělení je sudá funkce, platí<br />

Φ(x) = 1 − Φ(−x) x ∈ R .<br />

90


5.13. Příklad. Spočtěte pravděpodobnost, že veličina<br />

X s rozdělením N(0, σ 2 ) má hodnotu v intervalu<br />

< −a, a >, kde a > 0.<br />

Řešení:<br />

P [−a ≤ X ≤ a] = P [− a X a<br />

≤ ≤ ] =<br />

σ σ σ<br />

a<br />

= Φ −Φ −<br />

σ<br />

a<br />

<br />

a<br />

a<br />

= Φ − 1−Φ =<br />

σ σ<br />

σ<br />

<br />

a<br />

2Φ − 1 .<br />

σ<br />

Střední hodnota a rozptyl normálního rozdělení:<br />

Pro Y s rozdělením N(0, 1) platí<br />

EY = 1<br />

√ 2π<br />

∞<br />

−∞<br />

x2<br />

−<br />

xe 2 dx = 0 .<br />

91


1 = 1<br />

√ 2π<br />

∞<br />

−∞<br />

x2<br />

−<br />

e 2 dx .<br />

Použijeme metodu per partes pro<br />

u ′ x2<br />

− = 1 v = e 2<br />

a dostaneme<br />

u = x v ′ x2<br />

− = −xe 2<br />

1 = 1<br />

<br />

√ xe<br />

2π<br />

Odtud plyne, že<br />

x2<br />

− 2<br />

∞<br />

−∞<br />

<br />

=0<br />

var(Y ) = E(Y 2 ) = 1 .<br />

+ 1<br />

√ 2π<br />

Obecně: X má rozdělení N(µ, σ 2 )<br />

a proto<br />

X = σY + µ ,<br />

EX = σEY + µ = µ .<br />

92<br />

∞<br />

−∞<br />

x 2 x2<br />

−<br />

e 2 dx .


Závěr:<br />

X 2 = σ 2 Y 2 + 2µσY + µ 2<br />

EX 2 = σ 2 + 0 + µ 2 .<br />

varX = E(X 2 ) − (EX) 2 = σ 2 + µ 2 − µ 2 = σ 2 .<br />

EX = µ<br />

var(X) = σ 2 .<br />

93


kvantilová funkce a kvantily<br />

uα ... α-kvantil N(0, 1).<br />

kvantilová funke je inverzní funkce Φ −1 .<br />

Některé numerické hodnoty:<br />

u0,5 = 0,<br />

u0,95 = 1, 644,<br />

u0,975 = 1, 95996<br />

u0,999 = 3, 09023<br />

Pro α → 1 jde uα → ∞.<br />

5.14. Tvrzení.<br />

(i) u1−α = −uα pro všechna α ∈ (0, 1).<br />

(ii) Pro α-kvantil xα rozdělení N(µ, σ 2 ) platí<br />

xα = µ + σ uα .<br />

94


5.15. Příklad. Určete interval < −a, a > tak,<br />

aby náhodná veličina Y s rozdělením N(0, 1) měla<br />

v tomto intervalu hodnotu s pravděpodobností 0,95.<br />

a = u0,975<br />

.<br />

= 1, 96 .<br />

Pravidlo 3σ<br />

Máme rozdělení X typu N(µ, σ 2 ). Určeme<br />

Řešení:<br />

P [|X − µ| ≤ 3σ] .<br />

<br />

|X − µ|<br />

P<br />

σ<br />

<br />

≤ 3 = Φ(3) − Φ(−3) =<br />

= 2Φ(3)−1 = 2·0, 99865−1 = 0, 99730 .<br />

Po třech σ zbývají asi tři promile případů.<br />

95


5.16. Příklad. Pro oděvní továrnu je neziskové<br />

vyrábět šaty pro velmi malé a velmi velké muže.<br />

Záměr je nevyrábět pro 7,5% největších a 7,5%<br />

nejmenších mužů. Ví se, že výška mužů (v palcích)<br />

má rozdělení N(69, 2, 8 2 ). Nalezněte největší<br />

a nejmenší výšku pro kterou vyrábět.<br />

Řešení<br />

u0,925 = 1, 43953 .<br />

x0,925 = 69 + 2, 8 · 1, 43953 = 73, 03068<br />

x0,075 = 69 − 2, 8 · 1, 43953 = 64, 96932<br />

96


5.17. Příklad. Výsledky přijímacích zkoušek se<br />

řídí normálním rozdělením s rozptylem 100. Je přijato<br />

30% uchazečů. Hranice pro přijetí je 85 bodů.<br />

Jaký je průměrný výsledek u zkoušky?<br />

Řešení:<br />

N(µ, σ 2 )<br />

x0,7 = µ + 10 · u0.7<br />

µ = 85 − 10 · u0,7 = 85 − 10 · 0, 52440 . = 79, 8 .<br />

5.18. Příklad. Máme rozdělení N(µ, 0, 5). Jak<br />

zvolit střední hodnotu, aby<br />

Řešení:<br />

P [X ≥ 2] = 0, 01 .<br />

<br />

X − µ<br />

P √ ≥<br />

0, 5<br />

2 − µ<br />

√ 0, 5 = u0,99<br />

µ = 2 − 0, 5 · u0,99<br />

<br />

2 − µ<br />

√ = 0, 01<br />

0, 5<br />

97<br />

.<br />

= 0, 355023643


Exponenciální rozdělení<br />

hustota:<br />

Exp(λ) λ > 0<br />

f(x) =<br />

distribuční funkce:<br />

x ≥ 0<br />

F (x) =<br />

funkce přežití:<br />

<br />

λ e −λx x ≥ 0<br />

0 x < 0 .<br />

x<br />

0<br />

−λ x<br />

P [X ≥ x] = e<br />

λ e −λx dx = 1 − e −λ x .<br />

Exponenciální rozdělení popisuje čas do první ”poruchy”<br />

u systému ”bez paměti”<br />

98


Odvození:<br />

Hledáme funkci přežití<br />

R(t) = P [X ≥ t]<br />

tak, aby byly splněny následující předpoklady:<br />

(i) R(0) = 1<br />

(ii) P [X ≥ t + h|X ≥ t] = P [X ≥ h] pro<br />

všechna x, h ≥ 0.<br />

(iii) R je diferencovatelná klesající funkce<br />

Z toho plyne:<br />

P [X ≥ t + h] = P [X ≥ t] · P [X ≥ h] .<br />

R(t + h) = R(t)R(h)<br />

R(t + h) − R(t)<br />

h<br />

= R(t)R(h) − R(t)<br />

=<br />

h<br />

R(h) − 1<br />

= R(t)<br />

h<br />

99


Limitním přechodem h → 0+ dostaneme<br />

R ′ (t) = R(t) · R ′ (0)<br />

R(0) = 1<br />

Diferenciální rovnice s počáteční podmínkou.<br />

Označme<br />

R ′ (0) = −λ (λ > 0).<br />

Řešení (jediné):<br />

R(t) = e −λt .<br />

R(t) tedy vede na exponenciální rozdělení.<br />

100


Střední hodnotu a rozptyl získáme integrací (per<br />

partes)<br />

E(X) = 1<br />

λ<br />

var(X) = 1<br />

λ 2<br />

λ ... ”intenzita poruch”<br />

Příklady exponenciálního rozdělení:<br />

• doba rozpadu atomu<br />

• doba do registrace zákazníka<br />

• doba do příletu létavice v meteorickém roji<br />

101


5.19. Příklad. Na přílet meteoritu se průměrně<br />

čaká deset minut. Jaká je pravděpodobnost, že budeme<br />

na ”padající hvězdu” čekat dvě minuty?<br />

Řešení:<br />

1<br />

= 10 λ = 0, 1<br />

λ<br />

F (2) = 1 − e −2·0,1 = 1 − e −0,2 . = 0, 18127 .<br />

102


6 Transformace náhodných<br />

veličin<br />

Nutnost přepočítat distrubuční funkci. Například<br />

máme měření rychlosti a chceme ho přepočítat na<br />

energii.<br />

Obecná úloha: X je náhodná veličina, h : R ↦→ R<br />

Y = h(X)<br />

• Diskrétní náhodná veličina se vždy zobrazí na<br />

diskrétní<br />

6.1. Příklad. Diskrétní rozdělení X s pravděpo-<br />

dobnostní funkcí -1 0 1<br />

0,3 0,2 0,5<br />

Y = X 2 ... 1 0 1<br />

0,3 0,2 0,5<br />

Y ...<br />

0 1<br />

0,2 0,8<br />

103


Obecně stanovíme transformaci pomocí distribuční<br />

funkce:<br />

Y = h(X)<br />

FY (y) = P [h(X) ≤ y]<br />

6.2. Příklad. Rychlost molekul plynu má rozdělení<br />

N(0, 1). Molekula má hmotnost m. Nalezněte<br />

distribuční funkci a hustotu energie částice.<br />

X ∼ N(0, 1)<br />

Y = 1<br />

2 mX2<br />

Nerovnice 1<br />

2 mX2 ≤ y má řešení pouze pro y ≥ 0.<br />

y ≥ 0<br />

FY (y) = P [ 1<br />

2 mX2 <br />

2<br />

≤ y] = P [X ∈< −<br />

m y,<br />

<br />

2<br />

y >] =<br />

m<br />

<br />

2<br />

= Φ<br />

m y<br />

<br />

2<br />

−Φ −<br />

m y<br />

<br />

2<br />

= 2 Φ<br />

m y<br />

<br />

−1 .<br />

104


Hustota je pro y > 0 derivací distribuční funkce:<br />

g(y) = 2 1<br />

√ e<br />

2π − 2 m y<br />

<br />

2<br />

2 ·<br />

m ·<br />

Pro y ≤ 0 je g(y) = 0 .<br />

1<br />

2 √ y =<br />

Důležitý je případ lineární transformace.<br />

a > 0<br />

a < 0<br />

Y = aX + b, a = 0<br />

<br />

FY (y) = P [aX + b ≤ y] = P X ≤<br />

<br />

FY (y) = P [aX + b ≤ y] = P X ≥<br />

105<br />

1 y<br />

−<br />

√ e m<br />

mπy<br />

<br />

y − b<br />

= FX<br />

a<br />

y − b<br />

a<br />

<br />

.<br />

<br />

y − b<br />

y − b<br />

= 1 − FX<br />

a<br />

a −<br />

<br />

.


Užitečné je aplikovat toto pravidlo na spojité rozdělení<br />

6.3. Tvrzení. Je-li X spojitá náhodná veličina s<br />

hustotou f(x), pak náhodná veličina<br />

Y = aX + b , a = 0<br />

je spojitá a má hustotu<br />

g(y) = 1<br />

|a| f<br />

<br />

y − b<br />

.<br />

a<br />

Důkaz:<br />

a > 0<br />

<br />

y − b<br />

FY (y) = F<br />

a<br />

Derivací podle y:<br />

a < 0<br />

g(y) = 1<br />

a f<br />

y − b<br />

a<br />

<br />

.<br />

<br />

y − b<br />

FY (y) = 1 − F<br />

a<br />

106


Derivací podle y:<br />

g(y) = − 1<br />

a f<br />

y − b<br />

a<br />

<br />

.<br />

6.4. Příklad. X má rovnoměrné rozdělení na intervalu<br />

< 0, 3 >. Určete hustotu<br />

Y = 2X + 1<br />

g(y) = 1<br />

2 f<br />

<br />

y − 1<br />

.<br />

2<br />

y − 1<br />

2<br />

g(y) =<br />

∈< 0, 3 > ⇐⇒ y ∈< 1, 7 > .<br />

<br />

1/6 y ∈< 1, 7 ><br />

0 jinak<br />

Y má rovnoměrné rozdělení na intervalu < 1, 7 >.<br />

107


6.5. Příklad. Y = −X, kde X má rozdělení<br />

N(0, 1).<br />

g(y) = 1 (−y)2<br />

− √ e 2 =<br />

2π 1 y2<br />

− √ e 2<br />

2π<br />

Y má také rozdělení N(0, 1).<br />

6.6. Příklad. X má rozdělení Exp(1). Určete<br />

rozdělení −X.<br />

g(y) = f(−y)<br />

<br />

e<br />

g(y) =<br />

y y ≤ 0<br />

0 y > 0 .<br />

108


Nelineární transformace náhodné veličiny<br />

Předpoklady: X má hustotu f(x) soustředěnou na<br />

intervalu I a h je rostoucí diferencovatelná funkce<br />

definovaná na I, jejíž obor hodnot je interval J.<br />

Y = h(X)<br />

Pro y /∈ J bude hustota nulová.<br />

Pro y ∈ J<br />

FY (y) =<br />

<br />

h −1 (y)<br />

−∞<br />

f(x) dx<br />

Substituce: t = h(x), x = h −1 (t), dt = h ′ (x) dx.<br />

FY (y) =<br />

y<br />

−∞<br />

f(h −1 (t))<br />

dt<br />

h ′ (h −1 (t))<br />

Podobně lze postupovat v případě, kdy h je klesající,<br />

nebo je možno použít −(−h).<br />

109


Závěr:<br />

g(y) = f(h−1 (y))<br />

|h ′ (h −1 (y))| .<br />

pro y ∈ J a nula jinak.<br />

6.7. Příklad. Logaritmicko-normální rozdělení<br />

Y = e X ,<br />

kde X má rozdělení N(µ, σ 2 ).<br />

h(x) = e x , h −1 (x) = ln x , J = h(R) = (0, ∞) .<br />

g(y) =<br />

pro y > 0; a nula jinak.<br />

f(ln y) 1 (ln y−µ)2<br />

−<br />

= √ e 2σ<br />

eln y<br />

2πσ 2<br />

1<br />

y ,<br />

110


K výpočtu střední hodnoty transformované veličiny<br />

nepotřebujeme znát rozdělení transformace:<br />

6.8. Věta. Předpokládejme, že X je náhodná veličina<br />

a Y = h(X). Pak<br />

(i) E(Y ) = <br />

h(xi)pi ,<br />

i∈I<br />

je-li X diskrétní náhodná veličina s pravděpodobnostní<br />

funkcí (xi, pi)i∈I.<br />

(ii) E(Y ) =<br />

Důkaz:<br />

∞<br />

−∞<br />

f(x)h(x) dx<br />

je-li X spojitá náhodná veličina s hustotou<br />

f(x).<br />

(i) h(Y ) má (včetně násobnosti) pravděpodobnostní<br />

funkci (h(xi), pi)i∈I, a proto<br />

E(Y ) = <br />

h(xi)pi .<br />

i∈I<br />

(ii) je spojitou verzí.<br />

111


6.9. Příklad. Určete střední hodnotu třetí mocniny<br />

rozdělení Exp(1).<br />

E(Y ) =<br />

∞<br />

0<br />

x 3 e −x dx = 6 .<br />

112


7 Náhodné vektory<br />

Značení: x = (x1, x2, . . . xn) ∈ C n<br />

7.1. Definice. Nechť (Ω, A, P ) je pravděpodobnostní<br />

prostor. Zobrazení X : Ω → R n<br />

X(ω) = (X1(ω), X2(ω), . . . , Xn(ω)) ,<br />

kde X1, . . . , Xn jsou náhodné veličiny na Ω, se<br />

nazývá náhodný vektor. Veličiny X1, . . . , Xn se<br />

nazývají marginální rozdělení vektoru X.<br />

Nestačí znát marginální distribuční funkce, ale distribuční<br />

funkci sdruženou.<br />

Značení:<br />

[X ≤ x] = [X1 ≤ x1 ∧ X2 ≤ x2 ∧ · · · ∧ Xn ≤ xn].<br />

7.2. Definice. Je-li X : Ω → R n náhodný vektor,<br />

pak distribuční funkci FX : R n → R definujeme<br />

jako<br />

FX(x) = P [X ≤ x] .<br />

113


7.3. Příklad. X má distribuční funkci F . Určete<br />

distribuční funkci náhodného vektoru<br />

X = (X, X)<br />

FX(x, y) = P [X ≤ x ∧ X ≤ y] =<br />

= P [X ≤ min(x, y)] = F (min(x, y))<br />

Pomocí distribuční funkce spočítáme všechny relevantní<br />

pravděpodobnosti:<br />

např.<br />

X = (X, Y )<br />

P [(a < X ≤ b) ∧ (c < Y ≤ d)] =<br />

= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) .<br />

114


Základní vlastnosti vícerozměrné distribuční funkce:<br />

7.4. Věta. Je-li F (x1, . . . , xn) sdružená distribuční<br />

funkce náhodných veličin X1, . . . , Xn, pak<br />

(i) limx1→∞,x2→∞,... ,xn→∞ F (x1, . . . , xn) = 1<br />

(ii) lim<br />

x1→−∞,x2→−∞,... ,xn→−∞ F (x1, . . . , xn) = 0<br />

(iii) F je zprava spojitá a neklesající v každé proměnné.<br />

Tyto vlastnosti nestačí k tomu, aby F byla distribuční<br />

funkcí. Musí splňovat složitejší podmínku<br />

pro hodnoty ve vrcholech vícerozměrných intervalů.<br />

Jak spočítat marginální rozdělení vektoru<br />

X = (X1, . . . , Xn)?<br />

FX1(x) = lim<br />

x2→∞,x3→∞,... ,xn→∞ FX(x, x2, x3, . . . , xn) .<br />

115


7.5. Příklad. X má rovnoměrné rozdělení na jednotkovém<br />

kruhu se středem v počátku. Nalezněte<br />

marginální rozdělení.<br />

X = (X, Y )<br />

Pro −1 < x < 1.<br />

FX(x) = 2<br />

x<br />

π<br />

−1<br />

<br />

√ 2 1<br />

1 − t2 dt =<br />

π<br />

= x√ 1 − x 2<br />

π<br />

+ arcsin x<br />

2 t√1 − t2 + 1<br />

arcsin t<br />

2<br />

π<br />

+ 1<br />

2 .<br />

7.6. Definice. Náhodný vektor se nazývá diskrétní,<br />

jestliže všechny jeho složky mají diskrétní rozdělení.<br />

Diskrétní vektor je dán pravděpodobnostní funkcí:<br />

(x1, p1); (x2, p2); (x3, p3), . . .<br />

n<br />

pi > 0 , pi = 1 .<br />

i=1<br />

116<br />

x<br />

−1<br />

=


7.7. Příklad. Pravděpodobnost soustředěná ve<br />

vrcholech čtverce:<br />

P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,<br />

P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2<br />

tabulka:<br />

Y/X 0 1<br />

0 1/8 1/4<br />

1 1/8 1/2<br />

Diskrétní rozdělení pro X<br />

P [X = 0] = 1/8 + 1/4 = 3/8<br />

P [X = 1] = 1/8 + 1/2 = 5/8<br />

X ∼ A(5/8).<br />

Podobně Y ∼ A(3/4).<br />

117


• Distribuční funkce diskrétního vektoru je po částech<br />

konstantní.<br />

• Má-li X diskrétní rozdělení je<br />

P [X ∈ A] = <br />

{i | xi∈A}<br />

pi .<br />

• Marginální rozdělení diskrétního rozdělení má<br />

pravděpodobnostní funkci<br />

P [X1 = a] = <br />

{i | xi∈A}<br />

kde A = {xi | (xi)1 = a}.<br />

118<br />

pi ,


7.8. Definice. Nechť f(x1, . . . , xn) ≥ 0 je funkce<br />

definovaná na Rn s<br />

<br />

f(x) dx = 1 .<br />

R n<br />

Náhodný vektor X = (X1, . . . , Xn) má spojité<br />

rozdělení s hustotou f, jestliže<br />

x1<br />

x2<br />

xn<br />

FX(x1, . . . , xn) = · · · f(t1, . . . , tn)dt1 · · · dtn .<br />

•<br />

−∞ −∞<br />

−∞<br />

f(x1, . . . , xn) = ∂n FX(x1, . . . , xn)<br />

∂x1∂x2 · · · ∂xn<br />

v bodech spojitosti funkce f<br />

•<br />

<br />

P [X ∈ A] =<br />

A<br />

Například: X = (X, Y )<br />

f(x) dx .<br />

P [X ∈ (a, b > ∧Y ∈ (c, d >] =<br />

119<br />

b<br />

a<br />

d<br />

c<br />

f(x, y) dxdy .


7.9. Příklad. Rovnoměrné rozdělení na jednotkové<br />

kouli se středem v počátku má hustotu<br />

f(x, y, z) =<br />

1<br />

4/3π<br />

0 jinak<br />

pro x 2 + y 2 + z 2 ≤ 1<br />

7.10. Příklad. Dvourozměrná distribuční funkce<br />

F (x, y) =<br />

Pro x, y > 0<br />

<br />

(1 − e −x )(1 − e −y ) je-li x, y > 0<br />

0 jinak<br />

f(x, y) = ∂2<br />

∂x∂y (1 − e−x )(1 − e −y ) =<br />

= e −x e −y .<br />

(Jinak je f(x, y) nulová.) Je správně neboť<br />

f(x, y) =<br />

∞<br />

0<br />

∞<br />

0<br />

e −x e −y = 1 .<br />

120


Marginální rozdělení:<br />

X = (X1, . . . , Xn) má hustotu f(x1, . . . , xn).<br />

Pak X1 má distribuční funkci:<br />

FX1(x) =<br />

=<br />

x<br />

−∞<br />

x<br />

∞<br />

−∞ −∞<br />

∞<br />

−∞<br />

· · ·<br />

∞<br />

−∞<br />

<br />

(n−1)×<br />

<br />

· · ·<br />

∞<br />

−∞<br />

<br />

(n−1)×<br />

Hustota tedy bude<br />

fX1(x) =<br />

∞<br />

−∞<br />

· · ·<br />

∞<br />

−∞<br />

<br />

(n−1)×<br />

f(t1, . . . , tn) dt1 · · · dtn =<br />

f(t1, . . . , tn) dt2 · · · dtn<br />

121<br />

<br />

dt1<br />

f(x, t2, · · · tn) dt2 · · · dtn .


7.11. Příklad. Dvourozměrné Gaussovo rozdělení<br />

hustota:<br />

f(x, y) = 1<br />

2π e− x2 +y 2<br />

2 .<br />

X, Y ∼ N(0, 1)<br />

FX(x, y) = Φ(x)Φ(y) .<br />

Např.<br />

P [X ≤ 3∧Y ≤ 5] = Φ(3)Φ(5) = 0, 9986498158.<br />

Jaká je pravděpodobnost, že (X, Y ) ∈ A, kde A<br />

je mezikruží<br />

A = {(x, y) | 4 ≤ x 2 + y 2 ≤ 9}?<br />

P = 1<br />

<br />

2π<br />

A<br />

Substituce:<br />

x = ϱ sin ϕ, y = ϱ cos ϕ,<br />

Jakobián: dxdy = ϱ dϱ dϕ.<br />

122<br />

e − x2 +y 2<br />

2 dxdy


P = 1<br />

2π<br />

<br />

2π<br />

0<br />

2<br />

3<br />

e −ϱ2 /2 ϱ dϱ dϕ =<br />

= 1<br />

2π 2π[−e−ϱ2 /2 ] 3 2 = e −2 −e −9/2 = 0, 12422 .<br />

Nezávislost náhodných veličin<br />

7.12. Definice. Náhodné veličiny X1, . . . , Xn na<br />

pravděpodobnostním prostoru (Ω, A, P ) jsou nezávislé,<br />

jestliže sdružená distribuční funkce vektoru<br />

X = (X1, . . . , Xn)<br />

je součinem marginálních distribučních funkcí.<br />

123


7.13. Tvrzení. Náhodné veličiny X1, . . . , Xn jsou<br />

nezávislé právě tehdy když<br />

P [(X1 ∈ I1) ∧ (X2 ∈ I2) ∧ · · · ∧ (Xn ∈ In)] =<br />

= P [X1 ∈ I1] · P [X2 ∈ I2] · · · P [Xn ∈ In]<br />

pro všechny možné výběry intervalů I1, . . . , In ⊂<br />

R.<br />

Zdůvodnění pro X = (X, Y ), kde X, Y jsou nezávislé<br />

:<br />

P [X ∈ (a, b > ∧Y ∈ (c, d >] =<br />

= FX(b, d)−FX(a, d)−FX(b, c)+FX(a, c) =<br />

= FX(b)Fy(d)−FX(a)FY (d)−FX(b)FY (c)+FX(a)FY (c) =<br />

= (FX(b) − FX(a))(FY (d) − FY (c)) .<br />

7.14. Příklad. X = (X, Y ) je rovnoměrné rozdělení<br />

na čtverci < 0, 1 > × < 0, 1 >. Pak X a<br />

Y jsou nezávislé:<br />

0 ≤ x, y ≤ 1<br />

FX(x, y) = xy = FX(x) · FY (y)<br />

124


7.15. Tvrzení. Diskrétní náhodné veličiny<br />

X1, . . . , Xn jsou nezávislé právě tehdy když všechny<br />

jevy<br />

[X1 = x1], [X2 = x2], . . . , [Xn = xn] ,<br />

kde x1, . . . , xn ∈ R, jsou nezávislé.<br />

7.16. Příklad. Pravděpodobnost soustředěná ve<br />

vrcholech čtverce:<br />

P [X = (0, 0)] = 1/8, P [X = (0, 1)] = 1/4,<br />

P [X = (1, 0)] = 1/8, P [X = (1, 1)] = 1/2<br />

tabulka:<br />

Y/X 0 1<br />

0 1/8 1/4<br />

1 1/8 1/2<br />

X a Y nejsou nezávislé, protože<br />

P [X = 0 ∧ Y = 0] = 1/8 = P [X = 0]P [Y = 0] = 3/8 · 1/4 .<br />

125


X = (X1, . . . , Xn)<br />

náhodné veličiny v Bernoulliově schématu. Tyto<br />

veličiny jsou nezávislé.<br />

Binomické rozdělení Bi(n, p) je součtem n nezávislých<br />

alternativních rozdělení A(p).<br />

126


7.17. Tvrzení. Spojité vícerozměrné rozdělení je<br />

rozdělení nezávislých veličin právě tehdy když sdružená<br />

hustota je součinem hustot marginálních.<br />

Důvod: hustota je derivací distribuční funkce.<br />

7.18. Příklad. Je-li (X, Y ) rovnoměrné rozdělení<br />

na jednotkovém kruhu, pak X a Y nejsou<br />

nezávislé, protože součin marginálních hustot je<br />

nenulový v každém bodě čtverce<br />

< 0, 1 > × < 0, 1 >.<br />

7.19. Příklad. X a Y jsou nezávislé náhodné<br />

veličiny s rozděleními N(0, σ 2 1), N(0, σ 2 2). Jaká je<br />

hustota součinu?<br />

f(x, y) =<br />

1<br />

2πσ1σ2<br />

Gaussovská plocha.<br />

x2<br />

−<br />

2σ e 2 −<br />

1<br />

y2<br />

2σ2 2<br />

127


charakteristiky nezávislých veličin:<br />

7.20. Věta. Jsou-li X1, . . . , Xn nezávislé náhodné<br />

veličiny na pravděpodobnostním prostoru (Ω, A, P ),<br />

pak<br />

E(X1X2 · · · Xn) = E(X1)E(X2) · · · E(Xn) .<br />

Důkaz: pro diskrétní rozdělení<br />

X má pravděpodobnostní funkci (xi, pi)i∈I<br />

Y má pravděpodobnostní funkci (yj, pj)j∈J<br />

E(XY ) = <br />

= <br />

i∈I,j∈J<br />

i∈I<br />

i∈I,j∈J<br />

xi yjP [X = xi ∧ Y = yj] =<br />

xi yjP [X = xi]P [Y = yj] =<br />

<br />

<br />

<br />

<br />

<br />

= xiP [Y = xi] · yjP [Y = yj] =<br />

128<br />

j∈J<br />

= E(X)E(Y )


7.21. Věta. Jsou-li X1, . . . , Xn nezávislé náhodné<br />

veličiny na pravděpodobnostním prostoru (Ω, A, P ),<br />

pak<br />

var(X1 + X2 + · · · + Xn) = var(X1) + var(X2) + · · · + var(Xn) .<br />

Důkaz pro n = 2<br />

Víme, že E(X1X2) = E(X1)E(X2).<br />

var(X1+X2) = E[(X1+X2) 2 ]−(E(X1)+E(X2)) 2 =<br />

= E(X 2 1) + E(X 2 2) + 2E(X1X2) −<br />

−(E(X1)) 2 −(E(X2)) 2 −2E(X1)E(X2) =<br />

E(X1) 2 −(E(X1)) 2 +E(X2) 2 −(E(X2)) 2 =<br />

= var(X1) + var(X2) .<br />

129


7.22. Příklad. Pro X s rozdělením Bi(n, p) a<br />

Y s rozdělením A(p) platí<br />

var(X) = n var(Y ) = np(1 − p) .<br />

Funkce nezávislých náhodných veličin<br />

7.23. Příklad. Doba kdy lano vydrží zátěž se<br />

řídí exponeniálním rozdělením Exp(1). Dvě lana<br />

zapojíme a) paralelně b) sériově. Určete rozdělení<br />

doby po kterou systém lan vydrží v obou případech<br />

a stanovte střední hodnotu těchto náhodných veličin.<br />

X a Y jsou nezávislé náhodné veličiny s rozdělením<br />

Exp(1).<br />

a) Zpar = max(X, Y )<br />

b) Zserie = min(X, Y ) .<br />

130


a) paralelně<br />

Distribuční funkce je nulová pro t < 0. Pro t > 0 je<br />

FZpar = (1 − e −t )(1 − e −t ) = (1 − e −t ) 2<br />

Hustota pro t > 0:<br />

f(t) = 2(1 − e −t )e −t<br />

Střední hodnota<br />

<br />

EZpar = 2<br />

0<br />

∞<br />

te −t <br />

dt − 2<br />

131<br />

0<br />

∞<br />

te −2t dt = 1, 5 .


a) sériově<br />

Distribuční funkce je nulová pro t < 0. Pro t > 0 je<br />

FZpar = 1 − e −t e −t = 1 − e −2t<br />

Hustota pro t < 0:<br />

g(t) = 2e −2t<br />

Střední hodnota<br />

<br />

EZserie = 2<br />

0<br />

∞<br />

e −2t dt = 0, 5 .<br />

132


Rozdělení součtu spojitých nezávislých<br />

náhodných veličin<br />

Z = X + Y ,<br />

kde X a Y jsou nezávislé, X má hustotu f(x) a<br />

Y má hustotu g(x).<br />

Úlohou je stanovit hustotu náhodné veličiny Z.<br />

Sdružená hustota vektoru (X, Y ) je funkce<br />

h(x, y) = f(x)g(y).<br />

P [Z ≤ z] = P [X+Y ≤ z] =<br />

∞<br />

−∞<br />

<br />

{(x,y) | x+y≤z}<br />

z−x<br />

<br />

f(x)g(y) dy dx .<br />

−∞<br />

Substituce ve vnitřním integrálu<br />

y = v − x, dv = dy<br />

133<br />

f(x)g(y) dxdy =


=<br />

∞<br />

−∞<br />

z<br />

−∞<br />

<br />

f(x) g(v − x) dv dx =<br />

=<br />

z<br />

−∞<br />

∞<br />

<br />

f(x)g(v − x) dx<br />

−∞<br />

<br />

hustota h(v)<br />

<br />

Závěr: Hustota součtu X + Y je funkce<br />

h(y) =<br />

∞<br />

−∞<br />

f(x)g(y − x) dx .<br />

Terminologie : funkce h je konvolutivní součin funkcí<br />

f a g.<br />

134<br />

dv


7.24. Příklad. Čas do první poruchy daného zařízení<br />

se řídí exponenciálním zákonem Exp(λ). Náhodná<br />

veličina Z je čas do druhé poruchy. Určete<br />

její hustotu.<br />

Z = X + Y ,<br />

kde X a Y jsou nezávislé s rozdělením Exp(λ).<br />

Hustota h(y) je<br />

h(y) =<br />

∞<br />

−∞<br />

f(x)g(y−x) dx =<br />

pro y ≥ 0 a nula jinak.<br />

= λ 2 e −λy<br />

135<br />

<br />

0<br />

y<br />

0<br />

y<br />

λe −λx λe −λ(y−x) dx =<br />

dx = λ 2 ye −λy


7.25. Příklad. Souprava metra přijíždí kdykoliv<br />

během jedné minuty. Dvakrát přestupujeme. Jaká<br />

je hustota čekací doby? Která hodnota je nejvíc<br />

preferována?<br />

Z = X + Y ,<br />

kde X a Y jsou nezávislé náhodné veličiny s rozdělením<br />

R < 0, 1 >.<br />

h(y) =<br />

∞<br />

−∞<br />

f(x)g(y − x) dx ,<br />

kde f a g jsou chrakteristické funkce intervalu<br />

< 0, 1 >.<br />

Tento integrál je délkou průniku intervalu < 0, 1 ><br />

s intervalem < y − 1, y >. Tedy<br />

⎧<br />

0 y ≤ 0<br />

⎪⎨<br />

y 0 ≤ y ≤ 1<br />

h(y) =<br />

2 − y 1 ≤ y ≤ 2<br />

⎪⎩<br />

0 y ≥ 2<br />

Trojúhelníkové rozdělení, preferována je čekací doba<br />

1.<br />

136


8 Kovariance a korelace náhodných<br />

vektorů<br />

Je-li X náhodný vektor, je vektor středních hodnot<br />

vektor<br />

EX = (EX1, EX2, . . . EXn) .<br />

Nepopisuje interakci mezi náhodnými veličinami.<br />

8.1. Definice. Nechť X a Y jsou náhodné veličiny<br />

na pravděpodobnostním prostoru (Ω, A, P ),<br />

které mají rozptyl. Kovariance náhodných veličin<br />

X a Y je definována<br />

cov(X, Y ) = E[(X − EX)(Y − EY )] .<br />

137


• cov(X, X) = var(X)<br />

• cov(X, Y ) = cov(Y, X)<br />

• cov(X, Y ) = E(XY ) − E(X)E(Y ) :<br />

E[(X−EX)(Y −EY )] = E(XY )−2EX·EY +EX·EY =<br />

= E(XY ) − E(X)E(Y )<br />

Pro výpočet potřebujeme:<br />

1. Diskrétní vektor (X, Y ) s pravděpodobnostní<br />

funkcí ((xi, yi); pi)i∈I.<br />

EX = <br />

i∈I<br />

EY = <br />

i∈I<br />

xi pi<br />

yi pi<br />

E(XY ) = <br />

i∈I<br />

xiyi pi<br />

138


1. Spojitý vektor (X, Y ) se sdruženou hustotou<br />

f(x, y).<br />

<br />

EX =<br />

R 2<br />

<br />

EY =<br />

R 2<br />

<br />

E(XY ) =<br />

xf(x, y) dxdy<br />

yf(x, y) dxdy<br />

R 2<br />

xyf(x, y) dxdy<br />

8.2. Příklad. X má rovnoměrné rozdělení na intervalu<br />

< 0, 1 >. Určete cov(X, X 2 ) .<br />

cov(X, X 2 ) = EX 3 − EX · EX 2<br />

EX 3 =<br />

EX 2 =<br />

1<br />

0<br />

1<br />

<br />

0<br />

x 3 dx = 1<br />

4<br />

x 2 dx = 1<br />

3<br />

cov(X, X 2 ) = 1 1 1<br />

− ·<br />

4 2 3<br />

139<br />

= 1<br />

12 .<br />

EX = 1<br />

2 .


8.3. Příklad. X = (X, Y ) má rovnoměrné rozdělení<br />

na jednotkovém kruhu. Stanovte cov(X, Y ).<br />

EX =<br />

E(XY ) =<br />

<br />

K<br />

<br />

K<br />

cov(X, Y ) = 0 .<br />

x dxdy = 0<br />

xy dxdy = 0 .<br />

140


8.4. Věta. Jsou-li X a Y nezávislé náhodné veličiny<br />

je cov(X, Y ) = 0.<br />

Důkaz:<br />

Jsou-li X a Y nezávislé, pak E(XY ) = EX ·EY .<br />

Veličiny X, Y souřadnice rovnoměrného rozdělení<br />

na jednotkovém kruhu mají nulovou kovarianci, a<br />

přesto nejsou nezávislé.<br />

Normování náhodné veličiny X : X−EX<br />

√ varX má nulovou<br />

střední hodnotu a jednotkový rozptyl.<br />

<br />

X − EX Y − EY<br />

cov √ , √ =<br />

varX varY<br />

cov(X, Y )<br />

√ varX √ varY .<br />

8.5. Definice. Předpokládejme, že X a Y jsou<br />

náhodné veličiny s nenulovým rozptylem. Korelace<br />

ϱ(X, Y ) je definována vztahem<br />

ϱ(X, Y ) =<br />

cov(X, Y )<br />

√ varX √ varY .<br />

141


8.6. Příklad. (X, Y ) má diskrétní rozdělení s pravděpodobnostní<br />

funkcí<br />

((x1, y1), 1/3); ((x2, y2), 1/3); ((x3, y3), 1/3);<br />

Předpokládejme dále, že<br />

x1 + x2 + x3 = 0 y1 + y2 + y3 = 0 .<br />

cov(X, Y ) =<br />

=<br />

1<br />

3 x1y1 + 1<br />

1<br />

3 (x2 1 + x 2 2 + x 2 3)<br />

<br />

1<br />

3 (y2 1 + y2 2 + y2 =<br />

3)<br />

3x2y2 + 1<br />

3x3y3 x1y1 + x2y2 + x3y3<br />

<br />

2 x1 + x2 2 + x2 <br />

2<br />

3 y1 + y2 2 + y2 3<br />

= cos ϕ ,<br />

kde ϕ je úhel mezi vektory<br />

x = (x1, x2, x3) a y = (y1, y2, y3).<br />

Pokud je tedy cov(X, Y ) = 1 je y kladným násobkem<br />

x, pokud je cov(X, Y ) = −1 je y záporným<br />

násobkem x<br />

142


8.7. Věta. Pro korelaci ϱ(X, Y ) náhodných veličin<br />

X a Y platí<br />

|ϱ(X, Y )| ≤ 1 .<br />

Přitom ϱ(X, Y ) = 1 právě tehdy když hodnoty X<br />

a Y leží s pravděpodobností 1 na jedné přímce s<br />

kladnou směrnicí.<br />

ϱ(X, Y ) = −1 právě tehdy když hodnoty X a Y<br />

leží s pravděpodobností 1 na jedné přímce se zápornou<br />

směrnicí.<br />

Důkaz:<br />

Pro všechna t ∈ R máme<br />

<br />

X − EX Y − EY<br />

0 ≤ var √ + t √ =<br />

varX varY<br />

= 1 + 2tϱ(X, Y ) + t 2 . (2)<br />

Diskuse kvadratického výrazu:<br />

a tedy<br />

4ϱ 2 (X, Y ) − 4 ≤ 0<br />

|ϱ(X, Y )| ≤ 1 .<br />

143


Předpokládejme, že cov(X, Y ) = 1. Pak v nerovnosti<br />

(2) nastane rovnost a to může nastat právě<br />

když t = −1. Dosazením t = −1 pak vede k<br />

Tedy<br />

X − EX Y − EY<br />

√ − √ = konst .<br />

varX varY<br />

Y =<br />

√ varY<br />

√ varX · X + konstanta .<br />

ϱ(X, Y ) je míra lineární závislosti X a Y .<br />

144


9 Asymptotické vlastnosti<br />

náhodných veličin<br />

Větou asymptotického typu byla již věta Poissonova:<br />

binomické rozdělení s počtem pokusů jdoucím<br />

k nekonečnu a střední hodnotou jdoucí k λ se<br />

blíží Poissonově rozdělení P o(λ).<br />

Základní otázka: Co se děje s Bi(n, p), jestliže<br />

n → ∞ a p se nemění?<br />

Orientační odhady poskytuje Čebyševova nerovnost.<br />

9.1. Věta. Čebyševova nerovnost<br />

Nehť X je náhodná veličina s E(X 2 ) < ∞. Potom<br />

platí<br />

P [|X| ≥ ε] ≤ E(X2 )<br />

ε 2<br />

Speciálně, má-li X rozptyl, pak<br />

P [ |X − EX| ≥ ε] ≤ var(X)<br />

ε 2<br />

145<br />

.<br />

.


Důkaz pro spojité rozdělení s hustotou f(x).<br />

E(X 2 ) =<br />

≥<br />

∞<br />

−∞<br />

<br />

{x | |x|≥ε}<br />

P [ |X| ≥ ε] =<br />

x 2 f(x) dx =<br />

<br />

{x | |x|≥ε}<br />

<br />

{x | |x|≥ε}<br />

f(x) dx<br />

x 2 <br />

f(x) dx+<br />

ε 2 f(x) dx = ε 2 P [ |X| ≥ ε] .<br />

9.2. Důsledek. Je-li Xn náhodná veličina s rozdělením<br />

Bi(n, p), pak pro každé ε > 0 platí<br />

<br />

Xn <br />

P − p<br />

n ≥ ε → 0 pro n → ∞ .<br />

Důkaz:<br />

E<br />

<br />

Xn<br />

=<br />

n<br />

np<br />

n<br />

= p<br />

146<br />

−ε<br />

ε<br />

x 2 f(x) dx ≥


Xn<br />

var<br />

n<br />

Dle Čebyševovy nerovnosti<br />

<br />

Xn <br />

P − p<br />

n ≥ ε ≤<br />

= 1<br />

1<br />

np(1 − p) ≤<br />

n2 4n<br />

Xn var( n )<br />

ε2 ≤ 1<br />

.<br />

4nε2 9.3. Příklad. Kolika respondentů je třeba se zeptat,<br />

abychom odhadli volební preference p s tolerancí<br />

1% s pravděpodobností alespoň 90% ?<br />

n ... počet osob<br />

Xn ... Bi(n, p) (počet osob volících danou stranu)<br />

p ≈ Xn<br />

n (aproximace)<br />

Chceme:<br />

<br />

Xn<br />

P<br />

n<br />

<br />

<br />

− p<br />

<br />

<br />

< 0, 01 ≥ 0, 9 .<br />

Nebo-li<br />

<br />

Xn <br />

P − p<br />

n ≥ 0, 01 ≤ 0, 1<br />

<br />

1<br />

≤<br />

4n(0,01) 2<br />

147


1<br />

≤ 0, 1<br />

4n(0, 01) 2<br />

n ≥ 105<br />

4<br />

= 25000.<br />

Je pesimistický, nicméně jistý horní odhad.<br />

9.4. Věta. Centrální limitní věta<br />

Nehť X1, X2, X3, . . . je posloupnost nezávislých<br />

náhodných veličin, pro které platí<br />

EXi = µ , varXi = σ 2 , E|Xi| 3 < ∞ .<br />

pro všechna i ∈ N. Pro veličinu Sn (normovaný<br />

součet),<br />

platí<br />

Sn = X1 + X2 + · · · + Xn − nµ<br />

√ nσ<br />

lim<br />

n→∞ P [ Sn ≤ x] = Φ(x) ,<br />

pro všechna x ∈ R.<br />

148<br />

,


Tedy X1 + X2 + · · · + Xn má přibližně rozdělení<br />

N(nµ, nσ 2 ).<br />

9.5. Věta. Moaivrova-Laplaceova věta<br />

Pro náhodnou veličinu Xn s rozdělením Bi(n, p)<br />

platí<br />

lim<br />

n→∞ P<br />

<br />

Xn − np<br />

≤ x = Φ(x)<br />

np(1 − p)<br />

pro každé x ∈ R.<br />

Důkaz:<br />

Binomické rozdělení je součtem nezávislých alternativních<br />

rozdělení.<br />

Bi(n, p) ≈ N(np, np(1 − p))<br />

Empiriké pravidlo pro velikost n :<br />

np ≥ 5, n(1 − p) ≥ 5.<br />

149


9.6. Příklad. 250 krát hodíme symetrickou mincí.<br />

Určete pravděpodobnost, že rub padne 100 až 150<br />

krát.<br />

X250 − 125<br />

√ 250 · 0, 25 ≈ N(0, 1)<br />

P [100 ≤ X250 ≤ 150] =<br />

<br />

−25<br />

= P √ ≤<br />

250 · 0, 25 X250<br />

<br />

− 125 25<br />

√ ≤ √ =<br />

250 · 0, 25 250 · 0, 25<br />

<br />

25 · 2<br />

= 2Φ √ −1 = 2Φ(<br />

250<br />

√ 10)−1 . = 2Φ(3, 16)−1 . =<br />

= 0, 99842 .<br />

250 1<br />

k 2250 Přesně: 150<br />

k=125<br />

9.7. Příklad. Kolika respondentů je třeba se zeptat,<br />

abychom odhadli volební preference p s tolerancí<br />

1% a to s pravděpodobností alespoň 90%.<br />

<br />

Xn<br />

P<br />

n<br />

<br />

<br />

− p<br />

<br />

<br />

≤ 0, 01 ≥ 0, 9<br />

150


|Xn − np|<br />

P [ |Xn−np| ≤ 0, 01n] = P ≤<br />

np(1 − p)<br />

√ <br />

. 0, 01 · n<br />

= 2Φ −1 ≥ 2Φ<br />

p(1 − p)<br />

Volíme n tak aby<br />

2Φ(0, 02 √ n) − 1 ≥ 0, 9<br />

Φ(0, 02 √ n) ≥ 0, 95<br />

0, 02 √ n ≥ u0,95<br />

0, 01 · √ n<br />

1/2<br />

= 2Φ(0, 02 √ n) − 1 .<br />

√ u0,95<br />

n ≥<br />

0, 02<br />

2 2 u0,95 1, 644 .=<br />

n ≥ =<br />

6763, 8586<br />

0, 02 0, 02<br />

Pro srovnání při 5% toleranci potřebujeme 270 respondentů.<br />

151<br />

<br />

0, 01n .=<br />

<br />

np(1 − p)<br />

<br />

−1 =


10 Statistika<br />

Základní výběrové statistiky<br />

10.1. Definice. Náhodný výběr z rozdělení s distribuční<br />

funkcí F (x) je vektor<br />

X = (X1, . . . , Xn) ,<br />

kde X1, . . . , Xn jsou nezávislé náhodné veličiny<br />

mající stejnou distribuční funkci F (x).<br />

Základní výběrové statistiky:<br />

Výběrový průměr<br />

Xn = 1<br />

n (X1 + X2 + · · · Xn)<br />

Výběrový rozptyl<br />

S 2 n = 1<br />

n − 1<br />

n<br />

(Xi − Xn) 2<br />

i=1<br />

Výběrová směrodatná odchylka<br />

Sn<br />

152


Výběrové maximum<br />

max(X1, . . . , Xn)<br />

Výběrové minimum<br />

min(X1, . . . , Xn)<br />

Výběrové rozpětí<br />

max(X1, . . . , Xn) − min(X1, . . . , Xn)<br />

Výběrový průměr<br />

EX = µ, var(X) = σ 2<br />

E = E( 1<br />

n (X1 + · · · + Xn)) = nµ<br />

= µ .<br />

n<br />

<br />

X1 + · · · + Xn<br />

var(Xn) = var<br />

n<br />

E(Xn) = µ<br />

var(Xn) = σ2<br />

n<br />

153<br />

= 1<br />

n 2 nσ2 = σ2<br />

n .


Důležité je, že var(Xn) → 0 pro n → ∞.<br />

Čebyševova nerovnost:<br />

P [ |Xn − µ| ≥ ε] ≤ σ2<br />

.<br />

nε2 Výběrový rozptyl<br />

S 2 n = 1<br />

n − 1<br />

pomocný výpočet:<br />

n<br />

(Xi − Xn) 2 .<br />

i=1<br />

n<br />

(Xi − Xn) 2 =<br />

i=1<br />

=<br />

=<br />

n<br />

n<br />

i=1<br />

(X 2 i − 2XiXn + Xn<br />

n<br />

n<br />

X<br />

i=1<br />

2 i − 2Xn Xi +<br />

i=1 i=1<br />

n<br />

i=1<br />

X 2 2 2<br />

i −2nXn +nXn =<br />

154<br />

2<br />

Xn =<br />

n<br />

i=1<br />

2 ) =<br />

X 2 2<br />

i −nXn .


Výpočet střední hodnoty:<br />

(n−1)E(S 2 <br />

n<br />

n) = E<br />

=<br />

n<br />

i=1<br />

i=1<br />

X 2 <br />

2<br />

i −nXn =<br />

n<br />

i=1<br />

E(X 2 2<br />

i )−nE(Xn ) =<br />

(var(Xi)+E 2 (Xi))−n(var(Xn)+E 2 (Xn)) =<br />

= nσ 2 + nµ 2 − n σ2<br />

n − nµ2 = (n − 1)σ 2<br />

E(S 2 n) = σ 2 .<br />

Výběrové statistiky odvozené od normálního<br />

rozdělení.<br />

10.2. Tvrzení. Výběrový průměr z rozdělení N(µ, σ 2 )<br />

má rozdělení N(µ, σ2<br />

n ).<br />

Důkaz je založen na tom, že součet nezávislých<br />

normálních rozdělení je normální rozdělení, což se<br />

dá dokázt pomocí konvoluce gaussovských funkcí.<br />

Pro popis S 2 n potřebujeme zavést nové rozdělení<br />

155


10.3. Definice. Nechť X1, . . . , Xn jsou nezávislé<br />

veličiny s normovaným normálním rozdělením. Rozdělení<br />

χ 2 o n stupních volnosti je rozdělení náhodné<br />

veličiny<br />

Y = X 2 1 + X 2 2 + · · · + X 2 n<br />

Značení : χ 2 n<br />

kvantily: χ 2 n,α χ 2 n(α)<br />

Má-li X rozdělení χ 2 n, pak<br />

EX = n var(X) = 2n .<br />

10.4. Příklad. X, Y, Z jsou nezávislé náhodné<br />

veličiny s rozdělením N(0, 1). Stanovte r tak, aby<br />

P [ √ X 2 + Y 2 + Z 2 ≤ r] = 0, 995<br />

(Legenda: složky rychlosti molekul plynu)<br />

r =<br />

<br />

χ 2 3(0, 995) = 12, 838 = 3, 58<br />

156


Základní věta klasické statistiky<br />

10.5. Věta. Nechť X = (X1, . . . , Xn) je náhodný<br />

výběr z rozdělení N(µ, σ 2 ). Pak<br />

(i) Xn a S 2 n jsou nezávislé náhodné veličiny<br />

(ii) (n−1)S2 n<br />

σ 2<br />

má rozdělení χ 2 n−1.<br />

Statistická varianta normování veličiny:<br />

Xn − µ<br />

Sn/ √ n<br />

10.6. Definice. Nechť X = (X1, . . . , Xn) je náhodný<br />

výběr z rozdělení N(µ, σ 2 ). Studentovo rozděleni<br />

s n − 1 stupni volnosti je rozdělení náhodné<br />

veličiny<br />

Xn − µ<br />

Sn/ √ n<br />

Značení: tn−1, kvantily tn−1, α; tn−1(α).<br />

157


W. Gosset – pseudonym Student, Studentovo rozdělení<br />

tn má sudou hustotu, fn(x), která pro n →<br />

∞ konverguje bodově k Φ(x). (Aproximuje se obvykle<br />

pro n ≥ 31)<br />

158


Intervalové odhady<br />

Lokalizace neznámého parametru pomocí dat<br />

10.7. Definice. Nechť X = (X1, . . . , Xn) je náhodný<br />

výběr z rozdělení s neznámým parametrem<br />

θ a α ∈ (0, 1).<br />

(i) Interval < TD(X), TH(X) > se nazývá<br />

100(1 − α)% oboustranným intervalem spolehlivosti<br />

parametru θ jestliže<br />

P [ TD(X) ≤ θ ≤ TH(X) ] = 1 − α<br />

(ii) Interval < TD(X), ∞) se nazývá<br />

dolním 100(1 − α)% intervalem spolehlivosti<br />

parametru θ, jestliže<br />

P [θ ≥ TD(X)] = 1 − α<br />

(iii) Interval (−∞, TH(X) > se nazývá<br />

horním 100(1 − α)% intervalem spolehlivosti<br />

parametru θ, jestliže<br />

P [θ ≤ TH(X)] = 1 − α<br />

159


Pro odvození intervalových odhadů pro parametry<br />

µ a σ 2 používáme statistiky<br />

Z = Xn − µ<br />

σ/ √ n<br />

T = Xn − µ<br />

Sn/ √ n<br />

(n − 1)S 2 n<br />

σ 2<br />

∼ N(0, 1)<br />

∼ tn−1<br />

∼ χ 2 n−1<br />

10.8. Věta. Nechť X = (X1, . . . , Xn) je náhodný<br />

výběr z rozdělení N(µ, σ2 ). Pak<br />

σ<br />

σ<br />

(i) P [ Xn − u1−α/2 √ ≤ µ ≤ Xn + u1−α/2 √ ] = 1 − α<br />

n n<br />

Sn<br />

(ii) P [ Xn − tn−1,1−α/2 √ ≤ µ ≤ Xn + tn−1,1−α/2 √ ] = 1 − α<br />

n n<br />

Důkaz: (i) Z = Xn−µ<br />

σ/ √ n<br />

∼ N(0, 1)<br />

P [uα/2 ≤ Z ≤ u1−α/2] = 1 − α .<br />

σ<br />

√ n uα/2 ≤ Xn − µ ≤ σ √ n u1−α/2<br />

160<br />

Sn


(ii) Totéž s využitím statistiky T = Xn−µ<br />

Sn/ √ n<br />

∼ tn−1.<br />

10.9. Příklad. Je měřena výška 16 rostlin. Průměr<br />

naměřených hodnot je 72,5 cm, výběrová směrodatná<br />

odchylka je 4,5 cm. Nalezněte 90% interval<br />

spolehlivosti pro střední výšku.<br />

1 − α = 0, 9; α = 0, 1; 1 − α/2 = 0, 95<br />

t15(0, 95) = 1, 75<br />

r = 1, 75 4,5<br />

√ 16 = 1, 97<br />

(70, 53; 74, 47)<br />

10.10. Příklad. X ∼ N(µ, σ 2 ). Při padesáti měření<br />

byla získána směrodatná odchylka<br />

S50 = 2, 192<br />

Určete horní 95% interval spolehlivosti pro σ 2 .<br />

(n − 1)σ 2<br />

σ 2<br />

∼ χ 2 n−1<br />

161


2 (n − 1)Sn P<br />

σ 2<br />

≥ χ 2 n−1,α<br />

<br />

P σ 2 ≤ (n − 1)S2 n<br />

χ2 n−1,α<br />

χ 2 49(0, 05) = 33, 930<br />

49 · 2, 192<br />

33, 930<br />

Interval: (0, 3,166).<br />

= 3, 166 .<br />

<br />

= 1 − α<br />

<br />

= 1 − α<br />

Přibližné intervalové odhady: Xn má podle Centrální<br />

limitní věty pro velké n přibližně normální<br />

rozdělení:<br />

X1 + X2 + · · · + Xn − nµ<br />

√ nσ<br />

= Xn − µ<br />

σ/ √ n<br />

má přibližně rozdělení N(0, 1). Dá se použít intervalový<br />

odhad pro normální rozdělení:<br />

Sn<br />

Xn − u1−α/2<br />

Sn<br />

√ ≤ E(X) ≤ Xn + u1−α/2 √<br />

n n<br />

162


s pravděpodobností 1 − α.<br />

U alternativního rozdělení A(p) se navíc aproximuje<br />

σ 2 hodnotou<br />

Xn(1 − Xn)<br />

Xn − u1−α/2<br />

<br />

Xn(1 − Xn)<br />

√ n<br />

s pravděpodobností 1 − α.<br />

≤ p ≤ Xn + u1−α/2<br />

10.11. Příklad. Při průzkumu se zjistilo, že z<br />

1500 oslovených osob poslouchá rádiovou stanici<br />

kvůli hudbě 63%. Určete 98% interval spolehlivosti<br />

pro skutečné procento takovýchto posluchačů.<br />

interval<br />

X1500 = 0, 63<br />

<br />

0, 63 · 0, 37<br />

r = u0,99 ·<br />

= 0, 029<br />

1500<br />

(60, 1%; 65, 9%)<br />

163<br />

<br />

Xn(1 − Xn)<br />

√ n


11 Testování statistických<br />

hypotéz<br />

statistické rozhodování při neúplné informaci, vždy<br />

s jistým rizikem.<br />

H0 ... nulová hypotéza:<br />

k−tice parametrů (θ1, . . . , θk) ∈ A ⊂ R n<br />

H1 ... alternatvní hypotéza:<br />

k−tice parametrů (θ1, . . . , θk) ∈ B ⊂ R n<br />

A ∩ B = ∅<br />

kritický obor:<br />

W ⊂ R n<br />

naměřená data: X = (X1, . . . , Xn).<br />

H0 zamítneme ve prospěch H1 pokud X ∈ W ,<br />

volí se tak, aby<br />

P [X ∈ W |H0] ≤ α<br />

164


α ... hladina významnosti<br />

standardy: α = 0, 5; 0, 01<br />

Chyba prvního druhu: H0 platí a test ji zamítá<br />

Chyba druhého druhu: H0 neplatí a test ji nezamítá<br />

11.1. Příklad. V roce 1951 byla naměřena průměrná<br />

výška 10 letých chlapců v ČSSR 136,1 cm.<br />

V roce 1961 se u 15 náhodně vybraných 10 letých<br />

chlapců zjistila průměrná výška<br />

X15 = 139, 133cm<br />

V obou případech je σ = 6, 4cm<br />

Vzrostla výška?<br />

Výška v r. 1961, N(µ, 6, 4 2 )<br />

H0 : µ = 136, 1 = µ0<br />

H1 : µ > 136, 1<br />

165


Hypotézu H0 zamítneme pokud X15 bude příliš<br />

velký, tj. pokud X15 > c, kde c je vhodně zvolená<br />

konstanta.<br />

Platí-li H0, pak X15 má rozdělení N(µ0, 6,42<br />

). Tedy<br />

15<br />

Z = X15 − µ0<br />

σ/ √ 15<br />

∼ N(0, 1) .<br />

Zamítáme na hladině α jestliže Z > u1−α<br />

Volme α = 0, 05. u0,95<br />

Z =<br />

.<br />

= 1, 64<br />

139, 133 − 136, 1<br />

6, 4/ √ 15<br />

.<br />

= 1, 835<br />

Protože Z > u0,95 zamítáme hypotézu H0 na hladině<br />

významnosti 5%.<br />

Kritický obor: {x ∈ R 15 | 1<br />

15 (x1 + · · · + x15) ≥ c}<br />

c = 136, 1 + u0,95 · 6, 4 √ 15 = 136, 1 + 1, 838 = 137, 938<br />

166


Lze volit mnoho kritických oborů. Existuje matematický<br />

výsledek (Neymannovo-Pearsonovo lemma)<br />

říkající, že tento test má největší sílu.<br />

Síla testu: pravděpodobnost s jakou zamítneme<br />

nulovou hypotézu když platí hypotéza alternativní.<br />

Vztah mezi chybou prvního a druhého druhu α a<br />

β. Pokud H0 neplatí, pak α → 0 implikuje β → 1.<br />

Testy o střední hodnotě normálního rozdělení<br />

X = (X1, . . . , Xn)<br />

... náhodný výběr z rozdělení N(µ, σ 2 ).<br />

H0 : µ = µ0<br />

H1 : µ = µ0...oboustranný test<br />

H2 : µ > µ0...jednostranný test<br />

H3 : µ < µ0...jednostranný test<br />

167


Z-test<br />

známe σ<br />

Z = Xn − µ0<br />

σ/ √ n<br />

má za podmínky H0 rozdělení N(0, 1).<br />

H0 zamítneme na hladině významnosti α<br />

a) proti H1: pokud |Z| > u1−α/2<br />

b) proti H2: pokud Z > u1−α<br />

a) proti H3: pokud Z < uα = −u1−α<br />

168


t-test<br />

neznáme σ<br />

T = Xn − µ0<br />

Sn/ √ n<br />

má za podmínky H0 rozdělení tn−1.<br />

H0 zamítneme na hladině významnosti α<br />

a) proti H1: pokud |T | > tn−1(1 − α/2)<br />

b) proti H2: pokud T > tn−1(1 − α)<br />

a) proti H3: pokud T < tn−1(α) = −tn−1(1 − α)<br />

Pro velké n aproximujeme tn−1 rozdělením N(0, 1).<br />

169


11.2. Příklad. Automat plní krabice práškem. Norma<br />

je 2kg. Náhodně bylo vybráno 6 krabic. Zjistily se<br />

následující odchylky od normy v dkg.<br />

−5, 1, −1, −8, 7, −6<br />

Testujeme správnost funkce automatu.<br />

H0 : µ = 0<br />

H1 : µ = 0 .<br />

n = 6, X6 = −2, S 2 6 = 30, 4<br />

T =<br />

−2 − 0<br />

√ 30, 4/ √ 6<br />

t5(0, 975) = 2, 5706<br />

|T | < 2, 5706<br />

Závěr: H0 nezamítáme.<br />

.<br />

= −0, 889 .<br />

170


Párový t-test: Sledujeme související veličiny, předpokládáme,<br />

že rozdíl má normální rozdělení.<br />

11.3. Příklad.<br />

váha osob před dietou 82 70 91<br />

váha osob po dietě 81 69,5 89<br />

Má dieta efekt ?<br />

Rozdíly před a po:<br />

1— 0,5— 2<br />

H0 : µ = 0<br />

H1 : µ > 0<br />

X3 = 1, 167<br />

S 2 3 = 0, 583<br />

T =<br />

1, 167<br />

S3/ √ 3<br />

t2(0, 95) = 2, 92<br />

= 2, 647 .<br />

171


Závěr: nezamítáme nulovou hypotézu, pokles váhy<br />

neni průkazný. (I když se zdá být ztráta váhy velká,<br />

máme málo pokusných osob).<br />

172


Asymtotický test proporce<br />

A(p) ... alternativní rozdělení<br />

Centrální limitní věta: Xn se aproximuje rozdělením<br />

N(p, p(1−p)<br />

n ).<br />

H0 : p ≤ p0<br />

H1 : p > p0<br />

H0 zamítáme, jestliže Xn > c. Volíme vhodně c<br />

tak, aby<br />

P [Xn > c|H0] ≤ α<br />

<br />

.= c − p<br />

P Xn > c|H0 1 − Φ<br />

√ p(1−p)<br />

√ n<br />

<br />

=<br />

√ <br />

n(c − p)<br />

= 1 − Φ <br />

p(1 − p)<br />

p(1 − p) ≤ 1/2 c − p ≥ c − p0<br />

implikuje<br />

√ n(c − p)<br />

p(1 − p) ≥ 2 √ n(c − p0)<br />

173


Tedy<br />

√ <br />

n(c − p)<br />

1 − Φ ≤ 1 − Φ(2<br />

p(1 − p)<br />

√ n(c − p0))<br />

Podmmínce vyhovíme, jestliže<br />

1 − Φ(2 √ n(c − p0)) ≤ α<br />

Φ(2 √ n(c − p0)) ≥ 1 − α<br />

2 √ n(c − p0) ≥ u1−α<br />

c ≥ p0 + u1−α<br />

2 √ n<br />

Závěr: H0 zamítáme ve prospěch H1 jestliže<br />

Xn ≥ p0 + u1−α<br />

2 √ n<br />

174


11.4. Příklad. Průzkum zahrnuje 1600 osob. Kolik<br />

procent z tohoto vzorku má daná koalice získat<br />

hlasů, abychom na hladině významnosti 1% potvrdili<br />

hypotézu, že koalice vyhraje volby.<br />

X1600 ≥ 0, 5 + u0,99<br />

80<br />

. 2, 326<br />

= 0, 5 +<br />

80<br />

= 0, 529 .<br />

Musíme tedy získat 0, 529 · 1600 . = 847 hlasů.<br />

Musíme vždy získat o asi 2, 9% více než je daná<br />

mez.<br />

175


Test rozptylu normálního rozdělení<br />

X = (X1, . . . , Xn) ... náhodný výběr z rozdělení<br />

N(µ, σ 2 )<br />

H0 : σ 2 = σ 2 0<br />

H1 : σ 2 > σ 2 0<br />

Využíváme statistiku<br />

S = (n − 1)S2 n<br />

σ 2 0<br />

která má za předpokladu H0 rozdělení χ 2 n−1.<br />

Hypotézu H0 zamítáme ve prospěch H1 při hladině<br />

významnosti α jestliže<br />

(n − 1)S 2 n<br />

σ 2 0<br />

> χ 2 n−1(1 − α) .<br />

176


Testy dobré shody<br />

(Ω, A, P ) ... pravděpodobnostní prostor<br />

A1, . . . , Ak ... úplný systém jevů<br />

P (Ai) = pi<br />

A1 A2 · · · Ak<br />

p1 p2 · · · pk<br />

k<br />

pi = 1 .<br />

i=1<br />

Odpovídá rozdělení dat do disjunktních tříd. pi<br />

jsou apriorní pravděpodobnosti. Testujeme jejich<br />

shodu s empirickými daty.<br />

H0 : P (Ai) = pi<br />

(k = 2) máme vpodstatě alternativní rozdělení.<br />

Učiníme sérii n pokusů, v každém indikujeme jeden<br />

z jevů A1, . . . , Ak. Počítáme kolikrát který jev<br />

nastane. Při k = 2 tak máme binomické rozdělení.<br />

177


Značení:<br />

n ... počet nezávislých pokusů<br />

Oi ... počet výskytů jevu Ai v sérii n pokusů.<br />

Náhodná veličina – empirická četnost.<br />

n pi ... teoretická četnost<br />

(k = 2 pak Oi ∼ Bi(n, pi))<br />

Testujeme shodu npi ≈ Oi<br />

11.5. Věta. Náhodná veličina<br />

k (Oi − npi) 2<br />

i=1<br />

npi<br />

má při n → ∞ přibližně rozdělení χ 2 k−1 .<br />

Důkaz je založen na centrální limitní větě<br />

Hypotézu H0 o apriorních pravděpodobnostech zamítáme<br />

na hladině významnosti α, pokud<br />

k (Oi − npi) 2<br />

i=1<br />

npi<br />

> χ 2 k−1(1 − α)<br />

178


Tento test se nazývá χ 2 test, nebo též Pearsonův<br />

test. Tento test je asymptotický, doporučuje se ho<br />

použít pro n tak velké, že<br />

npi > 5 pro všechna i = 1, . . . , k .<br />

11.6. Příklad. Testujeme zda hrací kostka neni<br />

falešná. Provedeno 120 hodů. Výsledky jsou<br />

hodnota 1 2 3 4 5 6<br />

četnost 15 16 25 31 15 18<br />

= 20.<br />

n = 120, pi = 1/6, npi = 120 · 1<br />

6<br />

6 (Oi − npi) 2<br />

=<br />

npi<br />

i=1<br />

= 52 42 52 112 52 22<br />

+ + + + +<br />

20 20 20 20 20 20<br />

χ 2 5(0, 95) = 11, 07 .<br />

= 10, 8 .<br />

Závěr: nelze zamítnout hypotézu, že kostka je falešná.<br />

179


Často se používá na test typu rozdělení:<br />

11.7. Příklad. Testujeme hypotézu, že data pocházejí<br />

z rozdělení N(0, 1). Provedeno je 1000 měření,<br />

data jsou rozdělena do tří skupin<br />

u0,8 = 0, 84162<br />

250 hodnot v (−∞, −u0,8)<br />

550 hodnot v (−u0,8, u0,8)<br />

200 hodnot v (u0,8, ∞)<br />

H0 : p1 = 0, 2; p2 = 0, 6; p3 = 0, 2<br />

np1 = 200<br />

np2 = 600<br />

np3 = 200<br />

3 (Oi − npi) 2<br />

i=1<br />

npi<br />

χ 2 2(0, 95) = 5, 9915<br />

= 502 502 0<br />

+ +<br />

200 600 200<br />

Závěr: Hypotézu o rozdělení N(0, 1) zamítáme.<br />

180<br />

= 16, 667 .


Testy shody při neznámých parametrech<br />

Testujeme zda data pocházejí z rozdělení s neznámými<br />

parametry.<br />

Je-li l počet odhadnutých parametrů, pak<br />

k (Oi − npi) 2<br />

i=1<br />

npi<br />

má asymptoticky rozdělení χ 2 k−1−l .<br />

Postup:<br />

1. Neznámé parametry odhadneme z dat.<br />

2. Pomocí nich spočítáme apriorní pravděpodobnosti<br />

3. Hypotézu o daném rozdělení zamítneme, jestliže<br />

k (Oi − npi) 2<br />

i=1<br />

npi<br />

> χ 2 k−1−l(1 − α)<br />

181


11.8. Příklad. Za války byl Londýn bombardován<br />

střelami V1 a V2. Hypotéza je, že střely dopadaly<br />

náhodně (bez zaměřování) do jednotlivých<br />

lokalit.<br />

Celkem na Londýn dopadlo 537 raket.<br />

Území města bylo rozděleno na 24 2 = 576 čtverců<br />

stejné velikosti.<br />

Empirická data:<br />

počet zásahů: 0 1 2 3 4 a více<br />

počet oblastí: 229 211 93 35 8<br />

X: počet zásahů v náhodně vybrané oblasti:<br />

<br />

Bi počet střel ,<br />

1. Odhadneme:<br />

λ . = 537<br />

<br />

=<br />

576<br />

počet střel<br />

2. Platí-li H0 je<br />

P [X = i] = λi e −λ<br />

<br />

1<br />

≈ P o počet střel ·<br />

počet oblastí<br />

<br />

.<br />

počet oblastí<br />

i!<br />

.<br />

182<br />

<br />

1<br />

.<br />

počet oblastí


počet pokusů = počet oblastí<br />

n = 576<br />

537<br />

−<br />

nP [X = 0] = 576 e 576<br />

.<br />

= 226, 7 .<br />

nP [X = 1] = 576 · 537 537<br />

e− 576<br />

576<br />

nP [X = 2] . = 98, 5 .<br />

nP [X = 3] . = 30, 6 .<br />

nP [X ≥ 4] . = 8, 7 .<br />

.<br />

= 211, 4 .<br />

počet zásahů: 0 1 2 3 4 a více<br />

skutečnost: 229 211 93 35 8<br />

teorie: 226,7 211,4 98,5 30,6 8,7<br />

Numerický výpočet:<br />

5 (0i − npi) 2<br />

= 1, 569<br />

npi<br />

i=1<br />

χ 2 5−1−1(0, 95) = 7, 81 .<br />

Závěr: Na hladině významnosti 5% potvrzujeme<br />

hypotézu H0.<br />

183

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!