Intervalové odhady parametrů(10)

Intervalové odhady parametrů(10) Intervalové odhady parametrů(10)

math.feld.cvut.cz
from math.feld.cvut.cz More from this publisher
20.07.2013 Views

4. Intervalové odhady parametrů rozdělení. Jednou ze základních úloh mtematické statistiky je stanovení hodnot parametrů rozdělení, ze kterého máme k dispozici náhodný výběr. Nejčastěji hledáme odhady dvou druhů: -bodový odhad (point estimate, estimator) je odhad parametru pomocí statistiky (funkce náhodného výběru), jejíž hodnotu pro datový soubor považujeme za hledanou hodnotu neznámého parametru rozdělení (či jeho funkce); -intervalový odhad (konfidenční interval) (confidence interval) je interval, ve kterém se hodnota neznámého parametru vyskytuje s požadovanou pravděpodobností, pochopitelně s hodnotou blízkou jedné. Intervalový odhad. Jestliže je θ neznámý parametr zkoumaného rozdělení a τ(θ) je funkce parametru, kterou odhadujeme, pak hledáme statistiky Td a Th takové, že pro koeficient spolehlivosti (confidence level) (1 − α) platí: P (Td ≤ τ(θ) ≤ Th) = 1 − α, (oboustranný odhad) (two-tailed) přičemž obvykle ještě požadujeme P (τ(θ) < Td) = P (τ(θ) > Th) = α 2 . Intervalovým odhadem (oboustranným) funkce τ(θ) je interval (Td, Th). Někdy hledáme pouze jednostranné odhady (one-tailed). Je pak: τ(θ) ∈ (Td, ∞), kde P (τ(θ) ≥ Td) = 1 − α a P (τ(θ) < Td) = α; τ(θ) ∈ (−∞, Th), kde P (τ(θ) ≤ Th) = 1 − α a P (τ(θ) > Th = α. Obvykle volíme α = 0, 1; 0, 05, 0, 01. Spolehlivost odhadu (level of significance) je pak (1 − α) = 0, 9, 0, 95, 0, 99. To znamená, že po řadě v 90%, v 95% nebo v 99% případech je náš odhad pro parametr správný. Intervalové odhady parametrů některých rozdělení. 1. Normální rozdělení. A) Odhad parametru µ (střední hodnoty) rozdělení N(µ, σ2 ) při známém rozptylu σ2 . Zde použijeme statistiku X (výběrový průměr) jako X − µ √ jeho odhad. Víme, že náhodná veličina U = n má normované nor- σ mální rozdělení N(0, 1). Potom je P (|U| ≤ u1− α) = 1 − α ⇔ −u1− α 2 2 X − µ √ ≤ n ≤ u1− σ α 2 , kde symbolem up, 0 < p < 1 označujeme p−kvantil normovaného nor- 39

4. <strong>Intervalové</strong> <strong>odhady</strong> <strong>parametrů</strong> rozdělení.<br />

Jednou ze základních úloh mtematické statistiky je stanovení hodnot <strong>parametrů</strong><br />

rozdělení, ze kterého máme k dispozici náhodný výběr. Nejčastěji<br />

hledáme <strong>odhady</strong> dvou druhů:<br />

-bodový odhad (point estimate, estimator) je odhad parametru pomocí<br />

statistiky (funkce náhodného výběru), jejíž hodnotu pro datový soubor<br />

považujeme za hledanou hodnotu neznámého parametru rozdělení (či<br />

jeho funkce);<br />

-intervalový odhad (konfidenční interval) (confidence interval) je<br />

interval, ve kterém se hodnota neznámého parametru vyskytuje s požadovanou<br />

pravděpodobností, pochopitelně s hodnotou blízkou jedné.<br />

Intervalový odhad. Jestliže je θ neznámý parametr zkoumaného rozdělení<br />

a τ(θ) je funkce parametru, kterou odhadujeme, pak hledáme statistiky<br />

Td a Th takové, že pro koeficient spolehlivosti (confidence level)<br />

(1 − α) platí:<br />

P (Td ≤ τ(θ) ≤ Th) = 1 − α, (oboustranný odhad) (two-tailed) přičemž<br />

obvykle ještě požadujeme P (τ(θ) < Td) = P (τ(θ) > Th) = α<br />

2 . Intervalovým<br />

odhadem (oboustranným) funkce τ(θ) je interval (Td, Th).<br />

Někdy hledáme pouze jednostranné <strong>odhady</strong> (one-tailed). Je pak:<br />

τ(θ) ∈ (Td, ∞), kde P (τ(θ) ≥ Td) = 1 − α a P (τ(θ) < Td) = α;<br />

τ(θ) ∈ (−∞, Th), kde P (τ(θ) ≤ Th) = 1 − α a P (τ(θ) > Th = α.<br />

Obvykle volíme α = 0, 1; 0, 05, 0, 01. Spolehlivost odhadu (level of<br />

significance) je pak (1 − α) = 0, 9, 0, 95, 0, 99. To znamená, že po řadě v<br />

90%, v 95% nebo v 99% případech je náš odhad pro parametr správný.<br />

<strong>Intervalové</strong> <strong>odhady</strong> <strong>parametrů</strong> některých rozdělení.<br />

1. Normální rozdělení.<br />

A) Odhad parametru µ (střední hodnoty) rozdělení N(µ, σ2 ) při známém<br />

rozptylu σ2 . Zde použijeme statistiku X (výběrový průměr) jako<br />

X − µ √<br />

jeho odhad. Víme, že náhodná veličina U = n má normované nor-<br />

σ<br />

mální rozdělení N(0, 1). Potom je<br />

P (|U| ≤ u1− α)<br />

= 1 − α ⇔ −u1− α<br />

2 2<br />

X − µ √<br />

≤ n ≤ u1−<br />

σ<br />

α<br />

2 ,<br />

kde symbolem up, 0 < p < 1 označujeme p−kvantil normovaného nor-<br />

39


málního rozdělení N(0, 1). Odtud dostaneme, že<br />

Td = X − σ √ n u1− α<br />

2 ≤ µ ≤ Th = X + σ √ n u1− α<br />

2 .<br />

Jednostrannými <strong>odhady</strong> jsou intervaly (levostranný), resp. (pravostranný)<br />

µ ≤ Th = X + σ √ n u1−α, resp. µ ≥ Td = X − σ √ n u1−α.<br />

B) Odhad parametru σ2 při známé střední hodnotě µ. Zde použijeme<br />

skutečnosti, že má náhodná veličina Ui = Xi − µ<br />

normované normální<br />

σ<br />

rozdělení N(0, 1). Potom má náhodná veličina V = n 2<br />

Xi − µ<br />

lení χ 2 (n). Je pak<br />

s 2 = 1<br />

n<br />

n<br />

i=1<br />

(Xi − µ) 2 = σ2<br />

n<br />

n<br />

2<br />

Xi − µ<br />

i=1<br />

σ<br />

i=1<br />

= σ2<br />

n V.<br />

σ<br />

rozdě-<br />

Má tudíž statistika V = ns2<br />

σ 2 rozdělení χ 2 (n). Pro oboustranný odhad<br />

dostaneme<br />

P (v1 ≤ V ≤ v2) = 1 − α ⇒ v1 = χ 2 α<br />

2<br />

(n) a v2 = χ 2 1− α(n),<br />

2<br />

kde symbolem χ 2 p(n) označujeme p−kvantil rozdělení χ 2 (n). Odtud plyne<br />

odhad<br />

χ 2 α(n)<br />

≤<br />

2<br />

ns2<br />

σ2 ≤ χ21− α<br />

2<br />

(n) ⇒ ns2<br />

(n) ≤ σ2 ≤ ns2<br />

χ2 α(n)<br />

.<br />

χ 2 1− α<br />

2<br />

Obdobně dostaneme jednostranné <strong>odhady</strong> (pravostranný) resp. (levostranný)<br />

σ 2 ≤ ns2<br />

χ2 , resp.<br />

α(n)<br />

ns 2<br />

χ 2 1−α(n) ≤ σ2 .<br />

C) Odhad střední hodnoty µ za podmínky, že rozptyl σ2 uvažovaného<br />

rozdělení není znám. Ke stanovení intervalu spolehlivosti použijeme statis-<br />

X − µ √<br />

tiku T = n, o které víme, že má Studentovo t−rozdělení t(n−1)<br />

S<br />

40<br />

2


o (n − 1) stupních volnosti. Je totiž<br />

a<br />

U =<br />

neboť X ∼ N(µ; σ 2 /n). Dále je<br />

a<br />

T =<br />

X − µ<br />

σ√ n<br />

Z = (n − 1) S2<br />

σ 2 = n <br />

i=1<br />

X−µ<br />

σ<br />

S<br />

σ<br />

⎛<br />

⎝<br />

√ n<br />

∼ N(0; 1),<br />

X − Xi<br />

σ<br />

T = U<br />

Z<br />

n−1<br />

⎞2<br />

má tedy Studentovo rozdělení t(n − 1).<br />

Interval spolehlivosti určíme z podmínky<br />

P <br />

|T | ≤ t1− α(n<br />

− 1) = 1 − α.<br />

Odtud je<br />

tudíž<br />

−t1− α<br />

2<br />

2<br />

⎠<br />

X − µ √<br />

≤ n ≤ t1−<br />

S<br />

α<br />

2 ,<br />

X − S √ t1−<br />

n α<br />

2 ≤ µ ≤ X + S √ t1−<br />

n α<br />

2<br />

∼ χ 2 (n − 1)<br />

je oboustraný interval spolehlivosti pro parametr µ.<br />

Obdobně dostaneme jednostrané intervaly (pravostranný), resp. (levostranný)<br />

ve tvaru:<br />

µ ≤ X + S √ n t1−α, µ ≥ X − S √ n t1−α,<br />

kde symbolem tα označujeme α kvantil uvažovaného rozdělení.<br />

D) Odhad parametru σ2 při neznámé střední hodnotě µ. Zde použi-<br />

n − 1<br />

jeme statistiku Y =<br />

σ2 S2 , která má rozdělení χ2 (n − 1). Je totiž<br />

Y = n ⎛ ⎞2<br />

X − Xi<br />

⎝ ⎠ ∼ χ<br />

i=1 σ<br />

2 (n − 1)<br />

41


a dále vycházíme ze skutečnosti, že pro statistiku S 2 je E(S 2 ) = σ 2 a<br />

může tedy sloužit jako vhodný odhad parametru σ 2 . Oboustraný interval<br />

spolehlivosti dostaneme z podmínky<br />

P (v1 ≤ Y ≤ v2) = 1 − α ⇒ v1 = χ 2 α<br />

2<br />

(n − 1), v2 = χ 2 1− α(n<br />

− 1)<br />

2<br />

jsou odpovídající kvantily rozdělení χ 2 . Odtud plyne pro oboustraný interval<br />

spolehlivosti<br />

v1 ≤<br />

(n − 1)S2<br />

σ 2<br />

≤ v2 ⇒<br />

(n − 1)<br />

S 2 ≤ σ<br />

2(n − 1)<br />

S 2 .<br />

Jednoduchou úpravou získáme jednostrané intervaly spolehlivosti (pravostranný),<br />

resp. (levostranný) ve tvaru<br />

σ 2 ≤<br />

(n − 1)<br />

S 2 ,<br />

v1<br />

v2<br />

(n − 1)<br />

v2<br />

S 2 ≤ σ 2 ,<br />

kde v1 a v2 jsou zde po řadě kvantily χ 2 α(n−1), v2 = χ 2 1−α(n−1) rozdělení<br />

chí-kvadrát o (n − 1) stupních volnosti.<br />

2. Exponenciální rozdělení.<br />

Uvedeme interval spolehlivosti pro rozdělení Exp(0; δ), kde využijeme<br />

skutečnosti, že je střední hodnota E(X) = δ. Statistika T = 2nX<br />

δ má<br />

totiž rozdělení χ2 (2n). O tom se snadno přesvědčíme pomocí charakteristické<br />

funkce. Jestliže uvážíme, že náhodná veličina X, která má uvažované<br />

1<br />

exponenciální rozdělení, má charakteristickou funkci ψX(t) = , pak<br />

v1<br />

1 − jtδ<br />

1<br />

pro statistiku T dostaneme charakteristickou funkci ψT (t) =<br />

(1 − 2jt) n.<br />

To je ovšem charakteristická funkce náhodné veličiny, která má rozdělení<br />

χ(2n).<br />

Je totiž<br />

X = n <br />

= E <br />

e jtx1<br />

i−1<br />

Xi ⇒ ψ X = E<br />

<br />

.E <br />

e jtx2<br />

Pro exponenciální rozdělení Exp(0; δ) je<br />

ψX(t) = 1<br />

δ<br />

∞<br />

0<br />

⎛<br />

⎜<br />

⎝e<br />

jt n<br />

xi<br />

i=1<br />

⎞<br />

⎟<br />

⎠ =<br />

<br />

. . . E <br />

e jtxn<br />

<br />

= (ψX(t)) n .<br />

e jtx e −x/δ dx = 1<br />

δ<br />

42<br />

∞<br />

0<br />

e −x(1/δ−jt) dx =


Je tedy<br />

Dále je<br />

tedy<br />

= 1<br />

δ<br />

−δ <br />

e<br />

1 − δjt<br />

−x(1/δ−jt∞ 0 =<br />

ψ X (t) =<br />

1<br />

(1 − δjt) n.<br />

1<br />

1 − δjt<br />

ψαX(t) = E <br />

jtαX<br />

e = ψX(αt),<br />

ψT (t) = ψ( X( 2<br />

t) =<br />

δ<br />

což je charkteristická funkce rozdělení χ 2 (2n).<br />

Interval spolehlivosti získáme z identity<br />

kde v1 = χ 2 α<br />

2<br />

1<br />

1 − 2jt) n,<br />

P (v1 ≤ T ≤ v2) = 1 − α ⇒ v1 ≤ 2nX<br />

δ ≤ v2 ⇒<br />

2nX<br />

v2<br />

≤ δ ≤ 2nX<br />

,<br />

(2n) a v2 = χ2 1− α(2n)<br />

kvantil rozdělení chí-kvadrát.<br />

2<br />

Obdobně dostaneme jednostrané intervaly spolehlivosti ve tvaru<br />

2nX<br />

v2<br />

v1<br />

≤ δ, δ ≤ 2nX<br />

,<br />

kde v1 = χ 2 α(2n) a v2 = χ 2 1−α(2n) jsou kvantily rozdělení chí-kvadrát.<br />

Pro rozsáhlé výběry při velkém n můžeme použít důsledku centrální<br />

limitní věty. Protože pro náhodnou veličinu s exponenciálním rozdělení je<br />

E(X) = δ a D(X) = δ2 , je pro výběrový průměr náhodného výběru z<br />

tohoto rozdělení E(X) = δ a D(X) = δ2<br />

n . Potom má náhodná veličina<br />

Un =<br />

X − δ<br />

δ<br />

v limitě normované normální rozdělení N(0; 1). Intervaly spolehlivosti můžeme<br />

určit pomocí kvantilů normálního rozdělení obdobně jako v odstavci<br />

1A. V náhodné veličině Un použijeme odhadu δ = X a pro stanovení<br />

intervalu spolehlivosti vycházíme z náhodné veličiny<br />

U =<br />

X − δ<br />

X<br />

43<br />

√ n<br />

√ n,<br />

v1


u které předpokládáme normované normální rozdělení N(0; 1). Z identity<br />

P<br />

⎛<br />

<br />

<br />

⎝<br />

<br />

<br />

X − δ<br />

X<br />

√ n<br />

⎞<br />

<br />

<br />

<br />

< u1− α<br />

2<br />

dostaneme interval spolehlivosti ve tvaru<br />

X − u1− α<br />

2<br />

⎛<br />

⎞<br />

⎠ = 1 − α<br />

⎝ X √ ⎠ < δ < X + u1−<br />

n<br />

α ⎝<br />

2<br />

X √ ⎠,<br />

n<br />

kde symbolem uα označujeme α−kvantil normovaného normálního rozdělení.<br />

Pokud je náhodný výběr výběrem s obecného exponenciálního rozdělení<br />

Ex(A; δ), pak stanovíme odhad parametru A pomocí metod uvedených v<br />

odstavci 4 a zpracováváme soubor Yi = Xi − A, 1 ≤ i ≤ n.<br />

3. Alternativní rozdělení.<br />

Odhadujeme hodnotu parametru p, kde využíváme skutečnosti, že pro<br />

náhodný výběr z alternativního rozdělení má výběrový úhrn X = n<br />

i=1 Xi<br />

binomické rozdělení Bi(n, p). Podle centrální limitní věty lze pro dostatečně<br />

rozsáhlý výběr předpokládat, že součet má normální rozdělení. Protože je<br />

E( X) = np a D( X) = np(1 − p), má pro np(1 − p) > 9 výběrový úhrn X<br />

normální rozdělení N(np, np(1 − p)). Náhodná veličina<br />

Z =<br />

X − np<br />

<br />

np(1 − p)<br />

má normované normální rozdělení.<br />

Potom je<br />

P (|Z| ≤ u1− α<br />

2<br />

) = 1 − α ⇔ −u1− α<br />

2<br />

<br />

<br />

<br />

Odtud plyne, že pro parametr p platí<br />

X − u1− α<br />

2<br />

<br />

<br />

<br />

p(1 − p)<br />

n<br />

= X − p<br />

p(1−p)<br />

n<br />

p(1 − p)<br />

n<br />

≤ p ≤ X + u1− α<br />

2<br />

⎛<br />

∼ N(0; 1)<br />

⎞<br />

≤ X − p ≤ u1− α<br />

2<br />

<br />

<br />

<br />

p(1 − p)<br />

.<br />

n<br />

<br />

<br />

<br />

p(1 − p)<br />

.<br />

n<br />

Intervalový odhad parametru p obsahuje ale hodnotu rozptylu, která<br />

X(1 − X)<br />

závisí na p. Hodnotu rozptylu nahradíme jeho odhadem . Pro<br />

n<br />

44


parametr p dostaneme intervalový odhad<br />

X − u1− α<br />

2<br />

<br />

<br />

<br />

X(1 − X)<br />

n<br />

≤ p ≤ X + u1− α<br />

2<br />

<br />

<br />

<br />

X(1 − X)<br />

.<br />

n<br />

4. Geometrické rozdělení s parametrem p má pravděpodobnostní<br />

funkci p(k) = p(1 − p) k−1 , k = 1, 2, . . . , a odhadujeme parametr p. Pro <br />

,<br />

náhodnou veličinu X s tímto rozdělením je E(X) = 1<br />

p<br />

a D(X) = 1<br />

p<br />

<br />

1<br />

p − 1<br />

tedy pro náhodný výběr z tohoto rozdělení dostaneme, že E(X) = 1<br />

p a<br />

<br />

1<br />

p − 1 .<br />

Pro základní číselné charakteristiky je:<br />

D(X) = 1<br />

np<br />

E(X) = ∞ <br />

= ∞ <br />

k=2<br />

k=1<br />

E(X 2 ) = ∞ <br />

kp(1 − p) k−1 = −p ∞ <br />

k=1<br />

k(k −1)p(1−p) k−1 + ∞ <br />

= p(1 − p)<br />

⎛<br />

⎝<br />

k=1<br />

′ 1<br />

= −p − 1<br />

p<br />

<br />

k 2 p(1 − p) k−1 = ∞ <br />

k=1<br />

(1 − p)2<br />

1 − (1 − p)<br />

(1 − p) k ′ = −p<br />

= −p −1 1<br />

=<br />

p2 p ;<br />

k=1<br />

⎛<br />

⎝<br />

1 − p<br />

1 − (1 − p)<br />

[k(k − 1) + k]p(1 − p) k−1 =<br />

kp(1−p) k−1 = p(1−p) ∞ <br />

⎞′′<br />

⎠<br />

= p(1 − p) 2 1<br />

+<br />

p3 p<br />

1<br />

−<br />

p2 p<br />

k=2<br />

⎞′<br />

⎠<br />

=<br />

<br />

(1 − p) k ′′ + 1<br />

p =<br />

′′ 1<br />

= p(1 − p) − 2 + p +<br />

p 1<br />

p =<br />

2 1<br />

= −<br />

p2 p ;<br />

D(X) = E(X 2 ) − (E(X)) 2 = 2<br />

<br />

1 1 1 1 1<br />

− = − = − 1 .<br />

p2 p2 p p p<br />

Je-li (X1, X2, . . . , Xn) náhodný výběr z geometrického rozdělení, pak pro<br />

výběrový úhrn ˜ X a výběrový průměr X platí:<br />

E( X) = n<br />

,<br />

p<br />

1<br />

E(X) =<br />

p , D( X) = n<br />

<br />

1<br />

− 1 ,<br />

p p<br />

D(X) = 1<br />

<br />

1<br />

− 1 .<br />

np p<br />

Pro velké hodnoty rozsahu výběru má podle centrální limitní věty náhodná<br />

veličina<br />

Un = <br />

1 X − p<br />

1<br />

np<br />

45<br />

<br />

1<br />

p − 1


v limitě normální rozdělení N(0; 1).<br />

Pro interval spolehlivosti k dané hodnotě α dostaneme interval spoleh-<br />

livosti ve tvaru <br />

<br />

1<br />

Jestliže použijeme odhadu 1<br />

p<br />

pro parametr p ve tvaru<br />

X − 1<br />

√ n u1− α<br />

2<br />

p<br />

X − 1<br />

1<br />

p<br />

p<br />

− 1<br />

<br />

1<br />

p − 1<br />

<br />

<br />

X(X − 1) ≤ 1<br />

p<br />

√ n<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

<br />

≤ u1− α<br />

2 .<br />

.= X(X − 1), pak dostaneme interval<br />

≤ X + 1<br />

√ n u1− α<br />

2<br />

<br />

X(X − 1).<br />

Příklad: Při hodech hrací kostkou sledujeme počet hodů, které musíme<br />

provést, dokud nepadne šestka. Je tedy p = 1<br />

6 = 0, 16666, α = 0, 1 je z tabulek u0,95 = 1, 64485.<br />

Pro náhodné výběry jsme dostali:<br />

1<br />

p = 6. Pro<br />

n = 30, X = 4, 63333, tedy<br />

3, 401183 ≤ 1<br />

p ≤ 5, 8655 ⇒ 0, 1705 ≤ p ≤ 0, 294.<br />

n = 120, X = 5, 65, tedy<br />

4, 88 ≤ 1<br />

p ≤ 6, 412 ⇒ 0, 1558 ≤ p ≤ 0, 205.<br />

n = 180, X = 5, 8555, tedy<br />

5, 2018 ≤ 1<br />

p ≤ 6, 5093, tedy<br />

0, 1536 ≤ p ≤ 0, 19224.<br />

46


Příklady. Určete intervaly spolehlivosti, oboustranné i jednostranné<br />

pro zadané hodnoty α, α = 0, 1, 0, 05, 0, 01.<br />

1. Normální rozdělení.<br />

Ukážeme si použití na datech ze souborů, které jsou přehledem výšek v<br />

cm a vah v kg ve skupinách studentů. Příslušné výběrové charakteristiky<br />

vždy uvedeme u řešené úlohy.<br />

V tabulkách jsou zadány hodnoty výběrových statistik pro náhodný<br />

výběr z normálního rozdělení. Písmenem X je označen soubor výšek posluchačů<br />

v cm a písmenem Y je označen soubor vah v kg. Písmeno M značí<br />

muže, písmeno Ž ženy.<br />

n je rozsah souboru, X je hodnota výběrového průměru a S 2 X je hodnota<br />

výběrového rozptylu pro náhodný výběr.<br />

soubor výb. průměr výb. rozptyl počet hodnot rozpětí<br />

1990,M X = 180 S 2 X = 38, 8 n = 71 〈165, 200〉<br />

1990,Ž X = 165, 55 S 2 X = 47, 27 n = 11 〈152, 178〉<br />

1990,M+Ž X = 179, 12 S 2 X = 58, 875 n = 82 〈152, 200〉<br />

2000(1+2) X = 181, 673 S 2 X = 68, 489 n = 52 〈165, 201〉<br />

2000(1) X = 181, 607 S 2 X = 94, 024 n = 28 〈165, 201〉<br />

2000(2) X = 181, 75 S 2 X = 38, 687 n = 24 〈172, 196〉<br />

1990,M Y = 72, 52 S 2 Y = 55, 192 n = 71 〈60, 95〉<br />

1990,Ž Y = 56, 78 S 2 Y = 41, 017 n = 11 〈45, 67〉<br />

1990,M+Ž Y = 71, 57 S 2 Y = 67, 975 n = 82 〈45, 95〉<br />

2000(1+2) Y = 77, 923 S 2 Y = <strong>10</strong>6, 148 n = 52 〈60, <strong>10</strong>5〉<br />

2000(1) Y = 75, 893 S 2 Y = 128, 31 n = 28 〈60, <strong>10</strong>5〉<br />

2000(2) Y = 80, 292 S 2 Y = 69, 873 n = 24 〈61, 95〉<br />

n rozsah souboru, X výběrový průměr, S 2 výběrový rozptyl, V S výška<br />

v cm, V H váha v kg.<br />

47


n X S 2 n X S 2<br />

VS-1 35 182, 11 61, 1 VH-1 35 75, 4 1<strong>10</strong>, 78<br />

VS-2 30 183 64, 97 VH-2 30 77, 4 <strong>10</strong>2, 59<br />

VS-3 34 183, 35 72, 48 VH-3 34 77, 53 134, 62<br />

VS-4 27 181 74, 77 VH-4 27 76, 74 59, 74<br />

1.1. Výběr je náhodným výběrem z normálního rozdělení N(µ; σ2 ) z<br />

danými parametry. Určete interval spolehlivosti pro střední hodnotu µ.<br />

Ke stanovení intervalů spolehlivosti použijeme statistiku<br />

X − µ √<br />

T = n ∼ t(n − 1),<br />

S<br />

která má t−rozdělení o n − 1 stupních volnosti. Poznamenejme, že pro<br />

n ≥ 30 je t−rozdělení již shodné z normovaným normálním rozdělením<br />

N(0; 1). Je pak:<br />

oboustranný interval spolehlivosti<br />

(♠) X − S √ n t1− α<br />

2 ≤ µ ≤ X + S √ n t1− α<br />

2 ;<br />

jednostranné intervaly spolehlivosti<br />

(♣) µ ≤ X + S √ n t1−α, µ ≥ X − S √ n t1−α.<br />

a) Soubor 1990(M): Jedná se o soubor výšek v cm, X = 180,<br />

S 2 = 38, 8, n = 71, rozpětí 〈165, 200〉.<br />

Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />

oboustranný interval<br />

α t1− α<br />

2 S/ √ n µ<br />

0, 1 1, 64485 1, 216 178, 78 < µ < 181, 216<br />

0, 05 1, 95996 1, 4489 178, 55 < µ < 181, 449<br />

0, 001 2, 57583 1, 9042 178, 1 < µ < 181, 904<br />

jednostranné intervaly<br />

α t1−α S/ √ n µ µ<br />

0, 1 1, 2816 0, 9474 µ < 180, 95 µ > 179, 05<br />

0, 05 1, 64485 1, 216 µ < 181, 22 µ > 178, 78<br />

0, 001 2, 3264 1, 95996 µ < 181, 72 µ > 178, 28<br />

48


) Soubor 1990(Ž): Jedná se o soubor výšek v cm, X = 165, 55,<br />

S 2 = 47, 27, n = 11, rozpětí 〈152, 178〉.<br />

Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />

oboustranný interval<br />

α t1− α<br />

2 S/ √ n µ<br />

0, 1 1, 8125 3, 7573 161, 79 < µ < 169, 31<br />

0, 05 2, 2281 4, 61885 160, 93 < µ < 170, 17<br />

0, 001 2, 76383 6, 5699 158, 98 < µ < 172, 12<br />

jednostranné intervaly<br />

α t1−α S/ √ n µ µ<br />

0, 1 1, 3722 2, 8446 µ < 168, 39 µ > 162, 70<br />

0, 05 1, 8125 3, 7573 µ < 169, 31 µ > 161, 79<br />

0, 001 2, 7638 5, 7294 µ < 171, 28 µ > 159, 82<br />

c) Soubor 1990(M): Jedná se o soubor vah v kg, Y = 72, 52,<br />

S 2 = 55, 192, n = 71, rozpětí 〈60, 95〉.<br />

Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />

oboustranný interval<br />

α t1− α<br />

2 S/ √ n µ<br />

0, 1 1, 64485 1, 4502 71, 07 < µ < 73, 97<br />

0, 05 1, 95996 1, 728 70, 79 < µ < 74, 25<br />

0, 001 2, 57583 2, 27 70, 25 < µ < 74, 79<br />

jednostranné intervaly<br />

α t1−α S/ √ n µ µ<br />

0, 1 1, 2816 1, 1299 µ < 73, 65 µ > 71, 39<br />

0, 05 1, 64485 1, 4502 µ < 73, 97 µ > 71, 07<br />

0, 001 2, 3264 2, 051 µ < 74, 57 µ > 70, 47<br />

49


d) Soubor 1990(Ž): Jedná se o soubor vah v kg, Y = 56, 78,<br />

S 2 = 41, 017, n = 11, rozpětí 〈45, 77〉.<br />

Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />

oboustranný interval<br />

α t1− α<br />

2 S/ √ n µ<br />

0, 1 1, 8125 3, 499 53, 28 < µ < 60, 28<br />

0, 05 2, 2281 4, 302 52, 48 < µ < 61, 08<br />

0, 001 2, 76383 6, 1199 47, 66 < µ < 65, 90<br />

jednostranné intervaly<br />

α t1−α S/ √ n µ µ<br />

0, 1 1, 3722 2, 6497 µ < 59, 43 µ > 54, 13<br />

0, 05 1, 8125 3, 4999 µ < 60, 28 µ > 53, 28<br />

0, 001 2, 7638 5, 3374 µ < 62, 12 µ > 51, 44<br />

1.2. Výběr je náhodným výběrem z normálního rozdělení N(µ; σ 2 ) z<br />

danými parametry. Určete interval spolehlivosti pro rozptyl σ 2 .<br />

Ke stanovení intervalů spolehlivosti použijeme statistiku<br />

Y =<br />

n − 1<br />

σ 2 S2 ,<br />

která má rozdělení χ 2 (n − 1). Vycházíme ze skutečnosti, že pro statistiku<br />

S 2 je E(S 2 ) = σ 2 a může tedy sloužit jako vhodný odhad parametru σ 2 .<br />

Oboustraný interval spolehlivosti dostaneme ve tvaru<br />

(♠♠)<br />

(n − 1)<br />

χ2 1− α<br />

S<br />

2<br />

2 < σ 2 <<br />

(n − 1)<br />

χ2 S<br />

α<br />

2<br />

2 .<br />

Jednostranné intervaly spolehlivosti dostaneme ve tvaru<br />

(♣♣) σ 2 ><br />

(n − 1)<br />

χ2 1− α<br />

S<br />

2<br />

2 , σ 2 <<br />

50<br />

(n − 1)<br />

χ2 S<br />

α<br />

2<br />

2 .


a) Soubor 1990(M): Jedná se o soubor výšek v cm, X = 180,<br />

S 2 = 38, 8, n = 71, rozpětí 〈165, 200〉.<br />

Ke stanovení intervalů použijeme vzorce (♠♠) a (♣♣).<br />

α χ 2 1− α<br />

2<br />

oboustranný interval<br />

χ 2 α<br />

2<br />

0, 1 90, 531 51, 739 30 < σ 2 < 52, 49<br />

0, 05 95, 023 48, 758 28, 58 < σ 2 < 55, 70<br />

0, 001 <strong>10</strong>4, 21 43, 275 26, 06 < σ 2 < 62, 76<br />

jednostranné intervaly<br />

α χ 2 1−α χ 2 α σ 2 σ 2<br />

0, 1 − − σ 2 < σ 2 ><br />

0, 05 90, 531 51, 739 σ 2 < 52, 49 σ 2 > 30<br />

0, 001 <strong>10</strong>0, 43 45, 442 σ 2 < 59, 77 σ 2 > 27, 04<br />

b) Soubor 1990(Ž): Jedná se o soubor výšek v cm, X = 165, 55,<br />

S 2 = 47, 27, n = 11, rozpětí 〈152, 178〉.<br />

Ke stanovení intervalů použijeme vzorce (♠♠) a (♣♣).<br />

α χ 2 1− α<br />

2<br />

oboustranný interval<br />

χ 2 α<br />

2<br />

0, 1 18, 307 3, 9403 25, 82 < σ 2 < 119, 96<br />

0, 05 20, 483 3, 247 23, 08 < σ 2 < 145, 6<br />

0, 001 25, 188 2, 1559 18, 77 < σ 2 < 198, 4<br />

jednostranné intervaly<br />

α χ 2 1−α χ 2 α σ 2 σ 2<br />

0, 1 − − σ 2 < σ 2 ><br />

0, 05 18, 307 3, 9403 σ 2 < 119, 96 σ 2 > 25, 82<br />

0, 001 23, 209 2, 5582 σ 2 < 184, 78 σ 2 > 20, 37<br />

51<br />

σ 2<br />

σ 2


c) Soubor 1990(M): Jedná se o soubor vah v kg, Y = 72, 52,<br />

S 2 = 55, 192, n = 71, rozpětí 〈60, 95〉.<br />

Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />

α χ 2 1− α<br />

2<br />

oboustranný interval<br />

χ 2 α<br />

2<br />

0, 1 90, 531 51, 739 42, 68 < σ 2 < 74, 67<br />

0, 05 95, 023 48, 758 40, 66 < σ 2 < 79, 24<br />

0, 001 <strong>10</strong>4, 21 43, 275 37, 07 < σ 2 < 89, 28<br />

jednostranné intervaly<br />

α χ 2 1−α χ 2 α σ 2 σ 2<br />

0, 1 − − σ 2 < σ 2 ><br />

0, 05 90, 531 51, 739 σ 2 < 74, 67 σ 2 > 42, 68<br />

0, 001 <strong>10</strong>0, 43 45, 442 σ 2 < 85, 02 σ 2 > 38, 47<br />

d) Soubor 1990(Ž): Jedná se o soubor vah v kg, Y = 56, 78,<br />

S 2 = 41, 017, n = 11, rozpětí 〈45, 77〉.<br />

Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />

α χ 2 1− α<br />

2<br />

oboustranný interval<br />

χ 2 α<br />

2<br />

0, 1 18, 307 3, 9403 22, 41 < σ 2 < <strong>10</strong>4, 1<br />

0, 05 20, 483 3, 247 20, 02 < σ 2 < 126, 32<br />

0, 001 25, 188 2, 1559 16, 28 < σ 2 < 190, 25<br />

jednostranné intervaly<br />

α χ 2 1−α χ 2 α σ 2 σ 2<br />

0, 1 − − σ 2 < σ 2 ><br />

0, 05 18, 307 3, 9403 σ 2 < <strong>10</strong>4, 1 σ 2 > 22, 41<br />

0, 001 23, 209 2, 5582 σ 2 < 160, 33 σ 2 > 17, 67<br />

52<br />

σ 2<br />

σ 2


2. Exponenciální rozdělení.<br />

2.1. Výběr je náhodným výběrem z exponenciálního rozdělení Exp(0; δ)<br />

z danými parametry. Určete interval spolehlivosti pro střední hodnotu δ.<br />

Zde využijeme skutečnosti, že je střední hodnota E(X) = δ. a toho, že<br />

statistika<br />

T = 2nX<br />

δ<br />

má rozdělení χ 2 (2n).<br />

Interval spolehlivosti získáme ve tvaru<br />

kde v1 = χ 2 α<br />

2<br />

2nX<br />

v2<br />

< δ < 2nX<br />

,<br />

(2n) a v2 = χ2 1− α(2n)<br />

kvantil rozdělení chí-kvadrát.<br />

2<br />

Obdobně dostaneme jednostrané intervaly spolehlivosti ve tvaru<br />

2nX<br />

v2<br />

v1<br />

< δ, δ < 2nX<br />

,<br />

kde v1 = χ 2 α(2n) a v2 = χ 2 1−α(2n) kvantil rozdělení chí-kvadrát.<br />

a) Soubor byl generován z exponenciálního rozdělení Exp(0; δ) a má<br />

parametry:<br />

X = 1, 094, n = 40.<br />

Potom je 2nX = 80.1, 094 = 87, 5318. Odtud dostaneme<br />

oboustranný interval spolehlivosti<br />

α χ 2 1− α<br />

2<br />

χ 2 α<br />

2<br />

0, 1 <strong>10</strong>1, 88 60, 391 0, 86 < δ < 1, 45<br />

0, 05 <strong>10</strong>6, 63 57, 153 0, 82 < δ < 1, 53<br />

0, 001 116, 32 51, 172 0, 75 < δ < 1, 71<br />

jednostranný interval spolehlivosti<br />

α χ 2 1−α χ 2 α δ δ<br />

0, 1 - - - -<br />

0, 05 <strong>10</strong>1, 88 60, 391 0, 86 < δ δ > 1, 45<br />

0, 001 <strong>10</strong>6, 63 57, 153 0, 82 < δ δ > 1, 53<br />

53<br />

v1<br />

δ


3. Alternativní rozdělení.<br />

V tabulce jsou hodnoty, které odpovídají výběru z alternativního rozdělení<br />

pro p = 1 .<br />

6 = 0, 1667. Jsou to počty, kolikrát při n hodech hrací kostkou<br />

padnou čísla 1, 2,. . . ,6. Podmínka pro aproximaci pomocí normálního rozdělení<br />

je np(1 − p) > 9, tedy n > 65.<br />

n ˜ X ˜ X ˜ X ˜ X ˜ X ˜ X n<br />

6<br />

90 <strong>10</strong> 14 15 13 22 16 15<br />

120 17 19 20 18 25 21 20<br />

150 24 22 25 22 28 29 25<br />

180 31 25 29 27 34 34 30<br />

240 39 39 40 34 49 39 40<br />

300 47 53 51 40 61 48 50<br />

V další tabulce jsou uvedeny výběrové průměry X, tedy <strong>odhady</strong> para-<br />

=<br />

.<br />

0, 1667.<br />

metru p = 1<br />

6<br />

n X X X X X X<br />

90 0,1111 0,1556 0,1667 0,1444 0,2444 0,1778<br />

120 0,1417 0,1583 0,1667 0,15 0,2083 0,175<br />

150 0,16 0,1466 0,1667 0,1467 0,1867 0,1933<br />

180 0,1722 0,1389 0,1611 0,15 0,1889 0,1889<br />

240 0,1625 0,1625 0,1667 0,1417 0,2042 0,1625<br />

300 0,1567 0,1767 0,17 0,133 0,2033 0,16<br />

Interval spolehlivosti pro parametr p určíme ze vzorce<br />

X − u1− α<br />

2<br />

<br />

<br />

<br />

X(1 − X)<br />

n<br />

≤ p ≤ X + u1− α<br />

2<br />

<br />

<br />

<br />

X(1 − X)<br />

n<br />

a příslušné výsledky jsou uvedeny v tabulce.<br />

Pro kvantily u1− α dostaneme z tabulek hodnoty:<br />

2<br />

u0,95 = 1, 64485, u0,975 = 1, 95996, u0,995 = 2, 57583.<br />

Pro kvantily uα, resp, u1−α dostaneme:<br />

u0,9 = 1, 28155, u0,95 = 1, 64485, u0,99 = 2, 32635.<br />

54


n < p < < p < < p <<br />

90 0,057 - 0,1655 0,<strong>10</strong>928 - 0,2188 0,<strong>10</strong>21 - 0,2313<br />

120 0,0894 - 0,1994 0,<strong>10</strong>35 - 0,2131 0,1<strong>10</strong>8 - 0,2226<br />

150 0,1<strong>10</strong>8 -0,2092 0,0991- 0,1941 0,1167 - 0,2167<br />

180 0,126 - 0,2184 0,0965 - 0,1813 0,116 - 0,2026<br />

240 0,1234- 0,2016 0,1234 - 0,2016 0,1271 - 0,2063<br />

300 0,1159 -0,1975 0,1405 - 0,2129 0,1343 - 0,2057<br />

n < p < < p < < p <<br />

90 0,934 - 0,1954 0,1699 - 0,3189 0,115 - 0,2441<br />

120 0,1573 - 0,2593 0,1547 - 0,2619 0,1179 - 0,2321<br />

150 0,0992 - 0,1942 0,1344 -0,2369 0,1403- 0,2463<br />

180 0,<strong>10</strong>61 - 0,1939 0,1409 - 0,2369 0,1409 - 0,2369<br />

240 0,<strong>10</strong>47 - 0,1787 0,1641- 0,247 0,1234 - 0,2016<br />

300 0,<strong>10</strong>08 - 0,1652 0,1651 -0,2415 0,1251 - 0,1949<br />

4. Geometrické rozdělení.<br />

Interval spolehlivosti pro parametr p má tvar<br />

X − 1<br />

√ n u1− α<br />

2<br />

<br />

X(X − 1) ≤ 1<br />

p<br />

≤ X + 1<br />

√ n u1− α<br />

2<br />

<br />

X(X − 1).<br />

Jeho vyjádření si ukážeme pro data jsou ze souboru z geometrickým<br />

rozdělením s parametrem p = 1 1<br />

6 , tedy p = 6. Jedná se o počet hodů hrací<br />

kostkou, které musíme provést, aby padlo zvolené číslo, např. šestka.<br />

Pro hodnotu α = 0, 1 je u0,95 = 1, 64485 a pro hodnoty ze souboru<br />

máme:<br />

n X < 1<br />

p<br />

30 4,633 3, 4 < 1<br />

p<br />

120 5,65 4, 88 < 1<br />

p<br />

180 5,86 5, 2 < 1<br />

p<br />

< < p <<br />

< 5, 87 0, 17 < p < 0, 29<br />

< 6, 412 0, 156 < p < 0, 205<br />

< 6, 5 0, 154 < p < 0, 192<br />

55

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!