Intervalové odhady parametrů(10)
Intervalové odhady parametrů(10) Intervalové odhady parametrů(10)
4. Intervalové odhady parametrů rozdělení. Jednou ze základních úloh mtematické statistiky je stanovení hodnot parametrů rozdělení, ze kterého máme k dispozici náhodný výběr. Nejčastěji hledáme odhady dvou druhů: -bodový odhad (point estimate, estimator) je odhad parametru pomocí statistiky (funkce náhodného výběru), jejíž hodnotu pro datový soubor považujeme za hledanou hodnotu neznámého parametru rozdělení (či jeho funkce); -intervalový odhad (konfidenční interval) (confidence interval) je interval, ve kterém se hodnota neznámého parametru vyskytuje s požadovanou pravděpodobností, pochopitelně s hodnotou blízkou jedné. Intervalový odhad. Jestliže je θ neznámý parametr zkoumaného rozdělení a τ(θ) je funkce parametru, kterou odhadujeme, pak hledáme statistiky Td a Th takové, že pro koeficient spolehlivosti (confidence level) (1 − α) platí: P (Td ≤ τ(θ) ≤ Th) = 1 − α, (oboustranný odhad) (two-tailed) přičemž obvykle ještě požadujeme P (τ(θ) < Td) = P (τ(θ) > Th) = α 2 . Intervalovým odhadem (oboustranným) funkce τ(θ) je interval (Td, Th). Někdy hledáme pouze jednostranné odhady (one-tailed). Je pak: τ(θ) ∈ (Td, ∞), kde P (τ(θ) ≥ Td) = 1 − α a P (τ(θ) < Td) = α; τ(θ) ∈ (−∞, Th), kde P (τ(θ) ≤ Th) = 1 − α a P (τ(θ) > Th = α. Obvykle volíme α = 0, 1; 0, 05, 0, 01. Spolehlivost odhadu (level of significance) je pak (1 − α) = 0, 9, 0, 95, 0, 99. To znamená, že po řadě v 90%, v 95% nebo v 99% případech je náš odhad pro parametr správný. Intervalové odhady parametrů některých rozdělení. 1. Normální rozdělení. A) Odhad parametru µ (střední hodnoty) rozdělení N(µ, σ2 ) při známém rozptylu σ2 . Zde použijeme statistiku X (výběrový průměr) jako X − µ √ jeho odhad. Víme, že náhodná veličina U = n má normované nor- σ mální rozdělení N(0, 1). Potom je P (|U| ≤ u1− α) = 1 − α ⇔ −u1− α 2 2 X − µ √ ≤ n ≤ u1− σ α 2 , kde symbolem up, 0 < p < 1 označujeme p−kvantil normovaného nor- 39
- Page 2 and 3: málního rozdělení N(0, 1). Odtu
- Page 4 and 5: a dále vycházíme ze skutečnosti
- Page 6 and 7: u které předpokládáme normovan
- Page 8 and 9: v limitě normální rozdělení N(
- Page 10 and 11: n X S 2 n X S 2 VS-1 35 182, 11 61,
- Page 12 and 13: d) Soubor 1990(Ž): Jedná se o sou
- Page 14 and 15: c) Soubor 1990(M): Jedná se o soub
- Page 16 and 17: 3. Alternativní rozdělení. V tab
4. <strong>Intervalové</strong> <strong>odhady</strong> <strong>parametrů</strong> rozdělení.<br />
Jednou ze základních úloh mtematické statistiky je stanovení hodnot <strong>parametrů</strong><br />
rozdělení, ze kterého máme k dispozici náhodný výběr. Nejčastěji<br />
hledáme <strong>odhady</strong> dvou druhů:<br />
-bodový odhad (point estimate, estimator) je odhad parametru pomocí<br />
statistiky (funkce náhodného výběru), jejíž hodnotu pro datový soubor<br />
považujeme za hledanou hodnotu neznámého parametru rozdělení (či<br />
jeho funkce);<br />
-intervalový odhad (konfidenční interval) (confidence interval) je<br />
interval, ve kterém se hodnota neznámého parametru vyskytuje s požadovanou<br />
pravděpodobností, pochopitelně s hodnotou blízkou jedné.<br />
Intervalový odhad. Jestliže je θ neznámý parametr zkoumaného rozdělení<br />
a τ(θ) je funkce parametru, kterou odhadujeme, pak hledáme statistiky<br />
Td a Th takové, že pro koeficient spolehlivosti (confidence level)<br />
(1 − α) platí:<br />
P (Td ≤ τ(θ) ≤ Th) = 1 − α, (oboustranný odhad) (two-tailed) přičemž<br />
obvykle ještě požadujeme P (τ(θ) < Td) = P (τ(θ) > Th) = α<br />
2 . Intervalovým<br />
odhadem (oboustranným) funkce τ(θ) je interval (Td, Th).<br />
Někdy hledáme pouze jednostranné <strong>odhady</strong> (one-tailed). Je pak:<br />
τ(θ) ∈ (Td, ∞), kde P (τ(θ) ≥ Td) = 1 − α a P (τ(θ) < Td) = α;<br />
τ(θ) ∈ (−∞, Th), kde P (τ(θ) ≤ Th) = 1 − α a P (τ(θ) > Th = α.<br />
Obvykle volíme α = 0, 1; 0, 05, 0, 01. Spolehlivost odhadu (level of<br />
significance) je pak (1 − α) = 0, 9, 0, 95, 0, 99. To znamená, že po řadě v<br />
90%, v 95% nebo v 99% případech je náš odhad pro parametr správný.<br />
<strong>Intervalové</strong> <strong>odhady</strong> <strong>parametrů</strong> některých rozdělení.<br />
1. Normální rozdělení.<br />
A) Odhad parametru µ (střední hodnoty) rozdělení N(µ, σ2 ) při známém<br />
rozptylu σ2 . Zde použijeme statistiku X (výběrový průměr) jako<br />
X − µ √<br />
jeho odhad. Víme, že náhodná veličina U = n má normované nor-<br />
σ<br />
mální rozdělení N(0, 1). Potom je<br />
P (|U| ≤ u1− α)<br />
= 1 − α ⇔ −u1− α<br />
2 2<br />
X − µ √<br />
≤ n ≤ u1−<br />
σ<br />
α<br />
2 ,<br />
kde symbolem up, 0 < p < 1 označujeme p−kvantil normovaného nor-<br />
39
málního rozdělení N(0, 1). Odtud dostaneme, že<br />
Td = X − σ √ n u1− α<br />
2 ≤ µ ≤ Th = X + σ √ n u1− α<br />
2 .<br />
Jednostrannými <strong>odhady</strong> jsou intervaly (levostranný), resp. (pravostranný)<br />
µ ≤ Th = X + σ √ n u1−α, resp. µ ≥ Td = X − σ √ n u1−α.<br />
B) Odhad parametru σ2 při známé střední hodnotě µ. Zde použijeme<br />
skutečnosti, že má náhodná veličina Ui = Xi − µ<br />
normované normální<br />
σ<br />
rozdělení N(0, 1). Potom má náhodná veličina V = n 2<br />
Xi − µ<br />
lení χ 2 (n). Je pak<br />
s 2 = 1<br />
n<br />
n<br />
i=1<br />
(Xi − µ) 2 = σ2<br />
n<br />
n<br />
2<br />
Xi − µ<br />
i=1<br />
σ<br />
i=1<br />
= σ2<br />
n V.<br />
σ<br />
rozdě-<br />
Má tudíž statistika V = ns2<br />
σ 2 rozdělení χ 2 (n). Pro oboustranný odhad<br />
dostaneme<br />
P (v1 ≤ V ≤ v2) = 1 − α ⇒ v1 = χ 2 α<br />
2<br />
(n) a v2 = χ 2 1− α(n),<br />
2<br />
kde symbolem χ 2 p(n) označujeme p−kvantil rozdělení χ 2 (n). Odtud plyne<br />
odhad<br />
χ 2 α(n)<br />
≤<br />
2<br />
ns2<br />
σ2 ≤ χ21− α<br />
2<br />
(n) ⇒ ns2<br />
(n) ≤ σ2 ≤ ns2<br />
χ2 α(n)<br />
.<br />
χ 2 1− α<br />
2<br />
Obdobně dostaneme jednostranné <strong>odhady</strong> (pravostranný) resp. (levostranný)<br />
σ 2 ≤ ns2<br />
χ2 , resp.<br />
α(n)<br />
ns 2<br />
χ 2 1−α(n) ≤ σ2 .<br />
C) Odhad střední hodnoty µ za podmínky, že rozptyl σ2 uvažovaného<br />
rozdělení není znám. Ke stanovení intervalu spolehlivosti použijeme statis-<br />
X − µ √<br />
tiku T = n, o které víme, že má Studentovo t−rozdělení t(n−1)<br />
S<br />
40<br />
2
o (n − 1) stupních volnosti. Je totiž<br />
a<br />
U =<br />
neboť X ∼ N(µ; σ 2 /n). Dále je<br />
a<br />
T =<br />
X − µ<br />
σ√ n<br />
Z = (n − 1) S2<br />
σ 2 = n <br />
i=1<br />
X−µ<br />
σ<br />
S<br />
σ<br />
⎛<br />
⎝<br />
√ n<br />
∼ N(0; 1),<br />
X − Xi<br />
σ<br />
T = U<br />
Z<br />
n−1<br />
⎞2<br />
má tedy Studentovo rozdělení t(n − 1).<br />
Interval spolehlivosti určíme z podmínky<br />
P <br />
|T | ≤ t1− α(n<br />
− 1) = 1 − α.<br />
Odtud je<br />
tudíž<br />
−t1− α<br />
2<br />
2<br />
⎠<br />
X − µ √<br />
≤ n ≤ t1−<br />
S<br />
α<br />
2 ,<br />
X − S √ t1−<br />
n α<br />
2 ≤ µ ≤ X + S √ t1−<br />
n α<br />
2<br />
∼ χ 2 (n − 1)<br />
je oboustraný interval spolehlivosti pro parametr µ.<br />
Obdobně dostaneme jednostrané intervaly (pravostranný), resp. (levostranný)<br />
ve tvaru:<br />
µ ≤ X + S √ n t1−α, µ ≥ X − S √ n t1−α,<br />
kde symbolem tα označujeme α kvantil uvažovaného rozdělení.<br />
D) Odhad parametru σ2 při neznámé střední hodnotě µ. Zde použi-<br />
n − 1<br />
jeme statistiku Y =<br />
σ2 S2 , která má rozdělení χ2 (n − 1). Je totiž<br />
Y = n ⎛ ⎞2<br />
X − Xi<br />
⎝ ⎠ ∼ χ<br />
i=1 σ<br />
2 (n − 1)<br />
41
a dále vycházíme ze skutečnosti, že pro statistiku S 2 je E(S 2 ) = σ 2 a<br />
může tedy sloužit jako vhodný odhad parametru σ 2 . Oboustraný interval<br />
spolehlivosti dostaneme z podmínky<br />
P (v1 ≤ Y ≤ v2) = 1 − α ⇒ v1 = χ 2 α<br />
2<br />
(n − 1), v2 = χ 2 1− α(n<br />
− 1)<br />
2<br />
jsou odpovídající kvantily rozdělení χ 2 . Odtud plyne pro oboustraný interval<br />
spolehlivosti<br />
v1 ≤<br />
(n − 1)S2<br />
σ 2<br />
≤ v2 ⇒<br />
(n − 1)<br />
S 2 ≤ σ<br />
2(n − 1)<br />
S 2 .<br />
Jednoduchou úpravou získáme jednostrané intervaly spolehlivosti (pravostranný),<br />
resp. (levostranný) ve tvaru<br />
σ 2 ≤<br />
(n − 1)<br />
S 2 ,<br />
v1<br />
v2<br />
(n − 1)<br />
v2<br />
S 2 ≤ σ 2 ,<br />
kde v1 a v2 jsou zde po řadě kvantily χ 2 α(n−1), v2 = χ 2 1−α(n−1) rozdělení<br />
chí-kvadrát o (n − 1) stupních volnosti.<br />
2. Exponenciální rozdělení.<br />
Uvedeme interval spolehlivosti pro rozdělení Exp(0; δ), kde využijeme<br />
skutečnosti, že je střední hodnota E(X) = δ. Statistika T = 2nX<br />
δ má<br />
totiž rozdělení χ2 (2n). O tom se snadno přesvědčíme pomocí charakteristické<br />
funkce. Jestliže uvážíme, že náhodná veličina X, která má uvažované<br />
1<br />
exponenciální rozdělení, má charakteristickou funkci ψX(t) = , pak<br />
v1<br />
1 − jtδ<br />
1<br />
pro statistiku T dostaneme charakteristickou funkci ψT (t) =<br />
(1 − 2jt) n.<br />
To je ovšem charakteristická funkce náhodné veličiny, která má rozdělení<br />
χ(2n).<br />
Je totiž<br />
X = n <br />
= E <br />
e jtx1<br />
i−1<br />
Xi ⇒ ψ X = E<br />
<br />
.E <br />
e jtx2<br />
Pro exponenciální rozdělení Exp(0; δ) je<br />
ψX(t) = 1<br />
δ<br />
∞<br />
0<br />
⎛<br />
⎜<br />
⎝e<br />
jt n<br />
xi<br />
i=1<br />
⎞<br />
⎟<br />
⎠ =<br />
<br />
. . . E <br />
e jtxn<br />
<br />
= (ψX(t)) n .<br />
e jtx e −x/δ dx = 1<br />
δ<br />
42<br />
∞<br />
0<br />
e −x(1/δ−jt) dx =
Je tedy<br />
Dále je<br />
tedy<br />
= 1<br />
δ<br />
−δ <br />
e<br />
1 − δjt<br />
−x(1/δ−jt∞ 0 =<br />
ψ X (t) =<br />
1<br />
(1 − δjt) n.<br />
1<br />
1 − δjt<br />
ψαX(t) = E <br />
jtαX<br />
e = ψX(αt),<br />
ψT (t) = ψ( X( 2<br />
t) =<br />
δ<br />
což je charkteristická funkce rozdělení χ 2 (2n).<br />
Interval spolehlivosti získáme z identity<br />
kde v1 = χ 2 α<br />
2<br />
1<br />
1 − 2jt) n,<br />
P (v1 ≤ T ≤ v2) = 1 − α ⇒ v1 ≤ 2nX<br />
δ ≤ v2 ⇒<br />
2nX<br />
v2<br />
≤ δ ≤ 2nX<br />
,<br />
(2n) a v2 = χ2 1− α(2n)<br />
kvantil rozdělení chí-kvadrát.<br />
2<br />
Obdobně dostaneme jednostrané intervaly spolehlivosti ve tvaru<br />
2nX<br />
v2<br />
v1<br />
≤ δ, δ ≤ 2nX<br />
,<br />
kde v1 = χ 2 α(2n) a v2 = χ 2 1−α(2n) jsou kvantily rozdělení chí-kvadrát.<br />
Pro rozsáhlé výběry při velkém n můžeme použít důsledku centrální<br />
limitní věty. Protože pro náhodnou veličinu s exponenciálním rozdělení je<br />
E(X) = δ a D(X) = δ2 , je pro výběrový průměr náhodného výběru z<br />
tohoto rozdělení E(X) = δ a D(X) = δ2<br />
n . Potom má náhodná veličina<br />
Un =<br />
X − δ<br />
δ<br />
v limitě normované normální rozdělení N(0; 1). Intervaly spolehlivosti můžeme<br />
určit pomocí kvantilů normálního rozdělení obdobně jako v odstavci<br />
1A. V náhodné veličině Un použijeme odhadu δ = X a pro stanovení<br />
intervalu spolehlivosti vycházíme z náhodné veličiny<br />
U =<br />
X − δ<br />
X<br />
43<br />
√ n<br />
√ n,<br />
v1
u které předpokládáme normované normální rozdělení N(0; 1). Z identity<br />
P<br />
⎛<br />
<br />
<br />
⎝<br />
<br />
<br />
X − δ<br />
X<br />
√ n<br />
⎞<br />
<br />
<br />
<br />
< u1− α<br />
2<br />
dostaneme interval spolehlivosti ve tvaru<br />
X − u1− α<br />
2<br />
⎛<br />
⎞<br />
⎠ = 1 − α<br />
⎝ X √ ⎠ < δ < X + u1−<br />
n<br />
α ⎝<br />
2<br />
X √ ⎠,<br />
n<br />
kde symbolem uα označujeme α−kvantil normovaného normálního rozdělení.<br />
Pokud je náhodný výběr výběrem s obecného exponenciálního rozdělení<br />
Ex(A; δ), pak stanovíme odhad parametru A pomocí metod uvedených v<br />
odstavci 4 a zpracováváme soubor Yi = Xi − A, 1 ≤ i ≤ n.<br />
3. Alternativní rozdělení.<br />
Odhadujeme hodnotu parametru p, kde využíváme skutečnosti, že pro<br />
náhodný výběr z alternativního rozdělení má výběrový úhrn X = n<br />
i=1 Xi<br />
binomické rozdělení Bi(n, p). Podle centrální limitní věty lze pro dostatečně<br />
rozsáhlý výběr předpokládat, že součet má normální rozdělení. Protože je<br />
E( X) = np a D( X) = np(1 − p), má pro np(1 − p) > 9 výběrový úhrn X<br />
normální rozdělení N(np, np(1 − p)). Náhodná veličina<br />
Z =<br />
X − np<br />
<br />
np(1 − p)<br />
má normované normální rozdělení.<br />
Potom je<br />
P (|Z| ≤ u1− α<br />
2<br />
) = 1 − α ⇔ −u1− α<br />
2<br />
<br />
<br />
<br />
Odtud plyne, že pro parametr p platí<br />
X − u1− α<br />
2<br />
<br />
<br />
<br />
p(1 − p)<br />
n<br />
= X − p<br />
p(1−p)<br />
n<br />
p(1 − p)<br />
n<br />
≤ p ≤ X + u1− α<br />
2<br />
⎛<br />
∼ N(0; 1)<br />
⎞<br />
≤ X − p ≤ u1− α<br />
2<br />
<br />
<br />
<br />
p(1 − p)<br />
.<br />
n<br />
<br />
<br />
<br />
p(1 − p)<br />
.<br />
n<br />
Intervalový odhad parametru p obsahuje ale hodnotu rozptylu, která<br />
X(1 − X)<br />
závisí na p. Hodnotu rozptylu nahradíme jeho odhadem . Pro<br />
n<br />
44
parametr p dostaneme intervalový odhad<br />
X − u1− α<br />
2<br />
<br />
<br />
<br />
X(1 − X)<br />
n<br />
≤ p ≤ X + u1− α<br />
2<br />
<br />
<br />
<br />
X(1 − X)<br />
.<br />
n<br />
4. Geometrické rozdělení s parametrem p má pravděpodobnostní<br />
funkci p(k) = p(1 − p) k−1 , k = 1, 2, . . . , a odhadujeme parametr p. Pro <br />
,<br />
náhodnou veličinu X s tímto rozdělením je E(X) = 1<br />
p<br />
a D(X) = 1<br />
p<br />
<br />
1<br />
p − 1<br />
tedy pro náhodný výběr z tohoto rozdělení dostaneme, že E(X) = 1<br />
p a<br />
<br />
1<br />
p − 1 .<br />
Pro základní číselné charakteristiky je:<br />
D(X) = 1<br />
np<br />
E(X) = ∞ <br />
= ∞ <br />
k=2<br />
k=1<br />
E(X 2 ) = ∞ <br />
kp(1 − p) k−1 = −p ∞ <br />
k=1<br />
k(k −1)p(1−p) k−1 + ∞ <br />
= p(1 − p)<br />
⎛<br />
⎝<br />
k=1<br />
′ 1<br />
= −p − 1<br />
p<br />
<br />
k 2 p(1 − p) k−1 = ∞ <br />
k=1<br />
(1 − p)2<br />
1 − (1 − p)<br />
(1 − p) k ′ = −p<br />
= −p −1 1<br />
=<br />
p2 p ;<br />
k=1<br />
⎛<br />
⎝<br />
1 − p<br />
1 − (1 − p)<br />
[k(k − 1) + k]p(1 − p) k−1 =<br />
kp(1−p) k−1 = p(1−p) ∞ <br />
⎞′′<br />
⎠<br />
= p(1 − p) 2 1<br />
+<br />
p3 p<br />
1<br />
−<br />
p2 p<br />
k=2<br />
⎞′<br />
⎠<br />
=<br />
<br />
(1 − p) k ′′ + 1<br />
p =<br />
′′ 1<br />
= p(1 − p) − 2 + p +<br />
p 1<br />
p =<br />
2 1<br />
= −<br />
p2 p ;<br />
D(X) = E(X 2 ) − (E(X)) 2 = 2<br />
<br />
1 1 1 1 1<br />
− = − = − 1 .<br />
p2 p2 p p p<br />
Je-li (X1, X2, . . . , Xn) náhodný výběr z geometrického rozdělení, pak pro<br />
výběrový úhrn ˜ X a výběrový průměr X platí:<br />
E( X) = n<br />
,<br />
p<br />
1<br />
E(X) =<br />
p , D( X) = n<br />
<br />
1<br />
− 1 ,<br />
p p<br />
D(X) = 1<br />
<br />
1<br />
− 1 .<br />
np p<br />
Pro velké hodnoty rozsahu výběru má podle centrální limitní věty náhodná<br />
veličina<br />
Un = <br />
1 X − p<br />
1<br />
np<br />
45<br />
<br />
1<br />
p − 1
v limitě normální rozdělení N(0; 1).<br />
Pro interval spolehlivosti k dané hodnotě α dostaneme interval spoleh-<br />
livosti ve tvaru <br />
<br />
1<br />
Jestliže použijeme odhadu 1<br />
p<br />
pro parametr p ve tvaru<br />
X − 1<br />
√ n u1− α<br />
2<br />
p<br />
X − 1<br />
1<br />
p<br />
p<br />
− 1<br />
<br />
1<br />
p − 1<br />
<br />
<br />
X(X − 1) ≤ 1<br />
p<br />
√ n<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
<br />
≤ u1− α<br />
2 .<br />
.= X(X − 1), pak dostaneme interval<br />
≤ X + 1<br />
√ n u1− α<br />
2<br />
<br />
X(X − 1).<br />
Příklad: Při hodech hrací kostkou sledujeme počet hodů, které musíme<br />
provést, dokud nepadne šestka. Je tedy p = 1<br />
6 = 0, 16666, α = 0, 1 je z tabulek u0,95 = 1, 64485.<br />
Pro náhodné výběry jsme dostali:<br />
1<br />
p = 6. Pro<br />
n = 30, X = 4, 63333, tedy<br />
3, 401183 ≤ 1<br />
p ≤ 5, 8655 ⇒ 0, 1705 ≤ p ≤ 0, 294.<br />
n = 120, X = 5, 65, tedy<br />
4, 88 ≤ 1<br />
p ≤ 6, 412 ⇒ 0, 1558 ≤ p ≤ 0, 205.<br />
n = 180, X = 5, 8555, tedy<br />
5, 2018 ≤ 1<br />
p ≤ 6, 5093, tedy<br />
0, 1536 ≤ p ≤ 0, 19224.<br />
46
Příklady. Určete intervaly spolehlivosti, oboustranné i jednostranné<br />
pro zadané hodnoty α, α = 0, 1, 0, 05, 0, 01.<br />
1. Normální rozdělení.<br />
Ukážeme si použití na datech ze souborů, které jsou přehledem výšek v<br />
cm a vah v kg ve skupinách studentů. Příslušné výběrové charakteristiky<br />
vždy uvedeme u řešené úlohy.<br />
V tabulkách jsou zadány hodnoty výběrových statistik pro náhodný<br />
výběr z normálního rozdělení. Písmenem X je označen soubor výšek posluchačů<br />
v cm a písmenem Y je označen soubor vah v kg. Písmeno M značí<br />
muže, písmeno Ž ženy.<br />
n je rozsah souboru, X je hodnota výběrového průměru a S 2 X je hodnota<br />
výběrového rozptylu pro náhodný výběr.<br />
soubor výb. průměr výb. rozptyl počet hodnot rozpětí<br />
1990,M X = 180 S 2 X = 38, 8 n = 71 〈165, 200〉<br />
1990,Ž X = 165, 55 S 2 X = 47, 27 n = 11 〈152, 178〉<br />
1990,M+Ž X = 179, 12 S 2 X = 58, 875 n = 82 〈152, 200〉<br />
2000(1+2) X = 181, 673 S 2 X = 68, 489 n = 52 〈165, 201〉<br />
2000(1) X = 181, 607 S 2 X = 94, 024 n = 28 〈165, 201〉<br />
2000(2) X = 181, 75 S 2 X = 38, 687 n = 24 〈172, 196〉<br />
1990,M Y = 72, 52 S 2 Y = 55, 192 n = 71 〈60, 95〉<br />
1990,Ž Y = 56, 78 S 2 Y = 41, 017 n = 11 〈45, 67〉<br />
1990,M+Ž Y = 71, 57 S 2 Y = 67, 975 n = 82 〈45, 95〉<br />
2000(1+2) Y = 77, 923 S 2 Y = <strong>10</strong>6, 148 n = 52 〈60, <strong>10</strong>5〉<br />
2000(1) Y = 75, 893 S 2 Y = 128, 31 n = 28 〈60, <strong>10</strong>5〉<br />
2000(2) Y = 80, 292 S 2 Y = 69, 873 n = 24 〈61, 95〉<br />
n rozsah souboru, X výběrový průměr, S 2 výběrový rozptyl, V S výška<br />
v cm, V H váha v kg.<br />
47
n X S 2 n X S 2<br />
VS-1 35 182, 11 61, 1 VH-1 35 75, 4 1<strong>10</strong>, 78<br />
VS-2 30 183 64, 97 VH-2 30 77, 4 <strong>10</strong>2, 59<br />
VS-3 34 183, 35 72, 48 VH-3 34 77, 53 134, 62<br />
VS-4 27 181 74, 77 VH-4 27 76, 74 59, 74<br />
1.1. Výběr je náhodným výběrem z normálního rozdělení N(µ; σ2 ) z<br />
danými parametry. Určete interval spolehlivosti pro střední hodnotu µ.<br />
Ke stanovení intervalů spolehlivosti použijeme statistiku<br />
X − µ √<br />
T = n ∼ t(n − 1),<br />
S<br />
která má t−rozdělení o n − 1 stupních volnosti. Poznamenejme, že pro<br />
n ≥ 30 je t−rozdělení již shodné z normovaným normálním rozdělením<br />
N(0; 1). Je pak:<br />
oboustranný interval spolehlivosti<br />
(♠) X − S √ n t1− α<br />
2 ≤ µ ≤ X + S √ n t1− α<br />
2 ;<br />
jednostranné intervaly spolehlivosti<br />
(♣) µ ≤ X + S √ n t1−α, µ ≥ X − S √ n t1−α.<br />
a) Soubor 1990(M): Jedná se o soubor výšek v cm, X = 180,<br />
S 2 = 38, 8, n = 71, rozpětí 〈165, 200〉.<br />
Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />
oboustranný interval<br />
α t1− α<br />
2 S/ √ n µ<br />
0, 1 1, 64485 1, 216 178, 78 < µ < 181, 216<br />
0, 05 1, 95996 1, 4489 178, 55 < µ < 181, 449<br />
0, 001 2, 57583 1, 9042 178, 1 < µ < 181, 904<br />
jednostranné intervaly<br />
α t1−α S/ √ n µ µ<br />
0, 1 1, 2816 0, 9474 µ < 180, 95 µ > 179, 05<br />
0, 05 1, 64485 1, 216 µ < 181, 22 µ > 178, 78<br />
0, 001 2, 3264 1, 95996 µ < 181, 72 µ > 178, 28<br />
48
) Soubor 1990(Ž): Jedná se o soubor výšek v cm, X = 165, 55,<br />
S 2 = 47, 27, n = 11, rozpětí 〈152, 178〉.<br />
Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />
oboustranný interval<br />
α t1− α<br />
2 S/ √ n µ<br />
0, 1 1, 8125 3, 7573 161, 79 < µ < 169, 31<br />
0, 05 2, 2281 4, 61885 160, 93 < µ < 170, 17<br />
0, 001 2, 76383 6, 5699 158, 98 < µ < 172, 12<br />
jednostranné intervaly<br />
α t1−α S/ √ n µ µ<br />
0, 1 1, 3722 2, 8446 µ < 168, 39 µ > 162, 70<br />
0, 05 1, 8125 3, 7573 µ < 169, 31 µ > 161, 79<br />
0, 001 2, 7638 5, 7294 µ < 171, 28 µ > 159, 82<br />
c) Soubor 1990(M): Jedná se o soubor vah v kg, Y = 72, 52,<br />
S 2 = 55, 192, n = 71, rozpětí 〈60, 95〉.<br />
Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />
oboustranný interval<br />
α t1− α<br />
2 S/ √ n µ<br />
0, 1 1, 64485 1, 4502 71, 07 < µ < 73, 97<br />
0, 05 1, 95996 1, 728 70, 79 < µ < 74, 25<br />
0, 001 2, 57583 2, 27 70, 25 < µ < 74, 79<br />
jednostranné intervaly<br />
α t1−α S/ √ n µ µ<br />
0, 1 1, 2816 1, 1299 µ < 73, 65 µ > 71, 39<br />
0, 05 1, 64485 1, 4502 µ < 73, 97 µ > 71, 07<br />
0, 001 2, 3264 2, 051 µ < 74, 57 µ > 70, 47<br />
49
d) Soubor 1990(Ž): Jedná se o soubor vah v kg, Y = 56, 78,<br />
S 2 = 41, 017, n = 11, rozpětí 〈45, 77〉.<br />
Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />
oboustranný interval<br />
α t1− α<br />
2 S/ √ n µ<br />
0, 1 1, 8125 3, 499 53, 28 < µ < 60, 28<br />
0, 05 2, 2281 4, 302 52, 48 < µ < 61, 08<br />
0, 001 2, 76383 6, 1199 47, 66 < µ < 65, 90<br />
jednostranné intervaly<br />
α t1−α S/ √ n µ µ<br />
0, 1 1, 3722 2, 6497 µ < 59, 43 µ > 54, 13<br />
0, 05 1, 8125 3, 4999 µ < 60, 28 µ > 53, 28<br />
0, 001 2, 7638 5, 3374 µ < 62, 12 µ > 51, 44<br />
1.2. Výběr je náhodným výběrem z normálního rozdělení N(µ; σ 2 ) z<br />
danými parametry. Určete interval spolehlivosti pro rozptyl σ 2 .<br />
Ke stanovení intervalů spolehlivosti použijeme statistiku<br />
Y =<br />
n − 1<br />
σ 2 S2 ,<br />
která má rozdělení χ 2 (n − 1). Vycházíme ze skutečnosti, že pro statistiku<br />
S 2 je E(S 2 ) = σ 2 a může tedy sloužit jako vhodný odhad parametru σ 2 .<br />
Oboustraný interval spolehlivosti dostaneme ve tvaru<br />
(♠♠)<br />
(n − 1)<br />
χ2 1− α<br />
S<br />
2<br />
2 < σ 2 <<br />
(n − 1)<br />
χ2 S<br />
α<br />
2<br />
2 .<br />
Jednostranné intervaly spolehlivosti dostaneme ve tvaru<br />
(♣♣) σ 2 ><br />
(n − 1)<br />
χ2 1− α<br />
S<br />
2<br />
2 , σ 2 <<br />
50<br />
(n − 1)<br />
χ2 S<br />
α<br />
2<br />
2 .
a) Soubor 1990(M): Jedná se o soubor výšek v cm, X = 180,<br />
S 2 = 38, 8, n = 71, rozpětí 〈165, 200〉.<br />
Ke stanovení intervalů použijeme vzorce (♠♠) a (♣♣).<br />
α χ 2 1− α<br />
2<br />
oboustranný interval<br />
χ 2 α<br />
2<br />
0, 1 90, 531 51, 739 30 < σ 2 < 52, 49<br />
0, 05 95, 023 48, 758 28, 58 < σ 2 < 55, 70<br />
0, 001 <strong>10</strong>4, 21 43, 275 26, 06 < σ 2 < 62, 76<br />
jednostranné intervaly<br />
α χ 2 1−α χ 2 α σ 2 σ 2<br />
0, 1 − − σ 2 < σ 2 ><br />
0, 05 90, 531 51, 739 σ 2 < 52, 49 σ 2 > 30<br />
0, 001 <strong>10</strong>0, 43 45, 442 σ 2 < 59, 77 σ 2 > 27, 04<br />
b) Soubor 1990(Ž): Jedná se o soubor výšek v cm, X = 165, 55,<br />
S 2 = 47, 27, n = 11, rozpětí 〈152, 178〉.<br />
Ke stanovení intervalů použijeme vzorce (♠♠) a (♣♣).<br />
α χ 2 1− α<br />
2<br />
oboustranný interval<br />
χ 2 α<br />
2<br />
0, 1 18, 307 3, 9403 25, 82 < σ 2 < 119, 96<br />
0, 05 20, 483 3, 247 23, 08 < σ 2 < 145, 6<br />
0, 001 25, 188 2, 1559 18, 77 < σ 2 < 198, 4<br />
jednostranné intervaly<br />
α χ 2 1−α χ 2 α σ 2 σ 2<br />
0, 1 − − σ 2 < σ 2 ><br />
0, 05 18, 307 3, 9403 σ 2 < 119, 96 σ 2 > 25, 82<br />
0, 001 23, 209 2, 5582 σ 2 < 184, 78 σ 2 > 20, 37<br />
51<br />
σ 2<br />
σ 2
c) Soubor 1990(M): Jedná se o soubor vah v kg, Y = 72, 52,<br />
S 2 = 55, 192, n = 71, rozpětí 〈60, 95〉.<br />
Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />
α χ 2 1− α<br />
2<br />
oboustranný interval<br />
χ 2 α<br />
2<br />
0, 1 90, 531 51, 739 42, 68 < σ 2 < 74, 67<br />
0, 05 95, 023 48, 758 40, 66 < σ 2 < 79, 24<br />
0, 001 <strong>10</strong>4, 21 43, 275 37, 07 < σ 2 < 89, 28<br />
jednostranné intervaly<br />
α χ 2 1−α χ 2 α σ 2 σ 2<br />
0, 1 − − σ 2 < σ 2 ><br />
0, 05 90, 531 51, 739 σ 2 < 74, 67 σ 2 > 42, 68<br />
0, 001 <strong>10</strong>0, 43 45, 442 σ 2 < 85, 02 σ 2 > 38, 47<br />
d) Soubor 1990(Ž): Jedná se o soubor vah v kg, Y = 56, 78,<br />
S 2 = 41, 017, n = 11, rozpětí 〈45, 77〉.<br />
Ke stanovení intervalů použijeme vzorce (♠) a (♣).<br />
α χ 2 1− α<br />
2<br />
oboustranný interval<br />
χ 2 α<br />
2<br />
0, 1 18, 307 3, 9403 22, 41 < σ 2 < <strong>10</strong>4, 1<br />
0, 05 20, 483 3, 247 20, 02 < σ 2 < 126, 32<br />
0, 001 25, 188 2, 1559 16, 28 < σ 2 < 190, 25<br />
jednostranné intervaly<br />
α χ 2 1−α χ 2 α σ 2 σ 2<br />
0, 1 − − σ 2 < σ 2 ><br />
0, 05 18, 307 3, 9403 σ 2 < <strong>10</strong>4, 1 σ 2 > 22, 41<br />
0, 001 23, 209 2, 5582 σ 2 < 160, 33 σ 2 > 17, 67<br />
52<br />
σ 2<br />
σ 2
2. Exponenciální rozdělení.<br />
2.1. Výběr je náhodným výběrem z exponenciálního rozdělení Exp(0; δ)<br />
z danými parametry. Určete interval spolehlivosti pro střední hodnotu δ.<br />
Zde využijeme skutečnosti, že je střední hodnota E(X) = δ. a toho, že<br />
statistika<br />
T = 2nX<br />
δ<br />
má rozdělení χ 2 (2n).<br />
Interval spolehlivosti získáme ve tvaru<br />
kde v1 = χ 2 α<br />
2<br />
2nX<br />
v2<br />
< δ < 2nX<br />
,<br />
(2n) a v2 = χ2 1− α(2n)<br />
kvantil rozdělení chí-kvadrát.<br />
2<br />
Obdobně dostaneme jednostrané intervaly spolehlivosti ve tvaru<br />
2nX<br />
v2<br />
v1<br />
< δ, δ < 2nX<br />
,<br />
kde v1 = χ 2 α(2n) a v2 = χ 2 1−α(2n) kvantil rozdělení chí-kvadrát.<br />
a) Soubor byl generován z exponenciálního rozdělení Exp(0; δ) a má<br />
parametry:<br />
X = 1, 094, n = 40.<br />
Potom je 2nX = 80.1, 094 = 87, 5318. Odtud dostaneme<br />
oboustranný interval spolehlivosti<br />
α χ 2 1− α<br />
2<br />
χ 2 α<br />
2<br />
0, 1 <strong>10</strong>1, 88 60, 391 0, 86 < δ < 1, 45<br />
0, 05 <strong>10</strong>6, 63 57, 153 0, 82 < δ < 1, 53<br />
0, 001 116, 32 51, 172 0, 75 < δ < 1, 71<br />
jednostranný interval spolehlivosti<br />
α χ 2 1−α χ 2 α δ δ<br />
0, 1 - - - -<br />
0, 05 <strong>10</strong>1, 88 60, 391 0, 86 < δ δ > 1, 45<br />
0, 001 <strong>10</strong>6, 63 57, 153 0, 82 < δ δ > 1, 53<br />
53<br />
v1<br />
δ
3. Alternativní rozdělení.<br />
V tabulce jsou hodnoty, které odpovídají výběru z alternativního rozdělení<br />
pro p = 1 .<br />
6 = 0, 1667. Jsou to počty, kolikrát při n hodech hrací kostkou<br />
padnou čísla 1, 2,. . . ,6. Podmínka pro aproximaci pomocí normálního rozdělení<br />
je np(1 − p) > 9, tedy n > 65.<br />
n ˜ X ˜ X ˜ X ˜ X ˜ X ˜ X n<br />
6<br />
90 <strong>10</strong> 14 15 13 22 16 15<br />
120 17 19 20 18 25 21 20<br />
150 24 22 25 22 28 29 25<br />
180 31 25 29 27 34 34 30<br />
240 39 39 40 34 49 39 40<br />
300 47 53 51 40 61 48 50<br />
V další tabulce jsou uvedeny výběrové průměry X, tedy <strong>odhady</strong> para-<br />
=<br />
.<br />
0, 1667.<br />
metru p = 1<br />
6<br />
n X X X X X X<br />
90 0,1111 0,1556 0,1667 0,1444 0,2444 0,1778<br />
120 0,1417 0,1583 0,1667 0,15 0,2083 0,175<br />
150 0,16 0,1466 0,1667 0,1467 0,1867 0,1933<br />
180 0,1722 0,1389 0,1611 0,15 0,1889 0,1889<br />
240 0,1625 0,1625 0,1667 0,1417 0,2042 0,1625<br />
300 0,1567 0,1767 0,17 0,133 0,2033 0,16<br />
Interval spolehlivosti pro parametr p určíme ze vzorce<br />
X − u1− α<br />
2<br />
<br />
<br />
<br />
X(1 − X)<br />
n<br />
≤ p ≤ X + u1− α<br />
2<br />
<br />
<br />
<br />
X(1 − X)<br />
n<br />
a příslušné výsledky jsou uvedeny v tabulce.<br />
Pro kvantily u1− α dostaneme z tabulek hodnoty:<br />
2<br />
u0,95 = 1, 64485, u0,975 = 1, 95996, u0,995 = 2, 57583.<br />
Pro kvantily uα, resp, u1−α dostaneme:<br />
u0,9 = 1, 28155, u0,95 = 1, 64485, u0,99 = 2, 32635.<br />
54
n < p < < p < < p <<br />
90 0,057 - 0,1655 0,<strong>10</strong>928 - 0,2188 0,<strong>10</strong>21 - 0,2313<br />
120 0,0894 - 0,1994 0,<strong>10</strong>35 - 0,2131 0,1<strong>10</strong>8 - 0,2226<br />
150 0,1<strong>10</strong>8 -0,2092 0,0991- 0,1941 0,1167 - 0,2167<br />
180 0,126 - 0,2184 0,0965 - 0,1813 0,116 - 0,2026<br />
240 0,1234- 0,2016 0,1234 - 0,2016 0,1271 - 0,2063<br />
300 0,1159 -0,1975 0,1405 - 0,2129 0,1343 - 0,2057<br />
n < p < < p < < p <<br />
90 0,934 - 0,1954 0,1699 - 0,3189 0,115 - 0,2441<br />
120 0,1573 - 0,2593 0,1547 - 0,2619 0,1179 - 0,2321<br />
150 0,0992 - 0,1942 0,1344 -0,2369 0,1403- 0,2463<br />
180 0,<strong>10</strong>61 - 0,1939 0,1409 - 0,2369 0,1409 - 0,2369<br />
240 0,<strong>10</strong>47 - 0,1787 0,1641- 0,247 0,1234 - 0,2016<br />
300 0,<strong>10</strong>08 - 0,1652 0,1651 -0,2415 0,1251 - 0,1949<br />
4. Geometrické rozdělení.<br />
Interval spolehlivosti pro parametr p má tvar<br />
X − 1<br />
√ n u1− α<br />
2<br />
<br />
X(X − 1) ≤ 1<br />
p<br />
≤ X + 1<br />
√ n u1− α<br />
2<br />
<br />
X(X − 1).<br />
Jeho vyjádření si ukážeme pro data jsou ze souboru z geometrickým<br />
rozdělením s parametrem p = 1 1<br />
6 , tedy p = 6. Jedná se o počet hodů hrací<br />
kostkou, které musíme provést, aby padlo zvolené číslo, např. šestka.<br />
Pro hodnotu α = 0, 1 je u0,95 = 1, 64485 a pro hodnoty ze souboru<br />
máme:<br />
n X < 1<br />
p<br />
30 4,633 3, 4 < 1<br />
p<br />
120 5,65 4, 88 < 1<br />
p<br />
180 5,86 5, 2 < 1<br />
p<br />
< < p <<br />
< 5, 87 0, 17 < p < 0, 29<br />
< 6, 412 0, 156 < p < 0, 205<br />
< 6, 5 0, 154 < p < 0, 192<br />
55