Intervalové odhady parametrů(10)

Intervalové odhady parametrů(10) Intervalové odhady parametrů(10)

from math.feld.cvut.cz More from this publisher

20.07.2013 Views

4. Intervalové odhady parametrů rozdělení. Jednou ze základních úloh mtematické statistiky je stanovení hodnot parametrů rozdělení, ze kterého máme k dispozici náhodný výběr. Nejčastěji hledáme odhady dvou druhů: -bodový odhad (point estimate, estimator) je odhad parametru pomocí statistiky (funkce náhodného výběru), jejíž hodnotu pro datový soubor považujeme za hledanou hodnotu neznámého parametru rozdělení (či jeho funkce); -intervalový odhad (konfidenční interval) (confidence interval) je interval, ve kterém se hodnota neznámého parametru vyskytuje s požadovanou pravděpodobností, pochopitelně s hodnotou blízkou jedné. Intervalový odhad. Jestliže je θ neznámý parametr zkoumaného rozdělení a τ(θ) je funkce parametru, kterou odhadujeme, pak hledáme statistiky Td a Th takové, že pro koeficient spolehlivosti (confidence level) (1 − α) platí: P (Td ≤ τ(θ) ≤ Th) = 1 − α, (oboustranný odhad) (two-tailed) přičemž obvykle ještě požadujeme P (τ(θ) < Td) = P (τ(θ) > Th) = α 2 . Intervalovým odhadem (oboustranným) funkce τ(θ) je interval (Td, Th). Někdy hledáme pouze jednostranné odhady (one-tailed). Je pak: τ(θ) ∈ (Td, ∞), kde P (τ(θ) ≥ Td) = 1 − α a P (τ(θ) < Td) = α; τ(θ) ∈ (−∞, Th), kde P (τ(θ) ≤ Th) = 1 − α a P (τ(θ) > Th = α. Obvykle volíme α = 0, 1; 0, 05, 0, 01. Spolehlivost odhadu (level of significance) je pak (1 − α) = 0, 9, 0, 95, 0, 99. To znamená, že po řadě v 90%, v 95% nebo v 99% případech je náš odhad pro parametr správný. Intervalové odhady parametrů některých rozdělení. 1. Normální rozdělení. A) Odhad parametru µ (střední hodnoty) rozdělení N(µ, σ2 ) při známém rozptylu σ2 . Zde použijeme statistiku X (výběrový průměr) jako X − µ √ jeho odhad. Víme, že náhodná veličina U = n má normované nor- σ mální rozdělení N(0, 1). Potom je P (|U| ≤ u1− α) = 1 − α ⇔ −u1− α 2 2 X − µ √ ≤ n ≤ u1− σ α 2 , kde symbolem up, 0 < p < 1 označujeme p−kvantil normovaného nor- 39

4. Intervalové odhady parametrů rozdělení.

Jednou ze základních úloh mtematické statistiky je stanovení hodnot parametrů

rozdělení, ze kterého máme k dispozici náhodný výběr. Nejčastěji

hledáme odhady dvou druhů:

-bodový odhad (point estimate, estimator) je odhad parametru pomocí

statistiky (funkce náhodného výběru), jejíž hodnotu pro datový soubor

považujeme za hledanou hodnotu neznámého parametru rozdělení (či

jeho funkce);

-intervalový odhad (konfidenční interval) (confidence interval) je

interval, ve kterém se hodnota neznámého parametru vyskytuje s požadovanou

pravděpodobností, pochopitelně s hodnotou blízkou jedné.

Intervalový odhad. Jestliže je θ neznámý parametr zkoumaného rozdělení

a τ(θ) je funkce parametru, kterou odhadujeme, pak hledáme statistiky

Td a Th takové, že pro koeficient spolehlivosti (confidence level)

(1 − α) platí:

P (Td ≤ τ(θ) ≤ Th) = 1 − α, (oboustranný odhad) (two-tailed) přičemž

obvykle ještě požadujeme P (τ(θ) < Td) = P (τ(θ) > Th) = α

2 . Intervalovým

odhadem (oboustranným) funkce τ(θ) je interval (Td, Th).

Někdy hledáme pouze jednostranné odhady (one-tailed). Je pak:

τ(θ) ∈ (Td, ∞), kde P (τ(θ) ≥ Td) = 1 − α a P (τ(θ) < Td) = α;

τ(θ) ∈ (−∞, Th), kde P (τ(θ) ≤ Th) = 1 − α a P (τ(θ) > Th = α.

Obvykle volíme α = 0, 1; 0, 05, 0, 01. Spolehlivost odhadu (level of

significance) je pak (1 − α) = 0, 9, 0, 95, 0, 99. To znamená, že po řadě v

90%, v 95% nebo v 99% případech je náš odhad pro parametr správný.

Intervalové odhady parametrů některých rozdělení.

1. Normální rozdělení.

A) Odhad parametru µ (střední hodnoty) rozdělení N(µ, σ2 ) při známém

rozptylu σ2 . Zde použijeme statistiku X (výběrový průměr) jako

X − µ √

jeho odhad. Víme, že náhodná veličina U = n má normované nor-

σ

mální rozdělení N(0, 1). Potom je

P (|U| ≤ u1− α)

= 1 − α ⇔ −u1− α

2 2

X − µ √

≤ n ≤ u1−

σ

α

2 ,

kde symbolem up, 0

málního rozdělení N(0, 1). Odtud dostaneme, že

Td = X − σ √ n u1− α

2 ≤ µ ≤ Th = X + σ √ n u1− α

2 .

Jednostrannými odhady jsou intervaly (levostranný), resp. (pravostranný)

µ ≤ Th = X + σ √ n u1−α, resp. µ ≥ Td = X − σ √ n u1−α.

B) Odhad parametru σ2 při známé střední hodnotě µ. Zde použijeme

skutečnosti, že má náhodná veličina Ui = Xi − µ

normované normální

σ

rozdělení N(0, 1). Potom má náhodná veličina V = n 2

Xi − µ

lení χ 2 (n). Je pak

s 2 = 1

n

i=1

(Xi − µ) 2 = σ2

n

2

Xi − µ

i=1

σ

i=1

= σ2

n V.

σ

rozdě-

Má tudíž statistika V = ns2

σ 2 rozdělení χ 2 (n). Pro oboustranný odhad

dostaneme

P (v1 ≤ V ≤ v2) = 1 − α ⇒ v1 = χ 2 α

2

(n) a v2 = χ 2 1− α(n),

2

kde symbolem χ 2 p(n) označujeme p−kvantil rozdělení χ 2 (n). Odtud plyne

odhad

χ 2 α(n)

≤

2

ns2

σ2 ≤ χ21− α

2

(n) ⇒ ns2

(n) ≤ σ2 ≤ ns2

χ2 α(n)

.

χ 2 1− α

2

Obdobně dostaneme jednostranné odhady (pravostranný) resp. (levostranný)

σ 2 ≤ ns2

χ2 , resp.

α(n)

ns 2

χ 2 1−α(n) ≤ σ2 .

C) Odhad střední hodnoty µ za podmínky, že rozptyl σ2 uvažovaného

rozdělení není znám. Ke stanovení intervalu spolehlivosti použijeme statis-

X − µ √

tiku T = n, o které víme, že má Studentovo t−rozdělení t(n−1)

S

40

o (n − 1) stupních volnosti. Je totiž

a

U =

neboť X ∼ N(µ; σ 2 /n). Dále je

a

T =

X − µ

σ√ n

Z = (n − 1) S2

σ 2 = n

i=1

X−µ

σ

S

σ

⎛

⎝

√ n

∼ N(0; 1),

X − Xi

σ

T = U

Z

n−1

⎞2

má tedy Studentovo rozdělení t(n − 1).

Interval spolehlivosti určíme z podmínky

P

|T | ≤ t1− α(n

− 1) = 1 − α.

Odtud je

tudíž

−t1− α

2

⎠

X − µ √

≤ n ≤ t1−

S

α

2 ,

X − S √ t1−

n α

2 ≤ µ ≤ X + S √ t1−

n α

2

∼ χ 2 (n − 1)

je oboustraný interval spolehlivosti pro parametr µ.

Obdobně dostaneme jednostrané intervaly (pravostranný), resp. (levostranný)

ve tvaru:

µ ≤ X + S √ n t1−α, µ ≥ X − S √ n t1−α,

kde symbolem tα označujeme α kvantil uvažovaného rozdělení.

D) Odhad parametru σ2 při neznámé střední hodnotě µ. Zde použi-

n − 1

jeme statistiku Y =

σ2 S2 , která má rozdělení χ2 (n − 1). Je totiž

Y = n ⎛ ⎞2

X − Xi

⎝ ⎠ ∼ χ

i=1 σ

2 (n − 1)

a dále vycházíme ze skutečnosti, že pro statistiku S 2 je E(S 2 ) = σ 2 a

může tedy sloužit jako vhodný odhad parametru σ 2 . Oboustraný interval

spolehlivosti dostaneme z podmínky

P (v1 ≤ Y ≤ v2) = 1 − α ⇒ v1 = χ 2 α

2

(n − 1), v2 = χ 2 1− α(n

− 1)

2

jsou odpovídající kvantily rozdělení χ 2 . Odtud plyne pro oboustraný interval

spolehlivosti

v1 ≤

(n − 1)S2

σ 2

≤ v2 ⇒

(n − 1)

S 2 ≤ σ

2(n − 1)

S 2 .

Jednoduchou úpravou získáme jednostrané intervaly spolehlivosti (pravostranný),

resp. (levostranný) ve tvaru

σ 2 ≤

(n − 1)

S 2 ,

v1

v2

(n − 1)

v2

S 2 ≤ σ 2 ,

kde v1 a v2 jsou zde po řadě kvantily χ 2 α(n−1), v2 = χ 2 1−α(n−1) rozdělení

chí-kvadrát o (n − 1) stupních volnosti.

2. Exponenciální rozdělení.

Uvedeme interval spolehlivosti pro rozdělení Exp(0; δ), kde využijeme

skutečnosti, že je střední hodnota E(X) = δ. Statistika T = 2nX

δ má

totiž rozdělení χ2 (2n). O tom se snadno přesvědčíme pomocí charakteristické

funkce. Jestliže uvážíme, že náhodná veličina X, která má uvažované

1

exponenciální rozdělení, má charakteristickou funkci ψX(t) = , pak

v1

1 − jtδ

1

pro statistiku T dostaneme charakteristickou funkci ψT (t) =

(1 − 2jt) n.

To je ovšem charakteristická funkce náhodné veličiny, která má rozdělení

χ(2n).

Je totiž

X = n

= E

e jtx1

i−1

Xi ⇒ ψ X = E

.E

e jtx2

Pro exponenciální rozdělení Exp(0; δ) je

ψX(t) = 1

δ

∞

0

⎛

⎜

⎝e

jt n

xi

i=1

⎞

⎟

⎠ =

. . . E

e jtxn

= (ψX(t)) n .

e jtx e −x/δ dx = 1

δ

42

∞

0

e −x(1/δ−jt) dx =

Je tedy

Dále je

tedy

= 1

δ

−δ

e

1 − δjt

−x(1/δ−jt∞ 0 =

ψ X (t) =

1

(1 − δjt) n.

1

1 − δjt

ψαX(t) = E

jtαX

e = ψX(αt),

ψT (t) = ψ( X( 2

t) =

δ

což je charkteristická funkce rozdělení χ 2 (2n).

Interval spolehlivosti získáme z identity

kde v1 = χ 2 α

2

1

1 − 2jt) n,

P (v1 ≤ T ≤ v2) = 1 − α ⇒ v1 ≤ 2nX

δ ≤ v2 ⇒

2nX

v2

≤ δ ≤ 2nX

,

(2n) a v2 = χ2 1− α(2n)

kvantil rozdělení chí-kvadrát.

2

Obdobně dostaneme jednostrané intervaly spolehlivosti ve tvaru

2nX

v2

v1

≤ δ, δ ≤ 2nX

,

kde v1 = χ 2 α(2n) a v2 = χ 2 1−α(2n) jsou kvantily rozdělení chí-kvadrát.

Pro rozsáhlé výběry při velkém n můžeme použít důsledku centrální

limitní věty. Protože pro náhodnou veličinu s exponenciálním rozdělení je

E(X) = δ a D(X) = δ2 , je pro výběrový průměr náhodného výběru z

tohoto rozdělení E(X) = δ a D(X) = δ2

n . Potom má náhodná veličina

Un =

X − δ

δ

v limitě normované normální rozdělení N(0; 1). Intervaly spolehlivosti můžeme

určit pomocí kvantilů normálního rozdělení obdobně jako v odstavci

1A. V náhodné veličině Un použijeme odhadu δ = X a pro stanovení

intervalu spolehlivosti vycházíme z náhodné veličiny

U =

X − δ

X

43

√ n

√ n,

u které předpokládáme normované normální rozdělení N(0; 1). Z identity

P

⎛

⎝

X − δ

X

√ n

⎞

< u1− α

2

dostaneme interval spolehlivosti ve tvaru

X − u1− α

2

⎛

⎞

⎠ = 1 − α

⎝ X √ ⎠ < δ < X + u1−

n

α ⎝

2

X √ ⎠,

n

kde symbolem uα označujeme α−kvantil normovaného normálního rozdělení.

Pokud je náhodný výběr výběrem s obecného exponenciálního rozdělení

Ex(A; δ), pak stanovíme odhad parametru A pomocí metod uvedených v

odstavci 4 a zpracováváme soubor Yi = Xi − A, 1 ≤ i ≤ n.

3. Alternativní rozdělení.

Odhadujeme hodnotu parametru p, kde využíváme skutečnosti, že pro

náhodný výběr z alternativního rozdělení má výběrový úhrn X = n

i=1 Xi

binomické rozdělení Bi(n, p). Podle centrální limitní věty lze pro dostatečně

rozsáhlý výběr předpokládat, že součet má normální rozdělení. Protože je

E( X) = np a D( X) = np(1 − p), má pro np(1 − p) > 9 výběrový úhrn X

normální rozdělení N(np, np(1 − p)). Náhodná veličina

Z =

X − np

np(1 − p)

má normované normální rozdělení.

Potom je

P (|Z| ≤ u1− α

2

) = 1 − α ⇔ −u1− α

2

Odtud plyne, že pro parametr p platí

X − u1− α

2

p(1 − p)

n

= X − p

p(1−p)

n

p(1 − p)

n

≤ p ≤ X + u1− α

2

⎛

∼ N(0; 1)

⎞

≤ X − p ≤ u1− α

2

p(1 − p)

.

n

p(1 − p)

.

n

Intervalový odhad parametru p obsahuje ale hodnotu rozptylu, která

X(1 − X)

závisí na p. Hodnotu rozptylu nahradíme jeho odhadem . Pro

n

parametr p dostaneme intervalový odhad

X − u1− α

2

X(1 − X)

n

≤ p ≤ X + u1− α

2

X(1 − X)

.

n

4. Geometrické rozdělení s parametrem p má pravděpodobnostní

funkci p(k) = p(1 − p) k−1 , k = 1, 2, . . . , a odhadujeme parametr p. Pro

,

náhodnou veličinu X s tímto rozdělením je E(X) = 1

p

a D(X) = 1

p

1

p − 1

tedy pro náhodný výběr z tohoto rozdělení dostaneme, že E(X) = 1

p a

1

p − 1 .

Pro základní číselné charakteristiky je:

D(X) = 1

np

E(X) = ∞

= ∞

k=2

k=1

E(X 2 ) = ∞

kp(1 − p) k−1 = −p ∞

k=1

k(k −1)p(1−p) k−1 + ∞

= p(1 − p)

⎛

⎝

k=1

′ 1

= −p − 1

p

k 2 p(1 − p) k−1 = ∞

k=1

(1 − p)2

1 − (1 − p)

(1 − p) k ′ = −p

= −p −1 1

=

p2 p ;

k=1

⎛

⎝

1 − p

1 − (1 − p)

[k(k − 1) + k]p(1 − p) k−1 =

kp(1−p) k−1 = p(1−p) ∞

⎞′′

⎠

= p(1 − p) 2 1

+

p3 p

1

−

p2 p

k=2

⎞′

⎠

=

(1 − p) k ′′ + 1

p =

′′ 1

= p(1 − p) − 2 + p +

p 1

p =

2 1

= −

p2 p ;

D(X) = E(X 2 ) − (E(X)) 2 = 2

1 1 1 1 1

− = − = − 1 .

p2 p2 p p p

Je-li (X1, X2, . . . , Xn) náhodný výběr z geometrického rozdělení, pak pro

výběrový úhrn ˜ X a výběrový průměr X platí:

E( X) = n

,

p

1

E(X) =

p , D( X) = n

1

− 1 ,

p p

D(X) = 1

1

− 1 .

np p

Pro velké hodnoty rozsahu výběru má podle centrální limitní věty náhodná

veličina

Un =

1 X − p

1

np

45

1

p − 1

v limitě normální rozdělení N(0; 1).

Pro interval spolehlivosti k dané hodnotě α dostaneme interval spoleh-

livosti ve tvaru

1

Jestliže použijeme odhadu 1

p

pro parametr p ve tvaru

X − 1

√ n u1− α

2

p

X − 1

1

p

− 1

1

p − 1

X(X − 1) ≤ 1

p

√ n

≤ u1− α

2 .

.= X(X − 1), pak dostaneme interval

≤ X + 1

√ n u1− α

2

X(X − 1).

Příklad: Při hodech hrací kostkou sledujeme počet hodů, které musíme

provést, dokud nepadne šestka. Je tedy p = 1

6 = 0, 16666, α = 0, 1 je z tabulek u0,95 = 1, 64485.

Pro náhodné výběry jsme dostali:

1

p = 6. Pro

n = 30, X = 4, 63333, tedy

3, 401183 ≤ 1

p ≤ 5, 8655 ⇒ 0, 1705 ≤ p ≤ 0, 294.

n = 120, X = 5, 65, tedy

4, 88 ≤ 1

p ≤ 6, 412 ⇒ 0, 1558 ≤ p ≤ 0, 205.

n = 180, X = 5, 8555, tedy

5, 2018 ≤ 1

p ≤ 6, 5093, tedy

0, 1536 ≤ p ≤ 0, 19224.

Příklady. Určete intervaly spolehlivosti, oboustranné i jednostranné

pro zadané hodnoty α, α = 0, 1, 0, 05, 0, 01.

1. Normální rozdělení.

Ukážeme si použití na datech ze souborů, které jsou přehledem výšek v

cm a vah v kg ve skupinách studentů. Příslušné výběrové charakteristiky

vždy uvedeme u řešené úlohy.

V tabulkách jsou zadány hodnoty výběrových statistik pro náhodný

výběr z normálního rozdělení. Písmenem X je označen soubor výšek posluchačů

v cm a písmenem Y je označen soubor vah v kg. Písmeno M značí

muže, písmeno Ž ženy.

n je rozsah souboru, X je hodnota výběrového průměru a S 2 X je hodnota

výběrového rozptylu pro náhodný výběr.

soubor výb. průměr výb. rozptyl počet hodnot rozpětí

1990,M X = 180 S 2 X = 38, 8 n = 71 〈165, 200〉

1990,Ž X = 165, 55 S 2 X = 47, 27 n = 11 〈152, 178〉

1990,M+Ž X = 179, 12 S 2 X = 58, 875 n = 82 〈152, 200〉

2000(1+2) X = 181, 673 S 2 X = 68, 489 n = 52 〈165, 201〉

2000(1) X = 181, 607 S 2 X = 94, 024 n = 28 〈165, 201〉

2000(2) X = 181, 75 S 2 X = 38, 687 n = 24 〈172, 196〉

1990,M Y = 72, 52 S 2 Y = 55, 192 n = 71 〈60, 95〉

1990,Ž Y = 56, 78 S 2 Y = 41, 017 n = 11 〈45, 67〉

1990,M+Ž Y = 71, 57 S 2 Y = 67, 975 n = 82 〈45, 95〉

2000(1+2) Y = 77, 923 S 2 Y = 106, 148 n = 52 〈60, 105〉

2000(1) Y = 75, 893 S 2 Y = 128, 31 n = 28 〈60, 105〉

2000(2) Y = 80, 292 S 2 Y = 69, 873 n = 24 〈61, 95〉

n rozsah souboru, X výběrový průměr, S 2 výběrový rozptyl, V S výška

v cm, V H váha v kg.

n X S 2 n X S 2

VS-1 35 182, 11 61, 1 VH-1 35 75, 4 110, 78

VS-2 30 183 64, 97 VH-2 30 77, 4 102, 59

VS-3 34 183, 35 72, 48 VH-3 34 77, 53 134, 62

VS-4 27 181 74, 77 VH-4 27 76, 74 59, 74

1.1. Výběr je náhodným výběrem z normálního rozdělení N(µ; σ2 ) z

danými parametry. Určete interval spolehlivosti pro střední hodnotu µ.

Ke stanovení intervalů spolehlivosti použijeme statistiku

X − µ √

T = n ∼ t(n − 1),

S

která má t−rozdělení o n − 1 stupních volnosti. Poznamenejme, že pro

n ≥ 30 je t−rozdělení již shodné z normovaným normálním rozdělením

N(0; 1). Je pak:

oboustranný interval spolehlivosti

(♠) X − S √ n t1− α

2 ≤ µ ≤ X + S √ n t1− α

2 ;

jednostranné intervaly spolehlivosti

(♣) µ ≤ X + S √ n t1−α, µ ≥ X − S √ n t1−α.

a) Soubor 1990(M): Jedná se o soubor výšek v cm, X = 180,

S 2 = 38, 8, n = 71, rozpětí 〈165, 200〉.

Ke stanovení intervalů použijeme vzorce (♠) a (♣).

oboustranný interval

α t1− α

2 S/ √ n µ

0, 1 1, 64485 1, 216 178, 78 < µ < 181, 216

0, 05 1, 95996 1, 4489 178, 55 < µ < 181, 449

0, 001 2, 57583 1, 9042 178, 1 < µ < 181, 904

jednostranné intervaly

α t1−α S/ √ n µ µ

0, 1 1, 2816 0, 9474 µ < 180, 95 µ > 179, 05

0, 05 1, 64485 1, 216 µ < 181, 22 µ > 178, 78

0, 001 2, 3264 1, 95996 µ < 181, 72 µ > 178, 28

) Soubor 1990(Ž): Jedná se o soubor výšek v cm, X = 165, 55,

S 2 = 47, 27, n = 11, rozpětí 〈152, 178〉.

Ke stanovení intervalů použijeme vzorce (♠) a (♣).

oboustranný interval

α t1− α

2 S/ √ n µ

0, 1 1, 8125 3, 7573 161, 79 < µ < 169, 31

0, 05 2, 2281 4, 61885 160, 93 < µ < 170, 17

0, 001 2, 76383 6, 5699 158, 98 < µ < 172, 12

jednostranné intervaly

α t1−α S/ √ n µ µ

0, 1 1, 3722 2, 8446 µ < 168, 39 µ > 162, 70

0, 05 1, 8125 3, 7573 µ < 169, 31 µ > 161, 79

0, 001 2, 7638 5, 7294 µ < 171, 28 µ > 159, 82

c) Soubor 1990(M): Jedná se o soubor vah v kg, Y = 72, 52,

S 2 = 55, 192, n = 71, rozpětí 〈60, 95〉.

Ke stanovení intervalů použijeme vzorce (♠) a (♣).

oboustranný interval

α t1− α

2 S/ √ n µ

0, 1 1, 64485 1, 4502 71, 07 < µ < 73, 97

0, 05 1, 95996 1, 728 70, 79 < µ < 74, 25

0, 001 2, 57583 2, 27 70, 25 < µ < 74, 79

jednostranné intervaly

α t1−α S/ √ n µ µ

0, 1 1, 2816 1, 1299 µ < 73, 65 µ > 71, 39

0, 05 1, 64485 1, 4502 µ < 73, 97 µ > 71, 07

0, 001 2, 3264 2, 051 µ < 74, 57 µ > 70, 47

d) Soubor 1990(Ž): Jedná se o soubor vah v kg, Y = 56, 78,

S 2 = 41, 017, n = 11, rozpětí 〈45, 77〉.

Ke stanovení intervalů použijeme vzorce (♠) a (♣).

oboustranný interval

α t1− α

2 S/ √ n µ

0, 1 1, 8125 3, 499 53, 28 < µ < 60, 28

0, 05 2, 2281 4, 302 52, 48 < µ < 61, 08

0, 001 2, 76383 6, 1199 47, 66 < µ < 65, 90

jednostranné intervaly

α t1−α S/ √ n µ µ

0, 1 1, 3722 2, 6497 µ < 59, 43 µ > 54, 13

0, 05 1, 8125 3, 4999 µ < 60, 28 µ > 53, 28

0, 001 2, 7638 5, 3374 µ < 62, 12 µ > 51, 44

1.2. Výběr je náhodným výběrem z normálního rozdělení N(µ; σ 2 ) z

danými parametry. Určete interval spolehlivosti pro rozptyl σ 2 .

Ke stanovení intervalů spolehlivosti použijeme statistiku

Y =

n − 1

σ 2 S2 ,

která má rozdělení χ 2 (n − 1). Vycházíme ze skutečnosti, že pro statistiku

S 2 je E(S 2 ) = σ 2 a může tedy sloužit jako vhodný odhad parametru σ 2 .

Oboustraný interval spolehlivosti dostaneme ve tvaru

(♠♠)

(n − 1)

χ2 1− α

S

2

2 < σ 2 <

(n − 1)

χ2 S

α

2

2 .

Jednostranné intervaly spolehlivosti dostaneme ve tvaru

(♣♣) σ 2 >

(n − 1)

χ2 1− α

S

2

2 , σ 2 <

50

(n − 1)

χ2 S

α

2

2 .

a) Soubor 1990(M): Jedná se o soubor výšek v cm, X = 180,

S 2 = 38, 8, n = 71, rozpětí 〈165, 200〉.

Ke stanovení intervalů použijeme vzorce (♠♠) a (♣♣).

α χ 2 1− α

2

oboustranný interval

χ 2 α

2

0, 1 90, 531 51, 739 30 < σ 2 < 52, 49

0, 05 95, 023 48, 758 28, 58 < σ 2 < 55, 70

0, 001 104, 21 43, 275 26, 06 < σ 2 < 62, 76

jednostranné intervaly

α χ 2 1−α χ 2 α σ 2 σ 2

0, 1 − − σ 2 < σ 2 >

0, 05 90, 531 51, 739 σ 2 < 52, 49 σ 2 > 30

0, 001 100, 43 45, 442 σ 2 < 59, 77 σ 2 > 27, 04

b) Soubor 1990(Ž): Jedná se o soubor výšek v cm, X = 165, 55,

S 2 = 47, 27, n = 11, rozpětí 〈152, 178〉.

Ke stanovení intervalů použijeme vzorce (♠♠) a (♣♣).

α χ 2 1− α

2

oboustranný interval

χ 2 α

2

0, 1 18, 307 3, 9403 25, 82 < σ 2 < 119, 96

0, 05 20, 483 3, 247 23, 08 < σ 2 < 145, 6

0, 001 25, 188 2, 1559 18, 77 < σ 2 < 198, 4

jednostranné intervaly

α χ 2 1−α χ 2 α σ 2 σ 2

0, 1 − − σ 2 < σ 2 >

0, 05 18, 307 3, 9403 σ 2 < 119, 96 σ 2 > 25, 82

0, 001 23, 209 2, 5582 σ 2 < 184, 78 σ 2 > 20, 37

51

σ 2

σ 2

c) Soubor 1990(M): Jedná se o soubor vah v kg, Y = 72, 52,

S 2 = 55, 192, n = 71, rozpětí 〈60, 95〉.

Ke stanovení intervalů použijeme vzorce (♠) a (♣).

α χ 2 1− α

2

oboustranný interval

χ 2 α

2

0, 1 90, 531 51, 739 42, 68 < σ 2 < 74, 67

0, 05 95, 023 48, 758 40, 66 < σ 2 < 79, 24

0, 001 104, 21 43, 275 37, 07 < σ 2 < 89, 28

jednostranné intervaly

α χ 2 1−α χ 2 α σ 2 σ 2

0, 1 − − σ 2 < σ 2 >

0, 05 90, 531 51, 739 σ 2 < 74, 67 σ 2 > 42, 68

0, 001 100, 43 45, 442 σ 2 < 85, 02 σ 2 > 38, 47

d) Soubor 1990(Ž): Jedná se o soubor vah v kg, Y = 56, 78,

S 2 = 41, 017, n = 11, rozpětí 〈45, 77〉.

Ke stanovení intervalů použijeme vzorce (♠) a (♣).

α χ 2 1− α

2

oboustranný interval

χ 2 α

2

0, 1 18, 307 3, 9403 22, 41 < σ 2 < 104, 1

0, 05 20, 483 3, 247 20, 02 < σ 2 < 126, 32

0, 001 25, 188 2, 1559 16, 28 < σ 2 < 190, 25

jednostranné intervaly

α χ 2 1−α χ 2 α σ 2 σ 2

0, 1 − − σ 2 < σ 2 >

0, 05 18, 307 3, 9403 σ 2 < 104, 1 σ 2 > 22, 41

0, 001 23, 209 2, 5582 σ 2 < 160, 33 σ 2 > 17, 67

52

σ 2

σ 2

2. Exponenciální rozdělení.

2.1. Výběr je náhodným výběrem z exponenciálního rozdělení Exp(0; δ)

z danými parametry. Určete interval spolehlivosti pro střední hodnotu δ.

Zde využijeme skutečnosti, že je střední hodnota E(X) = δ. a toho, že

statistika

T = 2nX

δ

má rozdělení χ 2 (2n).

Interval spolehlivosti získáme ve tvaru

kde v1 = χ 2 α

2

2nX

v2

< δ < 2nX

,

(2n) a v2 = χ2 1− α(2n)

kvantil rozdělení chí-kvadrát.

2

Obdobně dostaneme jednostrané intervaly spolehlivosti ve tvaru

2nX

v2

v1

< δ, δ < 2nX

,

kde v1 = χ 2 α(2n) a v2 = χ 2 1−α(2n) kvantil rozdělení chí-kvadrát.

a) Soubor byl generován z exponenciálního rozdělení Exp(0; δ) a má

parametry:

X = 1, 094, n = 40.

Potom je 2nX = 80.1, 094 = 87, 5318. Odtud dostaneme

oboustranný interval spolehlivosti

α χ 2 1− α

2

χ 2 α

2

0, 1 101, 88 60, 391 0, 86 < δ < 1, 45

0, 05 106, 63 57, 153 0, 82 < δ < 1, 53

0, 001 116, 32 51, 172 0, 75 < δ < 1, 71

jednostranný interval spolehlivosti

α χ 2 1−α χ 2 α δ δ

0, 1 - - - -

0, 05 101, 88 60, 391 0, 86 < δ δ > 1, 45

0, 001 106, 63 57, 153 0, 82 < δ δ > 1, 53

53

v1

3. Alternativní rozdělení.

V tabulce jsou hodnoty, které odpovídají výběru z alternativního rozdělení

pro p = 1 .

6 = 0, 1667. Jsou to počty, kolikrát při n hodech hrací kostkou

padnou čísla 1, 2,. . . ,6. Podmínka pro aproximaci pomocí normálního rozdělení

je np(1 − p) > 9, tedy n > 65.

n ˜ X ˜ X ˜ X ˜ X ˜ X ˜ X n

6

90 10 14 15 13 22 16 15

120 17 19 20 18 25 21 20

150 24 22 25 22 28 29 25

180 31 25 29 27 34 34 30

240 39 39 40 34 49 39 40

300 47 53 51 40 61 48 50

V další tabulce jsou uvedeny výběrové průměry X, tedy odhady para-

=

.

0, 1667.

metru p = 1

6

n X X X X X X

90 0,1111 0,1556 0,1667 0,1444 0,2444 0,1778

120 0,1417 0,1583 0,1667 0,15 0,2083 0,175

150 0,16 0,1466 0,1667 0,1467 0,1867 0,1933

180 0,1722 0,1389 0,1611 0,15 0,1889 0,1889

240 0,1625 0,1625 0,1667 0,1417 0,2042 0,1625

300 0,1567 0,1767 0,17 0,133 0,2033 0,16

Interval spolehlivosti pro parametr p určíme ze vzorce

X − u1− α

2

X(1 − X)

n

≤ p ≤ X + u1− α

2

X(1 − X)

n

a příslušné výsledky jsou uvedeny v tabulce.

Pro kvantily u1− α dostaneme z tabulek hodnoty:

2

u0,95 = 1, 64485, u0,975 = 1, 95996, u0,995 = 2, 57583.

Pro kvantily uα, resp, u1−α dostaneme:

u0,9 = 1, 28155, u0,95 = 1, 64485, u0,99 = 2, 32635.

n

90 0,057 - 0,1655 0,10928 - 0,2188 0,1021 - 0,2313

120 0,0894 - 0,1994 0,1035 - 0,2131 0,1108 - 0,2226

150 0,1108 -0,2092 0,0991- 0,1941 0,1167 - 0,2167

180 0,126 - 0,2184 0,0965 - 0,1813 0,116 - 0,2026

240 0,1234- 0,2016 0,1234 - 0,2016 0,1271 - 0,2063

300 0,1159 -0,1975 0,1405 - 0,2129 0,1343 - 0,2057

n

90 0,934 - 0,1954 0,1699 - 0,3189 0,115 - 0,2441

120 0,1573 - 0,2593 0,1547 - 0,2619 0,1179 - 0,2321

150 0,0992 - 0,1942 0,1344 -0,2369 0,1403- 0,2463

180 0,1061 - 0,1939 0,1409 - 0,2369 0,1409 - 0,2369

240 0,1047 - 0,1787 0,1641- 0,247 0,1234 - 0,2016

300 0,1008 - 0,1652 0,1651 -0,2415 0,1251 - 0,1949

4. Geometrické rozdělení.

Interval spolehlivosti pro parametr p má tvar

X − 1

√ n u1− α

2

X(X − 1) ≤ 1

p

≤ X + 1

√ n u1− α

2

X(X − 1).

Jeho vyjádření si ukážeme pro data jsou ze souboru z geometrickým

rozdělením s parametrem p = 1 1

6 , tedy p = 6. Jedná se o počet hodů hrací

kostkou, které musíme provést, aby padlo zvolené číslo, např. šestka.

Pro hodnotu α = 0, 1 je u0,95 = 1, 64485 a pro hodnoty ze souboru

máme:

n X < 1

p

30 4,633 3, 4 < 1

p

120 5,65 4, 88 < 1

p

180 5,86 5, 2 < 1

p

<

< 5, 87 0, 17

< 6, 412 0, 156

< 6, 5 0, 154

Intervalové odhady parametrů(10)

Intervalové odhady parametrů(10) ... View more Intervalové odhady parametrů(10)

Delete template?

Save as template ?

Intervalové odhady parametrů(10) Intervalové odhady parametrů(10)