20.07.2013 Views

12. Náhodný výběr

12. Náhodný výběr

12. Náhodný výběr

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>12.</strong> N á h o d n ý v ý b ě r<br />

Při sledování a studiu vlastností náhodných výsledků poznáme charakter rozdělení z toho,<br />

že opakovaný náhodný pokus nám dává za stejných podmínek různé výsledky. Ty odpovídají<br />

hodnotám jednotlivých realizací náhodné veličiny, která popisuje příslušný náhodný proces.<br />

Základním pojmem statistiky se tak stává pojem náhodného <strong>výběr</strong>u, který je modelem popsané<br />

situace.<br />

<strong>12.</strong>1. Definice: <strong>Náhodný</strong> <strong>výběr</strong> je uspořádaná n-tice (náhodný vektor)<br />

(X1, X2, . . . , Xn) náhodných veličin Xi, 1 ≤ i ≤ n, které jsou nezávislé a mají stejné rozdělení.<br />

Poznámka: Je-li F distribuční funkce popisující rozdělení náhodných veličin Xi, pak<br />

sdružená distribuční funkce náhodného <strong>výběr</strong>u je rovna F (x1).F (x2) . . . F (xn). Obdobně pro<br />

sdruženou hustotu či pravděpodobnostní funkci dostaneme vyjádření ve tvaru<br />

f(x1).f(x2) . . . f(xn), resp. p(x1).p(x2) . . . p(xn) je-li f hustota resp. p pravděpodobnostní<br />

funkce náhodné veličiny Xi.<br />

Studium vlastností rozdělení obvykle provádíme pomocí vhodně zvolené funkce náhodného<br />

<strong>výběr</strong>u (statistiky). Uvedeme ty, které nejčastěji používáme.<br />

<strong>12.</strong>2. Definice: Výběrový průměr, <strong>výběr</strong>ový rozptyl. Jsou-li (X1, X2, . . . , Xn) a<br />

(Y1, Y2, . . . , Yn) náhodné <strong>výběr</strong>y, pak označujeme a nazýváme statistiku:<br />

X = n<br />

Xi - <strong>výběr</strong>ovým úhrnem;<br />

i=1<br />

X = 1<br />

n<br />

n<br />

Xi - <strong>výběr</strong>ovým průměrem;<br />

i=1<br />

S2 X = S2 = 1<br />

n<br />

n−1 (Xi − X)<br />

i=1<br />

2 - <strong>výběr</strong>ovým rozptylem;<br />

s2 = 1<br />

n<br />

n (Xi − X)<br />

i=1<br />

2 ; - střední kvadratickou odchylkou;<br />

SXY = 1<br />

n<br />

n−1 (Xi − X)(Yi − Y ) - <strong>výběr</strong>ovým koeficientem kovariance;<br />

i=1<br />

sXY = 1<br />

n<br />

n (Xi − X)(Yi − Y )<br />

i=1<br />

- <strong>výběr</strong>ovým koeficientem korelace.<br />

rXY = SXY<br />

SXSY<br />

= sXY<br />

sXsY<br />

Poznámka: Pro vyčíslení <strong>výběr</strong>ových charakteristik používáme někdy jiného vyjádření.<br />

Je totiž<br />

(n − 1)S 2 = ns 2 = n<br />

a<br />

Je tedy<br />

Je také<br />

i=1<br />

2 Xi − X = n<br />

<br />

X<br />

i=1<br />

2 i − 2XiX<br />

<br />

2<br />

+ X = n<br />

X<br />

i=1<br />

2 i<br />

S 2 = 1<br />

<br />

n<br />

X<br />

n − 1<br />

i=1<br />

2 <br />

2 i − n X = 1<br />

⎡<br />

n<br />

⎣<br />

n − 1<br />

i=1<br />

s 2 = 1<br />

n<br />

n<br />

X<br />

i=1<br />

2 i − (X) 2 .<br />

2 − n X .<br />

X 2 i − 1<br />

<br />

n<br />

⎤<br />

2<br />

Xi ⎦<br />

n<br />

i=1<br />

n<br />

n<br />

(n − 1)SXY = (Xi − X)(Yi − Y ) = (XiYi) − n(XY ) = nsXY ,<br />

i=1<br />

i=1<br />

62


XY =<br />

n 1<br />

n<br />

XiYi − (XY )<br />

i=1<br />

n 1<br />

n X<br />

i=1<br />

2 <br />

n 1<br />

i − (X)2 n Y<br />

i=1<br />

2<br />

i<br />

− (Y )2<br />

Pro uvedené statistiky platí několik tvrzení, která si postupně uvedeme.<br />

<strong>12.</strong>3.Věta: Vlastnosti <strong>výběr</strong>ového průměru a úhrnu. Je-li<br />

(X1, X2, . . . , Xn) náhodný <strong>výběr</strong> z rozdělení, kde E(Xi) = µ a D(Xi) = σ 2 , pak:<br />

E(X) = µ, E( X) = nµ a D(X) = σ2<br />

n , D( X) = nσ 2 .<br />

Důkaz: E( X) = E( n<br />

E(Xi) = nµ, E(X) = E(<br />

i=1 i=1<br />

1<br />

n X) = 1<br />

nE( X) = µ.<br />

Pro nezávislé náhodné veličiny ve <strong>výběr</strong>u je dostaneme<br />

D( X) = D( n<br />

i=1<br />

Xi) = n<br />

Xi) = n<br />

i=1<br />

D(Xi) = nσ 2 , D(X) = D( 1<br />

n X) = 1<br />

n 2 D( X) = σ2<br />

n .<br />

<strong>12.</strong>4. Věta: Vlastnosti <strong>výběr</strong>ového rozptylu. Je-li<br />

(X1, X2, . . . , Xn) náhodný <strong>výběr</strong> z rozdělení, kde E(Xi) = µ a<br />

D(Xi) = σ 2 , pak platí:<br />

E(S 2 ) = σ 2 , E(s 2 ) = n<br />

n − 1 σ2 a D(S 2 ) = 1<br />

n E(X4 i ) −<br />

<br />

n − 3<br />

n(n − 1) σ4 , n ≥ 3.<br />

<strong>12.</strong>5. <strong>Náhodný</strong> <strong>výběr</strong> z normálního rozdělení. Jestliže mají nezávislé náhodné veličiny<br />

Xi, 1 ≤ i ≤ n normální rozdělení N(µ, σ2 ) (náhodný <strong>výběr</strong> z normálního rozdělení), má<br />

pak<br />

<strong>výběr</strong>ový úhrn X = n<br />

Xi rozdělení N(nµ, nσ2 )<br />

i=1<br />

a <strong>výběr</strong>ový průměr X = 1<br />

n<br />

n<br />

i=1<br />

Xi rozdělení N(µ, σ2<br />

n ).<br />

<strong>12.</strong>6. Poznámka: Vlastnosti rozdělení <strong>výběr</strong>ového průměru a úhrnu vyplývají z centrální<br />

limitní věty. Za předpokladů, že se jedná o <strong>výběr</strong> z rozdělení s konečnou střední hodnotou<br />

µ a konečným rozptylem σ2 má <strong>výběr</strong>ový úhrn X v limitě normální rozdělení N(nµ, nσ2 )<br />

a <strong>výběr</strong>ový průměr X má v limitě normální rozdělení N(µ, σ2<br />

n ). Tyto skutečnosti můžeme<br />

zapsat vztahy pro distribuční funkce. Je<br />

lim<br />

n→∞ P<br />

<br />

X − nµ<br />

σ √ <br />

≤ x = lim<br />

n n→∞ P<br />

<br />

X − µ √<br />

n ≤ x = Φ(x), x ∈ R,<br />

σ<br />

kde Φ je distribuční funkce normovaného rozdělení N(0, 1).<br />

63


Některá rozdělení funkcí náhodného <strong>výběr</strong>u (statistik).<br />

<strong>12.</strong>13. Rozdělení chí kvadrát χ2 (n) o n stupních volnosti je rozdělení, které má náhodná<br />

veličina X = n<br />

U 2 i , kde Ui, 1 ≤ i ≤ n jsou nezávislé náhodné veličiny s normovaným<br />

i=1<br />

normálním rozdělením N(0, 1). Pro toto rozdělení je E(X) = n a D(X) = 2n. Hustota f<br />

tohoto rozdělení je dána předpisem<br />

<br />

0, x ≤ 0,<br />

f(x) =<br />

n<br />

√ 1<br />

2n n x 2<br />

Γ( ) 2 −1 x<br />

− e 2 , x > 0.<br />

Rozdělení je výrazně asymetrické, kvantily jsou kladné a jsou tabelovány. Až pro výrazně<br />

veliké hodnoty parametru n je možné toto rozdělení nahradit rozdělením normálním N(n; 2n).<br />

Pro velké hodnoty n, n > 100, má náhodná veličina<br />

U =<br />

X − n<br />

√ 2n ⇔ X = n + √ 2nU<br />

přibližně normované normální rozdělení N(0, 1). Tvrzení vyplývá ze skutečnosti, že se jedná<br />

o rzdělení součtu náhodných veličin s konečnou střední hodnotou a rozptylem. Pro kvantily<br />

xp náhodné veličiny X pak platí přibližný vzorec<br />

xp . √<br />

= n + up 2n,<br />

kde up jsou kvantily rozdělení N(0; 1). Průběh hustoty rozdělení χ 2 (n), pro dva stupně volnosti<br />

je znázorněn na obrázku Obr. <strong>12.</strong>4.<br />

<strong>12.</strong>14.Studentovo rozdělení (t- rozdělení) t(n) o n stupních volnosti má náhodná veličina<br />

T = U√ n<br />

Z ,<br />

kde náhodná veličina U má normované normální rozdělení N(0, 1) a náhodná veličina Z má<br />

rozdělení χ 2 (n). Rozdělení je symetrické vzhledem k počátku, je E(T ) = 0, D(T ) = n<br />

n−2 ,<br />

n > 2 a pro hodnoty n > 30 jej nahrazujeme normovanýn normálním rozdělením N(0, 1).<br />

Pro kvantily platí tp = −t1−p. Hustota f Studentova rozdělení je dána vzorcem<br />

f(x) =<br />

Γ( n+1<br />

2 )<br />

Γ( n<br />

2 )√ πn<br />

<br />

1 + x2<br />

n<br />

− n+1<br />

2<br />

, x ∈ R.<br />

Průběh hustoty t−rozdělení pro dvě hodnoty stupňů volnosti je znázorněn na obrázku Obr.<br />

<strong>12.</strong>3.<br />

n > 30<br />

y<br />

n = 3<br />

n < 5<br />

n = 5<br />

−3 −2 −1 0 1 2 3 x x<br />

Obr.<strong>12.</strong>3. Obr. <strong>12.</strong>4.<br />

64


<strong>12.</strong>15. Fischerovo-Snedecorovo rozdělení (F −rozdělení) Fm,n o m a n stupních volnosti<br />

má náhodná veličina<br />

F = Xn<br />

Y m ,<br />

kde náhodná veličina X má rozdělení χ 2 (m) a náhodná veličina Y má rozdělení χ 2 (n). Ná-<br />

hodná veličina F nabývá pouze kladných hodnot a je E(F ) = n<br />

n−2<br />

D(F ) = 2n2 (n+m−2)<br />

m(n−2) 2 (n−4)<br />

, n > 2 a<br />

, n > 4. Hustota f náhodné veličiny F je dána vzorcem<br />

f(x) =<br />

1<br />

B( m<br />

2<br />

, n<br />

2 )<br />

Pro kvantily Fp(m, n) rozdělení platí<br />

P<br />

Fp(m, n) =<br />

m<br />

m 2<br />

x<br />

n<br />

m<br />

2 −1<br />

<br />

1 + m<br />

n x<br />

m+n<br />

− 2<br />

, x > 0.<br />

1<br />

, 0 < p < 1.<br />

F1−p(n, m)<br />

Je totiž kvantil Fp náhodné veličiny F (m, n) určen podmínkou<br />

Odtud plyne, že<br />

1<br />

Fp<br />

≤<br />

P (F (m, n) ≤ Fp) = p ⇔ P<br />

<br />

Xn<br />

≤ Fp = p.<br />

Y m<br />

<br />

Y m<br />

Y m 1<br />

Y m 1<br />

= 1−P ≤ = p ⇒ P ≤ = P F (n, m) ≤<br />

Xn<br />

Xn Fp<br />

Xn Fp<br />

1<br />

<br />

= 1−p,<br />

Fp<br />

což je podmínka pro kvantil náhodné veličiny F (n, m). Je tedy F1−p(n, m) =<br />

Eulerovy funkce<br />

Definice: 1. Eulerovy funkce 1. a 2. druhu definujeme:<br />

Funkci Gama (Eulerova funkce 2. druhu) vztahem<br />

∞<br />

Γ(z) =<br />

0<br />

e −x x z−1 dx, z > 0.<br />

Funkci Beta (Eulerova funkce 1. druhu) vztahem<br />

B(p, q) =<br />

1<br />

Poznámka: Funkce voláme v<br />

MAPLE: GAMMA(z), BETA(p,q);<br />

OpenOffice: nemá zavedeny.<br />

Věta: 2. Pro funkci Γ platí:<br />

1. Γ(z + 1) = zΓ(z), z > 0;<br />

0<br />

x p−1 (1 − x) q−1 dx, p > 0, q > 0.<br />

65<br />

1<br />

Fp(m, n) .


Formuli odvodíme integrací per partes. Je<br />

∞<br />

Γ(z + 1) = e −x x z <br />

<br />

<br />

dx = <br />

<br />

0<br />

= −e −x x z ∞<br />

0<br />

∞<br />

+ +z<br />

jestliže použijeme skutečnosti, že lim<br />

x→∞ (e−x x z ) = 0.<br />

2. Γ(n + 1) = n!, n ∈ N ; Γ(1) = Γ(2) = 1;<br />

Pro z = 1 dostaneme<br />

∞<br />

Γ(1) =<br />

0<br />

0<br />

u ′ = e −x , v = x z<br />

u = −e −x , v ′ = zx z−1<br />

e −x x z−1 dx = zΓ(z),<br />

e −x dx = −e −x ∞<br />

0<br />

= 1.<br />

Dále je<br />

Γ(n + 1) = nΓ(n) = n(n − 1)Γ(n − 1) = . . . 1Γ(1) = n!.<br />

3. Γ( 1<br />

2 ) = √ π, Γ( 3 1√<br />

2 ) = 2 π.<br />

Pro z = 1<br />

2 dostaneme<br />

Γ( 1<br />

∞<br />

)) = e<br />

2 0<br />

−x 1<br />

−<br />

x 2 dx =<br />

∞<br />

=<br />

Dále je Γ( 3 1<br />

1 1<br />

2 ) = Γ( 2 + 1) = 2Γ( 2 ) =<br />

4. lim Γ(z) = lim Γ(z) = ∞;<br />

z→0+ z→∞<br />

Ze vztahu 2 dostaneme<br />

Γ(z) =<br />

Obdobně dostaneme pro z → ∞<br />

0<br />

<br />

<br />

<br />

<br />

<br />

e −t2<br />

t −1 ∞<br />

2tdt = 2<br />

Γ(z + 1)<br />

z<br />

√ π<br />

2 .<br />

⇒ lim<br />

z→0+<br />

x = t2 ,<br />

1<br />

− x 2 = t−1 dx = 2tdt,<br />

0<br />

Γ(z + 1)<br />

z<br />

e −t2<br />

dt = √ π.<br />

<br />

<br />

= <br />

1 <br />

<br />

0+<br />

= ∞.<br />

lim Γ(z) = lim Γ(n + 1) = lim n! = ∞.<br />

z→∞ n→∞ n→∞<br />

5. Stirlingova formule<br />

Γ(z + 1) ≈ z z .e −z√ 2πz, n! ≈ n n .e −n√ 2πn, z, n → ∞.<br />

Odvození formule se vymyká z rámce kurzu.<br />

Věta: 3. Pro Eulerovu funkci B platí:<br />

1. B(p, q) = B(q, p);<br />

Vztah plyne ze vzorce pro provedení jednoduché substituce. Je<br />

B(p, q) =<br />

1<br />

0<br />

x p−1 (1 − x) q−1 <br />

<br />

<br />

dx = <br />

<br />

<br />

<br />

<br />

<br />

=<br />

<br />

<br />

<br />

<br />

=<br />

1 − x = t, x = 1 − t 1 → 0<br />

−dx = dt, 0 → 1<br />

0<br />

= − (1 − t)<br />

1<br />

p−1 t q−1 dt = B(q, p).<br />

2. B(p, 1) = 1<br />

1<br />

p , B(1, q) = q , B(1, 1) = 1;<br />

Po dosazení dostaneme<br />

1<br />

B(p, 1) = x p−1 <br />

xp dx =<br />

p<br />

0<br />

66<br />

1<br />

0<br />

= 1<br />

p ;<br />

<br />

<br />

<br />

<br />

=


B(1, q) = B(q, 1) = 1<br />

; pro p = 1 B(1, 1) = 1.<br />

q<br />

3. B(p, q + 1) = q<br />

pB(p + 1, q);<br />

Integrací per partes dostaneme<br />

1<br />

B(p, q + 1) = x p−1 (1 − x) q <br />

<br />

<br />

dx = <br />

<br />

<br />

xp ∞ = (1 − x)q<br />

p<br />

(m − 1)!(n − 1)!<br />

4. B(m, n) = ;<br />

(m + n − 1)!<br />

5. B(p, q) = Γ(p).Γ(q)<br />

Γ(p + q) .<br />

0<br />

0<br />

+ q<br />

1<br />

p 0<br />

u ′ = x p−1 , v = (1 − x) q<br />

u = xp<br />

p , v′ = −qx q−1<br />

x p (1 − x) q−1 dx = q<br />

B(p + 1, q).<br />

p<br />

67<br />

<br />

<br />

<br />

<br />

=

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!