SMOP2

SMOP2 SMOP2

from users.uj.edu.pl More from this publisher

04.11.2014 Views

STATYSTYCZNE METODY OPRACOWANIA POMIARÓW - 2 B. Kamys Spis tre±ci 1 Wstep - podstawowe poj¦cia 4 2 Wielowymiarowe zmienne losowe 11 2.1 Rozkªad prawdopodobie«stwa funkcji wielowymiarowej zmiennej losowej . . 15 2.2 Momenty rozkªadu wielowymiarowej zmiennej losowej . . . . . . . . . . . 17 2.3 Przybli»one wzory na momenty funkcji wielowymiarowej zmiennej . . . . . 21 3 Rozkªad normalny (Gaussa) 23 3.1 Wielowymiarowy rozkªad normalny . . . . . . . . . . . . . . . . . . . . 26 3.2 Dwuwymiarowy rozkªad normalny . . . . . . . . . . . . . . . . . . . . . 27 4 Estymacja parametrów 30 5 Estymacja punktowa E(x), σ 2 (x) i σ(x) 34 5.1 Estymacja punktowa E(x) . . . . . . . . . . . . . . . . . . . . . . . . 34 5.2 Estymator wariancji σ 2 (x) . . . . . . . . . . . . . . . . . . . . . . . . 35 5.3 Estymator odchylenia standardowego σ(x) . . . . . . . . . . . . . . . . 37 6 Estymacja przedziaªowa E(x), σ 2 (x) i σ(x) 39 6.1 Estymacja przedziaªowa warto±ci oczekiwanej E{x} - znane σ{x} . . . . 40 6.2 Estymacja przedziaªowa warto±ci oczekiwanej E{x} - nieznane σ{x} . . 42 6.3 Estymacja przedziaªowa wariancji i odchylenia standardowego . . . . . . . 43 7 Estymacja punktowa E{⃗y(⃗x)} i macierzy kowariancji ⃗y(⃗x) 45 8 Regresja liniowa 48 9 Regresja przy pomocy wielomianów ortogonalnych 51 9.1 Regresja przy pomocy wielomianów ortogonalnych na zbiorze warto±ci argumentu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 9.2 Konstrukcja zespoªu wielomianów ortogonalnych na zbiorze warto±ci argumentu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

STATYSTYCZNE METODY OPRACOWANIA

POMIARÓW - 2

B. Kamys

Spis tre±ci

1 Wstep - podstawowe poj¦cia 4

2 Wielowymiarowe zmienne losowe 11

2.1 Rozkªad prawdopodobie«stwa funkcji wielowymiarowej zmiennej losowej . . 15

2.2 Momenty rozkªadu wielowymiarowej zmiennej losowej . . . . . . . . . . . 17

2.3 Przybli»one wzory na momenty funkcji wielowymiarowej zmiennej . . . . . 21

3 Rozkªad normalny (Gaussa) 23

3.1 Wielowymiarowy rozkªad normalny . . . . . . . . . . . . . . . . . . . . 26

3.2 Dwuwymiarowy rozkªad normalny . . . . . . . . . . . . . . . . . . . . . 27

4 Estymacja parametrów 30

5 Estymacja punktowa E(x), σ 2 (x) i σ(x) 34

5.1 Estymacja punktowa E(x) . . . . . . . . . . . . . . . . . . . . . . . . 34

5.2 Estymator wariancji σ 2 (x) . . . . . . . . . . . . . . . . . . . . . . . . 35

5.3 Estymator odchylenia standardowego σ(x) . . . . . . . . . . . . . . . . 37

6 Estymacja przedziaªowa E(x), σ 2 (x) i σ(x) 39

6.1 Estymacja przedziaªowa warto±ci oczekiwanej E{x} - znane σ{x} . . . . 40

6.2 Estymacja przedziaªowa warto±ci oczekiwanej E{x} - nieznane σ{x} . . 42

6.3 Estymacja przedziaªowa wariancji i odchylenia standardowego . . . . . . . 43

7 Estymacja punktowa E{⃗y(⃗x)} i macierzy kowariancji ⃗y(⃗x) 45

8 Regresja liniowa 48

9 Regresja przy pomocy wielomianów ortogonalnych 51

9.1 Regresja przy pomocy wielomianów ortogonalnych na zbiorze warto±ci argumentu

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

9.2 Konstrukcja zespoªu wielomianów ortogonalnych na zbiorze warto±ci argumentu

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

SMOP-2 B.Kamys: 2007/08 2

10 Metody szukania estymatorów o po»¡danych wªasno±ciach 56

10.1 Metoda momentów (MM) . . . . . . . . . . . . . . . . . . . . . . . . 56

10.2 Metoda najwiekszej wiarygodno±ci (MNW) . . . . . . . . . . . . . . . 60

10.2.1 Oszacowanie bªedu parametru znalezionego MNW . . . . . . . . . 65

10.3 Metoda najmniejszych kwadratów (MNK) . . . . . . . . . . . . . . . . 66

11 Testowanie hipotez statystycznych 70

11.1 Denicje elementarnych poje¢ . . . . . . . . . . . . . . . . . . . . . . . 70

11.2 Schemat postepowania przy testowaniu hipotez . . . . . . . . . . . . . . 71

11.3 Hipotezy dotyczace warto±ci oczekiwanej . . . . . . . . . . . . . . . . . 73

11.3.1 Porównanie E(X) z liczba (H 0 : E(X) = X 0 ) . . . . . . . . . . 73

11.3.2 Warto±ci oczekiwane dwu populacji (H 0 : E(X) = E(Y )) . . . . 75

11.4 Hipotezy dotyczace wariancji . . . . . . . . . . . . . . . . . . . . . . . 77

11.4.1 Porównanie wariancji X z liczba (H 0 : σ 2 (X) = σ 2 0 ) . . . . . . . 77

11.4.2 Porównanie wariancji dwu populacji (H 0 : σ 2 (X) = σ 2 (Y )) . . . 77

11.5 Test normalno±ci rozkªadu . . . . . . . . . . . . . . . . . . . . . . . . . 79

11.5.1 Test zerowania sie wspóªczynnika asymetrii i kurtozy . . . . . . . . 79

11.5.2 Test zgodno±ci λ - Koªmogorowa . . . . . . . . . . . . . . . . . . 81

11.5.3 Test zgodno±ci χ 2 - Pearsona . . . . . . . . . . . . . . . . . . . 83

11.5.4 Wykres normalny . . . . . . . . . . . . . . . . . . . . . . . . . 85

11.6 Testy nieparametryczne hipotez porównujacych populacje . . . . . . . . . 87

11.6.1 Test Smirnowa . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

11.6.2 Test znaków . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

11.6.3 Test serii Walda-Wolfowitza . . . . . . . . . . . . . . . . . . . . 91

11.6.4 Test sumy rang Wilcoxona-Manna-Whitneya . . . . . . . . . . . . 94

11.6.5 Wykres kwantyl-kwantyl . . . . . . . . . . . . . . . . . . . . . . 95

11.7 Hipoteza jednorodno±ci wariancji . . . . . . . . . . . . . . . . . . . . . 97

11.7.1 Test Bartletta . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

11.7.2 Test Cochrana . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

11.7.3 Test F max Hartleya . . . . . . . . . . . . . . . . . . . . . . . . 98

11.8 Analiza wariancji (ANOVA) - klasykacja jednoczynnikowa . . . . . . . . 99

11.8.1 Inne sformuªowanie hipotezy zerowej . . . . . . . . . . . . . . . . 101

11.8.2 Praktyczne rachunki w ANOVA . . . . . . . . . . . . . . . . . . 102

11.8.3 Stabilizacja wariancji . . . . . . . . . . . . . . . . . . . . . . . . 103

11.9 Analiza wariancji (ANOVA) - klasykacja dwuczynnikowa . . . . . . . . . 105

11.10Test wspóªzale»no±ci statystycznej pomiedzy cechami jako±ciowymi . . . . 109

11.10.1 Test dokªadny (Fishera) dla tablic kontyngencji 2x2 . . . . . . . . 110

11.10.2 Test χ 2 dla tablic kontyngencji 2x2 . . . . . . . . . . . . . . . . 115

11.10.3 Wspóªczynnik korelacji rang ϱ Spearmana . . . . . . . . . . . . . 118

11.10.4 Wspóªczynnik korelacji rang τ Kendalla . . . . . . . . . . . . . . 121

11.10.5 Analiza asocjacyjna . . . . . . . . . . . . . . . . . . . . . . . . 125

11.10.6 Miary siªy zwiazku nominalnych zmiennych jako±ciowych . . . . . . 128

11.11Test istotno±ci dla wspóªczynnika korelacji Pearsona . . . . . . . . . . . . 132

11.12Test istotno±ci dla stosunku korelacyjnego . . . . . . . . . . . . . . . . . 134

SMOP-2 B.Kamys: 2007/08 3

12 Metoda Monte Carlo 138

12.1 Liczenie caªek metoda Monte Carlo . . . . . . . . . . . . . . . . . . . . 138

12.2 Zmniejszanie bªedu caªki . . . . . . . . . . . . . . . . . . . . . . . . . . 141

12.3 Generacja liczb losowych . . . . . . . . . . . . . . . . . . . . . . . . . . 143

12.3.1 Generacja liczb o rozkªadzie równomiernym . . . . . . . . . . . . 143

12.3.2 Generacja liczb losowych o dowolnych rozkªadach prawdopodobie«stwa 145

12.3.3 Generacja wielowymiarowych zmiennych losowych . . . . . . . . . 153

12.4 Modelowanie komputerowe . . . . . . . . . . . . . . . . . . . . . . . . 155

12.4.1 Modelowanie przechodzenia neutronów przez o±rodek symulacja . . 155

12.4.2 Modelowanie przez zastosowanie wag statystycznych . . . . . . . . 162

12.4.3 Modelowanie przechodzenia neutronów przez o±rodek wagi statystyczne

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

SMOP-2 B.Kamys: 2007/08 4

1 WSTEP - podstawowe poj¦cia

W tym wst¦pie zostan¡ przypomniane podstawowe pojecia teorii prawdopodobie«stwa.

Nie powtarzamy wszystkich niezbednych denicji (mo»na je znale¹¢ w notatkach do wykªadu

ze Statystycznych Metod Opracowania Pomiarów I na stronie internetowej IFUJ).

1. Zdarzenia losowe. Badane zdarzenia traktujemy jako zdarzenia losowe. Denicje

zdarze« losowych omawiali±my na SMOP1 a tu przypomnijmy tylko intuicyjne okre-

±lenie; sa to takie zdarzenia o których nie mo»emy z góry wyrokowa¢ czy

zajda czy te» nie. To intuicyjne okre±lenie nie uwzgl¦dnia zdarzenia pewnego

(zachodz¡cego zawsze) i zdarzenia niemo»liwego (nie zachodz¡cego nigdy), które

formalnie nale»¡ do zdarze« losowych.

2. Ka»demu zdarzeniu losowemu mo»emy przypisa¢ prawdopodobie«stwo, które jest

miara czesto±ci pojawiania sie zdarzenia w okre±lonych warunkach (de-

nicje tak»e poznali±my na wykªadzie SMOP-1). Prawdopodobie«stwo i metody

pracy z prawdopodobie«stwem stanowia dziaª matematyki nazywany teoria prawdopodobie«stwa,

na której opieraj¡ si¦ wszystkie rozwa»ania statystyki tak jak rozwa»ania

zyki opieraj¡ si¦ na formali¹mie matematyki.

3. Zmienne losowe to dodatkowe (poza prawdopodobie«stwem) charakterystyki zdarze«

losowych. W zyce zajmujemy sie tylko wielko±ciami, które mog¡ by¢ zmierzone

tzn. takimi, które moga by¢ ilo±ciowo porównane z wielko±ci¡ tego samego rodzaju

przyj¦t¡ za jednostke. Dlatego te» w zyce wystepuja tylko ilo±ciowe zmienne

losowe.

W przyrodniczych dziedzinach wiedzy zwiazanych z organizmami »ywymi, wprowadza

sie tak»e jako±ciowe zmienne losowe. Zmienne te dzielimy na zmienne nominalne,

dla których okre±lona jest jedynie relacja identyczny - ró»ny i zmienne

porzadkowe, dla których dodatkowo mo»na wprowadzi¢ relacje uporzadkowania

(lepszy ni» , bardziej bolesny, itp.). Dla zmiennych nominalnych i porzadkowych

stosuje si¦ specyczne metody statystyczne.

Warto przypomnie¢, »e obok powy»szego podziaªu wprowadzone sa inne klasykacje,

np. zmienne mierzalne dzieli sie na zmienne ciagªe i zmienne dyskretne ze

wzgledu na przyjmowany zbiór warto±ci (oczywi±cie moga równie» istnie¢ zmienne

o charakterze mieszanym, tzn. przyjmujace w pewnych przedziaªach zmienno±ci

warto±ci dyskretne a w innych warto±ci ciagªe). Inny jeszcze podziaª zmiennych

mierzalnych to podziaª na zmienne przedziaªowe, dla których nie jest okre±lone

naturalne zero skali (np. temperatura w skali Celsjusza) oraz zmienne stosunkowe

gdzie zero skali jest naturalnym a nie umownym zerem (np. temperatura w skali

bezwzglednej). Dla pierwszego typu zmiennych istotne sa tylko przyrosty zmiennej

a nie ma sensu bezwzgledna warto±¢ tych zmiennych a wiec w szczególno±ci nie

mo»na liczy¢ ilorazów warto±ci tych zmiennych w odró»nieniu od zmiennych stosunkowych

gdzie ilorazy sa dobrze okre±lone i moga by¢ poprawnie interpretowane.

Stad wªa±nie pochodza przytoczone nazwy.

SMOP-2 B.Kamys: 2007/08 5

4. Statystyka jest dziaªem nauki, który posªugujac sie metodami teorii prawdopodobie«stwa

zajmuje sie zdarzeniami losowymi badanymi w praktyce do±wiadczalnej i

obserwacyjnej. W szczególno±ci statystyka podaje przepisy jak na podstawie sko«-

czonej grupy obserwacji czy pomiarów wnioskowa¢ o wszystkich mo»liwych obserwacjach

i pomiarach (teoria estymacji) i okre±la reguªy stawiania hipotez i ich

sprawdzania na podstawie sko«czonej liczby obserwacji czy pomiarów (testowanie

hipotez statystycznych). W obu tych podstawowych dziaªach statystyki trzeba

stosowa¢ specyczne metody je»eli mamy do czynienia ze zmiennymi nominalnymi

i porzadkowymi.

5. Metoda Monte Carlo to bardzo rozpowszechniona ostatnio metoda rozwi¡zywania

ró»nych zada« matematyki i nauk przyrodniczych przez przyporz¡dkowanie oryginalnemu

problemowi równowa»nego zagadnienia z teorii prawdopodobie«stwa i

rozwi¡zania tego problemu metodami statystycznymi.

6. Rozkªad prawdopodobie«stwa, funkcja gesto±ci prawdopodobie«stwa i dystrybuanta

zwana tak»e przez statystyków funkcja rozkªadu sa wielko±ciami u»ywanymi

do okre±lenia, jakie jest prawdopodobie«stwo pojawiania sie ró»nych warto-

±ci (mierzalnej) zmiennej losowej. Odpowiednie denicje poznali±my na wykªadzie

SMOP1.

DEFINICJA:

Przypomnijmy tutaj, »e rozkªad prawdopodobie«stwa to przyporzadkowanie dyskretnym

warto±ciom zmiennej losowej prawdopodobie«stw - stosowany jest wiec

tylko dla dyskretnych zmiennych losowych:

P (x k ) = p k , k = 1, 2, . . . (1)

PRZYKŠAD:

Rozkªad dwumianowy (Bernoulliego) to rozkªad prawdopodobie«stwa pojawienia

si¦ k pozytywnych wyników w serii n niezale»nych prób je»eli wiadomo, »e prawdopodobie«stwo

otrzymania pozytywnego wyniku w pojedynczej próbie wynosi p:

P (k) =

(

n

k

)

· p k · (1 − p) n−k (2)

Zmienna k przyjmuje warto±ci od zera do n.

SMOP-2 B.Kamys: 2007/08 6

Jak ªatwo sprawdzi¢ suma prawdopodobie«stw wszystkich (wykluczaj¡cych si¦) wyników

na warto±¢ zmiennej k jest równa jedno±ci bo zgodnie ze wzorem Newtona

taka suma jest równa n-tej pot¦dze dwumianu; [p+(1−p)] n , który to»samo±ciowo

równy jest jedno±ci.

DEFINICJA:

Funkcja gesto±ci prawdopodobie«stwa okre±la jakie jest prawdopodobie«stwo

przyjmowania przez zmienna ciagªa X warto±ci z przedziaªu [x, x + dx]:

f(x)dx ≡ P (x ≤ X ≤ x + dx) (3)

Stad mo»na ªatwo wydedukowa¢ nastepujace, wa»ne wªasno±ci funkcji gesto±ci prawdopodobie«stwa:

• f(x) ≥ 0

• wymiar f(x) to 1/(wymiar x)

• f(x) jest unormowana: ∫ +∞

−∞

f(x)dx = 1.

DEFINICJA:

Najbardziej ogólna wielko±cia, która mo»na zastosowa¢ zarówno do zmiennych

ciagªych jak i dyskretnych jest dystrybuanta zdeniowana nastepujaco:

F (x) ≡ P (X < x) (4)

przy czym dla zmiennych ciagªych istnieje nastepujaca relacja pomiedzy dystrybuanta

i funkcja gesto±ci prawdopodobie«stwa:

oraz

F (x) =

f(x) =

∫ x

−∞

f(t)dt

dF (x)

dx .

7. Warto±¢ oczekiwana,wariancja,odchylenie standardowe to podstawowe wielko-

±ci, które zawieraja w sobie wa»ne informacje o rozkªadzie prawdopodobie«stwa

(funkcji gesto±ci prawdopodobie«stwa). Znajomo±¢ tych wielko±ci musi nam czesto

SMOP-2 B.Kamys: 2007/08 7

zastapi¢ znajomo±¢ rozkªadu prawdopodobie«stwa, który znacznie trudniej wyznaczy¢

z do±wiadczenia.

DEFINICJA:

Warto±¢ oczekiwana x deniowana jest dla zmiennych ciagªych jako:

∫

E(x) ≡

x · f(x)dx (5)

oraz dla zmiennych dyskretnych jako:

E(x) ≡ ∑ i

x i · p(x i ) (6)

WŠASNO‘CI:

• Warto±¢ oczekiwana jest ta warto±cia, dookoªa której gromadza sie

warto±ci zmiennej losowej - wynika to z nierówno±ci Czebyszewa podanej

poni»ej (po denicji wariancji).

• Warto zapamieta¢, »e warto±¢ oczekiwana kombinacji liniowej jest kombinacja

liniowa warto±ci oczekiwanych bo operator caªkowania i operator sumy sa operatorami

liniowymi:

E( ∑ j

C j x j ) ≡ ∑ j

C j · E(x j )

• Cz¦sto wykorzystuje si¦ fakt, »e warto±¢ oczekiwan¡ pewnej funkcji zmiennej

x; g(x), mo»na policzy¢ korzystaj¡c z funkcji g¦sto±ci prawdopodobie«-

stwa (rozkªadu prawdopodobie«stwa) samego argumentu x:

E(g(x)) =

∫

g(x) · f(x)dx

= ∑ g(x i ) · p(x i )

DEFINICJA:

i

Wariancja, oznaczana var(x) lub σ 2 (x) deniowana jest jako warto±¢ oczekiwana

kwadratu odchylenia zmiennej od jej warto±ci oczekiwanej:

SMOP-2 B.Kamys: 2007/08 8

var(x) ≡ E [ (x − E(x)) 2] (7)

Prosze zapamieta¢ trzy nastepujace wªasno±ci wariancji, które czesto wykorzystuje

sie w praktyce:

• Wariancja nie zmienia sie przy przesunieciu zera skali zmiennej x (lub jak kto

woli nie zmienia sie przy dodaniu dowolnej staªej do zmiennej x),

• Zmiana jednostki skali o czynnik C (lub inaczej pomno»enie zmiennej x przez

staªe C) powoduje pomno»enie wariancji przez czynnik C 2 .

• Czesto wygodnie jest liczy¢ wariancje zmiennej x jako ró»nice warto±ci oczekiwanej

kwadratu zmiennej x i kwadratu warto±ci oczekiwanej x:

var(x) = E(x 2 ) − E 2 (x)

Dwie pierwsze wªasno±ci wynikaja w prosty sposób z denicji wariancji oraz z faktu,

»e w pierwszym przypadku dodanie staªej warto±ci C do zmiennej x powoduje dodanie

tej samej warto±ci C do warto±ci oczekiwanej E(x) (a wiec ró»nica x − E(x)

nie zmienia sie) a w drugim przypadku pomno»enie zmiennej x przez staªy czynnik

C powoduje pomno»enie warto±ci oczekiwanej x przez ten czynnik a operacja

podnoszenia do kwadratu, wystepujaca w denicji wariancji, powoduje pojawienie

sie czynnika C 2 . Trzecia wªasno±¢ ªatwo otrzyma¢ rozpisujac jawnie kwadrat ró»-

nicy wystepujacy w denicji wariancji a nastepnie dziaªajac operatorem warto±ci

oczekiwanej na poszczególne wyrazy.

DEFINICJA:

Odchylenie standardowe σ(x) z denicji jest pierwiastkiem arytmetycznym (liczba

nieujemna) z wariancji.

Wariancja lub/i odchylenie standardowe u»ywane sa jako miary rozrzutu

warto±ci zmiennej losowej x dookoªa jej warto±ci oczekiwanej co mo»na

wywnioskowa¢ z nierówno±ci Czebyszewa:

Nierówno±¢ Czebyszewa gªosi, »e dla ka»dej zmiennej losowej, która posiada skonczona

wariancje (a wiec i warto±¢ oczekiwana) zachodzi zwiazek (∀ k > 0):

P (|x − E(x)| ≥ k · σ(x)) ≤ 1 k 2 . (8)

Skoro warto±¢ oczekiwana i odchylenie standardowe zmiennej x maja interpretacje

centrum rozkªadu i naturalnej jednostki zmiennej x to jest oczywiste, »e dla celów

SMOP-2 B.Kamys: 2007/08 9

praktycznych wygodnie jest wprowadzi¢ tzw.

zdeniowana jest jako:

zmienna standaryzowana, która

z ≡

(x − E(x))

σ(x)

(9)

Jak ªatwo sprawdzi¢ warto±¢ oczekiwana zmiennej standaryzowanej równa jest zero:

E(z) = 0 a odchylenie standardowe równe jest jedno±ci: σ(z) = 1. Zgodnie z

twierdzeniem Czebyszewa warto±ci zmiennej standaryzowanej gromadza

sie dookoªa warto±ci zerowej na odcinku równym kilku jednostkom .

8. Kwantyle (albo fraktyle) to nastepne wa»ne i wygodne wielko±ci charakteryzujace

rozkªad prawdopodobie«stwa (funkcje gesto±ci prawdopodobie«stwa).

DEFINICJA:

Kwantylem na poziomie q nazywamy taka warto±¢ zmiennej losowej x q , dla której

speªniona jest relacja:

p(X < x q ) = q (10)

Korzystajac z denicji dystrybuanty F (x) mo»emy ten zwiazek zapisa¢ nastepujaco:

F (x q ) = q.

Kwantyle u»ywane sa bardzo czesto przy testowaniu hipotez statystycznych a

tak»e przy estymacji przedziaªowej.

DEFINICJA:

Specycznymi kwantylami sa decyle, tj. kwantyle na poziomie 0,1, 0,2, 0,3 ... oraz

percentyle, tj. kwantyle na poziomie 0,01, 0,02, ...

DEFINICJA:

U»ywa sie równie» specjalnej nazwy na okre±lenie kwantyla x 0.5 (mediana) oraz na

okre±lenie kwantyli x 0.25 i x 0.75 (dolny kwartyl i górny kwartyl).

SMOP-2 B.Kamys: 2007/08 10

Mediana sªu»y do okre±lania gdzie grupuja sie warto±ci zmiennej (poªowa warto-

±ci zmiennej jest mniejsza od mediany a poªowa wieksza) a wiec mediana mo»e

by¢ zastosowana w tym samym celu co warto±¢ oczekiwana . U»ywa sie jej

szczególnie wtedy gdy pojawiaja sie warto±ci zmiennej losowej silnie odró»niajace

sie od pozostaªych (nawet gdy pojawiaja sie one rzadko maja zwykle silny wpªyw

na warto±¢ oczekiwana a znacznie mniejszy na mediane). Dotyczy to przede wszystkim

zmiennych dyskretnych oraz, co jest bardzo wa»ne, oszacowa« (estymatorów)

warto±ci oczekiwanej i mediany na podstawie niewielkiej próby.

Kwartyle u»ywane sa dla scharakteryzowania rozrzutu warto±ci badanej zmiennej

losowej (podobnie jak odchylenie standardowe) bo ich ró»nica daje pojecie o zakresie

zmienno±ci rozwa»anej zmiennej.

SMOP-2 B.Kamys: 2007/08 11

2 WIELOWYMIAROWE ZMIENNE LOSOWE

Wielowymiarowa zmienna losowa deniowana jest analogicznie jak jednowymiarowa

(skalarna), tzn. mo»na ja traktowa¢ jako wektor, którego skªadowe sa jednowymiarowymi

zmiennymi losowymi.

DEFINICJA:

Dystrybuanta :

F (x 1 , .., x N ) = P (X 1 < x 1 , ..., X N < x N ) (11)

DEFINICJA:

Funkcja gesto±ci prawdopodobie«stwa:

f(x 1 , ..., x N ).dx 1 ...dx N = P (x 1 ≤ X 1 < x 1 + dx 1 , ..., x N ≤ X N < x N + dx N ) (12)

Oprócz funkcji gesto±ci prawdopodobie«stwa dla caªego wektora losowego (X 1 , .., X N )

mo»na zdeniowa¢ jeszcze :

• Rozkªad brzegowy gesto±ci prawdopodobie«stwa i

• Rozkªad warunkowy gesto±ci prawdopodobie«stwa.

DEFINICJA:

Brzegowy rozkªad gesto±ci prawdopodobie«stwa

zmiennej X i ( i tej skªadowej wektora losowego) to wynik wycaªkowania funkcji gesto±ci

prawdopodobie«stwa dla caªej wielowymiarowej zmiennej po wszystkich skªadowych z

wyjatkiem X i :

∫

f b (X i ) =

dx 1 ..dx i−1 .dx i+1 ...dx N .f(x 1 , ..., x N ) (13)

Oczywi±cie mo»na stworzy¢ rozkªady brzegowe dla dwuwymiarowych zmiennych (je»eli

N > 2) caªkujac po wszystkich zmiennych z wyjatkiem tych dwu wybranych,rozkªad

SMOP-2 B.Kamys: 2007/08 12

brzegowy dla trzywymiarowych (je»eli N > 3) caªkujac po wszystkich z wyjatkiem tych

trzech zmiennych, itd.

Rozkªad warunkowy f w zmiennych (X 1 , .., X i ) pod warunkiem, »e zmienne (X i+1 , .., X N )

przyjmuja warto±¢ w niesko«czenie maªym przedziale (x i+1 ≤ X i+1 < x i+1 , .., x N ≤

X N < x N ) deniowany jest nastepujaco:

f w (x 1 , .., x i |x i+1 , .., x N ) = f(x 1, .., x N )

f b (x i+1 , .., x N )

(14)

Rozkªad ten nie jest okre±lony, gdy rozkªad brzegowy wystepujacy w mianowniku zeruje

sie. Wska¹niki w i b zostaªy u»yte w tym wzorze aby podkre±li¢, »e posta¢ funkcyjna

tych rozkªadów jest w ogólno±ci inna ni» rozkªadu f(x 1 , .., x N ).

Rozkªad warunkowy mo»na tworzy¢ dla ró»nych zespoªów skªadowych wektora losowego,

np. mogliby±my zdeniowa¢ rozkªad warunkowy pojedynczej zmiennej X N pod

warunkiem, »e pozostaªe zmienne przyjmuja okre±lone warto±ci.

Rozkªad prawdopodobie«stwa wielowymiarowej dyskretnej zmiennej losowej jest

oczywistym uogólnieniem rozkªadu jednowymiarowego, a brzegowy rozkªad prawdopodobie«stwa

i warunkowy rozkªad prawdopodobie«stwa tworzy sie tak jak ich

odpowiedniki dla zmiennej ciagªej zastepujac caªkowanie sumowaniem po warto±ciach odpowiednich

skªadowych.

Warto równie» pamieta¢, »e mo»na tworzy¢ brzegowa dystrybuante i warunkowa

dystrybuante (zarówno dla zmiennej ciagªej jak i skokowej).

Niezale»ne zmienne losowe to takie, »e rozkªad warunkowy zmiennej (mo»e to by¢

wielowymiarowa zmienna) pod warunkiem, »e druga zmienna przyjmuje konkretne warto-

±ci (ta zmienna te» mo»e by¢ wielowymiarowa) równy jest rozkªadowi brzegowemu pierwszej

zmiennej:

f w (⃗x 1 |⃗x 2

) = f b (⃗x 1 ) (15)

Warunkiem koniecznym i wystarczajacym niezale»no±ci zmiennych losowych

jest aby ich wspólna funkcja gesto±ci prawdopodobie«stwa (dla zmiennej ciagªej) lub ich

wspólny rozkªad prawdopodobie«stwa (dla zmiennej dyskretnej) faktoryzowaªy sie tzn.

f(x 1 , ...x N ) = f 1 (x 1 ).f 2 (x 2 )....f N (x N ) (16)

SMOP-2 B.Kamys: 2007/08 13

UWAGA:

Zale»no±¢ statystyczna zmiennych jest sªabsza ni» zwiazek funkcyjny bo oznacza tylko,

»e rozkªad prawdopodobie«stwa a nie warto±¢ jednej ze zmiennych zale»y od warto±ci

drugiej zmiennej. Co wiecej, zale»no±¢ statystyczna nie oznacza zwiazku przyczynowego.

Najlepiej wida¢ to z faktu, »e gdy zmienna x nie zale»y statystycznie od y to automatycznie

y nie zale»y statystycznie od x a tak wcale nie musi by¢ przy zwiazku

przyczynowym, np. z faktu, »e wiek czªowieka nie zale»y przyczynowo od wzrostu nie

wynika, »e wzrost nie zale»y przyczynowo od wieku.

PRZYKŠAD

dla 2-wymiarowej zmiennej losowej:

Wspólna funkcja gesto±ci prawdopodobie«stwa X 1 i X 2 jest staªa (wynosi 1 / 2 ) w kwadracie

o wierzchoªkach {(-1,0),(0,1),(1,0) i (0,-1)} a zeruje sie poza kwadratem.

Rozkªad brzegowy X 1 :

⎧

⎪⎨

f b (X 1 ) =

⎪⎩

0 dla X 1 ≤ −1

X 1 + 1 dla −1 ≤ X 1 ≤ 0

−X 1 + 1 dla 0 ≤ X 1 ≤ +1

0 dla X 1 ≥ +1

Jest to rozkªad trójkatny zwany rozkªadem Simpsona. Mo»na wyobrazi¢ sobie

pogladowo, »e w powy»szym przykªadzie liczenie rozkªadu brzegowego jest równowa»ne

zsypywaniu punktów jednorodnego rozkªadu w kwadracie na o± X 1 co powoduje, »e rozkªad

brzegowy ma ksztaªt trójkata (w kwadracie zmiennych X 1 , X 2 najwiecej punktów

ma wspóªrzedna X 1 bliska zeru a ilo±¢ punktów z wiekszymi lub mniejszymi warto±ciami

tej wspóªrzednej maleje liniowo.

Rozkªad warunkowy X 1 pod warunkiem X 2 .

f w (X 1 |X 2 ) =

1

2

f b (X 2 )

Wzór ten wa»ny jest dla nastepujacego przedziaªu zmiennej X 1 :

−X 2 − 1 ≤ X 1 ≤ +X 2 + 1 gdy − 1 ≤ X 2 ≤ 0

+X 2 − 1 ≤ X 1 ≤ −X 2 + 1 gdy 0 ≤ X 2 ≤ +1

Jak wida¢ rozkªad warunkowy X 1 jest rozkªadem równomiernym w przedziale, którego

dªugo±¢ zale»y od warto±ci X 2 , co oznacza, »e zmienne sa zale»ne. Mo»emy to uja¢

inaczej: Poniewa» f w (X 1 |X 2 ) ≠ f b (X 1 ) to zmienne X 1 i X 2 sa zale»ne !.

Wyznaczanie rozkªadu warunkowego f w (X 1 |X 2 ) mo»na sobie wyobrazi¢ jako ogladanie

(patrzac wzdªu» osi X 2 ) przekroju prostopadªo±cianu wykonanego wzdªu» linii równolegªej

do osi X 1 i przechodzacej przez punkt o okre±lonej warto±ci X 2 . Przekrój ten to prostokat,

którego jeden bok - przedziaª zmienno±ci X 1 - zale»y od X 2 a poniewa» ze wzgledu na

SMOP-2 B.Kamys: 2007/08 14

normalizacje pole tego przekroju musi by¢ równe jedno±ci to i drugi bok prostokata -

warto±¢ warunkowej funkcji gesto±ci prawdopodobie«stwa f w (X 1 |X 2 ) = 1/(2 · f b (X 2 ))

musi zale»e¢ od X 2 .

Wychodzac z takiej interpretacji rozkªadu warunkowego wida¢, »e gdyby kwadrat, w którym

staªa funkcja gesto±ci prawdopodobie«stwa zmiennych (X 1 , X 2 ) jest ró»na od zera,

miaª boki równolegªe do osi X 1 i X 2 to rozkªad warunkowy jednej ze zmiennych nie zale»aªby

od warto±ci drugiej zmiennej a wiec zmienne byªyby niezale»ne statystycznie.

SMOP-2 B.Kamys: 2007/08 15

2.1 ROZKŠAD PRAWDOPODOBIE‹STWA FUNKCJI

WIELOWYMIAROWEJ ZMIENNEJ LOSOWEJ

Bardzo czesto interesuje nas rozkªad zmiennej losowej, która jest funkcja wielowymiarowej

zmiennej losowej, np. rozkªad sumy Z=X 1 +X 2 , iloczynu Z=X 1· X 2 , itd. W

szczególno±ci mo»emy by¢ zainteresowani rozkªadem wielowymiarowej zmiennej losowej,

która jest funkcja innej wielowymiarowej zmiennej losowej. Poni»ej podany jest wzór,

który stanowi uogólnienie wzoru na rozkªad skalarnej funkcji skalarnego losowego argumentu:

dX(Y )

g(Y ) = f(X(Y ))

∣ dY ∣

Wzór ten stosowaª sie dla monotonicznej funkcji g(Y ) - w przypadku niemonotonicznej

funkcji nale»y rozpatrywa¢ oddzielnie odcinki warto±ci argumentu, gdzie funkcja jest

monotoniczna. Analogiem dla wektorowej funkcji wektorowego argumentu losowego (oba

wektory o tym samym wymiarze) jest:

∥ ∥∥∥∥∥ ∂X

g(⃗Y ) = f( ⃗X(⃗Y ))

i (⃗Y )

(17)

∥ ∂Y j

Jak wida¢ oba wzory sa bardzo podobne, z tym »e moduª pochodnej zostaª zastapiony

moduªem jakobianu. Wzór ten podobnie jak jego skalarny analog stosuje sie dla monotonicznych

relacji pomiedzy zmiennymi.

Je»eli znamy rozkªad wektorowej zmiennej losowej ⃗X to mo»emy otrzyma¢ rozkªad skalarnej

zmiennej Y = y( ⃗X) wykonujac nastepujace dziaªania:

• Tworzymy nowa wektorowa zmienna losowa ⃗Y o takim samym wymiarze jak ⃗X przy

czym jedna ze skªadowych wektora ⃗Y jest interesujaca nas skalarna zmienna Y a

pozostaªe skªadowe sa dowolne. Warunkiem na nie nakªadanym jest tylko istnienie

jakobianu ∂X i

∂Y j

.

• Caªkujemy po pomocniczych zmiennych traktujac interesujaca nas skalarna zmienna

jako staªa (bedzie to oczywi±cie caªka po krzywej Y=const w przestrzeni zmiennych

⃗Y ). Ten rozkªad brzegowy wielowymiarowego rozkªadu zmiennej ⃗Y jest szukanym

rozkªadem skalarnej zmiennej Y.

Oczywi±cie, taka sama procedure mo»na zastosowa¢, gdy szukamy rozkªadu zmiennej

wektorowej ⃗Y ′ , o wymiarze mniejszym ni» wymiar ⃗Y .

SMOP-2 B.Kamys: 2007/08 16

Dla prostych funkcji takich jak suma, ró»nica, iloczyn i iloraz dwu zmiennych

z = x + y, z = y − x, z = x · y i z = y/x mo»na poda¢ ogólne wzory:

g(z ≡ x + y) =

g(z ≡ y − x) =

g(z ≡ x · y) =

g(z ≡ y/x) =

+∞ ∫

−∞

+∞ ∫

−∞

+∞ ∫

−∞

+∞ ∫

−∞

f(x, z − x)dx =

f(x, z + x)dx =

+∞ ∫

−∞

+∞ ∫

−∞

1

|x| f(x, z +∞ ∫

x )dx =

|x| f(x, zx)dx =

−∞

+∞ ∫

−∞

f(z − y, y)dy (18)

f(y − z, y)dy (19)

1

|y| f(z , y)dy (20)

y

|y|

z f(y , y)dy (21)

2 z

Szczególnie prosto wygladaja te wzory, gdy x i y sa niezale»ne - wówczas funkcja f(x, y)

wystepujaca pod caªka wyra»a sie przez iloczyn dwu funkcji f 1 (x) i f 2 (y). Warto

pamieta¢ o obu wersjach ka»dego wzoru, gdy» mo»e sie zdarzy¢, »e niektóre tylko caªki

daja sie ªatwo policzy¢.

W praktyce do±wiadczalnej rzadko mamy do czynienia z taka sytuacja, »e potramy

wyznaczy¢ dystrybuante wielowymiarowej zmiennej czy te» funkcje gesto±ci prawdopodobie«stwa

(dla zmiennej ciagªej) lub rozkªad prawdopodobie«stwa (dla zmiennej dyskretnej).

Dlatego musimy sie zadowala¢ mniej peªnymi informacjami zawartymi w momentach

rozkªadu. Dla zmiennych wielowymiarowych deniowane s¡ nowe typy momentów,

które nie tylko informuj¡ o ksztaªcie i poªo»eniu rozkªadu ale s¡ szczególnie istotne dla

badania zale»no±ci statystycznej pomi¦dzy zmiennymi losowymi. Do tego celu najlepiej

nadaja sie nastepujace wielko±ci: macierz kowariancji oraz krzywe regresji zdeniowane

poni»ej.

SMOP-2 B.Kamys: 2007/08 17

2.2 MOMENTY ROZKŠADU WIELOWYMIAROWEJ

ZMIENNEJ LOSOWEJ

Momentem wielowymiarowej zmiennej losowej X (X 1 ,...,X N ) rzedu k 1 +...+k N wzgledem

punktu X 0 (X 01 ,...,X 0N ) nazywamy wielko±¢ zdeniowana wzorem:

∫

m k1 +...+k N

(X 01 , ..., X 0N ) =

dX 1 ...dX N .f(X 1 , ..., X N ).(X 1 −X 01 ) k 1

...(X N −X 0N ) k N

(22)

Ten wzór jest sªuszny dla zmiennej ciagªej a dla dyskretnej trzeba caªke zamieni¢ na sume

i funkcje gesto±ci prawdopodobie«stwa na rozkªad prawdopodobie«stwa.

Najwa»niejsze momenty dla celów analizy statystycznej danych to:

Warto±¢ oczekiwana czyli pierwszy moment wzgledem poczatku ukªadu wspóªrzednych:

E{ ⃗X} = (m 10...0 (0, .., 0), ..., m 0...01 (0, ..., 0))

jest to wektor o skªadowych równych warto±ciom oczekiwanym poszczególnych zmiennych

E{ ⃗X} = (E{X 1 }, E{X 2 }, ...E{X N }) (23)

Wariancja czyli drugi moment wzgledem warto±ci oczekiwanej:

var{X 1 } = m 20...0 (E{X 1 }, ..., E{X N })

.............

var{X N } = m 00...2 (E{X 1 }, ..., E{X N })

(24)

Kowariancja czyli drugi moment mieszany wzgledem warto±ci oczekiwanej:

cov{X 1 , X 2 } = m 1100..0 (E{X 1 }, .., E{X N }),

cov{X 1 , X 3 } = m 1010..0 (E{X 1 }, .., E{X N }),

.....

(25)

SMOP-2 B.Kamys: 2007/08 18

Poniewa» wariancje mo»na uwa»a¢ za kowariancje policzona dla dwukrotnie powtórzonej

zmiennej var{X i } = cov{X i ,X i } to wygodnie jest zgromadzi¢ wariancje i kowariancje w

jeden zespóª wielko±ci zwany macierza kowariancji.

• Na gªównej przekatnej macierzy kowariancji znajduja sie wariancje a poza przekatna

kowariancje.

• Macierz kowariancji jest: rzeczywista, symetryczna i dodatnio okre±lona.

Mo»na ja wiec zawsze zdiagonalizowa¢ przez liniowa transformacje zmiennych pozostawiajac

jedynie wariancje na diagonali.

Czesto zamiast macierzy kowariancji tworzy sie macierz korelacji.

Macierz ta skªada sie ze wspóªczynników korelacji ρ(X i ,X j ) zdeniowanych nastepujaco:

ρ(X i , X j ) =

cov{X i , X j }

√

var{Xi }.var{X j } (26)

Oczywi±cie diagonalne elementy macierzy korelacji to jedynki a pozadiagonalne to odpowiednie

wspóªczynniki korelacji.

Wªasno±ci wspóªczynnika korelacji

○ Wspóªczynnik korelacji przyjmuje warto±ci z przedziaªu [-1,+1]

○ Je»eli zmienne sa niezale»ne to wspóªczynnik korelacji jest równy zero.

○ Gdy wspóªczynnik korelacji równy jest zero (mówimy wtedy, »e zmienne sa

nieskorelowane) to zmienne sa niezale»ne liniowo ale moga by¢ zale»ne i to nawet

funkcyjnie.

○ Je»eli zmienne X i Y sa zwiazane funkcyjnym zwiazkiem liniowym ; Y=

aX+b to wspóªczynnik korelacji jest równy jedno±ci co do moduªu a jego znak jest taki

sam jak znak wspóªczynnika kierunkowego prostej.

○ Je»eli moduª wspóªczynnika korelacji jest równy jedno±ci to X i Y zwiazane

sa funkcyjnym zwiazkiem liniowym Y= aX+b a znak wspóªczynnika kierunkowego prostej

jest taki sam jak znak wspóªczynnika korelacji.

Badanie wspóªczynników korelacji daje nam pewna informacje o zale»no±ci liniowej

zmiennych gdy warto±¢ wspóªczynnika korelacji jest co do moduªu bliska jedno±ci. Znikanie

wspóªczynnika korelacji mówi nam jedynie, »e zmienne sa niezale»ne liniowo ale nie

SMOP-2 B.Kamys: 2007/08 19

pozwala jednoznacznie stwierdzi¢ czy zmienne sa statystycznie niezale»ne.

Inny rodzaj informacji o spodziewanym zwiazku pomiedzy zmiennymi (niekoniecznie

zwiazku liniowym) mo»na otrzyma¢ badajac jak zachowuje sie warto±¢ oczekiwana jednej

zmiennej gdy potraktujemy ja jako funkcje warto±ci drugiej zmiennej. Taka funkcje

nazywamy funkcja regresji a denicje podajemy poni»ej:

DEFINICJA:

Regresja (lub regresja pierwszego rodzaju ) zmiennej Y wzgledem X nazywamy warunkowa

warto±¢ oczekiwana E{Y |X} traktowana jako funkcja zmiennej X. Oczywi±cie

warunkowa warto±¢ oczekiwana E{X|Y } nazywamy regresja pierwszego rodzaju zmiennej

X wzgledem Y .

Podstawowa wªasno±¢ funkcji regresji E{Y |X} polega na tym, »e warto±¢ oczekiwana

kwadratu odchyle« zmiennej losowej Y od dowolnej funkcji u(X) jest minimalna, gdy

jako te funkcje przyjmiemy funkcje regresji E{Y |X}:

E { (Y − u(X)) 2} ≥ E { (Y − E{Y |X}) 2} (27)

Dowód:

E { (Y − u(X)) 2} = ∫ dX · dY · f(X, Y ) · (Y − u(X)) 2

= ∫ dX · f 1 (X) ∫ dY · f 2 (Y |X) · (Y − u(X)) 2

Wewnetrzna caªka I jest warto±cia oczekiwana kwadratu odchylenia zmiennej Y od pewnej

staªej (u(X) jest staªa je»eli idzie o caªkowanie wzgledem zmiennej Y ). Mo»emy wiec

zapisa¢ te caªke nastepujaco (oznaczamy u(X) ≡ c):

I

≡

∫

dY · f 2 (Y |X) · (Y − u(X)) 2 =

= E{(Y − c) 2 } =

= E{(Y − E{Y } + E{Y } − c) 2 } =

= E{(Y − E{Y }) 2 + 2(Y − E{Y })(E{Y } − c) + (E{Y } − c) 2 } =

= E{(Y − E{Y }) 2 } + 2E{(Y − E{Y })(E{Y } − c)} + E{(E{Y } − c) 2 } =

= E{(Y − E{Y }) 2 + 0 + E{(E{Y } − c) 2 }.

Drugi wyraz zniknaª bo E{Y − E{Y }} ≡ 0 a pozostaªa suma warto±ci oczekiwanych

z kwadratów (Y − E{Y }) 2 i (E{Y } − c) 2 bedzie miaªa minimum gdy E{Y } ≡ c.

Poniewa» we wzorach powy»ej c ≡ u(x) oraz E{Y } ≡ E{Y |X} to wida¢, »e minimum

osi¡gane jest dla u(x) = E{Y |X}.

SMOP-2 B.Kamys: 2007/08 20

c.b.d.o.

UWAGI:

• Metoda estymacji parametrów oparta na omówionej powy»ej wªasno±ci funkcji regresji

nazywana jest metoda najmniejszych kwadratów.

• Funkcja regresji zmiennej Y wzgl¦dem X (E{Y |X}) zwykle nie pokrywa si¦ z

funkcj¡ regresji zmiennej X wzgl¦dem Y (E{X|Y }) co jest spowodowane tym,

»e pierwsza z nich minimalizuje sum¦ kwadratów odchyle« wzdªu» osi Y a druga

wzdªu» osi X. Krzywe reprezentuj¡ce obie regresje pokrywaj¡ si¦ tylko wtedy, gdy

zale»no±¢ pomi¦dzy Y i X jest zale»no±ci¡ funkcyjn¡ a nie statystyczn¡.

Regresja liniowa zwana równie» regresja drugiego rodzaju to linia prosta przybli»ajaca

zale»no±¢ regresji E{Y |X} od X, przy czym parametry tej prostej dobiera sie tak aby

byªa speªniona podstawowa wªasno±¢ regresji tzn. aby warto±¢ oczekiwana sumy kwadratów

odchyle« warto±ci Y od linii prostej byªa minimalna.

W szczególnym przypadku dwuwymiarowego rozkªadu normalnego funkcja regresji

E{Y |X} jest linia prosta a wiec funkcja regresji drugiego rodzaju jest równie» funkcja

regresji pierwszego rodzaju.

Regresja krzywoliniowa to funkcja nieliniowa argumentu X przybli»ajaca regresje E{Y |X}

przy czym parametry funkcji dobierane sa metoda najmniejszych kwadratów. W tym

przypadku nale»y rozró»ni¢ dwie sytuacje:

• Parametry wchodza liniowo do funkcji , np. przybli»enie E{Y |X} przez szereg

wielomianów lub innych funkcji tworzacych ukªad zupeªny. Odpowiada to tzw.

liniowej metodzie najmniejszych kwadratów i pozwala znale¹¢ warto±ci parametrów

jako rozwiazania ukªadu równa« liniowych przy czym dla unikniecia niestabilno±ci

numerycznych zalecane jest stosowanie funkcji, które sa ortogonalne na danym

odcinku lub na zbiorze warto±ci zmiennej X. W szczególno±ci mo»na posªu»y¢ sie

wielomianami ortonormalnymi na zbiorze warto±ci zmiennej X.

• Parametry wchodza nieliniowo do formuª . Wtedy optymalne warto±ci parametrów

sa rozwiazaniami ukªadu równa« nieliniowych, które rozwiazuje sie ró»nymi

sposobami. Jedna z popularnych metod jest szukanie rozwiaza« iteracyjnie znajdujac

w kolejnych iteracjach poprawki do startowych parametrów w sposób analogiczny

jak dla liniowego przypadku metody najmniejszych kwadratów. Osiaga sie

to rozwijajac nieliniowa formuªe w szereg Taylora dokoªa startowych warto±ci parametrów

i obcina sie szereg na wyrazach liniowych. Dla zapewnienia zbie»no±ci

procedury iteracyjnej uzupeªnia sie te metode o szereg pragmatycznych reguª przy-

±pieszajacych zbie»no±¢ i okre±lajacych kiedy nale»y przerwa¢ poszukiwanie warto±ci

parametrów.

SMOP-2 B.Kamys: 2007/08 21

2.3 Przybli»one wzory na momenty funkcji wielowymiarowej zmiennej

Cz¦sto zachodzi potrzeba oszacowania warto±ci oczekiwanej i wariancji wektorowej funkcji

⃗Y od wektorowego argumentu ⃗X gdy znamy dokªadnie warto±¢ oczekiwan¡ E( ⃗X) oraz

macierz kowariancji C( ⃗X).

Dla oszacowania warto±ci oczekiwanej funkcji wielu zmiennych losowych stosuje

sie standardowo poni»sze przybli»enie:

E(⃗y) ≈ ⃗y(E(x 1 ), E(x 2 ), ..E(x N )) (28)

gdzie x 1 , x 2 , ..., x N to skªadowe wektora ⃗X.

Dla oszacowania macierzy kowariancji zmiennej ⃗Y stosuje si¦ wzór:

cov(y k , y q ) ≈ ∑ i,j

( ( ∂yk ∂yq

∂x i

)⃗x=E(⃗x)

∂x j

)⃗x=E(⃗x)

cov(x i , x j ). (29)

Powy»szy wzór nazywa si¦ cz¦sto propagacj¡ bª¦dów.

W zapisie macierzowym wzór ten wygl¡da bardzo prosto:

C(⃗y) ≈ T C(⃗x)T T (30)

gdzie

C ij (⃗x) = cov{x i , x j }

C ij (⃗y) = cov{y i , y j }

( ∂yi

T ij =

∂x j

)⃗x=E(⃗x)

Oba wzory s¡ ±cisªe tylko dla liniowego zwi¡zku pomi¦dzy wektorami ⃗X i ⃗Y .

Powstaªy one przez rozwini¦cie funkcji ⃗Y ( ⃗X) w szereg Taylora dokoªa warto±ci oczekiwanej

wektora ⃗X i obci¦ciu szeregu do wyrazów liniowych.

SMOP-2 B.Kamys: 2007/08 22

Wyprowadzenie:

• Rozwijamy w szereg Taylora skªadowe wektora ⃗Y dokoªa wektora E{⃗x} obcinajac

rozwiniecie na wyrazach liniowych

y i ≈ y i (E{⃗x}) + ∑ j

( ∂yi

∂x j

)⃗x=E(⃗x)

· (x j − E{x j }).

• Poniewa» warto±¢ oczekiwana z ró»nicy ⃗x−E{⃗x} to»samo±ciowo znika wiec warto±¢

oczekiwana wektora ⃗y równa jest y(E{⃗x}), tzn. dostajemy podany wy»ej wzór na

warto±¢ oczekiwana

E(⃗y) ≈ y(E{⃗x}).

• Z tego równie» wynika, »e

y i − y i (E{⃗x}) ≈ ∑ ( ∂yi

j

∂x j

)⃗x=E(⃗x)

a wiec kowariancja y k i y q , która jest warto±cia oczekiwana

· (x j − E{x j })

cov(y k , y q ) ≡ E [(y k − E{y k }) · (y q − E{y q })]

liczona jest jako warto±¢ oczekiwana iloczynu analogicznych sum zawierajacych pochodne

i wyra»enia (x j − E{x j }) co po prostym przeliczeniu daje szukany wzór:

cov(y k , y q ) ≈ ∑ i,j

( ∂yk

∂x i

)⃗x=E(⃗x)

( ∂yq

∂x j

)⃗x=E(⃗x)

cov(x i , x j ).

UWAGA: Ostatnio coraz bardziej popularna staje si¦ estymacja momentów wektorowej

funkcji wektorowego losowego argumentu na podstawie próby skªadaj¡cej si¦ ze zbioru

warto±ci funkcji otrzymanych ze zbioru warto±ci argumentów wygenerowanego metod¡

Monte Carlo zgodnie z zaªo»onym rozkªadem prawdopodobie«stwa (zwykle wielowymiarowym

rozkªadem Gaussa).

SMOP-2 B.Kamys: 2007/08 23

3 ROZKŠAD NORMALNY (Gaussa)

DEFINICJA:

Ciagªa zmienna losowa X, której funkcja gesto±ci prawdopodobie«stwa ma posta¢:

f(X) =

[ ]

1 −(X − A)

2

√ exp 2π B 2B 2

(31)

nazywa sie zmienna o rozkªadzie normalnym N(A, B).

WŠASNO‘CI:

E(X) = A (32)

σ(X) = B (33)

m 3 (E(X)) = 0 (34)

m 4 (E(X)) = 3 · σ 4 (X) (35)

UWAGA:

• Rozkªad normalny jest caªkowicie okre±lony przez parametry A i B a wiec caªkowicie

okre±lony przez warto±¢ oczekiwana E(X) i odchylenie standardowe σ(X).

• Znikanie trzeciego momentu centralnego jest oczywi±cie równowa»ne znikaniu wspóªczynnika

asymetrii:

γ 1 ≡ m 3 (E(X))/σ 3 (X) (36)

i oznacza, »e rozkªad jest symetryczny dookoªa E(X).

• Wprowadza sie dla porównania rozkªadu danej zmiennej z rozkªadem normalnym,

tzw. wspóªczynnik przewy»szenia zwany tak»e kurtoza lub wspóªczynnikiem

ekscesu:

γ 2 ≡ m 4 (E(X))/σ 4 (X) − 3 (37)

Dla rozkªadu normalnego ten wspóªczynnik zeruje sie.

SMOP-2 B.Kamys: 2007/08 24

Dystrybuanta rozkªadu normalnego nie wyra»a sie przez funkcje elementarne.

Warto zapamieta¢ nastepujace nierówno±ci, speªniane przez zmienna X o rozkªadzie normalnym:

P (E(X) − σ(X) ≤ X < E(X) + σ(X)) = 0.6827

P (E(X) − 2σ(X) ≤ X < E(X) + 2σ(X)) = 0.9545

P (E(X) − 3σ(X) ≤ X < E(X) + 3σ(X)) = 0.9973

W biologii i naukach z nia zwiazanych czesto u»ywa sie dla warto±ci zmiennej le»acych

w pierwszym z trzech powy»szych przedziaªów okre±lenia: warto±ci charakterystyczne.

Dla tych, które nale»a do drugiego przedziaªu okre±lenia warto±ci typowe a dla tych, które

nale»a do trzeciego przedziaªu ale nie nale»a do przedziaªu drugiego - warto±ci nietypowe.

Dla warto±ci zmiennej bardziej odchylajacych sie od warto±ci oczekiwanej ni» trzy odchylenia

standardowe rezerwuje sie nazwe warto±ci wyjatkowe.

UWAGA:

Dowolna zmienna Y o rozkªadzie normalnym mo»na standaryzowa¢ tworzac wielko±¢ Z

o rozkªadzie standardowym normalnym N(0, 1):

Z = (Y − E(Y ))/σ(Y )

Standaryzacja jest wa»na ze wzgledu na mo»liwo±¢ tablicowania zarówno funkcji gesto±ci

prawdopodobie«stwa, jak i dystrybuanty rozkªadu N(0, 1) a potem wykorzystania faktu,

»e majac zmienna X o rozkªadzie N(0, 1) mo»emy stworzy¢ zmienna Y o rozkªadzie

N(A, B) przez prosta transformacje: Y = B · X + A .

TWIERDZENIE:

Centralne Twierdzenie Graniczne w wersji podanej przez Lapunowa:

Niech X 1 , X 2 , ...X n bedzie ciagiem niezale»nych zmiennych losowych których rozkªady

posiadaja:

• warto±¢ oczekiwana E(X k ),

• wariancje var(X k ),

SMOP-2 B.Kamys: 2007/08 25

• trzeci moment centralny µ 3 (X k ), oraz

• absolutny trzeci moment centralny tj.

b k ≡ E(| X k − E(X k ) | 3 ) dla k = 1, ..., n.

Wówczas ciag dystrybuant standaryzowanych zmiennych losowych zdeniowanych

nastepujaco:

speªnia zale»no±¢:

je»eli jest speªniony warunek:

Z =

n∑

k=1

X k − E(X k )

√ ∑n

i=1 var(X i)

lim F n(Z) = 1 ∫ Z

√ dt · exp(− t2 n→∞ 2π −∞

2 )

lim

n→∞

√ ∑n

3

k=1 b k

√ ∑n

k=1 var(X k) = 0

2

Centralne Twierdzenie Graniczne (Intuicyjne sformuªowanie)

Zmienna Z bedaca standaryzowana suma niezale»nych zmiennych losowych bedzie miaªa

standardowy rozkªad normalny gdy liczba skªadników w sumie da»y do niesko«czono±ci

oraz w sumie nie wystepuja zmienne o wariancjach dominujacych w stosunku do reszty

skªadników.

Wªa±nie to twierdzenie powoduje, »e rozkªad normalny jest wyró»nionym rozkªadem -

bardzo czesto stosowanym w statystyce.

SMOP-2 B.Kamys: 2007/08 26

3.1 WIELOWYMIAROWY ROZKŠAD NORMALNY

Jest to najwa»niejszy z rozkªadów w statystyce. Wektorowa zmienna losowa ⃗Y (Y 1 , ...Y N )

ma wielowymiarowy rozkªad normalny gdy jej funkcja gesto±ci prawdopodobie«stwa ma

nastepujaca posta¢:

f(⃗Y ) = √ det(B) [−

(2π) exp 1 (

Y ⃗ − ⃗A ) T (

B Y ⃗ − ⃗A )] (38)

N 2

gdzie wektor ⃗A to wektor warto±ci oczekiwanych (E{Y 1 }, ..E{Y N }) a macierz B to

macierz odwrotna do macierzy kowariancji skªadowych wektora ⃗Y .

Wªasno±ci:

• Wielowymiarowy rozkªad normalny jest caªkowicie okre±lony przez podanie wektora

warto±ci oczekiwanych (E{Y 1 }, ..E{Y N }) i macierzy kowariancji tych zmiennych

• Dowolny rozkªad brzegowy (rzut na podzespóª zmiennych Y 1 , ..Y N ) tego rozkªadu

jest rozkªadem normalnym

• Dowolny rozkªad warunkowy (przekrój wzdªu» podzespoªu zmiennych Y 1 , ..Y N ) jest

rozkªadem normalnym

• Poziomice funkcji gesto±ci (linie o staªej warto±ci gesto±ci) speªniaja warunek:

( ⃗ Y − ⃗A ) T

B

( ⃗ Y − ⃗A ) = const

Wielko±¢ wystepujaca po lewej stronie równania to zmienna losowa o rozkªadzie

chi-kwadrat o N stopniach swobody.

Dwuwymiarowy rozkªad normalny jest najprostszym rozkªadem, który posiada wszystkie

cechy wielowymiarowego rozkªadu a równocze±nie jest na tyle nieskomplikowany, »e

mo»na go sobie ªatwo wyobrazi¢. Poni»ej omówimy go jako przykªad wielowymiarowego

rozkªadu normalnego.

SMOP-2 B.Kamys: 2007/08 27

3.2 DWUWYMIAROWY ROZKŠAD NORMALNY

Parametrami rozkªadu jest wektor ⃗A = (E{y 1 }, E{y 2 }) oraz macierz B bedaca odwrotno±cia

macierzy kowariancji.

Odwrotna macierz mo»e by¢ znaleziona przez policzenie wyznacznika wyj±ciowej macierzy

i podzielenia macierzy uzupeªnie« algebraicznych wyj±ciowej macierzy przez ten

wyznacznik.

Ostatecznie dostajemy:

B =

[

1

σ 2 (y 2 ) −cov(y 2 , y 1 )

σ 2 (y 1 )σ 2 (y 2 ) − cov(y 1 , y 2 ) 2 −cov(y 1 , y 2 ) σ 2 (y 1 )

Wtedy dwuwymiarowy rozkªad normalny ma nastepujaca posta¢:

]

g(y 1 , y 2 ) =

f(y 1 , y 2 ) =

−1

2(1−ϱ 2 )

[

(y 1 −E{y 1 }) 2

σ 2 1

1√

exp {g(y 1, y 2 )}

2π·σ 1·σ 2 1−ϱ 2

− 2ϱ (y 1−E{y 1 })·(y 2 −E{y 2 })

σ 1 σ 2

+ (y 2−E{y 2 }) 2

σ 2 2

]

(39)

gdzie obok odchyle« standardowych σ i oraz warto±ci oczekiwanych E{y i } pojawiª sie

wspóªczynnik korelacji ϱ ≡ ϱ(y 1 , y 2 ).

WŠASNO‘CI:

• Rozkªad jest caªkowicie okre±lony przez 5 parametrów: warto±ci oczekiwane E(y 1 ),

E(y 2 ), odchylenia standardowe σ 1 , σ 2 i wspóªczynnik korelacji ϱ.

• Gdy wspóªczynnik korelacji znika to rozkªad sie zamienia na iloczyn dwu rozkªadów

brzegowych (jednowymiarowych rozkªadów normalnych). A wiec wida¢ tu unikalna

ceche wielowymiarowego rozkªadu normalnego; zmienne które nie sa skorelowane

(czyli sa niezale»ne liniowo) sa automatycznie niezale»ne .

• Poziomice funkcji gesto±ci prawdopodobie«stwa to elipsy, których póªosie równe sa

odchyleniom standardowym. Ustawienie osi elipsy w stosunku do osi wspóªrzednych

y 1 i y 2 zale»y od warto±ci wspóªczynnika korelacji. Gdy wspóªczynnik korelacji

znika osie elipsy sa równolegªe do osi wspóªrzednych. Gdy wspóªczynnik korelacji

jest dodatni to dªu»sza o± elipsy przechodzi przez pierwsza i trzecia ¢wiartke ukªadu

wspóªrzednych a gdy jest ujemny to przechodzi przez druga i czwarta ¢wiartke.

SMOP-2 B.Kamys: 2007/08 28

Rozkªad brzegowy dwuwymiarowego rozkªadu normalnego

to jednowymiarowy rozkªad normalny:

f b (y 1 ) =

{ }

1 −1

√ exp [y 2π.σ1 2σ1

2 1 − E(y 1 )] 2

(40)

WŠASNO‘CI:

• Okre±lony caªkowicie przez E(y 1 ) i σ 1 .

• Funkcja ksztaªtu dzwonu symetryczna dokoªa E(y 1 ), spadajaca bardzo szybko do

zera dla warto±ci y 1 oddalonych od warto±ci oczekiwanej.

Rozkªad warunkowy dwuwymiarowego rozkªadu normalnego:

f w (y 1 |y 2 ) =

1

√

2π · σ1 · √1

− ϱ exp 1

{−

2 2σ1 2(1 − ϱ2 )

[ {

y 1 − (E(y 1 ) + ϱ · σ }] } 2

1

(y 2 − E(y 2 ))

σ 2

(41)

WŠASNO‘CI:

• Rozkªad warunkowy dwuwymiarowego rozkªadu normalnego okre±lony jest przez te

same 5 parametrów co dwuwymiarowy rozkªad normalny.

• Gdy wspóªczynnik korelacji znika to rozkªad warunkowy przechodzi w rozkªad brzegowy

(jednowymiarowy rozkªad normalny) a wiec brak korelacji jest równowa»ny

niezale»no±ci zmiennych - zgodnie z tym co obserwowali±my dla peªnego rozkªadu.

• Posta¢ rozkªadu jest identyczna jak dla rozkªadu brzegowego (jednowymiarowego

rozkªadu Gaussa) ale parametry tego rozkªadu, tj. wariancja i warto±¢ oczekiwana

wyra»aja sie nastepujaco:

SMOP-2 B.Kamys: 2007/08 29

Wariancja:

σ 2 (y 1 |y 2 ) = σ 2 1 (1 − ϱ2 ) (42)

Warunkowa warto±¢ oczekiwana zmiennej y 1 pod warunkiem y 2 czyli

regresja pierwszego rodzaju y 1 wzgledem y 2 jest linia prosta czyli regresja

drugiego rodzaju.

E(y 1 |y 2 ) = E(y 1 ) + ϱ.σ 1

σ 2

(y 2 − E(y 2 )) (43)

Wspóªczynnikiem kierunkowym tej prostej jest wyra»enie

ϱ.σ 1

σ 2

a wiec wida¢, »e zamiana wska¹ników zmiennych y 1 i y 2 nie powoduje, przechodzenia

wspóªczynnika kierunkowego w swa odwrotno±¢ jak to powinno by¢ gdyby linia prosta

regresji y 1 wzgledem y 2 pokrywaªa sie z linia prosta regresji y 2 wzgledem y 1 .

Linie regresji E(y 1 |y 2 ) oraz E(y 2 |y 1 ) beda sie pokrywaªy tylko wtedy gdy

moduª wspóªczynnika korelacji bedzie równy jedno±ci , czyli wtedy gdy bedzie istniaª

funkcyjny zwiazek liniowy pomiedzy zmiennymi y 1 i y 2 . Przy bliskich zera warto-

±ciach wspóªczynnika korelacji linie te beda prawie prostopadªe do siebie.

SMOP-2 B.Kamys: 2007/08 30

4 ESTYMACJA PARAMETRÓW

W tym rozdziale zostan¡ omówione podstawowe poj¦cia estymacji parametrów.

DEFINICJA:

Statystyka nazywamy zmienna losowa, która jest funkcja próby czyli sko«czonej liczby

wyników do±wiadcze« (obserwacji) reprezentujacych wszystkie mo»liwe wyniki, których

zbiór nazywany jest populacja generalna. Je»eli rozkªad statystyki zale»y od warto±ci

pewnego parametru to warto±¢ statystyki mo»e sªu»y¢ do oszacowania tego parametru

i statystyke taka nazywamy estymatorem tego parametru. Na przykªad ±rednia arytmetyczna

wzrostu kilku studentów jest statystyka, która mo»e by¢ u»yta do oszacowania

warto±ci oczekiwanej wzrostu wszystkich studentów. A wiec ±rednia arytmetyczna jest

estymatorem warto±ci oczekiwanej .

DEFINICJA:

Oszacowanie warto±ci parametru przez warto±¢ estymatora nazywane jest estymacja

punktowa.

DEFINICJA:

Od estymatora wymagamy przede wszystkim aby byª zgodny. Synonimem zgodno±ci

estymatora jest stwierdzenie, »e estymator speªnia prawo wielkich liczb. Okre±lenia

te oznaczaja, »e wraz ze wzrostem rozmiarów próby prawdopodobie«stwo tego,

»e estymator parametru a odchyla sie od prawdziwej warto±ci tego parametru

mniej od dowolnego ε > 0, da»y do jedno±ci :

lim P (|T n(a) − a| < ε) = 1 (44)

n→∞

DEFINICJA:

Jeszcze bardziej po»adana wªasno±cia jest aby estymator speªniaª silne prawo wielkich

liczb czyli aby prawdopodobie«stwo tego, »e warto±¢ estymatora parametru da»y

do warto±ci szacowanego parametru wraz ze wzrostem rozmiarów próby, równaªo

sie jedno±ci (a nie aby tylko da»yªo do jedno±ci).

P

(

)

lim T n(a) = a

n→∞

= 1 (45)

SMOP-2 B.Kamys: 2007/08 31

Bardzo po»adane jest aby estymator miaª powy»sza wªasno±¢ ale je»eli nie da sie tego

osiagna¢ to zadowalamy sie faktem zgodno±ci estymatora.

Warto zapamieta¢, »e dla dwu bardzo wa»nych wielko±ci, tj. dla prawdopodobie«-

stwa zachodzenia jakiego± zdarzenia oraz dla warto±ci oczekiwanej zmiennej

losowej istnieja estymatory speªniajace silne prawo wielkich liczb :

TW. CANTELLIEGO

F.P. Cantelli w 1917 roku (a E. Borel w 1909 r dla szczególnego przypadku P=1/2)

udowodniª, »e czesto±¢ realizacji zdarzenia A w serii n niezale»nych do±wiadcze« jest estymatorem

prawdopodobie«stwa zdarzenia A speªniajacym silne prawo wielkich liczb:

P

( ( ) nA

lim

n→∞ n

)

= P (A) = 1 (46)

W powy»szym wzorze n A oznacza liczbe realizacji zdarzenia A w ciagu n do±wiadcze«.

TW. KOŠMOGOROWA

A.N. Koªmogorow udowodniª, »e ±rednia arytmetyczna ciagu niezale»nych pomiarów x i

jest estymatorem warto±ci oczekiwanej mierzonej wielko±ci x speªniajacym silne prawo

wielkich liczb.

P

(

lim

n→∞

( 1

n

) )

n∑

x i = E(x)

i=1

= 1 (47)

DEFINICJA:

Inna, po»adana cecha estymatora jest aby byª nieobcia»ony. Mówimy, »e estymator

parametru Θ posiada te ceche gdy

E {T n (Θ)} = Θ (48)

niezale»nie od n, tj. od rozmiaru próby.

DEFINICJA:

Obcia»eniem estymatora nazywana jest wielko±¢:

B n ≡ E {T n (Θ)} − Θ (49)

SMOP-2 B.Kamys: 2007/08 32

Oczywi±cie dla estymatora nieobcia»onego B n ≡ 0.

DEFINICJA:

Estymatorem asymptotycznie nieobcia»onym nazywany jest taki estymator obcia»ony,

dla którego obcia»enie da»y do zera gdy rozmiary próby rosna nieograniczenie:

lim B n ≡ lim

n→∞ n→∞

[E {T n (Θ)} − Θ] = 0 (50)

Poni»ej podane sa dwa po»yteczne twierdzenia, które mo»na wykorzysta¢ do zdecydowania,

czy estymator jest estymatorem zgodnym.

TWIERDZENIE:

Je»eli wariancja estymatora nieobcia»onego lub asymptotycznie nieobcia»onego da»y do

zera gdy rozmiary próby rosna nieograniczenie to estymator jest zgodny.

TWIERDZENIE:

Je»eli parametr η jest wymierna funkcja (ilorazem wielomianów) parametru Θ: η =

η(Θ) oraz T n (Θ) jest zgodnym estymatorem parametru Θ to T n (η) ≡ η(T n (Θ)) jest

zgodnym estymatorem parametru η.

UWAGA:

Istnieja specjalne metody tworzenia estymatorów, takie jak np. metoda momentów,

metoda najwiekszej wiarygodno±ci czy metoda najmniejszych kwadratów, których

zastosowanie zapewnia uzyskanie zgodnych estymatorów.

SMOP-2 B.Kamys: 2007/08 33

Estymator wspóªczynnika korelacji T n (ρ(X, Y )) ≡r" (symbole ¯x i ȳ oznaczaja ±rednie

arytmetyczne pomiarów):

T n (ρ(X, Y )) ≡ r =

n∑

(x i − ¯x)(y i − ȳ)

i=1

( n∑

) ( ) (51)

√

n∑

(x i − ¯x) 2 (y j − ȳ) 2

i=1

j=1

Interpretacja kwadratu estymatora r 2 ”

Mo»na pokaza¢, »e kwadrat estymatora wspóªczynnika korelacji pokazuje na ile dobre

jest przybli»enie liniowe zale»no±ci y(x) czyli jak dobra jest regresja drugiego rodzaju

(patrz ni»ej).

r 2 =

∑

(ax i + b − ȳ) 2

i

∑

i

(y i − ȳ) 2 (52)

Wielko±¢ y to ±rednia po wszystkich obserwowanych warto±ciach y i a a · x i + b to linia

prosta z tak dobranymi parametrami a i b aby byªa minimalna suma kwadratów odchyle«

od prostej do odpowiadajacych danemu argumentowi prostej x i warto±ci zmiennej y i .

Wyra»enie w liczniku to tzw. wyja±niona przez regresje suma kwadratów a wyra»enie

w mianowniku to caªkowita suma kwadratów . Jak wida¢ im bli»szy jedno±ci jest

kwadrat estymatora wspóªczynnika korelacji tym lepiej caªkowity rozrzut zmiennej y jest

odtwarzany przez regresje a wiec tym lepszym przybli»eniem zale»no±ci y(x) jest linia

prosta. Zwykle uwa»a sie, »e przybli»enie jest dobre gdy warto±ci r 2 sa bliskie 0.9 ale w

praktyce sami musimy zdecydowa¢, czy odchylenia rzedu 10% sa ju» zadowalajaco maªe.

SMOP-2 B.Kamys: 2007/08 34

5 ESTYMACJA PUNKTOWA E(x), σ 2 (x) i σ(x)

Przypomnijmy denicje estymacji punktowej podana we wstepie:

DEFINICJA:

Oszacowanie warto±ci parametru przez warto±¢ estymatora nazywane jest estymacja

punktowa.

W tym rozdziale zakªadamy, »e mierzona wielko±¢ losowa rzadzona jest rozkªadem normalnym.

Na tej podstawie mo»na wyprowadzi¢ wnioski dotyczace rozkªadów rozwa»anych

estymatorów. Wiekszo±¢ wniosków (z wyjatkiem postaci rozkªadu estymatorów) przenosi

sie równie» na estymatory warto±ci oczekiwanej i wariancji dla zmiennych losowych o

rozkªadach ró»nych od normalnego.

5.1 ESTYMACJA PUNKTOWA E(x)

Jak to ju» omówiono we wstepie jako estymator warto±ci oczekiwanej T n (E(x)) przyjmuje

sie ±rednia arytmetyczna niezale»nych pomiarów wielko±ci x (oznaczana przez x) :

T n (E(x)) ≡ x = 1 n

n∑

i=1

x i (53)

Estymator ten posiada optymalne wªasno±ci:

• Koªmogorow pokazaª, »e X speªnia mocne prawo wielkich liczb a wiec oczywi±cie

jest tak»e zgodny,

• Estymator X jest nieobcia»ony.

c.b.d.o.

E( 1 ∑

x i ) = 1 ∑

n n

i

E(x i ) = 1 (n.E(x)) = E(x)

n

Tu wykorzystano fakt, »e wszystkie warto±ci oczekiwane sa równe E(x i ) = E(x).

• Mo»na pokaza¢, »e x jest najbardziej efektywnym estymatorem E(x), tzn. posiada

najmniejsza wariancje spo±ród wszystkich mo»liwych estymatorów.

SMOP-2 B.Kamys: 2007/08 35

Dla zmiennej losowej x o rozkªadzie normalnym mo»na udowodni¢ poni»sze twierdzenie:

TWIERDZENIE:

Estymator x warto±ci oczekiwanej E(x) ma rozkªad normalny

gdzie n jest liczba pomiarów w próbie.

(

f(x) = N E(x), σ(x) )

√ n

WNIOSKI:

• E(x) = E(x) tzn.

Estymator x jest nieobcia»ony

• Odchylenie standardowe ±redniej arytmetycznej σ(x) jest √ n - krotnie mniejsze

od odchylenia standardowego σ(x) pojedynczego pomiaru.

• Odchylenie standardowe σ(x) czyli bªad ±redni kwadratowy ±redniej arytmetycznej

charakteryzuje dokªadno±¢ wyznaczenia prawdziwej warto±ci x w danym

konkretnym pomiarze skªadajacym sie z n niezale»nych do±wiadcze«.

x 0 = x ± σ(x)

• Aby charakteryzowa¢ dokªadno±¢ metody pomiarowej wówczas jako miare dokªadno±ci

podajemy bªad pojedynczego pomiaru tj. σ(x) .

5.2 ESTYMATOR WARIANCJI σ 2 (x)

Dwa powszechnie stosowane estymatory wariancji to S 2 (x) i s 2 (x):

S 2 (x) ≡ 1

n − 1

n∑

i=1

(x i − ¯x) 2 (54)

S 2 (x) to zgodny i nieobcia»ony estymator σ 2 (x). Jest to ªatwo pokaza¢ je»eli wiadomo

(a mo»na to udowodni¢), »e zmienna Y zdeniowana poni»ej ma rozkªad chi-kwadrat o

(n-1) stopniach swobody:

Y ≡ (n − 1)S2 (x)

σ 2 (x)

= χ 2 n−1

SMOP-2 B.Kamys: 2007/08 36

Wtedy, wykorzystujac znajomo±¢ warto±ci oczekiwanej i wariancji zmiennej chi-kwadrat,

mo»na napisa¢:

{ (n − 1)S 2 }

(x)

E {Y } ≡ E

= E { χn−1} 2 = n − 1

σ 2 (x)

{ (n − 1)S 2 }

(x)

σ 2 {Y } ≡ σ 2 = σ { 2 χn−1} 2 = 2(n − 1)

σ 2 (x)

Z pierwszego tych równa« dostajemy natychmiast:

E { S 2 (x) } = σ 2 (x)

a wiec S 2 (x) jest estymatorem nieobcia»onym .

Z drugiego otrzymujemy:

σ 2 { S 2 (x) } = 2(n − 1)σ4 (x)

(n − 1) 2 = 2σ4 (x)

(n − 1) 2 →

n→∞

0

a wiec mamy do czynienia z estymatorem nieobcia»onym, którego wariancja da»y do

zera wraz ze wzrostem rozmiarów próby . Taki estymator jest estymatorem zgodnym

jak to gªosi twierdzenie przytoczone we wstepie.

Drugi z wymienionych estymatorów to s 2 (x), deniowany nastepujaco:

s 2 (x) ≡ 1 n

n∑

i=1

(x i − ¯x) 2 (55)

Ten estymator proporcjonalny jest do S 2 (x):

s 2 (x) = n − 1

n

· S2 (x)

SMOP-2 B.Kamys: 2007/08 37

a wiec musi by¢ obcia»ony skoro S 2 (x) jest nieobcia»ony. Obcia»enie wynosi B n =

−(1/n)σ 2 (x) i znika gdy n ro±nie do niesko«czono±ci a wiec jest to estymator asymptotycznie

nieobcia»ony .

Wariancja tego estymatora wynosi:

σ 2 (s 2 (x)) =

( ) n − 1 2

·

n

2σ 4 (x)

(n − 1) = 2σ4 (x)

2 n 2

Stad mo»na powiedzie¢, »e

• Wariancja s 2 (x) znika, gdy rozmiary próby rosna do niesko«czono±ci a poniewa»

s 2 (x) jest asymptotycznie nieocia»ony to twierdzenie u»yte poprzednio tak»e mówi,

»e s 2 (x) jest estymatorem zgodnym σ 2 (x).

• Wariancja s 2 (x) jest dla ka»dego rozmiaru próby mniejsza od wariancji S 2 (x) a

wiec jest on bardziej efektywny ni» S 2 (x). Mo»na pokaza¢, »e jest to najbardziej

efektywny estymator σ 2 (x).

5.3 ESTYMATOR ODCHYLENIA STANDARDOWEGO σ(x)

Dla oszacowania warto±ci

√

odchylenia standardowego

√

stosuje sie trzy estymatory. Dwa

z nich - S(x) ≡ S 2 (x) i s(x) ≡ s 2 (x) sa bardzo popularne mimo, »e oba sa

estymatorami obcia»onymi . Trzeci, o którym bedzie mowa poni»ej, jest estymatorem

nieobcia»onym ale u»ywany jest rzadko gdy» wyra»a sie bardziej skomplikowanym wzorem

a jego warto±ci ró»nia sie znaczaco od warto±ci S(x) tylko dla niewielkich prób.

S(x):

S(x) ≡ √ 1

n − 1

n∑

i=1

(x i − x) 2 (56)

Jest to zgodny, asymptotycznie nieobcia»ony estymator odchylenia standardowego.

SMOP-2 B.Kamys: 2007/08 38

s(x):

s(x) ≡ √ 1 n

n∑

i=1

(x i − x) 2 (57)

Jest to zgodny, asymptotycznie nieobcia»ony i najbardziej efektywny estymator

odchylenia standardowego.

S(x):

S(X) ≡

√

n − 1

2

Γ( n−1

2 )

Γ( n 2 ) · S(x) (58)

UWAGA:

Jest to zgodny i nieobcia»ony estymator σ(X).

Wspóªczynnik wystepujacy przy estymatorze S(x) w powy»szej denicji mo»na zastapi¢

z niezªym przybli»eniem przez wstawienie do wzoru na S(X) zamiast 1/(n−1) czynnika

1/(n − 1.45).

Poni»ej podajemy w tabelce przykªadowe warto±ci tego wspóªczynnika dla ró»nych n

a tak»e wynik zastosowania powy»szego uproszczonego sposobu zastapienia tego wspóªczynnika:

√ n−1 Γ( n−1

2 ) √ n−1

2 Γ( n 2 ) n−1.45

n

3 1.1284 1.1359

4 1.0853 1.0847

5 1.0640 1.0615

6 1.0506 1.0482

7 1.0423 1.0397

10 1.0280 1.0260

15 1.0181 1.0165

20 1.0134 1.0121

25 1.0104 1.0095

50 1.0051 1.0046

UWAGA:

Najcze±ciej u»ywanym estymatorem odchylenia standardowego jest estymator S(x)

SMOP-2 B.Kamys: 2007/08 39

6 ESTYMACJA PRZEDZIAŠOWA E(x), σ 2 (x) i σ(x)

Podstawy tej metody estymacji opracowaª polski statystyk Jerzy Spªawa-Neyman (w literaturze

zachodniej cytowany zwykle jako Neyman). Idea metody jest tworzenie takiego

przedziaªu liczbowego, o którym mo»na powiedzie¢, »e z zadanym prawdopodobie«stwem

zawiera w sobie (przekrywa) warto±¢ szacowanego parametru.

Prawdopodobie«stwo to nazywa sie poziomem ufno±ci i standardowo oznaczane jest

symbolem 1 - α . W tych notatkach zamiennie u»ywane jest oznaczenie 1 - α oraz γ.

Przedziaª nazywany jest przedziaªem ufno±ci dla parametru θ je»eli:

♦ prawdopodobie«stwo P( T (1)

n

≤ θ ≤T (2)

n

) = 1 - α ,

♦ ko«ce przedziaªu zale»a od wyników do±wiadczenia i od poziomu ufno±ci a nie zale»a

funkcyjnie od θ.

UWAGA:

• Poziom ufno±ci 1 - α ≡ γ przyjmuje sie zwykle du»y (np. 0,9) ale nie mo»e

by¢ zbyt du»y bo zwiekszanie poziomu ufno±ci zwieksza dªugo±¢ przedziaªu ufno±ci

co powoduje, »e tracona jest informacja o warto±ci oszacowywanego parametru.

• Poni»sze rozwa»ania sa sªuszne przy zaªo»eniu, »e wyniki pomiarów x i ,i=1,..n obarczone

sa tylko bªedami przypadkowymi a wiec rzadzone sa rozkªadem normalnym

N(E{x}, σ{x}).

SMOP-2 B.Kamys: 2007/08 40

6.1 ESTYMACJA PRZEDZIAŠOWA WARTO‘CI OCZEKIWA-

NEJ E{x} - ZNANE σ{x}

Jako statystyke testowa (zmienna losowa zale»na od wyniku do±wiadczenia) bierzemy

zmienna z zdeniowana poni»ej:

z ≡

¯x − E{¯x}

σ{¯x}

≡ (¯x − E{x})√ n

σ{x}

(59)

Poniewa» ±rednia arytmetyczna ¯x ma rozkªad normalny wiec zmienna z, która jest

standaryzowana ±rednia arytmetyczna, ma standardowy rozkªad normalny N(0,1).

Szukamy takiego przedziaªu [z min , z max ], »e:

• P(z min ≤ z ≤ z max ) = γ

• przedziaª ten poªo»ony jest tam, gdzie gesto±¢ prawdopodobie«stwa f(z) jest najwieksza.

Poniewa» rozkªad standardowy normalny jest symetryczny dokoªa zera i zero jest moda

rozkªadu (funkcja gesto±ci ma maksimum) to wida¢, »e przedziaª [z min , z max ] powinien

by¢ poªo»ony symetrycznie dokoªa z=0:

z max = −z min .

Wiedzac, »e funkcja gesto±ci prawdopodobie«stwa jest unormowana do jedno±ci (pole

pod caªym wykresem funkcji gesto±ci jest równe jedno±ci) oraz wiedzac, »e pole pod tym

wykresem dla z le»acego w przedziale [z min , z max ] wynosi γ a przedziaª le»y symetrycznie

dokoªa z = 0 mo»na brzegi przedziaªu wyrazi¢ przez kwantyle rozkªadu N(0, 1) :

z min = z 1−γ

2

oraz z max = z 1+γ

2

Dodatkowo mo»emy skorzysta¢ z faktu symetrii rozkªadu N(0, 1) dokoªa z = 0, który

pozwala na wyra»enie obu kwantyli przez siebie:

z 1−γ

2

= −z 1+γ

2

1+γ

Dzieki temu w tablicach podawane sa zwykle tylko kwantyle na du»ym ( tj. ) lub 2

1−γ

na maªym ( tj. ) poziomie.

SMOP-2 B.Kamys: 2007/08 41

Zamiast korzysta¢ z tablic mo»na oczywi±cie wylicza¢ numerycznie kwantyle rozkªadu

N(0, 1). Odpowiednie procedury dla liczenia kwantyli rozkªadu standardowego normalnego

a tak»e innych podstawowych rozkªadów statystyki, takich jak rozkªad chi-kwadrat,

rozkªad Studenta czy te» rozkªad Fishera-Snedecora mo»na znale¹¢ np. w ksia»ce S.

Brandta, Analiza danych , PWN 1998.

Denicyjny wzór na zmienna z pokazuje, »e zmienna z i ±rednia arytmetyczna zwiazane sa

monotoniczna (liniowa) zale»no±cia a wiec mo»na jednoznacznie przedziaªowi [z min , z max ]

przypisa¢ przedziaª warto±ci zmiennej

¯x − E{x} = σ{x} √ n

z.

co po prostym przeksztaªceniu da przedziaª ufno±ci na E{X}:

P (z min ≤ z ≤ z max ) ⇔ P

(

¯x − σ{x} √ n

z max ≤ E{x} ≤ ¯x − σ{x} √ n

z min

)

Z prawdopodobie«stwem γ przedziaª liczbowy wypisany

powy»ej przykrywa soba warto±¢ oczekiwana E{x}.

Trzeba pamieta¢, »e warto±¢ oczekiwana jest konkretna liczba a nie zmienna

losowa. Zmiennymi sa ko«ce przedziaªu bo sa funkcjami ±redniej arytmetycznej

pomiarów.

Wyra»ajac z min i z max przez kwantyle standardowego rozkªadu normalnego dostajemy

przedziaª ufno±ci dla warto±ci oczekiwanej E{X} na poziomie ufno±ci γ:

¯x − σ{x} √ n

z 1+γ

2

≤ E{x} ≤ ¯x − σ{x} √ n

z 1−γ

2

lub

¯x − σ{x} √ n

z 1+γ

2

¯x + σ{x} √ n

z 1−γ

2

≤ E{x} ≤ ¯x + σ{x} √ n

z 1+γ

2

≤ E{x} ≤ ¯x − σ{x} √ n

z 1−γ

2

Sa to trzy równowa»ne formy, przy czym najªatwiej chyba zapamieta¢ druga z nich:

¯x − σ{x} √ n

z 1+γ

2

≤ E{x} ≤ ¯x + σ{x} √ n

z 1+γ

2

(60)

SMOP-2 B.Kamys: 2007/08 42

6.2 ESTYMACJA PRZEDZIAŠOWA WARTO‘CI OCZEKIWA-

NEJ E{x} - NIEZNANE σ{x}

Jako statystyke testowa bierzemy zmienna t zdeniowana poni»ej:

t ≡

¯x − E{¯x}

S{¯x}

≡ (¯x − E{x})√ n

S{x}

(61)

gdzie statystyka

1 n∑

S{¯x} ≡ √

(x i − ¯x) 2

n(n − 1) i=1

jest znanym nam estymatorem odchylenia standardowego ±redniej arytmetycznej ¯x a

n oznacza liczbe pomiarów w próbie.

rozkªad Studenta o (n-1) stopniach swo-

Mo»na pokaza¢, »e zmienna t ma

body.

Poniewa» rozkªad Studenta jest bardzo podobny do standardowego rozkªadu normalnego

wiec rozwa»ania podane powy»ej dla przypadku przedziaªu ufno±ci dla E{x} gdy

znane jest odchylenie standardowe pomiarów zachowuja swa prawdziwo±¢ i dla aktualnej

sytuacji z tym, »e kwantyle rozkªadu normalnego musza by¢ zamienione przez odpowiednie

kwantyle rozkªadu Studenta a odchylenie standardowe zastapione przez jego estymator:

¯x − S{x} √ n

t 1+γ

2

≤ E{x} ≤ ¯x + S{x} √ n

t 1+γ

2

(62)

Tu podana jest tylko jedna z trzech równowa»nych postaci wzoru na przedziaª ufno±ci

ale oczywi±cie mo»na równie» u»ywa¢ obu pozostaªych po odpowiednich modykacjach.

UWAGA: Dla du»ych prób (n > 20 ÷ 30) rozkªad Studenta upodabnia sie bardzo do

rozkªadu standardowego normalnego i dla wiekszo±ci praktycznych zastosowa« mo»na

posªugiwa¢ sie kwantylami rozkªadu N(0, 1).

SMOP-2 B.Kamys: 2007/08 43

6.3 ESTYMACJA PRZEDZIAŠOWA WARIANCJI I ODCHY-

LENIA STANDARDOWEGO

Jako statystyke bierzemy zmienna Y zdeniowana nastepujaco:

Y = (n − 1)S2 (x)

σ 2 (x)

(63)

gdzie n to liczba pomiarów w próbie, σ 2 (x) to wariancja X a S 2 (x) to estymator wariancji

zmiennej X:

S 2 (x) = 1 n∑

(x i − ¯x) 2

n − 1 i=1

Wielko±¢ ta ma rozkªad chi-kwadrat o (n-1) stopniach swobody.

Podobnie jak przy szukaniu przedziaªu ufno±ci dla warto±ci oczekiwanej E{x} rozwa»a

sie przedziaª najbardziej prawdopodobnych warto±ci zmiennej Y. Jednak»e przedziaª ten

nie jest symetryczny dokoªa mody bo rozkªad chi-kwadrat nie jest symetryczny.

Dla jednoznacznego okre±lenia przedziaªu ufno±ci zakªada sie, »e prawdopodobie«stwo

odchylenia warto±ci Y poza wybrany przedziaª w strone du»ych warto±ci jest takie samo

jak prawdopodobie«stwo odchylenia w strone odwrotna:

P (Y < Y min ) = P (Y > Y max ) = 1 − γ

2

Zaªo»enie to pozwala jednoznacznie okre±li¢ brzegi przedziaªu przez kwantyle rozkªadu

chi-kwadrat :

Y min = (χ 2 n−1 ) 1−γ

2

i Y max = (χ 2 n−1 ) 1+γ

2

Kwantyle te nie sa równe i musza by¢ oba wyliczone lub znalezione z tablic.

Relacja pomiedzy estymowanym parametrem, tj. wariancja i statystyka Y jest monotoniczna

funkcja :

σ 2 (x) = (n − 1).S2 (x)

Y

wiec prawdopodobie«stwo traenia statystyki do przedziaªu [Y min ,Y max ] jest równe prawdopodobie«stwu

tego, »e oszacowywana wariancja bedzie le»aªa w przedziale:

SMOP-2 B.Kamys: 2007/08 44

(n − 1).S 2 (x)

Y max

≤ σ 2 (x) ≤ (n − 1).S2 (x)

Y min

co powoduje, »e ostatecznie przedziaª ufno±ci dla wariancji na poziomie ufno±ci γ to :

(n − 1).S 2 (x)

(χ 2 n−1 ) 1+γ

2

≤ σ 2 (x) ≤ (n − 1).S2 (x)

(χ 2 n−1 ) 1−γ

2

(64)

Estymacja przedziaªowa odchylenia standardowego σ(x) mo»e by¢ przeprowadzona

przez pierwiastkowanie granic przedziaªu ufno±ci dla wariancji. Ten przedziaª liczbowy

bedzie przedziaªem ufno±ci dla odchylenia standardowego na tym samym poziomie ufno±ci

co startowy przedziaª ufno±ci dla wariancji. Dzieje sie tak dlatego, »e pierwiastkowanie -

relacja miedzy dwoma dodatnimi wielko±ciami, t.j. wariancja i odchyleniem standardowym

- jest monotoniczna funkcja. Stad prawdopodobie«stwo traenia odchylenia standardowego

do przedziaªu o granicach równych pierwiastkom z granic przedziaªu ufno±ci

dla wariancji jest takie samo jak prawdopodobie«stwo traenia wariancji do swojego przedziaªu

ufno±ci.

SMOP-2 B.Kamys: 2007/08 45

7 ESTYMACJA PUNKTOWA E{⃗y(⃗x)} I MACIERZY

KOWARIANCJI ⃗y(⃗x)

Estymator warto±ci oczekiwanej:

Dla oszacowania warto±ci oczekiwanej funkcji wielu zmiennych losowych stosuje sie

standardowo poni»sze przybli»enie:

T n (E(⃗y(⃗x))) = ⃗y (T n (E(x 1 )), T n (E(x 2 )), . . . , T n (E(x N )))

przy czym aby upro±ci¢ zapis opuszcza sie czesto symbol estymatora warto±ci oczekiwanej

funkcji ⃗y a estymatory warto±ci oczekiwanych argumentów zapisuje sie w standardowy

sposób:

E(⃗y) ≈ ⃗y(x 1 , x 2 , ..x N ) (65)

gdzie x 1 , x 2 , ... to skªadowe wektora ⃗x a x i

argumentu x i : x i ≡ (1/n) ∑ j(x i ) j .

to ±rednia arytmetyczna z n pomiarów

Estymator macierzy kowariancji:

T n (cov(y k , y q )) = ∑ i,j

( ( ∂yk ∂yq

∂x i

)⃗x=(⃗x)

∂x j

)⃗x=(⃗x)

T n (cov(x i , x j ))

gdzie estymator kowariancji skªadowych wektora argumentu ⃗x ma nastepujaca posta¢:

T n (cov(x i , x j )) = 1

n − 1

n∑

k=1

((x i ) k − ¯x i )((x j ) k − ¯x j ) (66)

Powy»sze wzory tak»e zapisuje sie najcze±ciej opuszczajac symbole estymatorów ale

wtedy trzeba z kontekstu domy±li¢ sie, »e mowa jest o estymatorach !

cov(y k , y q ) ≈ ∑ i,j

( ( ∂yk ∂yq

∂x i

)⃗x=(⃗x)

∂x j

)⃗x=(⃗x)

cov(x i , x j ) (67)

SMOP-2 B.Kamys: 2007/08 46

Symbol (⃗x) oznacza wektor ±rednich arytmetycznych (⃗x) ≡ (x 1 , x 2 , ...x N ).

Wprowadzajac oznaczenia macierzowe:

C ij (⃗x) = cov{x i , x j }

C ij (⃗y) = cov{y i , y j }

( ∂yi

T ij =

∂x j

)⃗x=(⃗x)

mo»emy wyrazi¢ kowariancje zmiennej ⃗y przez kowariancje zmiennej ⃗x w nastepujacy

sposób (nazywany propagacja bªedów):

C(⃗y) ≈ T C(⃗x)T T (68)

Wyprowadzenie powy»szych przybli»onych wzorów zostaªo podane w rozdziale 2.3 a

tutaj pokazano jakie estymatory wprowadza si¦ za odpowiednie wielko±ci.

SZCZEGÓLNY PRZYPADEK:

Gdy zmienne x i , i = 1, ..n sa niezale»ne macierz kowariancji skªadowych wektora ⃗x

jest diagonalna czyli pozostaja niezerowe jedynie wariancje:

cov{x i , x j } = δ ij · var{x i }

Wzór na estymatory kowariancji cov(y k , y q ) gdy x i , i=1,..n sa niezale»ne sprowadza

sie do poni»szej postaci, gdzie wariancje zast¡piono ich estymatorami:

cov(y k , y q ) ≈ ∑ i

( ( ∂yk ∂yq

∂x i

)⃗x=(⃗x)

∂x i

)⃗x=(⃗x)

S 2 (x i ) (69)

co w szczególno±ci daje znany nam wzór na bªad ±redni kwadratowy :

SMOP-2 B.Kamys: 2007/08 47

σ(y k ) ≡

√

var(y k ) ≈

√ ∑ ( ) 2 ∂yk

i

∂x i ⃗x=(⃗x)

S 2 (x i ) (70)

UWAGA: Nale»y pamieta¢, »e

• Bªad ±redni kwadratowy y k mo»e by¢ policzony wg wzoru powy»ej (bez kowariancji)

tylko wtedy gdy zmienne x i sa niezale»ne. W praktyce E(x i ) zastepowana

jest przez ±rednia arytmetyczna ¯x i a var(x j ) przez kwadrat bªedu ±redniej arytmetycznej

(a nie samej zmiennej x i ).

• Macierz kowariancji zmiennych y i , i=1,..n jest zwykle niediagonalna nawet

wtedy gdy zmienne x i sa niezale»ne (macierz kowariancji x i jest diagonalna)

czyli zmienne y i , i = 1, ..n sa zwykle zale»ne. Je»eli wiec bedziemy chcieli

znale¹¢ macierz kowariancji wektora losowego ⃗z, który jest z kolei funkcja wektora ⃗y

to musimy korzysta¢ z ogólnego wzoru zawierajacego kowariancje (zastepujac oczywi±cie

⃗y przez ⃗z a ⃗x przez ⃗y).

• Wzory powy»sze sa wzorami przybli»onymi, tzn. na tyle sa dobre na ile rozwiniecie

⃗y(⃗x) w szereg Taylora dokoªa E{⃗x} z obcieciem na liniowych wyrazach jest dobrym

przybli»eniem funkcji ⃗y(⃗x).

Mimo to praktycznie wszedzie stosuje sie te wzory , czesto zapominajac o

tym, »e sa one ±cisªe tylko dla liniowego zwiazku pomiedzy ⃗y i ⃗x.

SMOP-2 B.Kamys: 2007/08 48

8 REGRESJA LINIOWA

Denicja regresji liniowej byªa ju» omawiana powy»ej ale powtórzymy ja dla przypomnienia:

DEFINICJA

Regresja liniowa zmiennej Y wzgledem zmiennej X to linia prosta

Y = a · X + b (71)

z parametrami a i b dobranymi tak aby minimalizowa¢ sume kwadratów odchyle« wspóªrzednych

(y i , i = 1, 2, ..n) zespoªu n punktów o wspóªrzednych (x 1 , y 1 ),(x 2 , y 2 ),... (x n , y n ) od

tej linii:

n∑

Q 2 = (y i − a · x i − b) 2 (72)

i=1

Zmienna Y nazywana jest zmienna obja±niana a zmienna X zmienna obja±niajaca.

UWAGA:

Regresja liniowa X wzgledem Y tj. prosta X = c · Y + d pokrywa sie z regresja liniowa

Y wzgledem X tj. prosta Y = a · X + b znaleziona dla tego samego zespoªu punktów

do±wiadczalnych tylko wtedy gdy zwiazek pomiedzy X i Y jest funkcyjnym zwiazkiem

liniowym (a nie zale»no±cia statystyczna).

Rozwa»ymy tu specyczna sytuacje (czesto spotykana w zastosowaniach) polegajaca na

tym, »e:

• zmienna obja±niajaca X ma zaniedbywalnie maªe bªedy (mówimy wtedy, »e X jest

zmienna kontrolowana) a wiec mo»e by¢ traktowana jako nielosowa zmienna.

• zmienna obja±niana Y jest zmienna losowa przy czym bªad tej zmiennej jest identyczny

dla wszystkich punktów i wynosi σ(Y ).

Wtedy dostajemy proste, analityczne wzory na estymatory parametrów regresji:

SMOP-2 B.Kamys: 2007/08 49

T n (b) = (∑ i x 2 i ) · ( ∑ i y i ) − ( ∑ i x i ) · ( ∑ i x i · y i )

W

T n (a) = n · (∑ i x i · y i ) − ( ∑ i x i ) · ( ∑ i y i )

W

W ≡ n · ∑

x 2 i − (∑ x i ) 2 (73)

i

Wska¹nik sumowania i przebiega warto±ci od 1 do n gdzie n jest liczba punktów

pomiarowych.

Bªedy estymatorów parametrów a i b oraz ich kowariancja równie» wyra»aja

sie analitycznymi wzorami:

√ ∑

i x 2 i

T n (σ(b)) = σ(Y ) ·

W

√ n

T n (σ(a)) = σ(Y ) ·

W

∑

T n (cov(a, b)) = −σ 2 i x i

(Y ) ·

W (74)

Mo»emy równie» poda¢ wzór na bªad warto±ci Y przewidzianej przez linie regresji

(zale»ny od x):

T n (σ(Y (x))) = σ(Y ) · √ 1 n

+

(x − x)2

∑i (x i − x) 2 (75)

OZNACZENIA:

• T n (σ(Y (x))) to estymator bªedu warto±ci Y (x) przewidzianej przez regresje,

• σ(Y ) to bªad pomiaru wspóªrzednej Y i z zaªo»enia taki sam dla wszystkich punktów.

Gdy go nie znamy wpisujemy tu (i do wzorów na bªedy parametrów 'a' i 'b') estymator

T n (σ(Y )),

SMOP-2 B.Kamys: 2007/08 50

• x to ±rednia arytmetyczna warto±ci zmiennej kontrolowanej wyliczona ze wspóªrzednych

punktów x 1 , x 2 , ...x n ,

• x - to warto±¢ zmiennej kontrolowanej X, dla której wyliczamy warto±¢ regresji

liniowej Y (x) i estymator bªedu regresji liniowej T n (σ(Y (x))).

• Bardzo czesto opuszcza sie symbole estymatorów a o tym, czy mamy do

czynienia z parametrami linii prostej i ich bªedami czy te» z estymatorami tych

wielko±ci wnioskujemy z kontekstu.

UWAGA:

Aby podja¢ decyzje, czy regresja liniowa zadawalajaco dobrze odtwarza zale»no±¢ y od x

mo»na zbada¢ czy suma kwadratów odchyle« wyników pomiaru od linii prostej speªnia

poni»sze warunki:

Przy poprawnym odtwarzaniu zale»no±ci y(x) przez prosta regresji y = a · x + b

wielko±¢ Q 2 /σ 2 (Y ) ma rozkªad chi - kwadrat o n − 2 stopniach swobody a wiec jej

warto±¢ oczekiwana i odchylenie standardowe speªniaja nastepujace relacje:

{ } Q

2

E

σ 2 (Y )

{ } Q

2

σ

σ 2 (Y )

= n − 2

=

√

2(n − 2)

Stad przy adekwatno±ci liniowego modelu i przy poprawnym oszacowaniu bªedów pomiarów

σ(y i ) obliczona warto±¢ Q 2 /σ 2 (Y ) powinna by¢ bliska n − 2 a rozrzut dookoªa

tej warto±ci powinien by¢ okre±lony przez √ 2(n − 2) gdzie n to liczba pomiarów.

SMOP-2 B.Kamys: 2007/08 51

9 REGRESJA PRZY POMOCY WIELOMIANÓW OR-

TOGONALNYCH

Tu omówiona zostanie regresja krzywoliniowa ze wzgledu na posta¢ zale»no±ci dopasowanych

funkcji od argumentu ale liniowa ze wzgledu na zale»no±¢ od dobieranych parametrów.

W takiej sytuacji warto±ci parametrów mo»na znale¹¢ przez rozwiazanie ukªadu

równa« liniowych (podobnie jak poprzednio dla parametrów linii prostej). Równania

te sa jednak»e czesto numerycznie niestabilne, tzn. maªe zmiany warto±ci wspóªczynników

ukªadu równa« powoduja drastyczne zmiany rozwiaza«. Wygodna metoda unikniecia

tych problemów jest zastosowanie wielomianów ortogonalnych. Tu zakªadamy dalej, »e

zmienna x jest zmienna kontrolowana , tzn. jej warto±ci sa znane z zaniedbywalnie

maªymi bªedami.

9.1 REGRESJA PRZY POMOCY WIELOMIANÓW ORTOGO-

NALNYCH NA ZBIORZE WARTO‘CI ZMIENNEJ KON-

TROLOWANEJ x i , i = 1, ...n

Przedstawiamy zmienna y jako rozwiniecie w szereg wielomianów ortogonalnych P r (x)

na zbiorze warto±ci argumentów x i , i = 1, ...n:

m∑

y(x) = θ r · P r (x)

r=0

gdzie parametry θ r , (r = 1, ..., m) nale»y wyznaczy¢ z warunku minimalizacji sumy kwadratów

odchyle« wspóªrzednych (y i , i = 1, 2, ..n) zespoªu n punktów o wspóªrzednych

(x 1 , y 1 ),(x 2 , y 2 ),... (x n , y n ) od linii regresji y(x) a wielomiany P r (x), (r = 1, 2, ..., m)

sa okre±lone przez zbiór warto±ci argumentu x i ; (i = 1, 2, .., n) na którym maja by¢

ortogonalne oraz - ewentualnie - przez zbiór wag w i , (i = 1, 2, ..., n) przypisanych poszczególnym

punktom (x i , y i ), (i = 1, 2, ..., n).

Stosowanie wielomianów ortogonalnych ma nastepujace zalety:

1. parametry θ r , (r = 1, ..., m) mo»na wyliczy¢ analitycznie poniewa» pojawiaja

sie jako wspóªczynniki przy wielomianach a wiec mamy do czynienia z liniowym

przypadkiem metody najmniejszych kwadratów (MNK).

2. Obliczenie parametrów odbywa sie przy pomocy prostych wzorów podanych poni»ej.

Nie wymaga to odwracania macierzy - jak to ma miejsce w ogólnym przypadku

ogólnej liniowej MNK. Dzieki temu unika sie problemów numerycznych gdy» odwracanie

typowych macierzy pojawiajacych sie w MNK jest niestabilna numerycznie

procedura.

SMOP-2 B.Kamys: 2007/08 52

3. Parametr θ r+1 jest wyznaczany niezale»nie od parametrów θ 1 , θ 2 , ...θ r , tzn. dodanie

nastepnego wyrazu do szeregu nie wpªywa na parametry przy wielomianach

ni»szego stopnia). Oznacza to równie», »e macierz kowariancji estymatorów parametrów

θ jest diagonalna.

Ortogonalno±¢ wielomianów P r (x) na zbiorze x i , i = 1, 2, ...n warto±ci argumentu

oznacza speªnienie poni»szych warunków:

n∑

w i P l (x i ) · P k (x i ) = 0 dla l ≠ k

i=1

n∑

i=1

w i [P l (x i )] 2 ≠ 0 (76)

gdzie w i , i = 1, 2, ..n s¡ wagami odpowiednich pomiarów y i , i = 1, 2...n.

Wªasno±ci te wykorzystujemy nastepujaco:

Mno»ymy równanie okre±lajace y(x) jako rozwiniecie w szereg wielomianów ortogonalnych

przez dany wielomian P k (x i ) i wag¦ w i a nast¦pnie sumujemy po i co dzieki ortogonalno±ci

wielomianów prowadzi do wzoru:

n∑

∑ n

y i w i P k (x i ) = θ k w i [P k (x i )] 2

i=1

a wiec otrzymujemy analityczny wzór na estymator parametru θ k :

T n (θ k ) =

n∑

i=1

n∑

i=1

y i w i P k (x i )

w i [P k (x i )] 2 (77)

Jako wagi w i bierze sie zwykle kwadraty odwrotno±ci bªedów mierzonych wielko±ci Y i ,

gdy» to bardzo upraszcza rachunki:

w i = 1

σ 2 (y i )

(78)

Wida¢ to szczególnie przy szacowaniu bª¦dów estymatorów parametrów a nast¦pnie bª¦dów

znalezionych warto±ci funkcji regresji. Przede wszystkim nale»y zauwa»y¢, »e estymatory

parametrów θ k zale»a liniowo od danych y 1 , y 2 , ...y n a wiec macierz kowariancji

SMOP-2 B.Kamys: 2007/08 53

estymatorów mo»na wyliczy¢ ±ci±le stosujac wzór na transformacje macierzy

kowariancji (propagacja bªedów) znajac macierz kowariancji danych y 1 , y 2 , ...y n . Co

wiecej wiadomo, »e macierz kowariancji parametrów jest diagonalna (bo estymator parametru

θ k jest wyliczany niezale»nie od estymatorów pozostaªych parametrów) a wiec

pozostaje nam znalezienie wariancji tych estymatorów.

var(T n (θ k )) =

n∑

[w i · P k (x i )] 2 σ 2 (y i )

i=1

∑

[ n w i · Pk 2(x i)] 2

i=1

Gdy przyjmiemy (tak bedziemy robi¢ w nastepnych wzorach) w i ≡ 1

σ 2 (y i )

to

n∑

[w i · P k (x i )] 2 · σ 2 (y i ) = w 2 i · P 2 k (x 1

i) ·

i=1

w i

n∑

= w i · P 2 k (x i)

i=1

a wiec wariancja estymatora parametru θ k wyra»a sie analitycznym wzorem:

var(T n (θ k )) =

n∑

i=1

1

P 2 k (x i)/σ 2 (y i )

(79)

Równie ªatwo mo»na (±cisle) znale¹¢ wariancje (wiec i bªad) formuªy interpolacyjnej na

y(x):

czyli

m∑

var(y(x)) = [P r (x)] 2 · var(T n (θ r ))

r=0

m∑

var(y(x)) =

n∑

r=0

i=1

[P r (x)] 2

P 2 r (x i)/σ 2 (y i )

(80)

Jako±¢ dopasowania mo»e by¢ oceniana przez policzenie warto±ci wyra»enia:

SMOP-2 B.Kamys: 2007/08 54

n∑

m∑

Q 2 (m) = w i · [y i − T n (θ r ) · P r (x i )] 2 , (81)

i=1

r=0

które przy adekwatno±ci modelu powinno mie¢ rozkªad chi-kwadrat o (n-(m+1)) stopniach

swobody.

Wiedzac o tym mo»emy warto±¢ tego wyra»enia u»ywa¢ jako kryterium doboru najwy»-

szego stopnia wielomianu w rozwinieciu (m), gdy» wiemy, »e Q 2 (m) powinno mie¢ warto±¢

oczekiwana równa (n − m − 1) z bªedem √ 2(n − m − 1).

Czesto zamiast Q 2 (m) stosuje sie unormowana sume kwadratów odchyle«:

Q 2 (m)

n − m − 1 .

Warto±¢ oczekiwana tej wielko±ci jest równa jedno±ci a bªad √ 2

n−m−1 .

UWAGA: Innym popularnym wyborem wag jest przyj¦cie wag równych jedno±ci dla wszystkich

punktów. Wtedy trzeba jednak policzy¢ bª¦dy parametrów i przewidzianej funkcji

regresji wg nieco innych wzorów, uwzgl¦dniaj¡c to, »e wagi nie uproszcz¡ si¦ z kwadratem

bª¦dów.

var (T n (θ k )) =

n∑

i=1

[ n∑

P 2 k (x i) σ 2 (y i )

] 2

(82)

Pk 2(x i)

i=1

n∑

m∑

⎧⎪ ⎨ P 2

var (y (x)) = [P r (x)] 2 r (x i) σ 2 (y i )

⎫⎪ ⎬

i=1

[ n∑

] 2

(83)

r=0 ⎪ ⎩ Pr 2(x ⎪

i) ⎭

i=1

Ten ostatni wzór jest uogólnieniem wzoru (75), który mo»na z niego otrzyma¢ podstawiaj¡c

identyczn¡ warto±¢ bª¦du σ(y i ) dla wszystkich punktów.

SMOP-2 B.Kamys: 2007/08 55

9.2 KONSTRUKCJA ZESPOŠU WIELOMIANÓW ORTOGO-

NALNYCH NA ZBIORZE WARTO‘CI ARGUMENTU

Zakªadamy, »e maja to by¢ wielomiany ortogonalne z wagami w 1 , w 2 , ...w n na zbiorze

warto±ci argumentu x 1 , x 2 , ...x n , posiadajace jednostkowy wspóªczynnik przy najwy»szej

potedze argumentu x. Mo»na pokaza¢, »e wielomiany ortogonalne P 0 (x), P 1 (x), ...P m (x)

speªniaja poni»sze formuªy rekurencyjne, które moga by¢ efektywnie zastosowane do ich

wyliczenia:

P r+1 (x) = [x + β r+1 ] · P r (x) + γ r+1 · P r−1 (x)

n∑

w i · P 2 r (x i) · x i

i=1

β r+1 = − n∑

w i · Pr 2(x i)

γ r+1 = −

i=1

n∑

i=1

n∑

i=1

w i · P 2 r (x i)

w i · P 2 r−1 (x i)

(84)

przy czym startowe wielomiany, tzn. P 0 (x) i P 1 (x) okre±la sie nastepujaco:

P 0 (x) = 1

P 1 (x) = x −

n∑

i=1

n∑

w i · x i

i=1

w i

(85)

Warto zauwa»y¢, »e sumy typu ∑ i w i·P 2 r (x i) wystepuja zarówno w mianowniku wzorów

na γ r+2 , β r+1 , T n (θ r ), var(y) jak i w liczniku wzoru na γ r+1 . Dzieki temu przy

programowaniu wzorów mo»na te sumy wykorzysta¢ wielokrotnie.

SMOP-2 B.Kamys: 2007/08 56

10 METODY SZUKANIA ESTYMATORÓW O PO-

› DANYCH WŠASNO‘CIACH

Omówimy poni»ej trzy najcze±ciej stosowane ogólne metody poszukiwania estymatorów

parametrów zapewniajace otrzymanie estymatorów o po»adanych wªasno±ciach. Sa to:

• Metoda momentów

• Metoda najwiekszej wiarygodno±ci

• Metoda najmniejszych kwadratów

Ka»da z nich ma swoje zalety i wady. W ogólnym przypadku zalecana jest metoda

najwiekszej wiarygodno±ci ale w przypadku szukania parametrów regresji najbardziej popularna

jest metoda najmniejszych kwadratów. Z kolei metoda momentów mo»e by¢

bardzo wygodna w niektórych przypadkach przedyskutowanych poni»ej.

10.1 METODA MOMENTÓW (MM)

Metoda momentów zaproponowana zostaªa przez K. Pearsona na przeªomie XIX i XX

wieku.

Idea metody: Szukamy estymatorów parametrów θ 1, θ 2,... θ k okre±lajacych caªkowicie

dystrybuante zmiennej losowej X postepujac w poni»szy sposób:

• Znajdujemy zwiazki pomiedzy parametrami a momentami rozkªadu.

• Wyliczamy estymatory momentów T n (m i (0)) ≡ M i wg wzoru:

M i = 1 n∑

[x j ] i

n j=1

• Wstawiamy powy»sze estymatory momentów do wzorów wia»acych oszacowywane

parametry z momentami.

• Rozwiazujemy ukªad równa« na parametry θ 1, θ 2,... θ k wyra»ajac je przez estymatory

momentów M i , i=1,..,k . Te rozwiazania sa estymatorami odpowiednich

parametrów T n (θ i ) , i=1,...,k , optymalnymi w sensie metody momentów.

SMOP-2 B.Kamys: 2007/08 57

PRZYKŠAD:

Szukamy estymatorów parametrów θ 1, (θ 2 ) 2 rozkªadu Gaussa:

f(x) = 1 √ exp{− (x − θ 1) 2

}

2πθ

2

2θ 2 2

Znamy zwiazki pomiedzy parametrami i momentami rozkªadu:

θ 1 =E{x} ≡ m 1 (0)

(θ 2 ) 2 = var{x} = E{x 2 } − (E{x}) 2 ≡ m 2 (0) − (m 1 (0)) 2

Liczymy estymatory momentów:

T n (m 1 (0)) ≡ M 1 = 1 n∑

x i

n i=1

T n (m 2 (0)) ≡ M 2 = 1 n∑

x 2 i

n i=1

Z pierwszego równania po wstawieniu ±redniej arytmetycznej zamiast E{x}

dostajemy:

T n (θ 1 ) = 1 n∑

x i

n i=1

Z drugiego równania (zastepujac momenty ich estymatorami) dostajemy:

)

T n (θ 2 2 ) = 1 n∑

n∑ 2

x

n

n i =

i=1

n∑

x 2 i − 2¯x2 + ¯x 2 =

(

x 2 i − 2¯x. 1

n∑

= 1 n

i=1

= 1 n∑

n

i=1

= 1 n∑

n

i=1

= 1 n∑

n

i=1

x 2 i − (

1

n

i=1

x i

)

+

(

x

2

i − 2¯x.x i + ¯x 2) =

(x i − ¯x) 2

(

1

n∑

n

i=1

¯x 2 )

SMOP-2 B.Kamys: 2007/08 58

(w drugim wierszu dodany i odjety kwadrat ±redniej arytmetycznej, w trzecim kwadrat

±redniej zapisany jako n-ta cze±¢ sumy kwadratów ±redniej a dalej to tylko zwijanie kwadratu

ró»nicy).

Otrzymujemy wiec znany nam estymator s 2 (x) jako najlepszy w sensie metody momentów

estymator wariancji θ 2 2 :

T n (θ 2 2 ) = 1 n∑

(x i − ¯x) 2 ≡ s 2 (x)

n i=1

Wªasno±ci estymatorów metody momentów :

Estymatory sa:

• asymptotycznie nieobcia»one (lub nieobcia»one)

• zgodne

Wady metody momentów:

• Ukªad równa« na estymatory parametrów θ jest zwykle nieliniowy co powoduje,

»e musimy znajdowa¢ rozwiazania numerycznie i dodatkowo utrudnia oszacowanie

bªedów estymatorów.

• Estymatory metody momentów sa zwykle mniej efektywne (tzn. maja wieksza

wariancje) ni» estymatory znalezione innymi metodami a w szczególno±ci metoda

najwiekszej wiarygodno±ci.

• Wyznaczanie wy»szych momentów z do±wiadczenia jest maªo dokªadne co rzutuje

na dokªadno±¢ estymatorów parametrów.

Optymalna sytuacja dla metody momentów:

Zachodzi ona wtedy, gdy szukane parametry wystepuja jako wspóªczynniki rozwiniecia

funkcji gesto±ci prawdopodobie«stwa na ortonormalny zespóª funkcji g k (x), k = 1, .., r:

f(x, θ) ⃗ r∑

= const + θ k g k (x)

k=1

SMOP-2 B.Kamys: 2007/08 59

gdzie const jest staªa normalizacyjna a funkcje g k speªniaja relacje:

∫

dx g k (x) g j (x) = δ kj

oraz

∫

dx g k (x) = 0.

Wtedy mo»emy napisa¢ nastepujaco wzór na warto±¢ oczekiwana funkcji g j (x):

E{g j (x)} = ∫ dx g j (x) f(x, ⃗ θ) =

= ∫ dx const g j (x) + r ∑

= 0 + θ j

k=1

θ k

∫ dx gk (x) g j (x) =

Wynika stad, »e szukanie estymatora parametru θ j sprowadza sie do znalezienia estymatora

warto±ci oczekiwanej funkcji g j (x). Zgodnie z zasada metody momentów estymatorem

tym jest ±rednia arytmetyczna:

T n (θ j ) = 1 n∑

g j (x i )

n i=1

Wiemy, »e ±rednia arytmetyczna jest zgodnym i nieobcia»onym estymatorem. Co

wiecej, wiemy z centralnego twierdzenia granicznego , »e asymptotyczny rozkªad takiej

zmiennej jest rozkªadem normalnym a wiec znamy równie» przepis na estymator wariancji

tego estymatora. Takim nieobcia»onym i zgodnym estymatorem jest S 2 (¯x), gdzie zamiast

x i bierzemy funkcje g j (x i ) a zamiast ¯x bierzemy estymator T n (θ j ):

S 2 (T n (θ j )) =

1 n∑

[g j (x i ) − T n (θ j )] 2

n(n − 1) i=1

SMOP-2 B.Kamys: 2007/08 60

10.2 METODA NAJWIEKSZEJ WIARYGODNO‘CI (MNW)

Metoda najwiekszej wiarygodno±ci zaproponowana zostaªa przez R.A. Fishera w 1921

roku.

Idea metody:

Zawiera sie w zaªo»eniu, »e zaobserwowane w próbie wyniki sa najbardziej prawdopodobne

spo±ród wszystkich mo»liwych.

• Szukamy prawdopodobie«stwa tego, »e próba bedzie taka jaka zaobserwowali±my

je»eli parametry ⃗ θ przyjmuja konkretna warto±¢ ⃗ θ 0 .

Je»eli próba jest prosta, tzn. pomiary x i , i = 1, .., n sa niezale»ne to szukane prawdopodobie«stwo

próby równe jest iloczynowi prawdopodobie«stw warunkowych poszczególnych

pomiarów. Dla zmiennej ciagªej X mo»emy opu±ci¢ iloczyn ró»niczek

dx 1 ...dx n i zapisa¢ jedynie iloczyn gesto±ci prawdopodobie«stw:

L( θ ⃗ n∏ ∣ ∣∣ 0 ) = f(x i θ0 ⃗ ).

i=1

To prawdopodobie«stwo (dla zmiennej dyskretnej) lub gesto±¢ prawdopodobie«stwa

(dla zmiennej ciagªej) mo»emy potraktowa¢ jako funkcje szukanych parametrów.

Funkcje te nazywamy funkcja wiarygodno±ci.

• Znajdujemy taka warto±¢ parametrów ⃗ θ , która zapewnia maksimum funkcji wiarygodno±ci:

L( ⃗ θ) = max .

Te dwa warunki sªu»a jako przepis na szukanie optymalnych w sensie metody najwiekszej

wiarygodno±ci estymatorów.

Poniewa» szukanie maksimum funkcji wiarygodno±ci wymaga zwykle ró»niczkowania

po parametrach wiec bedziemy mie¢ do czynienia z ró»niczkowaniem iloczynu co prowadzi

do do±¢ skomplikowanych rachunków. Aby uªatwi¢ ró»niczkowanie standardowo

zamienia sie funkcje wiarygodno±ci przez jej logarytm co powoduje, »e zamiast

ró»niczkowania iloczynu nale»y ró»niczkowa¢ sume a poªo»enie maksimum w przestrzeni

parametrów jest takie samo gdy» logarytm jest funkcja monotoniczna oraz

∂ ln(L)

∂θ i

≡

( ) ∂L

∂θ i

L

ma taki sam znak jak

∂L

∂θ i

(L jest wieksze od zera ).

Logarytm z funkcji wiarygodno±ci oznaczany jest zwykle przez maªa litere l.

SMOP-2 B.Kamys: 2007/08 61

l ≡ ln(L)

(chocia» stosuje sie równie» oznaczenie przez du»e L) i nazywany jest logarytmiczna

funkcja wiarygodno±ci a czasem równie» funkcja wiarygodno±ci.

PRZYKŠAD:

Dla rozkªadu normalnego N(θ 1 ,θ 2 ) :

wiec funkcja wiarygodno±ci:

f(x) =

L(θ 1 , θ 2 ) =

1

√

2π θ2

exp

1

(2π) n 2 θ n 2

a logarytmiczna funkcja wiarygodno±ci:

{− (x − θ 1) 2 }

2θ 2 2

{

exp − 1

}

n∑

(x

2θ2

2 i − θ 1 ) 2

i=1

l = −n ln((2π) 1 2 ) − n ln(θ2 ) − 1 n∑

(x

2θ2

2 i −θ 1 ) 2

i=1

Ró»niczkujac po parametrach dostajemy ukªad równa« na parametry:

⎧

⎪⎨

⎪⎩

∂l

∂θ 1

= 1

θ2

2

n∑

i=1

∂l

∂θ 2

= − n θ 2

+ 1

(x i − θ 1 ) = 0

n∑

(x i − θ 1 ) 2 = 0

θ2

3 i=1

Rozwiazanie pierwszego równania daje estymator T n (θ 1 ):

T n (θ 1 ) = 1 n∑

x i

n i=1

czyli ±rednia arytmetyczna ¯x, a przeksztaªcajac drugie równanie mo»na napisa¢ tak:

czyli

n = 1 n∑

(x

θ2

2 i − T n (θ 1 ) 2

i=1

T n (θ 2 2 ) = 1 n∑

(x i − ¯x) 2

n i=1

SMOP-2 B.Kamys: 2007/08 62

a to jest znany nam estymator wariancji zmiennej x oznaczany symbolem s 2 (x).

Jak wida¢ metoda najwiekszej wiarygodno±ci daªa w tym przypadku dokªadnie te same

estymatory co metoda momentów.

Zanim podamy wªasno±ci estymatorów MNW wprowadzimy denicje rozkªadu regularnego

i estymatorów regularnych.

Mówimy, »e rozkªad f(X, θ) jest rozkªadem regularnym gdy caªkowanie wzgledem x i

ró»niczkowanie wzgledem θ sa przemienne i istnieja wyra»enia:

oraz

∫

∂ 2 +∞

∂θ 2 −∞

≡ +∞ ∫

−∞

+∞

∂ ∫

∂θ

−∞

≡ +∞ ∫

−∞

dx f(x|θ) = +∞ ∫

dx f(x|θ)

}

≡ E { ∂ ln f(x|θ)

∂θ

dx f(x|θ) = +∞ ∫

dx f(x|θ) ∂2 ln f(x|θ)

≡ E { ∂ 2 ln f(x|θ)

∂θ 2

−∞

∂ ln f(x|θ)

∂θ

dx ∂2 f(x|θ)

∂θ 2

−∞

+ +∞ ∫

∂θ 2

}

+ E

{ [ ∂ ln f(x|θ)

∂θ

−∞

] } 2

dx ∂f(x|θ)

∂θ

dx f(x|θ) [ ] 2 ∂ ln f(x|θ)

≡

∂θ

Estymator parametru θ rozkªadu regularnego nazywamy estymatorem regularnym.

Gdy zmienna X jest dyskretna to w powy»szych wzorach nale»y funkcje gesto±ci prawdopodobie«stwa

zastapi¢ prawdopodobie«stwem i caªki sumami.

UWAGA:

Ze wzgledu na warunek normalizacji gesto±ci prawdopodobie«stwa +∞

dx f(x|θ) = 1

oba wyra»enia wypisane w denicji rozkªadu regularnego sa równe zero.

∫

−∞

TWIERDZENIE

Je»eli funkcja gesto±ci prawdopodobie«stwa f(X|θ) (lub rozkªad prawdopodobie«stwa

p(X|θ) ) sa rozkªadami regularnymi i parametr θ jest szacowany na podstawie próby

prostej to estymator T n (θ) otrzymany przy pomocy MNW ma dla rozmiarów próby

n da»acych do niesko«czono±ci nastepujace wªasno±ci:

• jest zgodny

• jego asymptotyczny rozkªad jest normalny

SMOP-2 B.Kamys: 2007/08 63

z warto±cia oczekiwana

i wariancja σ 2 (T n (θ))=

E{T n (θ)}=θ

[

]

n +∞ ∫ ( ) −1

∂ ln f(X|θ)

2

∂θ f(X|θ) dX

−∞

Mo»na pokaza¢ (jest to tre±cia tzw. nierówno±ci Cramera-Rao), »e wyra»enie powy»-

sze jest dolna granica wariancji dla nieobcia»onego estymatora regularnego a

wiec

MNW daje estymatory:

- zgodne,

- asymptotycznie nieobcia»one,

- asymptotycznie najbardziej efektywne

Dla sko«czonych rozmiarów próby i regularnych rozkªadów MNW daje estymatory

zgodne ale moga by¢ one obcia»one i moga nie by¢ najbardziej efektywne. O ich

efektywno±ci mo»na wnioskowa¢ na podstawie twierdzenia Cramera-Rao zwanego równie»

nierówno±cia informacyjna :

TWIERDZENIE Cramera-Rao:

Wariancja regularnego estymatora T n (θ) speªnia nierówno±¢

gdzie

σ 2 (T n (θ)) ≥

{

jest obcia»eniem estymatora.

1 + ∂B n(θ)

∂θ

} ⎡ ⎤

+∞ ∫ ( )

⎢ ∂ ln f(X|θ) 2

⎥

⎣n f(X|θ) dX ⎦

∂θ

−∞

B n (θ) ≡ E{T n (θ)} − θ

Wyra»enie w nawiasie kwadratowym nazywane jest informacja o parametrze θ zawarta

w próbie (R.A. Fisher) - stad nazwa nierówno±ci.

Wyra»enie to zostaªo tak nazwane gdy» posiada wªasno±ci, których wymagamy od informacji:

• zwieksza sie wraz z liczba obserwacji,

• zale»y od tego czego chcemy sie dowiedzie¢ (od parametru θ i jego zwiazku z mierzonymi

wielko±ciami),

• zwiazana jest z dokªadno±cia (im wieksza informacja tym lepsza dokªadno±¢ okre-

±lenia warto±ci parametru)

−1

SMOP-2 B.Kamys: 2007/08 64

TWIERDZENIE

Minimalna wariancje estymatora regularnego (równo±¢ w twierdzeniu Cramera-Rao)

T n (τ(θ)) pewnej funkcji τ(θ) interesujacego nas parametru θ :

( )

∂τ (θ)

σ 2 (T n (τ (θ)) =

∂θ

∣ F (θ) ∣

uzyskuje sie dla sko«czonych rozmiarów próby n wtedy gdy pochodna czastkowa

funkcji wiarygodno±ci speªnia nastepujaca relacje:

∂ ln L

= F (θ) [T n (τ (θ)) − τ (θ)]

∂θ

gdzie F(θ) jest pewna funkcja parametru θ ale nie zale»y od pomiarów ⃗x.

○

Funkcja wiarygodno±ci ma wtedy nastepujaca posta¢:

L(⃗x|θ ) = exp { A(θ) B(⃗x) + C(⃗x) + D(θ) }

gdzie A i D sa funkcjami θ (A jest caªka po dθ z F (θ) ) a B i C sa funkcjami

zespoªu pomiarów (próby).

Porównujac wzór na wariancje estymatora T n (τ (θ)) z nierówno±cia Cramera-Rao wida¢

natychmiast, »e:

• F (θ) to informacja z próby o funkcji τ(θ),

• gdy τ(θ)=θ to wariancja wynosi 1/F (θ),

• istnieje tylko jedna funkcja τ (θ) parametru θ , dla której osiagana jest minimalna

wariancja estymatora okre±lona nierówno±cia Cramera-Rao czyli taka funkcja τ (θ)

od której liniowo zale»y pochodna po parametrze θ z logarytmicznej funkcji wiarygodno±ci.

PRZYKŠAD: Je»eli parametrem θ jest odchylenie standardowe rozkªadu normalnego

σ(x) to tylko estymator wariancji σ 2 (x) , tzn. estymator s 2 (x) ma minimalna wariancje

a estymator s(x) ju» tej wªasno±ci nie posiada. Wida¢ to ze wzoru wyprowadzonego w

przykªadzie zastosowania MNW:

∂l

= − n + 1 n∑

(x

∂θ 2 θ 2 θ2

3 i − θ 1 ) 2 = 0

i=1

Pochodna po θ 2 jest liniowo zwiazana z funkcja s 2 (x) ≡ 1 (x

n i − θ 1 ) 2 a nie z

i=1

estymatorem odchylenia standardowego s(x), który jest pierwiastkiem z tego wyra»enia.

Wida¢ to po prostym przeksztaªceniu wzoru na pochodna:

n∑

SMOP-2 B.Kamys: 2007/08 65

( ) [

∂l n

≡ −θ 2

∂θ 2 θ2

3 2 + 1 ]

n∑

(x i − θ 1 ) 2

n i=1

Šatwo zidentykujemy:

( ) n

F (θ) ≡

θ2 3

τ (θ) ≡ θ 2 2

T n (τ (θ)) ≡ 1 n∑

(x i − θ 1 ) 2

n

i=1

10.2.1 Oszacowanie bªedu parametru znalezionego MNW

Istnieje prosty sposób oszacowania bªedu estymatorów znalezionych MNW je»eli logarytmiczna

funkcja w pobli»u maksimum mo»e by¢ przybli»ona parabola jako funkcja wszystkich

parametrów. Mo»na pokaza¢, »e wówczas kontur staªej warto±ci logarytmicznej f.

wiarygodno±ci lnL( ⃗ θ) speªniajacy relacje:

ln ( L ( ⃗ θ

))

= ln

(

L

( ⃗θ

)

max

)

−

y 2

odcina na osiach θ i y-krotna wielko±¢ odchylenia standardowego parametru θ i : y ·σ(θ i ).

Je»eli przybli»enie parabola zale»no±ci lnL(θ i ) nie jest ±cisªe to nale»y ten sposób

traktowa¢ jedynie jako przybli»ona metode.

SMOP-2 B.Kamys: 2007/08 66

10.3 METODA NAJMNIEJSZYCH KWADRATÓW (MNK)

Za autora metody najmniejszych kwadratów uwa»a sie K. Gaussa.

Idea metody:

Szukamy estymatora T n (θ) parametru θ wystepujacego we wzorze:

g(Y, θ) = 0,

który mo»e by¢ ±ci±le speªniony tylko w wyidealizowanym przypadku, gdy mierzone do-

±wiadczalnie wielkosci Y i nie sa obarczone bªedami. W obecno±ci bªedów tak dobieramy

parametr θ (mo»e by¢ ich wiecej) aby funkcja g zbli»yªa sie do zera tak bardzo jak to

tylko jest mo»liwe, tj. »adamy speªnienia warunku:

n∑

i=1

[g(Y i , θ)] 2 = min

θ

a w najogólniejszym przypadku (wªaczajac wagi pomiarów w i ) warunku:

n∑

i=1

w i· [g(Y i , θ)] 2 = min .

θ

PRZYKŠAD:

Szukamy prawdziwej warto±ci wielko±ci Y mierzonej bezpo±rednio. Gdyby nie byªo bledów

wówczas:

albo inaczej

θ = Y

g(Y |θ) ≡ Y − θ = 0.

W obecno±ci bªedów,funkcja g(Y |θ) bedzie zwykle ró»na od zera ale MNK podaje przepis

jak znale¹¢ estymator T n (θ):

n∑

[g(Y i |θ)] 2 ≡

i=1

[Y i − θ] 2 = min

θ

Aby znale¹¢ minimum powy»szej funkcji ze wzgledu na θ nale»y przyrówna¢ do zera

pochodna tej funkcji wzgledem θ:

n∑

−2 [Y i − θ] = 0

i=1

a wiec dostajemy znany nam przepis na estymator warto±ci oczekiwanej:

SMOP-2 B.Kamys: 2007/08 67

T n (θ) = 1 n∑

Y i

n i=1

Wªasno±ci estymatorów MNK

Estymatory otrzymane MNK nie maja w ogólnym przypadku optymalnych wªasno±ci

(nawet asymptotycznie)! Istnieja jednak dwa wa»ne wyjatki od tej reguªy:

1.) Pomiary Y i maja rozkªad normalny i sa nieskorelowane,

2.) Szukane parametry sa wspóªczynnikami w liniowej funkcji regresji.

ad 1. Pomiary maja rozkªad normalny i sa nieskorelowane Odpowiada to sytuacji,

w której zmienna Y mo»e by¢ przedstawiona nastepujaco:

Y i = h(X i , ⃗ θ) + ε

gdzie ε to bªad przypadkowy.

Wtedy funkcja wiarygodno±ci ma nastepujaca posta¢:

L(Y 1 , .., Y n | ⃗ θ) =

n∏

i=1

a logarytmiczna funkcja wiarygodno±ci:

l(Y 1 , .., Y n | ⃗ θ) = − 1 2 n ln ( 2πσ 2 i

⎧ (

1

⎪⎨ Yi

√ exp 2πσi ⎪⎩ − − h(X i , θ) ⃗ ) ⎫

2

⎪⎬

2σi

2 ⎪⎭

(

) ∑ n Yi − h(X i , θ) ⃗ ) 2

−

Funkcja ta bedzie miaªa maksimum (ujemne !) gdy suma kwadratów bedzie najmniejsza.

A wiec metoda najmniejszych kwadratów jest wtedy równowa»na metodzie

najwiekszej wiarygodno±ci, która zapewnia optymalno±c otrzymywanych estymatorów.

ad 2. Funkcja regresji jest liniowa ze wzgledu na szukane parametry Zmienna

Y zale»y wtedy od zmiennej X w nastepujacy sposób:

i=1

2σ 2 i

k∑

Y i = θ j · f j (X i )

j=1

SMOP-2 B.Kamys: 2007/08 68

gdzie f j (X) jest dowolna funkcja.

Markow udowodniª , »e w takiej sytuacji estymatory parametrów posiadaja bardzo

dobre wªasno±ci:

• sa nieobcia»one

• sa najbardziej efektywne

• sa liniowymi funkcjami pomiarów Y 1 , ..., Y n .

Te wªasno±ci nie zale»a od rozkªadu zmiennej Y i speªnione sa nawet dla

niewielkich prób.

Linowy (ze wzgledu na parametry) model funkcji regresji jest bardzo czesto stosowany

w praktyce, poniewa» obok optymalnych wªasno±ci estymatorów parametrów zapewnia

mo»liwo±¢ ±cisªego rozwiazania równa« okre±lajacych estymatory parametrów a wiec mo»-

liwo±¢ znalezienia jawnych wzorów na estymatory. Tego prawie nigdy nie da sie zrobi¢

w przypadku pierwszym, tzn. gdy zale»no±¢ od parametrów jest nieliniowa. Zapiszemy

warunek metody najmniejszych kwadratów macierzowo stosujac nastepujace oznaczenia:

A ij ≡ f j (x i ) i = 1, .., n j = 1, .., r

B ij i = 1, .., n j = 1, .., n

Y i i = 1, .., n

i = 1, .., r

θ i

gdzie A ij to macierz warto±ci funkcji f j (x i ), B i,j to macierz wag zwykle brana jako

odwrócona macierz kowariancji pomiarów {cov(y i ,y j )} −1 , Y i - wektor pomiarów, θ i -

wektor parametrów. Wtedy minimalizowana suma kwadratów mo»e by¢ zapisana w taki

sposób:

Q 2 = (⃗Y − A · ⃗θ) T · B · (⃗Y − A · ⃗θ)

a pochodne wzgledem parametrów nastepujaco (i=1,...,r):

∂Q 2

∂θ i

= { −2A T · B · (⃗Y − A · ⃗θ) } i = 0·

Zespóª r powy»szych równa« mo»na zapisa¢ macierzowo i rozwiaza¢ formalnie:

A T · B · (⃗Y − A · ⃗θ) = 0

A T · B · ⃗Y = A T · B · A · ⃗θ

a mno»ac lewostronnie przez macierz odwrotna do A T BA, dostaniemy estymatory

parametrów liniowej funkcji regresji :

T n ( ⃗ θ) = [ A T · B · A ] −1

AT · B · ⃗Y

SMOP-2 B.Kamys: 2007/08 69

Jest to dokªadne i jedyne rozwiazanie (pod warunkiem, »e macierz A T BA jest nieosobliwa)

Z powy»szego wzoru wida¢, »e estymatory parametrów sa liniowymi funkcjami warto±ci

pomiarów Y 1 , ..., Y n co pozwala ±ci±le wyrazi¢ macierz kowariancji estymatorów

parametrów (a wiec i ich bªedy) przez macierz kowariancji pomiarów C( ⃗Y ) stosujac wzór

wyprowadzony dla propagacji bªedów. Gdy przyjmiemy macierz wag B jako macierz

odwrotna do C(⃗Y ) to uzyskamy wyjatkowo prosta forme macierzy kowariancji estymatorów

parametrów.

C(T n ( ⃗ θ)) =

=

{ [A T BA ] −1

A T B}

{ [A T BA ] −1

A T B}

{ [A

· C(⃗Y ) · T BA ] }

−1 T

A T B

{ [A

· B −1 · T BA ] }

−1 T

A T B

= [ A T BA ] (

−1 [A

AT · BB −1 · B T A

T BA ] −1 ) T

= [ A T BA ] −1 [

· A T BA ] ( [A

·

T BA ] T ) −1

= ([ A T BA ]) −1

= [ A T C(⃗Y ) −1 A ] −1

Ostatecznie macierz kowariancji estymatorów parametrów :

C(T n (⃗θ)) = [ A T C(⃗Y ) −1 A ] −1

Warto zauwa»y¢, »e

• Ten wynik jest ±cisªy

• Powy»sza macierz jest wyliczana dla znalezienia estymatorów parametrów bo to jest

macierz {A T BA} −1 wystepujaca we wzorze na estymatory.

• Mimo, »e wzór jest ±cisªy i prosty to jego wyliczenie czesto napotyka na trudno±ci

numeryczne gdy» procedura odwracania macierzy {A T BA} −1 jest ¹le uwarunkowana

numerycznie (maªe zaokraglenia rachunków moga powodowa¢ wielkie zmiany

wyników). Dla unikniecie tego problemu stosuje sie jako funkcje, na które rozwijana

jest funkcja regresji tzw. wielomiany ortogonalne na zbiorze punktów.

SMOP-2 B.Kamys: 2007/08 70

11 TESTOWANIE HIPOTEZ STATYSTYCZNYCH

11.1 Denicje elementarnych poje¢

Poni»ej podamy denicje elementarnych poje¢ stosowanych przy testowaniu hipotez.

Hipoteza statystyczna nazywamy hipoteze odnoszaca sie do rozkªadu prawdopodobie«stwa

zmiennej losowej (funkcji gesto±ci prawdopodobie«stwa, itp.) lub do parametrów

rozkªadu prawdopodobie«stwa.

Hipoteza prosta to taka, która jednoznacznie okre±la dystrybuante (rozkªad) zmiennej

losowej, tzn. podana jest posta¢ rozkªadu i warto±ci wszystkich parametrów.

Hipoteza zªo»ona to taka, która nie jest prosta, np. podana jest posta¢ rozkªadu a

nie sa znane warto±ci niektórych parametrów.

Hipoteza parametryczna to hipoteza odnoszaca sie do warto±ci parametrów rozkªadu.

Inne hipotezy nazywaja sie hipotezami nieparametrycznymi i z natury sa

hipotezami zªo»onymi.

Hipoteza zerowa H 0 ” to sprawdzana hipoteza.

Hipoteza alternatywna H 1 ” to hipoteza, która byliby±my skªonni przyja¢ gdy

H 0 ” jest nieprawdziwa.

UWAGA: H 1 ” nie musi by¢ prostym zaprzeczeniem H 0 ”

Bªad pierwszego rodzaju to odrzucenie prawdziwej H 0 ”.

Poziomem istotno±ci α” nazywamy prawdopodobie«stwo popeªnienia bªedu pierwszego

rodzaju. Przyjmuje sie zwykle α” ∈ [0.1 − 0.001] konkretny wybór oczywi±cie

zale»y od tego jak kosztowne beda skutki popeªnienia bªedu pierwszego rodzaju.

Bªad drugiego rodzaju to przyjecie nieprawdziwej H 0 ”.

UWAGA: Przez sformuªowanie przyjecie hipotezy” nale»y rozumie¢ stwierdzenie, »e nie

mamy podstaw do odrzucenia hipotezy H 0 ”. Inaczej mówiac pomiaru, którego wynik

nie przeczy hipotezie nie mo»na uwa»a¢ za dowód prawdziwo±ci hipotezy !!!

Moca testu nazywamy prawdopodobie«stwo odrzucenia faªszywej H 0 ”, tzn. prawdopodobie«stwo

tego, »e nie popeªnimy bªedu II rodzaju. Moc testu oznacza sie zwykle

przez 1 − β” gdzie β” oznacza prawdopodobie«stwo popeªnienia bªedu II rodzaju.

Tablica 1: Wyniki podejmowania decyzji przy testowaniu hipotez

H 0 prawdziwa H 1 prawdziwa

Przyjecie H 0 Decyzja prawidªowa Bªad II rodzaju

Przyjecie H 1 Bªad I rodzaju Decyzja prawidªowa

SMOP-2 B.Kamys: 2007/08 71

11.2 Schemat postepowania przy testowaniu hipotez

Idea testowania hipotez polega na odrzucaniu postawionej hipotezy (hipotezy zerowej

H 0 ) je»eli otrzymane wyniki do±wiadczenia lub obserwacji sa wysoce nieprawdopodobne

przy jej prawdziwo±ci.

1. Pojawienie sie wyników niesprzecznych z H 0 nie udowadnia tej hipotezy a jedynie

pozwala na stwierdzenie, »e nie ma podstaw do jej odrzucenia.

2. Jak wiadomo, maªe prawdopodobie«stwo pojawienia sie pewnych wyników nie oznacza,

»e wyniki te sa niemo»liwe. Mo»e wiec sie zdarzy¢, »e przy prawdziwo±ci H 0

pojawi sie tak bardzo nieprawdopodobny wynik i» uznamy go za argument dla odrzucenia

H 0 . Wtedy odrzucajac H 0 popeªnimy bªad pierwszego rodzaju.

3. Ustalajac, jakie warto±ci wyników uznamy za upowa»niajace do odrzucenia H 0

kierujemy sie kosztami skutków odrzucenia prawdziwej H 0 i na tej podstawie ustalamy

prawdopodobie«stwo odrzucenia prawdziwej H 0 czyli poziom istotno±ci. Typowe

warto±ci to α = 0, 1 − 0, 001.

4. Odrzucajac H 0 automatycznie akceptujemy hipoteze alternatywna H 1 , która w

braku wcze±niejszych informacji o badanym zagadnieniu powinna by¢ zaprzeczeniem

H 0 : H 1 : nieprawda »e H 0 .

Omówimy poni»ej schemat postepowania przy testowaniu hipotezy, wykorzystujac

jako przykªad prosta hipoteze zerowa, która gªosi, »e:

H 0 : Zmienna losowa x posiadajaca rozkªad normalny o znanym odchyleniu

standardowym σ(x)=2 ma warto±¢ oczekiwana E(x) = 3.0

• Ustalamy H 0 .

Zrobili±my to powy»ej. Wa»ne jest u±wiadomienie sobie faktu, »e caªe dalsze rozumowanie

przeprowadzane jest przy zaªo»eniu, »e H 0 jest prawdziwa.

• Tworzymy statystyke testowa T n .

Czynimy to w taki sposób aby zale»aªa ona od wielko±ci testowanej przez H 0 oraz

znany byª rozkªad tej statystyki przy prawdziwo±ci H 0 .

Tu H 0 dotyczy warto±ci oczekiwanej E(x) a wiec nasuwa sie aby jako statystyke

testowa wzia¢ estymator warto±ci oczekiwanej czyli ±rednia arytmetyczna pomiarów

x. Co wiecej, przy prawdziwo±ci H 0 znamy rozkªad tej statystyki - jest to

rozkªad normalny o warto±ci oczekiwanej E(x) = 3.0 i odchyleniu standardowym

σ(x) = σ(x)/ √ n = 2/ √ n, gdzie n oznacza liczbe pomiarów w próbie, np.

n = 10. Mo»emy wiec wzia¢ ±rednia arytmetyczna pomiarów jako statystyke

testowa przy czym wygodnie jest ja standaryzowa¢; x → (x − E(x))/σ(x) bo

rozkªad standaryzowanej zmiennej, tzn. N(0, 1), jest stablicowany:

T n ≡ (x − 3.0) √ 10

SMOP-2 B.Kamys: 2007/08 72

• Ustalamy H 1 .

Je»eli przed ustaleniem H 1 nie mamy »adnych informacji do±wiadczalnych (obserwacyjnych)

to jako H 1 przyjmujemy proste zaprzeczenie H 0 , tzn. H 1 brzmi nieprawda,

»e H 0 czyli w naszym przykªadzie H 1 : E(X) ≠ 3.0. W przypadku,

gdy mamy ju» pewne informacje, np. znamy warto±¢ ±redniej arytmetycznej, to w

hipotezie alternatywnej wykorzystujemy te wiedze. Przypu±¢my, »e w rozwa»anym

przykªadzie ±rednia arytmetyczna z n = 10 pomiarów wynosi 4, 1. W takiej sytuacji

nie miaªoby sensu gªoszenie hipotezy, »e warto±¢ oczekiwana E(x) jest mniejsza

od 3. Nale»aªoby wtedy przyja¢ jako H 1 hipoteze, »e E(X) > 3.

• Ustalamy poziom istotno±ci α. Jak wspomniano powy»ej α dobieramy biorac pod

uwage skutki odrzucenia prawdziwej hipotezy zerowej. Je»eli nie sa one gro¹ne lub

kosztowne to mo»emy zgodzi¢ sie na du»e prawdopodobie«stwo odrzucenia prawdziwej

H 0 np. 0, 1 lub 0, 05. W przeciwnym wypadku przyjmujemy mniejsza warto±¢

poziomu istotno±ci α.

• Okre±lamy obszar krytyczny testu.

Obszar krytyczny testu to ten zbiór warto±ci statystyki testowej który jest najmniej

prawdopodobny przy prawdziwo±ci H 0 a równocze±nie najbardziej prawdopodobny

przy prawdziwo±ci H 1 . W rozwa»anym przykªadzie najmniej prawdopodobne przy

prawdziwo±ci H 0 sa du»e dodatnie i du»e (co do moduªu) ujemne warto±ci T n . Hipoteza

alternatywna H 1 : H 0 jest nieprawdziwa faworyzuje dokªadnie te same

warto±ci statystyki, które odrzuca H 0 a wiec obszarem krytycznym beda warto±ci:

T n < z α/2 oraz T n > z 1−α/2 , gdzie z q oznacza kwantyl rozkªadu N(0, 1) na poziomie

q. Tu zaªo»one zostaªo, »e odchylenia w dóª i w góre od warto±ci postulowanej

przez H 0 sa równie prawdopodobne. Z kolei hipoteza alternatywna H 1 : E(x) > 3

faworyzuje tylko du»e dodatnie warto±ci T n . Wida¢ to ªatwo ze wzoru denicyjnego

na T n . Jedyna wielko±cia zale»na od do±wiadczenia w denicji T n jest ±rednia arytmetyczna

pomiarów, która dla E(x) > 3 bedzie w przewa»ajacej liczbie pomiarów

tak»e wieksza od 3 co jest równowa»ne temu,»e T n jest wieksze od zera. A wiec

obszarem krytycznym jest zbiór warto±ci statystyki testowej speªniajacy nierówno±¢:

T n > z 1−α .

• Sprawdzamy, czy warto±¢ statystyki testowej nale»y do obszaru krytycznego.

Je»eli warto±¢ statystyki testowej traa do obszaru krytycznego to odrzucamy H 0

(akceptuj¡c równocze±nie H 1 ). W przeciwnym wypadku stwierdzamy, »e nie mamy

podstaw do odrzucenia H 0 . Wnioski te formuªujemy w nast¦puj¡cy sposób:

W pierwszym przypadku: Na poziomie istotno±ci α odrzucamy hipotez¦

zerow¡ H 0 wzgl¦dem hipotezy alternatywnej H 1 .

W drugim wypadku: Na poziomie istotno±ci α nie mamy podstaw do

odrzucenia hipotezy zerowej H 0 wzgl¦dem hipotezy alternatywnej H 1 .

SMOP-2 B.Kamys: 2007/08 73

11.3 HIPOTEZY DOTYCZA CE WARTO‘CI OCZEKIWANEJ

Zajmujemy sie zmiennymi o rozkªadzie normalnym. Sa dwie podstawowe hipotezy, które

bada sie najcze±ciej:

• Porównanie E(X) z liczba:

H 0 : E(X) = x 0 , oraz

• Porównanie warto±ci oczekiwanych dwu populacji:

H 0 : E(X) = E(Y )

Ka»da z tych hipotez mo»e oczywi±cie by¢ formuªowana jako nierówno±¢, np. H 0 :

E(X) > X 0 ale wtedy hipoteza zerowa jest zªo»ona a wiec nie mamy jednoznacznie

zdeniowanego rozkªadu X. Z tego powodu wygodniej jest zawsze bra¢ jako hipoteze

zerowa równo±¢ E(X) z dana liczba lub E(Y) a interesujaca nas hipoteze traktowa¢ jako

hipoteze alternatywna.

11.3.1 PORÓWNANIE E(X) Z LICZBA (H 0 : E(X)=X 0 )

Musimy rozró»ni¢ dwa przypadki:

• gdy znamy σ(X), wtedy jako statystyke testowa T n (X) bierzemy poni»sza statystyke

z o rozkªadzie standardowym normalnym N(0,1):

z =

(x − E(X))

σ(X)

• gdy nie znamy σ(X), to jako statystyke T n (X) bierzemy analogiczna funkcje "t",

w której σ zastapiona jest estymatorem S(X):

t =

(x − E(X))

.

S(X)

Statystyka t ma rozkªad Studenta o (n-1) stopniach swobody.

Oczywi±cie odchylenie standardowe ±redniej arytmetycznej σ(X) podobnie jak jego

estymator S(X) równe sa odpowiednim warto±ciom dla samej zmiennej X podzielonym

przez √ n:

σ(X) = σ(X) √ n

SMOP-2 B.Kamys: 2007/08 74

Tablica 2:

Obszar krytyczny dla hipotez dotyczacych E(X)

Hipoteza H 1 Obszar krytyczny Obszar krytyczny

gdy znamy σ(X) gdy nie znamy σ(X)

E(X) ≠ X 0

| z | > z 1−

α

2

| t | > t 1−

α

2

E(X) > X 0 z > z 1−α t > t 1−α

E(X) < X 0 z < z α t < t α

Sposób okre±lenia obszaru krytycznego dla poszczególnych hipotez alternatywnych podany

jest w tabeli (2).

z α oraz t α to odpowiednio fraktyle standardowego rozkªadu normalnego N(0,1) i rozkªadu

Studenta o (n-1) stopniach swobody. Oba te rozkªady sa symetryczne wzgledem zera a

wiec mo»na wykorzysta¢ nastepujaca symetrie kwantyli:

z α = −z 1−α

t α = −t 1−α

UWAGA:

1. Rozwa»ania tego rozdziaªu odnosz¡ si¦ do zmiennych o rozkªadzie normalnym ale

warto zauwa»y¢, »e przy du»ych próbach mog¡ by¢ stosowane tak»e do innych rozkªadów.

Przyczyn¡ tego jest fakt, »e statystyki testowe s¡ funkcjami ±rednich arytmetycznych

z próby. Dzi¦ki centralnemu twierdzeniu granicznemu ±rednia

arytmetyczna ma rozkªad zbie»ny do rozkªadu normalnego nawet dla oryginalnego

rozkªadu rz¡dz¡cego prób¡ silnie ró»ni¡cego si¦ od rozkªadu

normalnego. Na przykªad wida¢ to bardzo dobrze dla zmiennych o rozkªadzie

wykªadniczym, który jest ewidentnie niesymetryczny, prawosko±ny.

2. Testy rozwa»ane w tym i nast¦pnym rozdziale bior¡ pod uwag¦ jedynie poziom

istotno±ci a wi¦c tylko mo»liwo±¢ popeªnienia bª¦du pierwszego rodzaju (odrzucenia

prawdziwej H 0 ). Nie rozwa»aj¡ w ogóle mocy testu, tj. prawdopodobie«stwa

odrzucenia faªszywej H 0 . Takie testy nazywane s¡ testami istotno±ci.

SMOP-2 B.Kamys: 2007/08 75

11.3.2 WARTO‘CI OCZEKIWANE DWU POPULACJI (H 0 : E(X) = E(Y ))

Tutaj trzeba odró»ni¢ trzy sytuacje:

1.) σ(X) i σ(Y ) znane,

2.) σ(X) i σ(Y ) nieznane ale σ(X) = σ(Y ),

3.) σ(X) i σ(Y ) nieznane oraz σ(X) ≠ σ(Y ),

ad 1.) Jako statystyke testowa bierze sie zmienna z:

z =

X − Y

√

σ 2 (X)

n x

+ σ2 (Y )

n y

Zmienna ta ma rozkªad standardowy normalny N(0,1).

ad 2.) Po stwierdzeniu (przy pomocy testu Fishera-Snedecora), »e wariancje zmiennej

X i zmiennej Y mo»na uzna¢ za równe, stosujemy test Studenta ze zmienna t

zdeniowana nastepujaco:

t =

S(X, Y ) =

X − Y

√

n x+n y

n x·n y

S(X, Y ) ·

√ (n x − 1) ∗ S 2 (X) + (n y − 1) ∗ S 2 (Y )

n x + n y − 2

Zmienna t ma rozkªad Studenta o (n x + n y − 2) stopniach swobody.

ad 3.) Je»eli test F pokazaª, »e wariancje zmiennych X i Y sa istotnie ró»ne to jako

statystyke testowa u»ywa sie zmodykowanej zmiennej t:

SMOP-2 B.Kamys: 2007/08 76

t =

X − Y

√

S 2 (X)

n x

+ S2 (Y )

n y

Zmienna t ma rozkªad, który mo»na przybli»y¢ rozkªadem Studenta o efektywnej

liczbie stopni swobody n ef :

n ef =

( S2 (X)

n x

+ S2 (Y )

n y

) 2

(S 2 (X)/n x) 2

n x+1

+ (S2 (Y )/n y) 2

n y+1

− 2

Poniewa» efektywna liczba stopni swobody n ef zwykle nie jest liczba caªkowita to

szukajac w tablicach musimy zaokragla¢ ja do liczby caªkowitej (bezpieczniej zaokragla¢

w dóª - wtedy efektywnie zwiekszamy nieco poziom istotno±ci).

W tabeli przytoczonej poni»ej zdeniowane sa obszary krytyczne dla tych trzech przypadków

przy zastosowaniu dwu ró»nych hipotez alternatywnych H 1 .

Hipoteza H 1 Obszar krytyczny Obszar krytyczny Obszar krytyczny

σ(X) i σ(Y ) σ(X) = σ(Y ) σ(X) ≠ σ(Y )

znane nieznane nieznane

E(X) ≠ E(Y )

| z | > z 1−

α

2

| t | > t nx+n y−2(1 − α 2 ) | t | > t n ef

(1 − α 2 )

E(X) > E(Y ) z > z 1−α t > t nx+n y−2(1 − α) t > t nef (1 − α)

Oczywi±cie statystyki testowe z i t to statystyki zdeniowane powy»ej a fraktyle nale»y

bra¢ odpowiednio dla rozkªadu standardowego normalnego N(0,1) oraz rozkªadów

Studenta o odpowiedniej liczbie stopni swobody.

SMOP-2 B.Kamys: 2007/08 77

11.4 HIPOTEZY DOTYCZA CE WARIANCJI

Najwa»niejsze to hipotezy porównujace wariancje zmiennej X z liczba oraz hipoteza porównujaca

wariancje dwu populacji. Zakªadamy, podobnie jak w przypadku hipotez odnoszacych

sie do warto±ci oczekiwanych, »e zmienne losowe pochodza z populacji normalnych.

11.4.1 PORÓWNANIE WARIANCJI X Z LICZBA (H 0 : σ 2 (X) = σ 2 0 )

Dla testowania takiej hipotezy u»ywa sie statystyki testowej Q 2 zdeniowanej nastepujaco:

Q 2 = (n − 1) · S2 (X)

σ 2 0

Przy prawdziwo±ci H 0 ta statystyka ma rozkªad χ 2 n−1

, gdzie n to liczba pomiarów w

próbie a S 2 (X) to estymator wariancji.

Obszary krytyczne dla ró»nych hipotez alternatywnych sa wymienione w tabeli poni»ej:

Hipoteza H 1

Obszar krytyczny

σ 2 (X) ≠ σ 2 0

Q 2 < χ 2 α

2

lub Q 2 > χ 2 1− α 2

σ 2 (X) > σ 2 0

Q 2 > χ 2 1−α

σ 2 (X) < σ 2 0

Q 2 < χ 2 α

11.4.2 PORÓWNANIE WARIANCJI DWU POPULACJI

Hipoteza zerowa H 0 : σ 2 (X) = σ 2 (Y )

Dla testowania tej hipotezy u»ywa sie testu F Fishera-Snedecora. Zarówno zmienna

jak i rozkªad prawdopodobie«stwa oznacza sie litera F z dwoma wska¹nikami n 1 , n 2 :

F(n 1 , n 2 ). Zmienna F(n 1 , n 2 ) to stosunek dwu zmiennych o rozkªadach chikwadrat

podzielonych przez ich liczby stopni swobody , przy czym zmienna w liczniku

ma n 1 a zmienna w mianowniku n 2 stopni swobody:

SMOP-2 B.Kamys: 2007/08 78

F (n 1 , n 2 ) ≡ ( χ2 n 1

n 1

)

( χ2 n 2

n 2

)

Zmienna ta przyjmuje, jako stosunek dwu nieujemnych liczb, tylko warto±ci nieujemne

a ksztaªt jej rozkªadu jest podobny do ksztaªtu rozkªadu χ 2 .

Jako statystyke testowa F bierze sie iloraz estymatora S 2 (X) i estymatora S 2 (Y):

F ≡ S2 (X)

S 2 (Y )

Šatwo pokaza¢, »e statystyka F ma rozkªad F(n x − 1, n y − 1):

Wiemy z rozwa»a« dotyczacych porównania wariancji z liczba, »e zmienna Q 2 obliczona

dla próby skªadajacej sie z n elementów ma rozkªad χ 2 . n−1

Po podzieleniu jej przez

liczbe stopni swobody (n − 1) otrzymujemy iloraz S2

. Je»eli prawdziwa jest hipoteza zerowa

gªoszaca, »e wariancje licznika i mianownika sa równe, 2 to stosunek statystyk S 2 (X)

σ

(licznika) i S 2 Q

(Y ) (mianownika) jest równy stosunkowi

2 (X)

i Q2 (Y )

n x−1 n y−1

czyli równy jest

zmiennej F (n x − 1, n y − 1).

Jako hipoteze alternatywna kªadzie sie brak równo±ci obu wariancji lub to, »e wariancja

licznika jest wieksza od wariancji mianownika:

Hipoteza H 1

σ 2 (X) ≠ σ 2 (Y )

Obszar krytyczny

F < F α

2 (n x − 1, n y − 1) lub F > F 1−

α

2 (n x − 1, n y − 1)

σ 2 (X) > σ 2 (Y ) F > F 1−α (n x − 1, n y − 1)

Je»eli w tablicach podane sa tylko kwantyle rozkªadu F na du»ym poziomie lub tylko

na maªym poziomie, to korzysta sie z oczywistej równo±ci:

F α/2 (n 1 , n 2 ) = 1/F 1−α/2 (n 2 , n 1 )

SMOP-2 B.Kamys: 2007/08 79

11.5 TEST NORMALNO‘CI ROZKŠADU

Wiekszo±¢ metod statystyki jest dobrze opracowana matematycznie dla zmiennych o rozkªadzie

normalnym natomiast nie jest oczywiste, »e dadza sie zastosowa¢ bez modykacji

dla zmiennych o innych rozkªadach. Z tej przyczyny przed rozpoczeciem bardziej zaawansowanych

rozwa»a« statystycznych nale»y sie upewni¢, »e badana zmienna podlega

rozkªadowi normalnemu. Sprawdzana hipoteza zerowa polega na stwierdzeniu, »e rozkªad

badanej zmiennej jest rozkªadem normalnym. W zale»no±ci od testu zakªada sie znajomo±¢

parametrów rozkªadu jak np. w te±cie lambda Koªmogorowa lub te» nie jest to

niezbedne jak np. w badaniu wykresu normalnego.

11.5.1 TEST ZEROWANIA SI† WSPÓŠCZYNNIKA ASYMETRII I KUR-

TOZY

Test ten polega na sprawdzeniu, czy speªnione sa warunki konieczne do tego aby rozkªad

badanej zmiennej mógª by¢ rozkªadem normalnym. Wiadomo, »e dla rozkªadu normalnego

wspóªczynnik asymetrii i kurtoza (wspóªczynnik przewy»szenia) znikaja niezale»nie od

tego jaka jest warto±¢ oczekiwana i wariancja rozkªadu. A wiec

• Hipoteza zerowa, H 0 :

(γ 1 = 0) ∧ (γ 2 = 0)

• Statystyka testowa:

Q 1 =

Q 2 =

√ n · g1

√

6

√ n · g2

√

24

gdzie g 1 i g 2 to estymatory wspóªczynnika asymetrii γ 1 i kurtozy γ 2 :

γ 1 ≡ E ((x − E(x))3 )

σ 3 (x)

opisane poni»szymi wzorami:

γ 2 ≡ E ((x − E(x))4 )

σ 4 (x)

− 3

g 1 = M 3

√

M

3

2

, g 2 = M 4

M 2 2

− 3

SMOP-2 B.Kamys: 2007/08 80

UWAGA:

Wielko±ci M 2 , M 3 i M 4 to nie sa momenty liczone wzgledem poczatku ukªadu

lecz estymatory momentów centralnych odpowiednio drugiego, trzeciego i czwartego

rzedu:

M 2 ≡ 1 n

M 3 ≡ 1 n

M 4 ≡ 1 n

n∑

i=1

n∑

i=1

n∑

i=1

(x i − ¯x) 2

(x i − ¯x) 3

(x i − ¯x) 4

Je»eli hipoteza zerowa jest prawdziwa oraz próba jest bardzo du»a to statystyki

g 1 i g 2 maja rozkªady normalne o warto±ciach oczekiwanych

i odchyleniach standardowych:

E(g 1 ) ≈ 0 E(g 2 ) ≈ 0

σ(g 1 ) ≈

√

6

n

σ(g 2 ) ≈

√

24

Wtedy estymatory Q 1 i Q 2 maja standardowe rozkªady normalne N(0,1).

n

• Hipoteza alternatywna to zaprzeczenie H 0 :

prawdziwe warto±ci γ 1 lub γ 2 nie sa równe 0.

• Obszar krytyczny dwustronny. Brzegi okre±lone przez kwantyl rozkªadu N(0,1):

| Q 1 |> z 1−

α

2

⋃

| Q2 |> z 1−

α

2

Je»eli rozmiary próby nie sa bardzo du»e to rozkªad statystyk Q 1 i Q 2 nie przyjmuje

swej asymptotycznej postaci; N(0,1) ale warto±ci oczekiwane i wariancje tych zmiennych

sa bliskie odpowiednio zeru i jedno±ci. Mo»na to wykorzysta¢ do stworzenia obszaru

krytycznego w oparciu o nierówno±¢ Czebyszewa . Jako obszar krytyczny przyjmuje sie

⋃

warto±ci ( | Q 1 |> 3 | Q2 |> 3 ) tj. poziom istotno±ci równy α = 1/9.

Nale»y zwróci¢ uwage na fakt, »e powy»szy test pozwala zwykle w uzasadniony sposób

odrzuci¢ hipoteze zerowa (gdy Q 1 lub Q 2 traa do obszaru krytycznego) natomiast fakt,

»e warto±ci tych statystyk nie sa sprzeczne z hipoteza zerowa nie wyklucza mo»liwo±ci, »e

mamy do czynienia z rozkªadem ró»nym od normalnego.

SMOP-2 B.Kamys: 2007/08 81

11.5.2 TEST ZGODNO‘CI λ - KOŠMOGOROWA

Ten test stosowany jest do porównania rozkªadu prawdopodobie«stwa z próby ze znanym

(teoretycznym) rozkªadem. Tu wykorzystujemy go do testowania normalno±ci rozkªadu

ale mo»na go stosowa¢ do dowolnych teoretycznych rozkªadów ciagªej zmiennej

losowej. Parametry rozkªadu powinny by¢ okre±lone w hipotezie zerowej.

Pomiary z próby x 1 , x 2 , x 3 , ...x n porzadkujemy wg wzrastajacej warto±ci otrzymujac

nastepujacy ciag:

x ∗ 1 ≤ x∗ 2 ≤ x∗ 3 ≤ ... x∗ n

Zmienna losowa X ∗ , taka, »e jej realizacja m x∗ m

zajmuje w ciagu m − te miejsce nazywamy

statystyka pozycyjna rzedu m w próbie n-elementowej.

Tworzymy empiryczna dystrybuante F n (x) obserwowanej w próbie zmiennej losowej X:

⎧

⎪⎨

F n (x) =

⎪⎩

0 gdy x ≤ x ∗ 1

m

n

gdy x ∗ m < x ≤ x∗ m+1 , 1 ≤ m ≤ n − 1

1 gdy x > x ∗ n

Empiryczna dystrybuanta jest zwykªa funkcja argumentu x ale jest równocze±nie statystyka

bo jest deniowana przez wszystkie wielko±ci x ∗ 1 , ..., x∗ n z próby.

Mo»na pokaza¢, »e warto±¢ oczekiwana empirycznej dystrybuanty jest równa oszacowywanej

wielko±ci teoretycznej dystrybuanty

E(F n (x)) = F (x)

a jej wariancja da»y do zera gdy rozmiary próby da»a do niesko«czono±ci

σ 2 (F n (x)) = 1 n

· F (x) · (1 − F (x)) → 0.

Stad F n (x) jest nieobcia»onym i zgodnym estymatorem F(x).

• Hipoteza zerowa

Dystrybuanta obserwowanej zmiennej losowej jest dystrybuanta rozkªadu normal-

SMOP-2 B.Kamys: 2007/08 82

nego o parametrach E(x) = x 0 , σ(x) = σ:

E(F n(x)) =

∫ x

−∞

dx ·

1

√

2πσ · exp(− (x − x 0) 2

2σ 2 )

• Statystyka testowa:

w oryginalnej wersji - zaproponowanej przez Koªmogorowa:

D n = sup

x

| F n (x) − F (x) |

Smirnow zaproponowaª dwie inne denicje statystyki testowej (stad czesto u»ywana

nazwa test Koªmogorowa-Smirnowa ):

D + n

D − n

= sup (F n (x) − F (x))

x

= − inf x (F n(x) − F (x))

Dla praktycznych rachunków wykorzystuje sie nieco inne wzory, które wymagaja

znajomo±ci teoretycznej dystrybuanty tylko dla zmierzonych warto±ci zmiennej

X:

D + n

= max

1≤m≤n ( m n − F (x∗ m ) )

D − n

= max 1≤m≤n (x∗ m ) − m − 1

n

D n = max( D + n , D− n )

)

a dystrybuante F (x ∗ m

) zastepuje sie dystrybuanta G(z) stablicowanego standardowego

rozkªadu normalnego N(0,1): F (x ∗ m )=G(z ≡ (x∗ m − E(x))/σ(x)).

• Obszar krytyczny: prawostronny (du»e warto±ci D n , tzn. D n > D n (1 − α))

Granice obszaru krytycznego, tj. kwantyl D n (1 − α) mo»na dla n ≥ 10 oraz

dla poziomu istotno±ci α ≥ 0, 01 wyliczy¢ z przybli»onego wzoru (dokªadno±¢ nie

gorsza ni» 3 cyfry znaczace)

D n (1 − α) ≈

√

1

2n · (y − 2y2 − 4y − 1

) − 1

18n 6n

y ≡ − ln(0, 5 · α)

SMOP-2 B.Kamys: 2007/08 83

Po wyliczeniu z próby warto±ci statystyki D n porównujemy ja z kwantylem D n (1 − α)

znalezionym z tablic lub wyliczonym z podanego wzoru (W praktyce mo»emy wylicza¢ ten

kwantyl wg wzoru poniewa» zarówno typowe poziomy istotno±ci α ≥ 0, 01 jak i liczebno±¢

próby n ≥ 10 odpowiadaja warunkom stosowania tego wzoru.)

Gdy D n > D n (1 − α) odrzucamy hipoteze zerowa, tzn. stwierdzamy, »e dane do±wiadczalne

wykluczaja to aby rozkªad prawdopodobie«stwa populacji byª rozkªadem normalnym

z parametrami E(x) = x 0 i σ(x) = σ, przy czym nasz wniosek mo»e by¢ bªedny

z prawdopodobie«stwem α.

UWAGA:

1. Statystyka D n powinna by¢ liczona ze szczegóªowego szeregu statystycznego ( tj. z

indywidualnych pomiarów ) a nie mo»e by¢ liczona z szeregu rozdzielczego (danych

pogrupowanych)!!

2. Statystyka λ ≡ √ n · D n testu Koªmogorowa - Smirnowa ma dla n da»acego do

niesko«czono±ci dystrybuant¦ niezale»n¡ od postaci porównywanych rozkªadów:

∞∑

K(λ) = (−1) k exp[−2k 2 λ 2 ]

k=−∞

Stad mo»na znale¹¢ kwantyle tego rozkªadu. Przytoczymy tylko trzy najcze±ciej

stosowane: λ 0,95 = 1, 36, λ 0,99 = 1, 63 i λ 0,999 = 1, 95. Dla n > 150 mo»na

u»ywa¢ tych asymptotycznych kwantyli.

To jest wielka zaleta testu ale jest równie» pewna sªabo±cia bo przez to jest stosunkowo

maªo czuªy na posta¢ ogonów rozkªadu.

3. Dla poprawnego stosowania testu Koªmogorowa - Smirnowa niezbedna jest znajomo±¢

warto±ci parametrów teoretycznego rozkªadu. Je»eli nie znamy tych parametrów

- musimy je wcze±niej oszacowa¢, np. przy pomocy metody najwiekszej

wiarygodno±ci. Istnieja programy, które dokonuja automatycznie takiego oszacowania

(np. w pakiecie STATISTICA ta wersja testu nazywa sie

testem Koªmogorowa -Smirnowa z poprawka Lillieforsa .

11.5.3 TEST ZGODNO‘CI χ 2 - PEARSONA

Podobnie jak test λ Koªmogorowa tak i ten test stosowany jest do porównania rozkªadu

prawdopodobie«stwa z próby ze znanym (teoretycznym) rozkªadem. Tu wykorzystujemy

SMOP-2 B.Kamys: 2007/08 84

go do testowania normalno±ci rozkªadu ale mo»na go stosowa¢ do dowolnych teoretycznych

rozkªadów ciagªej lub dyskretnej zmiennej losowej ale

pomiary musza by¢ pogrupowane (szereg rozdzielczy) - wprost przeciwnie ni» w przypadku

testu Koªmogorowa.

• Hipoteza zerowa

Dystrybuanta obserwowanej zmiennej losowej jest dystrybuanta rozkªadu normalnego:

∫ x 1

E(F n(x)) = dx · √ · exp(− (x − x 0) 2

)

−∞ 2πσ 2σ 2

• Statystyka testowa:

k∑ (n

X 2 i − n · π i ) 2

=

nπ i

i=1

gdzie

k to liczba przedziaªów w szeregu rozdzielczym (przynajmniej kilka),

n i to liczebno±¢ i − tego przedziaªu (n i ≥ 5),

π i to prawdopodobie«stwo zaobserwowania pomiarów w przedziale i − tym

je»eli prawdziwa jest hipoteza zerowa,

n to liczba wszystkich pomiarów.

Dowodzi sie, »e asymptotycznie (tzn. dla n → ∞) statystyka X 2 ma rozkªad

χ 2 k−r−1

, gdzie r jest liczba nieznanych parametrów teoretycznego rozkªadu (dla

rozkªadu normalnego r = 2) oszacowywanych wstepnie z próby metoda najwiekszej

wiarygodno±ci.

• Obszar krytyczny to du»e warto±ci X 2 (X 2 > χ 2 k−r−1

(1 − α)), gdzie w naszym

przypadku testowania normalno±ci rozkªadu χ 2 k−r−1

(1 − α) jest kwantylem rzedu

1 − α rozkªadu χ 2 k−1

(gdy znamy E(x) i σ(x) rozkªadu normalnego) lub rozkªadu

(gdy musimy oszacowa¢ przed testowaniem normalno±ci E(x) i σ(x) ).

χ 2 k−3

Test χ 2 równie» nie wymaga skomplikowanych oblicze« i dlatego mo»e by¢ przeprowadzony

bez u»ycia komputera ale kwantyle tego rozkªadu nie dadza sie policzy¢ tak prosto

jak dla testu Koªmogorowa. Musimy korzysta¢ z tablic statystycznych.

SMOP-2 B.Kamys: 2007/08 85

11.5.4 WYKRES NORMALNY

Wykres ten jest szczególnym przypadkiem wykresu kwantyl - kwantyl, na którym przedstawia

sie estymatory kwantyli dla rozkªadu zmiennej z próby w funkcji kwantyli teoretycznego

rozkªadu. Jako kwantyle teoretycznego rozkªadu bierze sie kwantyle standardowego

rozkªadu normalnego. Jako kwantyle do±wiadczalne bierzemy kolejne warto±ci pozycyjnej

statystyki z próby. Je»eli hipoteza zerowa (normalno±¢ rozkªadu mierzonej wielko±ci

X) jest prawdziwa to tak otrzymany wykres powinien by¢ linia prosta. Odstepstwa od

prostoliniowo±ci sa argumentem za odrzuceniem hipotezy zerowej.

• Hipoteza zerowa

Dystrybuanta obserwowanej zmiennej losowej jest dystrybuanta rozkªadu normalnego,

przy czym dla tego testu nie jest wymagana znajomo±¢ parametrów rozkªadu.

• Statystyka testowa

Jako statystyke testowa mo»na wzia¢ estymator wspólczynnika korelacji r pomiedzy

do±wiadczalnymi i teoretycznymi kwantylami.

Postepujemy nastepujaco:

1. Porzadkujemy pomiary {x k } tak aby utworzyªy ciag rosnacy {x ∗ k

} czyli statystyke

pozycyjna. Statystyke pozycyjna rzedu k z n - elementowej próby

traktujemy jako estymator kwantyla na poziomie k/(n + 1).

2. Szukamy z k , tj. teoretycznego kwantyla standardowego rozkªadu normalnego

na poziomie k/(n + 1) wykorzystujac relacje:

F (z k ) =

k

( ) k

n + 1 ⇒ z k = F −1 n + 1

gdzie przez F −1 (x) nale»y rozumie¢ funkcje odwrotna do dystrybuanty F (y).

3. Rysujemy pary {z k , x ∗ k

}. Gdy wykres wyra¹nie ró»ni sie od linii prostej to

odrzucamy H 0 , w przeciwnym wypadku liczymy estymator wspóªczynnika korelacji

r(z k , x ∗ k

) i przeprowadzamy bardziej ilo±ciowe rozwa»ania.

• Obszar krytyczny to maªe warto±ci estymatora r wspóªczynnika korelacji ϱ(z k , x ∗ k ),

tj. mniejsze od odpowiednich warto±ci krytycznych r n (α) zale»nych od poziomu

istotno±ci α (test lewostronny). Warto±ci te mo»na znale¹¢ w tablicach lub zastosowa¢

przybli»one wzory podane poni»ej:

r n (α = 0.01) ≈ 1 − 0.5669

n , r n(α = 0.05) ≈ 1 − 0.3867

2/3 n 2/3

SMOP-2 B.Kamys: 2007/08 86

Wzory te daja krytyczne warto±ci wspóªczynnika korelacji r n (α) dla dwu

poziomów istotno±ci α z dokªadno±cia nie gorsza ni» 1% je»eli rozmiar próby n le»y

w przedziale 5 < n < 1000. (Tablice krytycznych warto±ci estymatora r mo»na

znale¹¢ w bardzo bogatym i napisanym w przystepny sposób dla u»ytkowników

stosujacych statystyke w praktyce poradniku statystycznym dostepnym w sieci

internetowej pod adresem: http://www.itl.nist.gov/div898/handbook/ ).

UWAGA:

Je»eli linia prosta jest dobrym przybli»eniem, to wspóªczynnik kierunkowy prostej

{z k , x ∗ k

} równy jest parametrowi skali (tj. odchyleniu standardowemu) a wspóªrzedna

przeciecia prostej z osia x ∗ k

równa jest wspóªczynnikowi tendencji centralnej (warto±ci

oczekiwanej X). W ten sposób mo»na oszacowa¢ parametry rozkªadu normalnego, rzadzacego

warto±ciami zmiennej z próby.

SMOP-2 B.Kamys: 2007/08 87

11.6 TESTY NIEPARAMETRYCZNE

HIPOTEZ PORÓWNUJA CYCH POPULACJE

Do tej pory rozwa»ali±my testy sprawdzajace hipotezy gªoszace równo±¢ warto±ci oczekiwanych

dwu zmiennych a tak»e równo±¢ wariancji dwu zmiennych. Testy te dotyczyªy

jedynie zmiennych o rozkªadach normalnych. Teraz omówimy testy odnoszace sie do hipotez

gªoszacych identyczno±¢ dystrybuant dwu populacji; H 0 : F (X) = G(X)

niezale»nie od postaci rozkªadu . Dystrybuanty oznaczono ró»nymi literami aby podkre±li¢,

»e odnosza sie do dwu ró»nych populacji ale badamy te sama zmienna losowa

X dla obu populacji biorac próbe liczebno±ci n 1 z pierwszej populacji i liczebno±ci n 2 z

drugiej populacji.

11.6.1 TEST SMIRNOWA

• Hipoteza zerowa H 0 : F (X) ≡ G(X) gdzie zmienna X jest zmienna ciagªa.

F (X) i G(X) sa odpowiednio dystrybuantami zmiennej X dla pierwszej i drugiej

populacji.

Inne sformuªowanie to H 0 : E(F n1 (X)) = E(G n2 (X)), gdzie F n1 (X) i G n2 (X)

to empiryczne dystrybuanty otrzymane na podstawie dwu prób o liczebno±ci n 1

i n 2 wzietych odpowiednio z pierwszej i drugiej populacji (zdeniowane tak jak dla

rozkªadu Koªmogorowa).

• Hipoteza alternatywna H 1 : zaprzeczenie H 0

• Statystyka testowa D n1 ,n 2

:

D n1 ,n 2

= sup

x

| F n1 (x) − G n2 (x) |

Nale»y zauwa»y¢, »e obie dystrybuanty sa od tej samej warto±ci argumentu.

Poniewa» speªniona jest relacja:

D n1 ,n 2

= D n2 ,n 1

wiec bez ograniczenia ogólno±ci wniosków mo»na rozwa»a¢ tylko

D n1 ,n 2

SMOP-2 B.Kamys: 2007/08 88

zakªadajac, »e

n 1 ≤ n 2 .

W praktycznych rachunkach u»ywa sie nastepujacych wzorów na D n1 ,n 2

, gdzie

obliczenia wykonuje sie tylko dla warto±ci argumentów zaobserwowanych w obu

próbach i dla rozró»nienia prób stosuje sie symbole x ∗ 1 ...x∗ n 1

i y ∗ 1 ....y∗ n 2

na statystyki

pozycyjne odpowiednio z pierwszej i drugiej próby:

D + n 1 ,n 2

D − n 1 ,n 2

(

= max i

1≤i≤n n 1

− G n2 (x ∗ i ))

1

(

= max Gn2 (x ∗

1≤i≤n

i ) − )

i−1

n 1 1

D n1 ,n 2

= max ( D + n 1 ,n 2

, D − n 1 ,n 2

)

lub te»

(

D + n 1 ,n 2

= max Fn1 (y ∗

1≤j≤n

j ) − )

j−1

n 2 2

(

D − n 1 ,n 2

= max j

1≤j≤n n 2

− F n1 (y ∗ j ))

2

D n1 ,n 2

= max ( D + n 1 ,n 2

, D − n 1 ,n 2

)

TWIERDZENIE (Smirnow):

Gdy H 0 jest prawdziwa oraz liczby pomiarów n 1 i n 2 da»a do niesko«czono±ci to

rozkªad zmiennej

√

n1 · n 2

D n1 ,n 2

·

n 1 + n 2

d¡»y do rozkªadu λ (Koªmogorowa).

♦

Je»eli obie próby sa odpowiednio du»e (n i > 150) to mo»na ju» z rozsadnym

przybli»eniem stosowa¢ asymptotyczne wzory, tj.

√

n1 + n 2

D n1 ,n 2

(1 − α) ≈

· y 1−α

n 1 · n 2

SMOP-2 B.Kamys: 2007/08 89

gdzie y 1−α jest kwantylem rozkªadu lambda Koªmogorowa, którego dystrybuanta

i kwantyle na poziomie 0.95, 0.99 i 0.999 przytoczone s¡ w uwagach ko«cz¡cych

rozdziaª dotycz¡cy testowania normalno±ci rozkªadu testem Koªmogorowa.

Gdy n 1 i n 2 sa maªe, trzeba stosowa¢ dokªadny rozkªad statystyki D n1 ,n 2

znaleziony

przez Masseya (F.J.Massey, AMS 23 (1952) 435-441).

• Obszar krytyczny: prawostronny (du»e warto±ci statystyki testowej)

SMOP-2 B.Kamys: 2007/08 90

11.6.2 TEST ZNAKÓW

Test znaków sªu»y do sprawdzenia hipotezy zerowej gªoszacej, »e dystrybuanty dwu

ciagªych zmiennych losowych X i Y sa identyczne:

• Hipoteza zerowa H 0 : G(X) = F (Y ).

Przy prawdziwo±ci H 0 prawdopodobie«stwo P (X > Y ) tego, »e zajdzie zdarzenie

losowe X > Y , jest równe prawdopodobie«stwu P (X < Y ) tego, »e X < Y .

Ze wzgledu na zaªo»enie ciagªo±ci zmiennych prawdopodobie«stwo równo±ci X i Y

jest równe zero; P (X = Y ) = 0 a poniewa» te trzy zdarzenia sa rozªaczne i

wyczerpuja wszystkie mo»liwo±ci wiec ostatecznie:

P (X < Y ) = P (X > Y ) = 1/2

• Hipoteza alternatywna H 1 : G(X) ≠ F (Y ).

• Statystyka testowa to liczba k takich par, »e x i > y i w±ród n niezale»nych par

(x i , y i ). Rozkªad prawdopodobie«stwa tej statystyki przy prawdziwo±ci H 0 to rozkªad

Bernoulliego z parametrem p = 1/2 :

P (k) = ( n k ) · 1

2 k ·

1

2 = (n−k) (n k ) · 1

2 n

• Obszar krytyczny to bardzo maªa (k ≈ 0) i bardzo du»a (k ≈ n) liczba par (x i , y i ),

takich »e x i > y i (obszar dwustronny). Je»eli mamy wskazówki, »e prawdopodobie«stwo

pojawienia sie warto±ci X wiekszych od Y jest wieksze ni» 1/2 to nale»y

przyja¢ prawostronny obszar krytyczny (k > k p ) a gdy prawdopodobie«stwo X

wiekszych od Y jest mniejsze od 1/2 to lewostronny obszar krytyczny (k < k l ).

Brzeg prawostronnego obszaru krytycznego k p szukamy z warunku:

n∑

P (k ≥ k p ) = 2 −n · ( n i ) = α

i=k p

SMOP-2 B.Kamys: 2007/08 91

Brzeg lewostronnego obszaru krytycznego k l szukamy z warunku:

P (k ≤ k l ) = 2 −n ∑

· ( n i ) = α

k l

i=0

a brzegi dwustronnego obszaru krytycznego z obu powy»szych wzorów, w których

zastapi sie α przez α/2.

UWAGA:

1. Tu zakªadali±my milczaco, »e nie beda sie pojawiaªy pary (x i = y i ) poniewa»

obie zmienne sa ciagªe a wiec prawdopodobie«stwo takich par wynosi zero. W

praktyce obliczenia wykonywane sa zawsze ze sko«czona dokªadno±cia a to powoduje

pojawianie sie powy»szych par. Je»eli ich liczba jest niewielka w porównaniu do

liczby wszystkich par to mo»na je po prostu pomina¢. W przeciwnym wypadku

stosuje sie losowanie , które (z prawdopodobie«stwem 0,5 ) okre±la czy dana pare

zaliczy¢ do par, w których x i > y i czy odwrotnie.

2. Cz¦sto wygodnie jest obliczy¢ sum¦ prawdopodobie«stw poczynaj¡c od 0 (lub od

n, t.j. caªkowitej liczby par - zale»nie od tego czy k jest mniejsze czy wi¦ksze od

n/2) do obserwowanej warto±ci liczby par k. Tak¡ sum¦ nazywa si¦ granicznym

poziomem istotno±ci (w j¦zyku angielskim p-value) dla testu jednostronnego.

W przypadku testu dwustronnego liczy si¦ obie sumy i graniczny poziom istotno±ci

to podwojona warto±¢ mniejszej sumy. Je»eli p-value jest mniejsze od poziomu

istotno±ci α to statystyka testowa traa do obszaru krytycznego.

11.6.3 TEST SERII WALDA - WOLFOWITZA

Seria nazywamy ka»dy podciag ciagu zªo»onego z elementów A i B majacy te wªasno±¢,

»e nale»a do niego elementy tego samego typu (A lub B).

Liczba serii n s speªnia warunek:

2 ≤ n s ≤ 2 · min(n A , n B ) + 1 − δ nA ,n B

SMOP-2 B.Kamys: 2007/08 92

gdzie n A i n B to odpowiednio liczby elementów typu A i typu B w caªym ciagu.

Test serii Walda-Wolfowitza sªu»y do sprawdzania hipotezy gªoszacej, »e dystrybuanty

dwu zmiennych ciagªych X i Y sa identyczne:

• Hipoteza zerowa H 0 : F 1 (X) = F 2 (Y )

• Hipoteza alternatywna H 1 : F 1 (X) ≠ F 2 (Y )

(dla x=y)

• Statystyka testowa n s (liczba serii).

Mamy próbe skªadajaca sie z n A warto±ci zmiennej X oraz z n B warto±ci zmiennej

Y . Zapisujemy te n A + n B warto±ci w jeden niemalejacy ciag i sprawdzamy ile

jest serii typu A (tzn. skªadajacych sie z elementów X) i ile jest serii typu B (tzn.

skªadajacych sie z elementów Y ). Je»eli zdarzy sie, »e dwie warto±ci sa identyczne

to musimy losowa¢ (z prawdopodobie«stwem 0,5), która z nich ma by¢ pierwsza w

ciagu.

• Obszar krytyczny - lewostronny: n s ≤ n s (α)

Gdy hipoteza zerowa jest sªuszna to mo»emy sie spodziewa¢, »e warto±ci X sa

przemieszane z warto±ciami Y a wiec liczba serii bedzie du»a. Je»eli dystrybuanty

zmiennych X i Y sa ró»ne to spodziewamy sie, »e systematycznie jedna z tych

zmiennych bedzie wieksza od drugiej (przynajmniej na pewnym odcinku warto±ci)

a wiec liczba serii bedzie maªa. Stad maªa liczba serii w próbie bedzie ±wiadczy¢

przeciw hipotezie zerowej.

Rozkªad liczby serii n s jest znany przy prawdziwo±ci H 0 i wyra»a sie analitycznym

wzorem:

⎧

⎪⎩

⎛

2⎜

⎝

⎞⎛

⎞

n A − 1

n B − 1

⎟⎜

⎟

⎠⎝

⎠

n s

n

2

− 1

s

2

− 1

⎛

⎞

n A + n B

⎜

⎟

⎝

⎠

⎪⎨

n A

p(n s ) = ⎛ ⎞⎛

⎞ ⎛ ⎞⎛

⎞

n A − 1

n B − 1

n ⎜ ⎟⎜

⎟

⎝

n s

2

− 1 ⎠⎝

n s

2 2

− 3 ⎠ + A − 1

n B − 1

⎜ ⎟⎜

⎟

⎝

n s

2

− 3 ⎠⎝

n s

2 2

− 1 ⎠

2

⎛

⎞

n A + n B

⎜

⎟

⎝

⎠

n A

dla n s parzystego

a wiec mo»na znale¹¢ (numerycznie) warto±ci krytyczne statystyki testowej.

dla n s nieparzystego

SMOP-2 B.Kamys: 2007/08 93

UWAGA:

Warto zauwa»y¢, »e w przypadku odrzucenia hipotezy zerowej, tj. zaobserwowania maªej

liczby serii, mo»na próbowa¢ uzyska¢ informacje o relacji pomiedzy warto±ciami oczekiwanymi

E(X) i E(Y ) sprawdzajac czy na poczatku caªego ciagu przewa»aja warto±ci

typu A (tj. warto±ci zmiennej X) czy typu B(warto±ci zmiennej Y ).

Je»eli na poczatku mamy przewage warto±ci typu A a potem typu B to mo»emy uwa»a¢,

»e E(X) < E(Y ). W przypadku odwrotnym spodziewamy sie, »e E(X) > E(Y ).

SMOP-2 B.Kamys: 2007/08 94

11.6.4 TEST SUMY RANG WILCOXONA - MANNA - WHITNEYA

Test ten zostaª opracowany przez F. Wilcoxona dla dwu równie licznych prób a pó¹niej

uogólniony przez H.B. Manna i D.R. Whitneya na dwie próby o dowolnej liczebno±ci.

Mo»na wiec spotka¢ sie z nazwa test Wilcoxona lub test Wilcoxona-Manna-Whitneya.

Przez range obserwacji rozumie sie liczbe naturalna równa numerowi miejsca, który ta

obserwacja zajmuje w uporzadkowanym ciagu niemalejacym obserwacji w próbie (numer

danej statystyki pozycyjnej). Je»eli dwie lub wiecej obserwacji ma te sama warto±¢ to

ich rangi sa równe ±redniej arytmetycznej rang, które posiadaªyby gdyby sie minimalnie

ró»niªy (tzn. ró»niªyby sie tak maªo, »e nie zmieniªyby poªo»enia w ciagu w stosunku do

innych obserwacji).

• Hipoteza zerowa H 0 : F 1 (X) = F 2 (Y )

• Hipoteza alternatywna H 1 : F 1 (X) ≠ F 2 (Y )

Mo»na jednak postawi¢ inne hipotezy alternatywne:

H 1 : P (X > Y ) > 0, 5 lub

H 1 : P (X > Y ) < 0, 5

• Statystyka testowa:

w =

n∑

min

i=1

ranga(i)

n min oznacza liczebno±¢ mniejszej próby a ranga(i) to ranga kolejnej obserwacji

z mniej licznej próby ale w ciagu utworzonym z obserwacji obu prób.

• Obszar krytyczny: Dla prostego zaprzeczenia - obustronny, a dla dwu pozostaªych

hipotez alternatywnych jest odpowiednio prawo- i lewostronny (przy zaªo»eniu, »e

próba mniej liczna jest próba 'X'). Warto±ci krytyczne trzeba bra¢ z odpowiednich

tablic.

SMOP-2 B.Kamys: 2007/08 95

11.6.5 WYKRES KWANTYL-KWANTYL

Kwantylem na poziomie q nazywamy tak¡ warto±¢ x q zmiennej losowej x, »e prawdopodobie«stwo

znalezienie mniejszych warto±ci x od x q wynosi q. Dla zmiennej ci¡gªej

poziom kwantyla q mo»e przybiera¢ wszystkie warto±ci z przedziaªu [0, 1] a dla zmiennej

dyskretnej tylko dyskretne warto±ci. Dotyczy to równie» warto±ci kwantyla, który dla

zmiennej ci¡gªej mo»e przyjmowa¢ dowolne rzeczywiste warto±ci x q z przedziaªu, gdzie

zmienna jest okre±lona a dla zmiennej dyskretnej tylko dyskretne warto±ci x j :

q = xq ∫

q j =

−∞

j ∑

i=1

f(x) dx

p(x i )

Mo»na pokaza¢, rozwa»aj¡c zamian¦ zmiennych w powy»szej caªce deniuj¡cej kwantyl,

»e zamiana zmiennej losowej na inn¡ poprzez monotoniczn¡ tranformacj¦ prowadzi

do identycznej transformacji kwantyla. W zwi¡zku z tym, je»eli zmienna y jest liniow¡

funkcj¡ zmiennej x to kwantyl y q jest tak¡ sam¡ liniow¡ funkcj¡ kwantyla x q . W szczególno±ci

gdy zwi¡zek pomi¦dzy y i x jest to»samo±ci¡ y(x) = x to y q = x q dla ka»dego

poziomu kwantyla. A wi¦c linia, która b¦dzie utworzona przez punkty o wspóªrz¦dnych

(x q , y q ) - dla ró»nych warto±ci q) - powinna by¢ lini¡ prost¡ nachylon¡ pod k¡tem 45 ◦

do osi odci¦tych, przechodz¡c¡ przez pocz¡tek ukªadu wspóªrz¦dnych.

Dla zbadania hipotezy czy dwie zmienne X i Y , reprezentowane przez dwie próby

statystyczne x 1 , x 2 , ...x nx i y 1 , y 2 , ...y ny maj¡ identyczny rozkªad prawdopodobie«stwa

post¦pujemy nast¦puj¡co:

1. Porz¡dkujemy zmierzone warto±ci w ci¡gi niemalej¡ce: x ∗ 1 ≤ x∗ 2 ≤ ... ≤ x∗ n x

oraz

y ∗ 1 ≤ y∗ 2 ≤ ... ≤ y∗ n y

2. Traktujemy statystyk¦ pozycyjn¡ x ∗ i jako estymator kwantyla x q na poziomie

q = i/(n x + 1) a statystyk¦ pozycyjn¡ y ∗ j jako estymator kwantyla y p na poziomie

p = j/(n y + 1).

3. Gdy n x = n y to statystyki pozycyjne x ∗ i k y∗ k

reprezentuj¡ estymatory kwantyli obu

zmiennych na tym samym poziomie a wi¦c wykres kwantyl-kwantyl b¦dzie wykresem

statystyki pozycyjnej y ∗ w funkcji statystyki pozycyjnej k x∗ k

. Gdy jedna z prób jest

mniej liczna, np. n x < n y to interpolujemy warto±ci estymatorów kwantyli z

bardziej licznej próby (tu y ∗ k

) tak aby uzyska¢ identyczne poziomy kwantyli jak dla

mniej licznej próby i rysujemy wykres tylu punktów ile wynosi liczebno±¢ mniejszej

próby.

Interpretacja mo»liwych wyników:

• Je»eli punkty ukªadaj¡ si¦ na linii prostej nachylonej pod k¡tem 45 ◦ do osi odci¦tych

oraz przechodz¡cej przez pocz¡tek ukªadu odniesienia to akceptujemy hipotez¦ zerow¡

gªosz¡c¡, »e oba rozkªady s¡ identyczne.

SMOP-2 B.Kamys: 2007/08 96

• Je»eli punkty ukªadaj¡ si¦ na linii prostej przechodz¡cej przez pocz¡tek ukªadu

wspóªrz¦dnych ale nachylonej pod innym k¡tem ni» 45 ◦ to oznacza, »e zmienna y

ma rozkªad o takim samym ksztaªcie jak zmienna x ale wyra»ony w innych jednostkach

(odchylenie standardowe jednej zmiennej jest inne ni» drugiej oraz warto±¢

oczekiwana te» zwykle jest inna).

• Je»eli wykres kwantyl-kwantyl jest lini¡ prost¡ nachylon¡ pod k¡tem 45 ◦ ale nie

przechodz¡c¡ przez pocz¡tek ukªadu wspóªrz¦dnych to rozkªady prawopodobie«-

stwa maj¡ taki sam ksztaªt i identyczne wariancje ale jedna zmienna ma warto±ci

przesuni¦te wzgl¦dem drugiej zmiennej o staª¡ liczb¦ (warto±ci oczekiwane ró»ni¡

si¦ o t¦ liczb¦).

• Je»eli wykres kwantyl-kwantyl jest lini¡ prost¡ ale nie jest ona nachylona pod k¡tem

45 ◦ oraz nie przechodzi przez pocz¡tek ukªadu wspóªrz¦dnych to rozkªady maj¡ taki

sam ksztaªt ale ró»ne warto±ci oczekiwane i ró»ne wariancje.

• Je»eli wykres nie jest lini¡ prost¡ to zmienne maj¡ rozkªady ró»ni¡ce si¦ ksztaªtem.

Ilo±ciowo mo»emy zdecydowa¢ o tym czy akceptujemy ukªadanie si¦ punktów na linii

prostej badaj¡c warto±¢ wspóªczynnika korelacji tak jak przy wykresie normalnym

(rozdziaª (11.5.4)).

SMOP-2 B.Kamys: 2007/08 97

11.7 HIPOTEZA JEDNORODNO‘CI WARIANCJI

Zajmujemy sie zmiennymi o rozkªadzie normalnym. Sprawdzamy czy wariancje kilku

populacji sa takie same (np. czy dokªadno±¢ kilku ró»nych serii pomiarów jest taka

sama). Ta wªasno±¢ - zwana jednorodno±cia wariancji - mo»e by¢ interesujaca sama

w sobie a dodatkowo jest niezbedna je»eli chcemy bada¢ równo±¢ warto±ci oczekiwanych

kilku populacji przez zastosowanie tzw. analizy wariancji (ANOVA).

11.7.1 TEST BARTLETTA

Badamy k populacji normalnych. Z ka»dej populacji i = 1, .., k bierzemy n i obserwacji

(w sumie n = ∑ n

i=1 n i wyników).

• Hipoteza zerowa H 0 : Wszystkie wariancje sa sobie równe:

σ 2 1 = σ2 2 = ·· = σ2 k

• Hipoteza alternatywna H 1 : Przynajmniej jedna wariancja jest wieksza od pozosta-

ªych:

• Statystyka testowa:

σ 2 j > σ2 1 = · · σ2 j−1 = σ2 j+1 = ·· = σ2 k

⎧

⎪⎨

M =

⎪⎩

− k ∑

i=1

1 + 1

3(k−1)

(

Si

(n i − 1) · ln

2

[ k∑

i=1

S 2 )

1

n i −1 − 1

n−k

⎫

⎪⎬

]

⎪⎭

gdzie S 2 i

jest estymatorem wariancji dla i-tej próby:

S 2 i = 1

n i −1

n i ∑

j=1

(x ji − ¯x i ) 2 oraz S 2 = 1

n−k

k∑

i=1

(n i − 1) · S 2 i .

Bartlett pokazaª, »e zmienna M zdeniowana powy»ej ma rozkªad, który bardzo

szybko da»y do rozkªadu chi-kwadrat o k-1 stopniach swobody. Wystarcza ju»

warunek n i > 3 dla wszystkich prób i.

• Obszar krytyczny: prawostronny.

SMOP-2 B.Kamys: 2007/08 98

11.7.2 TEST COCHRANA

Mo»na go stosowa¢ dla k populacji normalnych je»eli liczebno±¢ wszystkich prób n i ,

i=1,..,k jest identyczna.

• Hipoteza zerowa H 0 : Wszystkie wariancje sa sobie równe:

σ 2 1 = σ2 2 = ·· = σ2 k

• Hipoteza alternatywna H 1 : Przynajmniej jedna wariancja jest wieksza od pozosta-

ªych:

σ 2 j > σ2 2 = · · σ2 j−1 = σ2 j+1 = ·· = σ2 k

• Statystyka testowa:

gdzie S 2 i

G =

max

S 2

i

k∑

Si

2 i=1

jest estymatorem wariancji dla i-tej próby.

• Obszar krytyczny: prawostronny. Nale»y korzysta¢ ze specjalnych tablic testu Cochrana.

11.7.3 TEST F max HARTLEYA

Podobnie jak test Cochrana mo»na go stosowa¢ dla k populacji normalnych je»eli liczebno±¢

wszystkich prób n i , i=1,..,k jest identyczna.

• Hipoteza zerowa H 0 : Wszystkie wariancje sa sobie równe:

σ 2 1 = σ2 2 = ·· = σ2 k

• Hipoteza alternatywna H 1 : Przynajmniej jedna wariancja jest wieksza od pozosta-

ªych:

σ 2 j > σ2 2 = · · σ2 j−1 = σ2 j+1 = ·· = σ2 k

• Statystyka testowa:

gdzie S 2 i

F max =

max S 2

i

min S 2

i

jest estymatorem wariancji dla i-tej próby.

• Obszar krytyczny: prawostronny. Nale»y korzysta¢ ze specjalnych tablic testu Hartleya.

SMOP-2 B.Kamys: 2007/08 99

11.8 ANALIZA WARIANCJI - klasykacja jednoczynnikowa

Analiza wariancji - zaproponowana przez R. A. Fishera - to metoda sªu»aca w swojej

najprostszej wersji do porównania warto±ci oczekiwanych kilku populacji normalnych.

Jednoczynnikowa analiza wariancji bierze swa nazwe z faktu podziaªu caªej populacji

warto±ci ilo±ciowej zmiennej x na k populacji ró»niacych sie warto±cia lub poziomem

jednego klasykujacego czynnika . Tym czynnikiem nie jest warto±¢ zmiennej

x lecz jaka± inna wielko±¢, która w szczególno±ci mo»e by¢ zmienna jako±ciowa. Przy

pomocy analizy wariancji sprawdzamy czy warto±ci oczekiwane zmiennej x dla populacji

ró»niacych sie warto±cia (poziomem) czynnika klasykujacego sa identyczne. Na przykªad,

zmienna x mo»e by¢ temperatura pacjentów a czynnikiem klasykujacym - rodzaj

choroby (nominalna zmienna jako±ciowa). Wtedy stwierdzenie, »e dla ró»nych poziomów

czynnika klasykujacego (ró»nych chorób) ±rednia temperatura ciaªa jest ró»na mo»e pozwoli¢

na uªatwienie rozpoznania rodzaju choroby.

Analiza wariancji zwana popularnie ANOVA (ANalysis Of VAriance) pozwala, w

przypadku odrzucenia hipotezy zerowej, stwierdzi¢ wpªyw poziomu pewnego jako±ciowego

czynnika na mierzalna charakterystyke badanego obiektu. Dzieki temu ANOVA ma bardzo

szerokie zastosowanie w naukach biologicznych i medycznych gdzie czesto mamy do

czynienia ze zmiennymi jako±ciowymi.

ZAŠO›ENIA:

1. Badamy k populacji charakteryzowanych przez zmienna X. Zakªadamy, »e zmienne

X 1 , ..., X k przypisane populacjom 1, ..., k sa niezale»ne i maja rozkªady normalne.

2. Wszystkie populacje maja równe wariancje,

Je»eli nie mamy z góry zagwarantowanego speªnienia tych zaªo»e« to musimy przeprowadzi¢

odpowiednie testy statystyczne (np. Test λ-Koªmogorowa, test χ 2 Pearsona

lub inne dla sprawdzenia normalno±ci populacji oraz test Bartletta lub Cochrana dla

sprawdzenia identyczno±ci wariancji - nazywanej jednorodno±cia wariancji - dla ró»nych

populacji).

• Hipoteza zerowa: H 0 : E(X 1 ) = E(X 2 ) = ... = E(X k )

• Hipoteza alternatywna: H 1 :

• Statystyka testowa:

Niektóre E(X i ) sa ró»ne.

Wprowadzamy nastepujace oznaczenia:

x ij to j-ty pomiar z i-tej próby (i-tej populacji)

SMOP-2 B.Kamys: 2007/08 100

n i to liczebno±¢ i-tej próby, przy czym k ∑

i=1

¯x i· to ±rednia arytmetyczna dla i-tej próby:

¯x i· = 1 n i

∑n i

x ij

j=1

czyli

n i ∑

j=1

n i = N

x ij = n i · ¯x i·

¯x·· to ±rednia arytmetyczna wszystkich pomiarów:

k∑

¯x·· = 1 N

i=1

s 2 b ≡ 1

(k−1)

n i ∑

j=1

x ij = 1 N

k∑

n i ∑

i=1 j=1

k∑

i=1

n i · ¯x i·

(¯x i· − ¯x··) 2 = 1

(k−1)

k∑

i=1

n i · (¯x i· − ¯x··) 2

to estymator wariancji caªkowitego zbioru danych liczony z rozrzutu ±rednich

arytmetycznych poszczególnych prób i = 1, .., k. Kwadrat odchylenia i-tej

±redniej ¯x i· od ogólnej ±redniej wchodzi do wzoru z waga równa liczebno±ci

i-tej próby. Poniewa» ogólna ±rednia narzuca jeden warunek na zespóª k ±rednich

grupowych to suma s 2 b

ma (k − 1) stopni swobody.

Wska¹nik "b"pochodzi od angielskiego sªowa "between"(pomiedzy) i s 2 nazywany

jest estymatorem "wariancji miedzygrupowej". U»ywa sie równie»

b

okre±lenia wariancja wedªug badanego czynnika".

s 2 w ≡ 1

(N−k)

k∑

n i ∑

i=1 j=1

(x ij − ¯x i·) 2

to estymator wariancji caªkowitego zbioru danych liczony z rozrzutu pomiarów

wewnatrz ka»dej próby i = 1, .., k. Liczba stopni swobody dla sumy kwadratów

wewnatrz j-tej grupy to (n i − 1). Liczba stopni swobody dla sumy

kwadratów po wszystkich k grupach to:

∑

(n 1 − 1) + (n 2 − 1) + .. + (n k − 1) = k n i − k = N − k.

Stad liczba stopni swobody tej sumy wynosi (N − k).

Wska¹nik "w" pochodzi od angielskiego sªowa "within" (wewnatrz) i dlatego

estymator s 2 w

nazywany jest estymatorem wariancji wewnatrzgrupowej".

U»ywa sie tak»e okre±lenia resztowa wariancja".

i=1

TWIERDZENIE:

Mo»na pokaza¢, »e przy równo±ci wariancji wszystkich populacji

σ 2 1 = σ2 2 = . . . = σ2 k ≡ σ2 zachodza nastepujace relacje:

E{s 2 w } = σ2

E{s 2 b } = σ2 +

(

∑ k

)

(E{x i }−E{x}) 2

i=1

·

k−1

(

k∑

N−

i=1

k−1

)

n 2 i

SMOP-2 B.Kamys: 2007/08 101

gdzie E{x i } i E{x} to warto±¢ oczekiwana dla i-tej populacji i postulowana przez

hipoteze zerowa wspólna warto±¢ oczekiwana wszystkich populacji.

Jak wida¢, estymator s 2 w

jest zawsze nieobcia»onym estymatorem wariancji

(niezale»nie od prawdziwo±ci H 0 ), natomiast estymator s 2 b

jest nieobcia»ony

tylko wtedy, gdy H 0 jest prawdziwa. W przeciwnym wypadku

ma dodatnie obcia»enie (wyra»enie w drugim nawiasie powy»ej zawiera ró»nice

kwadratu sumy dodatnich liczb N 2 ∑

≡ ( k n i ) 2 i sumy kwadratów tych liczb

k∑

i=1

n i2 wiec jest zawsze dodatnie).

Jako statystyke testowa bierzemy wielko±¢:

i=1

s 2 b /s2 w

= F (k − 1, N − k)

Powy»szy wzór przedstawia stosunek dwu nieobcia»onych (przy prawdziwo±ci hipotezy

zerowej ) estymatorów wariancji, a wiec jest to zmienna o rozkªadzie F Fishera

- Snedecora.

• Obszar krytyczny

Je»eli hipoteza zerowa nie jest prawdziwa to statystyka testowa powinna by¢ wieksza

ni» przewiduje to rozkªad F (k − 1, N − k) bo wtedy s 2 b

jest dodatnio obcia»ony,

a wiec obszar krytyczny odpowiada du»ym warto±ciom statystyki testowej (test

prawostronny).

11.8.1 INNE SFORMUŠOWANIE HIPOTEZY ZEROWEJ

Czesto stosuje sie inne przedstawienie hipotezy zerowej, w którym jawnie rozpatruje sie

mo»liwo±¢ wpªywu czynnika klasykujacego na warto±¢ oczekiwana mierzonej wielko±ci

x. Wprowadza sie nastepujacy model j-tej warto±ci x dla i-tej populacji:

x ij = x 0 + α i + ξ ij

gdzie x 0 i α i sa staªymi a ξ ij to zmienna o rozkªadzie N(0,σ).

Warto±¢ oczekiwana zmiennej x ij i jej wariancja wyra»aja sie wzorami:

E (x ij ) = x 0 + α i

σ 2 (x ij ) = σ 2 (ξ ij ) = σ 2

Stad wida¢, »e parametry α i nale»y interpretowa¢ jako efekty oddziaªywania poszczególnych

poziomów "i"klasykujacego czynnika a oryginalna hipoteze zerowa, która

gªosi , »e warto±ci oczekiwane zmiennej x sa takie same dla wszystkich populacji tj.

E(x ij ) = x 0 mo»na przedstawi¢ nastepujaco:

SMOP-2 B.Kamys: 2007/08 102

H o : α 1 = α 2 = ... = α k = 0.

Gdy odrzucamy hipoteze zerowa, czyli stwierdzamy »e nie wszystkie populacje maja

równe warto±ci oczekiwane badanej wielko±ci x, pojawia sie problem oszacowania tych

warto±ci oczekiwanych. W ten sposób mo»emy zwiaza¢ warto±¢ oczekiwana zmiennej

mierzonej x z warto±ciami (poziomami) czynnika klasykujacego.

• Jako nieobcia»ony estymator warto±ci oczekiwanej i-tej populacji przyjmuje

sie:

T ni (x 0 + α i ) ≡ ¯x i· = 1 n i

σ 2 (¯x i·) = σ2

n i

∑n i

x ij

j=1

• Jako nieobcia»ony estymator x 0 bierze sie ±rednia wa»ona ±rednich arytmetycznych

dla poszczególnych prób:

T N (x 0 ) ≡ ¯x·· = 1 N

k∑

¯x i·n i

i=1

σ 2 (¯x··) = σ2

N

• Jako estymator α i bierze sie ró»nice

α i ≈ T ni (x 0 + α i ) − T N (x 0 )

11.8.2 PRAKTYCZNE RACHUNKI W ANOVA

Rachunki zwiazane z analiza wariancji nale»y prowadzi¢ z mo»liwie du»a dokªadno±cia,

gdy» pozornie niewielkie zaokraglenia moga silnie znieksztaªci¢ wyniki.

zaleca sie liczy¢ wg wzorów przyto-

Sumy kwadratów wystepujace w denicjach s 2 i b s2 w

czonych poni»ej:

SS b ≡ (k − 1) · s 2 b =

SS w ≡ (N − k) · s 2 w =

SS ≡ (N − 1) ·

k∑

k ∑

i=1

∑ k

n i ∑

i=1 j=1

n i¯x 2 i. − N ¯x2 ..

n i ∑

i=1 j=1

x 2 ij − k ∑

i=1

(x ij − ¯x .. ) 2 = k ∑

n i¯x 2 i.

n i ∑

i=1 j=1

x 2 ij − N ¯x2 ..

gdzie suma kwadratów SS jest obliczana jako sprawdzian bo musi zachodzi¢:

SMOP-2 B.Kamys: 2007/08 103

SS = SS b + SS w

Zwykle czastkowe wyniki zapisuje sie w postaci tabeli analizy wariancji jednoczynnikowej:

Rodzaj wariancji SS≡ sum of squares DF≡ degrees of freedom MS≡ mean square F - statystyka

(suma kwadratów) (liczba stopni swobody) (±redni kwadrat) testowa

Pomiedzy grupami SS b k − 1 s 2 b = SS b/(k − 1)

Wewnatrz grup SS w N − k s 2 w = SS w/(N − k)

Caªkowita SS N − 1 s 2 = SS/(N − 1) F = s 2 b /s2 w

11.8.3 STABILIZACJA WARIANCJI

Warunkiem stosowalno±ci analizy wariancji jest normalno±¢ analizowanej zmiennej

oraz jednorodno±¢ wariancji (równo±¢ wariancji) dla wszystkich porównywanych populacji.

Z praktyki wiadomo, »e drugi warunek jest znacznie wa»niejszy , tzn. niejednorodno±¢

wariancji wpªywa silniej na wyniki analizy wariancji ni» niewielkie odstepstwa

od normalno±ci rozkªadu zmiennej X.

W przypadku, gdy estymator wariancji zmienia sie regularnie wraz z estymatorem

warto±ci oczekiwanej (±rednia arytmetyczna), co stwierdzamy odkªadajac na wykresie estymatory

s 2 w funkcji ±rednich z poszczególnych prób, mo»na dla tych prób zastosowa¢

przeksztaªcenie zmiennej wyj±ciowej X, które spowoduje, »e nowa zmienna bedzie miaªa

w przybli»eniu te sama wariancje we wszystkich próbach. Dla tej nowej zmiennej mo»na

ju» przeprowadzi¢ procedure ANOVA. Takie postepowanie, nazywa sie stabilizacja wariancji.

Korzysta sie z twierdzenia które gªosi:

TWIERDZENIE:

Je»eli S 2 (x) ≈ f(¯x) jest funkcja wyra»ajaca zwiazek pomiedzy wariancjami i warto±ciami

oczekiwanymi obserwowanej zmiennej losowej x w badanych próbach, to zastosowanie

transformacji

∫

z =

C · dx

√

f(x)

SMOP-2 B.Kamys: 2007/08 104

prowadzi do przybli»onej stabilizacji wariancji, gdzie staªa C jest przybli»ona warto±cia

wariancji nowej zmiennej z.

Czesto nie interesuje nas konkretna warto±¢ wariancji nowej zmiennej lecz tylko to aby

wariancje byªy jednorodne. Wtedy zamiast staªej C stosuje sie jedynke.

Najcze±ciej spotykane relacje pomiedzy wariancjami i warto±ciami oczekiwanymi to

• Proporcjonalno±¢: S 2 ≈ a · ¯x. Wystepuje ona wtedy, gdy dane wyra»aja czesto±¢

pewnych zdarze«, np. wypadków drogowych, gdzie nie ma wyra¹nego maximum.

Wtedy stosuje sie przeksztaªcenie pierwiastkowe: z = √ x. Oczywi±cie mo»na je

stosowa¢ tylko dla nieujemnych x. Je»eli na dane skªadaja sie maªe liczby i zera to

zaleca sie stosowanie wzoru: z = √ x + 0.5.

• Gdy wariancja proporcjonalna jest do kwadratu ±redniej: S 2 ≈ a · ¯x 2 to stosuje

sie przeksztaªcenie logarytmiczne: z = log(x), przy czym dla maªych liczb zaleca

sie u»ycie wzoru: z = log(x + 1). Oczywi±cie tak»e w tym wypadku zmienna

x powinna przyjmowa¢ nieujemne warto±ci. Z taka relacja pomiedzy wariancja i

±rednia spotykamy sie przy danych dotyczacych subiektywnych oszacowa« pewnych

wielko±ci a tak»e przy badaniu czasu reakcji na bod¹ce.

• W ogólnosci, gdy wariancja proporcjonalna jest do b-tej"potegi ±redniej: S 2 ≈ ¯x b

gdzie wykªadnik potegi b ≠ 2 to u»ywa sie przeksztaªcenia z = x 1−b/2 . Na

przykªad, √ gdy do kwadratu ±redniej proporcjonalne jest odchylenie standardowe:

S2 ≈ a · ¯x 2 czyli S 2 ≈ a 2 · ¯x 4 to transformacja zapewniajaca jednorodno±¢

wariancji jest wyliczanie odwrotno±ci: z = 1/x. Tak»e pierwszy przytoczony powy»ej

przypadek, tj. proporcjonalno±¢ wariancji do ±redniej (b = 1) podlega temu

przepisowi.

• W przypadku, gdy zmienna x wyra»a procentowy udziaª lub prawdopodobie«stwo

jakiego± procesu to pomiedzy wariancja i warto±cia ±rednia mo»na zaobserwowa¢

zwiazek nastepujacy: S 2 ≈ ¯x · (1 − ¯x). Wtedy stosuje sie przeksztaªcenie: z =

arcsin(x). Przy tym przeksztaªceniu zmienna x powinna nale»e¢ do przedziaªu

(0,1).

Po zastosowaniu transformacji przeprowadza sie procedure ANOVA dla nowej zmiennej i

wyciaga sie wnioski tak jakby analizowano oryginalne dane (dla których nie wolno byªo

stosowa¢ ANOVA ze wzgledu na brak jednorodno±ci wariancji).

SMOP-2 B.Kamys: 2007/08 105

11.9 ANALIZA WARIANCJI (ANOVA) - klasykacja dwuczynnikowa

Dwuczynnikowa analiza wariancji mo»e by¢ potraktowana jako automatyczne rozszerzenie

jednoczynnikowej analizy wariancji. Ró»nica polega na tym, »e wyniki bada« klasykujemy

(dzielimy na próby) przez zastosowanie dwu czynników a nie jednego czynnika.

Wyniki pomiarów zmiennej x przedstawiamy stosujac model analogiczny do tego, który

stosowali±my przy jednoczynnikowej klasykacji. Zakªadamy, »e wynik k-tego pomiaru

dla grupy sklasykowanej przez i-ty poziom pierwszego czynnika i j-ty poziom drugiego

czynnika mo»e by¢ zapisany nastepujaco:

x ijk = x 0 + α i + β j + γ ij + ξ ijk

gdzie x 0 , α i , β j i γ ij sa nielosowymi parametrami, ktore interpretujemy nastepujaco:

x 0

- wspólna warto±¢ oczekiwana pomiarów gdy wpªyw pierwszego i drugiego klasykujacego

czynnika na warto±¢ zmiennej x mo»e by¢ zaniedbany,

α i - efekt odziaªywania poziomu pierwszego czynnika na x,

β j - efekt odziaªywania poziomu drugiego czynnika na x,

γ ij - efekt wspóªdziaªania pierwszego i drugiego czynnika na x.

ξ ijk

- czynnik losowy o rozkªadzie N(0,σ).

Wyró»niamy r poziomów (dla zmiennej jako±ciowej) lub warto±ci (dla zmiennej ilo±ciowej)

pierwszego czynnika klasykujacego (i = 1, 2, ..., r) oraz c poziomów lub warto±ci

drugiego czynnika (j = 1, 2, ..., c). Symbole r i c pojawiaja sie jako pierwsze litery

angielskich sªów row (wiersz) i column (kolumna). Z ka»dej z tych r · c populacji pobiera

sie prosta próbe (tj. niezale»ne pomiary) o tej samej liczebno±ci m, tj. wska¹nik k

przebiega m warto±ci (k = 1, 2, ..., m).

Mo»emy sprawdza¢ trzy rodzaje hipotez zerowych:

H (1)

0 : α 1 = α 2 = . . . = α r = 0

H (2)

0 : β 1 = β 2 = . . . = β c = 0

H (3)

0 : γ 11 = γ 12 = . . . = γ rc = 0

SMOP-2 B.Kamys: 2007/08 106

Pierwsza hipoteza oznacza, »e klasykacja ze wzgledu na pierwszy czynnik nie ma wpªywu

na warto±ci oczekiwane zmiennej x, druga oznacza, »e klasykacja ze wzgledu na drugi

czynnik nie wpªywa na warto±ci oczekiwane zmiennej x a trzecia, »e efekt wspóªdziaªania

obu czynników jest zaniedbywalny.

Wprowadzamy oznaczenia:

¯x i··

¯x·j·

≡

¯x ij· ≡ 1 m

¯x···

≡

c∑ m∑

x ijk

j=1 k=1

r∑ m∑

x ijk

i=1 k=1

m∑

x ijk

k=1

1 r∑ c∑ m∑

x ijk

i=1 j=1 k=1

1

c · m

1

r · m

r · c · m

Korzystajac z tych denicji mozemy przedstawi¢ dwuczynnikowa analize wariancji

przy pomocy tabeli:

ródªo SS DF MS F - statystyka

zmienno±ci suma kwadratów stopnie swobody ±redni kwadrat testowa

Czynnik 1

∑

SS 1 = c · m r (¯x i·· − ¯x···) 2 r − 1 s 2 1 = SS1

i=1

(r−1)

∑

Czynnik 2 SS 2 = r · m c (¯x·j· − ¯x···) 2 c − 1 s 2 2 = SS2

Wspóªdz.

j=1

(c−1)

∑

SS 3 = m m (¯x ij· − ¯x i·· − ¯x·j· + ¯x···) 2 (r − 1)(c − 1) s 2 3 = SS 3

k=1

Resztowe SS 4 = r ∑

Caªkowita SS 5 = r ∑

i=1 j=1 k=1

(r−1)(c−1)

c∑ m∑

(x ijk − ¯x ij·) 2 rc(m − 1) s 2 e = SS4

c∑

i=1 j=1 k=1

rc(m−1)

m∑

(x ijk − ¯x···) 2 rmc − 1 s 2 = SS5

(rmc−1)

s 2 1 /s2 e

s 2 2 /s2 e

s 2 3 /s2 e

Wiersz pierwszy (oznaczony czynnik 1 ) odpowiada testowaniu hipotezy H (1)

0 , wiersz drugi

testowaniu hipotezy H (2)

0 a wiersz trzeci testowaniu hipotezy H (3)

0 .

W ka»dym przypadku statystyka testowa rzadzona jest rozkªadem F Fishera-Snedecora

o liczbie stopni licznika takiej jak liczba stopni swobody podana w danym wierszu a liczbie

stopni swobody mianownika takiej jak dla wiersza nr 4 (czyli dla zmienno±ci resztowej).

W ka»dym z tych trzech przypadków obszar krytyczny jest prawostronny.

SMOP-2 B.Kamys: 2007/08 107

Poniewa» w ANOVA bardzo wa»na jest dokªadno±¢ rachunków wiec obliczenia sum

kwadratów nie robi sie wg wzorów denicyjnych podanych w tabeli lecz zaleca sie stosowanie

nastepujacego schematu rachunkowego:

1. Liczymy SS 1 , SS 2 , SS 4 i SS 5 wg wzorów podanych poni»ej a potem

2. Liczymy najbardziej niestabilna numerycznie sume SS 3 wg przepisu:

ad 1.)

SS 3 = SS 5 − (SS 1 + SS 2 + SS 4 )

SS 1 =

SS 2 =

SS 4 =

SS 5 =

( ) c∑

2 ( )

m∑

r∑

2

c∑ m∑

x r∑

ijk x ijk

j=1 k=1

i=1 j=1 k=1

−

i=1 c · m

n

( r∑

)

( )

m∑ 2

r∑

2

c∑ m∑

c∑ x ijk

x ijk

i=1 k=1

i=1 j=1 k=1

−

j=1 r · m

n

( m∑

) 2

r∑ c∑ m∑

r∑ c∑ x ijk

x 2 ijk − k=1

i=1 j=1 k=1

i=1 j=1 m

( ) r∑

2

c∑ m∑

x r∑ c∑ m∑

ijk

x 2 ijk

− i=1 j=1 k=1

i=1 j=1 k=1

n

gdzie n = r · c · m czyli n jest caªkowita liczba pomiarów.

Wydaje sie rozsadnym zaczyna¢ analize od testowania hipotezy H (3)

0 , tzn. od sprawdzenia,

czy mo»na zaniedba¢ wpªyw wspóªdziaªania obu czynników klasykacyjnych na warto±ci

oczekiwane mierzonej zmiennej x.

Je»eli mo»na przyja¢ te hipoteze, tj. nie ma podstaw do jej odrzucenia to mo»na dokªadniej

oszacowa¢ wariancje resztowa, a wiec bardziej precyzyjnie wyznaczy¢ oba sprawdziany

testu dla hipotezy H (1)

0 i H (2)

0 . W tym celu sumujemy SS 3 + SS 4 i po podzieleniu tej

sumy przez nowa liczbe stopni sqobody: (r −1)(c−1)+rc(m−1) ≡ rmc−c−r +1

traktujemy ja jako nowa wariancje resztowa s 2.

SMOP-2 B.Kamys: 2007/08 108

Je»eli stwierdzimy, »e jedna lub wiecej hipotez zerowych jest nieprawdziwa to szacujemy

jaki jest wpªyw klasykujacych czynników na warto±¢ oczekiwana mierzonej wielko±ci x.

Stosujemy w tym celu nastepujace estymatory:

dla α i :

dla β j :

dla γ ij :

dla x 0 :

¯x i·· − ¯x···

¯x·j· − ¯x···

¯x ij· − ¯x i·· − ¯x·j· + ¯x···

¯x···

SMOP-2 B.Kamys: 2007/08 109

11.10 TEST WSPÓŠZALE›NO‘CI STATYSTYCZNEJ POMIEDZY

CECHAMI JAKO‘CIOWYMI

DEFINICJA: Zale»no±¢ statystyczna dwu (lub wiecej) zmiennych to taka, która

powoduje, »e ich wspólny rozkªad prawdopodobie«stwa nie daje sie przedstawi¢ jako iloczyn

rozkªadów brzegowych poszczególnych zmiennych.

Nale»y podkre±li¢, »e fakt istnienia zwiazku statystycznego zwykle nie mo»e

by¢ potraktowany jako argument na rzecz istnienia relacji deterministycznej

tzn. je»eli zmienna losowa Y jest zale»na statystycznie od zmiennej losowej X to

nie mo»na wygªosi¢ twierdzenia, »e pojawienie sie danej warto±ci (lub kategorii) zmiennej

X jest przyczyna pojawianie sie konkretnych warto±ci (kategorii) zmiennej Y. Jest to

spowodowane przez dwa wa»ne powody:

1.) Dla zwiazku statystycznego zawsze jest speªnione nastepujace wynikanie: je»eli

X nie zale»y statystycznie od Y to Y nie zale»y statystycznie od X. Tego nie

mo»emy powiedzie¢ o relacji zale»no±ci deterministycznej, np. z faktu, »e

dochody rodziców nie zale»a od dochodów maªoletnich dzieci nie wynika, »e dochody

tych dzieci nie zale»a od dochodów rodziców.

2.) fakt zale»no±ci statystycznej zmiennej X od zmiennej Y (i vice versa) mo»e by¢ spowodowany

zale»no±cia obu tych zmiennych od trzeciej zmiennej (która mo»e nawet

nie by¢ rozpatrywana) a nie od siebie wzajemnie.

Na przykªad, zakres opanowania materiaªu szkolnego i wzrost sa statystycznie zwiazane

ze soba bo obie te cechy zale»a od wieku. Ustalenie wieku badanych osób powoduje,

»e znika statystyczna zale»no±¢ miedzy ilo±cia opanowanego materiaªu szkolnego

i wzrostem, która jest oczywista gdy traktowa¢ jako równorzedne obserwacje odnoszace

sie do mªodzie»y licealnej, uczniów szkoªy podstawowej i przedszkolaków

bez rozró»niania wieku.

Te druga mo»liwo±¢ musza zawsze bra¢ pod uwage badacze zajmujacy sie »ywymi

organizmami bo ich badania prawie zawsze odbywaja sie w obecno±ci zmian takich

czynników, które nie sa explicite brane pod uwage.

Uwagi podane powy»ej prowadza do wniosku, »e bardziej logiczne jest nazywanie zale»-

no±ci statystycznej - wspóªzale»no±cia statystyczna.

Poni»ej omówimy metody stwierdzenia, »e istnieje wspóªzale»no±¢ statystyczna dwu zmiennych,

przy czym jedna lub obie zmienne moga mie¢ charakter jako±ciowy.

Przyjeªo sie nazywa¢ zwiazki pomiedzy zmiennymi nominalnymi

asocjacja a wspóªczynniki okre±lajace siªe

zwiazków wspóªczynnikami asocjacji.

SMOP-2 B.Kamys: 2007/08 110

11.10.1 TEST FISHERA DLA TABLIC KONTYNGENCJI 2x2

Wspóªzale»no±¢ statystyczna miedzy cechami, z których przynajmniej jedna jest cecha

jako±ciowa nazywana jest kontyngencja. Bardzo czesto klasykacja ze wzgledu na cechy

jako±ciowe przebiega wg. podziaªu na 2 kategorie, np. : wystepowanie cechy -

brak tej cechy. Wtedy wyniki próby badajacej zwiazek statystyczny dwu cech zapisujemy

w postaci tablicy 2 x 2, w której w ka»dym polu (odpowiadajacym parze kategorii

przyporzadkowanych do pierwszej i drugiej cechy) umieszcza sie liczebno±¢ obserwacji

danej pary .

Dla ªatwiejszego przedstawienia testu Fishera omówimy go na przykªadzie konkretnego

eksperymentu: Interesuje nas, czy terapia przy zastosowaniu leku A jest bardziej

efektywna ni» przy zastosowaniu leku B.

Pierwsza zmienna (oznaczmy ja przez X) jest rodzaj stosowanej terapii. Jest to zmienna

jako±ciowa przyjmujaca 2 kategorie: 1) stosowanie leku A, 2) stosowanie leku B.

Druga zmienna (oznaczona przez Y)jest stan zdrowia pacjentów, który równie» traktujemy

jako zmienna jako±ciowa przyjmujaca 2 kategorie: 1) poprawa stanu zdrowia, 2) brak

poprawy.

Próbe skªadajaca sie z n elementów dzielimy ze wzgledu na ceche X na dwie cze±ci o

liczebno±ci n 1 i n 2 . Pacjentom z pierwszej grupy podajemy lek A a pacjentom z drugiej

grupy lek B.

Liczebno±ci n 1 i n 2 nie sa liczbami losowymi, przy czym n = n 1 + n 2 .

Sprawdzamy ilu pacjentów pierwszej grupy (m 1 ) wykazuje poprawe zdrowia, tzn. ilu

jest pacjentów odpowiadajacych równoczesnemu zdarzeniu: (X=lek A, Y=poprawa) oraz

ilu pacjentów drugiej grupy (m 2 ) wykazuje poprawe, tzn. (X=lek B, Y=poprawa). Liczebno±ci

m 1 i m 2 sa zmiennymi losowymi takimi, »e warto±ci oczekiwane stosunków

m 1

n 1

i m 2

n 2

sa odpowiednio równe prawdopodobie«stwom p 1 i p 2 poprawy zdrowia po zastosowaniu

leku A i B.

Tablica 3: Czteropolowa (tj. 2x2) tablica kontyngencji

Cecha

X

Kategoria X 1 X 2 Suma

Y Y 1 m 1 m 2 m

Y 2 n 1 − m 1 n 2 − m 2 n − m

Suma n 1 n 2 n

Je»eli zaªo»ymy, »e cecha pierwsza (w przykªadzie - rodzaj podanego leku) jest nieza-

SMOP-2 B.Kamys: 2007/08 111

le»na statystycznie od cechy drugiej (poprawa zdrowia lub jej brak) to p 1 = p 2 i mo»emy

policzy¢ dokªadnie prawdopodobie«stwo zaobserwowania m 1 i m 2 przypadków wybranej

kategorii cechy drugiej przy danych kategoriach cechy pierwszej (patrz ni»ej).

Je»eli liczebno±¢ próby n jest niewielka to stosujemy tzw. dokªadny test Fishera.

Termin dokªadny oznacza, »e operuje sie tylko liczbami caªkowitymi i dostaje sie dokªadne

wzory na prawdopodobie«stwo pojawienia sie takiego a nie innego ukªadu liczb w

tabeli.

• Hipoteza zerowa gªosi, »e obie klasykacje ze wzgledu na ceche X i na ceche Y

sa statystycznie niezale»ne.

• Statystyka testowa jest obserwowana tabela liczebno±ci a konkretnie zespóª liczebno±ci

czterech pól w tabeli. Zauwa»my jednak, »e przy danych liczebno±ciach brzegowych

przyjecie jakiej± konkretnej warto±ci m 1 (w lewym górnym rogu tabeli)

jednoznacznie narzuca warto±ci wszystkim pozostaªym liczbom w tabeli. Dlatego

mo»emy numerowa¢ wszystkie mo»liwe tabele przez warto±¢ m 1 i jako statystyke

testowa przyja¢ warto±¢ m 1 .

Prawdopodobie«stwo tej statystyki to prawdopodobie«stwo pojawienia sie w do±wiadczeniu

danych liczebno±ci w czterech polach tabeli (przy ustalonych liczebno-

±ciach brzegowych (n 1 , n 2 , m, n − m). R. A. Fisher pokazaª, »e prawdopodobie«stwo

tabeli o danym rozkªadzie liczebno±ci (przy prawdziwo±ci hipotezy zerowej,

przy ustalonej liczebno±ci próby n i liczebno±ciach brzegowych) wyra»a sie prostym

wzorem:

P =

n 1 !

m 1 ! (n 1 − m 1 )! ·

n 2 !

m 2 ! (n 2 − m 2 )!

· m! (n − m)!

n!

(86)

• Obszar krytyczny

to taki zakres statystyki testowej, który jest najmniej prawdopodobny przy prawdziwo±ci

hipotezy zerowej a najbardziej prawdopodobny przy prawdziwo±ci hipotezy

alternatywnej.

Pierwszy warunek mówi, »e w obszarze krytycznym statystyka testowa, tzn.

liczebno±¢ m 1 , powinna by¢ mo»liwie daleka od centrum rozkªadu wyliczonego przy

zaªo»eniu prawdziwo±ci H 0 . A wiec powinna mie¢ albo bardzo du»e warto±ci albo

bardzo maªe , przy czym oczywi±cie nie mo»e by¢ wieksza od m ≡ m 1 + m 2 ani

mniejsza od zera.

Drugi warunek zale»y od konkretnej hipotezy alternatywnej, która mo»e faworyzowa¢

jeden z kierunków zmiany kategorii badanych cech.

H 1 : p 1 > p 2

Je»eli mamy podstawy przypuszcza¢, »e dana para kategorii cechy pierwszej i

drugiej odpowiadajaca liczebno±ci m 1 powinna by¢ bardziej prawdopodobna

SMOP-2 B.Kamys: 2007/08 112

ni» to wynika z H 0 - tj. z niezale»no±ci zmiennych - to obszarem krytycznym

jest zbiór najwiekszych warto±ci m 1 (oczywi±cie gdy hipoteza gªosi, »e p 1 <

p 2 to jest to zbiór najmniejszych warto±ci m 1 ).

Wtedy liczymy sume prawdopodobie«stw zaobserwowanej w doswiadczeniu liczebno±ci

m 1 oraz liczebno±ci wiekszych od niej. Ta suma daje nam warto±¢

poziomu istotno±ci, tzn. prawdopodobie«stwa popeªnienia bªedu pierwszego rodzaju,

polegajacego na odrzuceniu prawdziwej hipotezy zerowej H 0 : p 1 = p 2 .

Inaczej mówiac, Je»eli to prawdopodobie«stwo jest mniejsze od zaªo»onego poziomu

istotno±ci to odrzucamy H 0 i przyjmujemy H 1 : p 1 > p 2 .

H 1 : p 1 ≠ p 2

Je»eli nie mamy wskazówek ±wiadczacych, »e dany kierunek kategorii jest wyró»niony,

to stosujemy test dwustronny odpowiadajacy hipotezie alternatywnej

gªoszacej, »e zmienne nie sa niezale»ne albo inaczej H 1 : p 1 ≠ p 2 .

Wtedy liczymy sume prawdopodobie«stw liczebno±ci m 1 oddalonych od centrum

rozkªadu w góre i w dóª tyle lub wiecej jednostek jak obserwowana w próbie

warto±¢ m 1 ( patrz przykªad poni»ej). Ta suma daje nam warto±¢ poziomu

istotno±ci, tj. prawdopodobie«stwa odrzucenia prawdziwej H 0 (i przyjecia faªszywej

H 1 ). Gdy ta suma jest mniejsza od zaªo»onego poziomu istotno±ci to

odrzucamy H 0 (przyjmujac H 1 ).

W ten sposób zamieniamy szukanie obszaru krytycznego na sprawdzanie czy prawdopodobie«stwo

pojawienia sie danego m 1 jest odpowiednio maªe. Ta procedura zostanie

poni»ej zilustrowana przykªadem, który powinien wyja±ni¢ ewentualne watpliwo±ci.

Wzór (86) mimo swej prostoty jest niewygodny do rachunków ze wzgledu na wielkie

liczby w liczniku i mianowniku. Mo»na sie zabezpieczy¢ przez trudno±ciami numerycznymi

albo logarytmujac wzór (zamieniajac dzielenie silni na odejmowanie logarytmów z silni i

powrót do normalnej reprezentacji przez zastosowanie funkcji wykªadniczej) albo stosujac

wzory rekurencyjne na prawdopodobie«stwo w nastepujacy sposób: Przyjmujemy m 1 =

0, a wiec m 2 = m oraz n 1 − m 1 = n 1 . Wtedy wzór na prawdopodobie«stwo P 0

wyglada nastepujaco [2]:

a wzór rekurencyjny

P 0 = (n 1 + n 2 − m)! (m + n 2 − m)!

n! (n 2 − m)!

= (n − m)! n 2!

n!(n 2 − m)!

P k+1 =

(m − k)(n 1 − k)

(k + 1)(n 2 − m + k + 1) P k

SMOP-2 B.Kamys: 2007/08 113

UWAGA:

• Gdy P 0 ≈ 0 to nie mo»na stosowa¢ wzorów rekurencyjnych

(bo dostaniemy dla wszystkich k; P k ≈ 0 )

• Dla poprawnego stosowania wzorów rekurencyjnych nale»y tak przegrupowa¢ ustawienia

wierszy i kolumn aby zmienna m 1 miaªa najmniejsza warto±¢ z czterech liczb

m 1 , m 2 , n 1 -m 1 , n 2 -m 2 (mo»e by¢ tak»e równa której± z pozostaªych liczb).

Przykªad [12]: Bada sie skuteczno±¢ dwóch leków A i B werykujac hipoteze zerowa,

gªoszaca, »e oba leki sa jednakowo skuteczne. Zespóª 23 pacjentów podzielono losowo na

dwie grupy o liczebno±ciach 9 i 14 (to klasykacja ze wzgledu na ceche X). Pacjentom

pierwszej grupy podano lek A, pacjentom drugiej grupy lek B i zaobserwowano 6 wyników

pozytywnych w pierwszej grupie oraz 3 wyniki pozytywne w drugiej grupie (podziaª na

pozytywne i niepozytywne wyniki to klasykacja ze wzgledu na ceche Y). Wyniki leczenia

i teoretyczne przewidywania zestawiono w dwu tabelach przytoczonych poni»ej.

Cecha

Lek

Kategoria A B Suma

Wynik + 6 3 9

− 3 11 14

Suma 9 14 23

m 1 0 1 2 3 4

P (m 1 ) 2, 4499 10 −3 3, 3073 10 −2 1, 5119 10 −1 3, 0868 10 −1 3, 0868 10 −1

m 1 5 6 7 8 9

P (m 1 ) 1, 5434 10 −1 3, 7416 10 −2 4, 0089 10 −3 1, 5419 10 −4 1, 2237 10 −6

H 1 : Lek A jest lepszy ni» lek B Z tabeli pomiarów widzimy, »e wynik pozytywny pojawia

sie cze±ciej u pacjentów przyjmujacych lek A ni» u pacjentów przyjmujacych

lek B, a wiec mo»emy przypuszcza¢, »e lek ten jest lepszy, co w formalizmie statystycznego

opisu oznaczaªoby H 1 : p 1 > p 2 . Aby sprawdzi¢ istotno±¢ tej hipotezy

SMOP-2 B.Kamys: 2007/08 114

wzgledem hipotezy H 0 : p 1 = p 2 analizujemy tabele prawdopodobie«stw sumujac

prawdopodobie«stwa dla m 1 ≥ 6. Dostajemy w wyniku 0,0416, co interpretujemy

nastepujaco: Je»eli przyjmiemy H 1 (odrzucajac H 0 ) to popeªnimy bªad w

4,16% przypadków. Inaczej mówiac mamy prawo odrzuci¢ H 0 na poziomie istotno-

±ci nie mniejszym ni» 0,0416.

Gdyby±my zaªo»yli, »e prawdopodobie«stwo odrzucenia H 0 ma by¢ jeszcze mniejsze,

np. 0,01 to wtedy nie mieliby±my podstaw twierdzi¢, »e lek A jest lepszy ni» lek B.

H 1 :Lek B jest lepszy ni» lek A. Nie mamy ilo±ciowych argumentów za taka hipoteza,

ale spróbujmy ja formalnie postawi¢ i zwerykowa¢. Taka hipoteza medyczna

bedzie zapisana w jezyku statystyki nastepujaco: H 1 : p 1

krytyczny to zbiór maªych warto±ci m 1 , gdy» du»e prawdopodobie«stwo (liczebno±¢

wzgledna m 2 /m) powoduje, »e m 1 /m ≡ 1 − m 2 /m musi by¢ maªe. Aby

ilo±ciowo znale¹¢ poziom istotno±ci sumujemy prawdopodobie«stwa liczebno±ci m 1

mniejszych lub równych obserwowanej w próbie warto±ci tj. 6. Dostajemy jako wynik

tej sumy 0,9958, co oznacza, »e przyjecie takiej H 1 (odrzucenie H 0 : p 1 = p 2

na korzy±¢ hipotezy H 1 : p 1

Jak wida¢ nie mo»emy przeforsowa¢ takiej hipotezy H 1 .

H 1 : Lek A i B nie sa jednakowo skuteczne. Te hipoteze zapisujemy nastepujaco:

H 1 : p 1 ≠ p 2 . Aby ja ilo±ciowo przetestowa¢ sumujemy prawdopodobie«stwa

takich liczebno±ci m 1 , które oddalone sa od maksimum rozkªadu (tu ok. 3,5) przynajmniej

tak daleko (w góre i w dóª) jak obserwowana w próbie warto±¢ m 1 = 6.

Dostajemy poziom istotno±ci równy 0,0771 (sumowane byªy prawdopodobie«stwa

dla m 1 = 6, 7, 8, 9 oraz m 1 = 1, 0 bo 6 i 1 sa tak samo odlegªe od maksimum

rozkªadu: 6=3,5 + 2,5, 1=3,5 - 2,5). A wiec na takim poziomie istotno±ci (lub oczywi±cie

wiekszym) mo»emy twierdzi¢, »e nale»y odrzuci¢ H 0 i przyja¢ interesujaca

nas hipoteze H 1 . Popeªniamy przy tym bªad w ok. 8% przypadków.

Cochran (W.G. Cochran, Biometrics 10 (1954) 417) zaleca u»ywanie dokªadnego testu

Fishera dla tablic kontyngencji 2 x 2 gdy n < 20 lub gdy 20 < n < 40 i najmniejsza

warto±¢ oczekiwana jest mniejsza ni» 5. Przy du»ej liczbie elementów próby stosowany

jest raczej test χ 2 Pearsona.

SMOP-2 B.Kamys: 2007/08 115

11.10.2 TEST χ 2 DLA TABLIC KONTYNGENCJI 2x2

Tablice 2x2 - zwane równie» czteropolowymi tablicami sa szczególnym przypadkiem

tablic rxc (r sªu»y jako skrót angielskiego sªowa row - wiersz, a c jako skrót sªowa

column - kolumna). Gdy liczebno±¢ odpowiadajaca poszczególnym polom jest du»a to

zamiast dokªadnego testu Fishera stosuje sie test χ 2 , który ju» rozpatrywali±my jako test

zgodno±ci przy okazji testowania normalno±ci rozkªadu prawdopodobie«stwa.

• Hipoteza zerowa taka sama jak dla dokªadnego testu Fishera, tj. klasykacja ze

wzgledu na jedna ceche (kategoriom cechy odpowiadaja wiersze) jest niezale»na statystycznie

od klasykacji ze wzgledu na druga ceche (kategoriom cechy odpowiadaja

kolumny).

• Statystyka testowa X 2 - taka jak we wzorze (11.5.3):

X 2 =

k∑ (n i − n · π i ) 2

i=1

gdzie tu suma wykonywana jest po 4 polach tablicy (k = 4), n i oznacza obserwowana

liczebno±¢ w danym polu (oznaczana tradycyjnie O od angielskiego sªowa

observed - obserwowana), a nπ i oznacza teoretyczna liczebno±¢ w danym polu

(oznaczana tradycyjnie E od angielskiego sªowa expected - oczekiwana ). A wiec

powy»szy wzór na statystyke testowa X 2 zapisujemy nastepujaco:

nπ i

2∑ 2∑ (O

X 2 ij − E ij ) 2

=

(87)

E ij

i=1 j=1

Teoretyczna liczebno±¢ wyznaczana jest z liczebno±ci brzegowych (sum po wierszach

dla danej kolumny lub sum po kolumnach dla danego wiersza) przy zaªo»eniu, »e

badane zmienne (cechy) sa niezale»ne.

Prawdopodobie«stwo dwu niezale»nych zdarze« A i B wyra»a sie iloczynem ich

prawdopodobie«stw P (A ∩ B) = P (A) · P (B). Biorac czesto±ci brzegowe jako

estymatory prawdopodobie«stw, np. T (P (A)) = n A

, T (P (B)) = n B

oraz

n n

uwzgledniajac, »e szukamy liczebno±ci a nie prawdopodobie«stwa pola A ∩ B dostaniemy

na te liczebno±¢ n(A ∩ B) = T (P (A)) · T (P (B)) · n czyli ta liczebno±¢

wynosi n A · nB · n = n A·n B

.

n n

n

W tabeli (4) podane sa (nieopisane) obserwowane liczebno±ci oraz ich oczekiwane

odpowiedniki (opisane sªowem expected).

Wstawiajac wyra»enia na O ij i E ij wypisane w powy»szej tabeli dostajemy wyra-

»enie X 2 przez liczebno±ci obserwowane:

SMOP-2 B.Kamys: 2007/08 116

Tablica 4: Czteropolowa (tj. 2x2) tablica kontyngencji - w nawiasach umieszczone sa

oczekiwane liczebno±ci E ij , powy»ej nich - liczebno±ci obserwowane O ij

Cecha

X

Kategoria X 1 X 2 Suma

Y Y 1 m 1 m 2 m

(expected) ( m·n 1

n ) ( m·n 2

n )

Y 2 n 1 − m 1 n 2 − m 2 n − m

(expected) ( (n−m)·n 1

n

) ( (n−m)·n 2

n

)

Suma n 1 n 2 n

X 2 = n · [m 1 · (n 2 − m 2 ) − m 2 · (n 1 − m 1 )] 2

m · (n − m) · n 1 · n 2

(88)

Šatwo zapamieta¢ ten wzór bo w nawiasie kwadratowym licznika mamy ró»nice

iloczynów elementów macierzy na gªównej przekatnej i drugiej przekatnej (czyli

wyznacznik macierzy) a w mianowniku znajduje sie iloczyn wszystkich brzegowych

liczebno±ci.

Wyra»enie to ma asymptotycznie (dla du»ych liczebno±ci) rozkªad χ 2 1 .

Mo»na by przypuszcza¢, »e liczba stopni swobody powinna by¢ wieksza ni» jeden

(bo sa 4 pola a wiec cztery wyrazy w sumie) ale - jak to pokazano dla dokªadnego

testu Fishera - tylko jedna z czterech liczebno±ci jest niezale»na. Pozostaªe trzy sa

jednoznacznie okre±lone przez warto±¢ tej wybranej liczebno±ci i liczebno±ci brzegowe.

Taka sytuacja, tzn. mo»liwo±¢ otrzymania zwartego, prostego wzoru (88) na

X 2 , jak i jednoznaczne okre±lenie wszystkich pól tabeli przez liczebno±¢ jednego

pola jest cecha jedynie tabeli czteropolowych.

Poprawka Yatesa na nieciagªo±¢ . Zmienna losowa χ 2 z denicji jest zmienna

ciagªa. Wyliczanie statystyki X 2 z ilorazu caªkowitych liczb powoduje, »e jej warto±ci

nie reprezentuja wszystkich liczb rzeczywistych, np. nie moga pojawi¢ sie

liczby niewymierne. Co wiecej, ta statystyka mo»e przyja¢ tylko tyle warto±ci ile

jest ró»nych tablic czteropolowych przy ustalonych liczebno±ciach brzegowych. Dlatego,

nawet przy stosunkowo du»ych liczebno±ciach nale»aªoby ten efekt wzia¢ pod

uwage.

SMOP-2 B.Kamys: 2007/08 117

Po uwzglednieniu poprawki zaproponowanej przez Yatesa wzór na X 2 dla tablicy

czteropolowej wyglada nastepujaco:

X 2 = n · (| m 1 · (n 2 − m 2 ) − m 2 · (n 1 − m 1 ) | − n 2 )2

m · (n − m) · n 1 · n 2

(89)

• Obszar krytyczny to du»e warto±ci statystyki X 2 bo jak wynika ze wzoru (87) przy

warto±ciach obserwowanych liczebno±ci O ij bliskich warto±ciom oczekiwanym liczebno±ci

E ij , X 2 jest bliskie zera co jest najmniejsza z dozwolonych przez ten wzór

warto±ci.

Przy zaªo»onym poziomie istotno±ci α obszar krytyczny to zbiór warto±ci statystyki

testowej wiekszy od kwantyla rozkªadu χ 2 1

na poziomie 1 − α:

X 2 > χ 2 1

(1 − α)

Przykªad: Rozwa»my zestawienie [1] wyników próby klinicznej, w której stosowano

dwa sposoby leczenia (A i B)- wyniki zamieszczone sa w tabeli (5).

Tablica 5: Czteropolowa (tj. 2x2) tablica kontyngencji przedstawiajaca wyniki próby

klinicznej

Cecha

Wynik

Kategoria zgon prze»ycie Razem

Leczenie A 41 216 257

B 64 180 244

Razem 105 396 501

Hipoteza zerowa: Wyniki leczenia nie zale»a od sposobu leczenia.

Statystyka testowa: Zmienna X 2 liczona bez poprawki Yatesa i z poprawka, odpowiednio

wg wzorów (88) i (89). Bez poprawki mamy:

501 · (64 · 216 − 41 ·

X 2 180)2

=

257 · 244 · 105 · 396

= 7, 979

SMOP-2 B.Kamys: 2007/08 118

Z poprawka otrzymujemy:

501

501 · (| 64 · 216 − 41 · 180 | −

X 2 2

= )2

257 · 244 · 105 · 396

= 7, 371

Warto±ci statystyki testowej porównujemy z warto±cia kwantyla χ 2 1

(1 − α). Z tablic

znajdujemy, »e ten kwantyl wynosi odpowiednio 3,84 (dla α = 0,05), 5,02 (dla α =

0,025), 6,63 (dla α = 0,01) oraz 10,83 (dla α = 0,001). Wyliczona warto±¢ statystyki

X 2 z próby nale»y do obszaru krytycznego dla poziomu istotno±ci 0,01 ale ju» nie nale»y

do tego obszaru dla poziomu istotno±ci 0,001.

Stad wnioskujemy, »e dwa sposoby leczenia daja istotnie ró»ne wyniki na poziomie

istotno±ci mniejszym od 0,01 lecz wiekszym od 0,001 (tzn. nasz wniosek mo»e by¢

bªedny w mniej ni» jednym przypadku na sto ale cze±ciej ni» raz na tysiac przypadków).

Jak ªatwo zauwa»y¢ ze wzorów na X 2 oraz z warto±ci tej statystyki w powy»szym przykªadzie,

test z poprawka Yatesa jest bardziej konserwatywny, tzn. nie odrzuca hipotezy

zerowej w takich przypadkach gdy test bez poprawki odrzuciªby ja.

11.10.3 WSPÓŠCZYNNIK KORELACJI RANG ϱ SPEARMANA

Przy analizie wspóªzale»no±ci statystycznej dwu zmiennych porzadkowych (asocjacji, kongruencji)

najcze±ciej stosowana miara tej wspóªzale»no±ci jest wspóªczynnik rang Spearmana

oznaczany zwykle przez ϱ (podobnie jak wspóªczynnik Pearsona korelacji cech

mierzalnych) lub r d .

W tym celu obserwacje z obu prób A i B porzadkujemy przypisujac im rangi w ten

sposób, »e najbardziej korzystnej, po»adanej kategorii cechy przypisujemy range 1 a

kolejnym gorszym kategoriom rangi 2, 3, itd. Je»eli kilka kategorii odpowiada równie

korzystnej sytuacji to nadajemy im identyczne rangi (równe ±redniej arytmetycznej rang,

które otrzymaªyby te obserwacje gdyby sie minimalnie ró»niªy).Takie rangi nazywane sa

rangami wiazanymi.

Wspóªczynnik korelacji rang ϱ Spearmana deniowany jest nastepujaco:

ϱ = 1 −

∑

6 n (r 1i − r 2i ) 2

i=1

n(n 2 − 1)

(90)

Tu r 1i i r 2i - oznaczaja rangi dla i-tej kategorii tej samej cechy odpowiednio w pierwszej

i drugiej próbie, przy czym obie próby maja liczebno±¢ n.

SMOP-2 B.Kamys: 2007/08 119

Wspóªczynnik ten przyjmuje warto±ci z przedziaªu [-1,+1]:

• ϱ = +1 w przypadku idealnej zgodno±ci rang,

• ϱ = −1 w przypadku maksymalnej niezgodno±ci (du»ym r 1i odpowiadaja maªe

r 2i i odwrotnie)

• ϱ = 0 w przypadku czysto losowego ustawienia rang, tzn. przy ich niezale»no±ci

w obu porównywanych ciagach.

Na przykªad: poproszono dwie osoby o uporzadkowanie ich preferencji kulinarnych

dotyczacych kilku zup.

Pierwsza osoba podaªa nastepujace preferencje:

Barszcz czerwony, »urek, pomidorowa, ogórkowa, rosóª, chªodnik.

Druga:

Chªodnik, ogórkowa, pomidorowa, barszcz czerwony, »urek, rosóª.

Preferencje pierwszej osoby mo»emy uzna¢ za wzorzec i przyporzadkowa¢ im kolejne

liczby naturalne: 1, 2, 3, 4, 5, 6. Tym rangom beda odpowiadaªy nastepujace rangi

wybrane przez druga osobe: 4, 5, 3, 2, 6, 1.

Suma kwadratów ró»nicy rang bedzie wynosi¢ 9+9+0+4+1+25=48. Poniewa» n=6

wiec wspóªczynnik ϱ=1-6*48/[6*(36-1)]= - 0,37.

Wniosek: Obie osoby maja niezgodne preferencje kulinarne.

Oczywi±cie dla ilo±ciowego testowania czy odchylenie wspóªczynnika korelacji rang od

zera jest istotne trzeba korzysta¢ ze specjalnych tablic. Je»eli liczba obserwacji n jest

wieksza od 10 to mo»na posªu»y¢ sie asymptotycznymi wzorami, poniewa» dla du»ych

prób wspóªczynnik korelacji rang ma w przybli»eniu rozkªad normalny. W tym

celu korzystamy z twierdzenia:

TWIERDZENIE: Je»eli prawdziwa jest hipoteza zerowa gªoszaca, »e rangi dwu serii obserwacji

sa niezale»ne statystycznie to :

E{ϱ} = 0

V ar{ϱ} = 1

n−1

A wiec dla n > 10 mo»na u»ywa¢ poni»szego przybli»onego wzoru [4]:

P (ϱ > R) ≈ 1 − Φ { √ [ ]}

n − 1 · R · 1 +

0,19

− 3

R 2 n−1

≈ 1 − Φ( √ n − 1 · R)

(91)

SMOP-2 B.Kamys: 2007/08 120

W tym wzorze Φ oznacza dystrybuante standardowego rozkªadu normalnego.

Mo»na równie» dla n ≥ 10 stosowa¢ transformacje [7]:

t = ϱ√ n − 2

1 − ϱ 2

Zmienna t ma rozkªad Studenta o (n-2) stopniach swobody. Poniewa» o znaku t decyduje

znak ϱ wiec dla t stosuje sie identyczny obszar krytyczny (lewostronny, prawostronny lub

dwustronny) jak dla ϱ.

W tabeli poni»ej podane sa kwantyle testu Spearmana ϱ 0,95 i ϱ 0,99 dla prób o maªej liczebno±ci.

Mozna je zastosowa¢ do sprawdzania testu prawostronnego dla dwu najcze±ciej

stosowanych poziomów istotno±ci: α = 0, 05 i α = 0, 01. Dla testu lewostronnego nale»y

wykorzysta¢ fakt, »e ϱ q = −ϱ 1−q :

n ϱ 0,95 ϱ 0,99 n ϱ 0,95 ϱ 0,99

4 1,000 14 0,456 0,645

5 0,900 1,000 16 0,425 0,601

6 0,829 0,943 18 0,399 0,564

7 0,714 0,893 20 0,377 0,534

8 0,643 0,833 22 0,359 0,508

9 0,600 0,783 24 0,343 0,485

10 0,564 0,746 26 0,329 0,465

12 0,506 0,712 28 0,317 0,448

14 0,456 0,645 30 0,306 0,432

SMOP-2 B.Kamys: 2007/08 121

11.10.4 WSPÓŠCZYNNIK KORELACJI RANG τ KENDALLA

Wspóªczynnik korelacji rang τ Kendalla daje równowa»ne informacje do tych, które mo»na

uzyska¢ analizujac wspóªczynnik korelacji rang ϱ Spearmana tzn. równy jest +1, -1 i 0

gdy rangi w dwu próbach uszeregowane sa identycznie, odwrotnie i losowo. Wspóªczynnik

τ Kendalla m ma dwie zalety w porównaniu do wspólczynnika korelacji rang Spearmana:

1. ªatwiej mo»na go skorygowa¢, gdy istnieje wiele rang wiazanych,

2. jest szybciej zbie»ny do rozkªadu normalnego ni» wspóªczynnik ϱ Spearmana.

DEFINICJA:

S =

n∑

i=1 j=i+1

τ =

S

1

n(n − 1)

2

sign(r j − r i )

gdzie r i i r j sa rangami w zbiorze kategorii cechy drugiej ( rangi dla cechy pierwszej

ustawione sa jako rosnacy ciag liczb naturalnych: 1,2, .. z ewentualna modykacja

dla cech wiazanych). Przyczynki do sumy deniujacej S liczymy nastepujaco: porównujemy

piewsza range z druga, z trzecia, itd., nasteepnie druga range z trzecia, czwarta, itd.

(ªacznie n(n-1)/2 wyrazów)

• dla naturalnej kolejno±ci rang przyczynek +1,

• dla odwróconej kolejno±ci rang przyczynek -1,

• dla rang wiazanych (identycznych) przyczynek 0.

Je»eli zdarzy sie, »e równie» dla pierwszej cechy wystepuja rangi wiazane to odpowiadajacym

im parom rang cechy drugiej przypisujemy przyczynek 0 niezale»nie od ich uporzadkowania .

Przykªad 1 (rangi wiazane tylko dla cechy drugiej - Y):

Suma wszystkich przyczynków daje S=6.

Przykªad 2 (rangi wiazane zarówno dla pierwszej cechy - X jak i dla drugiej cechy -Y):

Suma wszystkich przyczynków do S daje S=4 . Gdy wystepuja rangi wiazane musimy

w inny sposób normalizowa¢ sume S aby dosta¢ τ:

τ =

[

1√

2

n(n − 1) − m ∑

i=1

S

] [ ]

∑

t i (t i − 1) n(n − 1) − r u j (u j − 1)

j=1

SMOP-2 B.Kamys: 2007/08 122

Rangi cechy X 1 2 3 4 5 6

Rangi cechy Y 2 3 4.5 4.5 1 6

Przyczynki do S (od 2) +1 +1 +1 -1 +1

Przyczynki do S (od 3) +1 +1 -1 +1

Przyczynki do S (od 4.5) 0 -1 +1

Przyczynki do S (od 4.5) -1 +1

Przyczynki do S (od 1) +1

Rangi cechy X 1.5 1.5 3 5 5 5

Rangi cechy Y 2 3 4.5 4.5 1 6

Przyczynki do S (od 2) 0 +1 +1 -1 +1

Przyczynki do S (od 3) +1 +1 -1 +1

Przyczynki do S (od 4.5) 0 -1 +1

Przyczynki do S (od 4.5) 0 0

Przyczynki do S (od 1) 0

Suma po wska¹niku i to suma po grupach rang wiazanych dla pierwszej zmiennej, t i

to liczebno±¢ i-tej grupy rang, a suma po wska¹niku j to suma po grupach rang wiazanych

dla drugiej zmiennej, u j to liczebno±¢ j-tej grupy rang.

W pierwszym przykªadzie powy»ej wspóªczynnik τ bedzie liczony wg wzoru:

τ =

=

S

1

2√

n(n−1)[n(n−1)−2(2−1)]

6

1

2√

6(6−1)[6(6−1)−2(2−1)]

= 0, 414

SMOP-2 B.Kamys: 2007/08 123

W drugim przykªadzie powy»ej wspóªczynnik τ bedzie liczony wg wzoru:

=

τ =

S

1

2√

n(n−1)[n(n−1)−2(2−1)]

4

1

2√

[6(6−1)−2(2−1)−3(3−1)][6(6−1)−2(2−1)]

= 0, 322

Policzenie wspóªczynnika τ i blisko±¢ jego warto±ci do granicznych warto±ci (+1,-1 lub

0) pozwalaja wyciagna¢ wnioski jako±ciowo o korelacji rang.

Dla ilo±ciowego testowania hipotezy H 0 : τ = 0

wygodniej jest rozwa»a¢ sama sume S deniowana powy»ej. Suma ta bardzo szybko da»y

do rozkªadu normalnego a wiec dla n≥ 10 mo»na sie posªugiwa¢ tablicami rozkªadu N(0,1)

je»eli bedziemy rozwa»a¢ zmienna

z = |S| − 1

σ(S)

przy czym wariancja S σ 2 (S) liczona jest z poni»szych wzorów (dla przypadku gdy nie

ma rang wiazanych i gdy sa rangi wiazane):

a) bez rang wiazanych:

σ 2 (S) =

n(n − 1)(2n + 5)

18

b) z rangami wiazanymi:

σ 2 (S) = 1 18

[

1

m∑

+

9n(n−1)(n−2)

i=1

[ m∑

+ 1

2n(n−1)

i=1

n(n − 1)(2n + 5) − m ∑

t i (t i − 1)(t i − 2)

i=1

] [ r∑

t i (t i − 1)(2t i + 5) −

j=1

]

] [ r∑

t i (t i − 1) u j (u j − 1)

j=1

r ∑

j=1

]

u j (u j − 1)(u j − 2)

u j (u j − 1)(2u j + 5)

]

SMOP-2 B.Kamys: 2007/08 124

Wzory te a szczególnie ostatni wygladaja skomplikowanie ale liczby w nich wystepujace

sa niewielkie, a wiec rachunki nie sa trudne.

Jako przykªad rozwa»my przypadek rozwa»any oryginalnie przez Kendalla: Egzamin

zdawaªo o±miu chªopców (C) i siedem dziewczat (D). Pytanie brzmiaªo: Czy wyniki egzaminu

dla chªopców sa inne ni» dla dziewczat. W tabelce poni»ej w pierwszym wierszu

podana jest ranga uzyskana na egzaminie a w drugim kategoria cechy jako±ciowej czyli

pªci:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

C C D C D D C C C D C D C D D

Ze wzgledu na druga ceche mamy dwie grupy rang wiazanych o liczebno±ci 8 (chªopcy) i

7 (dziewczeta). Biorac jako wspólna range dla chªopców ±rednia z rang 1 - 8 = 4,5 a dla

dziewczat ±rednia z rang 9 - 15 = 12 dostajemy tabelke:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4,5 4,5 12 4,5 12 12 4,5 4,5 4,5 12 4,5 12 4,5 12 12

Suma S liczona wedªug przepisu podanego wy»ej na podstawie tych rang wynosi:

S=7+7-6+6-5-5+4+4+4-2+3-1+2+0=18.

Wspóªczynnik τ:

τ =

18

= 0, 235

√15(15 − 1) [15(15 − 1) − 8(8 − 1) − 7(7 − 1)]

1

2

Jest on niewielki co sugeruje, »e H0 jest prawdziwa (przy czym jego znak nie ma

znaczenia bo zale»y od konwencji, w której mniejsze rangi nadano chªopcom a to byªo

arbitralne).

Dla ilo±ciowego testu liczymy wariancje zmiennej S (korzystajac ze skomplikowanego

wzoru podanego powy»ej). Poniewa» rangi dla pierwszej cechy (jako±¢ zdawania) nie sa

powiazane wiec wzór bardzo sie upraszcza bo sumy, w których wystepuje t i znikaja i

dostajemy:

√

σ(S) = 1

[15(15 − 1)(2 · 15 + 5) − 8(8 − 1)(2 · 8 + 5) − 7(7 − 1)(2 · 7 + 5)] = 17, 28

18

a standaryzowana zmienna o rozkªadzie normalnym bedzie miaªa warto±¢:

z = |S| − 1

σ(S)

= 18 − 1

17, 28

= 0, 984

Je»eli jako poziom istotno±ci we¹miemy α=0,05 to przy te±cie dwustronnym dostaniemy

obszar krytyczny z > 1, 96 lub z < −1, 96. Poniewa» z z do±wiadczenia nie

traa do obszaru krytycznego wiec nie ma podstaw odrzuca¢ hipotezy zerowej.

SMOP-2 B.Kamys: 2007/08 125

11.10.5 ANALIZA ASOCJACYJNA

Analiza korelacyjna cech niemierzalnych sprowadza sie do badania, czy okre±lone kombinacje

wariantów rozpatrywanych cech maja tendencje do wyra¹nie czestszego lub wyra¹nie

rzadszego pojawiania sie ni» by to miaªo miejsce w przypadku niezale»no±ci cech X i Y.

Taka analize wystepowania skojarze« okre±lonych wariantów cech nazywa sie "analiza

asocjacyjna".

Wyró»niamy r wariantów cechy jako±ciowej X (r≥2) oraz c wariantów cechy jako±ciowej

Y (c≥2). Niech n oznacza liczbe obserwacji w próbie, n i· i n·j liczbe obserwacji w

których zaobserwowano wariant x i cechy X i wariant y j cechy Y oraz n ij niech oznacza

liczbe obserwacji w których zaobserwowano zarówno i-ty wariant cechy X jak i j-ty wariant

cechy Y.

Wielko±ci te speªniaja relacje:

r∑ c∑

r∑

c∑

n ij = n i· = n·j = n

i=1 j=1 i=1 j=1

WSPÓŠCZYNNIK KORELACJI CECH NIEMIERZALNYCH

R xi ,y j

Deniujemy go nastepujaco:

R xi y j

=

√

ni·

n (1 − n i·

n ij

− n i· n·j

n n n

)

n·j

n n

(1 −

n·j

n )

Wspóªczynnik ten przyjmuje warto±ci z przedziaªu [-1,+1] przy czym

• R=0 dla nieskorelowanych wariantów x i i y j ,

• R=+1 wtedy i tylko wtedy, gdy warianty x i i y j wystepuja w próbie zawsze razem,

• R=-1 wtedy i tylko wtedy, gdy wystepowanie jednego z wariantów wyklucza pojawienie

sie drugiego z nich.

Ten wspóªczynnik korelacji pozwala wnioskowa¢ o niezale»no±ci (lub okre-

±lonym typie zale»no±ci) dwu wyró»nionych wariantów cech X i Y.

Ujemna warto±¢ empirycznego wsp. korelacji oznacza, »e wzgledna czesto±¢ ªacznego

wystepowania wariantów x i i y j jest mniejsza ni» dla niezale»nych cech Xi Y, dodatnia

oznacza, »e wzgledna czesto±¢ równoczesnego wystepowania wariantów x i i y j jest wieksza

ni» dla niezale»nych cech X i Y.

Wzór denicyjny mo»na przepisa¢ w formie wygodniejszej dla oblicze«:

SMOP-2 B.Kamys: 2007/08 126

R xi y j

=

n · n ij − n i· · n·j

√

ni· · (n − n i·) · n·j · (n − n·j )

PRZYKŠAD (zaczerpniety z [14]):

Dostawcy

Jako±¢ surowców B1 B2 B3 B4 Ogóªem

Dobra A1 35 23 60 31 149

Przecietna A2 17 11 15 20 63

Zªa A3 6 7 10 15 38

Ogóªem 58 41 85 66 250

Macierz wspóªczynników R Ai ,B j

(to nie jest zwykªa macierz korelacji !!):

Dostawcy

Jako±¢ surowców B1 B2 B3 B4

Dobra A1 0,0083 -0,0316 0,1607 -0,1542

Przecietna A2 0,0520 0,0166 -0,1249 0,0704

Zªa A3 -0,0743 0,0231 -0,0687 0,1256

Przeglad warto±ci wspóªczynników korelacji pokazuje, »e najwieksza dodatnia warto±¢

ma wspóªczynnik R A1 ,B 3

=0,1607 a najmniejsza (ujemna) wspóªczynnik R A1 ,B 4

=-0,1542.

Drugi najwiekszy wspóªczynnik korelacji to R A3 ,B 4

=0,1256 a drugi najmniejszy (ujemny)

to wspóªczynnik R A1 ,B 4

=-0,1249. Nale»y to interpretowa¢ w ten sposób, »e:

• Surowce dostarczane przez dostawce B3 maja dobra jako±¢ wyra¹nie cze±ciej ni»

gdyby to byªo przypadkowe (R A1 ,B 3

=0,1607),

• Surowce dostraczane przez dostawce B4 maja dobra jako±¢ wyra¹nie rzadziej, ni»

gdyby to byªo przypadkowe (R A1 ,B 4

=-0,1542).

SMOP-2 B.Kamys: 2007/08 127

• Surowce dostarczane przez dostawce B4 maja zªa jako±¢ cze±ciej ni» gdyby to byªo

przypadkowe (R A3 ,B 4

=0,1256),

• Surowce dostarczane przez dostawce B3 maja przecietna jako±¢ rzadziej ni» gdyby

to byªo przypadkowe (R A1 ,B 4

=-0,1249).

(uogólnienie z przy-

TEST CHI-KWADRAT NIEZALE›NO‘CI CECH X i Y

padku 2x2)

Hipoteza zerowa:

Ka»de zdarzenie losowe x i jest parami niezale»ne od ka»dego ze zdarze« y j .

Statystyka testowa:

X 2 =

r ∑

c∑

i=1 j=1

ˆn ij = n n i·

n

n·j

n

(n ij −ˆn ij ) 2

ˆn ij

K. Pearson udowodniª, »e ta statystyka ma przy prawdziwo±ci hipotezy zerowej asymptotycznie

(tzn. dla n→ ∞) rozkªad chi-kwadrat o (r-1)(c-1) stopniach swobody.

Obszar krytyczny: prawostronny.

PRZYKŠAD (zaczerpniety z [14]):

Korzystajac z danych umieszczonych w tabeli z poprzedniego przykªadu mo»na wyliczy¢

macierz warto±ci

⎡

ˆn ij =

⎢

⎣

35, 0 24, 4 50, 7 38, 9

14, 6 20, 3 21, 4 16, 7

8, 4 6, 3 12, 9 10, 4

⎤

⎥

⎦

wstawiajac te wielko±ci do wzoru na statystyke testowa dostaniemy:

SMOP-2 B.Kamys: 2007/08 128

X 2 =

(35 − 35)2

35

+

(23 − 24, 4)2

24, 4

+ . . . +

(15 − 10, 4)2

10, 4

= 10, 8

Liczba stopni swobody zmiennej χ 2 wynosi 6≡ (3 − 1) · (4 − 1). Obszar krytyczny na

poziomie istotno±ci α=0,1 to X 2 > χ 2 6 (1 − α) ≡ χ2 6

(0, 9) = 16, 8.

Poniewa» X 2 jest mniejsze od tej warto±ci, wiec nie ma podstaw do odrzucenia H 0 .

11.10.6 MIARY SIŠY ZWIA ZKU NOMINALNYCH CECH JAKO‘CIO-

WYCH

W dwu poprzednich rozdziaªach zajmowali±my sie metodami stwierdzenia, »e zmienne

jako±ciowe nie sa od siebie niezale»ne. Po zastosowaniu tych metod mogli±my dowiedzie¢

sie, »e zwiazek statystyczny istnieje ale nie dostali±my iformacji czy jest to silny zwiazek.

Jak nale»y rozumie¢ okre±lenie sªaby zwiazek lub silny zwiazek ?

Dla zmiennych ilo±ciowych jest to ªatwe do zdeniowania - najsilniejszym zwiazkiem

bedzie zwiazek funkcyjny, który polega na tym, »e warto±¢ argumentu (pierwsza rozpatrywana

zmienna) jednoznacznie okre±la warto±¢ funkcji (druga rozpatrywana zmienna) i

vice versa (gdy funkcja jest monotoniczna).

Dla zmiennych jako±ciowych mo»emy przez analogie rozumowa¢, »e silny zwiazek to

taki, przy którym przyjmowanie przez zmienna jako±ciowa jakiej± kategorii powoduje, »e

druga zmienna jako±ciowa te» bedzie nale»e¢ do wybranej kategorii.

Na przykªad, jako jedna zmienna jako±ciowa mo»emy przyja¢ rodzaj podawanego leku

a jako druga skuteczno±¢ kuracji. Kategoriami pierwszej zmiennej sa konkretne leki a

kategoriami drugiej zmiennej jest pozytywny lub negatywny skutek leczenia. Gdy podanie

leku A zawsze ko«czy sie wyleczeniem pacjenta a podanie leku B zawsze nie przynosi

skutku to wtedy w sposób oczywisty mamy do czynienia z najsilniejszym mo»liwym

zwiazkiem pomiedzy rodzajem leku i skuteczno±cia terapii. Warto zauwa»y¢, »e dla tablic

kontyngencji 2x2 jest to przypadek odpowiadajacy maksymalnej ró»nicy warto±ci iloczynu

elementów na gªównej i drugiej przekatnej. Jak przekonamy sie za chwile, jest to jedna z

cech wykorzystywanych do oceniania miary siªy zwiazku.

MIARY SIŠY ZWIA ZKU OPARTE O χ 2 .

Korzystajac ze wzoru (88) na X 2 oraz wzorów na E ij podanych w tabeli (4) widzimy, »e

X 2 zeruje sie dla niezale»nych zmiennych bo iloczyny wyrazów na przekatnych sa identyczne.

Z drugiej strony wiemy z rozwa»a« podanych powy»ej »e najsilniejszy zwiazek

odpowiada sytuacji, gdy jest maksymalna ró»nica iloczynów wyrazów na obu przekatnych,

SMOP-2 B.Kamys: 2007/08 129

co wg wzoru (88) oznacza najwieksza warto±¢ statystyki X 2 . To mogªoby nasuna¢ przypuszczenie,

»e warto±¢ tej statystyki mogªaby by¢ miara siªy zwiazku. Niestety warto±¢

X 2 zale»y nie tylko od siªy zwiazku ale równie» od liczebno±ci próby - ro±nie proporcjonalnie

do liczebno±ci próby.

Gdy zwiekszymy N-krotnie liczebno±¢ próby n to wszystkie liczebno±ci O ij i E ij

równie» powieksza sie N-krotnie. To spowoduje, »e statystyka X 2 tak»e zwiekszy sie N-

krotnie (licznik N 2 -krotnie a mianownik N-krotnie). Dzieje sie tak przy tym samym zwiazku

pomiedzy zmiennymi a wiec wida¢, »e musimy sie pozby¢ zale»no±ci od liczebno±ci próby

aby mo»na byªo statystyke X 2 u»ywa¢ jako miare siªy zwiazku.

Jako miare siªy zwiazku dla próby o liczebno±ci n wprowadza sie nastepujaca statystyke

(nazywana czasem wspóªczynnikiem Yule'a):

Φ 2 ≡ X2

n . (92)

Dla tablic 2xk (a wiec i dla tablic 2x2 ) Φ 2 przyjmuje warto±ci z przedziaªu

[0,1], przy czym niezale»nym zmiennym odpowiada warto±¢ zero a najsilniejszemu

zwiazkowi warto±¢ jeden. W ogólnym przypadku tablic rxc Φ 2 mo»e

znacznie przekroczy¢ jedno±¢.

Dlatego wprowadzono równie» inne miary siªy zwiazku oparte na statystyce X 2 [10].

Sa to:

• wspóªczynnik T - Czuprowa,

• wspóªczynnik C - Cramera (nazywany równie» wspóªczynnikiem V - Cramera) i

• wspóªczynnik P - Pearsona (nazywany tak»e wspóªczynnikiem C - Pearsona).

WSPÓŠCZYNNIK T CZUPROWA:

T ≡

X 2

√ √

n · (r − 1)(c − 1) ± σ(X 2 )

√

2 · n · (r − 1)(c − 1) · T

(93)

Wspóªczynnik T osiaga warto±¢ +1 przy najsilniejszym zwiazku tylko wtedy gdy liczby

kolumn (c) i wierszy (r) sa takie same. W przeciwnym wypadku jest mniejszy od jedno±ci.

Najwieksza jego warto±¢ to:

SMOP-2 B.Kamys: 2007/08 130

max(T ) = √

min(r − 1, c − 1)

max(r − 1, c − 1)

Gdy zmienne nie sa wspóªzale»ne to wspóªczynnik T zeruje sie.

Poniewa» wspóªczynnik T jest statystyka, wiec jest obarczony bªedem. Estymator

bªedu jest równie» podany we wzorze (93). Oczywi±cie wzór ten jest dany dla T ≠ 0.

WSPÓŠCZYNNIK C CRAMERA

X

C ≡ √

2

n · min[(r − 1)(c − 1)] ± σ(X 2 )

2 · n · min(r − 1, c − 1) · C

(94)

Wspóªczynnik C Cramera zachowuje sie podobnie jak wspóªczynnik Czuprowa, tzn.

znika gdy nie ma zale»no±ci pomiedzy zmiennymi a ro±nie gdy zale»no±¢ taka pojawia sie

ale ma te zalete, »e jego maksymalna warto±¢ jest równa +1 dla dowolnej liczby wierszy i

kolumn. Bªad tego wspóªczynnika podany we wzorze (94) równie» jest okre±lony tylko

dla C ≠ 0.

WSPÓŠCZYNNIK P PEARSONA:

P ≡ √

X2

X 2 + n ± n · σ(X 2 )

(95)

2 ·

√X 2 · (n + X 2 ) 3

Wspóªczynnik P jest zawsze mniejszy od jedno±ci. Dla zmiennych caªkowicie niezale»nych

ten wspóªczynnik zeruje sie ale przy istnieniu zwiazku miedzy zmiennymi jego

warto±¢ zale»y od liczby wierszy i kolumn tablicy kontyngencji. Na przykªad, dla tablic

2x2 przyjmuje warto±¢ 1 √

2

.

Powy»sze trzy wspóªczynniki wykorzystuja wªasno±ci statystyki X 2 a jedynie sa w

ró»ny sposób normowane. Dzieki jednoznacznej normalizacji (zero dla zmiennych niezale»-

nych, jeden dla najsilniejszego zwiazku) najbardziej wygodnym wspóªczynnikiem wydaje

sie by¢ wspóªczynnik C - Cramera. W literaturze mo»na jednak spotka¢ sie z u»ywaniem

wszystkich trzech wspóªczynników.

Poni»ej podamy jeszcze jeden wspóªczynnik u»ywany do okre±lania siªy zwiazku pomiedzy

nominalnymi zmiennymi jako±ciowymi nie wykorzystujacy statystyki X 2 . Jest to wielko±¢

nazywana wspóªczynnikiem Q - Kendalla mimo i» Kendall gªosi autorstwo Yule'a

[10].

SMOP-2 B.Kamys: 2007/08 131

WSPÓŠCZYNNIK Q - KENDALLA stosowany tylko dla tablic kontyngencji 2x2

zdeniowany jest nastepujacym wzorem:

Q ≡ m 1 · (n 2 − m 2 ) − m 2 · (n 1 − m 1 )

m 1 · (n 2 − m 2 ) + m 2 · (n 1 − m 1 )

(96)

Jest to jak wida¢ unormowany wyznacznik tablicy kontyngencji. Dlatego przyjmuje

warto±ci z przedziaªu [−1, +1], przy czym dla zmiennych niezale»nych zeruje sie a

dla najsilniejszego zwiazku Q = ±1.

SMOP-2 B.Kamys: 2007/08 132

11.11 Test istotno±ci dla wspóªczynnika korelacji Pearsona

Wspóªczynnik korelacji ϱ(X, Y ), który omawiali±my przy deniowaniu macierzy kowariancji

• mówi o istnieniu zale»no±ci liniowej zmiennych X i Y gdy jego warto±¢ zbli»ona

jest (co do moduªu) do jedno±ci,

• zeruje si¦, gdy zmienne X i Y s¡ niezale»ne statystycznie (tw. odwrotne nie zawsze

jest sªuszne, tj. zerowanie si¦ wspóªczynnika korelacji jest warunkiem koniecznym a

nie wystarczaj¡cym niezale»no±ci zmiennych).

Wa»ne jest wi¦c badanie nast¦puj¡cych hipotez:

1. H 0 : ϱ = ϱ 0

2. H 0 : ϱ = 0

Estymatorem wspóªczynnika korelacji T n (ϱ) jest

r ≡

n∑

i=1

√ [ n∑

(x i − ¯x) (y i − ȳ)

] [ n∑

].

(x i − ¯x) 2 (y i − ȳ) 2

i=1

R.A. Fisher pokazaª, »e je»eli zmienne X i Y pochodz¡ z dwuwymiarowego rozkªadu

Gaussa to mo»na poda¢ ±cisªy wzór na rozkªad estymatora r wspóªczynnika korelacji ϱ

sªuszny dla wszystkich warto±ci ϱ (z wyj¡tkiem |ϱ| = 1) i dla wszystkich rozmiarów

próby n:

f (r) = n − 2

π

(

1 − ϱ

2 ) n−1

2

(

1 − r

2 ) n−4

2

∫1

0

t n−2 dt

(1 − rϱt) n−1 √ 1 − t 2

Rozkªad ten mo»e by¢ u»yty do numerycznego obliczania odpowiednich warto±ci krytycznych

r(n, α) przy ustalonej warto±ci ϱ. Ze wzgl¦du na to, »e tego typu obliczenia

mog¡ by¢ skomplikowane a stosowanie tablic lub procedur obliczania kwantyli rozkªadu

standardowego normalnego jest powszechnie znane wi¦c najcz¦±ciej nie korzysta si¦ z

powy»szego wzoru lecz posªuguje si¦ wynikami twierdzenia podanego poni»ej (tak»e udowodnionego

przez R.A. Fishera).

TWIERDZENIE: Je»eli r jest estymatorem wspóªczynnika korelacji z próby prostej o

liczebno±ci n > 3 z populacji o dwuwymiarowym rozkªadzie normalnym i wspóªczynniku

korelacji ϱ to zmienna z zdeniowna poni»ej ma w przybli»eniu standardowy rozkªad

normalny: f(z) = N(0, 1):

z = √ [ 1

n − 3

2

]

(1 + r) (1 − ϱ)

ln

(1 − r) (1 + ϱ) − ϱ

2 (n − 1)

SMOP-2 B.Kamys: 2007/08 133

ad (1) H 0 : ϱ = ϱ 0 Stosujemy powy»sze przeksztaªcenie i w zale»no±ci od hipotezy

alternatywnej okre±lamy obszar krytyczny dla danego poziomu istotno±ci α.

H 1

Obszar krytyczny

ϱ ≠ ϱ 0 z < z α/2

⋃ z > z1−α/2

ϱ > ϱ 0

z > z 1−α

ϱ < ϱ 0

z < z α

ad (2) H 0 : ϱ = 0 Dla tej szczególnej warto±ci ϱ 0 mo»na u»y¢ tej samej metody jak

dla innych, rozwa»anych powy»ej warto±ci ale mo»na skorzysta¢ z innego przeksztaªcenia:

TWIERDZENIE: Je»eli badana próba prosta o liczebno±ci n pochodzi z dwuwymiarowej

populacji normalnej, w której ϱ = 0, to zmienna losowa v zdeniowana

poni»ej ma rozkªad Studenta o n − 2 stopniach swobody.

v =

√ n − 2 · r

√ 1 − r

2

Korzystamy wówczas z poni»szych reguª okre±lania obszaru krytycznego:

H 1

Obszar krytyczny

ϱ ≠ 0 v < t (n−2); α/2

⋃ v > t(n−2); 1−α/2

ϱ > 0

ϱ < 0

v > t (n−2); 1−α

v < t (n−2); α

SMOP-2 B.Kamys: 2007/08 134

11.12 Test istotno±ci dla stosunku korelacyjnego

W przypadku, gdy badamy nieliniowy zwi¡zek pomi¦dzy zmiennymi X i Y zastosowanie

wspóªczynnika korelacji liniowej ϱ(x, y) (Pearsona) nie daje nam peªnej informacji o

postulowanym zwi¡zku lub o jego braku. Spowodowane jest to tym, »e zerowanie si¦

tego wspóªczynnika korelacji mo»e zachodzi¢ równie» wtedy gdy istnieje ±cisªy zwi¡zek

nieliniowy pomi¦dzy zmiennymi.

Dla siªy nieliniowego zwi¡zku statystycznego pomi¦dzy ilo±ciowymi zmiennymi losowymi

X i Y stosuje si¦ wi¦c inny wielko±ci. S¡ nimi:

1. Wspóªczynnik zgodno±ci ϕ 2

2. Wspóªczynnik korelacji krzywoliniowej R ≡ √ 1 − ϕ 2

3. Stosunek korelacyjny zmiennej Y wzgl¦dem X: H 2 X|Y

4. Stosunek korelacyjny zmiennej X wzgl¦dem Y: H 2 Y |X

ad (1): Wspóªczynnik zgodno±ci deniuje si¦ jako:

ϕ 2 =

n∑

i=1

n∑

[y i − f(x i )] 2

i=1

[y i − ȳ] 2

gdzie y i i x i to zmierzone pary warto±ci zmiennych Y i X wyst¦puj¡ce w próbie o

liczebno±ci n , ȳ to ±rednia arytmetyczna warto±ci zmiennej Y w próbie a f(x) to funkcja

regresji z parametrami dobranymi metod¡ najmniejszych kwadratów.

Zgodnie z podstawow¡ wªasno±ci¡ funkcji regresji i metody najmniejszych kwadratów

suma kwadratów w liczniku musi by¢ nie wi¦ksza od sumy kwadratów w mianowniku a

wi¦c wspóªczynnik zgodno±ci musi by¢ mniejszy lub równy jedno±ci a jako iloraz nieujemnych

liczb musi by¢ nieujemny:

0 ≤ ϕ 2 ≤ 1.

Oczywi±cie im lepiej funkcja regresji odtwarza zwi¡zek Y (X) tym mniejszy jest wspóªczynnik

zgodno±ci.

ad (2): Wspóªczynnik korelacji krzywoliniowej R równie» przyjmuje warto±ci z tego

samego zakresu co wspóªczynnik zgodno±ci przy czym cz¦±ciej u»ywa si¦ kwadratu tego

wspóªczynnika:

R 2 = 1 −

n∑

i=1

n∑

[y i − f(x i )] 2

i=1

[y i − ȳ] 2

SMOP-2 B.Kamys: 2007/08 135

Wida¢, »e w przypadku gdy funkcja regresji bardzo dobrze opisuje zale»no±¢ Y (X)

to uªamek znika i R 2 ≈ 1. Co wi¦cej, mo»na pokaza¢, »e dla liniowego zwi¡zku

Y(X) wspóªczynnik R 2 jest równy kwadratowi zwykªego wspóªczynnika korelacji

Pearsona r 2 .

ad (3): H 2 Y |X

- stosunek korelacyjny zmiennej Y wzgl¦dem zmiennej X.

Oba powy»sze wspóªczynniki, tj. ϕ 2 i R 2 mog¡ by¢ zastosowane do okre±lenia jako±ci

opisu zale»no±ci Y (X) przez funkcj¦ regresji ale aby to wykona¢ musimy zna¢ parametry

funkcji regresji. Z tego powodu, nie jeste±my w stanie powiedzie¢ bez dopasowania warto±ci

parametrów tej funkcji, czy zmienne X i Y s¡ powi¡zane nieliniowym zwi¡zkiem

statystycznym.

Aby pokona¢ t¦ trudno±¢ K. Pearson zaproponowaª zastosowanie, tzw.

korelacyjnego:

stosunku

H 2 Y |X

E [E(Y |X) − E(Y )]2

≡ ,

σ 2 (Y )

którego estymatorem jest

η 2 Y |X =

l∑

i=1

m∑

k=1

[ȳ(¯x i ) − ȳ] 2 n i·

,

[ȳ k − ȳ] 2 n·k

gdzie prób¦ (x j , y j ), j = 1, ..., n podzielono na mniejsze próby o liczebno±ciach n i,k , i =

1, ...l, k = 1, ..., m, przy czym ka»da grupa ma centrum (¯x i , ȳ k ) a suma liczebno±ci

wynosi n: ∑ i,k

n i,k = n.

Symbol ȳ(¯x i ) jest ±redni¡ warunkow¡, tj. ±redni¡ ze zmiennej (y|¯x i ) a symbole

n i· = ∑ n i,k oraz n·k = ∑ n i,k .

k

i

Estymator stosunku korelacyjnego mo»e by¢ policzony tak»e wg nast¦puj¡cego wzoru:

η 2 Y |X = 1 −

l∑ m∑

[ȳ k − ȳ(¯x i )] 2 n ik

i=1 k=1

m∑

k=1

[ȳ k − ȳ] 2 n·k

Z tego wzoru wida¢, »e η 2 Y |X

= 1 wtedy i tylko wtedy, gdy ȳ k = ȳ(¯x i ) dla ka»dej

niezerowej liczebno±ci n i,k . Zachodzi to tylko wtedy, gdy dla ka»dej warto±ci x i zmienna

SMOP-2 B.Kamys: 2007/08 136

Y przyjmuje tylko jedn¡ warto±¢ a wi¦c istnieje dla caªej próby zwi¡zek funkcyjny y i =

y(x i ). Z kolei z pierwszego wzoru na stosunek korelacyjny wida¢, »e b¦dzie si¦ on zerowaª

wtedy i tylko wtedy gdy ȳ(¯x i ) − ȳ a wi¦c gdy zmienna y przyjmuje t¦ sam¡ warto±¢ ȳ

dla wszystkich warto±ci x. Wtedy oczywi±cie zmienne s¡ nieskorelowane.

Z tych rozwa»a« wynika, »e:

0 ≤ η 2 Y |X ≤ 1.

ad (4.): Analogicznie do stosunku korelacyjnego zmiennej Y wzgl¦dem X mo»na

stworzy¢ niezale»ny od niego wspóªczynnik korelacyjny zmiennej X wzgl¦dem zmiennej

Y : H 2 X|Y . H 2 X|Y

E [E(X|Y ) − E(X)]2

≡ ,

σ 2 (X)

którego estymator liczy si¦ wg poni»szych wzorów:

k=1

l∑

η 2 X|Y = m∑

i=1

[¯x(ȳ k ) − ¯x] 2 n·k

[¯x i − ¯x] 2 n i·

= 1 −

m∑ l∑

[¯x i − ¯x(ȳ k )] 2 n ik

k=1 i=1

l∑

i=1

[¯x i − ¯x] 2 n i·

Mo»na pokaza¢, »e zachodz¡ nast¦puj¡ce relacje pomi¦dzy stosunkami korelacyjnymi

i wspóªczynnikiem korelacji krzywoliniowej R:

R 2 ≤ η 2 X|Y

∩ R 2 ≤ η 2 Y |X

Wystarczy wi¦c pokaza¢, »e którykolwiek stosunek korelacyjny zeruje si¦ aby równie»

zerowaª si¦ wspóªczynnik korelacji krzywoliniowej.

Hipotez¦: H 0 : H 2 Y |X

= 0 testuje si¦ wprowadzaj¡c statystyk¦ testow¡:

F = η2 Y |X n − l

1 − ηY 2 |X

l − 1 ,

SMOP-2 B.Kamys: 2007/08 137

która ma rozkªad F (l−1),(n−l) tj. rozkªad Fishera-Snedecora o (l − 1), (n − l) stopniach swobody.

Obszar krytyczny: prawostronny, tj. F > (F (l−1),(n−l) ) 1−α gdzie α jest poziomem istotno±ci.

Analogicznie przebiega testowanie hipotezy: H 0 : H X|Y = 0.

Jako statystyk¦ testow¡ bierze si¦:

F =

η2 X|Y

1 − η 2 X|Y

n − m

m − 1 ,

która ma rozkªad F (m−1),(n−m) , tj. rozkªad Fishera-Snedecora o (m − 1), (n − m)

stopniach swobody. Oczywi±cie obszar krytyczny jest te» prawostronny.

SMOP-2 B.Kamys: 2007/08 138

12 METODA MONTE CARLO

Metoda ta polega na przyporzadkowaniu problemowi matematycznemu lub przyrodniczemu

równowa»nego problemu statystycznego i rozwiazaniu go metodami statystyki.

Szczególnie po»yteczna okazaªa sie w przypadkach, gdy szczegóªy badanego problemu

sa zrozumiaªe i daªyby sie rozwiaza¢ analitycznie ale rachunki takie sa zbyt czasochªonne,

np. policzenie caªek wielokrotnych gdy wymiar przestrzeni caªkowania jest du»y czy te»

±ledzenie losu neutronów przechodzacych przez niejednorodne ±rodowisko takie jak w

reaktorze jadrowym i jego obudowie. Ten ostatni przykªad, tj. ±ledzenie losu neutronów

przy ªa«cuchowej reakcji rozszczepienia prowadzacej do wybuchu bomby atomowej

byª pierwszym zastosowaniem tej metody zaproponowanej przez J. von Neumanna i S.

Ulama.

Zwykle udaje sie zastapi¢ poszukiwanie rozwiazania oryginalnego problemu przez estymacje

warto±ci oczekiwanej pewnej funkcji na podstawie próby statystycznej skªadajacej

sie z zespoªu warto±ci tej funkcji obliczonego dla wylosowanych warto±ci argumentu.

W zwiazku z tym pojawiaja sie nastepujace pytania:

1. Jak sformuªowa¢ problem statystyczny, tzn. jak ma wyglada¢ funkcja dla której

poszukujemy warto±ci oczekiwanej ? Bierzemy przy tym pod uwage:

• Jak zminimalizowa¢ blad estymacji przy ustalonym rozmiarze próby statystycznej

?

• Z jakim rozkªadem prawdopodobie«stwa (gesto±ci prawdopodobie«stwa) nale»y

losowa¢ warto±ci argumentu funkcji ?

2. W jaki sposób przeprowadzi¢ generacje liczb losowych ?

Odpowiedzi na te pytania zale»a od rozwiazywanego problemu. Poni»ej beda przedstawione

przykªady jak mo»na dobiera¢ posta¢ funkcji i jakie pojawiaja sie wtedy rozkªady

prawdopodobie«stwa gdy stosuje sie metode Monte Carlo do liczenia caªek.

12.1 LICZENIE CAŠEK METODA MONTE CARLO

Caªke

I ≡

mo»emy zapisa¢ w równowa»nej postaci

I =

∫ b

a

∫ b

a

f(x)dx

g(x) · f(x) · dx

g(x)

∫

gdzie funkcja g(x) > 0 oraz b g(x)dx = 1 - czyli g(x) jest pewna funkcja gesto±ci

prawdopodobie«stwa na odcinku [a,b]).

SMOP-2 B.Kamys: 2007/08 139

Porównujac drugi wzór na caªke I ze wzorem na warto±¢ oczekiwana funkcji f(x)

g(x) :

{ } f(x)

E ≡

g(x)

∫ b

a

dx · g(x) ·

( ) f(x)

g(x)

dla gesto±ci prawdopo-

wida¢, »e caªka jest po prostu warto±cia oczekiwana funkcji

dobie«stwa g(x).

f(x)

g(x)

W szczególno±ci jako funkcje g(x) mo»emy wzia¢ funkcje gesto±ci prawdopodobie«stwa

rozkªadu jednorodnego na odcinku [a,b] i dostaniemy:

I =

∫b

a

1

dx · · (b − a)f(x)

(b − a)

Estymatorem powy»szej warto±ci oczekiwanej jest ±rednia arytmetyczna

T n (I) = (b − a) · 1 n∑

f(x i )

n i=1

gdzie argumenty x i sa losowane z rozkªadem jednorodnym (równomiernym) na odcinku

[a,b]. Jest to tzw. podstawowa metoda liczenia caªki metoda Monte Carlo.

Dla wygody rozwa»a sie zwykle caªki liczone na odcinku [0,1] bo wtedy nie musimy

jawnie wypisywa¢ dªugo±ci przedziaªu caªkowania a mo»na zawsze przez

liniowa zmiane zmiennych przej±¢ do dowolnego odcinka [a,b]. W poni»szych

rozwa»aniach bedziemy stosowa¢ te konwencje.

Wzór na estymator caªki jest wtedy po prostu ±rednia arytmetyczna warto±ci funkcji

podcaªkowej gdzie argumenty x i sa losowane z rozkªadem jednorodnym na przedziale

[0,1].

Bªad estymatora caªki to bªad ±redniej arytmetycznej :

{ }

1

σ{I} = √ n∑

σ 2 f(x i )

n i=1

= √ 1 ∑ n σ 2 {f(x

n 2

i )}

i=1

√

n · σ2 {f}

=

n 2

= σ{f} √ n

SMOP-2 B.Kamys: 2007/08 140

Niestety ten wzór nie mo»e by¢ w praktyce stosowany bo liczenie σ{f} wymagaªoby

znajomo±ci warto±ci szukanej caªki:

σ 2 {f} =

=

∫ 1

⎡

∫ 1 ⎤2

f 2 (x)dx − ⎣ f(x)dx⎦

0

∫1

0

f 2 (x)dx − I 2

Dlatego dla liczenia estymatora bªedu caªki S(I) zamiast σ{f} u»ywa sie estymatora

S{f} liczonego wg wzoru:

S (f) =

√ 1 n∑

[f(x i ) − T n (I)] 2

n − 1 i=1

S (I) = S (f) √ n

gdzie T n (I) jest równe (ze wzgledu na jednostkowa dªugo±¢ przedziaªu caªkowania) ±redniej

arytmetycznej z warto±ci funkcji f(x).

Poniewa» przy liczeniu caªek chcieliby±my wiedzie¢ nie tylko jakie jest odchylenie standardowe

estymatora caªki, lecz chcieliby±my okre±li¢ przedziaª gdzie prawie na pewno

bedzie znajdowa¢ sie prawdziwa warto±¢ caªki to przyjeªo sie jako bªad caªki bra¢ po-

ªowe przedziaªu ufno±ci na poziomie ufno±ci 0,9545, który równy jest podwojonej warto±ci

odchylenia standardowego przy zaªo»eniu, »e ±rednia arytmetyczna ma rozkªad normalny.

A wiec jako bªad caªki bierzemy wielko±¢:

2S(f)

√ n

Z powy»szego wzoru wida¢, »e bªad liczenia caªki metoda Monte Carlo maleje proporcjonalnie

do odwrotno±ci pierwiastka z liczby obliczanych warto±ci funkcji podcaªkowej

1/ √ n. Dzieje sie tak niezale»nie od tego czy caªka jest liczona w przestrzeni

jedno- czy wielowymiarowej . Na tym, przede wszystkim, polega przewaga metody

Monte Carlo nad innymi metodami liczenia caªki.

W przypadku caªki jednokrotnej taka przewaga nie ujawnia sie bo istnieje wiele innych

metod numerycznych takich jak np. metoda Simpsona, Romberga czy Gaussa,

które sa bardziej precyzyjne od metody Monte Carlo przy tej samej liczbie wyliczonych

warto±ci funkcji podcaªkowej. Jednak»e gdyby±my chcieli zastosowa¢ która± z tych metod

do caªki wielokrotnej to oka»e sie, »e otrzymanie maªego bªedu caªki wymaga przy

SMOP-2 B.Kamys: 2007/08 141

zwiekszaniu wymiaru przestrzeni argumentów zwiekszania liczby oblicze« funkcji podcaªkowej

w sposób proporcjonalny do n w , gdzie n jest liczba warto±ci jednego argumentu

a w jest wymiarem przestrzeni argumentów. W odró»nieniu od tych metod wielko±¢

bªedu estymatora caªki uzyskanego metoda Monte Carlo maleje tak jak bªad ±redniej

arytmetycznej czyli proporcjonalnie do 1/ √ n niezale»nie od wymiaru przestrzeni

argumentów. A wiec zwiekszanie wymiaru przestrzeni argumentów funkcji podcaªkowej

nie musi przedªu»a¢ czasu obliczenia caªki.

Rozwa»my prosty przykªad: do obliczenia caªki 10 krotnej, wyliczajac funkcje podcaªkowa

10 razy dla ka»dego wymiaru musieliby±my obliczy¢ funkcje podcaªkowa 10 10 razy.

Je»eli potramy w ciagu sekundy obliczy¢ funkcje podcaªkowa 10 000 razy to znalezienie

warto±ci caªki wymagaªoby 1000 000 sekund czyli okoªo 12 dni i nocy. Tymczasem stosujac

metode Monte Carlo, mo»emy oszacowa¢ warto±¢ caªki z dobr¡ dokªadno±cia (równ¡

σ(f)/1000) wyliczajac 1000 000 razy funkcje podcaªkowa, tzn. skracajac czas oblicze«

do 100 sekund.

12.2 ZMNIEJSZANIE BŠEDU CAŠKI

Podstawowa metoda stosowana w tym celu jest tzw. metoda ±redniej wa»onej (zwana

po angielsku importance sampling). Polega ona na tym, »e zamiast losowa¢ argument

funkcji podcaªkowej z rozkªadem jednorodnym losuje sie go z rozkªadem g(x) mo»liwie

podobnym do funkcji podcaªkowej . Wtedy estymatorem caªki na przedziale [0,1]

z funkcji f(x) jest ±rednia wa»ona:

T n (I) = 1 n∑ f(x i )

n i=1 g(x i )

gdzie argumenty x i losowane sa cze±ciej tam gdzie funkcja f(x) jest du»a a wiec przyczynki

do caªki sa znaczace stad angielska nazwa losowanie istotne.

Mo»na pokaza¢, »e zastosowanie tej metody zawsze daje mniejszy bªad caªki ni» otrzymywany

w metodzie podstawowej.

Inna metoda jest tzw. losowanie warstwowe polegajace na rozbiciu przedziaªu

caªkowania na mniejsze przedziaªy, w których funkcja podcaªkowa zmienia sie mo»liwie

maªo jest prawie staªa. Wtedy u»ycie najprostszej metody podstawowej w ka»dym

z przedziaªów zdecydowanie zmniejsza wariancje (bªad) caªki. Wida¢ to ewidentnie dla

funkcji przedziaªami staªej. Tam metoda warstwowa daje bªad równy zeru (!).

Tu tak»e mo»na pokaza¢, »e bªad caªki jest zawsze mniejszy lub równy od bªedu metody

podstawowej.

SMOP-2 B.Kamys: 2007/08 142

Metoda zmiennych kontrolnych to szukanie funkcji h(x) podobnej do f(x) ale

takiej, »e caªka z h(x) na przedziale [0,1] jest znana. Wtedy mo»emy liczy¢ podstawowa

metoda Monte Carlo caªke z ró»nicy f(x) − h(x). Jest to opªacalne je»eli liczenie

funkcji h(x) nie jest zbyt pracochªonne. Zwykle przyjmuje sie, »e wspóªczynnik korelacji

pomiedzy funkcjami f(x) i h(x) powinien speªnia¢ relacje: ρ(f(x), h(x)) ≥ √ 1 − 1 k

gdzie k oznacza ile razy bardziej pracochªonne jest policzenie ró»nicy f(x) − h(x) od

policzenia samej funkcji f(x).

Metoda zmiennych antytetycznych

Je»eli f 1 (ξ) i f 2 (η) sa dwoma estymatorami liczonej powy»ej caªki to ich ±rednia

arytmetyczna g 2 te» bedzie estymatorem caªki:

g 2 ≡ 1 2 (f 1 + f 2 ),

przy czym je»eli oba estymatory f 1 i f 2 sa nieobcia»one to i estymator g 2 jest nieobcia»ony.

Z drugiej strony wariancja estymatora g 2 bedzie zale»e¢ nie tylko od wariancji estymatorów

f 1 i f 2 ale tak»e od ich kowariancji:

σ 2 (g 2 ) ≡ 1 4 (σ2 (f 1 ) + σ 2 (f 2 )) + 1 2 cov(f 1, f 2 ).

Je»eli kowariancja estymatorów bedzie ujemna i du»a co do moduªu, to wariancja estymatora

g 2 mo»e by¢ mniejsza od wariancji ka»dego z estymatorów f 1 i f 2 . Powy»sze

rozumowanie mo»na oczywi±cie rozszerzy¢ na ±rednia m estymatorów caªki.

PRZYKŠAD:

Je»eli funkcja podcaªkowa f(x) jest monotoniczna to jako dwa wy»ej omawiane estymatory

mo»emy wzia¢ nastepujace funkcje: f 1 = f(x) i f 2 = f(1 − x). Wtedy

estymator g 2 bedzie bardziej zbli»ony do staªej na odcinku [0,1] ni» ka»dy z dwu skªadników.

To spowoduje, »e jego wariancja bedzie mniejsza od wariancji ka»dego ze skªadników

a o to nam chodzi.

Dla funkcji monotonicznej na caªym przedziale caªkowania mo»na dobra¢ inny wygodny

estymator g 2 , który bedzie ±rednia wa»ona a nie ±rednia arytmetyczna a wagi

dobierze sie tak aby najbardziej zmniejszy¢ wariancje estymatora g 2 :

g 2 ≡ α · f(αx) + (1 − α) · f(1 − (1 − α)x) gdzie 0 < α < 1.

Znalezienie optymalnej warto±ci wspóªczynnika α mo»e by¢ bardzo trudne, wiec czesto

zadawalamy sie zastosowaniem nastepujacego, prostszego przepisu, który zwykle daje porównywalnie

maªa wariancje caªki jak optymalna warto±¢ α. Jest to rozwiazanie równania:

f(α) = (1 − α) · f(1) + α · f(0)

Powy»sze przykªady liczenia caªki metoda Monte Carlo nie wyczerpuja wszystkich

stosowanych wariantów tej metody lecz sªu»a raczej do ilustracji na czym polega problem

doboru funkcji, dla której szukamy warto±ci oczekiwanej.

SMOP-2 B.Kamys: 2007/08 143

12.3 GENERACJA LICZB LOSOWYCH

Przy obliczeniach metoda Monte Carlo konieczna jest generacja liczb losowych o po»adanym

rozkªadzie (gesto±ci) prawdopodobie«stwa. Liczby te w praktyce znajduje sie przy pomocy

odpowiednich programów komputerowych co powoduje, »e ciagi liczb losowych otrzymane

z tych samych startowych parametrów sa powtarzalne a wiec nie sa naprawde losowe. Z

tej przyczyny u»ywa sie czesto okre±lenia liczby pseudolosowe.

Najwa»niejszym ze stosowanych rozkªadów jest rozkªad jednorodny(równomierny,

jednostajny), gdy» przy jego u»yciu mo»na wygenerowa¢ liczby pseudolosowe o innych

po»adanych rozkªadach prawdopodobie«stwa. Jak bedzie pokazane poni»ej istnieja metody

pozwalajace na stworzenie prostych i krótkich programów komputerowych do generacji

liczb pseudolosowych o rozkªadzie jednorodnym. Mo»na wiec samemu napisa¢

taki program. Okazuje sie jednak, »e bezpieczniej jest korzysta¢ z gotowych, o-

pracowanych przez specjalistów procedur , gdy» speªniaja one nie tylko podstawowe

wymagania narzucane na liczby pseudolosowe ale uwzgledniaja tak»e bardziej zaawansowane

warunki, które musza by¢ zapewnione przy niektórych obliczeniach. Takimi godnymi

polecenia generatorami liczb losowych sa na przykªad procedury RANLUX i RAN-

MAR z biblioteki procedur CERN. Pierwszy z tych generatorów zostaª napisany przez

F. Jamesa (Comp. Phys. Comm. 79 (1994) 111) i oznaczony jest symbolem V115 w bibliotece

procedur CERN a drugi (stworzony w oparciu o raport G. Marsaglia, A. Zaman,

and W.W. Tsang, Towards a Universal Random Number Generator, Supercomputer Computations

Research Institute, Florida State University technical report FSU-SCRI-87-50

(1987)) przez F. Carminati i F. Jamesa i wystepuje jako procedura V113 w bibliotece

procedur CERN.

12.3.1 Generacja liczb o rozkªadzie równomiernym

W olbrzymiej wiekszo±ci przypadków ciagi liczb pseudolosowych tworzone sa przy pomocy

zwiazków rekurencyjnych. Najlepiej zbadanym algorytmem jest tzw. metoda kongruencyjna,

która generuje kolejna liczbe pseudolosowa w oparciu o k + 1 poprzednich wg

wzoru:

x n+1 = (a 0 x n + a 1 x n−1 + . . . + a k x n−k )(modM),

gdzie zapis a(mod b) nale»y rozumie¢ jako reszte z dzielenia liczby a przez liczbe b.

Liczba M a tak»e wszystkie liczby a i oraz x i sa liczbami caªkowitymi z przedziaªu [0, M).

Generatory stanowiace szczególne przypadki powy»szego wzoru maja swoje specjalne

nazwy. Generatory stosujace wzór:

x n+1 = x n + x n−1 (modM)

nazywane sa generatorami Fibonacciego,

te, które u»ywaja relacji:

x n+1 = a 0 x n (modM)

SMOP-2 B.Kamys: 2007/08 144

okre±la sie mianem generatorów multiplikatywnych a oparte o wyra»enie:

x n+1 = a 0 x n + a 1 (modM)

nosza nazwe generatorów mieszanych.

Wszystkie ciagi liczb pseudolosowych sa ciagami okresowymi. Dobry generator powinien

mie¢ mo»liwie dªugi okres, tak dªugi aby w czasie wykonywania prac obliczeniowych

wykorzystywa¢ tylko niewielka cze±¢ okresu. Maksymalny mo»liwy okres ciagu liczb losowych

otrzymanych ogólna metoda kongruencyjna nie mo»e przekroczy¢ M k+1 . A wiec

maksymalny okres generatora Fibonacciego to M 2 a generatora multiplikatywnego i mieszanego

nie przekracza M. Te maksymalne warto±ci sa osiagane tylko przy odpowiednim

doborze wspóªczynników formuªy rekurencyjnej. Na przykªad, mo»na pokaza¢, »e dªugo±¢

okresu ciagu liczb losowych generatora mieszanego wynosi M wtedy i tylko wtedy, gdy

speªnione sa nastepujace warunki:

• a 1 i M nie maja wspólnych dzielników,

• (a 0 − 1) jest wielokrotno±cia liczby pierwszej, która jest dzielnikiem liczby M,

• (a 0 − 1) jest wielokrotno±cia liczby 4, o ile M jest te» wielokrotno±cia liczby 4.

Od dobrego generatora, »adamy równie» aby mo»na byªo kolejne liczby pseudolosowe

uwa»a¢ za niezale»ne. W szczególno±ci powinny by¢ niezale»ne liniowo. Mo»emy to

sprawdzi¢ liczac wspóªczynniki korelacji pomiedzy parami liczb:

ϱ j ≡ ϱ(x i , x i+j ).

Wspóªczynniki korelacji ϱ j ,j=1,2,... powinny by¢ równe zero.

Zamiast liczy¢ wspóªczynniki korelacji mo»na niezale»no±¢ liniowa generowanych liczb

sprawdza¢ przez wykonanie pewnych kontrolnych zada« rachunkowych. Jednym z

najprostszych zada« jest liczenie metoda Monte Carlo (np. podstawowa metoda szukania

caªki) objeto±ci kuli o jednostkowym promieniu w przestrzeni N-wymiarowej. Objeto±¢

kuli wynosi:

V N = 2 π N/2

N Γ(N/2) ,

gdzie Γ(N/2) to funkcja gamma Eulera. Funkcja ta przyjmuje warto±¢ √ π dla argumentu

1/2 i mo»e by¢ liczona rekurencyjnie wg wzoru Γ(z + 1) = z · Γ(z). Nawet

niewielka korelacja pomiedzy generowanymi liczbami pseudolosowymi odbija sie wyra¹nie

na wynikach oblicze« dyskredytujac stosowany generator.

Inna, bardzo wa»na cecha generatora liczb pseudolosowych jest aby te liczby pokrywaªy

przedziaª (0,1) odpowiednio gesto.

Aby to prosto wyja±ni¢ we¹my pod uwage rekurencyjny algorytm, w którym nastepna

liczba generowana jest przy pomocy poprzedniej: x n+1 = f(x n ). Je»eli wykre±limy na

powierzchni jednostkowego kwadratu (czyli kwadratu o wierzchoªkach (0,0),(1,0),(1,1) i

(0,1) poªo»enia punktów o wspóªrzednych (x = x n , y = x n+1 ) to w przypadku prawdziwych

losowych liczb x n i x n+1 powinny one pokrywa¢ równomiernie powierzchnie

SMOP-2 B.Kamys: 2007/08 145

kwadratu. Natomiast dla pseudolosowych liczb dostaniemy punkty le»ace na krzywej

y = f(x). A wiec krzywa y = f(x) musi wielokrotnie i to w maªych odlegªo±ciach

przechodzi¢ przez powierzchnie kwadratu aby zapewni¢ w miare równomierne pokrycie

powierzchni kwadratu. Ten warunek podobnie jak i inne powy»ej wymienione jest jedynie

warunkiem koniecznym aby generator mógª by¢ uznany za zadawalajacy generator.

Dla surowego testowania generatorów wymy±lono caªy zestaw testów, które powinny

by¢ speªniane przez dobre generatory (np. G. Marsaglia, A Current View of Random

Number Generators, Computer Science and Statistics: 16th Symposium on the Interface,

Elsevier (1985)). Wspomniane na wstepie generatory RANLUX, RANMAR przeszªy pomy±lnie

ten zestaw testów.

12.3.2 Generacja liczb losowych o dowolnych rozkªadach prawdopodobie«-

stwa

Je»eli dysponujemy ju» dobrym generatorem liczb pseudolosowych o rozkªadzie równomiernym

na odcinku [0,1] to mo»emy przystapi¢ do generacji liczb o dowolnych rozkªadach

prawdopodobie«stwa. Zacznijmy od generacji zmiennej dyskretnej przyjmujacej

n warto±ci z zadanym rozkªadem prawdopodobie«stwa:

P (x = x i ) = p i ,

dla i = 1, 2, ...n

W tym celu podzielmy przedziaª [0,1] na n przedziaªów o dªugo±ci ∆ i = p i . Litera γ

oznacza¢ bedziemy wygenerowana zmienna o rozkªadzie równomiernym w przedziale [0,1].

Wtedy ªatwo udowodni¢ nastepujace twierdzenie:

TWIERDZENIE

Losowa wielko±¢ x okre±lona formuªa

ma poszukiwany rozkªad dyskretny.

x = x i

gdy γ ∈ ∆ i

DOWÓD:

♦

P (x = x i ) = P (γ ∈ ∆ i ) = ∆ i = p i

UWAGA 1: Powy»sze twierdzenie mo»na uogólni¢ na przypadek zmiennej dyskretnej

przyjmujacej niesko«czenie wiele warto±ci. Wtedy zarówno warto±ci zmiennej x i jak

i prawdopodobie«stwa p i okre±lone sa wzorami okre±lajacymi ich zale»no±¢ od wska¹nika

i. Dla efektywnego losowania wybiera sie pewne n max tak du»e, »e suma prawdopodobie«stw

n∑

max

i=1

p i = 1 − ε

SMOP-2 B.Kamys: 2007/08 146

jest bliska jedno±ci (tj. ε > 0 jest odpowiednio maªe) i dla wska¹ników i = 1, ..., n max

wylicza sie przed generacja x i i p i (przechowujac je nastepnie w pamieci komputera) a

obliczenia wg zadanych wzorów wykonuje sie tylko przy generacji maªo prawdopodobnych

warto±ci x i (dla i > n max ).

♦

UWAGA 2: Czesto przy symulacji zjawisk przyrodniczych spotykamy sie z sytuacja, w

której musimy zdecydowa¢ jakie zdarzenie spo±ród wszystkich mo»liwych i wykluczajacych

sie zdarze« (A 1 , A 2 , ..., A n ) zachodzi w danym momencie je»eli znamy

prawdopodobie«stwa tych zdarze«. Taka sytuacja dokªadnie odpowiada schematowi

wyboru warto±ci zmiennej dyskretnej to»samej ze wska¹nikiem i danego zdarzenia A i o

znanym rozkªadzie prawdopodobie«stw p i , i = 1, ..., n.

♦

Generacja zmiennej ciagªej z zadana funkcja gesto±ci prawdopodobie«stwa f(x).

Zaªó»my, »e zmienna losowa x ma funkcje gesto±ci prawdopodobie«stwa f(x) > 0 w sko«-

czonym lub niesko«czonym przedziale [a,b]. Wtedy dystrybuanta zmiennej x opisywana

jest wzorem:

i jest silnie rosnaca funkcja.

F (x) =

∫x

a

f(t)dt

TWIERDZENIE

Przy tych zaªo»eniach losowa wielko±¢ x okre±lona formuªa

F (x) = γ

ma funkcje gesto±ci prawdopodobie«stwa f(x).

DOWÓD:

Dla silnie rosnacej dystrybuanty F (x) mo»emy napisa¢ nastepujacy zespóª równa« (przez

Y oznaczamy dystrybuante traktowana jako zmienna losowa):

skad wynika, »e

P (y < Y < y + dy) = P (x < X < x + dx)

P (y < Y < y + dy) ≡ g(y)dy

P (x < X < x + dx) ≡ f(x)dx

g(y)dy = f(x)dx

g(F (x))dF (x) = f(x)dx.

SMOP-2 B.Kamys: 2007/08 147

Z denicji dystrybuanty wiadomo, »e:

a wiec

dF (x) = f(x)dx,

g(F (x)) = 1,

czyli dystrybuanta ma rozkªad równomierny w przedziale [0,1].

Stad generujac warto±¢ liczby losowej γ okre±lamy jednoznacznie warto±¢ dystrybuanty

F(x) a co za tym idzie warto±¢ zmiennej x o funkcji gesto±ci prawdopodobie«stwa f(x):

x = F −1 (γ),

gdzie F −1 (x) oznacza funkcje odwrotna do dystrybuanty.

♦

UWAGA 1: Je»eli funkcja gesto±ci prawdopodobie«stwa f(x) zeruje sie na pewnych odcinkach

warto±ci argumentu to dystrybuanta F(x) nie jest funkcja silnie rosnaca i wtedy

rozwiazanie równania F (x) = γ nie jest jednoznaczne (F(x) nie ma funkcji odwrotnej).

Mo»na temu jednak zapobiec zastepujac funkcje odwrotna do dystrybuanty F −1 (x) przez

funkcje G(y) zdeniowana nastepujaco:

G(y) ≡

inf x .

{x|y

SMOP-2 B.Kamys: 2007/08 148

PRZYKŠAD: Generacja zmiennej losowej x o rozkªadzie wykªadniczym dla x ≥ x 0 .

Dystrybuanta:

F (x) =

⎧

⎪⎨ C · exp[−C(x − x 0 )] dla x ≥ x 0

f(x) =

⎪⎩ 0 dla x < 0

∫x

x 0

C · exp[−C(t − x 0 )] · dt = 1 − exp[−C(x − x 0 )].

Rozwiazujemy ze wzgledu na x równanie F (x) = γ, gdzie γ jest pseudolosowa liczba

o rozkªadzie równomiernym w [0,1]. Wstawiajac jawna posta¢ dystrybuanty dostajemy:

1 − exp[−C(x − x 0 )] = γ. Rozwiazanie równania to:

x = x 0 − 1 C

· ln(1 − γ).

♦

Szukanie funkcji odwrotnej do dystrybuanty mo»e by¢ trudne ze wzgledów numerycznych.

Wtedy czesto daje sie upro±ci¢ generacje stosujac tzw. metode superpozycji. U»ywa

sie jej wtedy gdy dystrybuante zmiennej, która chcemy generowa¢ udaje sie przedstawi¢

w postaci kombinacji liniowej dystrybuant o prostszej postaci, takich dla których ªatwo

znale¹¢ funkcje odwrotne. Istotne jest, »e wspóªczynniki kombinacji liniowej (o sko«czonej

lub niesko«czonej liczbie wyrazów) powinny mie¢ warto±ci nale»ace do przedziaªu (0,1)

a ich suma ma by¢ równa jedno±ci, tak aby mo»na je byªo interpretowa¢ jako prawdopodobie«stwa.

Wtedy kombinacje liniowa mo»na interpretowa¢ jako formuªe peªnego

prawdopodobie«stwa:

F (x) = N ∑

N∑

k=1

c k · F k (x)

c k = 1, 0 < c k < 1

W metodzie superpozycji generujemy dwie niezale»ne liczby losowe o rozkªadzie jednorodnym

w [0,1]: γ 1 i γ 2 . Pierwsza z nich stosujemy do losowego wyboru warto±ci wska¹nika k

(zgodnie z przepisem podanym wy»ej dla generacji warto±ci dyskretnej zmiennej) a druga

do generacji warto±ci zmiennej x posiadajacej dystrybuante F k (x).

PRZYKŠAD:

Chcemy generowa¢ warto±ci zmiennej x o funkcji gesto±ci prawdopodobie«stwa:

f(x) = 5 12 · [1 + (x − 1)4 ] dla x ∈ (0, 2).

SMOP-2 B.Kamys: 2007/08 149

Dystrybuanta zmiennej x ma posta¢:

F (x) = 5x

12 + 1 12 · [(x − 1)5 + 1] dla x ∈ (0, 2)

co powoduje, »e dla generacji metoda funkcji odwrotnych musieliby±my rozwiaza¢ równanie

piatego stopnia:

1 (

(x − 1) 5 + 5x + 1 ) = γ.

12

Gdy przedstawimy funkcje gesto±ci prawdopodobie«stwa jako kombinacje liniowa o

wspóªczynnikach c 1 = (5/6) i c 2 = (1/6) dwu funkcji gesto±ci prawdopodobie«stwa:

f(x) =

( 5

6)

· 1 ( ) 1

2 + 6

to dystrybuanta te» bedzie kombinacja liniowa postaci:

F (x) =

( 5

6)

· 5 (x − 1)4

2

· x ( ) 1

2 + · 1

6 2 [(x − 1)5 + 1].

Wtedy generacja metoda funkcji odwrotnej dla obu prostszych dystrybuant daje jawne

wzory na funkcje odwrotne i dostajemy nastepujacy przepis na wyliczenie x:

♦

x = 2γ 2 gdy γ 1 < 5/6

= 1 + 5 √2γ 2 − 1 gdy γ 1 ≥ 5/6.

Obok metody funkcji odwrotnych u»ywa sie dla generacji liczb losowych równie» inne

metody, spo±ród których najbardziej popularna jest metoda eliminacji zaproponowana

przez J. von Neumanna lub metody wykorzystujace wzory typu: x = g(γ 1 , γ 2 , ..., γ n ).

Omówimy je poni»ej.

Metode eliminacji stosuje sie gdy zmienna x ma rozkªad o gesto±ci prawdopodobie«-

stwa opisany funkcja f(x) w przedziale [a,b] i równy zero poza przedziaªem, oraz f(x) jest

ograniczona od góry: f(x) ≤ c. Postepuje sie wtedy wg nastepujacej procedury:

1. Generujemy warto±¢ zmiennej x wg wzoru: x = (b − a)γ 1 + a z rozkªadem

jednorodnym w przedziale [a,b].

2. Generujemy warto±¢ zmiennej y wg wzoru: y = cγ 2 z rozkªadem jednorodnym w

przedziale [0,c].

SMOP-2 B.Kamys: 2007/08 150

3. Sprawdzamy, czy y ≤ f(x). Je»eli tak, to akceptujemy warto±¢ x, w przeciwnym

przypadku para (x,y) jest eliminowana i generacje powtarza sie od nowa.

Metody wykorzystujace przeksztaªcenie x = g(γ 1 , γ 2 , ..., γ n )

Sa to metody, wykorzystujace ró»norodne wªasno±ci statystyczne funkcji wielu niezale»nych

zmiennych losowych o rozkªadzie jednorodnym. Nie ma wiec ogólnego przepisu

na szukanie funkcji g. Poni»ej zostana podane wybrane przykªady zastosowania takiego

przeksztaªcenia.

PRZYKŠAD 1 (jednowymiarowy rozkªad normalny).

Centralne twierdzenie graniczne gªosi, »e suma niezale»nych zmiennych losowych da»y

do rozkªadu normalnego, gdy liczba skªadników w sumie da»y do niesko«czono±ci. Rozkªady

skªadników sumy powinny przy tym speªnia¢ bardzo ogólne warunki, które sa dobrze

speªnione przez rozkªad jednorodny na odcinku [0,1] jaki maja generowane liczby pseudolosowe.

We¹my wiec

Wiadomo, »e

n∑

g(γ 1 , . . . , γ n ) ≡

γ i

i=1

E {γ i } = 1 2

skad wynika, »e

σ 2 {γ i } = 1 12

{ n∑

E {g(γ 1 , . . . , γ n )} = E

σ 2 {g(γ 1 , . . . , γ n )} = σ 2 { n∑

}

∑

γ i = n

i=1

}

∑

γ i = n

i=1 i=1

i=1

E {γ i } = n 2

σ 2 {γ i } = n 12 .

Wykorzystali±my fakt, »e warto±¢ oczekiwana sumy jest (zawsze) równa sumie warto-

±ci oczekiwanych skªadników oraz to »e wariancja sumy niezale»nych zmiennych losowych

jest suma wariancji skªadników.

Dla du»ych n powy»sza suma bedzie (bardzo szybko) zbli»a¢ sie do zmiennej losowej o

rozkªadzie normalnym a po standaryzacji (tj. odjeciu jej warto±ci oczekiwanej i podzieleniu

przez odchylenie standardowe) bedzie miaªa rozkªad standardowy normalny N(0,1).

Ostatecznie stosujemy nastepujacy przepis na generacje zmiennej o rozkªadzie N(0,1):

√

12

g(γ 1 , . . . , γ n ) =

n

(

n∑

γ i − 1 )

i=1 2

SMOP-2 B.Kamys: 2007/08 151

UWAGA: Najcze±ciej stosuje sie powy»szy wzór biorac n = 12, gdy» wtedy wzór przyjmuje

najprostsza posta¢.

UWAGA: W przypadku gdy potrzebne sa warto±ci standaryzowanej zmiennej losowej

wieksze od 6 lub mniejsze od -6 to musimy zwiekszy¢ liczbe skªadników w sumie bo

oczywi±cie suma dwunastu powy»szych skªadników nigdy nie osiagnie takich warto±ci.

PRZYKŠAD 2 (jednowymiarowy rozkªad normalny).

Rozkªad wspólny dwu niezale»nych zmiennych losowych x, y o rozkªadach N(0,1) jest ich

iloczynem i mo»e by¢ zapisany nastepujaco:

f(x, y) = 1 [

2π exp − x2 + y 2 ]

2

Przechodzac do wspóªrzednych biegunowych (r, ϕ) dostajemy:

x = r cos ϕ

y = r sin ϕ

gdzie rozkªad h zmiennych (r, ϕ) wyra»a sie poni»szym wzorem:

h(r, ϕ) = f(r cos ϕ, r sin ϕ) |r| ,

w którym |r| jest moduªem jakobianu transformacji. Wida¢, »e rozkªad zmiennych (r, ϕ)

jest tak»e iloczynem dwu rozkªadów:

h(r, ϕ) =

( 1

2π

)

·

(

r exp

]) [− r2

Sa to; jednorodny rozkªad dla zmiennej ϕ w przedziale [0, 2π] oraz rozkªad o gesto±ci

re −r2 /2

dla nieujemnych r (stad mo»na opu±ci¢ moduª przy r). Oczywi±cie faktoryzacja

rozkªadu h(r, ϕ) oznacza, »e zmienne r i ϕ sa niezale»ne.

Poniewa» zmienna ϕ ma rozkªad równomierny wiec mo»na ja ªatwo generowa¢ stosujac

wzór:

ϕ = 2πγ 1

a zmienna r tak»e generuje sie prosto przez odwracanie dystrybuanty co daje:

√

r = −2 ln γ 2 .

Po takiej generacji mo»na powróci¢ do startowych zmiennych x, y i otrzyma¢ pare zmiennych

niezale»nych o rozkªadzie N(0,1) wg wzorów (x = g 1 (γ 1 , γ 2 ) i y = g 2 (γ 1 , γ 2 )):

2

.

x =

y =

√

−2 ln γ 2 cos 2πγ 1

√

−2 ln γ 2 sin 2πγ 1

SMOP-2 B.Kamys: 2007/08 152

PRZYKŠAD 3 (rozkªad chi-kwadrat o n stopniach swobody)

Jak wiadomo suma kwadratów n niezale»nych zmiennych losowych o rozkªadzie standardowym

normalnym ma rozkªad chi-kwadrat o n stopniach swobody:

n

χ 2 n ≡ ∑

X 2 i .

i=1

Generujac n niezale»nych zmiennych losowych o rozkªadzie N(0,1) jednym z powy»ej

omówionych sposobów mo»emy wstawi¢ je do sumy kwadratów i otrzymamy zmienna

o rozkªadzie chi-kwadrat. Warto rozwa»y¢ dokªadniej przypadek, gdy do generacji zmiennych

N(0,1) zastosuje sie ostatnia z podanych metod. Wtedy dla przypadku, gdy n

jest parzyste wystarczy doda¢ n/2 par kwadratów zmiennych N(0,1) i dostaniemy zdecydowane

uproszczenie wzoru gdy» suma kwadratów sinusa i cosinusa tego samego kata

jest równa jedno±ci a suma kwadratów pierwiastków bedzie równa sumie logarytmów

(ze znakiem minus) stanowiacych wyra»enia podpierwiastkowe a wiec bedzie logarytmem

iloczynu. Gdy n jest nieparzyste mamy n/2 − 1 par zachowujacych sie tak jak dla

n parzystego a dodatkowo musimy doda¢ jedna warto±¢ zmiennej o rozkªadzie N(0,1).

Ostatecznie dostaniemy:

⎧⎪ ⎨

χ 2 n = −2 ln ( )

γ 1 . . . γ n/2 n parzyste

⎪ ⎩ −2 ln ( )

γ 1 . . . γ (n−1)/2 − 2 ln(γ(n+1)/2 ) cos 2 2πγ (n+3)/2 n nieparzyste

PRZYKŠAD 4

Poka»emy, »e zmienna o rozkªadzie gesto±ci prawdopodobie«stwa:

czyli o dystrybuancie

f(x) = n · x n−1 dla x ∈ [0, 1]

F (x) = x n dla x ∈ [0, 1]

mo»na generowa¢ stosujac wzór: x = max(γ 1 , ..., γ n ).

Dowód:

Wprowad¹my funkcje schodkowa zdeniowana nastepujaco:

⎧

⎪⎨ 0 dla z ≤ 0

θ(z) =

⎪⎩ 1 dla z > 0.

SMOP-2 B.Kamys: 2007/08 153

Zmienna losowa g(γ 1 , ..., γ n ) bedzie miaªa dystrybuante F (x) wtedy i tylko wtedy gdy

∫ 1

0

∫ 1

. . .

0

dy 1 . . . dy n θ(x − g(γ 1 , ..., γ n )) = F (x).

Jest oczywiste, »e θ(x − max

1≤i≤n y i) nie równa jest zero wtedy i tylko wtedy gdy równocze±nie

y 1 < x, y 2 < x , ..., y n < x. A wiec caªka

mo»e by¢ zapisana jako:

∫ 1

0

∫ 1

. . .

0

∫ x

0

dy 1 . . . dy n θ(x − max

1≤i≤n y i)

∫ x

. . .

0

dy 1 . . . dy n = x n

a to jest wªa±nie taka dystrybuanta zmiennej x jaka chcieliby±my uzyska¢.

♦

UWAGA

Zmienna losowa o dystrybuancie F (x) = x n dla x ∈ [0, 1] mo»na generowa¢ metoda

funkcji odwrotnych, z której dostajemy:

x = n√ γ.

Porównujac ten wynik z poprzednim dostajemy zaskakujacy wniosek, »e mo»na

zastapi¢ obliczanie pierwiastka n-tego stopnia z liczby losowej o rozkªadzie

równomiernym w [0,1] przez obliczanie maksimum n liczb losowych o takim

rozkªadzie.

12.3.3 Generacja wielowymiarowych zmiennych losowych

Metoda eliminacji mo»e by¢ ªatwo uogólniona na przypadek zmiennych wielowymiarowych.

Je»eli f(x 1 , x 2 , ..., x n ) jest gesto±cia prawdopodobie«stwa dla n-wymiarowej

zmiennej losowej (x 1 , x 2 , ...x n ), która znika poza kostka n-wymiarowa: a i ≤ b i , i =

1, 2, .., n i ograniczona przez liczbe c to przeprowadzamy generacje w nastepujacy sposób:

1. Generujemy warto±¢ zmiennej x 1 , x 2 , ...x n+1 wg wzoru:

x i = (b i − a i )γ i + a i , i = 1, 2, ..., n oraz x n+1 = cγ n+1

z rozkªadem równomiernym w przedziale (a 1 ≤ x 1 ≤ b 1 , ..., a n ≤ x n ≤ b n ) i

ograniczona przez liczbe c: (0 ≤ x n+1 ≤ c)

SMOP-2 B.Kamys: 2007/08 154

2. Sprawdzamy, czy x n+1 ≤ f(x 1 , x 2 , ..., x n ). Je»eli tak, to akceptujemy punkt

x 1 , x 2 , ..., x n , w przeciwnym przypadku punkt ten jest eliminowany i generacje

powtarza sie od nowa.

Wielowymiarowe zmienne losowe mo»emy równie» generowa¢ metoda funkcji odwrotnych.

Nale»y rozwa»y¢ oddzielnie dwa przypadki:

1. Gdy poszczególne skªadowe wielowymiarowej zmiennej sa niezale»ne to ka»da z nich

generuje sie niezale»nie jedna z metod omawianych dla jednowymiarowych zmiennych

losowych.

2. Gdy skªadowe sa zale»ne to korzystamy z poni»szego twierdzenia:

TWIERDZENIE

Gdy γ 1 , γ 2 , ..., γ n sa niezale»nymi liczbami losowymi o rozkªadzie równomiernym w przedziale

[0,1) to zbiór liczb x 1 , x 2 , ..., x n otrzymanych jako rozwiazania nastepujacego

ukªadu równa«:

F 1 (x 1 ) = γ 1

F 2 (x 2 |x 1 ) = γ 2

· · ·

F n (x n |x 1 , ..., x n−1 ) = γ n

ma po»adana gesto±¢ prawdopodobie«stwa f(x 1 , x 2 , ..., x n ).

♦

SMOP-2 B.Kamys: 2007/08 155

12.4 MODELOWANIE KOMPUTEROWE

Zjawiska przyrodnicze, zadania techniczne czy ekonomiczne maja czesto charakter probabilistyczny.

Jest to spowodowane faktem, »e same prawa przyrody maja taki

charakter (mechanika kwantowa) a tak»e tym, »e w danym zagadnieniu uczestniczy

tak wielka liczba obiektów (np. atomów), i» ±cisªy opis nawet w ramach klasycznej

(niekwantowej) teorii jest niemo»liwy. Wtedy logicznym staje sie wprowadzenie pojecia

losowych funkcji czyli takich funkcji rzeczywistego argumentu, »e dla ustalonej warto±ci

argumentu warto±¢ funkcji jest zmienna losowa.

Modelowanie komputerowe polega na szacowaniu przy zastosowaniu komputerów

±rednich charakterystyk funkcji losowych pojawiajacych sie w badanym problemie. Sa

to zwykle warto±ci oczekiwane wielko±ci charakteryzujacych problem, ich wariancje i

kowariancje lub te» rozkªady prawdopodobie«stwa tych wielko±ci.

Czesto zjawiska przyrodnicze, zadania techniczne czy matematyczne opisywane funkcjami

losowymi sa tak skomplikowane, »e modelowanie musi rozpocza¢ sie od stworzenia

uproszczonego modelu badanego zagadnienia a dopiero potem rozwiazuje sie go metodami

probabilistycznymi przy wykorzystaniu komputera. Naturalna metoda, która sªu»y

do tego celu jest metoda Monte Carlo.

Charakterystyczna cecha tej metody jest to, »e czesto wygodniej jest stworzy¢ od

poczatku pewien schemat komputerowych losowa« odpowiadajacych badanym zjawiskom

ni» szuka¢ równa« nimi rzadzacych, a dopiero pó¹niej tworzy¢ uproszczony model probabilistyczny

dla rozwiazania tych równa«. Dzieje sie tak, gdy» czesto potramy przewidzie¢

mo»liwe zdarzenia zachodzace w realnym, badanym problemie oraz wiemy gdzie wystepuja

czynniki losowe, których efekt mo»emy odtworzy¢ przeprowadzajac odpowiednie losowania.

Taki sposób postepowania, tzn. imitacja lub symulacja badanego problemu jest

najprostszym, narzucajacym sie sposobem rozwiazania i tak wªa±nie byªy formuªowane

pierwsze zastosowania metody Monte Carlo.

12.4.1 MODELOWANIE PRZECHODZENIA NEUTRONÓW PRZEZ O‘RO-

DEK SYMULACJA

Jest to jedno z pierwszych zastosowa« metody Monte Carlo do modelowania realnego

procesu zycznego. Dla ustalenia uwagi rozwa»my przechodzenie neutronów przez osªone

reaktora jadrowego. Osªone te traktujemy jako jednorodny o±rodek materialny otoczony

pró»nia (obszarem pozbawionym obiektów z którymi neutrony mogªyby oddziaªywa¢).

Chcemy bada¢ proces przechodzenia neutronów przez materiaª osªony aby zaprojektowa¢

niezawodne i bezpieczne osªony.

Na poczatku nale»y zrobi¢ pewne zaªo»enia, które musza mie¢ uzasadnienie zyczne

ale przede wszystkim sªu»a do tego aby upro±ci¢ badane zagadnienie.

1. Liczba neutronów przechodzacych przez o±rodek jest na tyle niewielka, »e mo»na

zaniedba¢ ich wzajemne oddziaªywanie.

2. Gesto±¢ o±rodka i jego skªad nie zmienia sie w czasie.

SMOP-2 B.Kamys: 2007/08 156

3. Prawdopodobie«stwo ró»nych sposobów oddziaªywania neutronu z o±rodkiem nie

zale»y od tego jaka jest historia ruchu neutronu przez o±rodek.

Te zaªo»enia powoduja, »e badane zjawisko mo»e by¢ traktowane jako zbiór

niezale»nych historii ruchu poszczególnych neutronów .

Neutron charakteryzowany jest wspóªrzedna przestrzenna ⃗r ≡ (x, y, z) i czasowa t, kierunkiem

ruchu okre±lonym przez jednostkowy wektor ⃗ω ≡ (ω x , ω y , ω z ) oraz energia E.

Modelujemy historie neutronu w nastepujacy sposób:

a) Historia neutronu rozpoczyna sie od jego pojawienia w ¹ródle neutronów (reaktorze).

Zakªadajac pewien rozkªad gesto±ci prawdopodobie«stwa f(⃗r, t, ⃗ω, E) generujemy

poczatkowe warto±ci wspóªrzednych neutronu: (⃗r 0 , t 0 , ⃗ω 0 , E 0 ).

b) Neutron wylatuje ze ¹ródªa i porusza sie ruchem jednostajnym po prostej do chwili zderzenia

z jadrem atomu o±rodka. Generujemy dªugo±¢ drogi swobodnego ruchu.

c) Neutron mo»e oddziaªywa¢ na kilka sposobów z jadrem atomu o±rodka (mo»e ulec rozproszeniu,

pochªonieciu np. wychwyt radiacyjny lub rozmno»eniu jak w przypadku

rozszczepienia jadra). Generujemy rodzaj oddziaªywania oraz ewentualnie kierunek

(kierunki) dalszego ruchu i energie neutronu (neutronów).

d) Powracamy do punktu b) lub ko«czymy symulacje gdy neutron zostaª pochªoniety albo

opu±ciª badany o±rodek.

ad a) W chwili t 0 rozkªad poªo»e« i energii neutronów zale»y od konkretnego problemu

- ksztaªtu reaktora i reakcji w nim zachodzacych. Natomiast generacja kierunków

lotu przeprowadzana jest zwykle izotropowo a wiec omówimy tu sposób generacji

izotropowego wektora w przestrzeni trójwymiarowej: Idea algorytmu polega na

wylosowaniu punktów jednorodnie rozmieszczonych w kuli o jednostkowym promieniu

a wektor o izotropowym rozkªadzie kierunków to wektor poprowadzony ze

±rodka kuli do wylosowanych jednorodnie punktów.

1. Losujemy trzy niezale»ne liczby losowe o rozkªadzie jednorodnym na odcinku

[0,1]: γ 1 , γ 2 i γ 3 . Przeksztaªcamy je tak aby odpowiadaªy wspólrzednym

kartezja«skim jednorodnie rozªo»onych punktów w sze±cianie o ±rodku w poczatku

ukªadu i boku równym dwu jednostkom: α 1 = 1 − 2 · γ 1 , α 2 =

1 − 2 · γ 2 , α 3 = 1 − 2 · γ 3 .

2. Obliczamy

3∑

d 2 = α 2 i

i=1

SMOP-2 B.Kamys: 2007/08 157

i sprawdzamy warunek

d 2 ≤ 1.

Je»eli warunek jest speªniony to wyliczamy skªadowe wersora kierunku lotu:

ω x = α 1 /d,

ω y = α 2 /d,

ω z = α 3 /d.

w przeciwnym wypadku powtarzamy caªa procedure od generacji γ 1 , γ 2 i γ 3 .

Inny, najcze±ciej stosowany sposób losowania izotropowych kierunków to wykorzystanie

wspólrzednych sferycznych. Wiadomo, »e kierunek w przestrzeni bedzie

miaª izotropowy rozkªad, gdy rozkªad elementu kata bryªowego dΩ bedzie rozkªadem

równomiernym:

f(dΩ) = 1/4π dla dΩ ∈ [0, 4π]

czyli wszystkie kierunki ⃗ω beda równie prawdopodobne.

Element kata bryªowego we wspóªrzednych sferycznych wyra»a sie nastepujacym

wzorem:

dΩ = sin θdθ · dϕ

co oznacza, »e niezale»ne zmienne dϕ i dcosθ te» maja rozkªady równomierne:

f(d cos θ) ≡ f(sin θdθ) = 1/2 dla d cos θ ∈ [−1, 1]

g(dϕ) = 1/2π

dla dϕ ∈ [0, 2π].

Stad otrzymujemy nastepujacy schemat losowania kierunku izotropowego:

cos θ = 2γ 1 − 1

ϕ = 2πγ 2 .

Wtedy wspóªrzedne kartezja«skie jednostkowego wektora okre±lajacego kierunek

moga by¢ wyra»one przez wspóªrzedne sferyczne:

SMOP-2 B.Kamys: 2007/08 158

ω x = cosϕ · √1 − cos 2 θ

ω y = sinϕ · √1 − cos 2 θ

ω z = cosθ

ad b) Generacja drogi swobodnej: Zakªadamy, »e prawdopodobie«stwo warunkowe

(pod warunkiem, »e neutron przebyª droge l) i» na drodze od l do l + dl nastapi

zderzenie jest proporcjonalne do drogi dl a wspóªczynnikiem proporcjonalno±ci jest

tzw. makroskopowy przekrój czynny deniowany nastepujaco:

m∑

Σ(⃗r, E) ≡ ϱ i (⃗r) σ i (E)

i=1

gdzie ϱ i (⃗r) jest liczba jader typu i w 1 cm 3 , σ i (E) jest przekrojem czynnym na

oddziaªywanie neutronu o energii E z jadrem atomowym typu i a m jest liczba

rodzajów jader atomowych w materiale osªony. Mo»emy wiec prawdopodobie«stwo

iloczynu zdarze« polegajacych na tym, »e

• A ≡ neutron nie oddziaªuje na odcinku od zera do l,

• B ≡ neutron oddziaªuje na odcinku od l do l + dl

zapisa¢ nastepujaco:

P (A · B) = P (A) · P (B| A) =

= [1 − F (l)] · [Σ(l) dl]

gdzie F (l) jest dystrybuanta dªugo±ci swobodnego lotu neutronu, tj.

F (l) = P (droga < l)

a

1 − F (l) = P (droga ≥ l).

Z drugiej strony to samo prawdopodobie«stwo, »e oddziaªywanie nastapi na odcinku

od l do l + dl mo»na wyrazi¢ przez dystrybuante F (l) jako:

F (l + dl) − F (l) ≡ dF.

SMOP-2 B.Kamys: 2007/08 159

Porównujac te dwa wzory dostaniemy:

dF

1 − F (l)

= Σ(l) · dl.

Caªkujac obie strony otrzymujemy:

∫

− ln(1 − F (l)) = l

1 − F (l) = exp

[ 0

∫

− l

Σ(x) · dx

0

Σ(x) · dx

]

.

Ostatecznie dystrybuanta drogi swobodnego ruchu wynosi:

⎡

F (l) = 1 − exp ⎣−

∫ l

0

⎤

Σ(x) · dx⎦

Poniewa» energia neutronu nie zmienia sie w czasie lotu pomiedzy zderzeniami wiec

makroskopowy przekrój czynny Σ(⃗r, E) = Σ(⃗r) mo»e zmienia¢ sie tylko jako

jawna funkcja poªo»enia. Jest to istotne wtedy gdy zmienia sie skªad materiaªu przez

który przechodzi neutron. Przy jednorodnym skªadzie materiaªu znika caªkowicie

zale»no±¢ od ⃗r czyli w powy»szym wzorze na dystrybuante makroskopowy przekrój

czynny jest staªa wielko±cia: Σ(⃗r, E) = Σ. Wtedy mo»na ªatwo losowa¢ droge

swobodnego ruchu metoda funkcji odwrotnej do dystrybuanty:

l = −(1/Σ) lnγ

gdzie γ jest liczba pseudolosowa z przedziaªu [0,1].

Co zrobi¢, gdy materiaª nie jest jednorodny? Wydawaªoby sie, »e wtedy konieczne

bedzie znaczne skomplikowanie procesu losowania drogi swobodnej. Znaleziono jednak»e

bardzo zreczny sposób obej±cia trudno±ci. Sposób ten omówimy poni»ej podczas

dyskusji nastepnego problemu tzn. losowania rodzaju zderzenia.

SMOP-2 B.Kamys: 2007/08 160

ad c) Losowanie rodzaju oddziaªywania wymaga okre±lenia makroskopowych przekrojów

czynnych na trzy gªówne procesy:

• Rozpraszanie (scattering) Σ s (⃗r, E),

• Absorpcje czyli wychwyt (absorption, capture) Σ a (⃗r, E) i

• Rozmno»enie dzieki reakcji rozszczepienia (ssion) Σ f (⃗r, E).

Je»eli wiemy, »e w danej chwili musi zaj±¢ jeden z tych trzech procesów, to prawdopodobie«stwo

ka»dego z nich mo»na zapisa¢ nastepujaco:

P i =

Σ i

3∑

Σ j

j=1

a losowanie mo»e polega¢ na tym, »e po wygenerowaniu liczby pseudolosowej γ z

przedziaªu [0,1] sprawdzamy czy:

• γ

• P 1 ≤ γ ≤ P 2 , (je»eli tak, to zachodzi proces nr 2), oraz

• γ > P 2 , (je»eli tak, to zachodzi proces nr 3).

Omówimy teraz wspomniany powy»ej efektywny sposób losowania drogi swobodnego

lotu neutronu w niejednorodnym materiale. Dla tego celu zaªó»my,

»e oprócz tych trzech procesów mo»e zaj±¢ jeszcze kcyjne rozproszenie, które nie

zmienia ani energii ani kierunku lotu neutronu a tak»e nie powoduje znikania neutronu

czy te» jego rozmno»enia". Wprowad¹my staªy (niezale»ny od ⃗r i od energii)

przekrój czynny α, który speªnia warunek:

α ≥ sup(Σ s + Σ a + Σ f ) .

Wtedy deniujemy makroskopowy przekrój na kcyjne rozproszenie Σ F jako:

Σ F ≡ α − Σ s − Σ a − Σ f

a prawdopodobie«stwo kcyjnego rozproszenia równe jest:

P (F ) = Σ F /α ,

podobnie jak prawdopodobie«stwa pozostaªych procesów:

P (s) = Σ s /α

P (a) = Σ a /α i

P (f) = Σ f /α.

SMOP-2 B.Kamys: 2007/08 161

Nale»y podkre±li¢, »e ka»dy z przekrojów Σ F , Σ s , Σ a , i Σ f mo»e sie zmienia¢ wraz

z ⃗r oraz z energia ale ich suma α jest staªa. Mo»na wiec do losowania drogi swobodnego

lotu neutronu w niejednorodnym materiale zastosowa¢ prosty wzór podany

powy»ej dla jednorodnego materiaªu zastepujac przekrój Σ przekrojem α i

uwzgledniajac kcyjne rozpraszania w losowaniu rodzaju procesu:

l = −(1/α) lnγ .

W ten sposób losowanie kolejnych odcinków drogi odbywa sie bardzo ªatwo ale

oczywi±cie trzeba za to zapªaci¢ zwiekszona liczba losowa«, które beda sie ko«czy¢

kcyjnym rozpraszaniem. Inaczej mówiac zamiast losowa¢ w skomplikowany sposób

w jednym kroku dªugo±¢ swobodnego przebiegu neutronu robimy to w ªatwy sposób

w kilku kolejnych krokach, w których neutron porusza sie bez zderze« ruchem

jednostajnym po tej samej prostej.

Poprawno±¢ powy»szej intuicyjnej metody postepowania zostaªa ±ci±le udowodniona

(W.A. Coleman, Nucl. Sci. Engng. 32 (1968) 76).

Dla oszacowania prawdopodobie«stwa konkretnego losu neutronu, tzn. prawdopodobie«stwa

absorpcji w o±rodku, prawdopodobie«stwa zaj±cia rozszczepienia lub te» prawdopodobie«stwa

opuszczenia o±rodka przez neutron tworzymy estymator prawdopodobie«-

stwa danego zdarzenia A korzystajac z twierdzenia Bernoulliego (Cantellego):

T N (p A ) = N A

N

gdzie N A to liczba tych historii neutronu, w których zaszªo zdarzenie A a N to liczba

wszystkich neutronów rozwa»anych w symulacji.

UWAGA:

Mo»na uwa»a¢, »e ka»dej historii losowanego neutronu przypisujemy zmienna X A przyjmujaca

warto±¢ 1 gdy zdarzenie A zachodzi i warto±¢ 0 gdy to zdarzenie nie zachodzi.

Wtedy prawdopodobie«stwo zaj±cia zdarzenia A jest oczywi±cie równe prawdopodobie«-

stwu tego, »e zmienna X A przyjmie warto±¢ 1:

P (X A = 1) = p A

P (X A = 0) = 1 − p A

Postepujemy tak miedzy innymi wtedy, gdy rejestrujemy zdarzenia i tworzymy histogram

warto±ci obserwowanej zmiennej dodajac do histogramu jedynke dla wyró»nionego przedziaªu

warto±ci mierzonej zmiennej lub nie dodajac jedynki (tzn. dodajac zero) do tego

SMOP-2 B.Kamys: 2007/08 162

przedziaªu.

Prawdopodobie«stwo traenia warto±ci mierzonej zmiennej do wybranego przedziaªu

wynosi p A i jest równe warto±ci oczekiwanej zmiennej losowej X A :

E(X A ) = 1 · p A + 0 · (1 − p A ) = p A

a wiec jako estymator prawdopodobie«stwa, »e zaszªo zdarzenie A bierzemy

T N (p A ) = 1 N

N∑

(X A ) i

i=1

Wariancja zmiennej X A tak»e jest ªatwa do policzenia:

var(X A ) ≡ E(X 2 A ) − E2 (X A ) = [1 2 · p A + 0 2 · (1 − p A )] − p 2 A = p A − p 2 A .

12.4.2 MODELOWANIE PRZEZ ZASTOSOWANIE WAG STATYSTYCZ-

NYCH

Modelowanie przez zastosowanie symulacji jest najbardziej intuicyjna i naturalna metoda

ale nie jest najbardziej efektywne. Okazuje sie, »e mo»na przy tym samym wysiªku obliczeniowym

uzyska¢ znacznie mniejsza wariancje wyników (czyli znacznie mniejszy bªad)

gdy zastosuje sie modelowanie z u»yciem wag statystycznych rozwa»anych zdarze«.

Metoda ta opiera sie na twierdzeniu omówionym poni»ej:

TWIERDZENIE:

Je»eli zmienna losowa X ma warto±¢ oczekiwana równa E(X) = p A oraz speªnia nierówno±¢

0 ≤ X ≤ 1, to wariancja X jest mniejsza lub równa wariancji zmiennej zerojedynkowej

X A .

DOWÓD:

Poniewa» 0 ≤ X ≤ 1 to zawsze X 2 ≤ X, a wiec

stad wariancja X

E(X 2 ) ≤ E(X) ≡ p A

var(X) ≡ E(X 2 ) − E 2 (X) ≤ p A − E 2 (X) = p A − p 2 A ≡ var(X A). c.b.d.o.

SMOP-2 B.Kamys: 2007/08 163

WNIOSEK: zamiast przyporzadkowywa¢ zdarzeniom zmienna zero-jedynkowa X A jest

bardziej efektywne przyporzadkowa¢ wage o wªasno±ciach zmiennej X z omawianego

twierdzenia.

PRZYKŠAD:

Badamy ±redni czas »ycia τ promieniotwórczej substancji rejestrujac liczbe rozpadów

na jednostke czasu, np. na minue, przez godzine od chwili wytworzenia tej substancji.

Chcemy znale¹¢ ±redni czas »ycia rozpadajacych sie jader metoda najwiekszej wiarygodno±ci

lub najmniejszych kwadratów. W tym celu generujemy histogramy liczby rejestrowanych

zdarze« przy ró»nych zaªo»onych warto±ciach czasu »ycia. Okazuje sie, »e czas

»ycia jest tak krótki, »e w ciagu godziny liczba rejestrowanych zdarze« maleje 10 6 razy.

Rozpatrzmy jak beda sie ró»ni¢ dwie metody modelowania: 1) symulacja ka»dego zdarzenia

i 2) losowanie zdarze« i przypisywanie im wag:

ad 1.

W takiej sytuacji modelowanie rozkªadu przez symulacje, tzn. losowanie czasu zgodnie z

rozkªadem wykªadniczym i dodawanie jedno±ci do odpowiedniego przedziaªu histogramu

dawaªoby bardzo ró»na statystyke rejestrowanych zdarze« dla krótkich i dªugich czasów

»ycia. Na przykªad, gdy dla pierwszej minuty wylosowano by 10 6 zdarze« to dla ostatniej

tylko jedno zdarzenie. A wiec bªad wzgledny liczby rozpadów po krótkim czasie byªby

rzedu 0.001 podczas gdy dla ostatniej minuty bªad wgledny byªby rzedu jedno±ci. Aby

wiec dosta¢ bªad wzgledny ∼ 0.1 dla dªugich czasów nale»aªoby losowa¢ 100 razy wiecej

zdarze« dla caªego histogramu. Byªoby to ªacznie ponad 10 8 losowa«.

ad 2.

Wylosujemy liczby z rozkªadu równomiernego tak aby na ka»da minute wypadaªo 100 zdarze«,

czyli na caªy histogram 60 · 100 = 6000 zdarze«. Ka»demu zdarzeniu przypiszemy

wage ∼ exp(− t ). Histogram tworzymy dodajac wagi zdarze« odpowiadajacych odpowiednim

przedziaªom (minutom) czasu obserwacji. Wtedy dostaniemy histogram, który

τ

bedzie miaª dla ka»dego przedziaªu taka sama warto±¢ oczekiwana wysoko±ci sªupka jak

przy losowaniu wg pierwszej metody ale wzgledny bªad wysoko±ci wszystkich sªupków

bedzie taki sam równy 0.1.

Wida¢, »e zastosowanie wag ma nastepujace zalety:

• Pozwala na otrzymanie takich samych warto±ci wzglednych bªedów dla ka»dego przedziaªu

histogramu co jest wa»ne gdy chcemy odtworzy¢ ksztaªt rozkªadu.

• Pozwala poprawi¢ statystyke rzadkich zdarze«.

• Mo»e znacznie skróci¢ rachunki, co czesto jest bardzo wa»ne szczególnie gdy rachunki

musza by¢ wykonywane wielokrotnie.

SMOP-2 B.Kamys: 2007/08 164

12.4.3 MODELOWANIE PRZECHODZENIA NEUTRONÓW PRZEZ O‘RO-

DEK WAGI STATYSTYCZNE

Przy zastosowaniu wag statystycznych rezygnujemy z imitacji jeden do jeden realnego

procesu. Wybieramy wagi statystyczne, tak aby otrzyma¢ informacje o tych aspektach

procesu, które nas interesuja. Stad wybór wag zale»y od celu jaki chcemy osiagna¢. Na

przykªadzie badania prawdopodobie«stwa absorpcji neutronów w danym o±rodku poka-

»emy ró»ne sposoby wyboru wag:

1. Wagi zastepujace losowanie absorpcja inny rodzaj oddziaªywania.

2. Wagi uwzgledniajace wylot neutronu z o±rodka

3. Wagi uwzgledniajace oba efekty

ad 1.) Wagi zastepujace losowanie absorpcja inny rodzaj oddziaªywania Przypu±¢my,

»e ze ¹ródªa emitujacego neutrony wylatuje nie jeden neutron lecz du»a grupa

n 0 neutronów o tych samych charakterystykach (energia, kierunek lotu). Po wylosowaniu

dªugo±ci drogi swobodnego lotu (do pierwszego zderzenia) rozpatrujemy co

dzieje sie w chwili zderzenia neutronu z jadrem atomowym. Zakªadajac, »e wynikiem

zderzenia jest rozproszenie neutronu lub jego absorpcja oraz znajac makroskopowe

przekroje czynne Σ s i Σ a , odpowiednio na rozproszenie (scattering), i absorpcje

(absorption) mo»emy stwierdzi¢, »e prawdopodobie«stwo rozproszenia (s i ) i prawdopodobie«stwo

absorpcji (a i ) w punkcie ⃗r i wyra»aja sie wzorami:

s i ≡ Σ s (⃗r i )/ [Σ s (⃗r i ) + Σ a (⃗r i )]

a i ≡ Σ a (⃗r i )/ [Σ s (⃗r i ) + Σ a (⃗r i )]

czyli ±rednio (a 1·n 0 ) neutronów dozna absorpcji w punkcie r 1 a (s 1·n 0 ) neutronów

bedzie kontynuowaªo lot. Od tego momentu procedura losowania powtarza sie, tzn.

losuje sie kierunek i dªugo±¢ drogi swobodnego lotu grupy rozproszonych neutronów

a» do nastepnego zderzenia. A wiec przy drugim zderzeniu (s 1 · a 2 · n 0 ) neutronów

zostanie zaabsorbowane a (s 1 · s 2 · n 0 ) rozproszy sie. Rachunki te powtarza sie tak

dªugo a» neutrony opuszcza badany o±rodek. Ostatecznie liczba neutronów, które

zostana zaabsorbowane podczas takiej serii zderze« mo»e by¢ zapisana nastepujaco:

⎛

⎞ ⎛

⎞

j−1 ∑

n = ⎝ s 1 · s 2 . . . s i · a i+1

⎠ n 0 = ⎝ s 1 · s 2 . . . s i · (1 − s i+1 ) ⎠ n 0

i=0

Prosze zwróci¢ uwage, »e zamiast bra¢ du»a grupe neutronów mo»emy przyja¢

n 0 ≡ 1, ale musimy wtedy zmieni¢ interpretacje wielko±ci n w powy»szym wzorze.

Otó» po przyjeciu n 0 = 1 nale»y interpretowa¢ n jako prawdopodobie«stwo, »e pojedynczy

neutron wysªany ze ¹ródªa zostanie zaabsorbowany podczas przebywania

i=0

SMOP-2 B.Kamys: 2007/08 165

wylosowanej drogi w o±rodku. A wiec prawdopodobie«stwo absorpcji p a neutronu

w o±rodku jest warto±cia oczekiwana z tego prawdopodobie«stwa dla ró»nych

dróg neutronu przez o±rodek :

p a = E(n)

a estymatorem prawdopodobie«stwa absorpcji jest ±rednia arytmetyczna z prawdopodobie«stw

absorpcji neutronów poruszajacych sie po ró»nych drogach w o±rodku:

T N (p a ) = 1 N

N∑

n k .

k=1

Poniewa» prawdopodobie«stwo n absorpcji neutronu na ró»nych drogach speªnia

warunki twierdzenia omawianego poprzednio dla wag zdarze« ( E(n) = p a i

0 ≤ n ≤ 1), wiec mo»emy uzna¢ je za wage neutronu i dostajemy, »e wariancja

n jest mniejsza od wariancji zmiennej X a przyjmujacej warto±¢ jeden (gdy nastapi

absorpcja) i zero (gdy absorpcji nie ma), która u»ywa sie w zwykªej symulacji.

Nale»y podkre±li¢, »e wysiªek rachunkowy przy losowaniu historii N neutronów jest

praktycznie taki sam, gdy do oszacowania p a bierzemy zmienna X a i wage n mimo,

»e w drugim wypadku otrzymujemy oszacowanie z mniejszym bªedem .

ad 2.) Wagi uwzgledniajace wylot neutronu z o±rodka Omówimy teraz jak przy pomocy

wag mo»na uwzgledni¢ fakt, »e cze±¢ neutronów wydostaje sie z o±rodka a wiec

nie moga by¢ zaabsorbowane. Zacznijmy od analogicznego rozumowania jak powy-

»ej: Grupa n 0 neutronów wylatuje ze ¹ródªa poªo»onego w ⃗r 0 w tym samym kierunku

⃗ω 0 . Odlegªo±¢ od ¹ródªa do granicy o±rodka w tym kierunku wynosi l 0 . Je»eli

oznaczymy przez F 0 (l 0 ) warto±¢ dystrybuanty dªugo±ci swobodnej drogi neutronu

to prawdopodobie«stwo tego, »e nukleon bedzie na tej drodze zderzaª sie z jadrami

atomowymi o±rodka wynosi P (l < l 0 ) ≡ F 0 (l 0 ). Poniewa» chcemy rozpatrywa¢

tylko te neutrony, które nie opu±ciªy badanego o±rodka wiec:

1. Wiemy, »e ±rednio w punkcie ⃗r 1 bedzie oddziaªywaªo n 1 = n 0 · F 0 (l 0 ).

2. Poniewa» chcemy, aby dla tych neutronów oddziaªywanie nastapiªo z pewno±cia

wiec odlegªo±¢ l ′ od ⃗r 0 do ⃗r 1 losujemy z rozkªadu odlegªo±ci obcietego do

odcinka 0 < l ′ < l 0 , czyli:

F (l ′ ) = F 0 (l ′ )/F 0 (l 0 ).

Omówimy to bardziej szczegóªowo poni»ej.

3. Losujemy (ze znajomo±ci makroskopowych przekrojów Σ s (⃗r 1 ) na rozproszenie

i Σ a (⃗r 1 ) na absorpcje) czy nastapi rozproszenie i wtedy grupa wylatujacych

z punktu ⃗r 1 neutronów bedzie zawieraªa n 1 neutronów lub zostanie ona zaabsorbowana

w tym punkcie i wtedy przestajemy ±ledzi¢ los grupy neutronów

wiedzac, »e n 1 neutronów zostaªo zaabsorbowane.

SMOP-2 B.Kamys: 2007/08 166

Powtarzajac powy»sze kroki postepowania dostajemy, »e liczba neutronów zaabsorbowanych

po i zderzeniach wynosi:

n = F 0 (l 0 ) · F 1 (l 1 ) . . . F i−1 (l i−1 ) · n 0

a postepujac tak jak poprzednio, tzn. kªadac n 0 = 1 dostajemy jako wage neutronu

wyra»enie:

n = F 0 (l 0 ) · F 1 (l 1 ) . . . F i−1 (l i−1 )

a estymatorem prawdopodobie«stwa absorpcji bedzie ±rednia arytmetyczna z powy»szych

wag otrzymanych dla ró»nych dróg neutronu w o±rodku:

T N (p a ) = 1 N

N∑

n k

k=1

UWAGA:

Powracajac do losowania odlegªo±ci pomiedzy zderzeniami, nale»y sobie u±wiadomi¢,

»e w tej metodzie »adamy aby neutron zostaª pochªoniety czyli nie mo»e on opu±ci¢

o±rodka. ›adanie to prowadziªoby do niezycznych wyników ale kompensujemy

to wªa±nie przez dobór wag i przez to, »e losowanie swobodnej drogi pomiedzy

zderzeniami wykonywane jest przy wykorzystaniu obcietego rozkªadu dªugo±ci drogi

swobodnej. Przez rozkªad uciety rozumiemy rozkªad ograniczony do sko«czonego

odcinka zmiennej losowej. Je»eli oryginalna funkcja gesto±ci prawdopodobie«stwa

dªugo±ci drogi swobodnej f(x) byªa wieksza od zera dla nieujemnych warto±ci drogi to

obcieta funkcja gesto±ci g(x) jest wieksza od zera tylko dla argumentów z przedziaªu

[0, l], gdzie l jest odlegªo±cia od danego punktu do brzegu o±rodka. Ucieta funkcja

gesto±ci prawdopodobie«stwa jest równa zero poza tym odcinkiem a ma warto±ci

proporcjonalne do f(x) na tym odcinku. Wspóªczynnikiem proporcjonalno±ci jest:

1

F (l) − F (0)

ale poniewa» droga musi by¢ nieujemna wiec F (0) = 0 i wspóªczynnikiem proporcjonalno±ci

jest

1

jak to podali±my powy»ej.

F (l)

SMOP-2 B.Kamys: 2007/08 167

ad 3.) Wagi uwzgledniajace oba efekty Przeprowadzajac analogiczne rozumowanie jak

w dwu poprzednich punktach i uwzgledniajac w wagach zarówno mo»liwo±¢ absorpcji

jak i »adanie aby neutron nie opu±ciª o±rodka dostajemy, »e dla danej trajektorii

neutronu po i zderzeniach prawdopodobie«stwo rozproszenia w punkcie ⃗r i+1 bedzie

równe:

n i+1 (s) = F 0 (l 0 )s 1 · F 1 (l 1 )s 2 . . . F i−1 (l i−1 )s i · F i (l i )s i+1

a prawdopodobie«stwo absorpcji:

n i+1 (a) = F 0 (l 0 )s 1 · F 1 (l 1 )s 2 . . . F i−1 (l i−1 )s i · F i (l i )a i+1

Jak wida¢ oba prawdopodobie«stwa sa niezerowe a wiec trajektorie zawieraªyby

niesko«czenie wiele zderze«. W praktyce przerywamy losowanie gdy prawdopodobie«stwa

powy»sze ró»nia sie zaniedbywalnie maªo od zera.

Caªkowite prawdopodobie«stwo pochªoniecia neutronu na danej trajektorii (czyli

inaczej waga neutronu wynosi w tym przypadku:

∞∑

n = n i+1 (a)

i=0

a estymator prawdopodobie«stwa absorpcji:

N∑

T N (p a ) = 1 N

n k

k=1

gdzie sumowanie odbywa sie po N trajektoriach (historiach) neutronu.

SMOP-2 B.Kamys: 2007/08 168

Literatura

[1] P. Armitage, Metody statystyczne w badaniach medycznych", Pa«stwowy Zakªad

Wydawnictw Lekarskich, Warszawa 1978

[2] Hubert M. Blalock, Statystyka dla socjologów", Pa«stwowe Wydawnictwo Naukowe,

Warszawa 1977

[3] Zdzisªaw Bogucki, Elementy statystyki dla biologów", Wydawnictwo Naukowe Uniwersytetu

im. Adama Mickiewicza w Poznaniu, Pozna« 1979

[4] L.N. Bolszew, N.W. Smirnow, "Tablicy matiematiczieskoj statistiki", Nauka, Moskwa

1983

[5] Siegmund Brandt, Analiza danych", PWN, Warszawa 1998

[6] W.T. Eadie, D. Drijard, F.E. James, M. Roos, B. Sadoulet, Metody statystyczne w

zyce do±wiadczalnej", Pa«stwowe Wydawnictwo Naukowe, Warszawa 1989

[7] George A. Ferguson, Yoshio Takane, Analiza statystyczna w psychologii i pedagogice",

Wydawnictwo Naukowe PWN, Warszawa 1999

[8] M.Fisz, Rachunek prawdopodobie«stwa i statystyka matematyczna", PWN Warszawa

1967)

[9] "High Energy and Nuclear Physics Data Handbook", ed. by W. Galbraith, W.S.C.

Williams, Chilton 1963

[10] Maurice G. Kendall, Alan Stuart, "The Advanced Theory of Statistics", Charles

Grin & Company Limited, London 1966

[11] G.A. Korn, T.M. Korn, "Mathematical Handbook for Scientists and Engineers",

McGraw-Hill Book Company, Inc., New York - Toronto - London 1961

[12] R. Zieli«ski, "Tablice statystyczne", Warszawa 1972

[13] R. E. Parker, Wprowadzenie do statystyki dla biologów", Pa«stwowe Wydawnictwo

Naukowe, Warszawa 1978

[14] Zbigniew Pawªowski, Statystyka matematyczna",PWN, Warszawa 1976

[15] Arkadiusz Piekara, Mechanika ogólna", Pa«stwowe Wydawnictwo Naukowe, Warszawa

1975

[16] Bogusªaw Kamys, Statystyczne Metody Opracowania Pomiarów - 1", Wykªad dla

studentów I roku zyki

[17] Andrzej Stanisz, Przystepny kurs statystyki w oparciu o program STATISTICA PL

na przykªadach z medycyny", Kraków 1998

[18] NIST/SEMATECH e-Handbook of Statistical Methods,

http://www.itl.nist.gov/div898/handbook/

SMOP2

SMOP2 ... View more SMOP2

Delete template?

Save as template ?

SMOP2 SMOP2