2 na stran

STATISTIKA Z ELEMENTI 

INFORMATIKE 

http://www.fgg.uni-lj.si/~/sdrobne/Pouk/SEI/SEI_VSS1.htm 

Samo Drobne 

UL FGG, Jamova 2, Ljubljana 

(01) 4768 649 (telefon) 

(01) 4250 704 (faks) 

sdrobne@fgg.uni-lj.si 

http://www.fgg.uni-lj.si/~/sdrobne/ 

Cilj predmeta 

• osvojiti temelje pristopa k načrtovanju statističnih 

opazovanj, 

• seznaniti se s temeljnimi pojmi in uporabo programske 

opreme za obdelavo statističnih podatkov. 

2 

•1

Vsebina predavanj 

• temeljni pojmi statistike; 

• opisna statistika ene in več spremenljivk; 

• kombinatorika in verjetnostni račun; 

• sklepanje iz vzorca na populacijo; 

• preizkušanje domnev; 

• bivariatna analiza. 

3 

Vsebina vaj (na računalniku) 

• Vaja 1: Prikazovanje podatkov v preglednicah in na 

grafikonih 

• Vaja 2: Številski prikaz podatkov 

• Vaja 3: V skupine razvrščeni podatki 

• Vaja 4: Verjetnostni račun 

• Vaja 5: Diskretne slučajne spremenljivke 

• Vaja 6: Intervali zaupanja 

• Vaja 7: Preizkušanje domnev 

• Vaja 8: Bivariatna analiza 

4 

•2

Literatura 

• S. Drobne, 2002: Statistika z elementi informatike, 

Prosojnice predavanj za I. letnik VSŠ geodezije, UL FGG, 

Ljubljana. 

• S. Drobne in G. Turk, 2002: Statistika z elementi 

informatike – Vaje, Navodila za izvedbo vaj za I. letnik 

VSŠ geodezije, UL FGG, Ljubljana. 

5 

Druga (priporočena študijska) 

literatura 

• G. Turk, 2002: Verjetnostni račun in statistika, UL FGG, 

Ljubljana. 

• Bogataj M. in S. Drobne: Statistika z elementi informatike, 

FGG, Ljubljana, (delovna različica v knjižnici FGG). 

... več o drugi priporočeni študijski literaturi najdete na 

spletni strani predmeta: 

http://www.fgg.unilj.si/~/sdrobne/Pouk/SEI/SEI_VSS1.htm 

6 

•3

Predgovor 

To je delovna različica prosojnic iz osnov statistike, ki jo 

uporabljamo pri predavanjih pri predmetu Statistika z elementi 

informatike v I. letniku visokošolskega strokovnega študija 

geodezije. 

V prosojnicah so navedene zgolj pomembnejše definicije, formule in 

postopki. Dokaze in izpeljave študent sliši na predavanjih in vajah, 

oziroma najde v priporočeni študijski literaturi. 

Prosojnice, ki so pred vami, služijo zgolj kot napotek, katere 

vsebine študirate v priporočeni študijski literaturi. 

Napisati dovolj preprost in stokovno neoporečen študijski 

pripomoček je težko. Zato bom zelo hvaležen vsem, ki me bodo 

opozorili na tipkarske, računske in druge napake. Prav tako bom 

hvaležen tudi za vse morebitne pripombe in komentarje. 

Samo Drobne 

7 

(sdrobne@fgg.uni-lj.si) 

Kazalo 

1. UVOD 

1.1 Osnovni pojmi 

1.2 Vrste spremenljivk 

1.3 Tipi statističnih analiz 

1.4 Koraki statistične analize 

1.5 Prikazovanje podatkov 

1.6 Zgodovina statistike 

2. KVANTILI 

3. FREKVENČNA PORAZDELITEV 

3.1 Opredeljevanje skupin vrednosti 

3.1.1 Opredeljevanje skupin za opisne spremenljivke 

3.1.2 Opredeljevanje skupin za številske spremenljivke 

3.2 Kvantili frekvenčne porazdelitve 

3.3 Grafično prikazovanje frekvenčnih porazdelitev 

3.4 Oblike frekvenčnih porazdelitev 

8 

•4

Kazalo / 2 

4. SREDNJE VREDNOSTI 

4.1 Mediana 

4.2 Modus 

4.3 Aritmetična sredina ali povprečje 

4.4 Primerjava aritmetične sredine, modusa in mediane 

4.5 Geometrijska sredina 

4.6 Harmonična sredina 

4.7 Primerjava aritmetične, geometrijske in harmonične sredine 

4.8 Kvadratna sredina 

5. MERE RAZPRŠENOSTI 

5.1 Variacijski razmik 

5.2 Kvartilni razmik 

5.3 Kvartilni odklon 

5.4 Povprečni absolutni odklon 

5.5 Varianca in standardni odklon 

5.6 Relativne mere razpršenosti 

9 

Kazalo / 3 

6. NORMALNA PORAZDELITEV 

6.1 Splošne lastnosti 

6.2 Standardizacija spremenljivke 

6.3 Standardizirana normalna porazdelitev 

7. MERE ASIMETRIJE IN SPLOŠČENOSTI 

7.1 Meri asimetrije 

7.2 Meri sploščenosti 

7.3 Meri asimetrije in sploščenosti s centralnimi momenti 

8. STATISTIKA IN VERJETNOSTNI RAČUN 

9. KOMBINATORIKA 

9.1 Permutacija in variacija 

9.2 Osnovni izrek kombinatorike 

9.3 Število variacij, permutacij in kombinacij 

10 

•5

Kazalo / 4 

10. VERJETNOSTNI RAČUN 

10.1 Poskus 

10.2 Dogodek 

10.2.1 Računanje z dogodki 

10.3 Verjetnost dogodka 

10.3.1 Statistična definicija verjetnosti dogodka 

10.3.2 Klasična definicija verjetnosti dogodka 

10.3.3 Aksiomska definicija verjetnosti dogodka 

10.4 Pogojna verjetnost 

10.5 Bernoullijevo zaporedje neodvisnih poskusov 

11 

11. SLUČAJNA SPREMENLJIVKA 

11.1 Diskretna slučajna spremenljivka 

11.1.1 Enakomerna diskretna porazdelitev 

11.1.2 Binomska porazdelitev 

11.2 Zvezna slučajna spremenljivka 

11.2.1 Enakomerna zvezna porazdelitev 

11.2.2 Normalna porazdelitev 

11.3 Pričakovana vrednost slučajne spremenljivke 

11.4 Razpršenost slučajne spremenljivke 

11.5 Momenti in centralni momenti porazdelitve 

Kazalo / 5 

12. VZORČENJE 

12.1 Osnove vzorčenja 

12.2 Porazdelitev vzorčnih statistik 

12.2.1 Porazdelitev vzorčnih aritmetičnih sredin 

12.2.2 Porazdelitev vzorčnih deležev 

12.2.3 Porazdelitev razlik vzorčnih aritmetičnih sredin 

12.2.4 Porazdelitev razlik vzorčnih deležev 

13. INTERVALI ZAUPANJA 

13.1 Pomen stopnje zaupanja pri intervalih zaupanja 

13.2 Intervali zaupanja pri velikih vzorcih 

13.2.1 Interval zaupanja za aritmetično sredino pri velikih vzorcih 

13.2.2 Interval zaupanja za varianco pri velikih vzorcih 

13.2.3 Interval zaupanja za delež pri velikih vzorcih 

13.2.4 Interval zaupanja za razliko aritmetičnih sredin pri velikih vzorcih 

13.2.5 Interval zaupanja za razliko deležev pri velikih vzorcih 

13.2.6 Določanje velikosti vzorca 

13.2.6.1 Določanje velikosti vzorca, ko ocenjujemo aritmetično sredino 

13.2.6.2 Določanje velikosti vzorca, ko ocenjujemo delež 

12 

•6

Kazalo / 6 

13. INTERVALI ZAUPANJA (nadaljevanje) 

: 

13.3 Porazdelitev vzorčnih statistik pri majhnih vzorcih 

13.4 Porazdelitev t 

2 

13.5 Porazdelitev χ 

13.6 Intervali zaupanja pri majhnih vzorcih 

13.6.1 Interval zaupanja za aritmetično sredino pri majhnih vzorcih 

13.6.2 Interval zaupanja za varianco pri majhnih vzorcih 

13.6.3 Interval zaupanja za delež pri majhnih vzorcih 

13.6.4 Interval zaupanja za razliko aritmetičnih sredin pri majhnih vzorcih 

14. PREIZKUŠANJE DOMNEV 

14.1 Napaki I. in II. vrste 

14.2 Postopek preizkušanja domnev 

14.2.1 Preizkušanje domneve o pričakovani vrednosti 

14.2.2 Preizkušanje domneve o razliki pričakovanih vrednosti 

14.2.3 Preizkušanje domneve o varianci 

14.2.4 Preizkušanje domneve o homogenosti populacij 

14.2.5 Preizkušanje domneve o deležu 

14.2.6 Preizkušanje domneve o razliki deležev 

13 

Kazalo / 7 

15. BIVARIATNA ANALIZA 

15.1 Uni- in bivariatna analiza 

15.2 Preizkušanje domneve o povezanosti dveh nominalnih spremenljivk 

15.3 Preizkušanje domneve o povezanosti dveh številskih spremenljivk 

15.4 Regresija 

15.4.1 Linearna regresija 

15.4.2 Preizkušanje domneve o regresijskem koeficientu 

15.4.3 Pojasnjena varianca 

Literatura 

Nekaj zanimivih spletnih naslovov 

14 

•7

1. UVOD 

• Statistika je veda, ki proučuje množične pojave. 

• Statistika se ukvarja z zbiranjem, predstavitvijo, analizo 

ter interpretacijo podatkov in rezultatov analiz. 

• Beseda “statistika” izvira najverjetneje iz latinske besede 

“status” (država). 

Izvorno je statistika služila opisovanju ekonomskih in socialnih razmer razvitih držav antike. 

• V vsakdanjem pogovoru: 

• zbirko številskih in opisnih podatkov; 

• publikacije (publikacijske preglednice, grafikone, včasih tudi z 

zbirkami definicij); 

• delo pri zbiranju statističnih podatkov; 

• statistično službo. 

15 

1. UVOD / 2 

• Registri, 

• evidence in 

• katastri, 

kot poseben primer pisnih in grafičnih zbirk podatkov, 

sami po sebi še niso statistika, saj njihov namen ni 

proučevanje posamezne vrste množičnih pojavov kot 

celote, ampak opazovanje in analiza posameznih enot. 

16 

•8

1. UVOD / 3 

• Statistični urad RS 

(http://www.stat.si/) 

• Statističen letopis RS (http://www.stat.si/letopis_n.htm) 

17 

1.1 Osnovni pojmi 

• Enota – posamezni element proučevanja. 

Primer 1.1: redni študent na UL FGG Oddelku za 

geodezijo v šolskem letu 2002/03. 

• Populacija –množica vseh proučevanih elementov; 

pomembna je natančna opredelitev populacije (stvarno, 

časovno in prostorsko); parametre populacije označujemo 

z velikimi črkami (npr. N – število enot v populaciji). 

Primer 1.2: vsi redni študentje na UL FGG Oddelku za 

geodezijo šolskem letu 2002/03. 

Množični pojav je vsak pojav, ki se v prostoru in času pojavlja večkrat. 

18 

•9

1.1 Osnovni pojmi / 2 

• Vzorec – podmnožica populacije, na osnovi katere 

ponavadi sklepamo o lastnostih cele populacije; 

parametre vzorca označujemo z malimi črkami 

(npr. n – število enot v vzorcu). 

Primer 1.3: slučajni vzorec 15-tih rednih študentov na 

UL FGG Oddelku za geodezijo v šolskem letu 2002/03. 

19 

• Spremenljivka – lastnost enot; označujemo jih z 

velikimi poševnimi črkami; npr. X, Y, Z, X 1, X 2 . Vrednost 

spremenljivke X na i-ti enoti označimo z malo poševno 

črko in indeksom x i . 

Primeri 1.4: • spol, • višina mesečnih dohodkov v 

družini študenta na člana družine, • število poskusov 

študenta geodezije, da bi v šolskem letu 2001/2002 

opravil izpit pri predmetu Statistika z elementi 

informatike. 

1.2 Vrste spremenljivk 

• Vrste spremenljivk glede na tip izražanja 

vrednosti: 

1. opisne (ali atributivne) spremenljivke – vrednosti 

lahko opišemo le z besedami (npr. spol, poklic, 

uspeh); 

2. številske (ali numerične) spremenljivke – vrednosti 

lahko izražamo s števili (npr. starost, višina, 

temperatura). 

20 

•10

1.2 Vrste spremenljivk / 2 

21 

• Vrste spremenljivk glede na tip merjenja: 

1. nominalne spremenljivke – vrednosti lahko le 

razlikujemo med seboj, ne moremo pa jih urediti po 

logičnem zaporedju; dve vrednosti sta enaki ali 

različni (npr. spol, krvne skupine in vzroki telesnih 

poškodb); 

2. ordinalne spremenljivke – vrednosti lahko uredimo 

od najmanjše do največje (npr. starost, višina); 

3. intervalne spremenljivke – lahko primerjamo razlike 

med vrednostima dvojic enot (npr. temperatura); 

4. razmernostne spremenljivke – lahko primerjamo 

razmerja med vrednostima dvojic enot (npr. starost). 

Urejeno glede na kvaliteto merskih lastnosti: od tistih z najslabšimi merskimi 

lastnostmi (nominalne spremenljivke) do tistih z najboljšimi (razmernostne 

spremenljivke, ki zadoščajo lastnostim, ki jih imajo prve tri spremenljivke). 

1.3 Tipi statističnih analiz 

• Tipi statističnih analiz glede na sklepanje: 

• opisna statistika – statistična analiza, ki raziskuje 

sestavo in zveze med opazovanimi podatki; 

(Brez težnje po posploševanju čez njihov obseg: ne vključuje statističnega sklepanja); 

• sklepna (inferenčna) statistika – statistična 

analiza, ki temelji na statističnem sklepanju iz vzorca 

(dela populacije) na populacijo: 

• ocenjevanje značilnosti populacije (intervali zaupanja); 

• preizkušanje domnev. 

22 

•11

1.3 Tipi statističnih analiz / 2 

• Tipi statističnih analiz glede na število 

obravnavanih spremenljivk: 

• univariatna statistična analiza – analiza ene 

spremenljivke; 

• bivariatna statistična analiza – analiza dveh 

spremenljivk; 

• multivariatna statistična analiza – analiza več 

spremenljivk. 

23 

1.4 Koraki statistične analize 

1. določitev vsebine in namena statističnega 

proučevanja: 

• opredelitev predmeta opazovanja (enote in populacije); 

• opredelitev vsebine opazovanja (spremenljivke); 

2. izdelava načrta opazovanja in metod proučevanja 

(kako natančno); 

3. statistično opazovanje; vrste opazovanj: 

• opazovanje cele populacije (popis, tekoča registracija ...); 

• opazovanje vzorca (anketa ...); 

4. osnovna obdelava: 

• urejanje podatkov; 

• razvrščanje podatkov; 

• izračun osnovnih statističnih značilnosti; 

5. analitična obdelava. 

24 

•12

1.4 Koraki statistične analize / 2 

Primer 1.5: Zaledje neke regije želimo močneje povezati s 

središčem. V ta namen moramo zagotoviti ustrezen javni promet 

med središčem in okolico. 

• Namen: zagotovitev ustrezne povezave; 

• Vsebina proučevanja: potrebe in željen nivo uslug javnega potniškega 

prometa ter možnosti finančnega pokritja teh odločitev; 

• Izdelava načrta: ankete, merjenje prometa, čakalnih časov na 

postajališčih, potovalnih časov, individualno vrednotenja časa, 

pripravljenost potnikov na višje tarife, itd. 

Skratka: ugotovitev vrednosti parametrov, ki vplivajo na večjo dostopnost, in 

stroškov za zagotavljanje večje dostopnosti. Odločimo se za število opazovanj, čas 

opazovanja, itd. 

• Izvedba opazovanj po načrtu; 

• Osnovna obdelava: vnos v računalnik, urejanje, razvrščanje v razrede, 

prikaz preglednic in osnovnih grafikonov; 

• Analitična obdelava in kvalitativna analiza, ki daje podporo odločitvam 

o posegih v sam prometni sistem. 

25 

1.5 Prikazovanje podatkov 

• Statistične podatke navadno primerjamo med seboj. 

Zato jih združujemo v statistične vrste, te pa 

prikazujemo v preglednicah in grafikonih. 

• Prikaz podatkov v preglednici - prednost pred prikazom 

v grafikonu je predvsem v možnosti poljubno 

natančnega prikaza. 

• Prikaz podatkov v grafikonu - bolj nazorno prikažemo 

zveze med več podatki kot v preglednici: 

• enostavni grafikoni – z njimi prikazujemo temeljne 

statistične vrste na čim bolj razumljiv način; 

• analitični grafikoni -omogočajo celo grafično analizo pojava. 

Prikaz podatkov v grafikonu je tudi bolj privlačen in neposreden od prikaza 

podatkov v preglednicah, zato ga pogosto uporabljamo pri popularizaciji 

določenega pojava. 

26 

•13

1.5 Prikazovanje podatkov / 2 

Primer 1.6: Shematični prikaz preglednice 

g l a v a 

č 

e 

l 

o 

s 

t 

o 

l 

p 

e 

c 

v r s t i c a 

polje 

z s 

b t 

i o 

r l 

n p 

i e 

c 

z b i r n a 

v r s t i c a 

27 


Primer 1.7: Primer preglednice (vir: Statističen letopis 1991, SURS, Ljubljana) - 

naslov preglednice enolično pojasnjuje gradivo v preglednici; osrednji del preglednice je 

sestavljen je iz tekstovnega in številskega dela; v tekstovnem delu opredelimo pomen 

števil v preglednici; številski del preglednice je razdeljen v polja, v katere vpisujemo 

podatke. 

1.4 Stanovanjske in nestanovanjske stavbe, njihova gradbena velikost in stanovanja v njih, po regijah, Slovenija, 2000 1) 

Residential and non-residential buildings, their size and dwellings in them, by regions, Slovenia, 2000 1) 

Število stavb Površina Prostornina Stanovanja v stavbi 

Number of buildings stavbe stavbe Dw ellings in buildings 

skupaj stano- nestano- število površina 

total vanjske vanjske 

non - Floor Volume number useful 

residental residental area of of floor 

buildings buildings buildings buildings area 

m2 m3 m2 

Slovenija / Slovenia 6100 3650 2450 1994620 7125120 5815 662796 

Pomurska 497 250 247 145050 487535 332 42566 

Podravska 1003 633 370 323800 1086786 788 103553 

Koroška 234 142 92 72191 257326 239 23209 

Savinjska 875 528 347 215321 682983 808 91246 

Zasavska 77 45 32 23202 70133 77 8240 

Spodnjeposavska 312 154 158 105320 459948 171 22986 

Jugovzhodna Slovenija 531 263 268 136256 519206 334 34249 

Osrednjeslovenska 963 725 238 453552 1692724 1769 182510 

Gorenjska 551 364 187 169602 607596 444 58184 

Notranjsko-kraška 151 77 74 36379 136336 100 12857 

Goriška 638 312 326 202266 690639 454 56832 

Obalno-kraška 268 157 111 111681 433908 299 26364 

28 

1) Zajete so stavbe, za katere so bila izdana gradbena dovoljenja. Covered are buildings for w hich building permits w ere issued. 

•14


Primer 1.8: V stolpičnem grafikonu predstavimo število 

narodnostno opredeljenih v Republiki Sloveniji ob statističnem 

popisu leta 1991 

Število narodnostno opredeljenih v RS 

ob popisu 1991 

10000 

8503 

7500 

število 

5000 

2500 

4396 

3064 

2293 

0 

Črnogorci Italijani Madžari Romi 

narodnostno opredeljeni 

29 


Primer 1.9: V strukturnem krogu predstavimo strukturo stavb v 

Osrednjeslovenski statistični regiji v letu 1999 

Vrsta stavb v osrednjeslovenski statistični 

regiji leta 1999 

26% 

74% 

stanovanjske stavbe 

nestanovanjske stavbe 

30 

•15


Primer 1.10: V kartogramu predstavimo strukturo izdanih gradbenih 

dovoljenj po statističnih regijah RS v obdobju 1998 - 2000 

31 

1.6 Zgodovina statistike 

• Z opisno statistiko so se ukvarjali že v starem veku, ko so 

zbirali in analizirali podatke o davkih, vojnah, pridelkih ... 

• Inferenčna statistika pa sloni na verjetnostnem računu. 

• Pomembnejša imena iz zgodovine (inferenčne) statistike: 

• Abraham de Moivre (1667 - 1754; leta 1733 je odkril enačbo normalne 

porazdelitve); 

• Carl Friedrich Gauss (1777 – 1855; neodvisno od de Moivra je izpeljal 

enačbo normalne porazdelitve, ko je študiral napake ponavljajočih 

meritev iste količine); 

• Adolph Quetelet (1796 – 1874; pokazal je uporabnost statističnih metod 

v različnih znanstvenih disciplinah); 

• Karl Pearson (1857 – 1936; s statistikom v družboslovju sirom 

Francisom Galtonom sta postavila osnove korelacijske in regresijske 

analize); 

• William Gosset (1876 – 1937; razvil je metode statističnega sklepanja 

na osnovi majhnih množic podatkov; pod psevdonimom Student je 

objavil enačbo t-porazdelitve); 

• Sir Ronald Fischer (1890 – 1962; najpomembnejši statistik 20. stoletja). 

32 

•16

2. KVANTILI 

• Ranžirna vrsta je urejena vrsta enot opazovanj od tiste z 

najmanjšo do tiste z največjo vrednostjo. 

• Rang R je zaporedno mesto enote v ranžirni vrsti. 

• Kvantilni rang P pove, na katerem delu celotnega 

ranžirnega razmika leži določena enota (oziroma koliki del 

celotnega razmika ima manjše vrednosti od dane vrednosti). 

Izračunamo ga po formuli: 

P = 

R − 0.5 

N 

kjer je R rang enote, N pa število opazovanih enot. 

(2.1) 

33 

2. KVANTILI / 2 

• Kvantil je vrednost spremenljivke, ki pripada 

določenemu kvantilnemu rangu. 

• Običajni kvantili so: 

• mediana: 

• kvartili: 

• decili: 

• centili: 

Me (P=0.5) 

Q 1 (P=0.25), Q 2 (P=0.50), Q 3 (P=0.75) 

D 1 (P=0.1), D 2 (P=0.2),..., D 9 (P=0.9) 

C 1 (P=0.01), C 2 (P=0.02),..., C 99 (P=0.99) 

• Pri izračunu kvantilov uporabljamo linearno interpolacijo: 

R − R0 

R − R 

1 

0 

x − x0 

= 

x − x 

1 

Če je R med rangoma R 0 in R 1 , je ustrezni x med x 0 in x 1 

. 

0 

(2.2) 

34 

•17


• Pri linearni interpolaciji upoštevamo, da je R 1 - R 0 = 1: 

• poljuben kvantil x z rangom R, ki leži med kvantiloma 

x 0 in x 1 z rangoma R 0 in R 1 , izračunamo po enačbi: 

x = x 

+ ( x1 

− x0)( 

R − 

0) 

0 

R 

(2.3) 

• poljuben rang R kvantila x, ki leži med rangoma R 0 in 

R 1 kvantilov x 0 in x 1 , pa izračunamo po enačbi: 

R = R 

0 

x − x0 

+ 

x − x 

1 

0 

(2.4) 

35 


Primer 2.1: Uredimo na pisnem delu izpita dosežene točke 

(0-100) dvanajstih študentov: 

36 

• Spremenljivka: na pisnem 

delu izpita dosežene točke; 

• Število enot: 12; 

• Podatki: 

60, 35, 90, 40, 95, 15 

45, 25, 60, 10, 85, 65 

• Ranžirna vrsta je: 

x i R i 

10 1 

15 2 

25 3 

35 4 

40 5 

45 6 

60 7 

60 8 

65 9 

85 10 

90 11 

95 12 

•18


Primer 2.2: Za točke iz primera 2.1 izračunajmo mediano 

(P=0.5). 

x i 

10 

15 

25 

35 

40 

45 

60 

60 

65 

85 

90 

95 

R i 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Rang mediane izračunamo po formuli (2.1): 

R = N ⋅ P + 0 .5 = 12⋅0.5 

+ 0.5 = 6.5 

Rang mediane leži med rangoma R 0 = 6 in 

R 1 = 7 in ustrezna mediana med vrednostima 

x 0 = 45 in x 1 = 60. 

Me = x0.5 

= x0 

+ ( x1 

− x0)( 

R − R0 

) = 

= 45 + 15⋅0.5 

= 52.5 

Število doseženih točk, ki razdeli ranžirno 

vrsto na polovico, je 52.5 (mediana je 52.5). 

37 


Primer 2.3: Za podatke iz primera 2.1 izračunajmo kvantilni 

rang za 50 doseženih točk (x=50). 

x i 

10 

15 

25 

35 

40 

45 

60 

60 

65 

85 

90 

95 

R i 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

Sosednji vrednosti sta med x 0 = 45 in x 1 = 60 

in ustrezna ranga sta R 0 = 6 in R 1 = 7: 

R = R 

0 

x − x 

+ 

x − x 

1 

0 

0 

= 6 + 

5 

15 

= 6.33 

R − 0.5 6.33 − 0.5 

P = = = 0,486 

N 12 

Skoraj 49% študentov je na pisnem izpitu 

doseglo manj kot 50 točk. 

38 

•19

3. FREKVENČNA 

PORAZDELITEV 

• Frekvenčna porazdelitev spremenljivke je preglednica, 

ki jo določajo vrednosti ali skupine vrednosti ter 

njihove frekvence f i . 

• Če je spremenljivka vsaj ordinalnega značaja, vrednosti ali 

skupine vrednosti uredimo v ranžirno vrsto od najmanjše 

do največje. 

39 

3. FREKVENČNA PORAZDELITEV / 2 

Primer 3.1: Spodaj na levi so podane ocene zadnjega roka izpita 

pri predmetu Statistika z elementi informatike v šolskem letu 

2001/2002. Določimo frekvenčno porazdelitev. 

• Spremenljivka: ocena 

zadnjega roka pri predmetu 

SEI v š.l. 2001/2002; 

• Število enot: 19; 

• Podatki: 

5, 7, 8, 7, 3, 4, 2, 8, 6, 1, 9, 

6, 6, 6, 7, 2, 6, 5, 4 

• Frekvenčna porazdelitev je: 

x i f i 

1 1 

2 2 

3 1 

4 2 

5 2 

6 5 

7 3 

8 2 

9 1 

10 0 

19 

40 

•20

3.1 Opredeljevanje skupin 

vrednosti 

• Število vseh možnih vrednosti proučevane spremenljivke 

je lahko preveliko za pregledno prikazovanje podatkov v 

preglednici. V takih primerih podatke razvrstimo v 

skupine. 

• Posamezni skupini priredimo ustrezno predstavitveno 

vrednost oziroma predstavnika skupine, ki je nova 

vrednost spremenljivke. 

• Skupine vrednosti morajo biti enolično določene: vsaka 

enota s svojo vrednostjo je lahko uvrščena v samo eno 

skupino. 

41 

3.1.1 Opredeljevanje skupin za 

opisne spremenljivke 

• Opredeljevanje skupin za opisne spremenljivke, ki imajo 

malo vrednosti je enostavno. 

• Pri opisnih spremenljivkah, ki imajo veliko vrednosti, pa 

je opredeljevanje skupin težje: 

• Temeljno pri takšnem opredeljevanju skupin je dobro 

poznavanje obravnavanega področja. 

• Zato skupine za tovrstne vrednosti navadno oblikujejo 

strokovnjaki s posameznih področij. 

• Pritem vrednostiopisnihznakovsistematično razvrščajo in 

izdelujejo klasifikacije. 

• Klasifikacije so sistematično, po skupinah in podskupinah, urejene 

vrednosti opisnih spremenljivk. 

42 

•21

3.1.1 Opredeljevanje skupin za opisne ... / 2 

Primer 3.2: Opredelimo skupini spola. 

• Za spol lahko opredelimo le dve skupini: 

1. moški spol in 

2. ženski spol. 

43 

3.1.2 Opredeljevanje skupin za 

številske spremenljivke 

• Opredeljevanje skupin za številske spremenljivke ima 

mnogo posebnosti. 

• Skupine, ki jih opredelimo za številske spremenljivke, 

imenujemo razrede. 

• Ponavadi najprej preverimo razmik vrednosti proučevane 

spremenljivke, to je variacijski razmik VR (tudi totalni 

razmik): 

VR = x max 

− x min 

(3.1) 

kjer je x max največja vrednost, x min pa najmanjša vrednost 

opazovane spremenljivke. 

44 

•22

3.1.2 Opredeljevanje skupin za številske ... / 2 

• Nato izberemo število razredov (k), v katere bomo 

razvrstili vrednosti spremenljivke. 

• Razredov mora biti toliko, da ostane prikaz podatkov 

pregleden, razredi pa niso premajhni. 

• Število razredov lahko določimo na več načinov. 

Najpogosteje uporabljena je Sturgesova formula: 

k 

= 1+ 

3.32⋅log( 

N) 

(3.2) 

kjer je k število razredov, N pa število vseh opazovanj 

(enot, ki jih želimo razvrstiti v razrede). 

45 


Primer 3.3: Predpostavimo katastrsko občino s 5000 parcelami. 

Zaradi velike množice podatkov želimo le-te razvrstiti v razrede. V 

koliko razredov je priporočljivo razvrstiti opazovanja? 

Če vstavimo n = 5000 v formulo (3.2), dobimo k = 13.281: 

k = 1 + 3.32⋅log( 

n) 

= 1+ 

3.32⋅log(5000) 

= 1+ 

3.32⋅3,699 

= 13,281 

Celotno populacijo parcel obravnavane K.O. bomo predstavili v 

frekvenčni porazdelitvi s pomočjo 13-tih razredov. 

46 

•23


• V razredih se spreminja vrednost spremenljivke od 

spodnje meje razreda (x i,min ) do zgornje meje razreda 

(x i,max ); 

• Razlika med obema mejama se imenuje širina razreda in 

jo označimo z d i : 

d 

i 

= x 

− x 

i, max i,min 

kjer je i oznaka razreda; i=1,2,...,k. 

(3.3) 

47 


• V razrede lahko uvrščamo zvezne ali diskretne vrednosti 

spremenljivk: 

• Diskretna ureditev podatkov v razrede je enostavna: 

zgornja meja določenega razreda je različna od 

spodnje meje naslednjega razreda. 

• Pri zveznih številskih spremenljivkah moramo 

natančno opredeliti, kam spadajo mejni primeri. 

48 

•24


Primer 3.4: Primer diskretne ureditve meja razredov 

Meje razredov 

1− 

9 

10 −19 

20 − 29 

30 − 39 

40 − 49 

oziroma 

Meje razredov 

1≤ 

x ≤ 9 

10 ≤ x ≤ 19 

20 ≤ x ≤ 29 

30 ≤ x ≤ 39 

40 ≤ x ≤ 49 

49 


Primer 3.5: Primer zvezne ureditve meja razredov 

Meje razredov 

[1,10) 

[10,20) 

[20,30) 

[30,40) 

[40,50) 

oziroma 

Meje razredov 

1 ≤ x < 10 

10 ≤ x < 20 

20 ≤ x < 30 

30 ≤ x < 40 

40 ≤ x < 50 

50 

•25


• Širina razredov opredeljenih za številske spremenljivke je 

lahko enaka ali različna. 

• Zaradi boljše preglednosti ter nadaljnje statistične analize 

največkrat uporabljamo enako široke razrede. V tem 

primeru določimo meje razredov s pomočjo 

aritmetičnega zaporedja meja, kjer velja: 

x 

max 

= x min 

+ k ⋅ 

d i 

d i 

= 

x 

max − 

k 

x 

min 

oziroma (3.4) 

51 


• Kadar so razlike med vrednostmi opazovane spremenljivke 

zelo velike, je primerneje uporabiti razrede, kjer je količnik 

med zgornjo in spodnjo mejo enak za vse razrede. 

q = 

i,max 

i,min 

• V takem primeru uporabimo princip geometričnega 

zaporedja meja: 

x 

= x min 

⋅q 

k 

x 

x 

q = 

max oziroma k 

(3.6) 

x 

x 

max 

min 

(3.5) 

52 

•26


• Meje razredov lahko določimo tudi tako, da je v vsakem 

razredu približno enako število enot. Pri tem si pomagamo 

s kvantili: 

1 

P = , 

(3.7) 

k 

• oziroma rangom (mestom enote v ranžirni vrsti): 

R = N ⋅ P + 0.5 

(3.8) 

53 


• Ko smo vrednosti številske spremenljivke uvrstili v razrede 

(postavili meje razredov ter prešteli frekvence razredov f i ), 

lahko izračunamo predstavnike razredov: 

x 

x 

+ x 

i, min i,max 

i 

= (3.9) 

2 

54 

•27


• Izračunamo lahko tudi kumulativne frekvence razredov, 

ki so vsote frekvenc do spodnje meje določenega razreda. 

Kumulativno frekvenco i-tega razreda izračunamo po 

formuli: 

F 

i+1 

= Fi 

+ fi 

(3.6) 

kjer je F i kumulativna frekvenca in f i frekvenca v i-tem 

razredu. 

• Relativno frekvenco in kumulativo pa izračunamo po 

formulah: 

fi 

fi 

% = ⋅100 N (3.7) 

Fi 

F % = ⋅100 N 

i 

(3.8) 

55 

3.2 Kvantili frekvenčne 

porazdelitve 

• Ranžirna vrsta s pripadajočimi rangi je v primeru 

frekvenčne porazdelitve določena s spodnjimi mejami 

razredov in pripadajočimi kumulativami. 

• Izračun kvantilnih rangov in kvantilov nadaljujemo tako, 

kot je opisano v poglavju 2 (Kvantili). 

56 

•28

3.3 Grafično prikazovanje 

frekvenčnih porazdelitev 

• Predpostavimo, da so razredi enako široki (d i je enak za 

vsak i=1,2,...,k): 

• Histogram – drug poleg drugega rišemo stolpce (od spodnje 

meje do zgornje meje razreda) oziroma pravokotnike, katerih 

višina je sorazmerna frekvenci v razredu. Širina 

pravokotnikov je enaka, saj so razredi enako široki. 

• Poligon – v koordinatnem sistemu zaznamujemo točke 

(x i 

, f i 

), kjer je x i 

sredina i-tega razreda in f i 

njegova 

frekvenca. Tem točkam dodamo še točki (x 0 

, 0) in (x k+1 

, 0), 

če je v frekvenčni porazdelitvi k razredov. Točke zvežemo z 

daljicami. 

• Ogiva –grafična predstavitev kumulativne frekvenčne 

porazdelitve s poligonom, kjer v koordinatni sistem vnašamo 

točke (x i,min 

, F i 

). 

57 

3.3 Grafično prikazovanje ... / 2 

Primer 3.6: Narišimo histogram, poligon in ogivo (poligon 

kumulativnih frekvenc) za ocene izpita iz primera 3.1, ki so podane 

v naslednji frekvenčni porazdelitvi (predpostavimo, da je bila ocena 

5 že pozitivna ocena): 

meji 

f i 

x i,min 

x i,max 

x i 

F i 

1-2 

3 

0.5 

2.5 

1.5 

0 

3-4 

3 

2.5 

4.5 

3.5 

3 

5-6 

7 

4.5 

6.5 

5.5 

6 

7-8 

5 

6.5 

8.5 

7.5 

13 

9-10 

1 

8.5 

10.5 

9.5 

18 

19 

19 

58 

•29


Primer 3.6 nadaljevanje: Histogram frekvenc 

8 

meji 

1-2 

f i 

3 

x i 

1.5 

3-4 

3 

3.5 

6 

5-6 

7-8 

7 

5 

5.5 

7.5 

9-10 

1 

9.5 

f 

4 

2 

59 

0 

0 1 2 3 4 5 6 7 8 9 10 11 

X 


Primer 3.6 nadaljevanje: Poligon frekvenc 

meji 

f i 

x i 

8 

1-2 

3-4 

3 

3 

1.5 

3.5 

5-6 

7 

5.5 

6 

7-8 

5 

7.5 

9-10 

1 

9.5 

f 

4 

2 

60 

0 

-2 0 2 4 6 8 10 12 

X 

•30


Primer 3.6 nadaljevanje: Ogiva (poligon kumulativnih frekvenc) 

20 

x i,min 

0.5 

F i 

0 

16 

2.5 

4.5 

3 

6 

F 

12 

8 

6.5 

8.5 

10.5 

13 

18 

19 

4 

61 

0 

0 2 4 6 8 10 12 

X 

3.4 Oblike frekvenčnih 

porazdelitev 

• Frekvenčna porazdelitev prikazuje variiranje ali 

razpršenost vrednosti spremenljivke. 

• Razpršenost je rezultat posamičnih faktorjev, ki 

vplivajo na posamezne enote. Ti vplivi so najrazličnejši 

in njihova posledica so različne oblike frekvenčnih 

porazdelitev. 

• Frekvenčna porazdelitev, s katero običajno primerjamo 

drugo frekvenčno porazdelitev, je normalna 

porazdelitev, ki je unimodalna (ima en vrh), 

simetrična in zvonaste oblike. 

62 

•31

3.4 Oblike frekvenčnih porazdelitev... / 2 

• Oblika porazdelitev se lahko od normalne bolj ali manj 

razlikuje zaradi nehomogenosti populacije, okrnjenega 

delovanja določenih faktorjev itd. Zato je oblika 

porazdelitve lahko: 

• asimetrična v desno – če se rep vleče na desno; 

• asimetrična v levo – če se rep vleče na levo; 

• J ali U oblike; 

• dvovrhna – če ima dva vrhova; 

• večvrhna – če ima več vrhov; 

• bolj koničasta ali sploščena od normalne porazdelitve; 

• itd. 

63 

3.4 Oblike frekvenčnih porazdelitev... / 2 

64 

•32

4. SREDNJE VREDNOSTI 

• Pregled vrednosti opazovane spremenljivke dobimo z 

ranžirno vrsto ali v primeru večjega števila enot s 

frekvenčno porazdelitvijo. 

• Iz pregleda vrednosti običajno opazimo, da se enote 

gostijo okoli neke vrednosti, ki jo imamo za predstavitveno 

vrednost spremenljivke in jo imenujemo srednja 

vrednost. 

• Čim bolj vrednosti variirajo (predvsem zaradi izrazitih 

posamičnih vplivov), tem bolj se posamezne vrednosti 

odklanjajo od srednje vrednosti in tem slabše ta srednja 

vrednost predstavlja spremenljivko. 

65 

4. SREDNJE VREDNOSTI / 2 

Najpogosteje uporabljene srednje vrednosti so: 

1. mediana Me 

2. modus Mo 

3. aritmetična sredina ali povprečje 

4. geometrijska sredina G 

5. harmonična sredina H 

μ 

66 

•33

4.1 Mediana 

• Mediana Me je tista vrednost spremenljivke, od katere 

ima polovica enot ranžirne vrste manjše, polovica pa 

večje vrednosti spremenljivke. 

• Mediana je vrednost, ki leži na sredini ranžirne vrste: je 

vrednost, ki pripada kvantilnemu rangu P=0.5. 

• Na mediano vplivajo samo vrednosti v sredini ranžirne 

vrste. 

• Mediana je primerna srednja vrednost za vsaj 

ordinalne spremenljivke. 

67 

4.1 Mediana / 2 

• Če je v ranžirni vrsti liho število enot N = 2m + 1, je 

mediana (m+1)-ta vrednost v ranžirni vrsti. 

Primer 4.1: Podatki so 2, 3, 6, 7, 8, 10, 11, 21, 23. Ker 

imamo liho število enot N = 9, je mediana na 5. mestu; 

in sicer Me = 8. 

• Če pa je v ranžirni vrsti sodo število enot N = 2m, 

izračunamo mediano po formuli: 

Me 

x m 

+ x 

2 

m+1 

= 

(4.1) 

68 

Primer 4.2: Podatki so 2, 3, 6, 8, 10, 11, 21, 23. Ker 

imamo sodo število enot N = 8, je mediana Me = 9. 

•34


• Iz frekvenčne porazdelitve lahko mediano le ocenimo 

(ocena temelji na domnevi, da so enote v razredu 

enakomerno porazdeljene od spodnje do zgornje meje 

razreda): 

1. Iz podatkov o kumulativnih frekvencah ugotovimo, v 

katerem razredu leži mediana. Ta razred imenujemo 

medianin razred. 

69 

2. Mediano izračunamo po enačbi: 

N ⋅ PMe + 0.5 − F 

Me = x0,min+ 

d0 

f 

1. kjer sta x 0,min 

spodnja meja in d 0 

širina medianinega 

razreda, f 0 

frekvenca in F 0 

kumulativna frekvenca 

medianinega razreda, N število enot, P Me 

pa kvantilni 

rang mediane. 

0 

0 

(4.2) 


Primer 4.3: Za frekvenčno porazdelitev ocen iz primera 3.6 

izračunajmo mediano. 

meji 

1-2 

3-4 

5-6 

7-8 

9-10 

f i 

3 

3 

7 

5 

1 

x i,min 

0.5 

2.5 

4.5 

6.5 

8.5 

10.5 

F i 

0 

3 

6 

13 

18 

19 

Iz kumulativnih frekvenc 

ugotovimo, da leži mediana v 

tretjem razredu: 

Me = x 

0 

+ d 

0 

N ⋅ P 

Me 

+ 0.5 − F 

f 

19⋅0.5 

+ 0.5 − 6 

= 4.5 + 2⋅ 

= 5.64 

7 

0 

0 

= 

Mediana je 5.64. 

70 

•35


Grafično določimo mediano iz ogive; za primer 4.3: 

71 

F 

20 

18 

16 

14 

12 

10 

8 

6 

4 

2 

0 

100% 

50% 

Me 

0 1 2 3 4 5 6 7 8 9 10 11 12 

X 

4.2 Modus 

• Modus Mo je vrednost spremenljivke, ki se v množici 

opazovanj najpogosteje pojavlja. 

• Lahko je več modusov (polimodalna porazdelitev populacije), 

lahko pa nobenega. 

• Modus pravilno ugotovimo le za razmeroma velik vzorec 

(populacijo). 

• Modus je primerna srednja vrednost tudi za nominalne 

spremenljivke in edina srednja vrednost za opisne 

spremenljivke. 

72 

•36

4.2 Modus / 2 

Primer 4.4: Za spodnje tri ranžirne vrste določimo modus. 

2,3,5,5,6,8,9,11,14,16 Mo = 5 

2,3,5,5,6,8,9,9,11,14,16 Mo 1 = 5; Mo 2 = 9 

2,3,4,5,6,8,9,10,11,14,16 ni modusa 

73 

4.2 Modus / 3 

• Modus lahko razumemo kot vrednost spremenljivke, 

okoli katere se vrednosti najbolj gostijo. Zato ga 

najlažje določamo iz frekvenčne porazdelitve. 

• Modus se nahaja v razredu z največjo frekvenco, 

ki ga imenujemo modalni razred. 

• Prvi približek modusa je lahko sredina modalnega 

razreda, natančneje pa ga izračunamo po formuli: 

Mo = x 

0,min 

+ d 

f 

− 

0 −1 

0 

2 f0 

− f− 

1 

− f+ 

1 

f 

(4.2) 

74 

• kjer sta x 0 spodnja meja in d 0 širina modalnega 

razreda, f 0 , f 1 in f -1 pa frekvence modalnega, 

prejšnjega in naslednjega razreda. 

•37

4.2 Modus / 4 


izračunajmo modus. 

meji 

1-2 

3-4 

5-6 

7-8 

9-10 

f i 

3 

3 

7 

5 

1 

x i,min 

0.5 

2.5 

4.5 

6.5 

8.5 

10.5 

Modus leži v tretjem razredu, kjer je 

frekvenca največja : 

Mo = x 

0,min 

+ d 

0 −1 

0 

2 f0 

− f− 

1 

− f+ 

1 

7 − 3 

= 4.5 + 2⋅ 

= 5.83 

2⋅7 

− 3− 

5 

f 

− 

f 

= 

Modus je 5.83. 

75 

4.2 Modus / 5 

Grafično določimo modus iz histograma; za primer 4.5: 

8 

6 

f 

4 

2 

76 

0 

Mo 

0 1 2 3 4 5 6 7 8 9 10 11 

X 

•38

4.3 Aritmetična sredina 

ali povprečje 

• Aritmetična sredina ali povprečje je vsota vseh 

vrednosti deljena s številom enot v populaciji (vzorcu): 

1 

μ = 

N 

∑ x i 

N i= 

1 

(4.3) 

• Primerna je za številske, približno normalno porazdeljene 

spremenljivke. 

• Vsaka posamezna vrednost x i (i=1,2,...n) se od 

aritmetične sredine odklanja navzgor ali navzdol: odklon 

(x i - ) je pozitiven ali negativen; velja: 

μ 

N 

∑ 

i= 

1 

( x 

i 

− μ) 

= 0 

μ 

(4.4) 

77 

4.3 Aritmetična sredina / 2 

Primer 4.6: Za ocene iz primera 3.1 izračunajmo 

aritmetično sredino. 

• Število enot: 19 

• Podatki: 

5, 7, 8, 7, 3, 4, 2, 

8, 6, 1, 9, 6, 6, 6, 

7, 2, 6, 5, 4 

Aritmetična sredina je: 

N 

1 

μ = ∑ 

N 

x i 

i= 

1 

= 

102 

19 

= 5,37 

Povprečna ocena je 5.37. 

78 

•39


• Včasih je smiselno, da imajo vrednosti x 1 ,x 2 ,...,x N 

različen vpliv pri izračunu povprečja. 

• Vsaka vrednost ima svojo utež p 1 ,p 2 ,...,p N . Če 

upoštevamo uteži, izračunamo tehtano aritmetično 

sredino: 

μ = 

1 

N 

∑ 

N 

i 

∑ = 1 

pi 

i= 

1 

p x 

i 

i 

(4.4) 

79 


Primer 4.7: Geodet je hodil od geodetske točke A do B pet 

minut s hitrostjo 1.4 m/s, od točke B do C pa deset minut s 

hitrostjo 1.1 m/s. Kolikšna je bila povprečna hitrost na celotni poti? 

Povprečno hitrost izračunamo kot tehtano aritmetično 

sredino, kjer so uteži časi: 

s 

v = t 

5⋅1.4 

+ 10⋅1.1 

= 

= 1,2 

5 + 10 

Povprečna hitrost na celotni poti je bila 1.2 m/s. 

80 

•40


• Tehtano aritmetično sredino uporabljamo za izračun 

aritmetične sredine vrednosti, ki so uvrščene v 

frekvenčno porazdelitev: 

1. za vsak razred določimo predstavnika razreda x i 

(po formuli 3.9); 

Ker ne poznamo posamičnih vrednosti v razredu, predpostavimo, da so vse vrednosti v 

razredu enake sredini razreda. 

81 

2. predstavnika razreda upoštevamo f i 

-krat: 

1 

μ = 

k 

∑ 

f x 

= 

∑ 

N i= 

1 

i i k 

∑ fi 

i= 

1 

i= 

1 

kjer je f i frekvenca i-tega razreda, k pa število 

razredov. 

1 

k 

f x 

i 

i 

(4.4) 



izračunajmo aritmetično sredino. 

f i 

3 

3 

7 

5 

1 

x i 

1.5 

3.5 

5.5 

7.5 

9.5 

Aritmetična sredina frekvenčne porazdelitve 

je: 

k 

1 

μ = ∑ fixi 

= 

k 

i 1 

f 

= 

1 

19 

∑ = 

i 

i= 

1 

⋅(4.5 

+ 10.5 + 38.5 + 37.5 + 9.5) = 5.29 

Povprečna ocena je 5.29. 

82 

•41

4.4 Primerjava aritmetične 

sredine, modusa in mediane 

• Za unimodalne, simetrične porazdelitve je 

μ = Me = Mo 

• Za unimodalne porazdelitve, asimetrične v levo je 

< Me < Mo 

μ 

83 

4.4 Primerjava ... / 2 

• Za unimodalne porazdelitve, asimetrične v desno je 

Mo < Me < μ 

84 

•42

4.4 Primerjava ... / 3 

• Za unimodalne in ne preveč asimetrično porazdeljene 

spremenljivke približno velja naslednja zveza 

μ − Mo ≈ 3( 

μ − Me) 

(4.5) 

• Primer 4.9: Zopet vzemimo primer frekvenčno 

porazdeljenih ocen iz 3.6 in izračunane vrednosti, 

mediane, modusa in aritmetične sredine: 

Me = 5.50, Mo = 5.83, μ= 5.29. 

μ < Me < Mo 

Vidimo, da velja 

, zato je frekvenčna 

porazdelitev ocen asimetrična v levo. 

Približno velja tudi enakost (4.5): -0.54 ≈ -0.63. 

85 

4.5 Geometrijska sredina 

• Geometrijska sredina G je enaka N-temu korenu iz 

produkta N vrednosti številske spremenljivke, kjer 

morajo vse vrednosti x i biti večje od 0 ( ): 

G = 

N 

x1 ⋅ x2 

⋅... 

⋅ 

N 

x N N 

= ∏ xi 

i= 

1 

(4.6) 

• Dokazati se da, da je logaritem geometrijske sredine 

enak aritmetični sredini logaritmov vrednosti 

spremenljivke: 

1 

logG 

= 

N 

N 

∑ 

i= 

1 

log 

x i 

x i 

< 0 

(4.7) 

86 

•43

4.5 Geometrijska sredina / 2 


geometrijsko sredino. 


• Podatki: 

5, 7, 8, 7, 3, 4, 2, 

8, 6, 1, 9, 6, 6, 6, 

7, 2, 6, 5, 4 

Geometrijska sredina je ocen je: 

G = N 

∏ 

= 

19 

N 

i= 

1 

x i 

= 

73 74186 086 400 = 4.76 

87 

4.6 Harmonična sredina 

• Harmonična sredina H je enaka recipročni vrednosti 

aritmetične sredine, izračunane iz recipročne vrednosti 

spremenljivke: 

H = 

1 

x 

1 

N 

1 

+ 

x 

2 

+ ⋅⋅⋅ + 

1 

x N 

(4.8) 

88 

•44

4.6 Harmonična sredina / 2 


harmonično sredino. 


• Podatki: 

5, 7, 8, 7, 3, 4, 2, 

8, 6, 1, 9, 6, 6, 6, 

7, 2, 6, 5, 4 

Harmonična sredina ocen je: 

N 

H = 

1 1 1 

+ + ⋅⋅⋅+ 

x1 

x2 

x N 

19 

= 3.91 

1 1 1 

+ + ⋅⋅⋅ + 

5 7 4 

= 

89 

4.7 Primerjava aritmetične, 

geometrijske in harmonične sredine 

• Primerjava aritmetične, geometrijske in harmonične 

sredine pokaže,da velja: 

H ≤ G ≤ μ 

• Vse tri sredine so enake samo v primeru, ko so vse 

proučevane x 1 , x 2 ,...,x N enake. 

(4.9) 

• Primer 4.12: Zopet vzemimo primer ocen 3.1 ter 

primerjajmo njihovo aritmetično, geometrijsko in 

harmonično sredino. 

Vidimo, da velja: 

H = 3 .91 ≤ G = 4.76 ≤ μ = 5.37 

90 

•45

4.8 Kvadratna sredina 

• Kvadratna sredina RMS je enaka pozitivni vrednosti 

kvadratnega korena sredine vsote kvadratov opazovanih 

vrednosti: 

RMS 

N 

∑ 

i= 

1 

= 

N 

x 

2 

i 

(4.10) 

91 

4.8 Kvadratna sredina / 2 


kvadratno sredino. 


Kvadratna sredina ocen je: 

• Podatki: 

5, 7, 8, 7, 3, 4, 2, 

8, 6, 1, 9, 6, 6, 6, 

7, 2, 6, 5, 4 

RMS = 

= 

5 

2 

N 

∑ 

i= 

1 

N 

x 

2 

i 

= 

2 

+ 7 + ⋅⋅⋅ + 4 

19 

2 

= 5.79 

92 

•46

5. MERE RAZPRŠENOSTI 

• Mere razpršenosti (tudi variacije ali variabilnosti) 

označujejo stopnjo razpršenosti opazovanih vrednosti 

okrog srednje vrednosti. 

• Ločimo več mer razpršenosti, ki jih delimo na: 

• absolutne mere razpršenosti – proučujemo razpršenost ene 

populacije (vzorca); 

• relativne mere razpršenosti – za primerjavo razpršenosti 

dveh ali več populacij (vzorcev). 

93 

5. MERE RAZPRŠENOSTI / 2 

• Absolutne mere razpršenosti delimo, glede na to kako 

vrednotijo razpršenost spremenljivke: 

• razmiki - upoštevajo le dve vrednosti : 

• variacijski razmik, 

• kvartilni razmik, 

• itd.; 

94 

• odkloni - upoštevajo vse vrednosti spremenljivke 

(razen kvartilnega odklona): 

• kvartilni odklon, 

• povprečni absolutni odklon, 

• povprečni kvadratni odklon, 

• standardni odklon, 

• itd. 

•47

5.1 Variacijski razmik 

• Variacijski razmik VR je najbolj preprosta mera 

razpršenosti; enaka je razliki med največjo in najmanjšo 

vrednostjo opazovane spremenljivke (glej tudi 3.1): 

VR = x max 

− x min 

(5.1) 

kjer je x max največja vrednost, x min pa najmanjša 

vrednost opazovane spremenljivke. 

• Na vrednost variacijskega razmika vplivajo osamelci – 

to so opazovane vrednosti, ki se tako razlikujejo od 

drugih vrednosti, da je vprašljiva njihova vključitev v 

vzorec. 

95 

5.1 Variacijski razmik / 2 

Primer 5.1: Za ocene iz primera 3.1 izračunajmo variacijski 

razmik. 

• Podatki: 

5, 7, 8, 7, 3, 4, 2, 

8, 6, 1, 9, 6, 6, 6, 

7, 2, 6, 5, 4 

Variacijski razmik opazovanih 

vrednosti je: 

VR X 

= xmax − xmin 

= 9 −1 

= 8 

96 

•48

5.2 Kvartilni razmik 

• Kvartilni razmik QR je razlika med tretjim in prvim 

kvartilom: 

QR = Q 3 

− Q 1 

kjer sta Q 1 in Q 3 prvi in tretji kvartil. 

(5.2) 

• Na vrednost kvartilnega razmika ne vplivajo osamelci, 

saj je med Q 1 in Q 3 le polovica vseh opazovanj: četrtina 

jih je levo od Q 1 , četrtina pa desno od Q 3 . 

97 

5.2 Kvartilni razmik / 2 

Primer 5.2: Za ocene iz primera 3.1 izračunajmo kvartilni 

razmik. 

• Podatki: 

5, 7, 8, 7, 3, 4, 2, 

8, 6, 1, 9, 6, 6, 6, 

7, 2, 6, 5, 4 

Po formulah (2.1) in (2.2) najprej 

izračunamo prvi in tretji kvartil, 

nato pa kvartilni razmik: 

Q 

Q 

1 

3 

= 4 

= 7 

QR = Q 

3 

− Q 

1 

= 7 − 4 = 3 

Kvartilni razmik ocen je 3. 

98 

•49

5.3 Kvartilni odklon 

• Kvartilni odklon Q je polovica razlike med tretjim in 

prvim kvartilom oziroma polovica kvartilnega razmika: 

Q3 − Q1 

QR 

Q = = 

2 2 

(5.3) 

• Primer 5.3: Za ocene iz primera 3.1 izračunajmo 

kvartilni odklon. 

Kvartilni razmik smo izračunali v primeru 5.2 in je 

QR = 3; torej znaša kvartilni odklon Q = 1.5. 

99 

5.4 Povprečni absolutni odklon 

• Povprečni absolutni odklon računamo za aritmetično 

sredino in mediano po formulah: 

AD 

μ 

= 

1 

N 

N 

∑ 

i= 

1 

x i 

− μ 

(5.4) 

AD 

Me 

= 

1 

N 

N 

∑ 

i= 

1 

x − Me 

i 

(5.5) 

100 

•50

5.4 Povprečni absolutni odklon / 2 

x i 

78 

5 

7 

8 

|x i 

-μ| 

0,37 

1,63 

2,63 

|x i 

-Me| 

1 

1 

2 

Primer 5.4: Za ocene iz primera 3.1 

izračunajmo povprečni absolutni odklon 

od aritmerične sredine in od mediane. 

7 

1,63 

1 

3 

4 

2 

8 

2,37 

1,37 

3,37 

2,63 

3 

2 

4 

2 

AD 

μ 

N 

1 

= ∑ 

N 

i= 

1 

x i 

− μ = 1. 

6 

1 

9 

6 

0,63 

4,37 

3,63 

0,63 

0 

5 

3 

0 

AD 

Me 

N 

1 

= ∑ 

N 

i= 

1 

x − Me 

i 

= 1.68 

6 

0,63 

0 

6 

0,63 

0 

7 

1,63 

1 

2 

3,37 

4 

6 

0,63 

0 

5 

0,37 

1 

101 

4 

1,37 

2 


• Za frekvenčno porazdelitev izračunamo povprečni 

absolutni odklon s frekvencami kot utežmi: 

AD 

μ 

= 

1 

N 

N 

∑ 

i= 

1 

f i 

x i 

− μ 

(5.6) 

AD 

Me 

= 

1 

N 

N 

∑ 

i= 

1 

f 

i 

x − Me 

i 

(5.7) 

102 

•51



izračunajmo povprečni absolutni odklon od aritmetične 

sredine. 

meji 

1-2 

3-4 

f i 

3 

3 

x i 

1.5 

3.5 

f i 

|x i 

-μ| 

11.37 

5.37 

V primeru 5.4 smo izračunali 

aritmetično sredino za frekvenčno 

porazdelitev : 

μ = 5.29 

5-6 

7-8 

9-10 

7 

5 

1 

19 

5.5 

7.5 

9.5 

1.47 

11.05 

4.21 

33.47 

AD 

= 

μ 

33.47 

19 

N 

1 

= ∑ f i 

x i 

− μ = 

N 

i= 

1 

= 1.76 

Povprečni absolutni odklon od 

aritmetične sredine je 1.76. 

103 

5.5 Varianca in standardni odklon 

2 

σ 

• Varianco izračunamo kot povprečje kvadratov 

odklonov opazovanj od aritmetične sredine: 

2 

σ = 

1 

N 

2 

∑( 

x i 

− μ) 

N i= 

1 

(5.8) 

• Pozitivna vrednost kvadratnega korena iz variance je 

standardni odklon : 

σ 

σ = 

2 

σ 

(5.9) 

Standardni odklon ima isto mersko enoto kot proučevana spremenljivka. 

104 

•52

5.5 Varianca in ... / 2 

x i 

(x i 

-μ) 2 

105 

5 

7 

8 

7 

3 

4 

2 

8 

6 

1 

9 

6 

6 

6 

7 

2 

6 

5 

4 

0.14 

2.66 

6.93 

2.66 

5.61 

1.87 

11.35 

6.93 

0.40 

19.08 

13.19 

0.40 

0.40 

0.40 

2.66 

11.35 

0.40 

0.14 

1.87 

Primer 5.6: Za ocene iz primera 3.1 

izračunajmo varianco in standardni odklon. 

Varianco in standardni odklon izračunamo 

po enačbah 5.8 in 5.9: 

N 

2 1 

σ = ∑( 

N 

2 

σ = σ 

i= 

1 

= 

x i 

− μ) 

Varianca je 4.65, standardni odklon pa 

2.16. 

2 

4.65 = 2.16 

88.42 

= = 4.65 

19 


• Za frekvenčno porazdelitev izračunamo varianco s 

frekvencami kot utežmi: 

2 

σ = 

1 

N 

∑ 

f i 

( x i 

− μ) 

2 

N i= 

1 

(5.10) 

106 

•53



izračunajmo varianco in standardni odklon. 

meji 

1-2 

3-4 

f i 

3 

3 

x i 

1.5 

3.5 

f i 

(x i 

-μ) 2 

43.08 

9.61 

V primeru 5.4 smo izračunali 

aritmetično sredino za frekvenčno 

porazdelitev : 

μ = 5.29 

5-6 

7-8 

9-10 

7 

5 

1 

5.5 

7.5 

9.5 

0.31 

24.43 

17.73 

2 

σ 

N 

1 

= ∑ 

N 

i= 

1 

f i 

( x i 

− μ) 

2 

95.16 

= = 5.01 

19 

19 

95.16 

2 

σ = σ 

= 

5.01 = 2.24 

Varianca je 5.01, standardni odklon pa 

2.24. 

107 


• Nekaj lastnosti variance: 

1. varianco lahko izračunamo tudi takole: 

σ 

N 

2 1 

2 ⎛ 1 

∑ fi 

( xi 

− μ) 

= ⎜ 

N i= 

1 

N 

= ∑ x 

⎝ i= 

1 

N 

2 

i 

⎞ 2 

⎟ − μ 

⎠ 

(5.11) 

2. varianca je enaka, če vsem vrednostim 

spremenljivke prištejemo ali odštejemo isto 

konstanto. 

108 

•54


• Sheppardov popravek – Varianca, ki jo izračunamo iz 

podatkov, urejenih v frekvenčno porazdelitev, je le 

ocena prave vrednosti variance. Dokazano je, da je ta 

ocena za spremenljivke, ki so porazdeljene približno 

normalno (v obliki zvonaste in simetrične porazdelitve), 

sistematično prevelika. Zato je Sheppard predlagal 

popravek ocene variance: 

σ 

2 

2 2 d 

pop 

= σ − 

12 

(5.12) 

kjer je d širina razreda. 

109 


Primer 5.8: V primeru 5.7 smo izračunali varianco za 

frekvenčno porazdelitev ocen. Izračunajmo po Sheppardu 

popravljeno varianco. 

meji 

f i 

x i,min 

x i,max 

Ker je širina razreda 2, je: 

1-2 

3-4 

5-6 

7-8 

9-10 

3 

3 

7 

5 

1 

0.5 

2.5 

4.5 

6.5 

8.5 

2.5 

4.5 

6.5 

8.5 

10.5 

2 

2 

2 2 d 2 

σ pop = σ − = 5.01− 

= 

12 12 

= 5.01− 

0.33 = 4.67 

S Sheppardovim popravkom 

popravljena varianca je 4.67. 

19 

110 

•55


• Predpostavimo, da se spremenljivka X porazdeljuje 

normalno (glej poglavje 6) z aritmetično sredino μ in 

standardnim odklonom . Tedaj velja, da v razmiku: 

[ μ −σ 

, μ + σ ] 

σ 

• leži 68.27 % enot populacije; 

[ μ − 2σ 

, μ + 2σ 

] 


[ μ − 3σ 

, μ + 3σ 

] 

• leži 99.73 % enot populacije. 

111 


112 

•56

5.6 Relativne mere razpršenosti 

• Absolutne mere razpršenosti redko primerjamo med 

seboj. Za primerjavo razpršenosti dveh ali več množic 

podatkov (populacij ali vzorcev) uporabljamo relativne 

mere razpršenosti. 

• Relativno mero razpršenosti izračunamo tako 

absolutno mero delimo z ustrezno srednjo vrednostjo. 

113 

5.6 Relativne mere razpršenosti / 2 

• relativni variacijski razmik je: 

x 

RVR = 2⋅ 

x 

max 

max 

− x 

+ x 

min 

min 

(5.13) 

• relativni kvartilni odklon je: 

Q3 

− Q1 

RQ = 2 ⋅ Me 

(5.14) 

114 

•57


• relativni povprečni absolutni odklon je: 

RAD 

Me = 

AD 

Me 

Me 

(5.15) 

• relativni standardni odklon ali koeficient variacije je: 

KV 

σ 

= 

μ 

(5.16) 

115 


Primer 5.9: Primerjajmo razpršenost podatkov za ocene 

prvega in zadnjega roka izpita pri predmetu Statistika z 

elementi informatike v šolskem letu 2001/2002. 

116 

• N X : 21 

• X: 3, 3, 3, 3, 7, 3, 

8, 1, 2, 1, 1, 8, 6, 

3, 2, 1, 3, 6, 3, 2, 

3 

• N Y : 19 

• Y: 5, 7, 8, 7, 3, 4, 

2, 8, 6, 1, 9, 6, 6, 

6, 7, 2, 6, 5, 4 

Iz podatkov izračunamo obe 

aritmetični sredini, standardna 

odklona ter koeficienta variacije: 

μ = 3.43, σ 

X 

μ = 5.37, σ 

Y 

Y 

X 

= 2.17, KV 

= 2.16, KV 

= 0.63 

= 0.40 

Podatki kažejo, da so na prvem 

roku izpita študenti v povprečju 

slabše pisali kot na zadnjem. 

Čeprav sta standardna odklona 

ocen na prvem in zadnjem roku 

izpita skoraj enaka, pa je relativna 

razpršenost ocen prvega roka 

večja. 

Y 

X 

•58

6. NORMALNA 

PORAZDELITEV 

• Gaussova ali normalna porazdelitev. 

• Nekaj primerov pojavov in spremenljivk, katerih 

porazdelitve na teh pojavih so podobne normalni 

porazdelitvi: 

• demografska in družbena statistika: 

• višina in teža za večjo skupino ljudi iste starosti in spola, 

• število rojstev, porok in smrti v določenih stalnih razmerah, 

• plače velikega števila zaposlenih v podobnih razmerah itd. 

• psihološka in pedagoška statistika: 

• rezultati testov in znanja, 

• inteligentnost merjena s standardiziranimi testi itd. 

117 

6.1 Splošne lastnosti 

• ponazarja jo enovrhna, simetrična, zvonasta in gladka 

krivulja; 

• je teoretična porazdelitev, ki se ji lahko nekatere 

dejanske porazdelitve zelo približajo; 

• določata jo dva parametra: aritmetična sredina , ki 

vpliva na lego krivulje porazdelitve, ter standardni 

odklon σ , ki vpliva na obliko krivulje (večji σ pomeni 

večjo raztegnjenost v smeri abscisne osi); 

− ∞ 

[ μ − 3σ 

, μ + 3σ 

] 

• teoretično se razteza med in , čeprav je v 

razmiku 

kar 99.73 % enot populacije; 

∞ 

μ 

118 

•59

6.1 Splošne lastnosti / 2 

• celotna ploščina pod krivuljo predstavlja 100% vseh 

vrednosti porazdelitve; 

• največ vrednosti se nahaja okrog sredine; 

• mnoge različne množične pojave - predvsem naravne - 

opisuje z razmeroma visoko stopnjo natančnosti. 

119 


• Denimo, da se spremenljivka X porazdeljuje normalno z 

aritmetično sredino μ in standardnim odklonom σ . Tedaj 

velja, da v razmiku: 

[ μ −σ 

, μ + σ ] 


[ μ − 2σ 

, μ + 2σ 

] 


[ μ − 3σ 

, μ + 3σ 

] 

• leži 99.73 % enot populacije. 

120 

•60


121 


Primer 6.1: Predpostavimo, da se trajanje nosečnosti 

porazdeljuje približno normalno z aritmetično sredino 260 dni 

in standardnim odklonom 16 dni. 

Iz povedanega vemo, da traja nosečnost pri 95.45 % 

ženskah med 228 in 292 dnevi: 

μ − 2 σ = 260 − 32 = 228 

μ + 2 σ = 260 + 32 = 292 

122 

•61

6.2 Standardizacija spremenljivke 

Aritmetična sredina in standardni odklon dajeta dobro informacijo o porazdelitvi populacije 

opazovane spremenljivke – z njima lahko ugotavljamo položaj vrednosti v porazdelitvi. 

123 

• Denimo, da vsaki vrednosti x i spremenljivke X 

odštejemo njeno aritmetično sredino μ in delimo z 

njenim standardnim odklonom : 

z 

i 

= i 

x − μ 

σ 

• Dobimo novo spremenljivko Z, ki jo imenujemo 

standardizirana spremenljivka Z. 

(6.1) 

• Vrednosti z i - standardizirani odkloni - povedo, za 

koliko standardnih odklonov je izbrana vrednost x i 

večja (z i je pozitiven) ali manjša od aritmetične sredine 

(z i je negativen). 

σ 

6.2 Standardizacija spremenljivke / 2 

Primer 6.2: Zanima nas, kje v populaciji se nahaja mama, 

ki je rodila otroka v 244 dnevu nosečnosti. Iz primera 6.1 

vemo, da se trajanje nosečnosti porazdeljuje približno 

normalno z aritmetično sredino 260 dni in standardnim 

odklonom 16 dni. 

Izračunajmo standardiziran odklon z 244 : 

z 

244 − 260 

= = 

16 

244 

− 

Mama, ki je rodila otroka v 244 dnevu nosečnosti, se 

nahaja točno en standardni odklon pod aritmetično sredino. 

1 

124 

•62

6.3 Standardizirana normalna 

porazdelitev 

• S standardizacijo normalno porazdeljene spremenljivke X 

dobimo standardizirano normalno porazdelitev 

spremenljivke Z (Z~N(0,1)). 

• Aritmetična sredina in varianca spremenljivke Z sta: 

N 

N 

1 1 xi 

− μ 

X 

μZ 

= ∑ zi 

= ∑ 

N N σ 

i= 

1 

i= 

1 

X 

= 0 

(6.2) 

125 

2 1 

σ 

Z 

= 

N 

1 

2 

σ 

X 

1 

⋅ 

N 

∑ 

i= 

1 

N 

N 

∑ 

i= 

1 

( z − μ ) 

2 

2 

1 

= 

N 

( x − μ ) = 1 

i 

i 

Z 

X 

N 

∑ 

i= 

1 

⎛ xi 

− μ 

X 

⎜ 

⎝ σ 

X 

⎞ 

⎟ 

⎠ 

2 

= 

(6.3) 

6.3 Standardizirana normalna ... / 2 

• Standardizirana normalna porazdelitev ima aritmetično 

sredino in standardni odklon . 

μ = 0 

= 1 

Z 

• Zato lahko takšno porazdelitev uporabimo za določanje 

položajev posameznih vrednosti x i za katerokoli 

spremenljivko X, ki se porazdeljuje normalno. 

• V preglednici standardizirane normalne porazdelitve 

(Preglednice porazdelitev v Navodilih za izvedbo vaj) 

lahko za vse vrednosti od 0 ≤ z ≤ 3.79 odčitamo, koliko 

odstotkov celotne ploščine pod krivuljo normalne 

porazdelitve je med in izbrano z-vrednostjo: 

− ∞ 

σ Z 

• Odstotkom ploščine ustrezajo odstotki vrednosti 

porazdelitve, ki so na intervalu med -∞ in izbrano 

z-vrednostjo. 

126 

•63


Primer 6.3: Zanima nas, kolikšen odstotek vrednosti 

porazdelitve se nahaja med aritmetično sredino slučajne 

spremenljivke Z in izbrano pozitivno vrednostjo z = 1.10. 

− ∞ 

V preglednici porazdelitve vidimo, da se od do z = 1.10 

nahaja pod krivuljo normalne porazdelitve P(z=1.10) = 0.86433 

dela celotne ploščine. 

Ker se levo od aritmetične sredine slučajne spremenljivke Z nahaja 

prav tolikšen del opazovanj kot desno od nje, to je 50 %, sledi, da 

je P(z)% = 86.43 % - 50 % = 36.43 % 

vseh vrednosti. 

To pomeni, da se nahaja 36.43 % 

vseh vrednosti med aritmetično 

sredino slučajne spremenljivke Z 

in pozitivno vrednostjo z = 1.10. 

127 



porazdelitve se nahaja med izbrano negativno vrednostjo 

z = -1.10 in aritmetično sredino slučajne spremenljivke Z. 

V preglednici standardizirane normalne porazdelitve imamo 

izpisane ploščine za z i 

≥ 0 . Ker je normalna krivulja simetrična, 

se med negativno z-vrednostjo in sredino μ z 

= 0 nahaja prav toliko 

vrednosti kot med sredino μ z 

= 0 in enako pozitivno z-vrednostjo 

(glej primer 6.3). 

To pomeni, da se nahaja 36.43 % vseh 

vrednosti med izbrano negativno 

vrednostjo z = -1.10 in aritmetično 

sredino slučajne spremenljivke Z. 

128 

•64



porazdelitve slučajne spremenljivke Z se nahaja nad izbrano 

pozitivno vrednostjo z = 1.10. 

Ko iščemo odstotek vrednosti P(z)% nad izbrano pozitivno 

z-vrednostjo, moramo od skupne ploščine pod krivuljo normalne 

porazdelitve, ki znaša 1, odšteti odčitek iz preglednice 

porazdelitve; to je ploščino od − ∞ do izbrane pozitivne 

z-vrednosti: P( z >1.10 ) = 1 - 0.86433 = 0.13567. 

To pomeni, da se nahaja 13.57 % 

vseh vrednosti nad izbrano 

vrednostjo z = 1.10. 

129 



porazdelitve slučajne spremenljivke Z se nahaja med izbrano 

negativno vrednostjo z 1 

= -1.10 in enako pozitivno vrednostjo 

z 2 

= 1.10. 

V tem primeru moramo od ploščine P(z=1.10) = 0.86433 dela 

celotne ploščine odšteti P( z < −1.10 ) = P( z >1. 10 ), kar zapišemo: 

P( −1 .10 < z < 1.10 ) = P(z 2 

=1.10) - P(z 2 

=-1.10) = 

= 0.86433 – 0.13567 = 0.72866. 

To pomeni, da se nahaja 72.87 % vseh 

vrednosti med izbrano negativno 

vrednostjo z 1 

= -1.10 in enako 

pozitivno z-vrednostjo. 

130 

•65


Primer 6.7: Zanima nas, kolikšna je z-vrednost, ki ji ustreza 

odstotek vrednosti porazdelitve P(z)% = 88.1 %. 

V preglednici standardizirane normalne porazdelitve poiščemo 

v stolpcih z vrednostmi deležev porazdelitve vrednost 

P(z)% = 88.1 % oziroma P(z) = 0.88100. 

Temu odstotku deleža porazdelitve ustreza vrednost z = 1.18: 

P( z)% 

= 88.1% ⇒ z = 1.18 

131 


Primer 6.8: Zanima nas, kolikšna je z-vrednost, ki ji ustreza 

odstotek vrednosti porazdelitve P(z)% = 58 %. 

132 

V preglednici standardizirane normalne porazdelitve ne najdemo 

vrednosti P(z)% = 58 % oziroma P(z) = 0.58000. Ugotovimo le, 

da se nahaja med vrednostima P(z m 

) = 0.57926 in P(z v 

) = 

0.58317; ustrezni vrednosti sta z m 

= 0.20 in z v 

= 0.21. Pravo 

z-vrednost, ki leži med z m 

in z v 

poiščemo s pomočjo linearne 

interpolacije: 

z = z 

m 

P( 

z) 

− P( 

zm) 

+ 

10⋅( 

P( 

z ) − P( 

z 

= 0.20 + 0.0189 = 0.20189 ⇒ 

v 

m 

0.58000 − 0.57926 

= 0.20 + 

= 

)) 10⋅(0.58317 

− 0.57926) 

z = 0.202 

Interpolacija je prinesla popravek šele na mestu tretje decimalke. 

V našem primeru torej ne bi naredili večje napake, če bi kot 

rezultat vzeli kar manjšo z-vrednost. Dobro je, da poznamo 

postopek interpolacije, v večini primerov pa bomo z-vrednost, ki ji 

ustreza nek odstotek vrednosti porazdelitve, kar prebrali v 

preglednici porazdelitve. 

•66


Primer 6.9: Iz primera 6.1 vemo, da se trajanje nosečnosti 

porazdeljuje približno normalno z aritmetično sredino 260 dni in 

standardnim odklonom 16 dni. Zanimata nas dneva rojstva, med 

katerima leži srednjih 70 % populacije. 

Srednjih 70 % populacije ustreza 35 % pod ter 35 % populacije 

nad aritmetično sredino. Iz preglednice porazdelitve preberemo, da 

je: 

P z)% 

= 35 % ⇒ z = −1.04, 

z 1.04 

( 

1 2 

= 

z 1 

in z 2 

sta standardizirana odklona vrednosti x 1 

in x 2 

slučajne 

spremenljivke X. 

Po pravilu 

x = μ + z ⋅σ 

i 

X 

i 

X 

izračunamo 

x = 260 −1.04⋅16 

= 243.36 

x 

1 

2 

= 260 + 1.04⋅16 

= 276.64 

133 

Srednjih 70 % vseh otrok se rodi med 243-tim in 277-tim dnevom 

nosečnosti. 


Primer 6.10: Za podatke iz primera 6.1 izračunajmo, kolikšen 

odstotek otrok se rodi med 220-tim in 236-tim dnevom 

nosečnosti. 

V preglednici standardizirane normalne porazdelitve preberemo 

deleže pod ploščino krivulje za ustrezne z-vrednosti: 

x − μ 

220 − 260 

= = 

16 

1 X 

1 

= 

− 

σ 

X 

z 

2.5 

x − μ 

236 − 260 

= = 

16 

2 X 

2 

= 

− 

σ 

X 

in ustrezne deleže ploščine pod krivuljo normalne porazdelitve: 

P( 

z1 , z2) 

= P( 

z2) 

− P( 

z1) 

= (1 − 0.93319) − (1 − 0.99379) = 0.0606 

Med 220-tim in 236-tim dnevom nosečnosti se rodi 6.06 % vseh 

otrok. 

z 

1.5 

134 

•67

7. MERE ASIMETRIJE 

IN SPLOŠČENOSTI 

• Aritmetična sredina in standardni odklon sta dobra 

predstavnika populacije, na kateri se opazovana 

spremenljivka porazdeljuje približno normalno. 

• V primeru enovrhne porazdelitve spremenljivke, ki je 

bolj ali manj asimetrična ter bolj ali manj sploščena 

(koničasta), pa je potrebno izračunati še stopnjo 

asimetrije in sploščenosti (koničavosti). 

• Stopnjo asimetrije merimo na več načinov s koeficienti 

asimetrije stopnjo sploščenosti oziroma koničavosti pa 

s koeficienti sploščenosti. 

135 

7.1 Meri asimetrije 

• Pri zvezah med srednjimi vrednostmi smo omenili 

(poglavje 4.4), da so razlike med srednjimi vrednostmi 

tem večje, čim bolj je porazdelitev asimetrična. 

136 

• Ustrezni meri asimetrije sta: 

Velja: 

KA Mo 

KA Me 

μ − Mo 

= 

σ 

3⋅(μ − Me) 

= 

σ 

(7.1) 

(7.2) 

• KA Mo 

ali KA Me 

< 0, porazdelitev je asimetrična v levo; 

• KA Mo 

ali KA Me 

= 0, porazdelitev je simetrična; 

• KA Mo 

ali KA Me 

> 0, porazdelitev je asimetrična v desno. 

•68

7.1 Meri asimetrije / 2 

Primer 7.1: Za ocene iz primera 3.6 (frekvenčna porazdelitev ocen) 

izračunajmo koeficient asimetričnosti od modusa ter koeficient 

asimetričnosti od mediane. 

V primerih 4.3, 4.5 in 4.8 smo izračunali srednje vrednosti v 

primeru 5.7 pa standardni odklon: 

Me = 5.64 Mo = 5.83 μ = 5.29 σ = 2.24 

Koeficienta asimetrije sta: 

μ − Mo 5.29 − 5.83 

KA Mo 

= = = −0,24 

σ 2.24 

3⋅( 

μ − Me) 

3⋅(5.29 

− 5.64) 

KA Me 

= 

= 

= −0. 

47 

σ 

2.24 

Oba koeficienta asimetrije sta negativna: porazdelitev je 

asimetrična v levo. 

137 

7.2 Mera sploščenosti 

• Sploščenost merimo s pomočjo kvantilov. Koeficient 

sploščenosti je izražen kot razmerje med kvartili in decili: 

Q 

KS = 1.9⋅ 

D 

Velja: 

• KS < 1, porazdelitev je koničasta; 

• KS = 1, porazdelitev je normalna; 

• KS > 1, porazdelitev je sploščena. 

3 

9 

− Q1 

− D 

1 

(7.3) 

138 

•69

7.3 Meri asimetrije in sploščenosti 

s centralnimi momenti 

• Centralni moment r-tega reda je: 

m 

( r) 

= 

1 

N 

N 

∑ 

i= 

1 

r 

( x − μ) 

i 

(7.4) 

• iz zgornje enačbe sledi, da je: 

m 

m 

(1) 

(2) 

= 0 

2 

= σ 

139 

7.3 Meri asimetrije in ... / 2 

• S centralnimi momenti izračunan koeficient asimetrije: 

g = 

1 

m 

3 

m 

3 

2 

(7.5) 

Velja: 

• g 1 

< 0, porazdelitev je asimetrična v levo; 

• g 1 

= 0, porazdelitev je simetrična; 

• g 1 

> 0, porazdelitev je asimetrična v desno. 

140 

•70

7.3 Meri asimetrije in ... / 3 

• S centralnimi momenti izračunan koeficient sploščenosti: 

g 

= m 

m 

4 

2 

− 

2 

2 

3 

(7.6) 

Velja: 

• g 2 

< 1, porazdelitev je sploščena; 

• g 2 

= 1, porazdelitev je normalna; 

• g 2 

> 1, porazdelitev je koničasta. 

141 

8. STATISTIKA IN 

VERJETNOSTNI RAČUN 

• Statistika proučuje lastnosti populacije tako, da analizira 

spremenljivke, ki opisujejo to populacijo. 

• Zanima nas porazdelitev obravnavane spremenljivke 

ter določene značilnosti te porazdelitve (npr. povprečje, 

standardni odklon). 

142 

•71

8. STATISTIKA IN ... / 2 

Primer 8.1: Denimo, da proučujemo aktivnost študentov na 

UL FGG zadnjih pet šolskih let. Zanima nas, koliko časa na 

teden študent v povprečju nameni za študij, koliko za 

športno dejavnost ter ali sta ti dve količini povezani? 

V tem primeru proučujemo tri značilnosti: povprečje dveh 

spremenljivk ter mero povezanosti teh dveh spremenljivk. 

Če bi imeli podatke za vse enote obravnavane populacije, bi 

lahko te količine izračunali. 

Praktični problemi (dosegljivost študentov, zavračanje 

anketiranja, preveliki stroški) pa narekujejo, da izberemo 

določeno število študentov v vzorec in jih anketiramo. 

Na osnovi dobljenih vrednosti izračunamo vzorčne ocene. 

Iz vzorčnih ocen sklepamo o tem, kaj velja za celotno 

populacijo. 

143 


• Vrednotenje lastnosti populacije: 

Je informacija 

za vse enote populacije 

razpoložljiva? 

NE 

Izbira enot 

v vzorec 

DA 

Vrednotenje 

lastnosti 

populacije 

Izračun 

vzorčne ocene 

za lastnost 

populacije 

144 

•72


• Verjetnostni račun je matematična disciplina, ki 

predstavlja osnovno orodje statistike pri delu z 

nepopolno informacijo. 

• Na verjetnostnih predpostavkah temeljijo: 

• metode za načrtovanje poskusov oziroma 

opazovanj, 

• metode za izračun vzorčnih ocen, 

• metode za sklepanje iz vzorčnih vrednosti na 

populacijske vrednosti. 

145 


• Vloga verjetnostnega računa v statistiki: 

Populacija 

Načrtovan 

poskus ali 

opazovanje 

Vzorec 

VERJETNOSTNI 

RAČUN 

Analiza vzorčnih 

podatkov 

Lastnost 

populacije 

Statistično 

sklepanje 

Vzorčna ocena 

lastnosti 

populacije 

146 

•73


• Teorija verjetnostnega računa spada med “težja” 

poglavja matematike, zato podajamo v nadaljevanju 

nekaj osnov iz te teorije, ki jih bomo potrebovali pri 

statističnem sklepanju. 

147 

9. KOMBINATORIKA 

9.1 Permutacija in variacija 

148 

• Denimo, da imamo n elementov v danem vrstnem redu. 

Permutacija se imenuje vsaka preureditev teh n 

elementov. 

Npr. za n = 4 elementov 

2 3 4 5 

je ena možnih permutacij brez ponavljanja, 

4 3 2 5 

ali permutacija s ponavljanjem 

2 3 3 4 . 

Zanima nas, koliko je vseh možnih permutacij 

(brez ali s ponavljanjem). 

•74

9.1 Permutacija in variacija / 2 

• Če iz množice n elementov vzamemo r elementov in jih na 

nek način razporedimo, to imenujemo variacija reda r iz 

n elementov. Če se smejo elementi ponavljati, pravimo, 

da gre za variacijo s ponavljanjem. 

149 

Če vzamemo prejšnjo množico 4 elementov 

2 3 4 5 

je variacija reda 2 iz 4 elementov brez ponavljanja, npr.: 

2 3 

ali variacija reda 2 iz 4 elementov s ponavljanjem, npr.: 

3 3 

Zanima nas, koliko je vseh možnih variacij reda r iz 

n elementov (brez ali s ponavljanjem). 

9.2 Osnovni izrek kombinatorike 

Zanima nas, koliko je vseh možnih permutacij (brez ali s ponavljanjem). 

Zanima nas, koliko je vseh možnih variacij reda r iz n elementov (brez ali s ponavljanjem). 

• Na zastavljeni vprašanji nam omogoča odgovoriti 

osnovni izrek kombinatorike, ki govori o številu 

možnosti pri zaporednem (sestavljenem) izboru: 

Pri sestavljenem izboru izbiramo prvič med n 

možnostmi, po prvem izboru pa lahko vsakič 

izbiramo med m možnostmi. Tedaj je skupaj 

n ⋅m možnosti, do katerega vodi sestavljen 

izbor. 

150 

•75

9.2 Osnovni izrek kombinatorike / 2 

Primer 9.1: Od doma do postaje v Ljubljani, gremo lahko z 

avtomobilom, z avtobusom ali z vlakom. Od postaje do 

fakultete pa lahko gremo peš ali z avtobusom. Na koliko 

načinov lahko pridemo od doma do fakultete? 

Ker prvič izbiram med n = 3 možnostmi in drugič med m = 

2 možnosti, je vseh načinov šest: 

n⋅m = 3 ⋅2 

= 

6 

151 


Posplošen izrek kombinatorike: 

Imejmo izbor, sestavljen iz k delnih izborov. Prvič izbiramo 

med n 1 možnostmi, drugič med n 2 možnostmi, ... in k-tič 

med n k možnostmi. Pri tako sestavljenem izboru je vseh 

možnosti 

n = n1 

⋅n2 

⋅⋅⋅ 

n k 

(9.1) 

152 

•76


Primer 9.2: Prvošolček ima na voljo 3 pare obuval, 4 hlače 

in 9 majic. Na koliko različnih načinov se lahko obleče? 

Upoštevamo posplošeni izrek kombinatorike: 

n = 3 ⋅ 4⋅9 

= 108 

... ki pa pri prvošolčku popolnoma odpove, 

saj ima vedno iste hlače, majico in športne copate! 

153 

9.3 Število variacij, permutacij 

in kombinacij 

• Število variacij reda r iz n elementov s 

ponavljanjem: 

Vsakič izbiramo iz množice n elementov, izbor pa je 

sestavljen iz r delnih izborov. Zato je vseh variacij reda r 

iz n elementov s ponavljanjem 

( p) 

V = n 

r 

n 

r 

(9.2) 

154 

•77

9.3 Število variacij ... / 2 

• Število variacij reda r iz n elementov brez 

ponavljanja: 

Vsako variacijo dosežemo s sestavljenim izborom: 

najprej izberemo prvi element, nato drugi, ..., nazadnje 

r-ti element. Vsak element lahko izberemo le enkrat. 

Prvi element izberemo med n elementi, drugi (ker smo 

prvega že izbrali) med n-1, tretji med n-2, ..., zadnji 

element med n-r+1 elementi. Vseh variacij reda r iz n 

elementov brez ponavljanja je tedaj 

V r 

n 

= n⋅( n −1) 

⋅⋅⋅( 

n − r + 1) 

(9.3) 

155 


• Število permutacij: 

Vseh permutacij je 

n 

Pn = Vn 

= n⋅( n −1) 

⋅( 

n − 2) ⋅⋅⋅ 2⋅1 

= n! 

(9.4) 

Pri tem je 0! = 1. 

156 

•78


• Število kombinacij: 

157 

Denimo, da izbiramo r elementov iz množice z n 

elementi. V mislih imamo variacije brez ponavljanja. Če 

vzamemo, da so nabori, ki so sestavljeni iz istih 

elementov, enaki, tako variacijo imenujemo kombinacija 

reda r iz n elementov. Vseh kombinacij je 

C 

r 

n 

r 

Vn 

= 

P 

r 

n⋅( 

n −1) 

⋅⋅⋅( 

n − r + 1) 

= 

r ⋅( 

r −1) 

⋅( 

r − 2) ⋅⋅⋅1 

Če števec in imenovalec pomnožimo z (n-r)!, je število 

kombinacij 

C r n 

n! 

⎛n⎞ 

= = ⎜ ⎟ 

r!( 

⋅ n − r)! 

⎝r 

⎠ 

(9.5) 


Številu 

⎛n⎞ 

⎜ ⎟ 

⎝r 

⎠ 

rečemo tudi binomsko število. 

Dokazati se da, da velja: 

⎛ n ⎞ ⎛n⎞ 

⎜ ⎟ = ⎜ ⎟ 

⎝n 

− r ⎠ ⎝r 

⎠ 

⎛0⎞ 

⎛n⎞ 

⎜ ⎟ = ⎜ ⎟ = 1 

⎝0⎠ 

⎝0⎠ 

⎛n⎞ 

⎛ n ⎞ ⎛n 

+ 1⎞ 

⎜ ⎟ + ⎜ ⎟ = ⎜ ⎟ 

⎝r 

⎠ ⎝r 

+ 1⎠ 

⎝r 

+ 1⎠ 

158 

in še precej podobnih zanimivih lastnosti. 

•79


Primer 9.3: Iz populacije 5 moških in 3 žensk tvorimo 

vzorec 3 ljudi, tako da osebe v njem ne smejo nastopiti 

večkrat (vzorec brez ponavljanja). Na koliko načinov lahko 

tvorimo vzorec? 

V tem primeru gre za kombinacijo reda 3 iz 8 elementov: 

C 

⎛8⎞ 

8! 

= ⎜ ⎟ = 

⎝3⎠ 

3!5! ⋅ 

3 

8 

= 

56 

Vzorec lahko tvorimo na 56 načinov. 

159 





tvorimo vzorec, tako da je v njem 1 ženska in 2 moška? 

Rešitev: 

C 

⎛5⎞ 

⎛3⎞ 

5! 3! 

= ⎜ ⎟⋅⎜ 

⎟ = ⋅ 

⎝2⎠ 

⎝1⎠ 

2!3! ⋅ 1!2! ⋅ 

2 1 

5 

⋅C3 

= 

Če mora biti v vzorcu 1 ženska in 2 moška, lahko vzorec 

tvorimo na 30 različnih načinov. 

30 

160 

•80


(Kombinatorično) pravilo vsote: 

Če se lahko pri izbiranju odločimo ali za eno od n možnosti 

iz prve množice izborov ali pa za eno od m možnosti iz 

druge množice izborov, ki so nezdružljivi z izbori prve 

množice, je vseh možnih izborov n+m. 

161 





tvorimo vzorec, tako da je v njem vsaj 1 moški? 

V vzorcu je lahko 1, 2 ali 3 moški, zato uporabimo 

kombinatorično pravilo vsote: 

C ⋅C 

1 

5 

2 

3 

+ C 

2 

5 

⋅C 

⎛5⎞ 

⎛3⎞ 

⎛5⎞ 

⎛3⎞ 

⎛5⎞ 

⎛3⎞ 

= ⎜ ⎟⋅⎜ 

⎟ + ⎜ ⎟⋅⎜ 

⎟ + ⎜ ⎟⋅⎜ 

⎟ = 

⎝1⎠ 

⎝2⎠ 

⎝2⎠ 

⎝1⎠ 

⎝3⎠ 

⎝0⎠ 

5! 3! 5! 3! 5! 

= ⋅ + ⋅ + = 55 

1!4! ⋅ 2!1! ⋅ 2!3! ⋅ 1!2! ⋅ 3!2! ⋅ 

Vzorec lahko tvorimo na 55 različnih načinov. 

1 

3 

+ C 

3 

5 

⋅C 

0 

3 

= 

162 

•81

10. VERJETNOSTNI RAČUN 

• Verjetnostni račun je matematična disciplina, ki se 

ukvarja z vrednotenjem možnosti, da se bodo nekateri 

slučajni dogodki zgodili. 

163 

• Že v starem Egiptu 3500 let pr.n.št. so igrali igre s kockami 

podobne današnjim. 

• Okoli leta 1560 je Girolamo Cardano (italijanski zdravnik, 

profesor geometrije in vnet kockar) v knjigi “Knjiga o igrah s 

kockami” zapisal, da se vsaka ploskev kocke enako pogosto 

pojavlja. Ugotovil je tudi, da je verjetnost vsake ploskve 1/6. 

• Hiter razvoj statistične in matematične verjetnostne 

teorije. 

• Osebna verjetnost je močno povezana s človekovimi željami 

in upi. Spada med psihološke pojme: “Dogodkom, ki nam bi 

prinesli srečo, pripisujemo visoko verjetnost, dogodkom, za 

katere želimo, da se ne bi zgodili, pa nizko verjetnost”. 

10. VERJETNOSTNI RAČUN / 2 

• Verjetnostni račun obravnava zakonitosti, ki se pokažejo v 

velikih množicah enakih ali vsaj zelo podobnih pojavov. 

• Predmet verjetnostnega računa je izkustvene narave: 

njegovi osnovni pojmi so prevzeti iz izkušnje. 

• Osnovni pojmi v verjetnostnem računu so: 

• poskus, 

• dogodek in 

• verjetnost dogodka. 

164 

•82

10.1 Poskus 

• Poskus je izvedba neke množice skupaj nastopajočih 

dejstev (kompleksa pogojev). Poskus je torej vsako 

dejanje, ki ga opravimo v natanko določenih pogojih. 

• Primer: 

• met igralne kocke; 

• iz kupa 50-tih igralnih kart izberemo eno karto. 

• Poskuse označujemo z velikimi poševnimi črkami s 

konca abecede: 

X, Y, Z,... ali X 1 , X 2 , ..., X n ... 

165 

10.2 Dogodek 

• Dogodek je pojav, ki se pri poskusu lahko zgodi ali pa 

ne. 

• ... je rezultat izvedbe poskusa. 

• Primer: 

• dogodek v poskusu meta igralne kocke je, na primer, da 

vržemo 6 pik; 

• dogodek v poskusu, da iz kupa 50-tih igralnih kart izvlečemo 

eno karto, je, na primer, da izvlečemo rdečo karto. 

166 

• Dogodke označujemo z velikimi poševnimi črkami z 

začetka abecede: 

A, B, C,... ali A 1 , A 2 , ..., A n ... 

•83

10.2 Dogodek / 2 

• Dogodek je lahko: 

• gotov dogodek (G) – dogodek, ki se zgodi ob vsaki 

ponovitvi poskusa. 

• nemogoč dogodek (N) – dogodek, ki se nikoli ne 

zgodi. 

• slučajen dogodek – dogodek, ki se včasih zgodi, 

včasih pa ne; sem spadajo vsi dogodki, ki niso gotovi 

ali nemogoči. 

167 

10.2 Dogodek / 3 

Primer 10.1: Opišimo primer gotovega, nemogočega ter 

slučajnega dogodka. 

Primer gotovega dogodka je dogodek, da pri metu kocke 

vržemo 1, 2, 3, 4, 5 ali 6 pik. 

Primer nemogočega dogodka je dogodek, da pri metu 

kocke vržemo 7 pik. 

Primer slučajnega dogodka pa je dogodek, da pri metu 

kocke vržemo 1 piko. 

168 

•84

10.2.1 Računanje z dogodki 

1. Dogodek A je način dogodka B ( A ⊂ B ), če se vsakič, 

ko se zgodi dogodek A, zagotovo zgodi tudi dogodek B. 

Primer 10.2: Pri metu kocke je dogodek A, da pade 

šest pik, način dogodka B, da pade sodo število pik. 

2. Če je dogodek A način dogodka B in sočasno dogodek B 

način dogodka A, sta dogodka enaka: 

A ⊂ B ∧ B ⊂ A ⇔ A = B 

Primer 10.3: Pri metu kocke je dogodek A, da pade 1 

pika, dogodek B pa, da pade manj kot 2 piki. Glede na 

zgoraj zapisano sta dogodka A in B enaka. 

169 

10.2.1 Računanje z dogodki / 2 

3. Vsota dogodkov A in B ( A∪ B ) je, če se zgodi vsaj 

eden od dogodkov A in B. 

Primer 10.4: Vsota dogodka A, da vržemo sodo število 

pik, in dogodka B, da vržemo liho število pik, je gotov 

dogodek. 

Velja: 

A∪ 

B = B ∪ A 

A∪ 

N = A 

A∪G 

= G 

A∪ 

A = A 

170 

•85


4. Produkt dogodkov A in B ( A∩ B ) se imenuje 

dogodek, če se zgodita dogodka A in B hkrati. 

Primer 10.5: Produkt dogodka A, da vržemo sodo 

število pik, in dogodka B, da vržemo liho število pik, je 

nemogoč dogodek. 

Velja: 

A∩ 

B = B ∩ A 

A∩ 

N = N 

A∩G 

= A 

A∩ 

A = A 

171 


5. Dogodku A nasproten dogodek A imenujemo 

negacijo dogodka A . 

Primer 10.6: Nasproten dogodek dogodku, da vržemo 

sodo število pik, je dogodek, da vržemo liho število pik. 

Velja: 

A∩ 

A = N 

A∪ 

A = G 

N = G 

A = A 

172 

•86


6. Dogodka A in B sta nezdružljiva, če se ne moreta 

zgoditi hkrati, njun produkt je torej nemogoč dogodek: 

A ∩ B = 

N 

Primer 10.7: Dogodka, da pri metu kocke pade sodo 

število pik (A) in da pade liho število pik (B), sta 

nezdružljiva. 

Poljuben dogodek in njegov nasprotni dogodek, sta 

vedno nezdružljiva. Ob vsaki ponovitvi poskusa se 

zagotovo zgodi eden od njiju, zato je njuna vsota gotov 

dogodek: 

A ∩ A = N ∧ A∪ 

A = G 

173 


7. Če lahko dogodek A izrazimo kot vsoto nezdružljivih 

in mogočih dogodkov, rečemo, da je A sestavljen 

dogodek. Dogodek, ki ni sestavljen, imenujemo 

elementaren dogodek. 

Primer 10.8: Pri metu kocke je šest elementarnih 

dogodkov: E 1 , da pade 1 pika, E 2 , da padeta 2 piki, ..., 

E 6 , da pade 6 pik. Dogodek, da pade sodo število pik je 

sestavljen dogodek iz treh elementarnih dogodkov (E 2 , 

E 4 in E 6 ). 

174 

•87


8. Množico dogodkov S = { A1 , A2 

,..., An} 

imenujemo popoln 

sistem dogodkov, če se v vsaki ponovitvi poskusa 

zgodi natanko eden od dogodkov iz množice S. 

To pomeni, da so vsi dogodki mogoči 

A i 

≠ N 

paroma nezdružljivi 

A ∩ A 

= N 

in njihova vsota je gotov dogodek 

i 

j 

i ≠ 

Ai ∪ Aj 

∪... 

∪ An 

= G 

j 

175 

Primer 10.9: Popoln sistem dogodkov pri metu igralne 

kocke sestavljajo, na primer, elementarni dogodki ali pa 

tudi dva nezdružljiva dogodka: dogodek, da vržemo 

sodo število pik, in dogodek, da vržemo liho število pik. 

10.3 Verjetnost dogodka 

• Za slučajni dogodek ni mogoče nikoli reči v naprej, da se 

bo zgodil ali ne. Ponovitve, v katerih se slučajni dogodek 

zgodi, in tiste, v katerih se ne, si sledijo povsem 

neurejeno. Zato tudi rečemo, da je takšen dogodek 

slučajen dogodek. 

• Dokazano je, da je tudi slučajen dogodek podrejen 

nekim zakonitostim, ki pridejo do izraza šele pri 

velikem številu ponovitev poskusa. 

• Poznamo več vrst definicij verjetnosti dogodka: 

• statistična definicija, 

• klasična definicija, 

• aksiomatska definicija. 

176 

•88

10.3.1 Statistična definicija verjetnosti 

dogodka 

• Denimo, da smo nek poskus n-krat ponovili in da se je 

n A -krat zgodil dogodek A. Ponovitve poskusa, v katerih 

se je A zgodil, imenujemo ugodne za dogodek A, 

število 

nA 

(10.1) 

f ( A) 

= 

pa je relativna frekvenca dogodka A v opravljenih 

poskusih. 

• Statistični zakon, ki ga kaže izkušnja: 

Če nek poskus dolgo ponavljamo, se relativna 

frekvenca slučajnega dogodka ustali, in sicer toliko 

bolj, kolikor več ponovitev poskusa opravimo. 

n 

177 

10.3.1 Statistična definicija ... / 2 

178 

• Statistično zakonitost so izkustveno preverjali na več 

načinov. Najbolj znan je poskus s kovancem, kjer so 

določali relativno frekvenco, da pade grb (f(A)): 

• Buffon (Georges Louis Leclerc Comte, francoski matematik, 

1707-1788) je v 4040 metih dobil f(A)=0.5069; 

• Morgan (Augustos, anleški matematik, 1806-1871) je v 

12000 metih dobil f(A)=0.5016; 

• Pearson (Karl, anleški matematik, 1857-1936) je v 24000 

metih dobil f(A)=0.5005; 

• Mathematica (matematičen program, Wolfram Research) je 

v simulaciji 1 000 000 ponovitev poskusa zabeležila 

f(A)=0.499726 

• Relativna frekvenca, da pade grb, se torej približuje 

0.5, vendar tudi po velikem številu ponovitev ni 

natančno 0.5. 

•89

10.3.1 Statistična definicija ... / 3 

• Statistična definicijo verjetnosti: 

Verjetnost dogodka A v danem poskus je P[A], pri 

katerem se navadno ustali relativna frekvenca 

dogodka A v velikem številu ponovitev tega poskusa, 

oziroma: 

nA 

P[ 

A] 

= lim 

(10.2) 

n→∞ 

kjer je n število ponovitev poskusa, n A pa število 

ponovitev dogodka A. 

n 

179 

10.3.2 Klasična definicija verjetnosti 

dogodka 

• Včasih si pomagamo s klasično definicijo 

verjetnosti (ki je zelo podobna statistični definiciji): 

180 

Vzemimo, da so dogodki iz popolnega sistema 

dogodkov {E 1 , E 2 ,...,E n } enako verjetni: 

P E ] = P[ 

E ] = ... = P[ 

En ] = 

[ 

1 

12 

Tedaj je verjetnost enega od dogodkov 

1 

P[ E i 

] = i = 1,2,..., 

n 

n 

Če je nek dogodek A sestavljen iz n A dogodkov iz tega 

popolnega sistema dogodkov, potem je njegova 

verjetnost 

nA 

P[ 

A] 

= 

(10.3) 

n 

p 

•90

10.3.2 Klasična definicija ... / 2 

Primer 10.10: Izračunajmo verjetnost dogodka A, da pri 

metu kocke pade manj kot 3 pike. 

Popolni sistem enako verjetnih dogodkov sestavlja šest 

dogodkov. Od teh sta le dva ugodna za dogodek A 

(1 in 2 piki). Zato je verjetnost dogodka A: 

nA 

2 

P[ A] 

= = = n 6 

Verjetnost, da pri metu kocke pade manj kot 3 pike 

je 33.3 %. 

1 

3 

181 

10.3.3 Aksiomska definicija 

verjetnosti dogodka 

• Aksiomsko definicijo verjetnosti sestavljajo trije 

aksiomi in izreki, ki jih na osnovi teh aksiomov lahko 

dokažemo: 

1. Verjetnost poljubnega dogodka leži med ena in nič: 

0 ≤ P[ 

A] 

≤1 

(10.4) 

2. Verjetnost gotovega dogodka je enaka 1: 

P[ G] 

= 1 

(10.5) 

182 

3. Verjetnost vsote dveh nezdružljivih dogodkov A in 

B je vsota njunih verjetnosti: 

P [ A ∪ B] 

= P[ 

A] 

+ P[ 

B] 

(10.6) 

•91

10.3.3 Aksiomska definicija ... / 2 

• Iz treh osnovnih aksiomov aksiomske definicije 

izhajata še dve pomembni lastnosti verjetnosti: 

1. Za poljubna združljiva dogodka A in B ( A∩ 

B ≠ N ) 

velja: 

P[ A ∪ B] 

= P[ 

A] 

+ P[ 

B] 

− P[ 

A∩ 

B] 

(10.7) 

2. Velja tudi: 

P[ A] 

= 1− 

P[ 

A] 

(10.8) 

183 


Primer 10.11: Denimo, da je verjetnost, da študent naredi 

izpit iz Statistike P[S]=2/3. Verjetnost, da naredi izpit iz 

Matematike pa P[M]=5/9. Če je verjetnost, da naredi vsaj 

enega od obeh izpitov P[S ∪ M]= 4/5, kolikšna je verjetnost, 

da naredi oba izpita? 

P[ 

S ∩ M ] = P[ 

S] 

+ P[ 

M ] − P[ 

A ∪ B] 

= 

2 5 4 

= + − = 0.422 

3 9 5 

Verjetnost, da študent naredi oba izpita je 42.2 %. 

184 

•92


Primer 10.12: Iz kupa 32 kart povlečemo tri karte. Kolikšna je 

verjetnost, da je med tremi kartami vsaj en as (dogodek A)? 

Pri izračunu si pomagamo z nasprotnim dogodkom. Nasprotni 

dogodek A dogodka A je, da med tremi kartami ni asa. Njegova 

verjetnost po klasični definiciji verjetnosti je določena s kvocientom 

števila vseh ugodnih dogodkov v popolnem sistemu dogodkov s 

številom vseh dogodkov v tem sistemu dogodkov. Vseh dogodkov v 

⎛ ⎞ 

⎜32 

⎟ 

popolnem sistemu dogodkov je ⎜ ⎟, ugodni pa so tisti, kjer zbiramo 

⎛ ⎞ 

⎜28 

⎝ 3 ⎠ 

⎟ 

med ne-asi ⎜ ⎟. Torej je 

3 

⎝ 

⎠ 

⎛28⎞ 

⎜ ⎟ 

3 

P[ A] 

= 

⎝ ⎠ 

= 0.66 P[A] = 1- P[A] = 1- 0.66 = 0.34 

⎛32⎞ 

⎜ ⎟ 

⎝ 3 ⎠ 

185 

Verjetnost je 34 %. 

10.4 Pogojna verjetnost 

• Denimo, da imamo dva dogodka A in B, ki se zgodita z 

verjetnostima P[A] in P[B]. 

• Verjetnost, da se zgodi dogodek A, ob pogoju, da se je 

zgodil dogodek B, imenujemo pogojna verjetnost in jo 

označimo z izrazom P[ A | B] 

. 

• Podobno P[ B | A] 

predstavlja pogojno verjetnost 

dogodka B, ob pogoju, da se je zgodil dogodek A. 

• Velja lastnost: 

0 ≤ P[ 

A | B] 

≤1 

186 

•93

10.4 Pogojna verjetnost / 2 

187 

• Klasična definicija: Predpostavimo, da smo n-krat 

ponovili poskus in da se je ob tem n B -krat zgodil 

dogodek B, dogodek A∩ B pa se je zgodil n AB . 

Verjetnosti dogodkov B in A∩ B sta: 

nB nAB 

P[ 

B] 

= P[ 

A∩ 

B] 

= 

n 

n 

Po klasični definiciji verjetnosti zapišemo verjetnost, da 

se je zgodil dogodek A pri pogoju, da se je zgodil 

dogodek B z izrazom: 

nAB 

nAB 

P [ A | B] 

= n → P[ 

A | B] 

= 

(10.11) 

nB 

nB 

n 

in pogojem P[B]>0. 


• Aksiomska definicija: Če se je zgodil dogodek B, 

potem ni več slučajen, ampak gotov, torej ima 

verjetnost 1. Lahko rečemo, da se je verjetnostni 

prostor skrčil na dogodek B. 

Zato verjetnost, da se zgodi dogodek A, ob pogoju, da 

se je zgodil dogodek B, določimo tako, da verjetnost, da 

se je zgodil produkt dogodkov A in B, delimo z 

verjetnostjo dogodka B: 

P[ 

A∩ 

B] 

P[ A | B] 

= 

→ P[ 

A | B] 

⋅ P[ 

B] 

= P[ 

A∩ 

B] 

P[ 

B] 

ob pogoju P[B]>0. 

(10.12) 

188 

•94


Primer 10.13: Denimo, da je v nekem naselju 900 polnoletnih 

prebivalcev. Zanima nas struktura prebivalcev po spolu 

(M-moški, Ž-ženski spol) in po zaposlenosti (Z–zaposlen(a), 

N–nezaposlen(a)). Podatke po obeh spremenljivkah uredimo v 

dvodimenzionalno frekvenčno porazdelitev, ki jo imenujemo tudi 

kontingenčna preglednica. Kolikšna je verjetnost, da bo 

slučajno izbrana oseba zaposlen moški? 

spol \ zap. 

M 

Ž 

Z 

460 

240 

700 

N 

40 

160 

200 

500 

400 

900 

700 

460 

P[ 

Z] 

= , P[ 

M ∩ Z] 

= 

900 

900 

P[ 

M ∩ Z] 

460⋅900 

460 

P[ 

M | Z] 

= = = = 0.657 

P[ 

Z] 

900⋅700 

700 

189 

ali neposredno iz 

kontingenčne preglednice: 

460 

P[ M | Z] 

= = 0.657 

700 


• Ker je: 

P[ 

A∩ 

B] 

P[ 

A | B] 

= ⇒ P[ 

A ∩ B] 

= P[ 

B] 

⋅ P[ 

A | B] 

P[ 

B] 

P[ 

A∩ 

B] 

P[ 

B | A] 

= ⇒ P[ 

A ∩ B] 

= P[ 

A] 

⋅ P[ 

B | A] 

P[ 

A] 

je tudi 

P[ A] 

⋅ P[ 

B | A] 

= P[ 

B] 

⋅ P[ 

A | B] 

(10.13) 

190 

Dogodka A in B sta neodvisna, če velja 

P [ A | B] 

= P[ 

A] 

Zato za neodvisna dogodka velja 

P[ A ∩ B] 

= P[ 

A] 

⋅ P[ 

B] 

(10.14) 

•95


Primer 10.14: Iz posode, v kateri imamo 8 belih in 2 rdeči kroglici, 

dvakrat na slepo izberemo po eno kroglico. Kolikšna je verjetnost 

dogodka, da je prva kroglica bela (B 1 

) in druga rdeča (R 2 

)? 

1. Če po prvem izbiranju izvlečeno kroglico ne vrnemo v posodo 

(odvisnost), je: 

8 2 

P[ B ∩ R2] 

= P[ 

B1 

] ⋅ P[ 

R2 

| B1 

] = ⋅ 

10 9 

1 

= 

0.1777 

Če prvo izvlečeno kroglico ne vrnemo, je verjetnost 17.8 %. 

2. Če po prvem izbiranju izvlečeno kroglico vrnemo v posodo 

(neodvisnost), je : 

8 2 

P[ B ∩ R2] 

= P[ 

B1 

] ⋅ P[ 

R2 

| B1 

] = P[ 

B1 

] ⋅ P[ 

R2 

] = ⋅ 

10 10 

1 

= 

0.16 

Če pa po prvem izbiranju izvlečeno kroglico vrnemo v posodo, 

je verjetnost 16 %. 

191 

10.5 Bernoullijevo zaporedje 

neodvisnih poskusov 

• O zaporedju neodvisnih poskusov X 1 , X 2 , ..., X n , ... 

govorimo tedaj, ko so verjetnosti izidov v enem poskusu 

neodvisne od tega, kaj se zgodi v drugih poskusih: 

Zaporedje neodvisnih poskusov se imenuje 

Bernoullijevo zaporedje, če se more 

zgoditi v vsakem poskusu iz zaporedja 

neodvisnih poskusov le dogodek A z 

verjetnostjo P [ A] 

= p ali dogodek A z 

verjetnostjo P [ A] 

= 1− 

P[ 

A] 

= 1− 

p = q. 

192 

•96

10.5 Bernoullijevo zaporedje ... / 2 

Primer 10.15: Primer Bernoullijevega zaporedja poskusov 

... je met kocke, kjer ob vsaki ponovitvi poskusa pade 

šestica (dogodek A) z verjetnostjo P[ A] 

= p = 1/ 6 

ali ne pade šestica (dogodek A ) z verjetnostjo 

P[ A] 

= q = 5/ 6. 

193 


• V Bernoullijevem zaporedju neodvisnih poskusov nas 

zanima, kolikšna je verjetnost, da se v n zaporednih 

poskusih zgodi dogodek A natanko k-krat. 

To se lahko zgodi, na primer, tako, da se najprej zgodi k- 

krat dogodek A in nato v preostalih (n-k) poskusih zgodi 

dogodek A : 

P[ 

A∩ 

A∩⋅⋅⋅∩ 

A∩ 

A ∩ A ∩⋅⋅⋅∩ A] 

= 

= P[ 

A] 

⋅ P[ 

A] 

⋅⋅⋅ P[ 

A] 

⋅ P[ 

A] 

⋅ P[ 

A] 

⋅⋅⋅ P[ 

A] 

= 

= p ⋅ p ⋅⋅⋅ p ⋅q 

⋅q 

⋅⋅⋅q 

= p 

k 

⋅q 

( n−k 

) 

... nadaljevanje na naslednji strani 

194 

•97


... nadaljevanje: 

Dogodek P n (k), da se dogodek A v n zaporednih poskusih 

zgodi natanko k-krat, se lahko zgodi tudi na druge 

načine. Teh načinov je toliko, na koliko načinov lahko 

⎛ n ⎞ 

izberemo k poskusov iz n poskusov. Teh je ⎜ ⎟ . 

⎝ k ⎠ 

Ker so ti načini nezdružljivi med seboj, je 

verjetnost dogodka P n (k) enaka 

⎛n⎞ 

k ( n−k 

) 

Pn 

( k) 

= ⎜ ⎟ p (1 − p) 

(10.15) 

⎝k 

⎠ 

To formulo imenujemo Bernoullijev obrazec. 

195 


Primer 10.16: Iz posode, v kateri imamo 8 belih in 2 rdeči kroglici, 

na slepo izberemo po eno kroglico in po izbiranju izvlečeno kroglico 

vrnemo v posodo. Kolikšna je verjetnost, da v petih poskusih 

izberemo 3-krat belo kroglico? 

Dogodek A je, da izvlečemo belo kroglico. Potem je 

8 

p = P[ 

A] 

= = 0.8 

10 

q = 1− 

p = 1− 

0.8 = 0.2 

Verjetnost, da v petih poskusih izberemo 3-krat belo kroglico, je: 

⎛5⎞ 

3 

5−3 

P5 (3) = ⎜ ⎟⋅0.8 

⋅(1 

− 0.8) = 0.205 

⎝3⎠ 

196 

•98

11. SLUČAJNA 

SPREMENLJIVKA 

• Denimo, da imamo poskus, katerega izidi so števila (npr. 

pri metu kocke so izidi števila pik). 

• Poskusom je prirejena torej neka količina, ki more imeti 

različne vrednosti. 

• Tej količini rečemo spremenljivka. 

• Katero od vrednosti zavzame v določeni ponovitvi 

poskusa, je odvisno od slučaja. 

• Zato takšni spremenljivki rečemo slučajna 

spremenljivka. 

197 

11. SLUČAJNA SPREMENLJIVKA / 2 

• Slučajne spremenljivke opisujemo z: 

• zalogo vrednosti - vse vrednosti, ki jih slučajna 

spremenljivka lahko zavzame; 

• porazdelitvenim zakonom – predpis, ki določa, 

kolikšna je verjetnost vsake izmed možnih vrednosti 

ali intervala vrednosti. 

198 

•99


• Slučajne spremenljivke onačujemo s poševnimi velikimi 

tiskanimi črkami s konca abecede, vrednosti 

spremenljivke pa z enakimi malimi črkami. 

• Na primer, (X = x i ) je dogodek, da slučajna 

spremenljivka X zavzame vrednost x i . 

Primer 11.1: Denimo, da je število pik, ki jih lahko 

vržemo s kocko, slučajna spremenljivka X. Zaloga 

vrednosti te slučajne spremenljivke je torej x = 1, 2, 3, 

4, 5 in 6. 

199 


• Pravimo, da je porazdelitveni zakon slučajne 

spremenljivke X poznan, če je mogoče za vsako realno 

število x določiti verjetnost 

F( x) 

= P[ 

X ≤ x] 

(11.1) 

• F(x) imenujemo porazdelitvena funkcija (tudi 

kumulativa verjetnosti) slučajne spremenljivke X: 

200 

Pri danem x je vrednost funkcije F(x) 

enaka verjetnosti P, da slučajna 

spremenljivka zavzame vrednosti, ki 

so manjše ali enake x. 

•100


• Ločimo dva tipa slučajnih spremenljivk: 

1. diskretne slučajne spremenljivke, pri katerih je 

zaloga vrednosti neka končna množica števil (ali 

intervalov števil); 

2. zvezne slučajne spremenljivke, ki lahko zavzamejo 

vsako realno število znotraj določenega intervala. 

201 


Primer 11.2: Primeri diskretne slučajne spremenljivke: 

• število pik, ki jih vržemo s kocko; 

• število parcel v določeni katastrski občini; 

• število prebivalcev nekega naselja; 

• ... 

202 

Primer 11.3: Primeri zvezne slučajne spremenljivke: 

• količina padavin v obravnavanem kraju ter izbranem 

časovnem obdobju; 

• razdalja izmerjena z razdaljemerom; 

• čas, med dvema zaporednima dogodkoma; 

• ... 

•101

11.1 Diskretna slučajna 

spremenljivka 

• Zaloga vrednosti diskretne slučajne spremenljivke X 

je končna množica {x 1 , x 2 , ..., x m }, kjer dogodki X = x i ; 

i = 1,2,...,m tvorijo popoln sistem dogodkov. 

• Porazdelitev diskretne slučajne spremenljivke opišemo z 

verjetnostno funkcijo: 

p 

X 

( x ) p = P[ 

X = x ]; i = 1,2,...,m 

i 

= 

i 

i 

(11.2) 

kjer je p i verjetnost posameznega dogodka x i . 

203 

• Velja: 

0 ≤ p ≤1 

p 

i 

1 

+ p2 

+ ⋅⋅⋅+ pm 

= 

1 

(11.3) 

in (11.4) 

11.1 Diskretna slučajna spremenljivka / 2 

• Verjetnostna shema prikazuje diskretno slučajno 

spremenljivko v preglednici tako, da so v prvi vrstici 

zapisane vrednosti x i , pod njimi pa so pripisane 

pripadajoče verjetnosti: 

⎛ x 

X : 

⎜ 

⎝ p 

1 

1 

x 

p 

2 

2 

⋅⋅⋅ 

⋅⋅⋅ 

x 

p 

m 

m 

⎞ 

⎟ 

⎠ 

(11.5) 

204 

• Porazdelitvena funkcija (tudi kumulativna 

porazdelitvena funkcija) diskretne slučajne 

spremenljivke je: 

F ( x ) = P[ 

X ≤ x ] = 

X 

i 

i 

∑ 

x ≤x 

i 

p 

i 

(11.6) 

•102

11.1.1 Enakomerna diskretna 

porazdelitev 

• Enakomerna porazdelitev diskretne slučajne 

spremenljivke – diskretna slučajna spremenljivka se 

porazdeljuje enakomerno, če so vse njene vrednosti 

enako verjetne. 

Primer 11.4: Primer enakomerno diskretno 

porazdeljene slučajne spremenljivke je število pik pri 

metu kocke: 

⎛ 1 

X : ⎜ 

⎝1/ 

6 

2 

1/ 6 

3 

1/ 6 

4 

1/ 6 

5 

1/ 6 

6 ⎞ 

⎟ 

1/ 6⎠ 

205 

11.1.1 Enakomerna diskretna porazdelitev / 2 

Primer 11.5: Grafično prikažemo verjetnostno funkcijo iz 

primera 11.4 s črtnim grafikonom. 

1/6 

p X 

0 

0 1 2 3 4 5 6 

X 

206 

•103

11.1.1 Enakomerna diskretna porazdelitev / 3 

Primer 11.6: Grafično prikažemo (kumulativno) 

porazdelitveno funkcijo iz primera 11.4 s stopničasto črto. 

1 

5/6 

2/3 

F X 

1/2 

1/3 

1/6 

207 

0 

0 1 2 3 4 5 6 7 

X 

11.1.2 Binomska porazdelitev 

• Ena najpomembnejših porazdelitev diskretne slučajne 

spremenljivke je binomska porazdelitev z zalogo 

vrednosti {0, 1, 2, ..., n} in verjetnostmi, ki jih 

računamo po Bernoullijevem obrazcu: 

⎛n⎞ 

k ( 

P( 

X = k) 

= ⎜ ⎟ p (1 − p) 

⎝k 

⎠ 

n−k 

) 

k = 0,1,2, ⋅⋅⋅, 

n 

(11.7) 

• Binomska porazdelitev je natanko določena z dvema 

podatkoma – parametroma: n in p. 

• Če se slučajna spremenljivka porazdeljuje binomsko s 

parametroma n in p, to zapišemo: 

X : b( 

n, 

p) 

(11.8) 

208 

•104

11.1.2 Binomska porazdelitev / 2 

Primer 11.7: Naj bo spremenljivka Y določena s številom 

fantkov v družini s 4 otroki. Denimo, da je enako verjetno, 

da se v družini rodi fantek ali deklica. Izdelajmo verjetnostno 

shemo spremenljivke Y. 

209 

Verjetnost, da se rodi fantek ali deklica je enaka: 

1 

1 1 

P[ F] 

= p = , P[ 

D] 

= q = 1− 

p = 1− 

= 

2 

2 2 

Ker nas zanima v n ponovitvah k uspehov, se spremenljivka 

Y porazdeljuje binomsko b(4,0.5) . Njena verjetnostna shema 

je : 

⎛ 0 

Y : ⎜ 

⎝1/16 

1 

4 /16 

2 

6 /16 

Na primer: 

⎛4⎞ 

2 

P[ 

Y = 2] = ⎜ ⎟0.5 

(1 − 0.5) 

⎝2⎠ 

3 

4 /16 

(4−2) 

= 

6 

16 

4 ⎞ 

⎟ 

1/16⎠ 

11.2 Zvezna slučajna 

spremenljivka 

• Zaloga vrednosti zvezne slučajne spremenljivke X je 

vsako realno število znotraj določenega intervala 

a ≤ X ≤ b . 

• Verjetnost, da zvezna slučajna spremenljivka zavzame 

vrednost manjšo od neke vrednosti x (porazdelitvena 

funkcija zvezne slučajne spremenljivke), je 

FX ( x) 

= P[ 

X ≤ x] 

= ∫ f 

X 

( x) 

dx 

kjer f X (x) imenujemo gostota verjetnosti. 

b 

a 

(11.9) 

210 

•105

11.2 Zvezna slučajna spremenljivka / 2 

• Gostoto verjetnosti zvezne slučajne spremenljivke 

predstavimo grafično v koordinatnem sistemu, kjer na 

abscisno os nanašamo vrednosti slučajne spremenljivke, 

na ordinatno os pa gostoto verjetnosti f X (x). 

• Verjetnost, da zvezna slučajna spremenljivka zavzame 

vrednost manjšo od neke vrednosti x, je tedaj 

predstavljena kot ploščina pod krivuljo gostote 

verjetnosti f X (x). 

211 

• Velja 

b 

∫ 

a 

f 

X 

( x) 

dx = 1 

(11.10) 

11.2 Zvezna slučajna spremenljivka / 3 

• Grafikon gostote verjetnosti: 

f(x) 

X 

212 

a b X 

•106

11.2.1 Enakomerna zvezna 

porazdelitev 

• Enakomerna porazdelitev zvezne slučajne 

spremenljivke – gostota verjetnosti zvezne slučajne 

spremenljivke je: 

f X 

{ 

1 

a ≤ X ≤ b 

( x) 

= b - a 

0 drugod 

(11.11) 

213 

11.2.1 Enakomerna zvezna porazdelitev / 2 

• Grafično si predstavljamo gostoto verjetnosti 

enakomerno porazdeljene zvezne slučajne spremenljivke 

takole: 

f(x) X 

1 

b-a 

214 

a b X 

•107

11.2.2 Normalna porazdelitev 

• Normalna porazdelitev – zaloga vrednosti normalno 

porazdeljene slučajne spremenljivke so vsa realna 

števila, gostota verjetnosti pa je : 

f 

X 

( x) 

1 

e 

σ 2π 

2 

1⎛ 

x−μ 

⎞ 

2 

⎜ 

X 

− 

⎟ 

⎝ σ ⎠ 

= 

X 

X 

(11.12) 

• Normalna porazdelitev je natanko določena z dvema 

parametroma: in . 

μ 

• Če se slučajna spremenljivka X porazdeljuje normalno 

s parametroma in , to zapišemo takole: 

X 

X 

μ 

X 

σ 

X 

σ 

X 

: 

X X 

N( 

μ , σ ) 

(11.13) 

215 

11.2.2 Normalna porazdelitev / 2 

• Grafično si predstavljamo gostoto verjetnosti normalno 

porazdeljene zvezne slučajne spremenljivke takole: 

216 

•108


217 

• Če slučajno spremenljivko X, ki se porazdeljuje 

normalno, standardiziramo 

Z = 

X − μ 

X 

σ 

je slučajna spremenljivka Z še vedno normalno 

porazdeljena s parametroma 

Z : N(0,1) 

in ima preprostejšo gostoto verjetnosti: 

f 

Z 

( z) 

= 

X 

1 

e 

2π 

2 

z 

− 

2 

(11.14) 

(11.15) 


218 

• V splošnem nas zanimajo verjetnosti dogodkov, da 

zavzame slučajna spremenljivka X vrednosti v intervalu 

[x 1 , x 2 ]: 

Ker velja: 

1 

P[ x < X < x ] 2 

= 

1 

⎡ x1 

− μ 

X 

P[ 

x1 

≤ X ≤ x2] 

= P⎢ 

≤ 

⎣ σ 

X 

= P[ 

z ≤ Z ≤ z ] 

2 

je dovolj, da znamo poiskati poljubne verjetnosti 

dogodkov standardizirane normalno porazdeljene 

slučajne spremenljivke. 

x 

2 

∫ 

x 

1 

f 

X 

( x) 

dx 

X − μ 

X 

σ 

X 

x2 

− μ 

X 

≤ 

σ 

X 

⎤ 

⎥ 

⎦ 

(11.16) 

= 

•109

11.3 Pričakovana vrednost 

slučajne spremenljivke 

• Denimo, da proučujemo diskretno slučajno 

spremenljivko X z verjetnostno shemo: 

⎛ x 

X : 

⎜ 

⎝ p 

1 

1 

x 

p 

2 

2 

⋅⋅⋅ 

⋅⋅⋅ 

x 

p 

m 

m 

⎞ 

⎟ 

⎠ 

(11.17) 

219 

Ponovimo poskus, pri katerem nastopa ta slučajna 

spremenljivka, n-krat in pri tem beležimo, kolikokrat se 

je zgodila posamezna vrednost slučajne spremenljivke. 

Dobimo naslednjo frekvenčno porazdelitev: 

⎛ x 

X : 

⎜ 

⎝ f 

1 

1 

x 

f 

2 

2 

⋅⋅⋅ 

⋅⋅⋅ 

(11.18) 

kjer so f i frekvence posamezne vrednost (i=1,2,...m). 

x 

f 

m 

m 

⎞ 

⎟ 

⎠ 

11.3 Pričakovana vrednost ... / 2 

• ... nadaljevanje: 

Aritmetična sredina spremenljivke X je tedaj: 

1 

n 

m 

∑ 

i= 

1 

f x 

i 

i 

= 

m 

∑ 

i= 

1 

fi 

xi 

n 

(11.19) 

f 

kjer so i 

relativne frekvence. 

n 

Če poskus ponovimo zelo velikokrat, se relativne 

frekvence običajno ustalijo pri verjetnostih: 

] 

p = P = 

i 

[ X xi 

(11.20) 

220 

•110


• ... nadaljevanje: 

Zato se pri velikem številu poskusov aritmetična sredina 

slučajne spremenljivke X običajno ustali pri vrednosti: 

E ( X ) = 

m 

∑ 

i= 

1 

p i x 

(11.21) 

Število E(X) je aritmetična sredina slučajne 

spremenljivke X in ga imenujemo pričakovana 

vrednost (angl. “expected value”) (tudi matematično 

upanje) slučajne spremenljivke X. 

i 

221 


Primer 11.8: Zopet vzemimo slučajno spremenljivko Y, 

določeno s številom fantkov v družini s 4 otroki. 

Spremenljivka Y se porazdeljuje binomsko z verjetnostno 

shemo spodaj. Izračunajmo matematično upanje slučajne 

spremenljivke Y. 

⎛ 0 

Y : ⎜ 

⎝1/16 

1 

4 /16 

6 /16 

4 /16 

4 ⎞ 

⎟ 

1/16⎠ 

Pričakovano vrednost izračunamo po formuli (11.21): 

1 4 6 4 1 

E( 

Y ) = ⋅0 

+ ⋅1+ 

⋅2 

+ ⋅3+ 

⋅4 

= 2 

16 16 16 16 16 

2 

Ker je porazdelitev te slučajne spremenljivke simetrična 

(p=0.5; glej primer 11.7), je dobljena pričakovna vrednost 

(2 fantka v družini) zares “pričakovana”. 

3 

222 

•111


• Pri računanju pričakovane vrednosti slučajne 

spremenljivke velja (a in b sta konstanti): 

E ( aX + b) 

= aE( 

X ) + b 

(11.22) 

• Dokazati se da, da je pričakovana vrednost slučajne 

spremenljivke X, ki se porazdeljuje binomsko b( n, 

p) 

enaka 

E( 

X ) = n⋅ 

p 

(11.23) 

223 


• Pričakovana vrednost zvezne slučajne spremenljivke X, 

ki je definirana na intervalu [a,b], je analogno: 

b 

E ( X ) = ∫ x f 

a 

E( 

X ) = μ 

X 

X 

( x) 

dx 

(11.24) 

• Dokazati se da, da je pričakovana vrednost slučajne 

spremenljivke X, ki se porazdeljuje normalno N( μ 

X 

, σ 

X 

) 

enaka 

(11.25) 

224 

•112

11.4 Razpršenost 

slučajne spremenljivke 

• Razpršenost ali varianca slučajne spremenljivke X 

meri razpršenost slučajne spremenljivke in je definirana 

takole: 

2 

(11.26) 

D( X ) = E( 

X − E( 

X )) 

225 

• Razpršenost diskretne slučajne spremenljivke z m 

vrednostmi je: 

D( 

X ) = 

m 

∑ 

i= 

1 

( x − E( 

X )) 

2 

i 

p i 

(11.27) 

• Razpršenost zvezne slučajne spremenljivke definirane 

na intervalu [a,b] pa je: 

b 

D ( X ) = ∫ ( x − E( 

X )) 

a 

2 

f 

X 

( x) 

dx 

(11.28) 

11.4 Razpršenost slučajne spremenljivke / 2 

• Pozitivna vrednost kvadratnega korena iz variance je 

standardni odklon. 

• Za razpršenost velja: 

in 

D ( X + b) 

= D( 

X ) 

D ( aX ) = a 

2 

D( 

X ) 

(11.29) 

(11.30) 

kjer sta a in b konstanti. 

226 

•113


Primer 11.9: Zopet vzemimo slučajno spremenljivko Y, 

določeno s številom fantkov v družini s 4 otroki, ki se 

porazdeljuje binomsko b(4,0.5) . Izračunajmo razpršenost te 


S pomočjo pričakovane vrednosti izračunane v primeru 11.8 

izračunamo razpršenost oz. varianco po formuli (11.27): 

D( 

Y ) = 

+ 

4 

16 

1 

16 

⋅(3 

− 2) 

⋅(0 

− 2) 

2 

+ 

1 

16 

2 

+ 

4 

16 

⋅(4 

− 2) 

⋅(1 

− 2) 

2 

= 1 

2 

+ 

6 

16 

⋅(2 

− 2) 

2 

+ 

227 


Pokazati se da, da je: 

• razpršenost ali varianca slučajne spremenljivke X, ki 

se porazdeljuje binomsko b( n, 

p) 

, enaka: 

D( 

X ) = n⋅ 

p ⋅q 

(11.31) 

• razpršenost ali varianca slučajne spremenljivke X, ki 

se porazdeljuje normalno N μ , σ ), pa je: 

2 

D( X ) = σ X 

( 

X X 

(11.32) 

228 

•114

11.5 Momenti in centralni 

momenti porazdelitve 

• Pogosto se zgodi, da imamo na voljo premalo podatkov, 

da bi lahko v celoti določili porazdelitveni zakon. 

• Včasih je za inženirja dovolj, da pozna le določene 

lastnosti porazdelitvenega zakona (momente 

porazdelitve). 

• Pričakovano vrednost in razpršenost porazdelitve lahko 

izračunamo tudi iz momentov oz. centralnih 

momentov porazdelitve. 

229 

11.5 Momenti porazdelitve / 2 

• Moment r-tega reda za diskretno in zvezno slučajno 

spremenljivko X je: 

m 

( r) 

X 

= 

m 

∑ 

i= 

1 

x 

r 

i 

p 

X 

( x ) 

i 

(11.33) 

∞ 

∫ 

−∞ 

( r) 

r 

mX = x f 

X 

( x) 

dx 

(11.34) 

• Iz lastnosti verjetnostne funkcije in gostote verjetnosti 

velja, da je moment ničtega reda enak 1. 

230 

•115


• Moment prvega reda predstavlja srednjo vrednost 

ali pričakovano vrednost ali matematično upanje 

slučajne spremenljivke X: 

m 

(1) 

X 

= μ 

X 

= E( 

X ) = 

m 

∑ 

i= 

1 

x p 

i 

X 

( x ) 

i 

(11.35) 

∞ 

∫ 

−∞ 

(1) 

mX = μ 

X 

= E( 

X ) = x f 

X 

( x) 

dx 

(11.36) 

231 


• Centralni moment r-tega reda za diskretno in zvezno 

slučajno spremenljivko X pa je: 

m 

( r) 

X 

= 

m 

∑ 

i= 

1 

( x − μ ) 

i 

X 

r 

p 

X 

( x ) 

i 

(11.37) 

m 

( r) 

X 

∞ 

∫ 

−∞ 

= ( x − μ ) 

X 

r 

f 

X 

( x) 

dx 

(11.38) 

• Centralni moment ničtega reda je enak 1. 

232 

•116


• Najpogosteje uporabljen centralni moment je centralni 

moment drugega reda, s katerim opišemo razpršenost 

slučajne spremenljivke X: 

m 

(2) 

X 

= 

m 

∑ 

i= 

1 

( x − μ ) 

i 

X 

2 

p 

X 

( x ) 

i 

(11.39) 

∞ 

∫ 

−∞ 

(2) 

2 

mX = ( x − μ 

X 

) f 

X 

( x) 

dx 

(11.40) 

233 


• Centralni moment tretjega reda je mera za 

asimetričnost porazdelitve. Z njim definiramo koeficient 

asimetrije: 

KA = γ = 

1 

(3) 

m X 

3 

σ 

X 

(11.41) 

• Centralni moment četrtega reda pa je mera za 

sploščenost porazdelitve. Z njim definiramo koeficient 

sploščenosti: 

KS = γ = 

2 

(4) 

m X 

4 

σ 

X 

(11.42) 

234 

•117


• Pomen pričakovanih vrednosti, razpršenosti ter 

koeficientov asimetričnosti in sploščenosti pri neki zvezni 

slučajni spremenljivki (po metodi momentov) 

Pozor: Primerjaj s koeficienti asimetričnosti (136) in 

sploščenosti (138) opredeljenih s primerjavo 

srednjih vrednosti! 

235 

12. VZORČENJE 

12.1 Osnove vzorčenja 

• Statistične značilnosti imenujemo: 

• parametri, če so izračunane na populaciji, 

• statistike, če so izračunane na vzorcu. 

• Statistične značilnosti za: 

236 

• populacijo označujemo z grškimi črkami, npr.: 

• aritmetična sredina μ 

• standardni odklon σ 

• delež oz. p 

π 

• vzorec označujemo z latinskimi črkami, npr.: 

• aritmetična sredina X 

• standardni odklon s 

• delež pˆ 

•118

12.1 Osnove vzorčenja / 2 

237 

• Namen zbiranja podatkov o enotah populacije je odvisen 

od značilnosti te populacije in namena raziskovanja. 

Uporabimo lahko: 

• popolno opazovanje množičnega pojava – popišemo 

vse enote, ki sestavljajo statistično populacijo (običajno 

je dolgotrajno, drago in včasih težko izvedljivo); 

• delno opazovanje množičnega pojava – popišemo 

samo določene enote iz populacije. Pri tem se lahko 

odločamo za: 

• izbiro tipičnih enot – izberemo samo nekatere enote, ki so 

značilne za populacijo (subjektivna metoda); 

• metoda vzorčenja – izbiramo enote neodvisno od posamične 

presoje: vse enote obravnavane populacije naj bi imele enako 

možnost izbire v vzorec. 

12.1 Osnove vzorčenja / 3 

• Poznamo več vrst vzorčenja: 

• enostavno vzorčenje – iz množice enot naključno izbiramo enote 

(ni potrebno poznati značilnosti statistične množice); 

• stratificirano vzorčenje (vzorčenje po plasteh) – najprej množico 

enot razdelimo na homogene dele (razpršenost opazovane 

spremenljivke znotraj posameznih delov naj bi bila čim manjša); nato 

v teh delih izvedemo slučajno vzorčenje; 

• vzorčenje v skupinah – iz celotne populacije najprej izberemo 

določeno število skupin enot, ki jih opazujemo v celoti; 

• vzorčenje v več stopnjah – je nadaljevanje vzorčenja v skupinah; 

uporabljamo ga takrat, ko je mogoče osnovno populacijo urediti na 

več, hierarhično urejenih skupin; enote znotraj teh skupin izbiramo 

naključno; 

• sistematično vzorčenje –naključno izberemo le prvo enoto, druge 

pa izberemo v enakih razmikih. 

238 

•119

12.2 Porazdelitve vzorčnih 

statistik 

• Denimo, da je v populaciji N enot in da iz te populacije 

slučajno izbiramo n enot v enostaven slučajen vzorec ali 

na kratko slučajen vzorec (vsaka enota ima enako 

1 

verjetnost, da bo izbrana v vzorec; t.j. ). 

• Če hočemo dobiti slučajen vzorec, moramo izbrane 

enote pred ponovnim izbiranjem vrniti v populacijo 

(vzorec s ponavljanjem). 

• Če je velikost vzorca v primerjavi s populacijo majhna, 

se ne zmotimo dosti, če imamo za slučajen vzorec tudi 

vzorec, ki nastane s slučajnim izbiranjem brez 

vračanja. 

N 

239 

12.2 Porazdelitve vzorčnih statistik / 2 

• Predstavljajmo si, da smo iz populacije izbrali vse 

možne vzorce. Dobili smo populacijo vseh možnih 

vzorcev. 

• Teh je v primeru enostavnih slučajnih vzorcev (s 

n 

ponavljanjem) N , če je N število enot populacije in n 

število enot v vzorcu. 

• Število slučajnih vzorcev brez ponavljanja pa je: 

⎛ N ⎞ 

⎜ ⎟ 

• 

⎝ n ⎠ 

, če ne upoštevamo vrstnega reda izbranih 

elementov v vzorcu, oziroma 

⎛ N + n −1⎞ 

⎝ n ⎠ 

• ⎜ ⎟, če upoštevamo vrstni red. 

240 

•120


Primer 12.1: Vzemimo populacijo z N = 4 enotami, ki imajo 

naslednje vrednosti slučajne spremenljivke X: 0, 1, 2, 3. 

Grafično si lahko porazdelitev spremenljivke X predstavimo: 

1/4 

p X 

241 

0 

0 1 2 3 

X 



Izračunamo populacijsko aritmetično sredino in varianco: 

μ = 

X 

1 

N 

N 

∑ 

i= 

1 

x 

i 

= 

3 

2 

σ 

2 

X 

= 

1 

N 

N 

∑ 

i= 

1 

( x 

i 

− μ ) 

X 

2 

= 

5 

4 

242 

•121



243 

Sedaj pa tvorimo vse možne vzorce velikosti n = 2 

s ponavljanjem in na vsakem vzorcu izračunamo vzorčno 

aritmetično sredino X: 

vzorci X vzorci X 

0, 0 0 

2, 0 

1 

0, 1 

0, 2 

0, 3 

1, 0 

1, 1 

1, 2 

1, 3 

0.5 

1 

1.5 

0.5 

1 

1.5 

2 

2, 1 

2, 2 

2, 3 

3, 0 

3, 1 

3, 2 

3, 3 

1.5 

2 

2.5 

1.5 

2 

2.5 

3 

1 

X = 

n 

n 

∑ x i 

i= 

1 



Zapišimo verjetnostno shemo slučajne spremenljivke 

vzorčno povprečje X : 

⎛ 0 

X : ⎜ 

⎝1/16 

0.5 

2 /16 

1 

3/16 

1.5 

4 /16 

2 

3/16 

2.5 

2 /16 

3 ⎞ 

⎟ 

1/16⎠ 

244 

•122



Verjetnostno funkcijo predstavimo grafično: 

1/4 

p X 

245 

0 

-0.5 0 0.5 1 1.5 2 2.5 3 

X 



... in izračunamo matematično upanje ter razpršenost 

vzorčnega povprečja: 

E( 

X ) = 

D( 

X ) = 

m 

∑ 

i= 

1 

m 

∑ 

i= 

1 

0 + 1+ 

3+ 

6 + 6 + 5 + 3 3 

X 

i 

pi 

= 

= 

16 2 

( X − E( 

X )) 

2 

p 

i 

= 

S tem smo pokazali, da je statistika “vzorčna aritmetična 

sredina” slučajna spremenljivka s svojo porazdelitvijo. 

5 

8 

246 

• Poglejmo, kaj lahko rečemo v splošnem o porazdelitvi 

vzorčnih aritmetičnih sredin. 

•123

12.2.1 Porazdelitev vzorčnih 

aritmetičnih sredin 

• Denimo, da se spremenljivka X na populaciji porazdeljuje 

normalno N( μ 

X 

, σ 

X 

) . Na vsakem vzorcu (s ponavljanjem) 

izračunamo vzorčno aritmetično sredino X . Dokazati se 

da, da je porazdelitev vzorčnih aritmetičnih sredin 

normalna, kjer: 

• pričakovana vrednost vzorčnih aritmetičnih sredin je 

enaka aritmetični sredini spremenljivke na populaciji 

E( 

X ) = μ 

X 

(12.1) 

247 

• standardni odklon vzorčnih aritmetičnih sredin je enak 

SE( 

X ) = 

σ 

X 

n 

(12.2) 

12.2.1 Porazdelitev vzorčnih aritmetičnih ... / 2 

• Če tvorimo vzorce iz končne množice populacije brez 

vračanja, pa je standardni odklon vzorčnih aritmetičnih 

sredin 

σ 

X 

SE( 

X ) = 

n 

N − n 

N −1 

(12.3) 

• Standardni odklon statistike imenujemo tudi standardna 

napaka (angl. “Standard Error”) statistike. 

248 

•124


• Za dovolj velike vzorce (n>30) je porazdelitev vzorčnih 

aritmetičnih sredin približno normalna, tudi če 

spremenljivka X ni normalno porazdeljena na populaciji. 

• Vzorčna aritmetična sredina izračunana na i-tem 

vzorcu je ocena populacijske aritmetične sredine . 

• Ta je le ena od vrednosti, ki jo lahko zavzame slučajna 

spremenljivka “vzorčna aritmetična sredina “. 

• Vzorčno aritmetično sredino imenujemo tudi cenilka 

populacijske aritmetične sredine . 

X i 

μ X 

X i 

μ X 

249 


• Vrednosti cenilk se od ocenjevanega parametra bolj ali 

manj odklanjajo. Rečemo, da je cenilka parametra dobra, 

če ima nekaj dobrih lastnosti, kot npr.: 

1. nepristranska cenilka –povprečje vseh vzorčnih 

ocen (pričakovana vrednost cenilke) je enako 

ocenjevanemu parametru; 

2. doslednja cenilka –z večanjem vzorca se vzorčna 

ocena bliža parametru. 

• Cenilka aritmetične sredine je nepristranska cenilka, ker 

velja 

E( 

X ) = μ 

X 

250 

•125


Primer 12.2: Denimo, da se spremenljivka inteligenčni 

kvocient na populaciji porazdeljuje normalno z aritmetično 

sredino μ =100 in standardnim odklonom = 15. 

X 

X : N(100,15) 

Denimo, da imamo vzorce velikosti n = 225. Tedaj se 

vzorčne aritmetične sredine porazdeljujejo normalno: 

15 

X : N(100, 

) = N(100,1) 

225 

Izračunajmo, kolikšne vzorčne aritmetične sredine ima 90 % 

vzorcev (simetrično na povprečje): 

P[ 

X 

1 

P[ 

−z 

1 

≤ X ≤ X 

≤ Z ≤ z ] = 0.90 

P[Z 

< z ] = 0.95 

1 

1 

2 

] = 0.90 

⇒ 

z = 1.65 

1 

σ X 

251 


Primer 12.2: ... nadaljevanje 1 

Potem se vzorčne aritmetične sredine nahajajo v intervalu 

P 

[ μ X 

− z ⋅ SE X ) ≤ X ≤ μ + z ⋅ SE( 

X )] 0. 90 

⎡ 

P⎢μ 

X 

− z 

⎣ 

1 

( 

X 1 

= 

σ 

σ ⎤ 

n 

⎥ 

⎦ 

X 

X 

1 

⋅ ≤ X ≤ 

X 

+ z1 

⋅ = 

n 

μ 

0.90 

oziroma konkretno 

P[100 

−1.65⋅1≤ 

X ≤100 

+ 1.65⋅1] 

= 0.90 

P[98.35 

≤ X ≤101.65] 

= 0.90 

252 

90 % vseh slučajnih vzorcev velikosti 225 enot bo imelo 

povprečja za inteligenčni kvocient v intervalu 

(98.35,101.65). 

•126


Primer 12.2: ... nadaljevanje 2 

Lahko preverimo, da bi bil ta interval v primeru večjega 

vzorca ožji. V primeru vzorcev velikosti n = 2500 je ta 

interval 

⎡ 

P⎢100 

−1.65⋅ 

⎣ 

15 

≤ X 

2500 

≤100 

+ 1.65⋅ 

15 ⎤ 

⎥ = 0.90 

2500 ⎦ 

P[99.5 

≤ X 

≤100.5] 

= 0.90 

253 

12.2.2 Porazdelitev vzorčnih deležev 

254 

• Denimo, da želimo na populaciji oceniti delež enot p z 

določeno lastnostjo. Zato na vsakem vzorcu poiščemo 

vzorčni delež pˆ . Pokazati se da, da se za dovolj velike 

slučajne vzorce s ponavljanjem (za deleže okoli 0.5 je 

dovolj 20 enot ali več) vzorčni deleži porazdeljujejo 

približno normalno z 

• pričakovano vrednostjo vzorčnih deležev, ki je enaka 

deležu na populaciji 

E ( pˆ) 

= p 

• standardnim odklon vzorčnih deležev 

SE( 

pˆ) 

= 

p ⋅(1 

− p) 

n 

(12.4) 

(12.5) 

•127

12.2.2 Porazdelitev vzorčnih deležev / 2 

• Za manjše vzorce se vzorčni deleži porazdeljujejo 

binomsko. 

• Cenilka populacijskega deleža je nepristranska cenilka, 

ker velja 

E ( pˆ) 

= p 

(12.6) 

255 


Primer 12.3: V izbrani populaciji prebivalcev je polovica 

žensk (p = 0.5). Če tvorimo vzorce po n = 25 enot, nas 

zanima, kolikšna je verjetnost, da je v vzorcu več kot 55 % 

žensk? 

To pomeni, da iščemo verjetnost P[ pˆ >0.55]. 

Vzorčni deleži pˆ se porazdeljujejo približno normalno: 

pˆ 

: N( 

p, 

p ⋅(1 

− p) 

) = N(0.5, 

n 

0.5⋅0.5 

) = N(0.5,0.1) 

25 

⎡ 0.55− 

0.5⎤ 

P[ 

pˆ 

> 0.55] = P 

⎢ 

Z > = [ > 0.5] = 

⎣ 0.1 ⎥ 

P Z 

⎦ 

= 1− 

P[ 

Z < 0.5] = 0.3085 

256 

Rezultat pomeni, da lahko pričakujemo pri približno 31 % 

vzorcev delež žensk večji od 0.55. 

•128


Primer 12.3: ... nadaljevanje 

Poglejmo, kolikšna je ta verjetnost, če bi tvorili vzorce 

velikosti n = 2500 enot: 

P 

⎡ 

⎢ 

⎤ 

0.55 − 0.5 ⎥ 

0.5⋅(1 

− 0.5) ⎥ 

2500 ⎥ 

⎦ 

[ pˆ > 0.55] = P⎢Z 

> 

⎥ = P[ 

Z > 5] = 0 

⎢ 

⎢ 

⎣ 

Če bi tvorili vzorce po 2500 enot ne moremo pričakovati več 

kot 55 % žensk v vzorcu. 

257 

12.2.3 Porazdelitev razlik vzorčnih 


• Denimo, da imamo dve populaciji velikosti N 1 in N 2 ter 

se spremenljivka X na prvi populaciji porazdeljuje 

normalno N( μ 

X1, 

σ 

X 

), na drugi populaciji pa prav tako 

N( μ 

X 2, 

σ 

X 

) (standardna odklona sta na obeh populacijah 

enaka!). 

• V vsaki od obeh populacij neodvisno tvorimo slučajne 

vzorce velikosti n 1 in n 2 . 

• Na vsakem vzorcu (s ponavljanjem) prve populacije 

izračunamo vzorčno aritmetično sredino X 1 

in podobno 

na vsakem vzorcu druge populacije . 

X 2 

258 

•129

12.2.3 Porazdelitev razlik vzorčnih aritmetičnih ... / 2 

• Dokazati se da, da je porazdelitev razlik vzorčnih 

aritmetičnih sredin normalna, kjer je: 

• pričakovana vrednost razlik vzorčnih aritmetičnih 

sredin enaka 

E 

( X1 − X 

2) 

= E( 

X1) 

− E( 

X 

2) 

= μ 

X 1 

− 

X 2 

μ 

(12.7) 

• razpršenost razlik vzorčnih aritmetičnih sredin enaka 

D( 

X − 

= σ 

2 

X 

1 

X 

2) 

D( 

X1) 

D( 

X 

2) 

n1 

+ n 

⋅ 

n ⋅n 

1 

2 

= 

2 

+ 

σ 

= 

n 

2 

X 

1 

σ 

+ 

n 

2 

X 

2 

= 

(12.8) 

259 

12.2.3 Porazdelitev razlik vzorčnih aritmetičnih ... / 3 

Primer 12.4: Dvema populacijama študentov na neki univerzi 

(tehnikom in družboslovcem) so izmerili sposobnost branja kart s 

povprečjem μ 

Xt 

= 80 in μ Xd 

= 70 in standardnim odklonom, ki je na 

obeh populacijah enak, σ X 

= 7. Kolikšna je verjetnost, da je 

aritmetična sredina slučajnega vzorca tehnikov (n Xt 

= 36) večja 

za več kot 12 točk od aritmetične sredine vzorca družboslovcev 

(n Xd 

= 64)? 

Zanima nas torej verjetnost: 

P[ 

X − X 

t 

d 

⎡ 

⎤ 

⎢ 12 −10 

⎥ 

> 12] = P⎢Z 

> 

⎥ = P[ 

Z > 1.37] = 

⎢ 36 + 64 ⎥ 

⎢ 7⋅ 

⎣ 36⋅64 

⎥ 

⎦ 

= 1− 

P[ 

Z < 1.37] = 0.0853 

Torej, približno 8.5 % parov vzorcev je takih, da je povprečje 

tehnikov glede sposobnosti branja kart večje od povprečja 

družboslovcev za 12 točk. 

260 

•130

12.2.4 Porazdelitev razlik vzorčnih 

deležev 

• Podobno kot pri porazdelitvi razlik vzorčnih aritmetičnih 

sredin naj bosta dani dve populaciji velikosti N 1 in N 2 z 

deležema enot z neko lastnostjo p 1 in p 2 . 

• Iz prve populacije tvorimo slučajne vzorce velikosti n 1 in 

na vsakem izračunamo delež enot s to lastnostjo ˆp 1 . 

• Podobno naredimo tudi na drugi populaciji: tvorimo 

vzorce velikosti n 2 in na njih izračunamo deleže ˆp 2 . 

261 

12.2.4 Porazdelitev razlik vzorčnih deležev / 2 

• Pokazati se da, da se za dovolj velike vzorce razlike 

vzorčnih deležev porazdeljujejo normalno z 

• pričakovano vrednost razlik vzorčnih deležev 

E( pˆ 

pˆ 

E pˆ 

E pˆ 

= p − p 

1 

− 

2) 

= ( 

1) 

− ( 

2) 

1 

2 

(12.9) 

• razpršenostjo razlik vzorčnih deležev 

D( 

pˆ 

− pˆ 

) = D( 

pˆ 

) + D( 

pˆ 

) = 

1 

1 

2 

p1 

⋅(1 

− p1) 

p2 

⋅(1 

− p2) 

= + 

n n 

1 

2 

2 

(12.10) 

262 

•131

13. INTERVALI ZAUPANJA 

263 

• Denimo, da s slučajnim vzorcem ocenjujemo parameter . 

• Poskušamo najti statistiko g, ki je nepristranska E(g) = γ 

in se na vseh možnih vzorcih vsaj približno normalno 

porazdeljuje s standardno napako SE(g). 

• Nato poskušamo najti interval, v katerem se bo z dano 

stopnjo zaupanja oz. gotovostjo ( 1−α) 

nahajal 

ocenjevani parameter: 

P[ a ≤ γ ≤ b] = 1−α 

(13.1) 

a je spodnja meja zaupanja, b je zgornja meja zaupanja, 

α verjetnost tveganja oziroma 1− verjetnost gotovosti. 

• Ta interval imenujemo interval zaupanja in ga razlagamo 

takole: “Z verjetnostjo tveganja α se parameter γ nahaja 

v intervalu zaupanja.” 

α 

γ 

13. INTERVALI ZAUPANJA / 2 

• Na osnovi omenjenih predpostavk o porazdelitvi 

statistike g lahko zapišemo, da se statistika 

g − E( 

g) 

g −γ 

Z = = 

SE( 

g) 

SE( 

g) 

porazdeljuje standardizirano normalno N(0,1) . 

(13.2) 

α 

• Če tveganje porazdelimo polovico na levo in polovico 

na desno na konce porazdelitve, lahko zapišemo 

⎡ g −γ 

⎤ 

P⎢− 

zα 

2 

≤ ≤ zα 

2⎥ 

= 1−α 

⎣ SE( 

g) 

⎦ 

(13.3) 

264 

•132


• Po ustrezni preureditvi lahko izpeljemo naslednji interval 

zaupanja za parameter γ 

P 

[ g − z ⋅ SE(g) ≤ γ ≤ g + z ⋅ ] = 1−α 

α 2 α 2 

SE(g) 

(13.4) 

z α 2 

• v enačbi (13.4) je določen le s tveganjem 

α 

265 


z α 

• Vrednosti 

2 

preberemo iz preglednice verjetnosti za 

standardizirano normalno porazdelitev v prilogi navodil 

za izvedbo vaj (Statistika – Vaje, S. Drobne in G. Turk) 

ali izračunamo v Excelu s funkcijo NORMSINV, ali v 

programu STATKALK. 

• z α 2 

za nekaj najbolj standardnih tveganj je: 

• α = 0.10, 

z = α 2 

1.65 

• α = 0.05, 

z = α 2 

1.96 

• α 0.01, 

z = 2 

2.58 

= α 

266 

•133

13.1 Pomen stopnje zaupanja 

pri intervalih zaupanja 

• Za slučajni vzorec lahko ob omenjenih predpostavkah 

izračunamo ob izbrani stopnji zaupanja ( 1−α) 

interval 

zaupanja za ocenjevani parameter γ . 

• Ker se podatki vzorcev razlikujejo, se razlikujejo 

vzorčne ocene parametrov in zato tudi izračunani 

intervali zaupanja za ocenjevani parameter γ . 

• Meji intervala zaupanja sta slučajni spremenljivki. 

−α 

• Vzemimo stopnjo zaupanja ( 1 = 1− 

0.05 = 0.95) in 

100 slučajnih vzorcev, kjer smo za vsak vzorec 

izračunali interval zaupanja za parameter γ . Tedaj lahko 

pričakujemo, da bo 95 intervalov zaupanja od 100 

pokrilo iskani parameter γ. 

267 

Primer 13.1: Primer predstavitve 

več intervalov zaupanja za 

aritmetično sredino μ pri tveganju 

10 %: približno 90 % intervalov 

zaupanja pokrije parameter . 

13.1 Pomen stopnje zaupanja ... / 2 

μ 

268 

•134

13.2 Intervali zaupanja pri 

velikih vzorcih 

• V nadaljevanju bomo pokazali, da se cenilke 

obravnavanih parametrov populacije porazdeljujejo 

normalno ali približno normalno, če jih računamo iz 

velikih vzorcev (praviloma n > 30). 

• V primerih, ko določamo intervale zaupanja iz majhnih 

vzorcev, pa je nekaj posebnosti, ki jih bomo pokazali v 

poglavju 13.3. 

269 

13.2.1 Interval zaupanja za 

aritmetično sredino pri velikih vzorcih 

• Interval zaupanja za aritmetično sredino je: 

⎡ σ 

X 

σ 

X ⎤ 

P⎢X 

− zα 

2 

⋅ ≤ μ 

X 

≤ X + zα 

2 

⋅ ⎥ = 1−α 

⎣ n 

n ⎦ 

• Pogosto populacijskega standardnega odklona ne 

poznamo. Ocenimo ga na vzorcu in sicer takole: 

σ x 

(13.5) 

s 

* 

X 

n 

∑ ( x − X ) 

i= 

1 i 

= 

n −1 

2 

(13.6) 

*2 

s X 

ker je tako definirana vzorčna varianca nepristranska 

2 2 

cenilka populacijske variance: E 

* ) = σ . 

( s X X 

270 

•135

13.2.1 Interval zaupanja za aritmetično sredino ... / 2 

• Če lahko predpostavimo, da se spremenljivka X na 

populaciji porazdeljuje normalno in če imamo dovolj 

velik vzorec (n>30), je interval zaupanja za aritmetično 

sredino populacije : 

μ x 

* 

* 

⎡ s 

⎤ 

X 

sX 

P⎢X 

− zα 

2 

⋅ ≤ μ 

X 

≤ X + zα 

2 

⋅ ⎥ = 1−α 

⎣ n 

n ⎦ 

(13.7) 

271 


Primer 13.2: Na vzorcu velikosti n = 151 podjetnikov v majhnih 

podjetjih v Sloveniji, so izračunali, da je povprečna starost 

anketiranih podjetnikov X = 40.4 leta in standardni odklon 

* 

s X = 10.2 leti. Pri stopnji zaupanja 95 % želimo z intervalom 

zaupanja oceniti povprečno starost podjetnikov v majhnih podjetjih 

v Sloveniji. 

Ker imamo velik vzorec, izračunamo interval zaupanja po enačbi 

(13.7): 

* 

* 

⎡ s 

⎤ 

X 

sX 

P⎢X 

− zα 

2 

⋅ ≤ μ 

X 

≤ X + zα 

2 

⋅ ⎥ = 1−α 

⎣ n 

n ⎦ 

1.96⋅10.2 

1.96⋅10.2 

40.4 − ≤ μ 

X 

≤ 40.4 + 

151 

151 

40.4 −1.6 

≤ μ ≤ 40.4 + 1.6 

38.8 ≤ μ 

X 

X 

≤ 42.0 

S tveganjem 5 % lahko trdimo, da je povprečna starost podjetnikov 

majhnih podjetij v Sloveniji med 38.8 in 42.0 leti. 

272 

•136

13.2.2 Interval zaupanja za varianco 

pri velikih vzorcih 

• Interval zaupanja za varianco računamo enako pri velikih 

kot tudi pri majhnih vzorcih. 

• Pri opredelitvi intervala zaupanja za varianco populacije 

2 

je nekaj posebnosti (porazdelitev χ, število prostostnih 

stopenj ν ), ki jih posebej omenjamo pri intervalih 

zaupanja pri majhnih vzorcih. 

• Zato bomo interval zaupanja za varianco opredelili v 

poglavju 13.6.2 Intervalna ocena variance pri 

majhnih vzorcih. 

273 

13.2.3 Interval zaupanja za delež 

pri velikih vzorcih 

• Interval zaupanja za populacijski delež je: 

⎡ pˆ(1 

− pˆ) 

pˆ(1 

− pˆ) 

⎤ 

P⎢ 

pˆ − zα 

⋅ ≤ ≤ ˆ 

2 

p p + zα 

2 

⋅ ⎥ = 1−α 

⎣ 

n 

n ⎦ 

(13.8) 

kjer smo v standardni napaki SE( pˆ ) upoštevili namesto 

populacijskega deleža p njegovo vzorčno oceno pˆ . 

• Tudi v tem primeru se vzorčni deleži za dovolj velike 

vzorce porazdeljujejo približno normalno. 

274 

•137

13.2.3 Interval zaupanja za delež ... / 2 

Primer 13.3: Na vzorcu iz primera 13.2 so izračunali, da je delež 

obrtnih podjetij od vseh malih podjetij pˆ = 0.50. Pri tveganju 5 % 

želimo z intervalom zaupanja oceniti delež obrtnih majhnih podjetij 

v Sloveniji. 

Ker imamo velik vzorec, izračunamo interval zaupanja po enačbi 

(13.8): 

⎡ pˆ(1 

− pˆ) 

P⎢ 

pˆ − z 

ˆ 

α 2 

⋅ ≤ p ≤ p + zα 

2 

⋅ 

⎣ 

n 

0.50 −1.96⋅ 

0.50(1 − 0.50) 

≤ p ≤ 0.50 + 1.96⋅ 

151 

0.50 − 0.08 ≤ p ≤ 0.50 + 0.08 

0.42 ≤ p ≤ 0.58 

pˆ(1 

− pˆ) 

⎤ 

⎥ = 1−α 

n ⎦ 

0.50(1 − 0.50) 

151 

S tveganjem 5 % lahko trdimo, da je delež obrtnih majhnih podjetij 

v Sloveniji glede na vsa majhna podjetja med 42 in 58 %. 

275 

13.2.4 Interval zaupanja za razliko 

aritmetičnih sredin pri velikih vzorcih 

• Ker se razlike aritmetičnih sredin pri velikih vzorcih 

porazdeljujejo normalno 

⎛ 

X ⎜ 

1 

− X 

2 

: N μ 

X1 

− μ 

X 2, 

⎜ 

⎝ 

2 2 

σ σ 

X X 

+ 

n n 

je interval zaupanja za razliko aritmetičnih sredin 

1 

2 

⎞ 

⎟ 

⎟ 

⎠ 

⎡ 

P⎢X1 

− X 

⎢ 

⎣ 

= 1−α 

2 

− z 

α 2 

⋅ 

2 

σ 

n 

X 

1 

2 

σ 

X 

+ 

n 

2 

≤ μ 

X1 

− μ 

X 2 

≤ X 

1 

− X 

2 

+ z 

α 2 

⋅ 

2 2 

σ σ 

X X 

+ 

n n 

1 

2 

(13.9) 

⎤ 

⎥ = 

⎥ 

⎦ 

276 

•138

13.2.4 Interval zaupanja za razliko aritmetičnih ... / 2 

277 

2 

σ X 

• Običajno populacijske variance ne poznamo, zato jo 

ocenimo na vzorcu prve in druge populacije: 

s 

1 

n1 

n2 

*2 

2 

*2 

2 

X 1 

= ∑( 

xi 

− X1) 

sX 

2 

= ∑( 

xi 

− X 

2) 

n1 

−1 

i= 

1 

n2 

−1 

i= 

1 

• Ob predpostavki, da se spremenljivka X na obeh 

populacijah porazdeljuje normalno in če imamo dovolj 

velika vzorca, je interval zaupanja za razliko 


⎡ 

P⎢X1 

− X 

⎢ 

⎣ 

= 1−α 

2 

− z 

α 2 

⋅ 

s 

n 

*2 

X 1 

1 

s 

X 

+ 

n 

*2 

2 

2 

≤ μ 

X1 

− μ 

X 2 

≤ X 

1 

− X 

1 

2 

+ z 

α 2 

⋅ 

s 

n 

*2 

X 1 

1 

s 

X 

+ 

n 

*2 

2 

2 

(13.10) 

⎤ 

⎥ = 

⎥ 

⎦ 


deležev pri velikih vzorcih 

• Interval zaupanja za razliko deležev dveh populacij je: 

P[ 

pˆ 

− pˆ 

1 

≤ pˆ 

1 

2 

− pˆ 

− z 

2 

α 2 

+ z 

⋅ 

α 2 

⋅ 

pˆ 

(1 − ˆ ) ˆ 

1 

p1 

p 

+ 

n 

1 

pˆ 

(1 − ˆ ) ˆ 

1 

p1 

p 

+ 

n 

1 

2 

(1 − pˆ 

n 

2 

2 

(1 − pˆ 

n 

2 

2 

) 

≤ p 

2 

1 

− p 

2 

) 

] = 1−α 

≤ 

(13.11) 

kjer smo v standardni napaki SE( pˆ 

1 

− pˆ 2) upoštevali 

namesto populacijskih deležev p 1 in p 2 njihove vzorčne 

ocene ˆp 

1in ˆp 

2. 

278 

•139

13.2.6 Določanje velikosti vzorca 

• Raziskovalci ponavadi vedo, kako natančno želijo na 

osnovi vzorčnih podatkov oceniti parametre, ki jih 

potrebujejo (npr. aritmetično sredino neke 

spremenljivke ali delež neke lastnosti na populaciji). 

279 

• Na osnovi vedenja, kolikšna je lahko največja razlika E 

med iskanim parametrom γ in njegovo vzorčno oceno g 

(dovoljeno odstopanje) 

γ − g < E 

lahko izračunamo, kako velik vzorec potrebujemo. 

• Iz intervala zaupanja lahko razberemo, da je pri izbrani 

stopnji zaupanja 

1−α 

γ − g = z ⋅ SE( 

g) 

< E 

α 2 

(13.12) 

13.2.6.1 Določanje velikosti vzorca, ko ocenjujemo 

aritmetično sredino 

• V primeru določanja velikosti vzorca za ocenjevanje 

aritmetične sredine na populaciji, vstavimo v neenačbo 

(13.12) standardno napako za aritmetično sredino 

z ⋅ σ X 

α 2 

< E 

(13.13) 

n 

in po krajšem premisleku dobimo 

⎛ z 

n > 

⎜ 

⎝ 

α 2 

⋅σ X 

E 

⎞ 

⎟ 

⎠ 

2 

(13.14) 

280 

•140

13.2.6.1 Določanje velikosti vzorca ... / 2 

Primer 13.4: Denimo, da želimo oceniti povprečno starost 

podjetnikov majhnih podjetij v Sloveniji, tako da bo razlika med 

populacijskim povprečjem in ocenjenim povprečjem manjša od 

enega leta (E = 1). Če vemo, da je populacijski standardni odklon 

σ X = 10 let in izberemo tveganje 5 %, lahko ocenimo, kako velik 

vzorec potrebujemo: 

⎛ z 

n > 

⎜ 

⎝ 

α 2 

⋅σ X 

E 

⎞ 

⎟ 

⎠ 

2 

2 

⎛1.96⋅10 

⎞ 

= ⎜ ⎟ 

⎝ 1 ⎠ 

= 384.2 

Če želimo doseči dogovorjeno natančnost ocenjevanja, potrebujemo 

vsaj 385 enot v slučajnem vzorcu. 

281 

13.2.6.2 Določanje velikosti vzorca, ko ocenjujemo 

delež 

• Podobno lahko ocenimo velikost vzorca, če želimo 

ocenjevati z določeno natančnostjo populacijski delež: 

n 

z 

2 

2 

> α 

⋅ p ⋅(1 

− p) 

E 

2 

(13.15) 

282 

•141

13.3 Porazdelitev vzorčnih 

statistik pri majhnih vzorcih 

• Za velike vzorce smo ugotovili, da se cenilke 

obravnavanih parametrov porazdeljujejo normalno ali 

približno normalno. 

• Poglejmo, kakšne so porazdelitve statistik, če parametre 

ocenjujemo na osnovi majhnih vzorcev. 

283 

13.3 Porazdelitve vzorčnih statistik pri majhnih vzorcih / 2 

• Če se spremenljivka X porazdeljuje na populaciji normalno 

in je populacijski standardni odklon σ X 

znan, potem za 

vsako velikost vzorca velja, da se vzorčne aritmetične 

sredine porazdeljujejo normalno 

oziroma 

σ 

X 

X : N( 

μ 

X 

, ) 

n 

X − μ 

X 

Z = 

σ n 

X 

N(0,1) 

(13.16) 

284 

•142


• Če se spremenljivka X ne porazdeljuje na populaciji 

normalno in je populacijski standardni odklon σ X 

znan, 

potem za velike vzorce (n>30) velja, da se vzorčne 

aritmetične sredine porazdeljujejo približno normalno 

oziroma 

σ 

X 

X : N( 

μ 

X 

, ) 

n 

X − μ 

X 

Z = 

σ n 

X 

N(0,1) 

(13.17) 

285 



in parameter σ X 

ni znan, potem za velike vzorce (n>30) 

velja, da se vzorčne aritmetične sredine porazdeljujejo 

približno normalno 

oziroma 

X : N( 

* 

X 

μ X 

X − μ 

Z = X 

s n 

* 

sX 

, ) 

n 

N(0,1) 

(13.18) 

286 

• Velikost vzorca, pri katerem velja, da se spremenljivka Z 

porazdeljuje približno normalno (13.17 in 13.18), je 

odvisna od simetričnosti porazdelitve. 

•143



in σ X 

ni znan, potem za male vzorce ( n ≤ 30 ) velja, da se 

statistika 

t 

X − μ 

X 

= 

* ν = n−1 

sX 

n 

t 

(13.19) 

porazdeljuje po Studentovi porazdelitvi t z 

prostostno stopnjo. 

ν = n −1 

• Porazdelitev t je pojasnjena v posebnem poglavju v 

nadaljevanju (poglavje 13.4). 

287 



N( μ 

X 

, σ 

X 

) , potem tako za velike kot tudi majhne vzorce 

velja, da se statistika 

χ 

(n -1) ⋅ 

*2 

2 s 2 

= X 

χ 

2 

ν = n−1 

σ 

X 

2 

(13.20) 

porazdeljuje po porazdelitvi z ν = n −1 prostostno 

*2 

stopnjo, kjer je vzorčna varianca. 

2 

χ 

s X 

• Porazdelitev je pojasnjena v posebnem poglavju v 

nadaljevanju (poglavje 13.5). 

χ 

288 

•144


289 

• Denimo, da imamo dve populaciji. Spremenljivka X se na 

obeh populacijah porazdeljuje normalno z enakima 

variancama: N( μ 

X1, 

σ 

X 

) in N( μ 

X 2, 

σ 

X 

) . Če neodvisno 

izberemo iz vsake populacije slučajne vzorce (tudi 

majhne), se statistika 

X1 

− X 

2 

− ( μ 

X1 

− μ 

X 2) 

n1 

⋅n2 

t = t 

* 

ν = n 2 (13.21) 

1+ 

n2 

− 

sX 

n1 

+ n2 

kjer je ocena populacijske variance, ki jo dobimo takole 

*2 

s X 

*2 

*2 

*2 ( n1 

−1) 

⋅ sX1 

+ ( n2 

−1) 

⋅ sX 

2 

sX 

= 

n1 

+ n2 

− 2 

porazdeljuje po porazdelitvi t z ν = n + n 

prostostnima stopnjama. 

1 2 

− 

2 

(13.22) 

13.4 Porazdelitev t 

• Porazdelitev t ali tudi Studentova porazdelitev je 

zelo podobna normalni porazdelitvi. 

• Matematično upanje slučajne spremenljivke, ki se 

porazdeljuje po porazdelitvi t je enako 0 ( E( 

t) 

= 0) , 

porazdelitev je enovrhna in simetrična ter ima večjo 

razpršenost, čim manjše je število prostostnih stopenj. 

• Ob večanju števila enot v vzorcu se porazdelitev t vedno 

bolj približuje standardizirani normalni porazdelitvi. 

290 

•145

13.4 Porazdelitev t / 2 

• Gostota verjetnosti porazdelitve t glede na različne 

stopnje prostosti: 

291 

13.5 Porazdelitev 

2 

χ 

2 

χ 

• Porazdelitev je definirana le za pozitivne vrednosti 

slučajne spremenljivke, je enovrhna in tem bolj 

asimetrična v desno, čim manjše je število prostostnih 

stopenj. 

• Ob večanju števila enot v vzorcu se porazdelitev 

vedno bolj približuje standardizirani normalni 

porazdelitvi. 

2 

χ 

292 

•146

2 

13.5 Porazdelitev χ / 2 

2 

χ 

• Porazdelitev glede na različne stopnje prostosti: 

293 

13.6 Intervali zaupanja pri 

majhnih vzorcih 

13.6.1 Interval zaupanja za 

aritmetično sredino pri majhnih vzorcih 

294 

• V primeru, da računamo interval zaupanja iz malega 

vzorca ( n ≤ 30 ) ter da je populacijski standardni odklon 

σ X 

znan, je interval zaupanja za populacijsko 

aritmetično sredino μ 

X 

pri dani stopnji zaupanja 1−α 

⎡ σ 

X 

σ 

X ⎤ 

P⎢X 

− zα 

2 

⋅ ≤ μ 

X 

≤ X + zα 

2 

⋅ ⎥ = 1−α 

(13.23) 

⎣ n 

n ⎦ 

Vrednosti z α 2 

preberemo iz preglednice porazdelitev 

(Statistika – Vaje, S. Drobne in G. Turk) ali izračunamo 

v Excelu s funkcijo NORMSINV, ali v programu 

STATKALK. 

•147


• V primeru, da računamo interval zaupanja iz malega 

vzorca ( n ≤ 30 ) ter da je populacijski standardni odklon 

σ X 

ni znan, je interval zaupanja za populacijsko 

aritmetično sredino μ 

X 

pri dani stopnji zaupanja 1−α 

* 

* 

⎡ s 

⎤ 

x 

sx 

P⎢X 

− tα 

2 

⋅ ≤ μ 

X 

≤ X + tα 

2 

⋅ ⎥ = 1−α 

(13.24) 

⎣ n 

n ⎦ 

Vrednosti t α 2 

preberemo iz preglednice porazdelitev 

(Statistika – Vaje, S. Drobne in G. Turk) ali izračunamo 

v Excelu s funkcijo TINV, ali v programu STATKALK. 

295 


• Gostota verjetnosti statistike t in dvostranski interval 

zaupanja 

296 

•148


• Gostota verjetnosti statistike t in enostranski interval 

zaupanja 

297 


298 

Primer 13.5: Vzemimo, da se spremenljivka X (število ur branja 

dnevnih časopisov na teden) porazdeljuje normalno N( μ 

X 

, σ 

X 

) . Na 

osnovi podatkov za sedem slučajno izbranih oseb ocenimo interval 

zaupanja za aritmetično sredino pri tveganju 10 % (x i 

= 5, 7, 9, 7, 

6, 10, 5). 

n 

n 

1 49 

*2 1 

X = ∑ xi 

= = 7 sX 

= ∑( 

xi 

n 7 

n −1 

i= 

1 

Iz preglednice za porazdelitev t preberemo, da je 

in interval zaupanja je 

⎡ 

P⎢X 

− 

⎣ 

⎡ 

P⎢7 

−1.943 

⎣ 

i= 

1 

t α 

* 

sx 

tα 

2 

⋅ ≤ μ 

X 

≤ X + tα 

2 

⋅ 

n 

3.67 

⋅ ≤ μ 

X 

≤ 7 + 1.943⋅ 

7 

P[ 5.6 ≤ μ ≤ 8.4] = 0. 9 

2 

( n −1) 

= t0. 

05(6) 

= 1.943 

X 

− X ) 

2 

* 

s ⎤ 

x 

⎥ = 1−α 

n ⎦ 

22 

= = 3.67 

6 

3.67 ⎤ 

⎥ = 1− 

0.1 

7 ⎦ 

•149

13.6.2 Interval zaupanja za varianco 

pri majhnih in velikih vzorcih 

• Interval zaupanja za varianco pri velikih kot tudi pri 

majhnih vzorcih računamo 

⎡ 

*2 

*2 

( n −1) 

⋅ s 

⎤ 

X 2 ( n −1) 

⋅ sX 

P⎢ 

≤ σ ≤ ⎥ = 1−α 

2 

X 

2 

(13.25) 

⎢⎣ 

χ1 

−α 

2 

χα 

2 ⎥⎦ 

2 

2 

kjer vrednosti χ1 − α 2 in χ α 2 preberemo iz preglednice 

porazdelitve (Statistika – Vaje, S. Drobne in G. Turk) ali 

izračunamo v Excelu s funkcijo CHIINV, ali v programu 

STATKALK. 

2 

χ 

• Porazdelitev ni simetrična (s povprečjem 0), zato 

moramo poiskati vsako vrednost posebej. 

299 

13.6.2 Interval zaupanja za varianco ... / 2 

2 

χ 

• Gostota verjetnosti statistike in dvostranski interval 

zaupanja 

300 

•150

13.6.2 Interval zaupanja za varianco ... / 3 

Primer 13.6: Vzemimo prejšnji primer (13.5) spremenljivke 

o številu ur branja dnevnih časopisov na teden. Za omenjene 

podatke iz vzorca ocenimo z intervalom zaupanja varianco pri 

10% tveganju. 

Iz preglednice za porazdelitev 

χ 

χ 

2 

α 2 

2 

1−α 

2 

2 

( n −1) 

= χ 

2 

( n −1) 

= χ 

2 

χ 

(6) = 1.64 

0.95 

in interval zaupanja za varianco je 

0.5 

preberemo, da je 

(6) = 12.59 

⎡ 

*2 

*2 

( n −1) 

⋅ s ( 1) ⎤ 

X 2 n − ⋅ sX 

P⎢ 

≤ σ 

1 

2 

X 

≤ 

2 ⎥ = −α 

⎢⎣ 

χ1 

−α 

2 

χα 

2 ⎥⎦ 

⎡(7 

−1) 

⋅3.67 

2 (7 −1) 

⋅3.67⎤ 

P⎢ 

≤ σ 

X 

≤ 

= 1− 

0.1 

12.6 

1.64 ⎥ 

⎣ 

⎦ 

P 

2 

[ 1.75 ≤ σ ≤13.43] = 0. 9 

X 

301 


aritmetičnih sredin pri majhnih vzorcih 

• Interval zaupanja za razliko aritmetičnih sredin pri 

majhnih vzorcih računamo 

P[ 

X 

1 

− X 

≤ X 

1 

2 

− t 

− X 

α 2 

2 

+ t 

⋅ s 

* 

X 

α 2 

⋅ 

⋅ s 

* 

X 

n1 

+ n 

n ⋅n 

⋅ 

1 

n1 

+ n 

n ⋅n 

1 

2 

2 

≤ μ 

2 

2 

X 1 

− μ 

X 2 

] = 1−α 

≤ 

(13.26) 

* 

s X 

kjer je pojasnjena v (13.22). 

302 

•151

13.6.4 Interval zaupanja za delež 

pri majhnih vzorcih 

• Interval zaupanja za delež pri majhnih vzorcih je: 

1 

P[ 

pˆ 

− 

2 

z 

1+ 

n 

1−α 

2 

1 

≤ pˆ 

+ 

2 

z 

1+ 

n 

1−α 

2 

2 

z 

⋅( 

pˆ 

+ 

2n 

1−α 

2 

2 

z 

⋅( 

pˆ 

+ 

2n 

1−α 

2 

− z 

− z 

1−α 

2 

1−α 

2 

2 

pˆ 

⋅(1 

− pˆ) 

z 

+ 

n 4n 

1−α 

2 

2 

2 

pˆ 

⋅(1 

− pˆ) 

z 

+ 

n 4n 

1−α 

2 

2 

) ≤ p ≤ 

(13.27) 

)] = 1−α 

kjer je 

pˆ 

vzorčni delež. 

303 

14. PREIZKUŠANJE 

DOMNEV 

• Statistična domneva (hipoteza) je vsaka domneva o 

neznani porazdelitvi vrednosti slučajne spremenljivke. 

• Domneva je lahko: 

• parametrična, to je domneva o vrednosti nekega 

parametra porazdelitve, ali 

• neparametrična, to je domneva o neki neparametrični 

lastnosti (tip porazdelitve, neodvisnost ...) porazdelitve 


• Preizkušanje domneve ali test je vsak postopek, po 

katerem lahko na temelju vzorca slučajne spremenljivke 

domnevo, ki jo preizkušamo, zavrnemo ali ne. 

304 

•152

14. PREIZKUŠANJE DOMNEV / 2 

Primer 14.1: Postavimo domnevo o vrednosti nekega 

parametra ter jo preizkusimo. 

• Postavimo domnevo vrednosti parametra, npr. deleža enot 

populacije z določeno lastnostjo (p). Denimo, da je 

domneva 

H : p H 

= 0.36 

• Tvorimo vse slučajne vzorce velikosti, na primer, n = 900 

enot in na vsakem vzorcu določimo vzorčni delež pˆ (delež 

enot v vzorcu z določeno lastnostjo). 

• Ob predpostavki, da je domneva pravilna, vemo, da se 

vzorčni deleži porazdeljujejo približno normalno 

N( 

p 

H 

, 

p 

H 

⋅(1 

− p 

n 

H 

) 

) 

305 


• Vzemimo en slučajen vzorec z vzorčnim deležem pˆ . 

Ta se lahko bolj ali manj razlikuje od p H . Če se zelo 

razlikuje, lahko podvomimo o resničnosti p H 

. Zato 

naredimo okoli p H območje sprejemanja domneve 

in izven tega območja območje zavračanja domneve 

(tudi kritično območje). 

• Denimo, da je območje zavračanja določeno s 5 % 

vzorcev, ki imajo ekstremne vrednosti deležev 

(2.5 % na levo in 2.5 % na desno). 

306 

•153


• Vzorčna deleža, ki ločita območje sprejemanja od območja 

zavračanja domneve lahko izračunamo takole: 

pˆ 

pˆ 

1,2 

1,2 

= p 

H 

± z 

α 2 

= 0.36 ± 1.96 

p 

H 

⋅(1 

− p 

n 

H 

) 

0.36⋅(1 

− 0.36) 

900 

= 0.36 ± 0.03 

307 


• ... oziroma prikažemo takole: 

pˆ 

pˆ 

308 

•154

14.1 Napaki I. in II. vrste 

309 

• Sprejemanje ali zavračanje domnev po opisanem 

postopku (glej primer 14.1) je lahko napačno v dveh 

smislih: 

α 

1. Napaka I. vrste ( ): 

Če vzorčna vrednost deleža pade v območje 

zavračanja, domnevo p H zavrnemo. Pri tem pa 

vemo, da ob resnični domnevi p H 

obstajajo vzorci, 

ki imajo vrednosti v območju zavračanja. α je 

verjetnost, da vzorčna vrednost pade v območje 

zavračanja ob predpostavki, da je domneva 

resnična. Zato je α verjetnost, da zavrnemo 

pravilno domnevo. To verjetnost imenujemo 

napaka I. vrste. Ta napaka je merljiva in jo lahko 

poljubno manjšamo. 

14.1 Napaki I. in II. vrste / 2 

310 

β 

2. Napaka II. vrste ( ): 

Vzorčna vrednost lahko pade v območje 

sprejemanja, čeprav je domnevna vrednost 

parametra napačna. V primeru, ki ga obravnavamo 

(14.1), naj bo prava vrednost deleža na populaciji 

p=0.40. Tedaj je porazdelitev vzorčnih deležev 

p ⋅(1 

− p) 

N ( p, 

) = N(0.40;0.0163) 

n 

Ker je območje sprejemanja domneve v intervalu 

0.33 

≤ p ≤ 0.39, lahko izračunamo verjetnost, da 

bomo sprejeli napačno domnevo takole: 

β = P[ 0.33 ≤ p ≤ 0.39] = 0.27 

Napako II. vrste lahko izračunamo le, če imamo 

znano resnično vrednost parametra p. Ker ga 

ponavadi ne poznamo, tudi ne poznamo napake II. 

vrste. Zato takšne domneve ne moremo sprejeti. 

•155

14.1 Napaki I. in II. vrste / 3 

• Verjetnost, da bomo sprejeli napačno domnevo 

= P[ 0.33 ≤ p ≤ 0.39] = 0.27 

β 

izračunamo takole: 

Poznamo torej pravo vrednost p=0.40. Zanima nas torej 

ploščina pod krivuljo normalne porazdelitve okrog prave 

vrednosti p za 0.33 

≤ p ≤ 0.39: 

pˆ 

1 

− p 0.33− 

0.40 

z1 

= = = −4.294 

SE( 

pˆ) 

0.0163 

pˆ 

2 

− p 0.39 − 0.40 

z2 

= = = −0.613 

SE( 

pˆ) 

0.0163 

311 

nato pa poiščemo ploščino pod krivuljo standardizirane 

normalne porazdelitve (0.27). 

14.2 Postopek preizkušanja 

domnev 

1. Postavimo ničelno in alternativno domnevo o 

parametru porazdelitve 

H 0 – ničelna domneva je domneva, ki jo v danih 

okoliščinah želimo preizkusiti; 

H 1 – alternativna (osnovna) domneva je domneva, 

ki je z ničelno domnevo nezdružljiva. 

2. Za parameter poiščemo kar se da dobro cenilko (npr. 

nepristransko) in njeno porazdelitev ali porazdelitev 

ustrezne statistike (izraz, v katerem nastopa cenilka). 

α 

3. Izberemo tveganje . Na osnovi izbranega tveganja 

in porazdelitve statistike določimo kritično območje 

oziroma območje zavračanja ničelne domneve. 

312 

•156

14.2 Postopek preizkušanja domnev / 2 

4. Na vzorčnih podatkih izračunamo vrednost statistike. 

5. Sklep: 

• Če vrednost (eksperimentalne) statistike pade v 

kritično območje, ničelno domnevo zavrnemo in 

sprejmemo alternativno domnevo s tveganjem . 

• Če vrednost (eksperimentalne) statistike ne pade 

v kritično območje, ničelne domneve ne moremo 

zavrniti s tveganjem . 

α 

α 

313 

• Slika na naslednji strani prikazuje območje zavrnitve 

ničelne domneve pri preizkušanju domneve o 

populacijskem deležu pri enostranskem oziroma 

dvostranskem testu ter pri tveganju . 

α 


pˆ 

pˆ 

314 

pˆ 

•157


• Primeri domnev: 

• parametrični domnevi dvostranskega testa: 

H : = 12 

0 

1 

μ 

X 

H : μ 

X 

≠ 12 

• parametrični domnevi enostranskega testa: 

H : = 12 

0 

H : σ 

1 

σ 

X 

X 

< 12 

• neparametrični domnevi: 

H : porazdelitev je normalna 

H 

0 

1 

: porazdelitev ni normalna 

315 

14.2.1 Preizkušanje domneve 

o pričakovani vrednosti 

• Če je spremenljivka X porazdeljena normalno, N( X 

, 

X 

), 

z znanim standardnim odklonom σ X 

in neznano 

pričakovano vrednostjo μ X 

in velja ničelna domneva 

H : μ = μ 0 X 0 

potem je statistika 

X − μ 

X 

Z = 

(14.1) 

σ 

X 

n 

porazdeljena standardizirano normalno, Z:N(0,1), kjer 

je X povprečje vzorčnih podatkov ter n velikost vzorca. 

μ 

σ 

316 

•158

14.2.1 Preizkušanje domneve o pričakovani vrednosti / 2 

• Če je spremenljivka X porazdeljena normalno, N( μ 

X 

, σ 

X 

), 

z neznanim standardnim odklonom σ X 

in neznano 

pričakovano vrednostjo in velja ničelna domneva 

H : μ = μ 0 X 0 


X − μ 

X 

T = 

* 

s n 

X 

μ X 

porazdeljena po porazdelitvi t z 

stopnjo. 

ν = n −1 

prostostno 

(14.2) 

317 


318 

Primer 14.2: Vzemimo vzorec sedmih odgovorov glede 

povprečnega števila ur branja dnevnih časopisov na teden iz 

primera 13.5, za katere smo izračunali X = 7 in s *2 

X 

= 3. 67. Pri 

tveganju 10 % preizkusimo domnevo, da je povprečno število ur 

branja dnevnih časopisov v Sloveniji večje od 6 ur tedensko. 

Postavimo ničelno in alternativno domnevo, izračunamo testno 

statistiko, ki jo primerjamo s kritično vrednostjo t: 

H : μ = 6 

0 

1 

X 

H : μ 

X 

X − 

T = 

* 

s 

X 

> 6 

μ X 

7 − 6 

= = 1.378 

n 1.92 7 

Alternativna domneva kaže enostranski test: možnost napake I. 

vrste je le na desni strani porazdelitve t, kjer zavračamo ničelno 

domnevo. Iz preglednice porazdelitve t preberemo, da je 

tα 

= 0 .1, ν = n−1= 

6 

= ± 1.440 . 

Sklep: Statistika T ne pade v kritično območje (T ni večja od t), 

zato ničelne domneve ne moremo zavrniti. 

Odgovor: Pri tveganju 10 % ne moremo trditi, da Slovenci beremo 

dnevne časopise v povprečju več kot 6 ur tedensko. 

•159


Primer 14.3: Koliko tvegamo ob trditi, da drži domneva 

postavljena v primeru 14.2. 

V tem primeru moramo ničelno domnevo zavrniti. To lahko 

zavrnemo le takrat, ko statistika T pade v kritično območje 

(T>t). Torej je potrebno poiskati prvo takšno kritično 

vrednost t, da bo manjša od statistike T. 

Iz preglednice porazdelitve t odčitamo, da je 

1.134 

t α = 0 .15, ν = 6 

= 

S tveganjem 15 % lahko trdimo, da Slovenci beremo dnevne 

časopise v povprečju več kot 6 ur tedensko. 

319 


o razliki pričakovanih vrednosti 

320 

• Če sta slučajni spremenljivki X in Y porazdeljeni 

normalno, N( μ 

X 

, σ 

X 

) in N( μY 

, σ 

Y 

) z znanim enakim 

standardnim odklonom σ X 

= σ Y 

= σ ter neznanima 

pričakovanima vrednostima μ X 

in μ Y 

in velja ničelna 

domneva 

H 

0 

: μ X 

− μ Y 

= δ 


X Y −δ 

Z = 

−1 1 

σ + (14.3) 

n X 

n Y 

porazdeljena standardizirano normalno, kjer sta nX 

in nY 

velikosti vzorcev slučajnih spremenljivk X in Y. 

•160

14.2.2 Preizkušanje domneve o razliki pričakovanih ... / 2 

321 



X 

, σ 

X 

) in N( μY 

, σ 

Y 

) z neznanim, vendar 

enakim standardnim odklonom σ X 

= σ Y 

= σ ter 

neznanima pričakovanima vrednostima μ 

X 

in μY 

in velja 

ničelna domneva 

H 

0 

: μ X 

− μ Y 

= δ 


X −Y 

−δ 

T = 

* 1 1 

s 

p 

+ 

(14.4) 

nX 

nY 

porazdeljena po porazdelitvi t z ν = n X 

+ nY 

− 2 , kjer 

2 2 

oceno variance σ ≈ s p 

izračunamo po enačbi (14.5) na 

naslednji strani. 


• ... če se slučajni spremenljivki X in Y porazdeljujeta 

normalno, z neznanim, vendar enakim standardnim 

odklonom, ocenimo skupno varianco takole: 

s 

*2 

p 

( n 

= 

X 

*2 

−1) 

⋅ sX 

+ ( nY 

−1) 

⋅ s 

n + n − 2 

*2 

s X 

X 

*2 

s Y 

Y 

*2 

Y 

(14.5) 

kjer sta in nepristranski oceni vzorčnih varianc v 

vzorcu X oziroma Y. 

322 

•161


323 

• V primeru, da preizkušamo domnevo o razliki 

pričakovanih vrednosti in da neznana standardna 

odklona nista enaka, je statistika: 

X −Y 

−δ 

T = 

*2 *2 

sX 

sY 

(14.6) 

+ 

n n 

X 

Y 

porazdeljena približno po porazdelitvi t z ν prostostnimi 

stopnjami, ki jih izračunamo takole: 

*2 *2 

2 

⎛ s ⎞ 

X 

sY 

⎜ + 

⎟ 

⎝ nX 

nY 

ν = 

⎠ 

*2 2 *2 2 

( s ) ( ) 

(14.7) 

X 

nX 

sY 

nY 

+ 

n −1 

n −1 

X 

Y 


324 

Primer 14.4: Denimo, da velja sedem odgovorov o povprečnem 

številu ur branja dnevnih časopisov na teden iz primera 13.5 za 

moške (spremenljivka X). Podobno vprašanje smo zastavili šest 

naključno izbranim ženskam ter dobili spodnje rezultate 

(sprememenljivka Y). Predpostavimo, da sta standardna odklona 

populacij enaka. Pri tveganju 5 % preizkusimo domnevo, da obstaja 

razlika v branju dnevnih časopisov med spoloma. 

*2 

*2 

n = 7, X = 7, s = 3.67 n = 6, Y = 4.5, s 3.99 

X 

Postavimo ničelno in alternativno domnevo, po (14.5) ocenimo 

skupno varianco, po (14.4) izračunamo statistiko T in jo primerjamo 

s kritično vrednostjo t pri α 2 = 0.025 in ν n X 

+ n − 2 = 7 + 6 − 2 = 11. 

H : μ − μ = 0 

0 

1 

X 

H : μ − μ ≠ 0 

X 

Y 

Y 

X Y 

Y 

= 

*2 

s p 

= 

Y 

(7 −1) 

⋅3.67 

+ (6 −1) 

⋅3.99 

= 

= 3.81 

7 + 6 − 2 

7 − 4.5 − 0 

T = 

= 2.304 t α 2 = 0.025, ν = 11 

= ± 2. 201 

1 1 

1.95 + 

7 6 

Z gotovostjo 95 % lahko trdimo, da obstaja razlika v branju 

dnevnih časopisov med spoloma v Sloveniji. 

•162


o varianci 

• Denimo, da je spremenljivka X porazdeljena normalno, 

N μ , σ ) , in da velja ničelna domneva 

( 

X X 

H : σ = σ 0 X 0 


*2 

( n −1) 

⋅ s 

H = 

X 

(14.8) 

2 

σ 

0 

2 

porazdeljena po porazdelitvi χ z ν = n −1 

prostostno 

stopnjo. 

Opomba: Pri dvostranskem testu moramo pri odčitku 

2 

kritičnih vrednosti χ iz preglednice upoštevati spodnjo in 

zgornjo kritično vrednost, saj porazdelitev ni simetrična. 

325 

14.2.3 Preizkušanje domneve o varianci / 2 

Primer 14.5: Obravnavajmo podatke iz primera 14.4 o branju 

dnevnih časopisov na teden za moške in ženske skupaj. Iz naših 

podatkov za sedem moških in šest žensk izračunamo varianco 

*2 

s S 

= 3.81 . Podobne raziskave v tujini kažejo, da je standardni 

odklon večji od 1 ure in 30 minut. S tveganjem 10 % preizkusimo, 

ali lahko to trdimo tudi za slovenske razmere. 

Postavimo ničelno in alternativno domnevo, izračunamo testno 

statistiko H po obrazcu (14.8) in jo primerjamo s kritično vrednostjo 

2 

χ : 

H 

0 

1 

: σ 

H : σ 

X 

X 

= 1.5 

> 1.5 

H 

( n −1) 

⋅ 

= 

2 

σ 

0 

*2 

s S 

(13−1) 

⋅3.81 

= 

= 20.32 

2.25 

χ 

2 

1 −α 

= 0.9, ν = 12 

= 

18.549 

326 

Eksperimentalna statistika pade v kritično območje, zato lahko 

ničelno domnevo zavrnemo. S tveganjem 10 % lahko trdimo, da je 

standardni odklon branja dnevnih časopisov na teden v Sloveniji 

večji od ene ure in pol. 

•163


o homogenosti populacij 

• Test homogenosti populacij (tud test F) uporabljamo 

za preizkušanje domneve o enakosti varianc dveh 

populacij. 

• Če sta dve slučajni spremenljivki X in Y porazdeljeni 


X 

, σ 

X 

) in N( μ , z neznanima 

Y 

, σ 

Y 

) 

standardnima odklonoma σ 

X 

in σ 

Y 

, potem je statistika 

*2 2 

sX 

σ 

X 

F = 

*2 2 

(14.9) 

sY 

σ 

Y 

porazdeljena po porazdelitvi F (Fischer-Snedercorjevi 

porazdelitvi) s prostostnima stopnjama ν X 

= n X 

−1 in 

ν Y 

n −1 . 

= Y 

327 

14.2.4 Preizkušanje domneve o homogenosti ... / 2 

• Pri preizkušanju ničelne domneve 

H 

σ = σ 

: 2 2 

0 X Y 

se testna statistika F poenostavi in dobimo: 

s 

F = 

s 

*2 

X 

*2 

Y 

(14.10) 

Statistiko F primerjamo s kritično vrednostjo f, ki jo 

odčitamo iz preglednic. Pri tem je potrebno upoštevati 

navodila na naslednji strani! 

328 

•164

14.2.4 Preizkušanje domneve o homogenosti ... / 3 

Pomembno: 

• Pri odčitku kritične vrednosti f iz preglednic moramo paziti, 

katero vzorčno varianco smo upoštevali v števcu in katero v 

imenovalcu enačbe (14.10): 

• Varianca slučajne spremenljivke, ki je v števcu določa prvo 

2 

število prostostnih stopenj ( σ 

X 

⇒ ν 

X 

ali ν1 

), varianca 

slučajne spremenljivke, ki je v imenovalcu, pa določa drugo 

2 

število prostostnih stopenj ( σ ⇒ ν ali ν ). 

• V preglednicah porazdelitev imamo običajno izračune samo 

za f . Kritično vrednost pa izračunamo po formuli: 

f 

α 

1−α 

2, ν1, 

ν 2 

2, ν1, 

ν 2 

= f 

1 

1−α 

2, ν 2 , ν1 

Y 

f α 2, 

ν1, 

ν 2 

Y 

2 

(14.11) 

329 

14.2.4 Preizkušanje domneve o homogenosti / 3 

Primer 14.6: Vzemimo podatke iz primera 14.4 o branju dnevnih 

časopisov na teden za moške in ženske. S stopnjo zaupanja 0.95 

preizkusimo domnevo, da populaciji nista homogeni (da sta 

standardna odklona na populacijah različna). 

330 

Iz primera (14.4) prevzemimo rezultate vzorčnih varianc: 

*2 

*2 

n X 

7, s = 3.67 n = 6, s 3.99 

= 

X Y 

Y 

= 

Postavimo ničelno in alternativno domnevo, izračunajmo testno 

statistiko F ter jo primerjajmo s kritično vrednostjo f pri ν X 

= 

in = 6 −1 

= 5 prostostnih stopnjah: 

ν Y 

2 2 

H 

0 

: σ 

X 

= σ 

Y 

H : σ ≠ σ 

1 

s 

F = 

s 

2 

X 

*2 

X 

*2 

Y 

2 

Y 

3.67 

= = 0.920 

3.99 

f 

1−α 

2= 

0.975, ν1= 

6, ν 2 = 5 

f 

α 2= 

0.025, ν1= 

6, ν 2 = 5 

= 6.978 

S tveganjem 5 % ne moremo trditi, da je razpršenost branja 

dnevnih časopisov na teden med spoloma različna. 

= 

f 

1 

1−α 

2= 

0.975, ν1= 

5, ν 2 = 6 

7 −1 

= 6 

= 0.167 

•165


o deležu 

331 

• Iz primera 14.1 vemo, da se, ob predpostavki, da 

je slučajna spremenljivka X porazdeljena normalno 

N( μ , ) , vzorčni deleži porazdeljujejo približno 

X 

σ 

X 

normalno pH 

⋅(1 

− pH 

) 

N( 

pH 

, 

) 

n 

Če velja ničelna domneva 

H : p = p 0 0 


pˆ 

− p0 

Z = 

p ⋅(1 

− p ) n 

0 

0 

(14.12) 

porazdeljena po standardizirani normalni porazdelitvi, 

kjer je pˆ delež enot z določeno lastnostjo v vzorcu, 

pa testiran delež. 

p 0 

14.2.5 Preizkušanje domneve o deležu / 2 

Primer 14.7: Vzemimo vzorec 151 majhnih podjetij iz 

primera 13.3, kjer smo izračunali delež obrtnih majhnih 

podjetij pˆ = 0.5. S tveganjem 0.05 preizkusimo domnevo, da 

je delež obrtnih majhnih podjetij v Sloveniji manjši od 0.6. 

Postavimo ničelno in alternativno domnevo, izračunamo 

testno statistiko Z po obrazcu (14.12) in jo primerjamo s 

kritično vrednostjo: 

H 

0 

1 

: p = 0.6 

H : p < 0.6 

Z = 

0 

z α = 0.05 

= − 

pˆ 

− p 

p ⋅(1 

− p ) 

1.645 

0 

0.5 − 0.6 

= 

0.6⋅(1 

− 0.6) 151 

0 

= 

− 

n 

2.508 

S tveganjem 5 % lahko trdimo, da je delež obrtnih majhnih 

podjetij v Sloveniji manjši od 60 %. 

332 

•166


o razliki deležov 



X 

, σ 

X 

) in N( μY 

, σ 

Y 

) in če velja ničelna 

domneva 

H : 

0 

p X 

− p 

= δ 


Z = 

Y 

pˆ 

X 

− pˆ 

Y 

p ⋅(1 

− p) 

⋅(1 

n 

−δ 

X 

+ 1 n 

Y 

) 

(14.13) 

porazdeljena standardizirano normalno, kjer sta pˆ 

X 

in pˆ 

Y 

vzorčna deleža, pX 

in pY 

deleža v populacijah, p pa je 

skupen populacijski delež, ki ga ocenimo ... 

333 

14.2.6 Preizkušanje domneve o razliki deležev / 2 

• V primeru, da velja ničelna domneva pX = pY 

= p, 

ocenimo populacijski delež z obteženim povprečenjem 

vzorčnih deležev pˆ in pˆ : 

n 

p = 

X 

p 

n 

X 

X 

X 

+ nY 

p 

+ n 

Y 

Y 

Y 

k 

= 

n 

(14.14) 

kjer sta k 1 in k 2 števili elementov prvega oz. drugega 

vzorca z določeno lastnostjo. 

X 

X 

+ k 

+ n 

Y 

Y 

334 

•167

14.2.6 Preizkušanje domneve o razliki deležev / 3 

Primer 14.8: Želimo preveriti, ali je predsedniški kandidat različno 

priljubljen med mestnimi in vaškimi prebivalci. Zato smo izbrali dva 

slučajna vzorca: od 300 vprašanih iz mesta bi jih 90 glasovalo za 

kandidata, od 200 vprašanih iz vasi pa bi za kandidata glasovalo 40 

vaščanov. Domnevo, da je predsedniški kandidat različno priljubljen 

pri teh dveh skupinah preverimo pri tveganju 10 %. 

n 300 , k = 90 n = 200, k = 40 

X 

= 

X 

Y 

Y 

Postavimo ničelno in alternativno domnevo, po obrazcu (14.14) 

izračunamo skupni populacijski delež, izračunamo testno statistiko po 

(14.13), ki jo primerjamo s kritično vrednostjo (dvostranski test): 

H 

Z = 

0 

1 

: p 

X 

H : p 

X 

− p 

− p 

Y 

Y 

pˆ 

X 

= 0 

≠ 0 

− pˆ 

Y 

p ⋅(1 

− p) 

⋅(1 

n 

X 

+ 1 n 

Y 

k 

p = 

n 

= 

) 

X 

X 

+ k 

+ n 

Y 

Y 

90 + 40 

= = 0.26 

300 + 200 

0.30 − 0.20 

= 2.497 

0.26⋅(1 

− 0.26) ⋅(1 300 + 1 200) 

335 

z α 2 = 0.05 

= ± 

1.645 

S tveganjem 10 % lahko trdimo, da je predsedniški kandidat različno 

priljubljen med vaščani in meščani. 

15. BIVARIATNA ANALIZA 

15.1 Uni- in bivariatna analiza 

• V prejšnjih poglavjih statistične analize je bila vsa 

pozornost namenjena eni opazovani spremenljivki. 

• V stvarnem svetu pa se pogosto pojavijo vprašanja kot 

so, na primer: 

• Zakaj imajo spremenljivke takšne lastnosti? 

• V kakšnem odnosu je opazovana spremenljivka z 

drugimi spremenljivkami? 

• Kako se bodo spreminjale vrednosti spremenljivk, če 

spreminajmo vrednost neke druge, z njo povezane 

spremenljivke? 

336 

• Na takšna vprašanja poskušamo odgovoriti z metodami 

bivariatne analize (“bis” (latinsko) = dvakrat). 

•168

15.1 Uni- in bivariatna analiza / 2 

• Bivariatna analiza, za razliko od univariatne analize, 

ugotavlja kvantiteto in kvaliteto odnosa med dvema 

spremenljivkama. 

• Pomembna kakovostna razlika med obema analizama je 

v obsegu znanja oziroma vedenja o lastnostih 

proučevane populacije na začetku ene in druge analize: 

• V univariatno analizo vstopimo na podlagi načrta statistične 

analize, toda samo populacijo (opazovane spremenljivke) 

spoznamo šele med urejanjem podatkov, ugotavljanjem 

središčne težnje, razpršenosti itd. 

• Drugače je na vhodu bivariatne analize. Tukaj moramo 

imeti znanje o domnevnih lastnostih populacije po 

opazovanih dveh spremenljivkah. 

337 

15.1 Uni- in bivariatna analiza / 3 

338 

• Znanje o domnevnih lastnostih populacije, ki ga 

moramo imeti ob vstopu v bivariatno analizo je lahko 

rezultat: 

• informacij, ki jih pridobimo z univariatno analizo obeh 

spremenljivk; 

• teoretičnega znanja in 

• izkušenj. 

• Poznamo metode bivariatne analize za ugotavljanje 

statističnega razmerja med nominalnimi, ordinalnimi in 

številskimi spremenljivkami. 

• V nadaljevanju si bomo pogledali nekaj metod 

ugotavljanja statistične povezanosti med: 

• dvema nominalnima ter 

• med dvema številskima spremenljivkama. 

•169

15.2 Preizkušanje domneve o 

povezanosti dveh 

nominalnih spremenljivk 

• Problem preizkušanja domneve o povezanosti (tudi 

statistični odvisnosti) si poglejmo na konkretnem 

primeru. 

• Primer 15.1: Zanima nas, ali je vrsta napake pri 

geodetskih izmerah (slučajna spremenljivka Y) 

statistično odvisna od delovnih izkušenj (slučajna 

spremenljivka X); oziroma ali sta slučajni spremenljivki 

X in Y povezani. V ta namen smo naključno zbrali 

podatke 23-tih takšnih primerov po naključno izbranih 

geodetskih izpostavah Slovenije ter tveganje 5 %. 

339 

Podatke uredimo v dvodimenzionalno frekvenčno 

porazdelitev. Takšno preglednico imenujemo tudi 

kontingenčna preglednica. 

15.2 Preizkušanje domneve o povezanosti dveh nominalnih ... / 2 

• V kontingenčni preglednici praviloma zapišemo 

neodvisno spremenljivko v stolpce, odvisno pa v vrstice. 

< 10 let ≥10 let 

skupaj 

manjše napake 

4 

8 

12 

grobe napake 

9 

2 

11 

skupaj 

13 

10 

23 

340 

•170


• Zanima nas, ali strokovni kolegi z manj delovnih izkušenj 

v splošnem delajo več grobih napak od tistih z daljšim 

delovnim stažem, zato moramo porazdelitev napak pri 

mlajših primerjati s porazdelitvijo pri starejših kolegih. 

Ker je število manj izkušenih različno od števila bolj 

izkušenih kolegov, moramo zaradi primerjave izračunati 

relativne frekvence. 

< 10 let ≥10 let 

skupaj 


30.8 

80 

52.2 


69.2 

20 

47.8 

skupaj 

100 

100 

100 

341 


• Če med manj in bolj izkušenimi ne bi bilo razlik, bi bili 

obe porazdelitvi (za tiste, ki imajo manj kot 10 let 

izkušenj, in za tiste, ki imajo več kot 10 let izkušenj) 

enaki porazdelitvi pod “skupaj”. 

• Naš primer kaže, da se odstotki razlikujejo, na primer: 

le 20 % grobih napak so naredili starejši kolegi, in kar 

69.2 % grobih napak so naredili tisti z manj kot 10 let 

delovnih izkušenj. 

• Odstotki pri manjših napakah pa kažejo ravno obratno: 

več manjših napak naredijo starejši kolegi. 

• Že sam pregled relativnih frekvenc (po stolpcih) kaže, 

da sta spremenljivki povezani med seboj. 

342 

•171


• Relativne frekvence lahko izračunamo tudi po vrsticah: 

< 10 let ≥10 let 

skupaj 


33.3 

66.7 

100 


81.8 

18.2 

100 

skupaj 

56.5 

43.5 

100 

• Relativne frekvence lahko prikažemo s stolpci ali s krogi. 

343 


• Kontingenčna preglednica kaže podatke za slučajen 

vzorec. Zato nas zanima, ali so razlike v porazdelitvi 

vrste napake pri geodetskih izmerah glede na delovne 

izkušnje statistično značilne in ne le učinek vzorca. 

• Postavimo ničelno in alternativno domnevo: 

H 

0 

1 

: spremenljivki nista 

povezani(sta neodvisni) 

H :spremenljivki sta povezani(sta odvisni) 

• Za preizkušanje domneve o povezanosti med dvema 

nominalnima spremenljivkama na osnovi vzorčnih 

podatkov, podanih v dvorazsežni frekvenčni porazdelitvi 

2 

(kontingenčni preglednici), lahko uporabimo test χ . 

344 

•172


345 

2 

χ 

• Test sloni na primerjavi empiričnih (dejanskih) 

frekvenc s teoretičnimi frekvencami, ki so v tem primeru 

frekvence, ki bi bile v kontingenčni preglednici, če 

spremenljivki ne bi bili povezani med seboj. 

• V našem primeru to pomeni, da bi bili porazdelitvi vrste 

napak in delovnih izkušenj enaki. 

• Če spremenljivi nista povezani med seboj, so verjetnosti 

hkratne zgoditve posameznih vrednosti prve in druge 

slučajne spremenljivke enake produktu verjetnosti 

posameznih vrednosti. Na primer, verjetnost, da bo 

strokovni kolega mlajši od 10 let naredil grobo napako 

je: 

P[ 

ML] 

= 13 23 = 0.565 P[ 

GN] 

= 11 23 = 0.478 

P[ 

ML ∩GN] 

= P[ 

ML] 

⋅ P[ 

GN] 

= 0.270 


• Teoretične frekvence pa dobimo tako, da verjetnost 

hkratnega dogodka pomnožimo s številom vseh enot v 

vzorcu; na primer: 

13 11 

n⋅ 

P[ ML ∩GN] 

= 23⋅ 

⋅ = 6.217 

23 23 

• Podobno izračunamo teoretične frekvence za druge 

hkratne dogodke oziroma celice v kontingenčni 

preglednici: 

n 

ij 

= n⋅ 

P[ X = xi 

∩Y 

= y 

j 

] = n⋅ 

P[ 

X = xi 

] ⋅ P[ 

Y = y 

j 

] 

(15.1) 

346 

•173


• Če teoretične frekvence zaokrožimo na cela števila, je 

preglednica izračunanih teoretičnih frekvenc : 

n ij 



skupaj 

< 10 let ≥10 let 

7 

5 

6 

5 

13 

10 

skupaj 

12 

11 

23 

• Spomnimo se empiričnih (dejanskih) frekvenc : 

nˆij 



skupaj 

< 10 let ≥10 let 

4 

8 

9 

2 

13 

10 

skupaj 

12 

11 

23 

347 


• Statistiko H, ki primerja dejanske s teoretičnimi 

frekvencami, izračunamo takole: 

H = 

k 

∑ 

i= 

1 

( n 

ij 

− nˆ 

) 

n 

ij 

ij 

2 

(15.2) 

348 

kjer je k število celic v kontingenčni preglednici. 

2 

χ 

• Statistika H se porazdeljuje po porazdelitvi s 

ν = ( s −1) 

⋅( 

v −1) 

prostostnimi stopnjami, kjer je s število 

stolpcev in v število vrstic v kontingenčni preglednici. 

• Ničelna in alternativna domneva sta v primeru testa : 

H 

0 

: χ 

H : χ 

1 

2 

2 

= 0 

> 0 

(spremenljivki nista 

(spremenljivki sta 

povezani) 

povezani) 

2 

χ 

•174


• Izračunajmo torej H-je in jih primerjajmo s teoretično 

2 

vrednostjo χ pri ( s −1) 

⋅( 

v −1) 

= (2 −1) 

⋅(2 

−1) 

= 1 prostostni 

stopnji in tveganju 0.05 : 

k 

2 

ˆ 

2 

2 

2 

2 

( nij 

− nij 

) (7 − 4) (5 −8) 

(6 − 9) (5 − 2) 

H = ∑ = + + + 

n 7 5 6 5 

i= 

1 

ij 

= 6.386 

Opomba: Za bolj točen izračun statistike H teoretičnih frekvenc ne 

zaokrožujemo (v našem primeru bi bila statistika H=5.490). 

2 

χ α = 0 .05, ν = 1 

= 

3.841 

Statistika H pade v kritično območje, zato lahko ničelno 

domnevo zavrnemo. S tveganjem 5 % lahko trdimo, da 

sta slučajni spremenljivki statistično značilno povezani. 

349 


• Statistika H je lahko le pozitivna: zavzame lahko le 

vrednosti v intervalu [ 0, H 

max] 

, kjer je H 

max 

= n⋅( 

k −1) 

, 

če je k = min( v, 

s) 

. 

• Dokazati se da, da nobena od teoretičnih frekvenc ne 

sme biti premajhna. Veljata naslednji omejitvi: 

• če je več kot 20 % teoretičnih frekvenc manjših od 

5, je treba združevati sosednje celice; 

• za kontingenčne preglednice dimenzij 2x2 (v=2, 

s=2) smemo izračunati statistiko H samo za vzorce, 

kjer je n > 40; če je 20 < n < 40 , se sme statistika H 

izračunati le v primeru, da nobena od teoretičnih 

frekvenc ni manjša od 5. 

350 

•175


• Statistika H v splošnem ni primerljiva. Za primerjavo je 

definiranih več kontingenčnih koeficientov: 

• Pearsonov koeficient: 

2 H 

φ = 

n 

2 

ki ima zgornjo mejo φ = k −1 

. 

max 

• Cramerjev koeficient: 

2 

φ H 

α = = 

k −1 

n⋅( 

k −1) 

ki je definiran na intervalu [0,1]. 

(15.3) 

(15.4) 

351 


• ... več koeficientov: 

• Kontingenčni koeficient: 

H 

C = 

H + n 

ki je definiran na intervalu [0,C max ], kjer je 

k −1 

Cmax 

= 

k 

. 

(15.5) 

352 

•176

15.3 Preizkušanje domneve o 

povezanosti dveh 

številskih spremenljivk 

• Primer 15.2: Obravnavajmo dve številski spremenljivki: 

X – zračna oddaljenost poslovnega prostora od 

središča mesta 

Y – cena za m 2 poslovnega prostora izražena v točkah 

• Grafično lahko ponazorimo povezanost med dvema 

številskima spremenljivkama z razsevnim grafikonom. 

To je, da v koordinatni sistem, kjer sta koordinati obe 

spremenljivki, vrišemo enote s pari vrednosti 

(koordinatnimi pari). 

353 

15.2 Preizkušanje domneve o povezanosti dveh številskih ... / 2 

Če privzamemo spodnje podatke za primer 15.2, lahko 

grafično ponazorimo povezanost med ceno za m 2 poslovnega 

prostora (X) in zračno oddaljenostjo od središča mesta (Y). 

X 

210 

30 

60 

110 

20 

330 

270 

30 

80 

390 

Y 

60 

98 

88 

77 

90 

66 

72 

95 

75 

67 

Y : cena za m 2 poslovnega prostora (točke) 

110 

100 

90 

80 

70 

60 

50 

0 50 100 150 200 250 300 350 400 450 

X : zračna oddaljenost poslovnega prostora od središča mesta (m) 

354 

•177


• Poznamo več tipov povezanosti številskih spremenljivk: 

• funkcijska povezanost, kjer vse točke v 

razsevnem grafikonu ležijo na krivulji; 

• korelacijska (stohastična) povezanost, kjer se 

točke v razsevnem grafikonu od neke krivulje bolj 

ali manj odklanjajo (manjša ali večja povezanost). 

355 


• Primeri linearne povezanosti spremenljivk: 

356 

X 

•178


• Primer nelinearne povezanosti spremenljivk: 

357 


• Linearno povezanost med dvema spremenljivkama 

merimo s kovarianco: 

N 

1 

CXY 

= ∑( 

xi 

− μ 

X 

) ⋅( 

yi 

− μY 

) 

(15.6) 

N i= 

1 

Opomba: Ko varianco računamo iz vzorca, jo 

označimo s s XY . 

• Za kovarianco velja: 

C XY 

C XY 

C XY 

> 0 

= 0 

< 0 

pozitivna linearna povezanost 

ni linearne povezanosti 

negativna linerana povezanost 

358 

•179


• S kovarianco redko primerjamo linearno povezanost več 

parov spremenljivk. Brezdimenzijska mera linearne 

povezanosti je Pearsonov koeficient korelacije: 

ρ 

XY 

CXY 

= 

σ ⋅σ 

X 

Y 

= 

∑i 

N 

∑ ( 

i= 

1 

N 

= 1 

( x − μ ) ⋅( 

y 

i 

i 

(15.7) 

• Koeficient korelacije leži na intervalu [-1,1]; velja: 

ρ XY 

≈1 močna pozitivna linearna povezanost (z večanjem 

vrednosti spremenljivke X se večajo tudi vrednosti Y); 

ρ XY 

≈ 0 ni linearne povezanosti; 

ρ XY 

≈ −1 močna negativna linearna povezanost (z večanjem 

vrednosti spremenljivke X se manjšajo vrednosti Y). 

X 

X 

2 

x − μ ) ⋅ 

∑ 

N 

i 

i= 

1 

− μ ) 

i 

Y 

2 

( y − μ ) 

Y 

359 


• Primeri linearne povezanosti spremenljivk in 

koeficientov korelacije: 

r = 0.9059 

= −0. 9428 

XY 

r XY 

r = 0.7353 

r XY 

= 0. 0189 

XY 

360 

•180


Primer 15.3: Izračunajmo korelacijo ter koeficient korelacije za 

podatke o oddaljenosti poslovnih prostorov od središča mesta ter 

njihovi ceni za kvadratni meter iz primera 15.2. 

Korelacijo in korelacijski koeficient izračunamo po obrazcih (15.6) in 

(15.7) z upoštevanjem, da imamo vzorec podatkov: 

X 

210 

Y 

60 

x i 

− X 

57 

y i 

− Y ( x − X ) ⋅( 

y −Y 

) 

-18.8 

i 

-1071.6 

i 

30 

98 

-123 

19.2 

-2361.6 

60 

110 

20 

330 

270 

30 

80 

390 

88 

77 

90 

66 

72 

95 

75 

67 

-93 

-43 

-133 

177 

117 

-123 

-73 

237 

9.2 

-1.8 

11.2 

-12.8 

-6.8 

16.2 

-3.8 

-11.8 

-855.6 

77.4 

-1489.6 

-2265.6 

-795.6 

-1992.6 

277.4 

-2796.6 

s 

r 

XY 

XY 

n 

1 

= ∑( 

xi 

n 

i= 

1 

sXY 

= 

s ⋅ s 

X 

Y 

− X ) ⋅( 

y 

i 

−Y 

) = −1327.4 

−1327.4 

= 

= −0.819 

129.696⋅12.496 

Pozor: Upoštevamo standardne odklone vzorca 

(in ne nepristranske ocene). 

361 

Obstaja dokaj močna negativna korelacija med oddaljenostjo 

poslovnih prostorov od središča mesta ter njihovo ceno za m 2 . 


• Postavimo ničelno in alternativno domnevo: 

H : ρ = 0 (spremenljivki nista linearnopovezani) 

0 

H : ρ 

1 

XY 

XY 

≠ 0 

(spremenljivki sta linearno povezani) 

Tedaj se statistika T 

rXY 

⋅ n − 2 

T = 

(15.8) 

2 

1− 

rXY 

porazdeljuje po Studentovi porazdelitvi t z ν = n − 2 

prostostnima stopnjama. Z r XY 

označujemo koeficient 

korelacije na vzorcu, z ρ XY pa koeficient korelacije na 

populaciji. 

362 

•181


Primer 15.4: Pri tveganju 5 % preizkusimo domnevo, da sta 

oddaljenost poslovnih prostorov od središča mesta ter njihova cena 

za kvadratni meter iz primera 15.2 linearno povezana med seboj. 

Postavimo ničelno in alternativno domnevo, po (15.8) izračunamo 

statistiko T, iz preglednice porazdelitve t pa odčitamo vrednost za t 

kritično pri = 0.05 in prostostnih stopnjah: 

H : ρ 

0 

H : ρ 

1 

XY 

XY 

= 0 

≠ 0 

α ν = 10 − 2 = 8 

− 0.819⋅ 

10 − 2 

T = 

= −4.037 

t α 2 = 0.025, ν = 8 

= ± 2. 306 

2 

1− 

( −0.819) 

Eksperimentalna vrednost (statistika T) pade v kritično območje, 

zato lahko ničelno domnevo zavrnemo in sprejmemo alternativno 

domnevo. 

S tveganjem 5 % lahko trdimo, da je oddaljenost poslovnih 

prostorov od središča mesta linearno povezana s ceno za m 2 

poslovnega prostora. 

363 

15.4 Regresija 

• Regresijska funkcija Y ˆ = f ( X ) kaže, kakšen vpliv bi 

bil vpliv spremenljivke X na Y, če razen vpliva 

spremenljivke X ne bi bilo drugih vplivov na 

spremenljivko Y. 

• Ker so ponavadi še drugi vplivi na proučevano 

spremenljivko Y, se točke, ki predstavljajo enote v 

razsevnem grafikonu, odklanjajo od idealne regresijske 

krivulje: 

Y = Yˆ 

+ ε = f ( X ) + ε 

(15.9) 

kjer X imenujemo neodvisna spremenljivka, Y odvisna 

spremenljivka ter ε napaka (ali motnja, disturbanca). 

364 

•182

15.4 Regresija / 2 

• Če je regresijska funkcija linearna: 

Y ˆ = f ( X ) = a + bX 

(15.10) 

je regresijska odvisnost 

Y = Yˆ 

+ ε = a + bX + ε 

(15.11) 

oziroma z i-to enoto 

y = yˆ 

+ ε = a + bx + ε 

i 

i 

i 

i 

i 

(15.12) 

365 


• Regresijsko odvisnost nazorno prikažemo v razsevnem 

grafikonu: 

y i 

ŷ i 

} 

ε i 

Y ˆ = a + bX 

x i 

366 

•183


• Regresijsko funkcijo lahko v splošnem zapišemo: 

Y ˆ = f ( X , a, 

b,...) 

kjer so a, b, ... parametri funkcije. 

(15.13) 

• Ponavadi se moramo na osnovi razsevnega grafikona 

odločiti za tip regresijske funkcije in nato oceniti 

parametre funkcije, tako da se regresijska krivulja kar se 

da dobro prilega točkam. Kot merilo prilagojenosti 

krivulje točkam vzamemo 

N 

∑ 

i= 

1 

N 

2 

εi 

= ∑( 

yi 

i= 

1 

− yˆ 

) 

i 

2 

= min 

(15.14) 

367 

• To metodo ocenjevanja parametrov regresijske funkcije 

imenujemo metoda najmanjših kvadratov. 

15.4.1 Linearna regresija 

• V primeru linearne regresijske funkcije Y ˆ = a + bX 

lahko ocenimo parametra a in b po metodi najmanjših 

kvadratov takole: 

N 

2 

2 

S = ∑ε 

= ∑( 

− ˆ ) = ∑ 

i 

yi 

yi 

( yi 

i= 

1 

N 

i= 

1 

N 

i= 

1 

− aˆ 

− bˆ 

x ) 

i 

2 

= min 

(15.15) 

368 

• Minimum funkcije S lahko določimo tako, da parcialno 

odvajamo po obeh parametrih ∂S 

∂S 

= 0 , = 0 

∂aˆ 

∂bˆ 

Dobimo sistem dveh linearnih enačb, iz katerih 

izračunamo cenilki â in bˆ : 

s 

s 

bˆ 

XY 

XY 

= , aˆ 

= Y − ⋅ X 

2 2 

s 

s 

X 

X 

(15.16) 

•184

15.4.1 Linearna regresija / 2 

• Dokazati se da, da so vse tri cenilke Yˆ, 

aˆ 

in bˆ 

nepristranske, kar pomeni, da je njihova pričakovana 

vrednost enaka pravi vrednosti parametra. 

2 

σ Y 

• Njihove variance so odvisne od variance , povprečja 

2 

vzorca X in variance vzorca : 

2 

2 

σ ⎛ ⎞ 

= = 

Y 

X 

E( aˆ) 

a, 

D( aˆ) 

⋅ ⎜1 

+ 

⎟ 

2 

n ⎝ sX 

⎠ 

2 

σ 

Y 

E( 

bˆ) 

= b, 

D( 

bˆ) 

= 

2 

n⋅ 

sX 

2 

2 

σ ⎛ 

Y 

( x0 

− X ) 

E( 

Yˆ( 

x = + 

= ⋅ 

⎜ 

0)) 

a bx0, 

D( 

Yˆ( 

x0)) 

1+ 

2 

n ⎝ sX 

s X 

⎞ 

⎟ 

⎠ 

(15.17) 

(15.18) 

(15.19) 

369 


• Porazdelitev cenilk Yˆ, 

aˆ 

in bˆ 

je v primeru, da 

poznamo, normalna. 

2 

σ Y 

2 

σ Y 

• Ker variance običajno ne poznamo, jo moramo 

oceniti: 

2 n 2 2 

ˆ σ 

Y 

= ⋅ sY 

⋅(1 

− rXY 

) 

n −1 

(15.17) 

2 

2 

• Cenilka je porazdeljena po porazdelitvi χ σˆY 

z ν = n − 2 


2 

σ Y 

• V primeru, ko variance ne poznamo, so cenilke 

Yˆ, 

aˆ 

in bˆ 

porazdeljene po studentovi porazdelitvi t z 

ν = n − 2 prostostnima stopnjama. 

370 

•185


• Sedaj lahko zapišemo intervale zaupanja za vse zgoraj 

navedene cenilke. 

• Interval zaupanja za vrednost Y( x 0 

) je tako: 

⎡ 

⎢aˆ 

+ bˆ 

⋅ x0 

− t 

⎢ 

P⎢ 

⎢ 

⎢ 

⎢aˆ 

+ bˆ 

⋅ x0 

+ t 

⎢⎣ 

1−α 

2 

1−α 

2 

ˆ σ 

Y 

⋅ ⋅ 

n 

≤ Y( 

x ) ≤ 

0 

ˆ σ 

Y 

⋅ ⋅ 

n 

( x 

1+ 

0 

( x 

1+ 

0 

− X 

2 

s 

X 

− X 

2 

s 

X 

2 

2 

) 

) 

2 

2 

⎤ 

⎥ 

⎥ 

⎥ = 1−α 

⎥ 

⎥ 

⎥ 

⎥⎦ 

(15.18) 

371 

X 


Primer 15.5: Vzemimo podatke iz primera 15.2 o oddaljenosti 

poslovnih prostorov od središča mesta ter njihovi ceni za kvadratni 

meter. Ocenimo parametra regresijske premice, ki se opazovanjem 

najbolje prilega. 

V primeru (15.3) smo že izračunali kovarianco s XY 

= −1327.4 , 

parametra regresijske premice pa ocenimo po obrazcih (15.16): 

210 

30 

60 

110 

20 

330 

270 

30 

80 

390 

Y 

60 

98 

88 

77 

90 

66 

72 

95 

75 

67 

2 

( x i 

− X ) 

3249 

15129 

8649 

1849 

17689 

31329 

13689 

15129 

5329 

56169 

2 

( y i 

−Y ) 

353.44 

368.64 

84.64 

3.24 

125.44 

163.84 

46.24 

262.44 

14.44 

139.24 

s 

2 

X 

⎛ 

⎜ s 

⎝ 

2 

Y 

1 

= 

n 

1 

= 

n 

ˆ s 

b = 

s 

XY 

2 

X 

n 

∑ 

i= 

1 

n 

∑ 

i= 

1 

s 

aˆ 

= Y − 

s 

( x 

XY 

2 

X 

i 

( y 

− X ) 

i 

2 

−Yˆ) 

2 

= 16821 

⎞ 

= 156.16⎟ 

⎠ 

-1327.4 

= = -0.079 

16821 

-1327.4 

⋅ X = 78.8 − ⋅153 

= 90.874 

16821 

372 

Regresijska premica ima obliko: 

Yˆ 

= 90.874 − 0. 079X 

•186

15.4.2 Statistično sklepanje o 

regresijskem koeficientu 

373 

• Vpeljimo naslednje oznake: 

Y ˆ = a + bX - regresijska premica na populaciji 

Yˆ = aˆ 

+ bX ˆ - regresijska premica na vzorcu 

• Denimo, da želimo preizkusiti domnevo o regresijskem 

koeficientu b. Postavimo ničelno in alternativno 

domnevo: 

H0 

: b = b0 

H1 

: b ≠ b0 

• Nepristranska cenilka za regresijski koeficient b je ˆ sXY 

b = , 

2 

ki ima pričakovano vrednost in standardno napako: sX 

E( 

bˆ) 

= b, 

ˆ 

sY 

SE(b) = 

s 

X 

1− 

r 

2 

XY 

n − 2 

15.4.2 Statistično sklepanje o regresijskem koeficientu / 2 

• Testna statistika za ničelno domnevo o regresijskem 

koeficientu je: 

s 

T = 

s 

Y 

X 

n − 2 

⋅( 

bˆ 

− b0 

) 

2 

1− 

r 

ki se porazdeljuje po porazdelitvi t z 


XY 

ν = n − 2 

(15.19) 

374 

•187

15.4.2 Statistično sklepanje o regresijskem koeficientu / 3 

Primer 15.6: Vzemimo podatke iz primera 15.2 (X - oddaljenost 

poslovnih prostorov od središča mesta, Y - cena za kvadratni meter). 

Pri tveganju 5 % preizkusimo domnevo, da je regresijski koeficient 

različen od 0. 

V primeru (15.5) smo že izračunali regresijski koeficient ˆ = -0.079 . 

Postavimo ničelno in alternativno domnevo, po obrazcu (15.18) 

izračunamo testno statistiko T , iz preglednice porazdelitve t pa 

odčitamo vrednost za t kritično pri α = 0.05 in ν = 10 − 2b 

= 8 

prostostnih stopnjah. 

H 

0 

1 

: b = 0 

H : b ≠ 0 

sX 

n − 2 ˆ 129.696⋅ 

10 − 2 

T = ⋅( 

b − b0 

) = 

2 

2 

s 1− 

r 

12.496⋅ 

1− 

( −0.819) 

Y 

XY 

t α 2 = 0.025, ν = 8 

= ± 

2.306 

⋅( 

−0.079 

− 0) = −4.042 

375 

S tveganjem 5 % lahko trdimo, da je regresijski koeficient različen 

od 0. 

15.4.3 Pojasnjena varianca 

• Vrednost odvisne spremenljivke y i lahko razstavimo na 

tri komponente: 

y = μ 

i 

Y 

+ (yˆ 

-μ 

i 

Y 

) + (y − yˆ 

) 

i 

i 

(15.20) 

kjer so pomeni posameznih komponent: 

μ Y 

: rezultat splošnih vplivov 

ŷ -μ : rezultat vpliva spremenljivke X 

i Y 

y − yˆ 

: rezultat vpliva drugih dejavnikov 

i 

i 

376 

•188

15.4.3 Pojasnjena varianca / 2 

• Če enakost (15.20) najprej na obeh straneh enačaja 

kvadriramo, nato seštejemo po vseh enotah in nato 

delimo s številom enot (N), dobimo: 

1 

N 

N 

∑ 

i= 

1 

( y 

i 

− μ ) 

Y 

i= 

1 

• To lahko zapišemo tudi takole: 

2 

1 

= 

N 

N 

∑ 

2 

( yˆ 

− μ ) 

i 

Y 

1 

+ 

N 

N 

∑ 

i= 

1 

( y 

i 

− yˆ 

) 

i 

2 

(15.21) 

σ + 

2 2 

Y 

= σ Y ˆ 

2 

σ ε 

(15.22) 

377 

kjer posamezni členi pomenijo: 

2 

σ Y : celotna varianca spremenljivke Y 

2 

σ Ŷ 

: pojasnjena varianca spremenljivke Y 

2 

: nepojasnjena varianca spremenljivke Y 

σ ε 


• Delež pojasnjene variance spremenljivke Y s 

spremenljivko X je: 

Imenujemo ga determinacijski koeficient in je 

definiran na intervalu [0, 1]. 

• Pokazati se da, da je v primeru linearne regresijske 

odvisnosti determinacijski koeficient enak 

kjer je 

ρ XY 

R 

2 

σ 

= 

σ 

2 

Yˆ 

2 

Y 

2 2 

R = ρ XY 

koeficient korelacije. 

(15.23) 

(15.24) 

378 

•189


• Kvadratni koren iz nepojasnjene variance 

imenujemo standardna napaka regresijske ocene, 

ki meri razpršenost točk okoli regresijske krivulje. 

• Standardna napaka (regresijske) ocene meri 

kakovost ocenjevanja vrednosti odvisne spremenljivke z 

regresijsko funkcijo. 

• V primeru linearne regresijske odvisnosti je standardna 

napaka enaka: 

σ ε 

σ ε 

σ ε 

= σ Y 

ρ 

2 

1− 

XY 

(15.25) 

379 


Primer 15.7: Vzemimo podatke iz primera 15.2 o oddaljenosti 

poslovnih prostorov od središča mesta ter njihovi ceni za kvadratni 

meter. Z linearno regresijsko funkcijo ocenimo, koliko bi stal poslovni 

prostor na oddaljenosti 500 m od središča mesta, če predpostavimo 

enake pogoje kot v primeru 15.2. Kolikšna je standardna napaka? 

Kolikšen delež variance cene za kvadratni meter poslovnega prostora 

lahko pojasnimo z oddaljenostjo od središča mesta? 

Regresijsko premico smo že izračunali v primeru (15.5), koeficient 

korelacije ter standardni odklon vzorca Y pa v primeru (15.3): 

Y ˆ = 90.874 − 0.079X 

= 90.874 − 0.079⋅500 

= 51.374 

σ ε 

2 

= s Y 

1− 

rXY 

= 12.496⋅ 

1− 

( −0.819) 

2 

= 7.17 

Kvadratni meter poslovnega prostora na oddaljenosti 500 m od 

središča mesta, bi stal 51.4 točke, pri čemer je standardna napaka 

7.17 točke. 

380 

R 

2 2 

= r XY 

= ( −0.819) 

2 

= 0.671 

67 % variance cene za kvadratni meter poslovnega prostora lahko 

pojasnimo z oddaljenostjo od središča mesta. 

•190

Literatura 

381 

• Benjamin, J.R.; Cornell, C.A.: Probability, Statistics, and Decision 

for Civil Engineers, McGraw-Hill, 1970. 

• Blejec, M.: Statistične metode za ekonomiste, Ekonomska 

fakulteta, Univerza v Ljubljani, Ljubljana, 1976. 

• Drobne S., Turk, G.: Statistika – Vaje, Fakulteta za gradbeništvo 

in geodezijo, Univerza v Ljubljani, Ljubljana, 2002. 

• Ferligoj, A.: Osnove statistike na prosojnicah, samozaložba, 

Ljubljana, 1995 (na voljo v fotokopirnici UL, FDV). 

• Jamnik, R.: Verjetnostni račun in statistika, DMFA Slovenije, 

1986. 

• Kirk, E.R.: Statistics, An Introduction, Harcourt Brace College 

Publishers, New York, 1999. 

• Košmelj, B.: Vaje iz statistike II, Ekonomska fakulteta v Ljubljani, 

Univerza v Ljubljani, Ljubljana, 1993. 

Literatura / 2 

• Košmelj, B., Arh, F., Doberšek Urbanc, A., Ferligoj, A., Omladič 

M.: Statistični terminološki slovar, Statistično društvo Slovenije, 

Statistični urad Republike Slovenije, 2001. 

• Košmelj, K.: Uporabna statistika, Biotehniška fakulteta, Univerza 

v Ljubljani, Ljubljana, 2001. 

• Moore, D.S.; McCabe, G.P.: Introduction to the Practice of 

Statistics, W. H. Freeman and Company, New York, 1998. 

• Spiegel, M.R: Statistics, Schaum’s Outlines, McGraw-Hill, New 

York, 1998. 

• Vadnal, A.: Elementarni uvod v verjetnostni račun, DZS, 1979. 

• Walpole, R. E.; Myres, R.H.; Myres, S.L.: Probability and 

Statistics for Engineers and Scientists, Prentice Hall 

International, Inc. New Jersey, 1998. 

382 

•191

Nekaj zanimivih spletnih naslovov 

• Cedilnik, A., Valantič,T.: Statistični urad republike Slovenije. 

http://www.stat.si/ 

• Drobne, S.: Statistika z elementi informatike, Prosojnice s 

predavanja za 1. letnik VSŠ geodezije, v pripravi, Ljubljana, 

2002. 

http://www.fgg.uni-lj.si/~/sdrobne/Pouk/SEI/SEI_VSS1.htm 

• Grinstead, C.M.; Snell, J. L.: Introduction to Probability, 1998. 

http://www.dartmouth.edu/~chance/teaching_aids/books_artic 

les/probability_book/book.html 

• Hopkins, W.G.: A New View of Statistics, 2002. 

http://www.sportsci.org/resource/stats/index.html 

383 

• NIST/SEMATECH e-Handbook of Statistical Methods, 

Engineering statistics Handbook, 2002. 

http://www.itl.nist.gov/div898/handbook/index.htm 

Nekaj zanimivih spletnih naslovov / 2 

• Piele D.,: Introduction to Probability, Mathematica notebooks. 

http://www.uwp.edu/academic/mathematics/probability/index.ht 

m 

• Pollett, P., Bob Dobrow, B.: The Probability Web, 1995-2002. 

http://www.mathcs.carleton.edu/probweb/probweb.html 

• StatSoft, Inc. Electronic Statistics Textbook. Tulsa, OK: StatSoft, 

2002. http://www.statsoft.com/textbook/stathome.html 

• Turk, G.: Verjetnostni račun in statistika, Učbenik v pripravi, 

Ljubljana, 2002. 

http://www.km.fgg.uni-lj.si/predmeti/sei/vrs1.pdf 

• Wolfram Research, Statistics with Mathematica, 2002. 

http://www.wri.com/solutions/statistics/ 

384 

•192

2 na stran

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?