Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si

Metode raziskovanja 

Majda BASTIČ 

Raziskovalni proces 

Načrtovanje raziskave 

• Opredelitev raziskovalnega procesa 

• Izdelava koncepta raziskave 

• Izdelava instrumenta za zbiranje podatkov 

• Izbira vzorca 

• Pisanje raziskovalnega predloga 

Izvedba raziskave 

• Zbiranje podatkov 

• Obdelava podatkov 

• Pisanje raziskovalnega poročila 

Raziskovalni proces Vsebina 

Vzorčenje 

• Je proces izbire manjšega števila enot iz 

statistične množice (populacije). 

• Vzorec je podmnožica statistične množice. 

• Vzorec je osnova za ocenjevanje vrednosti 

parametrov (povprečni dohodek na 

družinskega člana v Mariboru) ali 

napovedovanje izidov (volitev), ki se 

nanašajo na statistično množico. 

• Vzorčenje 

• Analiza podatkov 

• Klasifikacija statističnih metod 

• Ugotavljanje razlik med aritmetičnimi 

sredinami 

• Analiza odvisnosti med številskimi 

spremenljivkami 

• Analiza medsebojne odvisnosti 

Vzorčenje 

1

Prednosti in slabosti 

• Prednosti 

– Prihranek v času 

– Prihranek v stroških 

– Prihranek v človeških virih 

• Slabosti 

– Ne dobimo informacij za statistično množico 

– Dobljene ocene utegnejo biti napačne 

Načela vzorčenja 

• Čim manjša vzorčna napaka: razlika med 

dejansko vrednostjo parametra in vrednostjo 

statistike (oceno parametra) 

• Večji kot je vzorec, manjša je vzorčna 

napaka. 

• Večja kot je variabilnost proučevane 

spremenljivke (njen standardni odklon), večja 

bo vzorčna napaka 

Primer 

• Vzemimo, da so v statistični množici 4 enote 

A 

B 

C 

D 

Povp.starost 

Stand. odklon 

18 let 

20 let 

23 let 

25 let 

21,5 let 

3,109 

Osnovni pojmi vzorčenja 

• Statistična množica ali populacija 

• Velikost statistične množice(N) 

• Vzorec 

• Velikost vzorca je enaka številu enot v vzorcu (n) 

• Vzorčna strategija je način izbiranja enot v vzorec 

• Vzorčna enota 

• Vzorčni okvir – seznam enot v statistični množici 

• Ugotovitve, dobljene iz vzorca, so vzorčne statistike 

Natančnost dobljene statistike 

Je odvisna od: 

• Velikosti vzorca 

• Variabilnosti spremenljivke 

– Pri enaki velikosti vzorca bo standardna napaka 

ocene večja, čim večja bo variabilnost 

spremenljivka 

Vzorčenje 

število enot v vzorcu 

• Vzemimo, da bosta v vzorcu 2 enoti 

Vzorec 

A, B 

A, C 

A, D 

B, C 

B, D 

C, D 

Povp. starost 

Stand. odklon 

Povp. starost 

19 

20,5 

21,5 

21,5 

22,5 

24 

21,5 

1,703 

2

Vzorčenje 

• Vzemimo, da bodo v vzorcu 3 enote 

Vzorec 

A, B, C 

A, B, D 

A, C, D 

B, C, D 

Povp. starost 

Stand. odklon 

Povp. starost 

20,33 

21 

22 

22,67 

21,5 

1,036 

Vzorčenje 

variabilnost med enotami 

• Vzemimo, da bosta v vzorcu 2 enoti 

Vzorec 

A, B 

A, C 

A, D 

B, C 

B, D 

C, D 

Povp. starost 

Stand. odklon 

Povp. starost 

19 

20,5 

19,5 

21,5 

20,5 

22 

20,5 

1,14 

Vrste vzorčenja 

1. Slučajno vzorčenje 

2. Ne-slučajno vzorčenje 

3. Mešano vzorčenje 

Primer 2 

variabilnost med enotami 

• Vzemimo, da so v statistični množici 4 enote 

A 

B 

C 

D 

Povp.starost 

Stand. odklon 

18 let 

20 let 

23 let 

21 let 

20,5 let 

2,08 

Cilji vzorčenja 

• Doseči čim večjo natančnost ocen 

parametrov 

• Izogniti pristranosti pri izbiri enot v vzorec. 

• Pristranost je posledica 

– Uporabe ne-slučajne metode vzorčenja 

–Vzorčni okvir ne zajema celotne populacije 

– Del populacije ni mogoče najti ali zavrača 

sodelovanje 

Klasifikacija metod vzorčenja 

3

Slučajno vzorčenje 

• Slučajni vzorec: vsaka enota v populaciji ima 

enako in neodvisno možnost, da je izbrana v 

vzorec 

– Enako: za vsako enoto populacija obstaja enaka 

verjetnost, da bo izbrana v vzorec 

– Neodvisno: izbira enote v vzorec ni odvisna od 

izbora drugih enot 

• Prednosti: zaključki, dobljeni iz vzorca, se 

lahko posplošijo na statistično množico 

Sistem izbire enot pri slučajnem 

vzorčenju 

• Slučajno vzorčenje brez nadomeščanja 

– Izbrana enota se ne vrne v statistično množico 

– Verjetnost izbora posamezne enote ni enaka 

• Slučajno vzorčenje z nadomeščanjem 

– Izbrana enota se vrne v statistično množico 

– Verjetnost izbora posamezne enote je enaka za 

vse enote 

– Če je ista enota izbrana večkrat, se v vzorcu 

upošteva samo enkrat (prvič). 

Enostavno vzorčenje 

• Opredeli število v statistični množici (N), 

vsaka enota v statistični množici dobi svoj 

indeks ali zaporedno številko 

• Določi velikost vzorca (n) 

• Izberejo se enote v slučajni vzorec z 

– Žrebanjem 

– Tabelo slučajnih števil 

–Računalniškim programom – generator slučajnih 

števil 

Metode izbire enot pri slučajnem 

vzorčenju 

• Žrebanje (za male statistične množice) 

• Tabela slučajnih števil 

• Generator slučajnih števil – računalniški 

program 

Metode slučajnega 

(verjetnostnega) vzorčenja 

1. Enostavno slučajno vzorčenje 

2. Stratificirano slučajno vzorčenje 

1. Proporcionalno 

2. neproporcionalno 

3. Vzorčenje po skupinah 

1. Enostopenjsko 

2. Dvostopenjsko 

3. Večstopenjsko 

Stratificirano slučajno vzorčenje 

• Statistično populacijo razdelimo v stratume, 

tako da so enote znotraj stratumov glede na 

proučevano karakteristiko čim bolj homogene 

– Proporcionalno stratificirano vzorčenje 

• Delež stratuma v statistični množici 

• Število enot v vzorcu iz posameznega stratuma je enako 

– delež stratuma*velikost vzorca 

– Neproporcionalno stratificirano vzorčenje 

• Število enot v vzorcu iz posameznega stratuma 

– velikost vzorca : s številom stratumov 

4

Vzorčenje po skupinah (clustrih) 

• Primerno za: 

– velike statistične množice 

– Ni mogoče identificirate vseh enot statistične 

množice 

• Statistično množico razdelimo v skupine 

• Iz skupin se enote zbirajo v vzorec s 

slučajnostnim vzorčenjem 

Vzorčenje po principu kvot 

• Pri izboru enot v vzorec se uporabljajo vidne 

karakteristike enot (spol, rasa, barva las) 

• Določi lokacija(e) izbire enot: če se 

statistična enota z določenimi 

karakteristikami pojavi na določeni lokaciji 

postane element vzorca. Enote se na ta 

način nabirajo tako dolgo, dokler ni v vzorcu 

načrtovano število enot. 

Naključno vzorčenje 

• Enote se izbirajo naključno, torej brez 

upoštevanja pravil slučajnega vzorčenja in 

brez upoštevanja vidnih lastnosti statističnih 

enot 

• Pogosto uporablja pri tržnih in novinarskih 

raziskavah 

• Prednosti in slabosti so podobne kot pri 

vzorčenju po principu kvote 

Neslučajno vzorčenje 

• Vzorčenje po principu kvot 

• Naključno vzorčenje 

• Vzorčenje po presoji 

• Vzorčenje po principu kotaleče snežne kepe 

Prednosti in slabosti 

Prednosti 

• Cenejši način oblikovanja vzorca 

• Niso potrebni podatki o statistični množici 

Slabosti 

• Osebe, izbrane v vzorec, utegnejo imeti 

lastnosti, ki niso značilne za statistično 

množico 

• Zaključke, dobljene s pomočjo vzorca, ne 

smemo posplošiti na statistično množico 

Vzorčenje po presoji 

• Raziskovalec izbira enote v vzorec po presoji 

glede na njihovo poznavanje proučevanega 

problema. 

• Metoda vzorčenja je primerna za 

proučevanje pojavov, o katerih je zelo malo 

znanega. 

5

Vzorčenje po principu snežne kepe 

• Temelji na uporabi mrež: v vzorec se izbere 

nekaj enot skupine, ki priporočijo za 

vključitev v vzorec še druge enote. Te enote 

priporočijo za vključitev v vzorec spet druge 

enote, dokler ni doseženo načrtovano število 

enot v vzorcu. 

• Ta metoda zahteva malo podatkov o 

statistični množici. 

• Uporablja pri proučevanju: 

–načinov komuniciranja v skupini 

–Načinov prenosa znanja v skupini 

Izbira velikosti vzorca 

• Velikost vzorca je odvisna 

– Zahtevane natančnosti dobljenih ocen 

– Zahtevane zanesljivosti dobljenih ocen 

– Variabilnosti proučevane spremenljivke 

• Večji vzorec – večja natančnost in 

zanesljivost 

• Stroški raziskave odvisni od velikosti vzorca 

Izračun velikosti vzorca 

• Odstopanje od povprečne vrednosti je določeno z: 

( t 

α 

σ 

) 

n 

• kjer je 

• t α - vrednost spremenljivke t pri tveganju α 

• σ - standardni odklon za proučevano spremenljivko v 

statistični množici 

• n – velikost vzorca 

Mešano vzorčenje 

• Ima karakteristike tako slučajnega kot neslučajnega 

vzorčenja 

• Statistična populacija se razdeli v segmente, 

imenovane intervale 

• Iz prvega segmenta se enote izbirajo s 

slučajnim vzorčenjem. Isto slučajno število se 

uporabi pri izboru enote v drugih segmentih. 

• Izbira enote v prvem segmentu je 

slučajnostna, v drugih pa odvisna. 

• Širina intervala je enaka količniku med 

velikostjo statistične množice in vzorca. 

Primer 

• Vzemimo primer, ko želimo določiti povprečno 

starost študentov. Največje dovoljeno odstopanje od 

dejanske povprečne starosti je ± 0,5 leta. Interval za 

povprečno starost želimo določiti z 0,95 stopnjo 

zaupanja. 

• Interval zaupanja je določen z: 

xˆ = x ± ( t 

α 

σ 

) 

n 

Standardni odklon 

Za izračun velikosti vzorca potrebujemo 

vrednost standardnega odklona proučevane 

spremenljivke za statistično množico, ki ga 

določimo: 

• z uganjevanjem 

• posvetovanjem s strokovnjaki 

• iz predhodnih študij 

• njegovo vrednost izračunamo s pomočjo 

pilotne študije 

6

Izračun velikosti vzorca - primer 

• t0,05 = 1,96 

• σ = 1(vrednost ocenjena na enega od omenjenih 

načinov) 

• Odstopanje je 0,5 

t0, 05 

σ 

= 0, 

5 

n 

1, 

96 

1 

= 0, 

5 

n 

n = 15, 

37 ≅ 16 

Analiza podatkov 

Vrste podatkov 

• Številski podatki (numerični, kvantitativni, 

metric) 

– Zvezni (prihodek, starost) 

– Nezvezni ali diskretni (število družinskih članov) 

• Opisni (kvalitativni, non-metric) 

– Ordinalni opisni podatki 

Skale za merjenje spremenljivk 

Številske spremenljivke merimo na 

• Intervalni skali – ima vse lastnosti ordinalne 

skale in uporablja enoto mere 

• Razmernostni skali – ima vse lastnosti 

predhodnih skal in njena začetna točka se ne 

spreminja 

Izračun velikosti vzorca - primer 

• t0,05 = 1,96 

• σ = 2 (vrednost ocenjena na enega od omenjenih 

načinov) 

• Odstopanje je 0,5 

σ 

t0, 05 = 0, 

5 

n 

2 

1, 

96 = 0, 

5 

n 

n = 61, 

466 ≅ 61 

Skale za merjenje spremenljivk 

Opisne spremenljivke merimo na 

• Nominalni skali – enote razvrščamo po 

skupni značilnosti 

• Ordinalni skali – ima vse lastnosti nominalne 

skale in enote so razvrščene po določenem 

kriteriju 

– 1=velika podjetja 

– 2=srednje velika podjetja 

– 3=mala podjetja 

Parametri in statistike 

• Parameter – številska ali opisna značilnost 

statistične množice 

• Statistika - številska ali opisna značilnost 

statistične množice, ki jo ugotavljamo z 

vzorcem 

7

Parametri in statistike 

Srednje vrednosti 

• Aritmetična sredina 

• Mediana 

• Modus 

Mere variabilnosti 

• Variacijski razmik 

• Varianca 

• Standardni odklon 

Mere asimetrije in sploščenosti 

• Koeficient asimetrije (asimetrija v levo ali desno) 

• Koeficient sploščenosti (pozitiven – koničasta) 

Koničasta in sploščena 

porazdelitev 

Standardna napaka ocene 

aritmetične sredine 

je enaka standardnemu odklonu vzorčnih aritmetičnih 

sredin. 

Njena vrednost je določena z 

s 

SE = X 

n 

kjer je 

s – standardni odklon, izračun s podatki vzorca 

n – velikost vzorca 

Normalna in nesimetrični 

porazdelitvi 

Zanesljivost vzorca 

Standardna napaka ocene aritmetične sredine 

Primer za spremenljivko K4 

N Valid 

Mean 

Std. Error of Mean 

Median 

Mode 

Std. Deviation 

Variance 

Skewness 

Kurtosis 

Range 

Missing 

214 

0 

5,3411 

,08986 

5,5000 

6,0000 

1,31460 

1,728 

-,651 

-,004 

6,00 

8

1 

c − x i 

Frekvenčna porazdelitev za K4 

Frequency 

70 

60 

50 

40 

30 

20 

10 

0 

0,00 

2,00 

4,00 

K4 

Histogram 

6,00 

8,00 

Mean =5,3411 

Std. Dev. =1,3146 

N =214 

Transformacija podatkov 

Logaritmiranje vrednosti – zmanjševanje pozitivne 

asimetrije 

Korenjenje vrednosti - zmanjševanje pozitivne 

asimetrije 

1 

Recipročna transformacija 

c − x 

Za zmanjševanje negativne asimetrije – vrednosti 

spremenljivke predhodno transformiramo z c – x i in 

nato uporabimo eno od opisanih transformacij. 

Razvrstitev univariatnih metod 

Je odvisna od: 

• vrste spremenljivke, ki jo analiziramo 

• števila vzorcev 

• povezave med vzorci 

i 

Obrobna vrednost 

• Se bistveno razlikuje od ostalih vrednosti 

spremenljivke. 

• Primer: ocene ocenjevalcev 

5, 4, 2, 5, 5, 5, 5 

Ocena tretjega ocenjevalca se bistveno 

razlikuje od ostalih. 

Klasifikacija statističnih metod 

1. Univariatne metode – proučujemo le eno 

značilnost 

Analiza povprečij in variance 

2. Multivariatne metode – proučujemo več 

značilnosti hkrati 

Proučevanje ravni zveze med 


Klasifikacija univariatnih metod 

9

Klasifikacije multivariatnih metod 

2 skupini multivariatnih metod: 

• metode za proučevanje odvisnosti med 

dvema skupinama spremenljivk (skupina 

odvisnih in skupina neodvisnih spremenljivk) 

• metode za proučevanje medsebojne 

odvisnosti (odvisnost med proučevanimi 

spremenljivkami, odvisne spremenljivke 

združimo v novo spremenljivko) 

Izbor multivariatne metode 

Je odvisen od tega, ali gre za 

• proučevanje odvisnosti med dvema skupinama 

spremenljivk 

– Števila spremenljivk v skupini odvisnih spremenljivk 

– Vrste spremenljivke 

• proučevanje medsebojne odvisnosti 

– Medsebojna odvisnost med spremenljivkami 

– Medsebojna odvisnost med subjekti 

Klasifikacije multivariatnih metod Univariatne metode 

Domneva 

Izraža raziskovalno vprašanje. 

• Izhodiščna ali ničelna domneva (H o) izraža 

stanje, v katerem ni nobenih razlik med 

proučevanimi spremenljivkami. 

• Raziskovalna domneva (H 1) je trditev o 

neenakosti. 

• Domneva je 

– Dvostranska – se razlikuje… 

– Enostranska – je večje kot… je manjše kot.. 

Ugotavljanje razlik med aritmetičnimi sredinami 

- domneva 

- statistično značilne razlike 

• Parametrični test 

- dva neodvisna vzorca 

- dva odvisna vzorca 

- analiza variance 

• Neparametrični test 

- za en vzorec 

- za dva neodvisna vzorca 

- za dva odvisna vzorca 

Primer za domnevo 

Ničelna domneva 

Pri nekem predmetu je povprečna ocena študentov, ki 

obiskujejo vaje, enaka povprečni oceni študentov, ki 

vaj ne obiskujejo. 

Dvostranska raziskovalna domneva 

Pri nekem predmetu povprečna ocena študentov, ki 

obiskujejo vaje, ni enaka povprečni oceni študentov, 

ki vaj ne obiskujejo. 

Enostranska raziskovalna domneva 

Pri nekem predmetu je povprečna ocena študentov, ki 

obiskujejo vaje, višja kot povprečna ocena 

študentov, ki vaj ne obiskujejo. 

10

Stopnja značilnosti 

Je tveganje, povezano s tem, da nismo 100 % 

gotovi, da je to kar proučujemo v raziskavi, to 

kar preverjamo. 

Stopnja značilnosti 0,05 (p < 0,05) pomeni, da 

obstaja 5 % možnost, da razlike, ki smo jih 

odkrili, niso posledica proučevanega vzroka, 

pač pa nekih drugih neznanih vzrokov. 

Parametrični test za ugotavljanje razlik 

med dvema povprečnima vrednostma 

Primer: proučujemo vpliv sredstev za 

izobraževanje na velikost prodaje 

prodajalcev v dveh skupinah podjetjih 

- tistih, ki namenjajo za izobraževanje 

manj kot 50 d.e. na prodajalca. 

- tistih, ki namenjajo za izobraževanje več 

kot 50 d.e. na prodajalca. 

Statistični test 

1. Postavitev ničelne domneve 

2. Izbira stopnje značilnosti 

3. Izbira primernega testa 

4. Izračun testne vrednosti in tveganja, da je 

ničelna domneva pravilna. 

5. Ničelno domnevo zavrnemo, če je 

izračunano tveganje (korak 4) manjše od 

izbrane stopnje značilnosti (korak 2) 

Ničelna 

domneva 

je 

Stopnja značilnosti 

Pravilna 

Nepravilna 

Naš zaključek 

Ničelno domnevo 

smo sprejeli 

Zaključek je 

pravilen. 

Zaključek je 

napačen. 

Napaka II. vrste. 

Postopek 

Ničelne domneve 

nismo sprejeli 

Zaključek je 

napačen. 

Napaka I. vrste 

Naš zaključek je 

pravilen. 

• Izberemo dva vzorca 

– v prvega izbiramo podjetja, ki namenjajo 

izobraževanju več kot 50 d.e. 

– v drugega izbiramo podjetja, ki namenjajo 

izobraževanju manj kot 50 d.e. 

• Izračunamo povprečno prodajo na prodajalca 

• Zaključek za celotno populacijo: ali so razlike 

nastale slučajno ali pa so posledica 

različnega vlaganja v izobraževanje 

prodajalcev. 

Testiranje razlik v povprečni vrednosti 

2 neodvisna vzorca 

Neodvisna vzorca 

z-test za neodvisne vzorce uporabimo 

• za velike vzorce 

• znana varianca statistične množice 

t-test za neodvisne vzorce uporabimo 

• za male vzorce 

Odvisna vzorca 

t-test za odvisne vzorce 

11

2 neodvisna vzorca 

primer 4.2.1 

Problem: Ali obstajajo značilne razlike v 

povprečni porabi določene pijače na dan 

med prebivalci toplejšega in prebivalci 

hladnejšega področja. 

Podatki: zbrali podatke o dnevni porabi 

proučevane pijače za 30 prebivalcev 

toplejšega in 30 prebivalcev hladnejšega 

področja. 

poraba 

skupina 

1 

2 

Rezultati 

Group Statistics 

N Mean Std. Deviation 

Std. Error 

Mean 

30 5,43 3,421 ,625 

30 5,53 2,063 ,377 

Dva odvisna vzorca 

primer 4.2.2 

Problem: analizirati želimo uspešnost 

izobraževalnega programa, ki jo merimo s 

številom opravljenih nalog v časovni enoti. 

Podatki: merili število opravljenih nalog v 

časovni enoti za 25 zaposlenih, izbranih v 

slučajni vzorec, in sicer: 

- pred izvedbo izobraževalnega programa 

- po izvedbi izobraževalnega programa 

Postopek 

1. Postavimo ničelno in raziskovalno domnevo 

• Ho : µ 1 = µ 2 

• H1 : µ 1 ≠µ 2 

2. Domneva je dvostranska 

3. Izberemo stopnjo značilnosti 

α = 0,05 

4. Uporabimo t-test za neodvisne vzorce in ga 

izvedemo s programom SPSS. 

poraba 

Equal variances 

assumed 

Equal variances 

not assumed 

Levene's Test 

for Equality of 

Variances 

Rezultati 

Independent Samples Test 

t-test for Equality of Means 

Std. 

95% 

Confidence 

Interval of the 

Difference 

Sig. Mean Error 

F Sig. t df (2-tailed) Differ. Differ. Lower Upper 

4,994 ,029 -,14 58 ,891 -,100 ,729 -1,560 1,360 

-,14 48 ,892 -,100 ,729 -1,567 1,367 

Verjetnost, da je domneva H o : µ 1 = µ 2 pravilna, je 

0,892 

Postopek 

1. Postavimo ničelno in raziskovalno domnevo 

• Ho = µ po = µ pred 

• H1 = µ po > µ pred 

2. Domneva je enostranska 

3. Izberemo stopnjo značilnosti 

α = 0,05 

4. Uporabimo t-test za odvisne vzorce, ki ga 

izvedemo s programom SPSS 

12

Pair 

1 

pred 

po 

Rezultati 

Paired Samples Statistics 

Mean N Std. Deviation 

Std. Error 

Mean 

6,32 25 1,725 ,345 

7,52 25 1,828 ,366 

Paired Samples Test 

Paired Differences 

95% Confidence 

Interval of the 

Std. Error Difference 

Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed) 

Pair 1 pred - po -1,200 2,449 ,490 -2,211 -,189 -2,449 24 ,022 

Verjetnost, da je domneva H o pravilna, je 0,011. 

Domnevo H o zavrnemo in zaključimo, da so razlike 

v storilnosti posledica izobraževanja. 

ANOVA 

Primer 4.2.3 

• Problem: ugotoviti uspešnost treh različnih 

oglaševalnih akcij za nov proizvod 

• Podatki: 30 primerljivih trgovin razdelili v tri 

skupine po 10 trgovin. 

– V vsaki skupini trgovin izvedli eno od treh 

oglaševalnih akcij 

– Merili prodajo po končani oglaševalni akciji v vseh 

v vzorec zajetih trgovinah 

prodaja 

1 

2 

3 

Total 

prodaja 

Rezultati 

Descriptives 


Interval for Mean 

Std. Std. Lower Upper 

N Mean Deviation Error Bound Bound Minimum Maximum 

10 76,60 11,965 3,784 68,04 85,16 56 98 

10 85,20 6,197 1,960 80,77 89,63 78 99 

10 91,60 3,406 1,077 89,16 94,04 87 96 

30 84,47 9,951 1,817 80,75 88,18 56 99 

Between Groups 

Within Groups 

Total 

ANOVA 

Sum of 

Squares df Mean Square F Sig. 

1133,067 2 566,533 8,799 ,001 

1738,400 27 64,385 

2871,467 29 

ANOVA 

• Analiza razlik med povprečnimi vrednostmi 

za več kot dva neodvisna vzorca. 

• Celotno variiranje vrednosti je razdeljeno na 

– variiranje vrednosti zaradi razlik znotraj vzorcev 

– variiranje vrednosti zaradi razlik med vzorci 

Postopek 

• Postavitev domneve 

Ho: µ 1 = µ 2 = µ 3 

Ho: µ 1 ≠ µ 2 ≠µ 3 

• Stopnja značilnosti 

α = 0,05 

ANOVA test izvedemo s programom SPSS. 

Rezultati 

Primerjave med skupinami 

Dependent Variable: prodaja 

Tukey HSD 

(I) akcija 

1 

2 

3 

(J) akcija 

2 

3 

1 

3 

1 

2 

Multiple Comparisons 

Mean 

Difference 

Std. 


Interval 

Lower Upper 

(I-J) Error Sig. Bound Bound 

-8,600 3,588 ,060 -17,50 ,30 

-15,000* 3,588 ,001 -23,90 -6,10 

8,600 3,588 ,060 -,30 17,50 

-6,400 3,588 ,194 -15,30 2,50 

15,000* 3,588 ,001 6,10 23,90 

6,400 3,588 ,194 -2,50 15,30 

*. 

The mean difference is significant at the .05 level. 

13

Neparametrični test 

Uporabljamo za ugotavljanje značilnosti razlik 

med povprečnimi vrednostmi za 

• opisne spremenljivke (merjene na ordinalni 

skali) 

• številske spremenljivke, ki niso normalno 

porazdeljene 

Neparametrični test za en vzorec 

• Kolmogorov-Smirnov test 

• Shapiro-Wilkov test 

Uporabljamo za preverjanje ničelne domneve, 

da je proučevana porazdelitev enaka 

normalni porazdelitvi. 

Ničelne domneve ne zavrnemo, če je 

verjetnost, da je ničelna domneva pravilna, 

večja od 0,05 (p > 0,05). 

Neparametrični test za dva 

neodvisna vzorca 

Uporabljamo 

• Mann-Whitneyev test 

• Wilcoxonov rank-sum test 

za ugotavljanje značilnosti razlik med dvema 

povprečnima vrednostma za neodvisne vzorce, ko 

• spremenljivka ni normalno porazdeljena 

• opisna spremenljivka je merjena na ordinalni skali 

Testa sta neparametrični ekvivalent parametričnemu ttestu. 

Vrednosti številske spremenljivke se pretvorijo v range. 

Rang 1 dobi najmanjša vrednost. 

Neparametrični test 

• Za en vzorec 

– Kolmogorov-Smirnov test 

– Shapiro-Wilkov test 

• Za dva neodvisna vzorca 

– Mann-Whitneyev test 

– Wilxoxonov rank-sum test 

• Za dva odvisna vzorca 

– Wilcoxonov signed-rank test 

Primer 4.3.1 

• Problem: preveriti želimo, če je spremenljivka 

v 1 normalno porazdeljena. 

• Podatki: vrednosti spremenljivke v 1 

• Rezultat: p > 0,2; v 1 je normalno 

porazdeljena Tests of Normality 

Kolmogorov-Smirnov 

Statistic df Sig. Statistic df Sig. 

v1 

,135 20 ,200* ,938 20 ,219 

a 

Shapiro-Wilk 

*. This is a lower bound of the true significance. 

a. Lilliefors Significance Correction 

Izračun testne statistike 

Ws 

−Ws 

z = 

SE 

W s 

SEws = 

n 

= 

Ws 

( 1 

2 

n + n + 1) 

1 

2 

n1 

n2( 

n1 

+ n2 

+ 1) 

12 

14

Wilcoxonov rank-sum test 

• Testna statistika je W s 

• Vrednost statistike W s je enaka 

– manjši vsoti rangov pri enako velikih skupinah 

– vsoti rangov manjše skupine pri neenako velikih 

skupinah 

• Vrednsot statistike W s je statistično značilna 

pri p < 0,05, če je njena absolutna 

standardizirana vrednost (z) večja od 1,96 

1. skupina 

2. skupina 

Opis problema 

Število bolniških 

Pred ukrepom 

Po ukrepu 

r1 pred r1 po 

r 2 pred 

Mann-Whitney U 

Wilcoxon W 

Z 

Asymp. Sig. (2-tailed) 

Exact Sig. [2*(1-tailed 

Sig.)] 

Exact Sig. (2-tailed) 

Exact Sig. (1-tailed) 

Point Probability 

r 2 po 

Rezultati 

Test Statistics b 

a. Not corrected for ties. 

b. Grouping Variable: skupina 

35,500 4,000 

90,500 59,000 

-1,105 -3,484 

,269 ,000 

,280 a 

,000 a 

bolpred bopo 

,288 ,000 

,144 ,000 

,013 ,000 

Izvajanje 

ukrepa 

Ne 

Da 

Primer 4.3.2 

• Problem: vpliv ukrepov za povečanje zadovoljstva 

zaposlenih na letno število bolniških zaostankov. 

• Podatki: 20 primerljivih podjetij razdelimo v dve 

skupini po 10 podjetij. V drugi skupini ukrepe 

izvajamo, v prvi pa ne. 

• Zanima nas, ali je 

• razlika v številu bolniških pred izvedbo ukrepov med 

obema skupinama statistično značilna ter 

• ali je razlika v številu bolniških po izvedbi ukrepov 

med obema skupinama statistično značilna. 

– V vsaki skupini za vsako podjetje izmerimo število bolniških pred 

izvedbo ukrepov in po enem letu, ko so ukrepi končani. 

– Vrednosti spremenljivke število bolniških izostankov niso normalne 

porazdeljene. 

Reševanje 

• Neparametrični test za dva neodvisna vzorca 

• Rezultati s programom SPSS 

bolpred 

bopo 

skupina 

1 

2 

Total 

1 

2 

Total 

Ranks 

N Mean Rank Sum of Ranks 

10 11,95 119,50 

10 

20 

9,05 90,50 

10 15,10 151,00 

10 

20 

5,90 59,00 

Neparametrični test za dva odvisna 

vzorca 

• Uporabljamo 

Wilcoxonov signed-rank test 

• za ugotavljanje značilnosti razlik med dvema 

povprečnima vrednostma za odvisne vzorce, ko: 

• spremenljivka ni normalno porazdeljena 

• opisna spremenljivka je merjena na ordinalni skali 

• Je neparametrični ekvivalent parametričnemu t-testu 

za odvisne vzorce 

Vrednosti številske spremenljivke se pretvorijo v range. 

Rang 1 dobi najmanjša vrednost. 

15

Wilcoxonov signed-rank test 

• Testna statistika je T 

• Tvorita se dve vsoti rangov 

• Vsota rangov za pozitivne razlike 

• Vsota rangov za negativne razlike 

• Vrednost statistike T je enaka manjši od 

obeh vsot. 

• Vrednost statistike T je statistično značilna 

pri p < 0,05, če je njena absolutna 

standardizirana vrednost večja od 1,96. 

Rezultati za drugo skupino 

Descriptive Statisticsa N Mean Std. Deviation Minimum Maximum 

bolpred 10 164,00 22,706 130 200 

bopo 

a. skupina = 2 

10 101,00 79,505 30 300 

bopo - bolpred 

a. bopo < bolpred 

b. bopo > bolpred 

c. bopo = bolpred 

d. skupina = 2 

Negative Ranks 

Positive Ranks 

Ties 

Total 

Ranks d 

9a 5,22 47,00 

1b 0 

8,00 8,00 

c 

N Mean Rank Sum of Ranks 

10 

Analiza odvisnosti med številskimi 


Ugotavljamo medsebojno odvisnost med 

dvema skupinama spremenljivk. V eni je 

odvisna spremenljivka, v drugi pa neodvisne. 

• Regresija – v obeh skupinah so številske 

spremenljivke 

– Enostavna regresija 

– Multipla regresija 

• Diskriminantna analiza – odvisnost med 

opisno odvisno in številskimi neodvisnimi 


Primer 

• Problem: analiza razlik v številu bolniških 

izostankov pred in po izvedbi ukrepov za 

vsako skupino posebej. 

• Podatki enaki kot za primer 4.3.2, le da 

imamo sedaj dva odvisna vzorca. 

• Za vsako skupino posebej primerjamo razliko 

v številu bolniških izostankov pred in po 

izvedbi ukrepov. 

• Analizo razlik napravimo s Wilcoxonov 

signed-rank test in programom SPSS 

Rezultati za drugo skupino 

Test Statistics b,c 

-1,990a bopo - 

bolpred 

Z 

Asymp. Sig. (2-tailed) ,047 

a. Based on positive ranks. 

b. Wilcoxon Signed Ranks Test 

c. skupina = 2 

Enostavna regresija 

• Enostavna regresija : proučujemo odvisnost 

med eno odvisno in eno neodvisno 

spremenljivko. 

• Z regresijsko analizo ugotavljamo 

– Obliko odvisnosti: linearna, krivuljčna,… 

– Smer odvisnosti: pozitivna, negativna 

– Jakost odvisnosti: močna, slaba,… 

• Velikost vzorca 

– Vsaj 10 enot za vsako spremenljivko. 

16

y 

Linearna regresijska enačba 

y = f ( x ) + e 

i 

= a 

o 

+ a 

1 

x 

i 

+ e 

y- odvisna spremenljivka 

x- neodvisna spremenljivka 

e- ostanek ali rezidual 

Korelacijski koeficient 

• Korelacijski koeficient kaže na jakost linearne 

zveze. 

– njegova vrednost se giblje med –1 in 1. 

Absolutna vrednost 

korelacijskega koeficienta 

0 

0,00 - 0,50 

0,51 - 0,79 

0,80 - 0,99 

1,00 

Primer 5.1 

i 

Moč linearne zveze 

ni 

slaba 

srednje močna 

močna 

popolna 

Problem 

• Podjetje prodaja svoje izdelke na 40 

prodajnih področjih in proučuje odvisnost 

prodaje od števila propagandnih akcij. 

Podatki 

• Podjetje je zbralo podatke o prodaji in številu 

propagandnih akcij na 40 prodajnih 

področjih. 

Rezultati: S programom SPSS in regresijsko 

analizo so dobili naslednje rezultate 

Kakovost regresijske enačbe 

• Določamo s: 

– korelacijskim koeficientom 

– determinacijskim koeficientom 

– F testom in stopnjo značilnosti 

– t testom in stopnjo značilnosti 

Dekompozicija celotne variance v 

regresijski analizi 

2 n 

2 n 

2 2 2 

( y − y) 

= ( y − y) 

+ ( y yˆ 

) = σ + σ 

n 

∑ ˆ i ∑ i ∑ − i i 

xy ey 

i= 

1 i= 

1 i= 

1 

Rezultati 

Model Summary 

,880a Adjusted R 

Std. Error 

of the 

Model R R Square Square Estimate 

1 

,775 ,769 595,60 

a. Predictors: (Constant), propaganda 

ANOVA b 

4,6E+07 1 5,E+07 130,644 ,000a Sum of 

Mean 

Model 

Squares df Square F Sig. 

1 Regression 

Residual 1,3E+07 38 354742 

Total 

6,0E+07 39 

a. Predictors: (Constant), propaganda 

b. 


17

Rezultati 

Coefficients a 

Unstandardized 

Coefficients 

Standar 

dized 

Coeffici 

ents 

Model 

B Std. Error Beta t Sig. 

1 (Constant) 1354,34 259,065 5,228 ,000 

propaganda 253,077 22,142 ,880 11,430 ,000 

a. Dependent Variable: prodaja 

yˆ = 1354, 

34 + 

253, 

077x 

Multipla regresija 

• S pomočjo vzorca dobimo ocene regresijskih 

koeficientov 

yˆ = â + â x + â x + ... + â 

i 

0 

1 i1 

â j − parcialni regresijski 

koeficient 

2 

i2 

Metode za izbor neodvisnih 

spremenljivk v model 

• Hierarhične metode 

– Backward metoda – v model vključimo vse spremenljivke, 

nato postopno izločamo tiste spremenljivke z najmanjšo 

vrednostjo parcialnega F. 

2 2 

2 

( σ −σ 

) / 

F σ 

par = 

xy( 

v ) 

xy( 

zun ) 

xy( 

v ) 

– Forward metoda – v model vključimo eno spremenljivko z 

največjim korelacijskim koeficientom, nato pa postopno 

vključujemo spremenljivke z največjo vrednostjo parcialnega 

F. 

– Stepwise metoda – podobna forward metodi, le da 

opazujemo parcialne F za spremenljivke v modelu in izven 

njega. 

• Nehierarhične metode – tvorimo regresijske modele 

za vse možne kombinacije neodvisnih spremenljivk. 

k 

x 

ik 

Multipla regresija 

• Proučujemo odvisnost ene odvisne 

spremenljivke od več neodvisnih 

spremenljivk 

• Regresijska enačba 

• y i = a o +a 1x i1+a 2x i2+…+a ikx k+e i 

• y i – vrednost odvisne spremenljivke pri i-ti enoti 

• a k – vrednost regresijskega koeficienta pri k-ti neodvisni 

spremenljivki 

• x ik – vrednost k-te neodvisne spremenljivke pri i-ti enoti 

Regresijska analiza in opisna 

spremenljivka 

• Opisne spremenljivke vključimo v regresijsko analizo z ‘dummy’ 

spremenljivkami. Potrebujemo m-1 dummy spremenljivk, kjer je 

m število skupin, določenih z opisno spremenljivko. 

Primer1: spremenljivka spol – ena spremenljivka 

– moški = 0 

– ženska = 1 

Primer 2: spremenljivka velikost podjetja (majhno, srednje, 

veliko) – dve dummy spremenljivki 

malo 

srednje 

Veliko 

x 1 

1 

0 

0 

x 2 

0 

1 

0 

Kakovost regresijske enačbe 

• Multipli korelacijski koeficient – jakost 

odvisnosti med odvisno in k neodvisnimi 


• Multipli determinacijski koeficient – delež 

variance v odvisni spremenljivki, pojasnjen z 

variabilnostjo k neodvisnih spremenljivk 

• F-test – zanesljivost regresijske enačbe 

• t-test – zanesljivost regresijskih koeficientov 

18

Problemi pri izvajanju regresijske 

analize 

• Neodvisne spremenljivke so med seboj korelirane 

(multikolinearnost). Kolinearnost neodvisnih 

spremenljivk ugotavljamo z variance inflation factor 

(VIF). 

• VIF = 10 kaže na prisotnost kolinearnosti in 

izključimo pripadajočo spremenljivko 

1 

VIF = 

2 

1 − R 

• R 2 je determinacijski koeficient med i-to 

spremenljivko in ostalimi spremenljivkami 

Vpliv obrobnih vrednosti na 

regresijsko enačbo 

Problemi pri izvajanju regresijske 

analize 

• Obrobne vrednosti z vplivom na regresijsko 

enačbo 

• Vzroki za pojav obrobnih vrednosti 

–Netipično obnašanje enote v vzorcu 

– Napaka pri vnosu podatkov 

• Kako jih odkrijemo? 

– Standardizirana vrednost reziduala večja od 3 

– Cookova razdalja (Cook’s distance) ≥ 1 

Reziduali 

• Reziduali so normalno porazdeljene slučajne 

spremenljivke s povprečno vrednostjo nič in 

standardnim odklonom 1 

• Homoskedastičnost – varianca residualov je 

konstantna pri vseh vrednostih odvisne 

spremenljivke 

• Nekoreliranost rezidualov – Durbin-Watsonov test 

• DW > 2 ⇒ prisotnost negativne korelacije 

• DW < 2 ⇒ prisotnost pozitivne korelacije 

• DW < 1 ali DW > 3 kažejo na problem kolinearnosti 

med reziduali 

Analiza rezidualov Primer 5.2 

Problem 

• Podjetje prodaja svoje izdelke na 40 

prodajnih področjih in proučuje odvisnost 

prodaje od 

– števila propagandnih akcij 

– števila trgovskih potnikov 

Podatki 

• Podjetje je zbralo podatke o prodaji in številu 

propagandnih akcij in številu trgovskih 

potnikov na 40 prodajnih področjih. 

19

Model Summary 

Rezultati 

,935a Adjusted R 

Std. Error 

of the 

Model R R Square Square Estimate 

1 

,874 ,867 451,65 

a. Predictors: (Constant), število trgovskih 

potnikov, propaganda 

ANOVA b 

5,2E+07 2 3,E+07 128,141 ,000a Sum of 

Mean 

Model 

Squares df Square F Sig. 

1 Regression 

Residual 7547456 37 203985 

Total 

6,0E+07 39 

a. Predictors: (Constant), število trgovskih potnikov, propaganda 

b. Dependent Variable: prodaja 

Primer 

• Podjetje želi proučiti vpliv stroškov 

propagande, števila prodajalcev v prodajalni 

in stroškov promocije na prodajo izdelka. V ta 

namen so zbrali podatke o prodaji v 10 

prodajalnah, podatke o stroških za 

propagando, število prodajalcev v 

prodajalnah in podatke o stroških za 

promocijo prodaje. 

Regresijska analiza s tremi 

neodvisnimi spremenljivkami 

Model Summary 

,892a Adjusted Std. Error of 

Model R R Square R Square the Estimate 

1 

,795 ,692 46,984 

a. Predictors: (Constant), promocija, oprod, propag 

Model 

1 

Regression 

Residual 

Total 

ANOVA b 

51339,714 3 17113,238 7,752 ,017a Sum of 

Squares df Mean Square F Sig. 

13245,186 6 2207,531 

64584,900 9 

a. Predictors: (Constant), promocija, oprod, propag 

b. Dependent Variable: prodaja 

Model 

1 

(Constant) 

propaganda 

število trgovskih 

potnikov 


Rezultati 



Coefficients 

Standar 

dized 

Coeffici 

ents 

B Std. Error Beta t Sig. 

693,285 231,555 2,994 ,005 

141,562 26,636 ,492 5,315 ,000 

375,313 69,593 ,500 5,393 ,000 

yˆ = 693, 

285 + 141, 

562x 

+ 375, 

313x 

X 1 – število propagandnih akcij 

X 2 – število trgovskih potnikov 

prodaja 

propag 

oprod 

promocija 

1 

Korelacijska analiza 

Pearson Correlation 

Sig. (2-tailed) 

N 



N 



N 



N 

2 

Correlations 

*. Correlation is significant at the 0.05 level (2-tailed). 

Model 

1 

prodaja propag oprod promocija 

1 ,727* ,731* ,613 

,017 ,016 ,059 

10 10 10 10 

,727* 1 ,475 ,739* 

,017 ,165 ,015 

10 10 10 10 

,731* ,475 1 ,157 

,016 ,165 ,665 

10 10 10 10 

,613 ,739* ,157 1 

,059 ,015 ,665 

10 10 10 10 

Model za tri neodvisne 

spremenljivke 

(Constant) 

propag 

oprod 

promocija 

a. 



Coefficients 


Standardized 

Coefficients 

B Std. Error Beta 

t Sig. 

9,163 61,541 ,149 ,887 

2,486 6,546 ,124 ,380 ,717 

24,215 8,890 ,606 2,724 ,034 

33,589 22,839 ,427 1,471 ,192 

20

Regresijska analiza z dvema 

neodvisnima spremenljivkama 

Model Summary 



1 

,721 ,641 50,738 

a. Predictors: (Constant), oprod, propag 

Model 

1 

(Constant) 

propag 

oprod 



Coefficients 


Standardized 

Coefficients 


t Sig. 

34,596 63,780 ,542 ,604 

9,845 4,557 ,490 2,161 ,068 

19,933 9,071 ,499 2,197 ,064 

Diskriminantna analiza 

Problemi: 

• v banki proučujejo lastnosti, po katerih se 

razlikujejo dobičkonosni od nedobičkonosnih 

komitentov. 

• V podjetju proučujejo lastnosti, po katerih se 

kupci njihovega izdelka razlikujejo od kupcev 

konkurenčnih izdelkov 

• V podjetju proučujejo dejavnosti v celotnem 

razvoju novega izdelka, ki vplivajo na uspeh 

ali neuspeh novega izdelka. 

Diskriminantna analiza z dvema 

skupinama 

• Vrednosti odvisne opisne spremenljivke so 

razvrščene v dve skupini 

• Diskriminantno funkcijo zapišemo: 

• D = a 1y 1 + a 2y 2 +…+ a ky k 

• kjer je: 

• D- vrednost diskriminantne funkcije 

• a j - koeficient diskriminantne funkcije pri spremenljivki y j 

• y j - j-ta neodvisna spremenljivka 

• Koeficienti izražajo relativni prispevek 

posamezne neodvisne spremenljivke k 

vrednosti diskriminantne funkcije; 

Regresijska analiza z dvema 

neodvisnima spremenljivkama 

Model Summary 



1 

,790 ,730 44,019 

a. Predictors: (Constant), promocija, oprod 

Model 

1 

(Constant) 

oprod 

promocija 



Coefficients 


Standardized 

Coefficients 


t Sig. 

11,435 57,384 ,199 ,848 

26,037 7,012 ,651 3,713 ,008 

40,219 13,793 ,511 2,916 ,022 

Diskriminantna analiza 

• Z njo proučujemo odvisnost med opisno odvisno 

spremenljivko in neodvisnimi številskimi 

spremenljivkami. 

• Oblikujemo diskriminantno funkcijo, kot linearno 

kombinacijo neodvisnih spremenljivk 

• Ugotavljamo, ali obstajajo značilne razlike med 

skupinami z vidika izbranih neodvisnih spremenljivk 

• Prispevek neodvisnih spremenljivk k razlikovanju 

med skupinami 

• Kakovost diskriminantne funkcije – odstotek pravilno 

razvrščenih enot z diskriminantno funkcijo 

Koeficienti v diskriminantni 

funkciji 

• Koeficienti diskriminantne funkcije so 

določeni tako, da je količnik med 

Variabilnost 

med skupinami 

Variabilnost 

znotrajskupin 

• maksimalen 

• Diskriminantne uteži so enake korelacijskim 

koeficientom med diskriminantnimi 

vrednostmi in vrednostmi neodvisnih 

spremenljivk. Izražajo pomen neodvisnih 

spremenljivk k razlikovanju med skupinami. 

21

Kakovost diskriminantne funkcije 

• Lastna vrednost (eigenvalue) je razmerje 

med vsoto kvadratov med skupinami in vsoto 

kvadratov znotraj skupin. Večja kot je njena 

vrednost, boljša je diskriminantna funkcija. 

• Wilk’s lambda je enaka količniku med vsoto 

kvadratov znotraj skupin in celotno vsoto 

kvadratov. 

– Njene vrednosti so med 0 in 1. 

– Vrednosti blizu nič kažejo na to, da so 

diskriminantne vrednosti med skupinami značilno 

različne med seboj. 


• Klasifikacijska matrika kaže število in odstotek 

pravilno in nepravilno razvrščenih enot 

Dejanska 

skupina 

1 

2 

Predvidena skupina 

1 

a 

c 

2 

b 

d 

Primer 5.3 

• Proučujemo lastnosti družin, ki vplivajo na odločitev 

družine, da zdravilišče obišče ali ne (dve skupini) 

• Odvisna spremenljivka je torej obisk zdravilišča, ki 

lahko zavzame dve vrednosti; da=1 in ne=2. 

• Družine so glede na vrednost odvisne spremenljivke 

razvrščene v dve skupini. 

• Obe skupini primerjamo glede na vrednost 

neodvisnih spremenljivk (lastnosti družine), ki morajo 

biti številske spremenljivke: 

– dohodek, 

– odnos do potovanja (intervalna skala 1-9) 

– pomen dopusta (intervalna skala 1-9) 

– velikost družine 

– starost starša 


• S hi-kvadrat testom testiramo domnevo, da 

so aritmetične sredine diskriminantnih 

vrednosti skupin enake. 

• Kanonična korelacija meri moč zveze med 

vrednostmi diskriminantne funkcije in 

spremenljivko (ali dummy spremenljivkami v 

primeru multiple diskriminantne analize), ki 

določa pripadnost skupini. 

• Centroid je povprečna vrednost 

diskriminantne funkcije za določeno skupino. 

Multipla diskriminantna analiza 

• Proučujemo odvisnost med opisno odvisno 

spremenljivko, katere opisne vrednosti so 

razvrščene v več skupin in med neodvisnimi 

številskimi spremenljivkami. 

• Oblikujemo lahko G-1 diskriminantnih funkcij, 

kjer je G število skupin. 

• Prva diskriminantna funkcija prispeva največ 

k razlikovanju, itd. 

Rezultati 

Eigenvalues 

1,786a % of Cumulative Canonical 

Function Eigenvalue Variance % Correlation 

1 

100,0 100,0 ,801 

a. First 1 canonical discriminant functions were used in the 

analysis. 

Test of Function(s) 

1 

Wilks' Lambda 

Wilks' 

Lambda Chi-square df Sig. 

,359 26,130 5 ,000 

S hi testom preverjamo hipotezo 

Ho: D 1 = 

D2 

22

Diskriminantna funkcija 

Standardized Canonical 

Discriminant Function Coefficients 

LETNI DOHODEK 

DRUŽINE 

ODNOS DO 

ZDRAVILIŠČ 

POMEN DRUŽINSKIH 

POČITNIC 

ŠTEVILO DRUŽINSKIH 

ČLANOV 

STAROST OČETA ALI 

MATERE 

Function 

1 

,743 

,096 

,233 

,469 

,209 

Centroidi 

Functions at Group Centroids 

OBISK ZDRAVILIŠČA 

1 

2 

Function 

1 

1,291 

-1,291 

Unstandardized canonical discriminant 

functions evaluated at group means 

Standardizirani 

koeficienti 

kažejo na 

relativni pomen 

spremenljivk pri 

razlikovanju med 

skupinama. 

Kakovost diskriminantnih funkcij 

Eigenvalues 

3,819a 93,9 93,9 ,890 

,247a % of Cumulative Canonical 

Function Eigenvalue Variance % Correlation 

1 

2 

6,1 100,0 ,445 

a. First 2 canonical discriminant functions were used in the 

analysis. 

Test of Function(s) 

1 through 2 

2 

Wilks' Lambda 

Wilks' 

Lambda Chi-square df Sig. 

,166 44,831 10 ,000 

,802 5,517 4 ,238 

Klasifikacijska matrika 

Classification Results a 

Predicted Group 

Membership 

OBISK ZDRAVILIŠČA 1 2 Total 

Original Count 1 

12 3 15 

2 

0 15 15 

% 1 

80,0 20,0 100,0 

2 

,0 100,0 100,0 

a. 90,0% of original grouped cases correctly classified. 

Klasifikacijska matrika prikazuje število z diskriminantno 

funkcijo pravilno razvrščenih enot v skupini 

Multipla diskriminantna analiza 

• Vzemimo primer, opisan pri enostavni 

diskriminantni analizi. Tokrat nas zanima, 

katere lastnosti družine prispevajo k višini 

porabljenega denarja na počitnicah. Enote v 

vzorcu bomo razvrstili v tri skupine: v eni 

skupini so tiste družine, ki porabijo malo 

denarja, v drugi tiste, ki porabijo srednje 

veliko denarja in v tretji skupini tiste, ki 

porabijo veliko denarja na počitnicah. 

LETNI DOHODEK 

DRUŽINE 

ŠTEVILO DRUŽINSKIH 

ČLANOV 

ODNOS DO 

ZDRAVILIŠČ 

POMEN DRUŽINSKIH 

POČITNIC 

Diskriminantne uteži 

Structure Matrix 

Function 

1 2 

,856* -,278 

,193* ,077 

,219 ,588* 

,149 ,454* 

STAROST OČETA ALI 

,166 ,341* 

MATERE 

Pooled within-groups correlations between 

discriminating variables and standardized 

canonical discriminant functions 

Variables ordered by absolute size of correlation 

within function. 

*. Largest absolute correlation between each 

variable and any discriminant function 

Prva funkcija je 

povezana s 

spremenljivkama 

letni dohodek 

družine in število 

družinskih članov. 

Druga funkcija pa z 

ostalimi 

spremenljivkami. 

23

Function 2 

3 

2 

1 

0 

-1 

-2 

-3 

Razsevni grafikon 

Canonical Discriminant Functions 

-4 

Function 1 

1 

-2 

2 

0 

2 

3 

4 

6 

ZNESEK DRUŽINE ZA LE 

Group Centroids 

Ungrouped Cases 

3 

2 

1 

Analiza skupin 

cluster analysis 

• Problemi: segmentacija tržišča, segmentacija 

dobaviteljev, strank podjetja, študentov, ipd 

• Uporablja pri razvrščanju enot v čim bolj 

homogene skupine, ki se pa med seboj čim 

bolj razlikujejo 

• Temeljne naloge pri analizi skupin 

–Določiti lastnosti enot pri razvrščanju – izbor 

ustreznih spremenljivk 

–Določiti merilo za določanje razlik 

–Določiti kriterij pri razvrščanju enot v skupine 

Merilo za določanje razlik med 

enotami 

• Obstaja več načinov merjenja razlik 

• Najbolj pogosto se uporablja evklidska razdalja 

d 

p 

2 

rs = 

j= 

1 

( x x ) 

∑ − 

rj 

sj 

2 

2 

• drs- 

kvadrirana evklidska razdalja 

• xrj – vrednost j-te spremenljivke pri enoti r 

• xsj – vrednost j-te spremenljivke pri enoti s 

Analize medsebojne odvisnosti 

(podobnosti) 

• Analiza skupin (cluster analysis) 

• Faktorska analiza 

Grafični prikaz združevanja 

Najpogostejši primer 

pred združevanjem 

Idealni primer 

združevanja enot v 

skupine 

Izbira metode za združevanje enot 

v skupine 

• Najbolj pogosto se uporablja Wardova 

metoda – minimizira variiranje znotraj skupin 

• Hierarhično razvrščanje enot v skupine 

– Število skupin na začetku je enako številu enot 

– V vsaki iteraciji še število skupin zmanjša za ena 

–Razvrščanje na višjem nivoju je odvisno od 

razvrščanja na nižjih nivojih 

– Ni potrebno vnaprej določiti število skupin 

• Nehierarhično razvrščanje enot v skupine – 

ni odvisno od predhodnih razvrščanj 

– Potrebno vnaprej določiti število želenih skupin 

24

Definicija raziskovalnega problema 

• Pravilni zbor značilnosti enot – spremenljivk, 

• Spremenljivke se določajo 

– Rezultati preteklih raziskovanj 

– Teorije 

– Hipotez, ki se preverjajo z raziskavo 

Odločanje o številu skupin 

Kriteriji za odločanje o številu skupin 

• Spoznanja teorije 

• Razlike, pri katerih pride do združevanja 

• Število enot v skupini ne sme biti premalo 

Grafični prikaz dveh metod 

združevanja enot v skupine 

Primer 6.1 

• Podjetje želi segmentirati svoje kupce glede 

na njihove nakupne navade. 20 njihovih 

kupcev je na intervalni skali od 1-7 izrazilo 

svoje mnenje o naslednjih trditvah 

– Nakupovanje je zabava (zabava) 

– Nakupovanje zmanjšuje družinski proračun 

(strošek) 

– Ob nakupovanju običajno ne kosim doma (kosilo) 

– Stremim za najugodnejšim nakupom (ugodno) 

– Nakupovanje me ne zanima (nezanima) 

– S primerljivo ceno lahko dosti prihranim 

(prihranek) 

Dendrogram Razvrstitev enot v skupine 

Cluster Membership 

Case 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

3 Clusters 

1 

2 

1 

3 

2 

1 

1 

1 

2 

3 

2 

1 

2 

3 

1 

3 

1 

3 

3 

2 

25

Faktorska analiza 

• Problem: pri proučevanju pojava uporabimo 

veliko med seboj odvisnih spremenljivk. 

Medsebojno odvisne spremenljivke združimo 

v nove spremenljivke – faktorje 

• Potek 

• Določitev spremenljivk in analiza njihove 

medsebojne odvisnosti 

• Določitev števila faktorjev 

• Vsebinska opredelitev faktorjev 

Metoda glavnih komponent 

• z 1 = a 11F 1 + a 12F 2 + … + a 1kF k 

• z 2 = a 21F 1 + a 22F 2 + … + a 2kF k 

• M 

• z k = a k1F 1 + a k2F 2 + … + a kkF k 

z i – standardizirana vrednost i-te spremenljivke 

F j – j-ti faktor 

a ij – faktorska utež pri i-ti spremenljivki in j-tem 

faktorju 

Faktorji so določeni tako, da prvi faktor pojasni 

največji del celotne variance, drugi največji 

del preostale nepojasnjene variance, itd.. 

Lastna vrednost 

• Izraža prispevek j-tega faktorja k pojasnitvi celotne 

variance 

• Opredeljena je z vsoto kvadratov faktorskih uteži za 

j-ti faktor 

2 

1 j 

2 

2 j 

2 

kj 

a + a + ... + a = λ 

• pri čemer velja 

• λ1 > λ2 > … > λk • Odstotek s k-tim faktorjem pojasnjene variance je 

λ 

100 

j 

k 

j 

Izbor spremenljivk 

• Poznavanje problema, študij literature 

pomaga pri izboru ustreznih spremenljivk 

• Velikost vzorca vsaj 4k, kjer je k število 

spremenljivk 

• Analiza odvisnosti med spremenljivkami 

– Barlettov test sferičnosti 

– Keiser-Meyer-Olkinova statistika (KMO), ki naj bo 

večja od 0,5 

Komunaliteta 

• Izraža prispevek m faktorjev k pojasnitvi 

celotne variance i-te spremenljivke; m < k 

• Komunaliteta je določena z: 

h = a + a + ... + a 

2 

i 

2 

i1 

2 

i 2 

2 

im 

• Delež nepojasnjene variance pri m faktorjih 

je 1 – h i 2 

Določitev števila faktorjev 

• Izkušnje 

• Faktorji z lastno vrednostjo λj, ki je večja od 

ena 

• Diagram lastnih vrednosti – prelom. 

• Odstotek celotne pojasnjene variance – vsaj 

60 % 

• Statistični test značilnosti faktorjev 

26

Poimenovanje faktorjev 

• Uporabimo faktorske uteži po rotaciji 

faktorjev 

• Vsebinski pomen in ime faktorja najbolj 

opredeljujejo spremenljivke z visoko 

vrednostjo faktorskih uteži 

• Rotacijo faktorjev – varimax metoda 

– Ortogonalna metoda 

– Da medsebojno neodvisne faktorje 

Correlation 

Analiza odvisnosti med 


V1 

V2 

V3 

V4 

V5 

V6 

V7 

V1 V2 

Correlation Matrix 

V3 V4 V5 V6 V7 

1.000 -.004 .628 .082 .675 -.100 -.338 

-.004 1.000 .151 -.248 .048 .582 -.251 

.628 .151 1.000 -.182 .480 .090 -.588 

.082 -.248 -.182 1.000 .272 .017 .469 

.675 .048 .480 .272 1.000 -.110 -.082 

-.100 .582 .090 .017 -.110 1.000 .014 

-.338 -.251 -.588 .469 -.082 .014 1.000 

KMO and Bartlett's Test 

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. 

Bartlett's Test of Sphericity 

Eigenvalue 

Approx. Chi-Square 

df 

Sig. 

.550 

57.994 

21 

.000 

Diagram lastnih vrednosti 

3.0 

2.5 

2.0 

1.5 

1.0 

.5 

0.0 

1 

Scree Plot 

2 

Component Number 

3 

4 

5 

6 

7 

Primer 6.2 

• Pri proučevanju odvisnosti med načinom preživljanja 

prostega časa in nakupnim obnašanjem bomo 

uporabili 7 spremenljivk 

• V1: Raje bi preživel-a miren večer doma, kot 

odšel(a) na zabavo. 

• V2: Vedno preverim ceno izdelka, tudi za izdelke z 

nizko ceno. 

• V3: Branje revij je zanimivejše od gledanja televizije. 

• V4: Odločitve o nakupu izdelka ne sprejemam pod 

vplivom oglaševanja. 

• V5: Najraje sem doma. 

• V6: Hranim in unovčim kupone za popust pri ceni. 

• V7: Podjetja potrošijo preveč denarja za 

oglaševanje. 

Lastne vrednosti in pojasnjena 

varianca 

Compon. 

1 

2 

3 

4 

5 

6 

7 

Total 

Initial Eigenvalues 

% of 

Variance 

Cumul. 

% 

Total 

Extraction Sums of 

Squared loadings 

% of 

Variance 

Cumul. 

% 

2,485 35,505 35,505 2,485 35,505 35,505 

1,821 26,013 61,518 1,821 26,013 61,518 

1,339 19,131 80,649 1,339 19,131 80,649 

0,508 7,258 87,907 

0,376 5,373 93,280 

0,279 3,990 97,270 

0,191 2,730 100,00 

Lastne vrednosti in pojasnjene 

variance po rotaciji 

Component 

1 

2 

3 

Rotation Sums of Squared Loadings 

Total 

2,315 

1,731 

1,599 

% of Variance 

33,076 

24,729 

22,844 

Cumulative 

% 

33,076 

57,805 

80,649 

27

Faktor 

F1 

F2 

F3 

V1 

V2 

V3 

V4 

V5 

V6 

V7 

Faktorske uteži 

Rotated Component Matrix a 

1 

Component 

2 3 

.897 -8.2E-02 -7.6E-02 

4.86E-02 -.232 .860 

.762 -.440 .125 

.214 .867 -5.2E-02 

.868 .224 -1.7E-02 

-5.7E-02 9.06E-02 .911 

-.351 .817 -7.3E-02 

Extraction Method: Principal Component Analysis. 

Rotation Method: Varimax with Kaiser Normalization. 

a. Rotation converged in 4 iterations. 

Poimenovanje faktorjev 

Spremenljivke 

V1, V3, V5 

V4, V7 

V2, V6 

Pojasnjena 

varianca 

33,1 % 

24,7 % 

22,8 % 

Ime faktorja 

Način preživljanja 

prostega časa 

Oglaševanje 

Cena in popusti 

Analiza notranje konzistentnosti 

faktorja (Reliability analysis) 

• Uporabimo, kadar želimo preveriti zanesljivost 

vnaprej opredeljenega faktorja 

• Preverimo pravilnost izbora spremenljivk, s katerim 

merimo faktor 

• Cronbach-ova α meri notranjo konzistentnost 

faktorja. Njena vrednost je odvisna od korelacijskih 

koeficientov med spremenljivkami, ki sestavljajo 

faktor. Višji so ti korelacijski koeficienti, večja je 

notranja konzistentnost faktorja, večja je 

Cronbachova α. 

• Izkustveno pravilo: Konzistentnost faktorja je 

zadovoljiva, če je Cronbachova α večja od 0,7. 

V1 

V2 

V3 

V4 

V5 

V6 

V7 

komunalitete 

Communalities 

Initial Extraction 

1.000 .818 

1.000 .796 

1.000 .790 

1.000 .800 

1.000 .805 

1.000 .841 

1.000 .796 

Extraction Method: Principal Component Analysis. 

Analiza konsistentnosti faktorja 

• Z njo merimo stopnjo homogenosti 

spremenljivk, s katerimi merimo faktor 

• Stopnjo konsistentnosti (zanesljivost faktorja) 

merimo s Cronbachovo α. 

• Vrednost Cronbachove α je odvisna od: 

– Homogenosti spremenljivk, s katerimi merimo 

faktor 

– Števila spremenljivk, s katerimi merimo faktor 

• Cronbach α zavzame vrednost med 0 in 1 

• Nunnaly (1978) predlaga minimalno vrednost 

0,7 

28

Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?