11.08.2013 Views

Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si

Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si

Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Metode</strong> <strong>raziskovanja</strong><br />

Majda BASTIČ<br />

<strong>Raziskovalni</strong> <strong>proces</strong><br />

Načrtovanje raziskave<br />

• Opredelitev raziskovalnega <strong>proces</strong>a<br />

• Izdelava koncepta raziskave<br />

• Izdelava instrumenta za zbiranje podatkov<br />

• Izbira vzorca<br />

• Pisanje raziskovalnega predloga<br />

Izvedba raziskave<br />

• Zbiranje podatkov<br />

• Obdelava podatkov<br />

• Pisanje raziskovalnega poročila<br />

<strong>Raziskovalni</strong> <strong>proces</strong> <strong>Vsebina</strong><br />

Vzorčenje<br />

• Je <strong>proces</strong> izbire manjšega števila enot iz<br />

statistične množice (populacije).<br />

• Vzorec je podmnožica statistične množice.<br />

• Vzorec je osnova za ocenjevanje vrednosti<br />

parametrov (povprečni dohodek na<br />

družinskega člana v Mariboru) ali<br />

napovedovanje izidov (volitev), ki se<br />

nanašajo na statistično množico.<br />

• Vzorčenje<br />

• Analiza podatkov<br />

• Kla<strong>si</strong>fikacija statističnih metod<br />

• Ugotavljanje razlik med aritmetičnimi<br />

sredinami<br />

• Analiza odvisnosti med številskimi<br />

spremenljivkami<br />

• Analiza medsebojne odvisnosti<br />

Vzorčenje<br />

1


Prednosti in slabosti<br />

• Prednosti<br />

– Prihranek v času<br />

– Prihranek v stroških<br />

– Prihranek v človeških virih<br />

• Slabosti<br />

– Ne dobimo informacij za statistično množico<br />

– Dobljene ocene utegnejo biti napačne<br />

Načela vzorčenja<br />

• Čim manjša vzorčna napaka: razlika med<br />

dejansko vrednostjo parametra in vrednostjo<br />

statistike (oceno parametra)<br />

• Večji kot je vzorec, manjša je vzorčna<br />

napaka.<br />

• Večja kot je variabilnost proučevane<br />

spremenljivke (njen standardni odklon), večja<br />

bo vzorčna napaka<br />

Primer<br />

• Vzemimo, da so v statistični množici 4 enote<br />

A<br />

B<br />

C<br />

D<br />

Povp.starost<br />

Stand. odklon<br />

18 let<br />

20 let<br />

23 let<br />

25 let<br />

21,5 let<br />

3,109<br />

Osnovni pojmi vzorčenja<br />

• Statistična množica ali populacija<br />

• Velikost statistične množice(N)<br />

• Vzorec<br />

• Velikost vzorca je enaka številu enot v vzorcu (n)<br />

• Vzorčna strategija je način izbiranja enot v vzorec<br />

• Vzorčna enota<br />

• Vzorčni okvir – seznam enot v statistični množici<br />

• Ugotovitve, dobljene iz vzorca, so vzorčne statistike<br />

Natančnost dobljene statistike<br />

Je odvisna od:<br />

• Velikosti vzorca<br />

• Variabilnosti spremenljivke<br />

– Pri enaki velikosti vzorca bo standardna napaka<br />

ocene večja, čim večja bo variabilnost<br />

spremenljivka<br />

Vzorčenje<br />

število enot v vzorcu<br />

• Vzemimo, da bosta v vzorcu 2 enoti<br />

Vzorec<br />

A, B<br />

A, C<br />

A, D<br />

B, C<br />

B, D<br />

C, D<br />

Povp. starost<br />

Stand. odklon<br />

Povp. starost<br />

19<br />

20,5<br />

21,5<br />

21,5<br />

22,5<br />

24<br />

21,5<br />

1,703<br />

2


Vzorčenje<br />

• Vzemimo, da bodo v vzorcu 3 enote<br />

Vzorec<br />

A, B, C<br />

A, B, D<br />

A, C, D<br />

B, C, D<br />

Povp. starost<br />

Stand. odklon<br />

Povp. starost<br />

20,33<br />

21<br />

22<br />

22,67<br />

21,5<br />

1,036<br />

Vzorčenje<br />

variabilnost med enotami<br />

• Vzemimo, da bosta v vzorcu 2 enoti<br />

Vzorec<br />

A, B<br />

A, C<br />

A, D<br />

B, C<br />

B, D<br />

C, D<br />

Povp. starost<br />

Stand. odklon<br />

Povp. starost<br />

19<br />

20,5<br />

19,5<br />

21,5<br />

20,5<br />

22<br />

20,5<br />

1,14<br />

Vrste vzorčenja<br />

1. Slučajno vzorčenje<br />

2. Ne-slučajno vzorčenje<br />

3. Mešano vzorčenje<br />

Primer 2<br />

variabilnost med enotami<br />

• Vzemimo, da so v statistični množici 4 enote<br />

A<br />

B<br />

C<br />

D<br />

Povp.starost<br />

Stand. odklon<br />

18 let<br />

20 let<br />

23 let<br />

21 let<br />

20,5 let<br />

2,08<br />

Cilji vzorčenja<br />

• Doseči čim večjo natančnost ocen<br />

parametrov<br />

• Izogniti pristranosti pri izbiri enot v vzorec.<br />

• Pristranost je posledica<br />

– Uporabe ne-slučajne metode vzorčenja<br />

–Vzorčni okvir ne zajema celotne populacije<br />

– Del populacije ni mogoče najti ali zavrača<br />

sodelovanje<br />

Kla<strong>si</strong>fikacija metod vzorčenja<br />

3


Slučajno vzorčenje<br />

• Slučajni vzorec: vsaka enota v populaciji ima<br />

enako in neodvisno možnost, da je izbrana v<br />

vzorec<br />

– Enako: za vsako enoto populacija obstaja enaka<br />

verjetnost, da bo izbrana v vzorec<br />

– Neodvisno: izbira enote v vzorec ni odvisna od<br />

izbora drugih enot<br />

• Prednosti: zaključki, dobljeni iz vzorca, se<br />

lahko posplošijo na statistično množico<br />

Sistem izbire enot pri slučajnem<br />

vzorčenju<br />

• Slučajno vzorčenje brez nadomeščanja<br />

– Izbrana enota se ne vrne v statistično množico<br />

– Verjetnost izbora posamezne enote ni enaka<br />

• Slučajno vzorčenje z nadomeščanjem<br />

– Izbrana enota se vrne v statistično množico<br />

– Verjetnost izbora posamezne enote je enaka za<br />

vse enote<br />

– Če je ista enota izbrana večkrat, se v vzorcu<br />

upošteva samo enkrat (prvič).<br />

Enostavno vzorčenje<br />

• Opredeli število v statistični množici (N),<br />

vsaka enota v statistični množici dobi svoj<br />

indeks ali zaporedno številko<br />

• Določi velikost vzorca (n)<br />

• Izberejo se enote v slučajni vzorec z<br />

– Žrebanjem<br />

– Tabelo slučajnih števil<br />

–Računalniškim programom – generator slučajnih<br />

števil<br />

<strong>Metode</strong> izbire enot pri slučajnem<br />

vzorčenju<br />

• Žrebanje (za male statistične množice)<br />

• Tabela slučajnih števil<br />

• Generator slučajnih števil – računalniški<br />

program<br />

<strong>Metode</strong> slučajnega<br />

(verjetnostnega) vzorčenja<br />

1. Enostavno slučajno vzorčenje<br />

2. Stratificirano slučajno vzorčenje<br />

1. Proporcionalno<br />

2. neproporcionalno<br />

3. Vzorčenje po skupinah<br />

1. Enostopenjsko<br />

2. Dvostopenjsko<br />

3. Večstopenjsko<br />

Stratificirano slučajno vzorčenje<br />

• Statistično populacijo razdelimo v stratume,<br />

tako da so enote znotraj stratumov glede na<br />

proučevano karakteristiko čim bolj homogene<br />

– Proporcionalno stratificirano vzorčenje<br />

• Delež stratuma v statistični množici<br />

• Število enot v vzorcu iz posameznega stratuma je enako<br />

– delež stratuma*velikost vzorca<br />

– Neproporcionalno stratificirano vzorčenje<br />

• Število enot v vzorcu iz posameznega stratuma<br />

– velikost vzorca : s številom stratumov<br />

4


Vzorčenje po skupinah (clustrih)<br />

• Primerno za:<br />

– velike statistične množice<br />

– Ni mogoče identificirate vseh enot statistične<br />

množice<br />

• Statistično množico razdelimo v skupine<br />

• Iz skupin se enote zbirajo v vzorec s<br />

slučajnostnim vzorčenjem<br />

Vzorčenje po principu kvot<br />

• Pri izboru enot v vzorec se uporabljajo vidne<br />

karakteristike enot (spol, rasa, barva las)<br />

• Določi lokacija(e) izbire enot: če se<br />

statistična enota z določenimi<br />

karakteristikami pojavi na določeni lokaciji<br />

postane element vzorca. Enote se na ta<br />

način nabirajo tako dolgo, dokler ni v vzorcu<br />

načrtovano število enot.<br />

Naključno vzorčenje<br />

• Enote se izbirajo naključno, torej brez<br />

upoštevanja pravil slučajnega vzorčenja in<br />

brez upoštevanja vidnih lastnosti statističnih<br />

enot<br />

• Pogosto uporablja pri tržnih in novinarskih<br />

raziskavah<br />

• Prednosti in slabosti so podobne kot pri<br />

vzorčenju po principu kvote<br />

Neslučajno vzorčenje<br />

• Vzorčenje po principu kvot<br />

• Naključno vzorčenje<br />

• Vzorčenje po presoji<br />

• Vzorčenje po principu kotaleče snežne kepe<br />

Prednosti in slabosti<br />

Prednosti<br />

• Cenejši način oblikovanja vzorca<br />

• Niso potrebni podatki o statistični množici<br />

Slabosti<br />

• Osebe, izbrane v vzorec, utegnejo imeti<br />

lastnosti, ki niso značilne za statistično<br />

množico<br />

• Zaključke, dobljene s pomočjo vzorca, ne<br />

smemo posplošiti na statistično množico<br />

Vzorčenje po presoji<br />

• Raziskovalec izbira enote v vzorec po presoji<br />

glede na njihovo poznavanje proučevanega<br />

problema.<br />

• Metoda vzorčenja je primerna za<br />

proučevanje pojavov, o katerih je zelo malo<br />

znanega.<br />

5


Vzorčenje po principu snežne kepe<br />

• Temelji na uporabi mrež: v vzorec se izbere<br />

nekaj enot skupine, ki priporočijo za<br />

vključitev v vzorec še druge enote. Te enote<br />

priporočijo za vključitev v vzorec spet druge<br />

enote, dokler ni doseženo načrtovano število<br />

enot v vzorcu.<br />

• Ta metoda zahteva malo podatkov o<br />

statistični množici.<br />

• Uporablja pri proučevanju:<br />

–načinov komuniciranja v skupini<br />

–Načinov prenosa znanja v skupini<br />

Izbira velikosti vzorca<br />

• Velikost vzorca je odvisna<br />

– Zahtevane natančnosti dobljenih ocen<br />

– Zahtevane zanesljivosti dobljenih ocen<br />

– Variabilnosti proučevane spremenljivke<br />

• Večji vzorec – večja natančnost in<br />

zanesljivost<br />

• Stroški raziskave odvisni od velikosti vzorca<br />

Izračun velikosti vzorca<br />

• Odstopanje od povprečne vrednosti je določeno z:<br />

( t<br />

α<br />

σ<br />

)<br />

n<br />

• kjer je<br />

• t α - vrednost spremenljivke t pri tveganju α<br />

• σ - standardni odklon za proučevano spremenljivko v<br />

statistični množici<br />

• n – velikost vzorca<br />

Mešano vzorčenje<br />

• Ima karakteristike tako slučajnega kot neslučajnega<br />

vzorčenja<br />

• Statistična populacija se razdeli v segmente,<br />

imenovane intervale<br />

• Iz prvega segmenta se enote izbirajo s<br />

slučajnim vzorčenjem. Isto slučajno število se<br />

uporabi pri izboru enote v drugih segmentih.<br />

• Izbira enote v prvem segmentu je<br />

slučajnostna, v drugih pa odvisna.<br />

• Širina intervala je enaka količniku med<br />

velikostjo statistične množice in vzorca.<br />

Primer<br />

• Vzemimo primer, ko želimo določiti povprečno<br />

starost študentov. Največje dovoljeno odstopanje od<br />

dejanske povprečne starosti je ± 0,5 leta. Interval za<br />

povprečno starost želimo določiti z 0,95 stopnjo<br />

zaupanja.<br />

• Interval zaupanja je določen z:<br />

xˆ = x ± ( t<br />

α<br />

σ<br />

)<br />

n<br />

Standardni odklon<br />

Za izračun velikosti vzorca potrebujemo<br />

vrednost standardnega odklona proučevane<br />

spremenljivke za statistično množico, ki ga<br />

določimo:<br />

• z uganjevanjem<br />

• posvetovanjem s strokovnjaki<br />

• iz predhodnih študij<br />

• njegovo vrednost izračunamo s pomočjo<br />

pilotne študije<br />

6


Izračun velikosti vzorca - primer<br />

• t0,05 = 1,96<br />

• σ = 1(vrednost ocenjena na enega od omenjenih<br />

načinov)<br />

• Odstopanje je 0,5<br />

t0, 05<br />

σ<br />

= 0,<br />

5<br />

n<br />

1,<br />

96<br />

1<br />

= 0,<br />

5<br />

n<br />

n = 15,<br />

37 ≅ 16<br />

Analiza podatkov<br />

Vrste podatkov<br />

• Številski podatki (numerični, kvantitativni,<br />

metric)<br />

– Zvezni (prihodek, starost)<br />

– Nezvezni ali diskretni (število družinskih članov)<br />

• Opisni (kvalitativni, non-metric)<br />

– Ordinalni opisni podatki<br />

Skale za merjenje spremenljivk<br />

Številske spremenljivke merimo na<br />

• Intervalni skali – ima vse lastnosti ordinalne<br />

skale in uporablja enoto mere<br />

• Razmernostni skali – ima vse lastnosti<br />

predhodnih skal in njena začetna točka se ne<br />

spreminja<br />

Izračun velikosti vzorca - primer<br />

• t0,05 = 1,96<br />

• σ = 2 (vrednost ocenjena na enega od omenjenih<br />

načinov)<br />

• Odstopanje je 0,5<br />

σ<br />

t0, 05 = 0,<br />

5<br />

n<br />

2<br />

1,<br />

96 = 0,<br />

5<br />

n<br />

n = 61,<br />

466 ≅ 61<br />

Skale za merjenje spremenljivk<br />

Opisne spremenljivke merimo na<br />

• Nominalni skali – enote razvrščamo po<br />

skupni značilnosti<br />

• Ordinalni skali – ima vse lastnosti nominalne<br />

skale in enote so razvrščene po določenem<br />

kriteriju<br />

– 1=velika podjetja<br />

– 2=srednje velika podjetja<br />

– 3=mala podjetja<br />

Parametri in statistike<br />

• Parameter – številska ali opisna značilnost<br />

statistične množice<br />

• Statistika - številska ali opisna značilnost<br />

statistične množice, ki jo ugotavljamo z<br />

vzorcem<br />

7


Parametri in statistike<br />

Srednje vrednosti<br />

• Aritmetična sredina<br />

• Mediana<br />

• Modus<br />

Mere variabilnosti<br />

• Variacijski razmik<br />

• Varianca<br />

• Standardni odklon<br />

Mere a<strong>si</strong>metrije in sploščenosti<br />

• Koeficient a<strong>si</strong>metrije (a<strong>si</strong>metrija v levo ali desno)<br />

• Koeficient sploščenosti (pozitiven – koničasta)<br />

Koničasta in sploščena<br />

porazdelitev<br />

Standardna napaka ocene<br />

aritmetične sredine<br />

je enaka standardnemu odklonu vzorčnih aritmetičnih<br />

sredin.<br />

Njena vrednost je določena z<br />

s<br />

SE = X<br />

n<br />

kjer je<br />

s – standardni odklon, izračun s podatki vzorca<br />

n – velikost vzorca<br />

Normalna in ne<strong>si</strong>metrični<br />

porazdelitvi<br />

Zanesljivost vzorca<br />

Standardna napaka ocene aritmetične sredine<br />

Primer za spremenljivko K4<br />

N Valid<br />

Mean<br />

Std. Error of Mean<br />

Median<br />

Mode<br />

Std. Deviation<br />

Variance<br />

Skewness<br />

Kurto<strong>si</strong>s<br />

Range<br />

Mis<strong>si</strong>ng<br />

214<br />

0<br />

5,3411<br />

,08986<br />

5,5000<br />

6,0000<br />

1,31460<br />

1,728<br />

-,651<br />

-,004<br />

6,00<br />

8


1<br />

c − x i<br />

Frekvenčna porazdelitev za K4<br />

Frequency<br />

70<br />

60<br />

50<br />

40<br />

30<br />

20<br />

10<br />

0<br />

0,00<br />

2,00<br />

4,00<br />

K4<br />

Histogram<br />

6,00<br />

8,00<br />

Mean =5,3411<br />

Std. Dev. =1,3146<br />

N =214<br />

Transformacija podatkov<br />

Logaritmiranje vrednosti – zmanjševanje pozitivne<br />

a<strong>si</strong>metrije<br />

Korenjenje vrednosti - zmanjševanje pozitivne<br />

a<strong>si</strong>metrije<br />

1<br />

Recipročna transformacija<br />

c − x<br />

Za zmanjševanje negativne a<strong>si</strong>metrije – vrednosti<br />

spremenljivke predhodno transformiramo z c – x i in<br />

nato uporabimo eno od opisanih transformacij.<br />

Razvrstitev univariatnih metod<br />

Je odvisna od:<br />

• vrste spremenljivke, ki jo analiziramo<br />

• števila vzorcev<br />

• povezave med vzorci<br />

i<br />

Obrobna vrednost<br />

• Se bistveno razlikuje od ostalih vrednosti<br />

spremenljivke.<br />

• Primer: ocene ocenjevalcev<br />

5, 4, 2, 5, 5, 5, 5<br />

Ocena tretjega ocenjevalca se bistveno<br />

razlikuje od ostalih.<br />

Kla<strong>si</strong>fikacija statističnih metod<br />

1. Univariatne metode – proučujemo le eno<br />

značilnost<br />

Analiza povprečij in variance<br />

2. Multivariatne metode – proučujemo več<br />

značilnosti hkrati<br />

Proučevanje ravni zveze med<br />

spremenljivkami<br />

Kla<strong>si</strong>fikacija univariatnih metod<br />

9


Kla<strong>si</strong>fikacije multivariatnih metod<br />

2 skupini multivariatnih metod:<br />

• metode za proučevanje odvisnosti med<br />

dvema skupinama spremenljivk (skupina<br />

odvisnih in skupina neodvisnih spremenljivk)<br />

• metode za proučevanje medsebojne<br />

odvisnosti (odvisnost med proučevanimi<br />

spremenljivkami, odvisne spremenljivke<br />

združimo v novo spremenljivko)<br />

Izbor multivariatne metode<br />

Je odvisen od tega, ali gre za<br />

• proučevanje odvisnosti med dvema skupinama<br />

spremenljivk<br />

– Števila spremenljivk v skupini odvisnih spremenljivk<br />

– Vrste spremenljivke<br />

• proučevanje medsebojne odvisnosti<br />

– Medsebojna odvisnost med spremenljivkami<br />

– Medsebojna odvisnost med subjekti<br />

Kla<strong>si</strong>fikacije multivariatnih metod Univariatne metode<br />

Domneva<br />

Izraža raziskovalno vprašanje.<br />

• Izhodiščna ali ničelna domneva (H o) izraža<br />

stanje, v katerem ni nobenih razlik med<br />

proučevanimi spremenljivkami.<br />

• Raziskovalna domneva (H 1) je trditev o<br />

neenakosti.<br />

• Domneva je<br />

– Dvostranska – se razlikuje…<br />

– Enostranska – je večje kot… je manjše kot..<br />

Ugotavljanje razlik med aritmetičnimi sredinami<br />

- domneva<br />

- statistično značilne razlike<br />

• Parametrični test<br />

- dva neodvisna vzorca<br />

- dva odvisna vzorca<br />

- analiza variance<br />

• Neparametrični test<br />

- za en vzorec<br />

- za dva neodvisna vzorca<br />

- za dva odvisna vzorca<br />

Primer za domnevo<br />

Ničelna domneva<br />

Pri nekem predmetu je povprečna ocena študentov, ki<br />

obiskujejo vaje, enaka povprečni oceni študentov, ki<br />

vaj ne obiskujejo.<br />

Dvostranska raziskovalna domneva<br />

Pri nekem predmetu povprečna ocena študentov, ki<br />

obiskujejo vaje, ni enaka povprečni oceni študentov,<br />

ki vaj ne obiskujejo.<br />

Enostranska raziskovalna domneva<br />

Pri nekem predmetu je povprečna ocena študentov, ki<br />

obiskujejo vaje, višja kot povprečna ocena<br />

študentov, ki vaj ne obiskujejo.<br />

10


Stopnja značilnosti<br />

Je tveganje, povezano s tem, da nismo 100 %<br />

gotovi, da je to kar proučujemo v raziskavi, to<br />

kar preverjamo.<br />

Stopnja značilnosti 0,05 (p < 0,05) pomeni, da<br />

obstaja 5 % možnost, da razlike, ki smo jih<br />

odkrili, niso posledica proučevanega vzroka,<br />

pač pa nekih drugih neznanih vzrokov.<br />

Parametrični test za ugotavljanje razlik<br />

med dvema povprečnima vrednostma<br />

Primer: proučujemo vpliv sredstev za<br />

izobraževanje na velikost prodaje<br />

prodajalcev v dveh skupinah podjetjih<br />

- tistih, ki namenjajo za izobraževanje<br />

manj kot 50 d.e. na prodajalca.<br />

- tistih, ki namenjajo za izobraževanje več<br />

kot 50 d.e. na prodajalca.<br />

Statistični test<br />

1. Postavitev ničelne domneve<br />

2. Izbira stopnje značilnosti<br />

3. Izbira primernega testa<br />

4. Izračun testne vrednosti in tveganja, da je<br />

ničelna domneva pravilna.<br />

5. Ničelno domnevo zavrnemo, če je<br />

izračunano tveganje (korak 4) manjše od<br />

izbrane stopnje značilnosti (korak 2)<br />

Ničelna<br />

domneva<br />

je<br />

Stopnja značilnosti<br />

Pravilna<br />

Nepravilna<br />

Naš zaključek<br />

Ničelno domnevo<br />

smo sprejeli<br />

Zaključek je<br />

pravilen.<br />

Zaključek je<br />

napačen.<br />

Napaka II. vrste.<br />

Postopek<br />

Ničelne domneve<br />

nismo sprejeli<br />

Zaključek je<br />

napačen.<br />

Napaka I. vrste<br />

Naš zaključek je<br />

pravilen.<br />

• Izberemo dva vzorca<br />

– v prvega izbiramo podjetja, ki namenjajo<br />

izobraževanju več kot 50 d.e.<br />

– v drugega izbiramo podjetja, ki namenjajo<br />

izobraževanju manj kot 50 d.e.<br />

• Izračunamo povprečno prodajo na prodajalca<br />

• Zaključek za celotno populacijo: ali so razlike<br />

nastale slučajno ali pa so posledica<br />

različnega vlaganja v izobraževanje<br />

prodajalcev.<br />

Testiranje razlik v povprečni vrednosti<br />

2 neodvisna vzorca<br />

Neodvisna vzorca<br />

z-test za neodvisne vzorce uporabimo<br />

• za velike vzorce<br />

• znana varianca statistične množice<br />

t-test za neodvisne vzorce uporabimo<br />

• za male vzorce<br />

Odvisna vzorca<br />

t-test za odvisne vzorce<br />

11


2 neodvisna vzorca<br />

primer 4.2.1<br />

Problem: Ali obstajajo značilne razlike v<br />

povprečni porabi določene pijače na dan<br />

med prebivalci toplejšega in prebivalci<br />

hladnejšega področja.<br />

Podatki: zbrali podatke o dnevni porabi<br />

proučevane pijače za 30 prebivalcev<br />

toplejšega in 30 prebivalcev hladnejšega<br />

področja.<br />

poraba<br />

skupina<br />

1<br />

2<br />

Rezultati<br />

Group Statistics<br />

N Mean Std. Deviation<br />

Std. Error<br />

Mean<br />

30 5,43 3,421 ,625<br />

30 5,53 2,063 ,377<br />

Dva odvisna vzorca<br />

primer 4.2.2<br />

Problem: analizirati želimo uspešnost<br />

izobraževalnega programa, ki jo merimo s<br />

številom opravljenih nalog v časovni enoti.<br />

Podatki: merili število opravljenih nalog v<br />

časovni enoti za 25 zaposlenih, izbranih v<br />

slučajni vzorec, in <strong>si</strong>cer:<br />

- pred izvedbo izobraževalnega programa<br />

- po izvedbi izobraževalnega programa<br />

Postopek<br />

1. Postavimo ničelno in raziskovalno domnevo<br />

• Ho : µ 1 = µ 2<br />

• H1 : µ 1 ≠µ 2<br />

2. Domneva je dvostranska<br />

3. Izberemo stopnjo značilnosti<br />

α = 0,05<br />

4. Uporabimo t-test za neodvisne vzorce in ga<br />

izvedemo s programom SPSS.<br />

poraba<br />

Equal variances<br />

assumed<br />

Equal variances<br />

not assumed<br />

Levene's Test<br />

for Equality of<br />

Variances<br />

Rezultati<br />

Independent Samples Test<br />

t-test for Equality of Means<br />

Std.<br />

95%<br />

Confidence<br />

Interval of the<br />

Difference<br />

Sig. Mean Error<br />

F Sig. t df (2-tailed) Differ. Differ. Lower Upper<br />

4,994 ,029 -,14 58 ,891 -,100 ,729 -1,560 1,360<br />

-,14 48 ,892 -,100 ,729 -1,567 1,367<br />

Verjetnost, da je domneva H o : µ 1 = µ 2 pravilna, je<br />

0,892<br />

Postopek<br />

1. Postavimo ničelno in raziskovalno domnevo<br />

• Ho = µ po = µ pred<br />

• H1 = µ po > µ pred<br />

2. Domneva je enostranska<br />

3. Izberemo stopnjo značilnosti<br />

α = 0,05<br />

4. Uporabimo t-test za odvisne vzorce, ki ga<br />

izvedemo s programom SPSS<br />

12


Pair<br />

1<br />

pred<br />

po<br />

Rezultati<br />

Paired Samples Statistics<br />

Mean N Std. Deviation<br />

Std. Error<br />

Mean<br />

6,32 25 1,725 ,345<br />

7,52 25 1,828 ,366<br />

Paired Samples Test<br />

Paired Differences<br />

95% Confidence<br />

Interval of the<br />

Std. Error Difference<br />

Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)<br />

Pair 1 pred - po -1,200 2,449 ,490 -2,211 -,189 -2,449 24 ,022<br />

Verjetnost, da je domneva H o pravilna, je 0,011.<br />

Domnevo H o zavrnemo in zaključimo, da so razlike<br />

v storilnosti posledica izobraževanja.<br />

ANOVA<br />

Primer 4.2.3<br />

• Problem: ugotoviti uspešnost treh različnih<br />

oglaševalnih akcij za nov proizvod<br />

• Podatki: 30 primerljivih trgovin razdelili v tri<br />

skupine po 10 trgovin.<br />

– V vsaki skupini trgovin izvedli eno od treh<br />

oglaševalnih akcij<br />

– Merili prodajo po končani oglaševalni akciji v vseh<br />

v vzorec zajetih trgovinah<br />

prodaja<br />

1<br />

2<br />

3<br />

Total<br />

prodaja<br />

Rezultati<br />

Descriptives<br />

95% Confidence<br />

Interval for Mean<br />

Std. Std. Lower Upper<br />

N Mean Deviation Error Bound Bound Minimum Maximum<br />

10 76,60 11,965 3,784 68,04 85,16 56 98<br />

10 85,20 6,197 1,960 80,77 89,63 78 99<br />

10 91,60 3,406 1,077 89,16 94,04 87 96<br />

30 84,47 9,951 1,817 80,75 88,18 56 99<br />

Between Groups<br />

Within Groups<br />

Total<br />

ANOVA<br />

Sum of<br />

Squares df Mean Square F Sig.<br />

1133,067 2 566,533 8,799 ,001<br />

1738,400 27 64,385<br />

2871,467 29<br />

ANOVA<br />

• Analiza razlik med povprečnimi vrednostmi<br />

za več kot dva neodvisna vzorca.<br />

• Celotno variiranje vrednosti je razdeljeno na<br />

– variiranje vrednosti zaradi razlik znotraj vzorcev<br />

– variiranje vrednosti zaradi razlik med vzorci<br />

Postopek<br />

• Postavitev domneve<br />

Ho: µ 1 = µ 2 = µ 3<br />

Ho: µ 1 ≠ µ 2 ≠µ 3<br />

• Stopnja značilnosti<br />

α = 0,05<br />

ANOVA test izvedemo s programom SPSS.<br />

Rezultati<br />

Primerjave med skupinami<br />

Dependent Variable: prodaja<br />

Tukey HSD<br />

(I) akcija<br />

1<br />

2<br />

3<br />

(J) akcija<br />

2<br />

3<br />

1<br />

3<br />

1<br />

2<br />

Multiple Comparisons<br />

Mean<br />

Difference<br />

Std.<br />

95% Confidence<br />

Interval<br />

Lower Upper<br />

(I-J) Error Sig. Bound Bound<br />

-8,600 3,588 ,060 -17,50 ,30<br />

-15,000* 3,588 ,001 -23,90 -6,10<br />

8,600 3,588 ,060 -,30 17,50<br />

-6,400 3,588 ,194 -15,30 2,50<br />

15,000* 3,588 ,001 6,10 23,90<br />

6,400 3,588 ,194 -2,50 15,30<br />

*.<br />

The mean difference is <strong>si</strong>gnificant at the .05 level.<br />

13


Neparametrični test<br />

Uporabljamo za ugotavljanje značilnosti razlik<br />

med povprečnimi vrednostmi za<br />

• opisne spremenljivke (merjene na ordinalni<br />

skali)<br />

• številske spremenljivke, ki niso normalno<br />

porazdeljene<br />

Neparametrični test za en vzorec<br />

• Kolmogorov-Smirnov test<br />

• Shapiro-Wilkov test<br />

Uporabljamo za preverjanje ničelne domneve,<br />

da je proučevana porazdelitev enaka<br />

normalni porazdelitvi.<br />

Ničelne domneve ne zavrnemo, če je<br />

verjetnost, da je ničelna domneva pravilna,<br />

večja od 0,05 (p > 0,05).<br />

Neparametrični test za dva<br />

neodvisna vzorca<br />

Uporabljamo<br />

• Mann-Whitneyev test<br />

• Wilcoxonov rank-sum test<br />

za ugotavljanje značilnosti razlik med dvema<br />

povprečnima vrednostma za neodvisne vzorce, ko<br />

• spremenljivka ni normalno porazdeljena<br />

• opisna spremenljivka je merjena na ordinalni skali<br />

Testa sta neparametrični ekvivalent parametričnemu ttestu.<br />

Vrednosti številske spremenljivke se pretvorijo v range.<br />

Rang 1 dobi najmanjša vrednost.<br />

Neparametrični test<br />

• Za en vzorec<br />

– Kolmogorov-Smirnov test<br />

– Shapiro-Wilkov test<br />

• Za dva neodvisna vzorca<br />

– Mann-Whitneyev test<br />

– Wilxoxonov rank-sum test<br />

• Za dva odvisna vzorca<br />

– Wilcoxonov <strong>si</strong>gned-rank test<br />

Primer 4.3.1<br />

• Problem: preveriti želimo, če je spremenljivka<br />

v 1 normalno porazdeljena.<br />

• Podatki: vrednosti spremenljivke v 1<br />

• Rezultat: p > 0,2; v 1 je normalno<br />

porazdeljena Tests of Normality<br />

Kolmogorov-Smirnov<br />

Statistic df Sig. Statistic df Sig.<br />

v1<br />

,135 20 ,200* ,938 20 ,219<br />

a<br />

Shapiro-Wilk<br />

*. This is a lower bound of the true <strong>si</strong>gnificance.<br />

a. Lilliefors Significance Correction<br />

Izračun testne statistike<br />

Ws<br />

−Ws<br />

z =<br />

SE<br />

W s<br />

SEws =<br />

n<br />

=<br />

Ws<br />

( 1<br />

2<br />

n + n + 1)<br />

1<br />

2<br />

n1<br />

n2(<br />

n1<br />

+ n2<br />

+ 1)<br />

12<br />

14


Wilcoxonov rank-sum test<br />

• Testna statistika je W s<br />

• Vrednost statistike W s je enaka<br />

– manjši vsoti rangov pri enako velikih skupinah<br />

– vsoti rangov manjše skupine pri neenako velikih<br />

skupinah<br />

• Vrednsot statistike W s je statistično značilna<br />

pri p < 0,05, če je njena absolutna<br />

standardizirana vrednost (z) večja od 1,96<br />

1. skupina<br />

2. skupina<br />

Opis problema<br />

Število bolniških<br />

Pred ukrepom<br />

Po ukrepu<br />

r1 pred r1 po<br />

r 2 pred<br />

Mann-Whitney U<br />

Wilcoxon W<br />

Z<br />

Asymp. Sig. (2-tailed)<br />

Exact Sig. [2*(1-tailed<br />

Sig.)]<br />

Exact Sig. (2-tailed)<br />

Exact Sig. (1-tailed)<br />

Point Probability<br />

r 2 po<br />

Rezultati<br />

Test Statistics b<br />

a. Not corrected for ties.<br />

b. Grouping Variable: skupina<br />

35,500 4,000<br />

90,500 59,000<br />

-1,105 -3,484<br />

,269 ,000<br />

,280 a<br />

,000 a<br />

bolpred bopo<br />

,288 ,000<br />

,144 ,000<br />

,013 ,000<br />

Izvajanje<br />

ukrepa<br />

Ne<br />

Da<br />

Primer 4.3.2<br />

• Problem: vpliv ukrepov za povečanje zadovoljstva<br />

zaposlenih na letno število bolniških zaostankov.<br />

• Podatki: 20 primerljivih podjetij razdelimo v dve<br />

skupini po 10 podjetij. V drugi skupini ukrepe<br />

izvajamo, v prvi pa ne.<br />

• Zanima nas, ali je<br />

• razlika v številu bolniških pred izvedbo ukrepov med<br />

obema skupinama statistično značilna ter<br />

• ali je razlika v številu bolniških po izvedbi ukrepov<br />

med obema skupinama statistično značilna.<br />

– V vsaki skupini za vsako podjetje izmerimo število bolniških pred<br />

izvedbo ukrepov in po enem letu, ko so ukrepi končani.<br />

– Vrednosti spremenljivke število bolniških izostankov niso normalne<br />

porazdeljene.<br />

Reševanje<br />

• Neparametrični test za dva neodvisna vzorca<br />

• Rezultati s programom SPSS<br />

bolpred<br />

bopo<br />

skupina<br />

1<br />

2<br />

Total<br />

1<br />

2<br />

Total<br />

Ranks<br />

N Mean Rank Sum of Ranks<br />

10 11,95 119,50<br />

10<br />

20<br />

9,05 90,50<br />

10 15,10 151,00<br />

10<br />

20<br />

5,90 59,00<br />

Neparametrični test za dva odvisna<br />

vzorca<br />

• Uporabljamo<br />

Wilcoxonov <strong>si</strong>gned-rank test<br />

• za ugotavljanje značilnosti razlik med dvema<br />

povprečnima vrednostma za odvisne vzorce, ko:<br />

• spremenljivka ni normalno porazdeljena<br />

• opisna spremenljivka je merjena na ordinalni skali<br />

• Je neparametrični ekvivalent parametričnemu t-testu<br />

za odvisne vzorce<br />

Vrednosti številske spremenljivke se pretvorijo v range.<br />

Rang 1 dobi najmanjša vrednost.<br />

15


Wilcoxonov <strong>si</strong>gned-rank test<br />

• Testna statistika je T<br />

• Tvorita se dve vsoti rangov<br />

• Vsota rangov za pozitivne razlike<br />

• Vsota rangov za negativne razlike<br />

• Vrednost statistike T je enaka manjši od<br />

obeh vsot.<br />

• Vrednost statistike T je statistično značilna<br />

pri p < 0,05, če je njena absolutna<br />

standardizirana vrednost večja od 1,96.<br />

Rezultati za drugo skupino<br />

Descriptive Statisticsa N Mean Std. Deviation Minimum Maximum<br />

bolpred 10 164,00 22,706 130 200<br />

bopo<br />

a. skupina = 2<br />

10 101,00 79,505 30 300<br />

bopo - bolpred<br />

a. bopo < bolpred<br />

b. bopo > bolpred<br />

c. bopo = bolpred<br />

d. skupina = 2<br />

Negative Ranks<br />

Po<strong>si</strong>tive Ranks<br />

Ties<br />

Total<br />

Ranks d<br />

9a 5,22 47,00<br />

1b 0<br />

8,00 8,00<br />

c<br />

N Mean Rank Sum of Ranks<br />

10<br />

Analiza odvisnosti med številskimi<br />

spremenljivkami<br />

Ugotavljamo medsebojno odvisnost med<br />

dvema skupinama spremenljivk. V eni je<br />

odvisna spremenljivka, v drugi pa neodvisne.<br />

• Regre<strong>si</strong>ja – v obeh skupinah so številske<br />

spremenljivke<br />

– Enostavna regre<strong>si</strong>ja<br />

– Multipla regre<strong>si</strong>ja<br />

• Diskriminantna analiza – odvisnost med<br />

opisno odvisno in številskimi neodvisnimi<br />

spremenljivkami<br />

Primer<br />

• Problem: analiza razlik v številu bolniških<br />

izostankov pred in po izvedbi ukrepov za<br />

vsako skupino posebej.<br />

• Podatki enaki kot za primer 4.3.2, le da<br />

imamo sedaj dva odvisna vzorca.<br />

• Za vsako skupino posebej primerjamo razliko<br />

v številu bolniških izostankov pred in po<br />

izvedbi ukrepov.<br />

• Analizo razlik napravimo s Wilcoxonov<br />

<strong>si</strong>gned-rank test in programom SPSS<br />

Rezultati za drugo skupino<br />

Test Statistics b,c<br />

-1,990a bopo -<br />

bolpred<br />

Z<br />

Asymp. Sig. (2-tailed) ,047<br />

a. Based on po<strong>si</strong>tive ranks.<br />

b. Wilcoxon Signed Ranks Test<br />

c. skupina = 2<br />

Enostavna regre<strong>si</strong>ja<br />

• Enostavna regre<strong>si</strong>ja : proučujemo odvisnost<br />

med eno odvisno in eno neodvisno<br />

spremenljivko.<br />

• Z regre<strong>si</strong>jsko analizo ugotavljamo<br />

– Obliko odvisnosti: linearna, krivuljčna,…<br />

– Smer odvisnosti: pozitivna, negativna<br />

– Jakost odvisnosti: močna, slaba,…<br />

• Velikost vzorca<br />

– Vsaj 10 enot za vsako spremenljivko.<br />

16


y<br />

Linearna regre<strong>si</strong>jska enačba<br />

y = f ( x ) + e<br />

i<br />

= a<br />

o<br />

+ a<br />

1<br />

x<br />

i<br />

+ e<br />

y- odvisna spremenljivka<br />

x- neodvisna spremenljivka<br />

e- ostanek ali rezidual<br />

Korelacijski koeficient<br />

• Korelacijski koeficient kaže na jakost linearne<br />

zveze.<br />

– njegova vrednost se giblje med –1 in 1.<br />

Absolutna vrednost<br />

korelacijskega koeficienta<br />

0<br />

0,00 - 0,50<br />

0,51 - 0,79<br />

0,80 - 0,99<br />

1,00<br />

Primer 5.1<br />

i<br />

Moč linearne zveze<br />

ni<br />

slaba<br />

srednje močna<br />

močna<br />

popolna<br />

Problem<br />

• Podjetje prodaja svoje izdelke na 40<br />

prodajnih področjih in proučuje odvisnost<br />

prodaje od števila propagandnih akcij.<br />

Podatki<br />

• Podjetje je zbralo podatke o prodaji in številu<br />

propagandnih akcij na 40 prodajnih<br />

področjih.<br />

Rezultati: S programom SPSS in regre<strong>si</strong>jsko<br />

analizo so dobili naslednje rezultate<br />

Kakovost regre<strong>si</strong>jske enačbe<br />

• Določamo s:<br />

– korelacijskim koeficientom<br />

– determinacijskim koeficientom<br />

– F testom in stopnjo značilnosti<br />

– t testom in stopnjo značilnosti<br />

Dekompozicija celotne variance v<br />

regre<strong>si</strong>jski analizi<br />

2 n<br />

2 n<br />

2 2 2<br />

( y − y)<br />

= ( y − y)<br />

+ ( y yˆ<br />

) = σ + σ<br />

n<br />

∑ ˆ i ∑ i ∑ − i i<br />

xy ey<br />

i=<br />

1 i=<br />

1 i=<br />

1<br />

Rezultati<br />

Model Summary<br />

,880a Adjusted R<br />

Std. Error<br />

of the<br />

Model R R Square Square Estimate<br />

1<br />

,775 ,769 595,60<br />

a. Predictors: (Constant), propaganda<br />

ANOVA b<br />

4,6E+07 1 5,E+07 130,644 ,000a Sum of<br />

Mean<br />

Model<br />

Squares df Square F Sig.<br />

1 Regres<strong>si</strong>on<br />

Re<strong>si</strong>dual 1,3E+07 38 354742<br />

Total<br />

6,0E+07 39<br />

a. Predictors: (Constant), propaganda<br />

b.<br />

Dependent Variable: prodaja<br />

17


Rezultati<br />

Coefficients a<br />

Unstandardized<br />

Coefficients<br />

Standar<br />

dized<br />

Coeffici<br />

ents<br />

Model<br />

B Std. Error Beta t Sig.<br />

1 (Constant) 1354,34 259,065 5,228 ,000<br />

propaganda 253,077 22,142 ,880 11,430 ,000<br />

a. Dependent Variable: prodaja<br />

yˆ = 1354,<br />

34 +<br />

253,<br />

077x<br />

Multipla regre<strong>si</strong>ja<br />

• S pomočjo vzorca dobimo ocene regre<strong>si</strong>jskih<br />

koeficientov<br />

yˆ = â + â x + â x + ... + â<br />

i<br />

0<br />

1 i1<br />

â j − parcialni regre<strong>si</strong>jski<br />

koeficient<br />

2<br />

i2<br />

<strong>Metode</strong> za izbor neodvisnih<br />

spremenljivk v model<br />

• Hierarhične metode<br />

– Backward metoda – v model vključimo vse spremenljivke,<br />

nato postopno izločamo tiste spremenljivke z najmanjšo<br />

vrednostjo parcialnega F.<br />

2 2<br />

2<br />

( σ −σ<br />

) /<br />

F σ<br />

par =<br />

xy(<br />

v )<br />

xy(<br />

zun )<br />

xy(<br />

v )<br />

– Forward metoda – v model vključimo eno spremenljivko z<br />

največjim korelacijskim koeficientom, nato pa postopno<br />

vključujemo spremenljivke z največjo vrednostjo parcialnega<br />

F.<br />

– Stepwise metoda – podobna forward metodi, le da<br />

opazujemo parcialne F za spremenljivke v modelu in izven<br />

njega.<br />

• Nehierarhične metode – tvorimo regre<strong>si</strong>jske modele<br />

za vse možne kombinacije neodvisnih spremenljivk.<br />

k<br />

x<br />

ik<br />

Multipla regre<strong>si</strong>ja<br />

• Proučujemo odvisnost ene odvisne<br />

spremenljivke od več neodvisnih<br />

spremenljivk<br />

• Regre<strong>si</strong>jska enačba<br />

• y i = a o +a 1x i1+a 2x i2+…+a ikx k+e i<br />

• y i – vrednost odvisne spremenljivke pri i-ti enoti<br />

• a k – vrednost regre<strong>si</strong>jskega koeficienta pri k-ti neodvisni<br />

spremenljivki<br />

• x ik – vrednost k-te neodvisne spremenljivke pri i-ti enoti<br />

Regre<strong>si</strong>jska analiza in opisna<br />

spremenljivka<br />

• Opisne spremenljivke vključimo v regre<strong>si</strong>jsko analizo z ‘dummy’<br />

spremenljivkami. Potrebujemo m-1 dummy spremenljivk, kjer je<br />

m število skupin, določenih z opisno spremenljivko.<br />

Primer1: spremenljivka spol – ena spremenljivka<br />

– moški = 0<br />

– ženska = 1<br />

Primer 2: spremenljivka velikost podjetja (majhno, srednje,<br />

veliko) – dve dummy spremenljivki<br />

malo<br />

srednje<br />

Veliko<br />

x 1<br />

1<br />

0<br />

0<br />

x 2<br />

0<br />

1<br />

0<br />

Kakovost regre<strong>si</strong>jske enačbe<br />

• Multipli korelacijski koeficient – jakost<br />

odvisnosti med odvisno in k neodvisnimi<br />

spremenljivkami<br />

• Multipli determinacijski koeficient – delež<br />

variance v odvisni spremenljivki, pojasnjen z<br />

variabilnostjo k neodvisnih spremenljivk<br />

• F-test – zanesljivost regre<strong>si</strong>jske enačbe<br />

• t-test – zanesljivost regre<strong>si</strong>jskih koeficientov<br />

18


Problemi pri izvajanju regre<strong>si</strong>jske<br />

analize<br />

• Neodvisne spremenljivke so med seboj korelirane<br />

(multikolinearnost). Kolinearnost neodvisnih<br />

spremenljivk ugotavljamo z variance inflation factor<br />

(VIF).<br />

• VIF = 10 kaže na prisotnost kolinearnosti in<br />

izključimo pripadajočo spremenljivko<br />

1<br />

VIF =<br />

2<br />

1 − R<br />

• R 2 je determinacijski koeficient med i-to<br />

spremenljivko in ostalimi spremenljivkami<br />

Vpliv obrobnih vrednosti na<br />

regre<strong>si</strong>jsko enačbo<br />

Problemi pri izvajanju regre<strong>si</strong>jske<br />

analize<br />

• Obrobne vrednosti z vplivom na regre<strong>si</strong>jsko<br />

enačbo<br />

• Vzroki za pojav obrobnih vrednosti<br />

–Netipično obnašanje enote v vzorcu<br />

– Napaka pri vnosu podatkov<br />

• Kako jih odkrijemo?<br />

– Standardizirana vrednost reziduala večja od 3<br />

– Cookova razdalja (Cook’s distance) ≥ 1<br />

Reziduali<br />

• Reziduali so normalno porazdeljene slučajne<br />

spremenljivke s povprečno vrednostjo nič in<br />

standardnim odklonom 1<br />

• Homoskedastičnost – varianca re<strong>si</strong>dualov je<br />

konstantna pri vseh vrednostih odvisne<br />

spremenljivke<br />

• Nekoreliranost rezidualov – Durbin-Watsonov test<br />

• DW > 2 ⇒ prisotnost negativne korelacije<br />

• DW < 2 ⇒ prisotnost pozitivne korelacije<br />

• DW < 1 ali DW > 3 kažejo na problem kolinearnosti<br />

med reziduali<br />

Analiza rezidualov Primer 5.2<br />

Problem<br />

• Podjetje prodaja svoje izdelke na 40<br />

prodajnih področjih in proučuje odvisnost<br />

prodaje od<br />

– števila propagandnih akcij<br />

– števila trgovskih potnikov<br />

Podatki<br />

• Podjetje je zbralo podatke o prodaji in številu<br />

propagandnih akcij in številu trgovskih<br />

potnikov na 40 prodajnih področjih.<br />

19


Model Summary<br />

Rezultati<br />

,935a Adjusted R<br />

Std. Error<br />

of the<br />

Model R R Square Square Estimate<br />

1<br />

,874 ,867 451,65<br />

a. Predictors: (Constant), število trgovskih<br />

potnikov, propaganda<br />

ANOVA b<br />

5,2E+07 2 3,E+07 128,141 ,000a Sum of<br />

Mean<br />

Model<br />

Squares df Square F Sig.<br />

1 Regres<strong>si</strong>on<br />

Re<strong>si</strong>dual 7547456 37 203985<br />

Total<br />

6,0E+07 39<br />

a. Predictors: (Constant), število trgovskih potnikov, propaganda<br />

b. Dependent Variable: prodaja<br />

Primer<br />

• Podjetje želi proučiti vpliv stroškov<br />

propagande, števila prodajalcev v prodajalni<br />

in stroškov promocije na prodajo izdelka. V ta<br />

namen so zbrali podatke o prodaji v 10<br />

prodajalnah, podatke o stroških za<br />

propagando, število prodajalcev v<br />

prodajalnah in podatke o stroških za<br />

promocijo prodaje.<br />

Regre<strong>si</strong>jska analiza s tremi<br />

neodvisnimi spremenljivkami<br />

Model Summary<br />

,892a Adjusted Std. Error of<br />

Model R R Square R Square the Estimate<br />

1<br />

,795 ,692 46,984<br />

a. Predictors: (Constant), promocija, oprod, propag<br />

Model<br />

1<br />

Regres<strong>si</strong>on<br />

Re<strong>si</strong>dual<br />

Total<br />

ANOVA b<br />

51339,714 3 17113,238 7,752 ,017a Sum of<br />

Squares df Mean Square F Sig.<br />

13245,186 6 2207,531<br />

64584,900 9<br />

a. Predictors: (Constant), promocija, oprod, propag<br />

b. Dependent Variable: prodaja<br />

Model<br />

1<br />

(Constant)<br />

propaganda<br />

število trgovskih<br />

potnikov<br />

a. Dependent Variable: prodaja<br />

Rezultati<br />

Coefficients a<br />

Unstandardized<br />

Coefficients<br />

Standar<br />

dized<br />

Coeffici<br />

ents<br />

B Std. Error Beta t Sig.<br />

693,285 231,555 2,994 ,005<br />

141,562 26,636 ,492 5,315 ,000<br />

375,313 69,593 ,500 5,393 ,000<br />

yˆ = 693,<br />

285 + 141,<br />

562x<br />

+ 375,<br />

313x<br />

X 1 – število propagandnih akcij<br />

X 2 – število trgovskih potnikov<br />

prodaja<br />

propag<br />

oprod<br />

promocija<br />

1<br />

Korelacijska analiza<br />

Pearson Correlation<br />

Sig. (2-tailed)<br />

N<br />

Pearson Correlation<br />

Sig. (2-tailed)<br />

N<br />

Pearson Correlation<br />

Sig. (2-tailed)<br />

N<br />

Pearson Correlation<br />

Sig. (2-tailed)<br />

N<br />

2<br />

Correlations<br />

*. Correlation is <strong>si</strong>gnificant at the 0.05 level (2-tailed).<br />

Model<br />

1<br />

prodaja propag oprod promocija<br />

1 ,727* ,731* ,613<br />

,017 ,016 ,059<br />

10 10 10 10<br />

,727* 1 ,475 ,739*<br />

,017 ,165 ,015<br />

10 10 10 10<br />

,731* ,475 1 ,157<br />

,016 ,165 ,665<br />

10 10 10 10<br />

,613 ,739* ,157 1<br />

,059 ,015 ,665<br />

10 10 10 10<br />

Model za tri neodvisne<br />

spremenljivke<br />

(Constant)<br />

propag<br />

oprod<br />

promocija<br />

a.<br />

Dependent Variable: prodaja<br />

Unstandardized<br />

Coefficients<br />

Coefficients a<br />

Standardized<br />

Coefficients<br />

B Std. Error Beta<br />

t Sig.<br />

9,163 61,541 ,149 ,887<br />

2,486 6,546 ,124 ,380 ,717<br />

24,215 8,890 ,606 2,724 ,034<br />

33,589 22,839 ,427 1,471 ,192<br />

20


Regre<strong>si</strong>jska analiza z dvema<br />

neodvisnima spremenljivkama<br />

Model Summary<br />

,849a Adjusted Std. Error of<br />

Model R R Square R Square the Estimate<br />

1<br />

,721 ,641 50,738<br />

a. Predictors: (Constant), oprod, propag<br />

Model<br />

1<br />

(Constant)<br />

propag<br />

oprod<br />

a. Dependent Variable: prodaja<br />

Unstandardized<br />

Coefficients<br />

Coefficients a<br />

Standardized<br />

Coefficients<br />

B Std. Error Beta<br />

t Sig.<br />

34,596 63,780 ,542 ,604<br />

9,845 4,557 ,490 2,161 ,068<br />

19,933 9,071 ,499 2,197 ,064<br />

Diskriminantna analiza<br />

Problemi:<br />

• v banki proučujejo lastnosti, po katerih se<br />

razlikujejo dobičkonosni od nedobičkonosnih<br />

komitentov.<br />

• V podjetju proučujejo lastnosti, po katerih se<br />

kupci njihovega izdelka razlikujejo od kupcev<br />

konkurenčnih izdelkov<br />

• V podjetju proučujejo dejavnosti v celotnem<br />

razvoju novega izdelka, ki vplivajo na uspeh<br />

ali neuspeh novega izdelka.<br />

Diskriminantna analiza z dvema<br />

skupinama<br />

• Vrednosti odvisne opisne spremenljivke so<br />

razvrščene v dve skupini<br />

• Diskriminantno funkcijo zapišemo:<br />

• D = a 1y 1 + a 2y 2 +…+ a ky k<br />

• kjer je:<br />

• D- vrednost diskriminantne funkcije<br />

• a j - koeficient diskriminantne funkcije pri spremenljivki y j<br />

• y j - j-ta neodvisna spremenljivka<br />

• Koeficienti izražajo relativni prispevek<br />

posamezne neodvisne spremenljivke k<br />

vrednosti diskriminantne funkcije;<br />

Regre<strong>si</strong>jska analiza z dvema<br />

neodvisnima spremenljivkama<br />

Model Summary<br />

,889a Adjusted Std. Error of<br />

Model R R Square R Square the Estimate<br />

1<br />

,790 ,730 44,019<br />

a. Predictors: (Constant), promocija, oprod<br />

Model<br />

1<br />

(Constant)<br />

oprod<br />

promocija<br />

a. Dependent Variable: prodaja<br />

Unstandardized<br />

Coefficients<br />

Coefficients a<br />

Standardized<br />

Coefficients<br />

B Std. Error Beta<br />

t Sig.<br />

11,435 57,384 ,199 ,848<br />

26,037 7,012 ,651 3,713 ,008<br />

40,219 13,793 ,511 2,916 ,022<br />

Diskriminantna analiza<br />

• Z njo proučujemo odvisnost med opisno odvisno<br />

spremenljivko in neodvisnimi številskimi<br />

spremenljivkami.<br />

• Oblikujemo diskriminantno funkcijo, kot linearno<br />

kombinacijo neodvisnih spremenljivk<br />

• Ugotavljamo, ali obstajajo značilne razlike med<br />

skupinami z vidika izbranih neodvisnih spremenljivk<br />

• Prispevek neodvisnih spremenljivk k razlikovanju<br />

med skupinami<br />

• Kakovost diskriminantne funkcije – odstotek pravilno<br />

razvrščenih enot z diskriminantno funkcijo<br />

Koeficienti v diskriminantni<br />

funkciji<br />

• Koeficienti diskriminantne funkcije so<br />

določeni tako, da je količnik med<br />

Variabilnost<br />

med skupinami<br />

Variabilnost<br />

znotrajskupin<br />

• mak<strong>si</strong>malen<br />

• Diskriminantne uteži so enake korelacijskim<br />

koeficientom med diskriminantnimi<br />

vrednostmi in vrednostmi neodvisnih<br />

spremenljivk. Izražajo pomen neodvisnih<br />

spremenljivk k razlikovanju med skupinami.<br />

21


Kakovost diskriminantne funkcije<br />

• Lastna vrednost (eigenvalue) je razmerje<br />

med vsoto kvadratov med skupinami in vsoto<br />

kvadratov znotraj skupin. Večja kot je njena<br />

vrednost, boljša je diskriminantna funkcija.<br />

• Wilk’s lambda je enaka količniku med vsoto<br />

kvadratov znotraj skupin in celotno vsoto<br />

kvadratov.<br />

– Njene vrednosti so med 0 in 1.<br />

– Vrednosti blizu nič kažejo na to, da so<br />

diskriminantne vrednosti med skupinami značilno<br />

različne med seboj.<br />

Kakovost diskriminantne funkcije<br />

• Kla<strong>si</strong>fikacijska matrika kaže število in odstotek<br />

pravilno in nepravilno razvrščenih enot<br />

Dejanska<br />

skupina<br />

1<br />

2<br />

Predvidena skupina<br />

1<br />

a<br />

c<br />

2<br />

b<br />

d<br />

Primer 5.3<br />

• Proučujemo lastnosti družin, ki vplivajo na odločitev<br />

družine, da zdravilišče obišče ali ne (dve skupini)<br />

• Odvisna spremenljivka je torej obisk zdravilišča, ki<br />

lahko zavzame dve vrednosti; da=1 in ne=2.<br />

• Družine so glede na vrednost odvisne spremenljivke<br />

razvrščene v dve skupini.<br />

• Obe skupini primerjamo glede na vrednost<br />

neodvisnih spremenljivk (lastnosti družine), ki morajo<br />

biti številske spremenljivke:<br />

– dohodek,<br />

– odnos do potovanja (intervalna skala 1-9)<br />

– pomen dopusta (intervalna skala 1-9)<br />

– velikost družine<br />

– starost starša<br />

Kakovost diskriminantne funkcije<br />

• S hi-kvadrat testom testiramo domnevo, da<br />

so aritmetične sredine diskriminantnih<br />

vrednosti skupin enake.<br />

• Kanonična korelacija meri moč zveze med<br />

vrednostmi diskriminantne funkcije in<br />

spremenljivko (ali dummy spremenljivkami v<br />

primeru multiple diskriminantne analize), ki<br />

določa pripadnost skupini.<br />

• Centroid je povprečna vrednost<br />

diskriminantne funkcije za določeno skupino.<br />

Multipla diskriminantna analiza<br />

• Proučujemo odvisnost med opisno odvisno<br />

spremenljivko, katere opisne vrednosti so<br />

razvrščene v več skupin in med neodvisnimi<br />

številskimi spremenljivkami.<br />

• Oblikujemo lahko G-1 diskriminantnih funkcij,<br />

kjer je G število skupin.<br />

• Prva diskriminantna funkcija prispeva največ<br />

k razlikovanju, itd.<br />

Rezultati<br />

Eigenvalues<br />

1,786a % of Cumulative Canonical<br />

Function Eigenvalue Variance % Correlation<br />

1<br />

100,0 100,0 ,801<br />

a. First 1 canonical discriminant functions were used in the<br />

analy<strong>si</strong>s.<br />

Test of Function(s)<br />

1<br />

Wilks' Lambda<br />

Wilks'<br />

Lambda Chi-square df Sig.<br />

,359 26,130 5 ,000<br />

S hi testom preverjamo hipotezo<br />

Ho: D 1 =<br />

D2<br />

22


Diskriminantna funkcija<br />

Standardized Canonical<br />

Discriminant Function Coefficients<br />

LETNI DOHODEK<br />

DRUŽINE<br />

ODNOS DO<br />

ZDRAVILIŠČ<br />

POMEN DRUŽINSKIH<br />

POČITNIC<br />

ŠTEVILO DRUŽINSKIH<br />

ČLANOV<br />

STAROST OČETA ALI<br />

MATERE<br />

Function<br />

1<br />

,743<br />

,096<br />

,233<br />

,469<br />

,209<br />

Centroidi<br />

Functions at Group Centroids<br />

OBISK ZDRAVILIŠČA<br />

1<br />

2<br />

Function<br />

1<br />

1,291<br />

-1,291<br />

Unstandardized canonical discriminant<br />

functions evaluated at group means<br />

Standardizirani<br />

koeficienti<br />

kažejo na<br />

relativni pomen<br />

spremenljivk pri<br />

razlikovanju med<br />

skupinama.<br />

Kakovost diskriminantnih funkcij<br />

Eigenvalues<br />

3,819a 93,9 93,9 ,890<br />

,247a % of Cumulative Canonical<br />

Function Eigenvalue Variance % Correlation<br />

1<br />

2<br />

6,1 100,0 ,445<br />

a. First 2 canonical discriminant functions were used in the<br />

analy<strong>si</strong>s.<br />

Test of Function(s)<br />

1 through 2<br />

2<br />

Wilks' Lambda<br />

Wilks'<br />

Lambda Chi-square df Sig.<br />

,166 44,831 10 ,000<br />

,802 5,517 4 ,238<br />

Kla<strong>si</strong>fikacijska matrika<br />

Clas<strong>si</strong>fication Results a<br />

Predicted Group<br />

Membership<br />

OBISK ZDRAVILIŠČA 1 2 Total<br />

Original Count 1<br />

12 3 15<br />

2<br />

0 15 15<br />

% 1<br />

80,0 20,0 100,0<br />

2<br />

,0 100,0 100,0<br />

a. 90,0% of original grouped cases correctly clas<strong>si</strong>fied.<br />

Kla<strong>si</strong>fikacijska matrika prikazuje število z diskriminantno<br />

funkcijo pravilno razvrščenih enot v skupini<br />

Multipla diskriminantna analiza<br />

• Vzemimo primer, opisan pri enostavni<br />

diskriminantni analizi. Tokrat nas zanima,<br />

katere lastnosti družine prispevajo k višini<br />

porabljenega denarja na počitnicah. Enote v<br />

vzorcu bomo razvrstili v tri skupine: v eni<br />

skupini so tiste družine, ki porabijo malo<br />

denarja, v drugi tiste, ki porabijo srednje<br />

veliko denarja in v tretji skupini tiste, ki<br />

porabijo veliko denarja na počitnicah.<br />

LETNI DOHODEK<br />

DRUŽINE<br />

ŠTEVILO DRUŽINSKIH<br />

ČLANOV<br />

ODNOS DO<br />

ZDRAVILIŠČ<br />

POMEN DRUŽINSKIH<br />

POČITNIC<br />

Diskriminantne uteži<br />

Structure Matrix<br />

Function<br />

1 2<br />

,856* -,278<br />

,193* ,077<br />

,219 ,588*<br />

,149 ,454*<br />

STAROST OČETA ALI<br />

,166 ,341*<br />

MATERE<br />

Pooled within-groups correlations between<br />

discriminating variables and standardized<br />

canonical discriminant functions<br />

Variables ordered by absolute <strong>si</strong>ze of correlation<br />

within function.<br />

*. Largest absolute correlation between each<br />

variable and any discriminant function<br />

Prva funkcija je<br />

povezana s<br />

spremenljivkama<br />

letni dohodek<br />

družine in število<br />

družinskih članov.<br />

Druga funkcija pa z<br />

ostalimi<br />

spremenljivkami.<br />

23


Function 2<br />

3<br />

2<br />

1<br />

0<br />

-1<br />

-2<br />

-3<br />

Razsevni grafikon<br />

Canonical Discriminant Functions<br />

-4<br />

Function 1<br />

1<br />

-2<br />

2<br />

0<br />

2<br />

3<br />

4<br />

6<br />

ZNESEK DRUŽINE ZA LE<br />

Group Centroids<br />

Ungrouped Cases<br />

3<br />

2<br />

1<br />

Analiza skupin<br />

cluster analy<strong>si</strong>s<br />

• Problemi: segmentacija tržišča, segmentacija<br />

dobaviteljev, strank podjetja, študentov, ipd<br />

• Uporablja pri razvrščanju enot v čim bolj<br />

homogene skupine, ki se pa med seboj čim<br />

bolj razlikujejo<br />

• Temeljne naloge pri analizi skupin<br />

–Določiti lastnosti enot pri razvrščanju – izbor<br />

ustreznih spremenljivk<br />

–Določiti merilo za določanje razlik<br />

–Določiti kriterij pri razvrščanju enot v skupine<br />

Merilo za določanje razlik med<br />

enotami<br />

• Obstaja več načinov merjenja razlik<br />

• Najbolj pogosto se uporablja evklidska razdalja<br />

d<br />

p<br />

2<br />

rs =<br />

j=<br />

1<br />

( x x )<br />

∑ −<br />

rj<br />

sj<br />

2<br />

2<br />

• drs-<br />

kvadrirana evklidska razdalja<br />

• xrj – vrednost j-te spremenljivke pri enoti r<br />

• xsj – vrednost j-te spremenljivke pri enoti s<br />

Analize medsebojne odvisnosti<br />

(podobnosti)<br />

• Analiza skupin (cluster analy<strong>si</strong>s)<br />

• Faktorska analiza<br />

Grafični prikaz združevanja<br />

Najpogostejši primer<br />

pred združevanjem<br />

Idealni primer<br />

združevanja enot v<br />

skupine<br />

Izbira metode za združevanje enot<br />

v skupine<br />

• Najbolj pogosto se uporablja Wardova<br />

metoda – minimizira variiranje znotraj skupin<br />

• Hierarhično razvrščanje enot v skupine<br />

– Število skupin na začetku je enako številu enot<br />

– V vsaki iteraciji še število skupin zmanjša za ena<br />

–Razvrščanje na višjem nivoju je odvisno od<br />

razvrščanja na nižjih nivojih<br />

– Ni potrebno vnaprej določiti število skupin<br />

• Nehierarhično razvrščanje enot v skupine –<br />

ni odvisno od predhodnih razvrščanj<br />

– Potrebno vnaprej določiti število želenih skupin<br />

24


Definicija raziskovalnega problema<br />

• Pravilni zbor značilnosti enot – spremenljivk,<br />

• Spremenljivke se določajo<br />

– Rezultati preteklih raziskovanj<br />

– Teorije<br />

– Hipotez, ki se preverjajo z raziskavo<br />

Odločanje o številu skupin<br />

Kriteriji za odločanje o številu skupin<br />

• Spoznanja teorije<br />

• Razlike, pri katerih pride do združevanja<br />

• Število enot v skupini ne sme biti premalo<br />

Grafični prikaz dveh metod<br />

združevanja enot v skupine<br />

Primer 6.1<br />

• Podjetje želi segmentirati svoje kupce glede<br />

na njihove nakupne navade. 20 njihovih<br />

kupcev je na intervalni skali od 1-7 izrazilo<br />

svoje mnenje o naslednjih trditvah<br />

– Nakupovanje je zabava (zabava)<br />

– Nakupovanje zmanjšuje družinski proračun<br />

(strošek)<br />

– Ob nakupovanju običajno ne ko<strong>si</strong>m doma (ko<strong>si</strong>lo)<br />

– Stremim za najugodnejšim nakupom (ugodno)<br />

– Nakupovanje me ne zanima (nezanima)<br />

– S primerljivo ceno lahko dosti prihranim<br />

(prihranek)<br />

Dendrogram Razvrstitev enot v skupine<br />

Cluster Membership<br />

Case<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

8<br />

9<br />

10<br />

11<br />

12<br />

13<br />

14<br />

15<br />

16<br />

17<br />

18<br />

19<br />

20<br />

3 Clusters<br />

1<br />

2<br />

1<br />

3<br />

2<br />

1<br />

1<br />

1<br />

2<br />

3<br />

2<br />

1<br />

2<br />

3<br />

1<br />

3<br />

1<br />

3<br />

3<br />

2<br />

25


Faktorska analiza<br />

• Problem: pri proučevanju pojava uporabimo<br />

veliko med seboj odvisnih spremenljivk.<br />

Medsebojno odvisne spremenljivke združimo<br />

v nove spremenljivke – faktorje<br />

• Potek<br />

• Določitev spremenljivk in analiza njihove<br />

medsebojne odvisnosti<br />

• Določitev števila faktorjev<br />

• Vsebinska opredelitev faktorjev<br />

Metoda glavnih komponent<br />

• z 1 = a 11F 1 + a 12F 2 + … + a 1kF k<br />

• z 2 = a 21F 1 + a 22F 2 + … + a 2kF k<br />

• M<br />

• z k = a k1F 1 + a k2F 2 + … + a kkF k<br />

z i – standardizirana vrednost i-te spremenljivke<br />

F j – j-ti faktor<br />

a ij – faktorska utež pri i-ti spremenljivki in j-tem<br />

faktorju<br />

Faktorji so določeni tako, da prvi faktor pojasni<br />

največji del celotne variance, drugi največji<br />

del preostale nepojasnjene variance, itd..<br />

Lastna vrednost<br />

• Izraža prispevek j-tega faktorja k pojasnitvi celotne<br />

variance<br />

• Opredeljena je z vsoto kvadratov faktorskih uteži za<br />

j-ti faktor<br />

2<br />

1 j<br />

2<br />

2 j<br />

2<br />

kj<br />

a + a + ... + a = λ<br />

• pri čemer velja<br />

• λ1 > λ2 > … > λk • Odstotek s k-tim faktorjem pojasnjene variance je<br />

λ<br />

100<br />

j<br />

k<br />

j<br />

Izbor spremenljivk<br />

• Poznavanje problema, študij literature<br />

pomaga pri izboru ustreznih spremenljivk<br />

• Velikost vzorca vsaj 4k, kjer je k število<br />

spremenljivk<br />

• Analiza odvisnosti med spremenljivkami<br />

– Barlettov test sferičnosti<br />

– Keiser-Meyer-Olkinova statistika (KMO), ki naj bo<br />

večja od 0,5<br />

Komunaliteta<br />

• Izraža prispevek m faktorjev k pojasnitvi<br />

celotne variance i-te spremenljivke; m < k<br />

• Komunaliteta je določena z:<br />

h = a + a + ... + a<br />

2<br />

i<br />

2<br />

i1<br />

2<br />

i 2<br />

2<br />

im<br />

• Delež nepojasnjene variance pri m faktorjih<br />

je 1 – h i 2<br />

Določitev števila faktorjev<br />

• Izkušnje<br />

• Faktorji z lastno vrednostjo λj, ki je večja od<br />

ena<br />

• Diagram lastnih vrednosti – prelom.<br />

• Odstotek celotne pojasnjene variance – vsaj<br />

60 %<br />

• Statistični test značilnosti faktorjev<br />

26


Poimenovanje faktorjev<br />

• Uporabimo faktorske uteži po rotaciji<br />

faktorjev<br />

• Vsebinski pomen in ime faktorja najbolj<br />

opredeljujejo spremenljivke z visoko<br />

vrednostjo faktorskih uteži<br />

• Rotacijo faktorjev – varimax metoda<br />

– Ortogonalna metoda<br />

– Da medsebojno neodvisne faktorje<br />

Correlation<br />

Analiza odvisnosti med<br />

spremenljivkami<br />

V1<br />

V2<br />

V3<br />

V4<br />

V5<br />

V6<br />

V7<br />

V1 V2<br />

Correlation Matrix<br />

V3 V4 V5 V6 V7<br />

1.000 -.004 .628 .082 .675 -.100 -.338<br />

-.004 1.000 .151 -.248 .048 .582 -.251<br />

.628 .151 1.000 -.182 .480 .090 -.588<br />

.082 -.248 -.182 1.000 .272 .017 .469<br />

.675 .048 .480 .272 1.000 -.110 -.082<br />

-.100 .582 .090 .017 -.110 1.000 .014<br />

-.338 -.251 -.588 .469 -.082 .014 1.000<br />

KMO and Bartlett's Test<br />

Kaiser-Meyer-Olkin Measure of Sampling Adequacy.<br />

Bartlett's Test of Sphericity<br />

Eigenvalue<br />

Approx. Chi-Square<br />

df<br />

Sig.<br />

.550<br />

57.994<br />

21<br />

.000<br />

Diagram lastnih vrednosti<br />

3.0<br />

2.5<br />

2.0<br />

1.5<br />

1.0<br />

.5<br />

0.0<br />

1<br />

Scree Plot<br />

2<br />

Component Number<br />

3<br />

4<br />

5<br />

6<br />

7<br />

Primer 6.2<br />

• Pri proučevanju odvisnosti med načinom preživljanja<br />

prostega časa in nakupnim obnašanjem bomo<br />

uporabili 7 spremenljivk<br />

• V1: Raje bi preživel-a miren večer doma, kot<br />

odšel(a) na zabavo.<br />

• V2: Vedno preverim ceno izdelka, tudi za izdelke z<br />

nizko ceno.<br />

• V3: Branje revij je zanimivejše od gledanja televizije.<br />

• V4: Odločitve o nakupu izdelka ne sprejemam pod<br />

vplivom oglaševanja.<br />

• V5: Najraje sem doma.<br />

• V6: Hranim in unovčim kupone za popust pri ceni.<br />

• V7: Podjetja potrošijo preveč denarja za<br />

oglaševanje.<br />

Lastne vrednosti in pojasnjena<br />

varianca<br />

Compon.<br />

1<br />

2<br />

3<br />

4<br />

5<br />

6<br />

7<br />

Total<br />

Initial Eigenvalues<br />

% of<br />

Variance<br />

Cumul.<br />

%<br />

Total<br />

Extraction Sums of<br />

Squared loadings<br />

% of<br />

Variance<br />

Cumul.<br />

%<br />

2,485 35,505 35,505 2,485 35,505 35,505<br />

1,821 26,013 61,518 1,821 26,013 61,518<br />

1,339 19,131 80,649 1,339 19,131 80,649<br />

0,508 7,258 87,907<br />

0,376 5,373 93,280<br />

0,279 3,990 97,270<br />

0,191 2,730 100,00<br />

Lastne vrednosti in pojasnjene<br />

variance po rotaciji<br />

Component<br />

1<br />

2<br />

3<br />

Rotation Sums of Squared Loadings<br />

Total<br />

2,315<br />

1,731<br />

1,599<br />

% of Variance<br />

33,076<br />

24,729<br />

22,844<br />

Cumulative<br />

%<br />

33,076<br />

57,805<br />

80,649<br />

27


Faktor<br />

F1<br />

F2<br />

F3<br />

V1<br />

V2<br />

V3<br />

V4<br />

V5<br />

V6<br />

V7<br />

Faktorske uteži<br />

Rotated Component Matrix a<br />

1<br />

Component<br />

2 3<br />

.897 -8.2E-02 -7.6E-02<br />

4.86E-02 -.232 .860<br />

.762 -.440 .125<br />

.214 .867 -5.2E-02<br />

.868 .224 -1.7E-02<br />

-5.7E-02 9.06E-02 .911<br />

-.351 .817 -7.3E-02<br />

Extraction Method: Principal Component Analy<strong>si</strong>s.<br />

Rotation Method: Varimax with Kaiser Normalization.<br />

a. Rotation converged in 4 iterations.<br />

Poimenovanje faktorjev<br />

Spremenljivke<br />

V1, V3, V5<br />

V4, V7<br />

V2, V6<br />

Pojasnjena<br />

varianca<br />

33,1 %<br />

24,7 %<br />

22,8 %<br />

Ime faktorja<br />

Način preživljanja<br />

prostega časa<br />

Oglaševanje<br />

Cena in popusti<br />

Analiza notranje konzistentnosti<br />

faktorja (Reliability analy<strong>si</strong>s)<br />

• Uporabimo, kadar želimo preveriti zanesljivost<br />

vnaprej opredeljenega faktorja<br />

• Preverimo pravilnost izbora spremenljivk, s katerim<br />

merimo faktor<br />

• Cronbach-ova α meri notranjo konzistentnost<br />

faktorja. Njena vrednost je odvisna od korelacijskih<br />

koeficientov med spremenljivkami, ki sestavljajo<br />

faktor. Višji so ti korelacijski koeficienti, večja je<br />

notranja konzistentnost faktorja, večja je<br />

Cronbachova α.<br />

• Izkustveno pravilo: Konzistentnost faktorja je<br />

zadovoljiva, če je Cronbachova α večja od 0,7.<br />

V1<br />

V2<br />

V3<br />

V4<br />

V5<br />

V6<br />

V7<br />

komunalitete<br />

Communalities<br />

Initial Extraction<br />

1.000 .818<br />

1.000 .796<br />

1.000 .790<br />

1.000 .800<br />

1.000 .805<br />

1.000 .841<br />

1.000 .796<br />

Extraction Method: Principal Component Analy<strong>si</strong>s.<br />

Analiza kon<strong>si</strong>stentnosti faktorja<br />

• Z njo merimo stopnjo homogenosti<br />

spremenljivk, s katerimi merimo faktor<br />

• Stopnjo kon<strong>si</strong>stentnosti (zanesljivost faktorja)<br />

merimo s Cronbachovo α.<br />

• Vrednost Cronbachove α je odvisna od:<br />

– Homogenosti spremenljivk, s katerimi merimo<br />

faktor<br />

– Števila spremenljivk, s katerimi merimo faktor<br />

• Cronbach α zavzame vrednost med 0 in 1<br />

• Nunnaly (1978) predlaga minimalno vrednost<br />

0,7<br />

28

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!