Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si
Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si
Metode raziskovanja Raziskovalni proces Vsebina ... - Shrani.si
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Metode</strong> <strong>raziskovanja</strong><br />
Majda BASTIČ<br />
<strong>Raziskovalni</strong> <strong>proces</strong><br />
Načrtovanje raziskave<br />
• Opredelitev raziskovalnega <strong>proces</strong>a<br />
• Izdelava koncepta raziskave<br />
• Izdelava instrumenta za zbiranje podatkov<br />
• Izbira vzorca<br />
• Pisanje raziskovalnega predloga<br />
Izvedba raziskave<br />
• Zbiranje podatkov<br />
• Obdelava podatkov<br />
• Pisanje raziskovalnega poročila<br />
<strong>Raziskovalni</strong> <strong>proces</strong> <strong>Vsebina</strong><br />
Vzorčenje<br />
• Je <strong>proces</strong> izbire manjšega števila enot iz<br />
statistične množice (populacije).<br />
• Vzorec je podmnožica statistične množice.<br />
• Vzorec je osnova za ocenjevanje vrednosti<br />
parametrov (povprečni dohodek na<br />
družinskega člana v Mariboru) ali<br />
napovedovanje izidov (volitev), ki se<br />
nanašajo na statistično množico.<br />
• Vzorčenje<br />
• Analiza podatkov<br />
• Kla<strong>si</strong>fikacija statističnih metod<br />
• Ugotavljanje razlik med aritmetičnimi<br />
sredinami<br />
• Analiza odvisnosti med številskimi<br />
spremenljivkami<br />
• Analiza medsebojne odvisnosti<br />
Vzorčenje<br />
1
Prednosti in slabosti<br />
• Prednosti<br />
– Prihranek v času<br />
– Prihranek v stroških<br />
– Prihranek v človeških virih<br />
• Slabosti<br />
– Ne dobimo informacij za statistično množico<br />
– Dobljene ocene utegnejo biti napačne<br />
Načela vzorčenja<br />
• Čim manjša vzorčna napaka: razlika med<br />
dejansko vrednostjo parametra in vrednostjo<br />
statistike (oceno parametra)<br />
• Večji kot je vzorec, manjša je vzorčna<br />
napaka.<br />
• Večja kot je variabilnost proučevane<br />
spremenljivke (njen standardni odklon), večja<br />
bo vzorčna napaka<br />
Primer<br />
• Vzemimo, da so v statistični množici 4 enote<br />
A<br />
B<br />
C<br />
D<br />
Povp.starost<br />
Stand. odklon<br />
18 let<br />
20 let<br />
23 let<br />
25 let<br />
21,5 let<br />
3,109<br />
Osnovni pojmi vzorčenja<br />
• Statistična množica ali populacija<br />
• Velikost statistične množice(N)<br />
• Vzorec<br />
• Velikost vzorca je enaka številu enot v vzorcu (n)<br />
• Vzorčna strategija je način izbiranja enot v vzorec<br />
• Vzorčna enota<br />
• Vzorčni okvir – seznam enot v statistični množici<br />
• Ugotovitve, dobljene iz vzorca, so vzorčne statistike<br />
Natančnost dobljene statistike<br />
Je odvisna od:<br />
• Velikosti vzorca<br />
• Variabilnosti spremenljivke<br />
– Pri enaki velikosti vzorca bo standardna napaka<br />
ocene večja, čim večja bo variabilnost<br />
spremenljivka<br />
Vzorčenje<br />
število enot v vzorcu<br />
• Vzemimo, da bosta v vzorcu 2 enoti<br />
Vzorec<br />
A, B<br />
A, C<br />
A, D<br />
B, C<br />
B, D<br />
C, D<br />
Povp. starost<br />
Stand. odklon<br />
Povp. starost<br />
19<br />
20,5<br />
21,5<br />
21,5<br />
22,5<br />
24<br />
21,5<br />
1,703<br />
2
Vzorčenje<br />
• Vzemimo, da bodo v vzorcu 3 enote<br />
Vzorec<br />
A, B, C<br />
A, B, D<br />
A, C, D<br />
B, C, D<br />
Povp. starost<br />
Stand. odklon<br />
Povp. starost<br />
20,33<br />
21<br />
22<br />
22,67<br />
21,5<br />
1,036<br />
Vzorčenje<br />
variabilnost med enotami<br />
• Vzemimo, da bosta v vzorcu 2 enoti<br />
Vzorec<br />
A, B<br />
A, C<br />
A, D<br />
B, C<br />
B, D<br />
C, D<br />
Povp. starost<br />
Stand. odklon<br />
Povp. starost<br />
19<br />
20,5<br />
19,5<br />
21,5<br />
20,5<br />
22<br />
20,5<br />
1,14<br />
Vrste vzorčenja<br />
1. Slučajno vzorčenje<br />
2. Ne-slučajno vzorčenje<br />
3. Mešano vzorčenje<br />
Primer 2<br />
variabilnost med enotami<br />
• Vzemimo, da so v statistični množici 4 enote<br />
A<br />
B<br />
C<br />
D<br />
Povp.starost<br />
Stand. odklon<br />
18 let<br />
20 let<br />
23 let<br />
21 let<br />
20,5 let<br />
2,08<br />
Cilji vzorčenja<br />
• Doseči čim večjo natančnost ocen<br />
parametrov<br />
• Izogniti pristranosti pri izbiri enot v vzorec.<br />
• Pristranost je posledica<br />
– Uporabe ne-slučajne metode vzorčenja<br />
–Vzorčni okvir ne zajema celotne populacije<br />
– Del populacije ni mogoče najti ali zavrača<br />
sodelovanje<br />
Kla<strong>si</strong>fikacija metod vzorčenja<br />
3
Slučajno vzorčenje<br />
• Slučajni vzorec: vsaka enota v populaciji ima<br />
enako in neodvisno možnost, da je izbrana v<br />
vzorec<br />
– Enako: za vsako enoto populacija obstaja enaka<br />
verjetnost, da bo izbrana v vzorec<br />
– Neodvisno: izbira enote v vzorec ni odvisna od<br />
izbora drugih enot<br />
• Prednosti: zaključki, dobljeni iz vzorca, se<br />
lahko posplošijo na statistično množico<br />
Sistem izbire enot pri slučajnem<br />
vzorčenju<br />
• Slučajno vzorčenje brez nadomeščanja<br />
– Izbrana enota se ne vrne v statistično množico<br />
– Verjetnost izbora posamezne enote ni enaka<br />
• Slučajno vzorčenje z nadomeščanjem<br />
– Izbrana enota se vrne v statistično množico<br />
– Verjetnost izbora posamezne enote je enaka za<br />
vse enote<br />
– Če je ista enota izbrana večkrat, se v vzorcu<br />
upošteva samo enkrat (prvič).<br />
Enostavno vzorčenje<br />
• Opredeli število v statistični množici (N),<br />
vsaka enota v statistični množici dobi svoj<br />
indeks ali zaporedno številko<br />
• Določi velikost vzorca (n)<br />
• Izberejo se enote v slučajni vzorec z<br />
– Žrebanjem<br />
– Tabelo slučajnih števil<br />
–Računalniškim programom – generator slučajnih<br />
števil<br />
<strong>Metode</strong> izbire enot pri slučajnem<br />
vzorčenju<br />
• Žrebanje (za male statistične množice)<br />
• Tabela slučajnih števil<br />
• Generator slučajnih števil – računalniški<br />
program<br />
<strong>Metode</strong> slučajnega<br />
(verjetnostnega) vzorčenja<br />
1. Enostavno slučajno vzorčenje<br />
2. Stratificirano slučajno vzorčenje<br />
1. Proporcionalno<br />
2. neproporcionalno<br />
3. Vzorčenje po skupinah<br />
1. Enostopenjsko<br />
2. Dvostopenjsko<br />
3. Večstopenjsko<br />
Stratificirano slučajno vzorčenje<br />
• Statistično populacijo razdelimo v stratume,<br />
tako da so enote znotraj stratumov glede na<br />
proučevano karakteristiko čim bolj homogene<br />
– Proporcionalno stratificirano vzorčenje<br />
• Delež stratuma v statistični množici<br />
• Število enot v vzorcu iz posameznega stratuma je enako<br />
– delež stratuma*velikost vzorca<br />
– Neproporcionalno stratificirano vzorčenje<br />
• Število enot v vzorcu iz posameznega stratuma<br />
– velikost vzorca : s številom stratumov<br />
4
Vzorčenje po skupinah (clustrih)<br />
• Primerno za:<br />
– velike statistične množice<br />
– Ni mogoče identificirate vseh enot statistične<br />
množice<br />
• Statistično množico razdelimo v skupine<br />
• Iz skupin se enote zbirajo v vzorec s<br />
slučajnostnim vzorčenjem<br />
Vzorčenje po principu kvot<br />
• Pri izboru enot v vzorec se uporabljajo vidne<br />
karakteristike enot (spol, rasa, barva las)<br />
• Določi lokacija(e) izbire enot: če se<br />
statistična enota z določenimi<br />
karakteristikami pojavi na določeni lokaciji<br />
postane element vzorca. Enote se na ta<br />
način nabirajo tako dolgo, dokler ni v vzorcu<br />
načrtovano število enot.<br />
Naključno vzorčenje<br />
• Enote se izbirajo naključno, torej brez<br />
upoštevanja pravil slučajnega vzorčenja in<br />
brez upoštevanja vidnih lastnosti statističnih<br />
enot<br />
• Pogosto uporablja pri tržnih in novinarskih<br />
raziskavah<br />
• Prednosti in slabosti so podobne kot pri<br />
vzorčenju po principu kvote<br />
Neslučajno vzorčenje<br />
• Vzorčenje po principu kvot<br />
• Naključno vzorčenje<br />
• Vzorčenje po presoji<br />
• Vzorčenje po principu kotaleče snežne kepe<br />
Prednosti in slabosti<br />
Prednosti<br />
• Cenejši način oblikovanja vzorca<br />
• Niso potrebni podatki o statistični množici<br />
Slabosti<br />
• Osebe, izbrane v vzorec, utegnejo imeti<br />
lastnosti, ki niso značilne za statistično<br />
množico<br />
• Zaključke, dobljene s pomočjo vzorca, ne<br />
smemo posplošiti na statistično množico<br />
Vzorčenje po presoji<br />
• Raziskovalec izbira enote v vzorec po presoji<br />
glede na njihovo poznavanje proučevanega<br />
problema.<br />
• Metoda vzorčenja je primerna za<br />
proučevanje pojavov, o katerih je zelo malo<br />
znanega.<br />
5
Vzorčenje po principu snežne kepe<br />
• Temelji na uporabi mrež: v vzorec se izbere<br />
nekaj enot skupine, ki priporočijo za<br />
vključitev v vzorec še druge enote. Te enote<br />
priporočijo za vključitev v vzorec spet druge<br />
enote, dokler ni doseženo načrtovano število<br />
enot v vzorcu.<br />
• Ta metoda zahteva malo podatkov o<br />
statistični množici.<br />
• Uporablja pri proučevanju:<br />
–načinov komuniciranja v skupini<br />
–Načinov prenosa znanja v skupini<br />
Izbira velikosti vzorca<br />
• Velikost vzorca je odvisna<br />
– Zahtevane natančnosti dobljenih ocen<br />
– Zahtevane zanesljivosti dobljenih ocen<br />
– Variabilnosti proučevane spremenljivke<br />
• Večji vzorec – večja natančnost in<br />
zanesljivost<br />
• Stroški raziskave odvisni od velikosti vzorca<br />
Izračun velikosti vzorca<br />
• Odstopanje od povprečne vrednosti je določeno z:<br />
( t<br />
α<br />
σ<br />
)<br />
n<br />
• kjer je<br />
• t α - vrednost spremenljivke t pri tveganju α<br />
• σ - standardni odklon za proučevano spremenljivko v<br />
statistični množici<br />
• n – velikost vzorca<br />
Mešano vzorčenje<br />
• Ima karakteristike tako slučajnega kot neslučajnega<br />
vzorčenja<br />
• Statistična populacija se razdeli v segmente,<br />
imenovane intervale<br />
• Iz prvega segmenta se enote izbirajo s<br />
slučajnim vzorčenjem. Isto slučajno število se<br />
uporabi pri izboru enote v drugih segmentih.<br />
• Izbira enote v prvem segmentu je<br />
slučajnostna, v drugih pa odvisna.<br />
• Širina intervala je enaka količniku med<br />
velikostjo statistične množice in vzorca.<br />
Primer<br />
• Vzemimo primer, ko želimo določiti povprečno<br />
starost študentov. Največje dovoljeno odstopanje od<br />
dejanske povprečne starosti je ± 0,5 leta. Interval za<br />
povprečno starost želimo določiti z 0,95 stopnjo<br />
zaupanja.<br />
• Interval zaupanja je določen z:<br />
xˆ = x ± ( t<br />
α<br />
σ<br />
)<br />
n<br />
Standardni odklon<br />
Za izračun velikosti vzorca potrebujemo<br />
vrednost standardnega odklona proučevane<br />
spremenljivke za statistično množico, ki ga<br />
določimo:<br />
• z uganjevanjem<br />
• posvetovanjem s strokovnjaki<br />
• iz predhodnih študij<br />
• njegovo vrednost izračunamo s pomočjo<br />
pilotne študije<br />
6
Izračun velikosti vzorca - primer<br />
• t0,05 = 1,96<br />
• σ = 1(vrednost ocenjena na enega od omenjenih<br />
načinov)<br />
• Odstopanje je 0,5<br />
t0, 05<br />
σ<br />
= 0,<br />
5<br />
n<br />
1,<br />
96<br />
1<br />
= 0,<br />
5<br />
n<br />
n = 15,<br />
37 ≅ 16<br />
Analiza podatkov<br />
Vrste podatkov<br />
• Številski podatki (numerični, kvantitativni,<br />
metric)<br />
– Zvezni (prihodek, starost)<br />
– Nezvezni ali diskretni (število družinskih članov)<br />
• Opisni (kvalitativni, non-metric)<br />
– Ordinalni opisni podatki<br />
Skale za merjenje spremenljivk<br />
Številske spremenljivke merimo na<br />
• Intervalni skali – ima vse lastnosti ordinalne<br />
skale in uporablja enoto mere<br />
• Razmernostni skali – ima vse lastnosti<br />
predhodnih skal in njena začetna točka se ne<br />
spreminja<br />
Izračun velikosti vzorca - primer<br />
• t0,05 = 1,96<br />
• σ = 2 (vrednost ocenjena na enega od omenjenih<br />
načinov)<br />
• Odstopanje je 0,5<br />
σ<br />
t0, 05 = 0,<br />
5<br />
n<br />
2<br />
1,<br />
96 = 0,<br />
5<br />
n<br />
n = 61,<br />
466 ≅ 61<br />
Skale za merjenje spremenljivk<br />
Opisne spremenljivke merimo na<br />
• Nominalni skali – enote razvrščamo po<br />
skupni značilnosti<br />
• Ordinalni skali – ima vse lastnosti nominalne<br />
skale in enote so razvrščene po določenem<br />
kriteriju<br />
– 1=velika podjetja<br />
– 2=srednje velika podjetja<br />
– 3=mala podjetja<br />
Parametri in statistike<br />
• Parameter – številska ali opisna značilnost<br />
statistične množice<br />
• Statistika - številska ali opisna značilnost<br />
statistične množice, ki jo ugotavljamo z<br />
vzorcem<br />
7
Parametri in statistike<br />
Srednje vrednosti<br />
• Aritmetična sredina<br />
• Mediana<br />
• Modus<br />
Mere variabilnosti<br />
• Variacijski razmik<br />
• Varianca<br />
• Standardni odklon<br />
Mere a<strong>si</strong>metrije in sploščenosti<br />
• Koeficient a<strong>si</strong>metrije (a<strong>si</strong>metrija v levo ali desno)<br />
• Koeficient sploščenosti (pozitiven – koničasta)<br />
Koničasta in sploščena<br />
porazdelitev<br />
Standardna napaka ocene<br />
aritmetične sredine<br />
je enaka standardnemu odklonu vzorčnih aritmetičnih<br />
sredin.<br />
Njena vrednost je določena z<br />
s<br />
SE = X<br />
n<br />
kjer je<br />
s – standardni odklon, izračun s podatki vzorca<br />
n – velikost vzorca<br />
Normalna in ne<strong>si</strong>metrični<br />
porazdelitvi<br />
Zanesljivost vzorca<br />
Standardna napaka ocene aritmetične sredine<br />
Primer za spremenljivko K4<br />
N Valid<br />
Mean<br />
Std. Error of Mean<br />
Median<br />
Mode<br />
Std. Deviation<br />
Variance<br />
Skewness<br />
Kurto<strong>si</strong>s<br />
Range<br />
Mis<strong>si</strong>ng<br />
214<br />
0<br />
5,3411<br />
,08986<br />
5,5000<br />
6,0000<br />
1,31460<br />
1,728<br />
-,651<br />
-,004<br />
6,00<br />
8
1<br />
c − x i<br />
Frekvenčna porazdelitev za K4<br />
Frequency<br />
70<br />
60<br />
50<br />
40<br />
30<br />
20<br />
10<br />
0<br />
0,00<br />
2,00<br />
4,00<br />
K4<br />
Histogram<br />
6,00<br />
8,00<br />
Mean =5,3411<br />
Std. Dev. =1,3146<br />
N =214<br />
Transformacija podatkov<br />
Logaritmiranje vrednosti – zmanjševanje pozitivne<br />
a<strong>si</strong>metrije<br />
Korenjenje vrednosti - zmanjševanje pozitivne<br />
a<strong>si</strong>metrije<br />
1<br />
Recipročna transformacija<br />
c − x<br />
Za zmanjševanje negativne a<strong>si</strong>metrije – vrednosti<br />
spremenljivke predhodno transformiramo z c – x i in<br />
nato uporabimo eno od opisanih transformacij.<br />
Razvrstitev univariatnih metod<br />
Je odvisna od:<br />
• vrste spremenljivke, ki jo analiziramo<br />
• števila vzorcev<br />
• povezave med vzorci<br />
i<br />
Obrobna vrednost<br />
• Se bistveno razlikuje od ostalih vrednosti<br />
spremenljivke.<br />
• Primer: ocene ocenjevalcev<br />
5, 4, 2, 5, 5, 5, 5<br />
Ocena tretjega ocenjevalca se bistveno<br />
razlikuje od ostalih.<br />
Kla<strong>si</strong>fikacija statističnih metod<br />
1. Univariatne metode – proučujemo le eno<br />
značilnost<br />
Analiza povprečij in variance<br />
2. Multivariatne metode – proučujemo več<br />
značilnosti hkrati<br />
Proučevanje ravni zveze med<br />
spremenljivkami<br />
Kla<strong>si</strong>fikacija univariatnih metod<br />
9
Kla<strong>si</strong>fikacije multivariatnih metod<br />
2 skupini multivariatnih metod:<br />
• metode za proučevanje odvisnosti med<br />
dvema skupinama spremenljivk (skupina<br />
odvisnih in skupina neodvisnih spremenljivk)<br />
• metode za proučevanje medsebojne<br />
odvisnosti (odvisnost med proučevanimi<br />
spremenljivkami, odvisne spremenljivke<br />
združimo v novo spremenljivko)<br />
Izbor multivariatne metode<br />
Je odvisen od tega, ali gre za<br />
• proučevanje odvisnosti med dvema skupinama<br />
spremenljivk<br />
– Števila spremenljivk v skupini odvisnih spremenljivk<br />
– Vrste spremenljivke<br />
• proučevanje medsebojne odvisnosti<br />
– Medsebojna odvisnost med spremenljivkami<br />
– Medsebojna odvisnost med subjekti<br />
Kla<strong>si</strong>fikacije multivariatnih metod Univariatne metode<br />
Domneva<br />
Izraža raziskovalno vprašanje.<br />
• Izhodiščna ali ničelna domneva (H o) izraža<br />
stanje, v katerem ni nobenih razlik med<br />
proučevanimi spremenljivkami.<br />
• Raziskovalna domneva (H 1) je trditev o<br />
neenakosti.<br />
• Domneva je<br />
– Dvostranska – se razlikuje…<br />
– Enostranska – je večje kot… je manjše kot..<br />
Ugotavljanje razlik med aritmetičnimi sredinami<br />
- domneva<br />
- statistično značilne razlike<br />
• Parametrični test<br />
- dva neodvisna vzorca<br />
- dva odvisna vzorca<br />
- analiza variance<br />
• Neparametrični test<br />
- za en vzorec<br />
- za dva neodvisna vzorca<br />
- za dva odvisna vzorca<br />
Primer za domnevo<br />
Ničelna domneva<br />
Pri nekem predmetu je povprečna ocena študentov, ki<br />
obiskujejo vaje, enaka povprečni oceni študentov, ki<br />
vaj ne obiskujejo.<br />
Dvostranska raziskovalna domneva<br />
Pri nekem predmetu povprečna ocena študentov, ki<br />
obiskujejo vaje, ni enaka povprečni oceni študentov,<br />
ki vaj ne obiskujejo.<br />
Enostranska raziskovalna domneva<br />
Pri nekem predmetu je povprečna ocena študentov, ki<br />
obiskujejo vaje, višja kot povprečna ocena<br />
študentov, ki vaj ne obiskujejo.<br />
10
Stopnja značilnosti<br />
Je tveganje, povezano s tem, da nismo 100 %<br />
gotovi, da je to kar proučujemo v raziskavi, to<br />
kar preverjamo.<br />
Stopnja značilnosti 0,05 (p < 0,05) pomeni, da<br />
obstaja 5 % možnost, da razlike, ki smo jih<br />
odkrili, niso posledica proučevanega vzroka,<br />
pač pa nekih drugih neznanih vzrokov.<br />
Parametrični test za ugotavljanje razlik<br />
med dvema povprečnima vrednostma<br />
Primer: proučujemo vpliv sredstev za<br />
izobraževanje na velikost prodaje<br />
prodajalcev v dveh skupinah podjetjih<br />
- tistih, ki namenjajo za izobraževanje<br />
manj kot 50 d.e. na prodajalca.<br />
- tistih, ki namenjajo za izobraževanje več<br />
kot 50 d.e. na prodajalca.<br />
Statistični test<br />
1. Postavitev ničelne domneve<br />
2. Izbira stopnje značilnosti<br />
3. Izbira primernega testa<br />
4. Izračun testne vrednosti in tveganja, da je<br />
ničelna domneva pravilna.<br />
5. Ničelno domnevo zavrnemo, če je<br />
izračunano tveganje (korak 4) manjše od<br />
izbrane stopnje značilnosti (korak 2)<br />
Ničelna<br />
domneva<br />
je<br />
Stopnja značilnosti<br />
Pravilna<br />
Nepravilna<br />
Naš zaključek<br />
Ničelno domnevo<br />
smo sprejeli<br />
Zaključek je<br />
pravilen.<br />
Zaključek je<br />
napačen.<br />
Napaka II. vrste.<br />
Postopek<br />
Ničelne domneve<br />
nismo sprejeli<br />
Zaključek je<br />
napačen.<br />
Napaka I. vrste<br />
Naš zaključek je<br />
pravilen.<br />
• Izberemo dva vzorca<br />
– v prvega izbiramo podjetja, ki namenjajo<br />
izobraževanju več kot 50 d.e.<br />
– v drugega izbiramo podjetja, ki namenjajo<br />
izobraževanju manj kot 50 d.e.<br />
• Izračunamo povprečno prodajo na prodajalca<br />
• Zaključek za celotno populacijo: ali so razlike<br />
nastale slučajno ali pa so posledica<br />
različnega vlaganja v izobraževanje<br />
prodajalcev.<br />
Testiranje razlik v povprečni vrednosti<br />
2 neodvisna vzorca<br />
Neodvisna vzorca<br />
z-test za neodvisne vzorce uporabimo<br />
• za velike vzorce<br />
• znana varianca statistične množice<br />
t-test za neodvisne vzorce uporabimo<br />
• za male vzorce<br />
Odvisna vzorca<br />
t-test za odvisne vzorce<br />
11
2 neodvisna vzorca<br />
primer 4.2.1<br />
Problem: Ali obstajajo značilne razlike v<br />
povprečni porabi določene pijače na dan<br />
med prebivalci toplejšega in prebivalci<br />
hladnejšega področja.<br />
Podatki: zbrali podatke o dnevni porabi<br />
proučevane pijače za 30 prebivalcev<br />
toplejšega in 30 prebivalcev hladnejšega<br />
področja.<br />
poraba<br />
skupina<br />
1<br />
2<br />
Rezultati<br />
Group Statistics<br />
N Mean Std. Deviation<br />
Std. Error<br />
Mean<br />
30 5,43 3,421 ,625<br />
30 5,53 2,063 ,377<br />
Dva odvisna vzorca<br />
primer 4.2.2<br />
Problem: analizirati želimo uspešnost<br />
izobraževalnega programa, ki jo merimo s<br />
številom opravljenih nalog v časovni enoti.<br />
Podatki: merili število opravljenih nalog v<br />
časovni enoti za 25 zaposlenih, izbranih v<br />
slučajni vzorec, in <strong>si</strong>cer:<br />
- pred izvedbo izobraževalnega programa<br />
- po izvedbi izobraževalnega programa<br />
Postopek<br />
1. Postavimo ničelno in raziskovalno domnevo<br />
• Ho : µ 1 = µ 2<br />
• H1 : µ 1 ≠µ 2<br />
2. Domneva je dvostranska<br />
3. Izberemo stopnjo značilnosti<br />
α = 0,05<br />
4. Uporabimo t-test za neodvisne vzorce in ga<br />
izvedemo s programom SPSS.<br />
poraba<br />
Equal variances<br />
assumed<br />
Equal variances<br />
not assumed<br />
Levene's Test<br />
for Equality of<br />
Variances<br />
Rezultati<br />
Independent Samples Test<br />
t-test for Equality of Means<br />
Std.<br />
95%<br />
Confidence<br />
Interval of the<br />
Difference<br />
Sig. Mean Error<br />
F Sig. t df (2-tailed) Differ. Differ. Lower Upper<br />
4,994 ,029 -,14 58 ,891 -,100 ,729 -1,560 1,360<br />
-,14 48 ,892 -,100 ,729 -1,567 1,367<br />
Verjetnost, da je domneva H o : µ 1 = µ 2 pravilna, je<br />
0,892<br />
Postopek<br />
1. Postavimo ničelno in raziskovalno domnevo<br />
• Ho = µ po = µ pred<br />
• H1 = µ po > µ pred<br />
2. Domneva je enostranska<br />
3. Izberemo stopnjo značilnosti<br />
α = 0,05<br />
4. Uporabimo t-test za odvisne vzorce, ki ga<br />
izvedemo s programom SPSS<br />
12
Pair<br />
1<br />
pred<br />
po<br />
Rezultati<br />
Paired Samples Statistics<br />
Mean N Std. Deviation<br />
Std. Error<br />
Mean<br />
6,32 25 1,725 ,345<br />
7,52 25 1,828 ,366<br />
Paired Samples Test<br />
Paired Differences<br />
95% Confidence<br />
Interval of the<br />
Std. Error Difference<br />
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)<br />
Pair 1 pred - po -1,200 2,449 ,490 -2,211 -,189 -2,449 24 ,022<br />
Verjetnost, da je domneva H o pravilna, je 0,011.<br />
Domnevo H o zavrnemo in zaključimo, da so razlike<br />
v storilnosti posledica izobraževanja.<br />
ANOVA<br />
Primer 4.2.3<br />
• Problem: ugotoviti uspešnost treh različnih<br />
oglaševalnih akcij za nov proizvod<br />
• Podatki: 30 primerljivih trgovin razdelili v tri<br />
skupine po 10 trgovin.<br />
– V vsaki skupini trgovin izvedli eno od treh<br />
oglaševalnih akcij<br />
– Merili prodajo po končani oglaševalni akciji v vseh<br />
v vzorec zajetih trgovinah<br />
prodaja<br />
1<br />
2<br />
3<br />
Total<br />
prodaja<br />
Rezultati<br />
Descriptives<br />
95% Confidence<br />
Interval for Mean<br />
Std. Std. Lower Upper<br />
N Mean Deviation Error Bound Bound Minimum Maximum<br />
10 76,60 11,965 3,784 68,04 85,16 56 98<br />
10 85,20 6,197 1,960 80,77 89,63 78 99<br />
10 91,60 3,406 1,077 89,16 94,04 87 96<br />
30 84,47 9,951 1,817 80,75 88,18 56 99<br />
Between Groups<br />
Within Groups<br />
Total<br />
ANOVA<br />
Sum of<br />
Squares df Mean Square F Sig.<br />
1133,067 2 566,533 8,799 ,001<br />
1738,400 27 64,385<br />
2871,467 29<br />
ANOVA<br />
• Analiza razlik med povprečnimi vrednostmi<br />
za več kot dva neodvisna vzorca.<br />
• Celotno variiranje vrednosti je razdeljeno na<br />
– variiranje vrednosti zaradi razlik znotraj vzorcev<br />
– variiranje vrednosti zaradi razlik med vzorci<br />
Postopek<br />
• Postavitev domneve<br />
Ho: µ 1 = µ 2 = µ 3<br />
Ho: µ 1 ≠ µ 2 ≠µ 3<br />
• Stopnja značilnosti<br />
α = 0,05<br />
ANOVA test izvedemo s programom SPSS.<br />
Rezultati<br />
Primerjave med skupinami<br />
Dependent Variable: prodaja<br />
Tukey HSD<br />
(I) akcija<br />
1<br />
2<br />
3<br />
(J) akcija<br />
2<br />
3<br />
1<br />
3<br />
1<br />
2<br />
Multiple Comparisons<br />
Mean<br />
Difference<br />
Std.<br />
95% Confidence<br />
Interval<br />
Lower Upper<br />
(I-J) Error Sig. Bound Bound<br />
-8,600 3,588 ,060 -17,50 ,30<br />
-15,000* 3,588 ,001 -23,90 -6,10<br />
8,600 3,588 ,060 -,30 17,50<br />
-6,400 3,588 ,194 -15,30 2,50<br />
15,000* 3,588 ,001 6,10 23,90<br />
6,400 3,588 ,194 -2,50 15,30<br />
*.<br />
The mean difference is <strong>si</strong>gnificant at the .05 level.<br />
13
Neparametrični test<br />
Uporabljamo za ugotavljanje značilnosti razlik<br />
med povprečnimi vrednostmi za<br />
• opisne spremenljivke (merjene na ordinalni<br />
skali)<br />
• številske spremenljivke, ki niso normalno<br />
porazdeljene<br />
Neparametrični test za en vzorec<br />
• Kolmogorov-Smirnov test<br />
• Shapiro-Wilkov test<br />
Uporabljamo za preverjanje ničelne domneve,<br />
da je proučevana porazdelitev enaka<br />
normalni porazdelitvi.<br />
Ničelne domneve ne zavrnemo, če je<br />
verjetnost, da je ničelna domneva pravilna,<br />
večja od 0,05 (p > 0,05).<br />
Neparametrični test za dva<br />
neodvisna vzorca<br />
Uporabljamo<br />
• Mann-Whitneyev test<br />
• Wilcoxonov rank-sum test<br />
za ugotavljanje značilnosti razlik med dvema<br />
povprečnima vrednostma za neodvisne vzorce, ko<br />
• spremenljivka ni normalno porazdeljena<br />
• opisna spremenljivka je merjena na ordinalni skali<br />
Testa sta neparametrični ekvivalent parametričnemu ttestu.<br />
Vrednosti številske spremenljivke se pretvorijo v range.<br />
Rang 1 dobi najmanjša vrednost.<br />
Neparametrični test<br />
• Za en vzorec<br />
– Kolmogorov-Smirnov test<br />
– Shapiro-Wilkov test<br />
• Za dva neodvisna vzorca<br />
– Mann-Whitneyev test<br />
– Wilxoxonov rank-sum test<br />
• Za dva odvisna vzorca<br />
– Wilcoxonov <strong>si</strong>gned-rank test<br />
Primer 4.3.1<br />
• Problem: preveriti želimo, če je spremenljivka<br />
v 1 normalno porazdeljena.<br />
• Podatki: vrednosti spremenljivke v 1<br />
• Rezultat: p > 0,2; v 1 je normalno<br />
porazdeljena Tests of Normality<br />
Kolmogorov-Smirnov<br />
Statistic df Sig. Statistic df Sig.<br />
v1<br />
,135 20 ,200* ,938 20 ,219<br />
a<br />
Shapiro-Wilk<br />
*. This is a lower bound of the true <strong>si</strong>gnificance.<br />
a. Lilliefors Significance Correction<br />
Izračun testne statistike<br />
Ws<br />
−Ws<br />
z =<br />
SE<br />
W s<br />
SEws =<br />
n<br />
=<br />
Ws<br />
( 1<br />
2<br />
n + n + 1)<br />
1<br />
2<br />
n1<br />
n2(<br />
n1<br />
+ n2<br />
+ 1)<br />
12<br />
14
Wilcoxonov rank-sum test<br />
• Testna statistika je W s<br />
• Vrednost statistike W s je enaka<br />
– manjši vsoti rangov pri enako velikih skupinah<br />
– vsoti rangov manjše skupine pri neenako velikih<br />
skupinah<br />
• Vrednsot statistike W s je statistično značilna<br />
pri p < 0,05, če je njena absolutna<br />
standardizirana vrednost (z) večja od 1,96<br />
1. skupina<br />
2. skupina<br />
Opis problema<br />
Število bolniških<br />
Pred ukrepom<br />
Po ukrepu<br />
r1 pred r1 po<br />
r 2 pred<br />
Mann-Whitney U<br />
Wilcoxon W<br />
Z<br />
Asymp. Sig. (2-tailed)<br />
Exact Sig. [2*(1-tailed<br />
Sig.)]<br />
Exact Sig. (2-tailed)<br />
Exact Sig. (1-tailed)<br />
Point Probability<br />
r 2 po<br />
Rezultati<br />
Test Statistics b<br />
a. Not corrected for ties.<br />
b. Grouping Variable: skupina<br />
35,500 4,000<br />
90,500 59,000<br />
-1,105 -3,484<br />
,269 ,000<br />
,280 a<br />
,000 a<br />
bolpred bopo<br />
,288 ,000<br />
,144 ,000<br />
,013 ,000<br />
Izvajanje<br />
ukrepa<br />
Ne<br />
Da<br />
Primer 4.3.2<br />
• Problem: vpliv ukrepov za povečanje zadovoljstva<br />
zaposlenih na letno število bolniških zaostankov.<br />
• Podatki: 20 primerljivih podjetij razdelimo v dve<br />
skupini po 10 podjetij. V drugi skupini ukrepe<br />
izvajamo, v prvi pa ne.<br />
• Zanima nas, ali je<br />
• razlika v številu bolniških pred izvedbo ukrepov med<br />
obema skupinama statistično značilna ter<br />
• ali je razlika v številu bolniških po izvedbi ukrepov<br />
med obema skupinama statistično značilna.<br />
– V vsaki skupini za vsako podjetje izmerimo število bolniških pred<br />
izvedbo ukrepov in po enem letu, ko so ukrepi končani.<br />
– Vrednosti spremenljivke število bolniških izostankov niso normalne<br />
porazdeljene.<br />
Reševanje<br />
• Neparametrični test za dva neodvisna vzorca<br />
• Rezultati s programom SPSS<br />
bolpred<br />
bopo<br />
skupina<br />
1<br />
2<br />
Total<br />
1<br />
2<br />
Total<br />
Ranks<br />
N Mean Rank Sum of Ranks<br />
10 11,95 119,50<br />
10<br />
20<br />
9,05 90,50<br />
10 15,10 151,00<br />
10<br />
20<br />
5,90 59,00<br />
Neparametrični test za dva odvisna<br />
vzorca<br />
• Uporabljamo<br />
Wilcoxonov <strong>si</strong>gned-rank test<br />
• za ugotavljanje značilnosti razlik med dvema<br />
povprečnima vrednostma za odvisne vzorce, ko:<br />
• spremenljivka ni normalno porazdeljena<br />
• opisna spremenljivka je merjena na ordinalni skali<br />
• Je neparametrični ekvivalent parametričnemu t-testu<br />
za odvisne vzorce<br />
Vrednosti številske spremenljivke se pretvorijo v range.<br />
Rang 1 dobi najmanjša vrednost.<br />
15
Wilcoxonov <strong>si</strong>gned-rank test<br />
• Testna statistika je T<br />
• Tvorita se dve vsoti rangov<br />
• Vsota rangov za pozitivne razlike<br />
• Vsota rangov za negativne razlike<br />
• Vrednost statistike T je enaka manjši od<br />
obeh vsot.<br />
• Vrednost statistike T je statistično značilna<br />
pri p < 0,05, če je njena absolutna<br />
standardizirana vrednost večja od 1,96.<br />
Rezultati za drugo skupino<br />
Descriptive Statisticsa N Mean Std. Deviation Minimum Maximum<br />
bolpred 10 164,00 22,706 130 200<br />
bopo<br />
a. skupina = 2<br />
10 101,00 79,505 30 300<br />
bopo - bolpred<br />
a. bopo < bolpred<br />
b. bopo > bolpred<br />
c. bopo = bolpred<br />
d. skupina = 2<br />
Negative Ranks<br />
Po<strong>si</strong>tive Ranks<br />
Ties<br />
Total<br />
Ranks d<br />
9a 5,22 47,00<br />
1b 0<br />
8,00 8,00<br />
c<br />
N Mean Rank Sum of Ranks<br />
10<br />
Analiza odvisnosti med številskimi<br />
spremenljivkami<br />
Ugotavljamo medsebojno odvisnost med<br />
dvema skupinama spremenljivk. V eni je<br />
odvisna spremenljivka, v drugi pa neodvisne.<br />
• Regre<strong>si</strong>ja – v obeh skupinah so številske<br />
spremenljivke<br />
– Enostavna regre<strong>si</strong>ja<br />
– Multipla regre<strong>si</strong>ja<br />
• Diskriminantna analiza – odvisnost med<br />
opisno odvisno in številskimi neodvisnimi<br />
spremenljivkami<br />
Primer<br />
• Problem: analiza razlik v številu bolniških<br />
izostankov pred in po izvedbi ukrepov za<br />
vsako skupino posebej.<br />
• Podatki enaki kot za primer 4.3.2, le da<br />
imamo sedaj dva odvisna vzorca.<br />
• Za vsako skupino posebej primerjamo razliko<br />
v številu bolniških izostankov pred in po<br />
izvedbi ukrepov.<br />
• Analizo razlik napravimo s Wilcoxonov<br />
<strong>si</strong>gned-rank test in programom SPSS<br />
Rezultati za drugo skupino<br />
Test Statistics b,c<br />
-1,990a bopo -<br />
bolpred<br />
Z<br />
Asymp. Sig. (2-tailed) ,047<br />
a. Based on po<strong>si</strong>tive ranks.<br />
b. Wilcoxon Signed Ranks Test<br />
c. skupina = 2<br />
Enostavna regre<strong>si</strong>ja<br />
• Enostavna regre<strong>si</strong>ja : proučujemo odvisnost<br />
med eno odvisno in eno neodvisno<br />
spremenljivko.<br />
• Z regre<strong>si</strong>jsko analizo ugotavljamo<br />
– Obliko odvisnosti: linearna, krivuljčna,…<br />
– Smer odvisnosti: pozitivna, negativna<br />
– Jakost odvisnosti: močna, slaba,…<br />
• Velikost vzorca<br />
– Vsaj 10 enot za vsako spremenljivko.<br />
16
y<br />
Linearna regre<strong>si</strong>jska enačba<br />
y = f ( x ) + e<br />
i<br />
= a<br />
o<br />
+ a<br />
1<br />
x<br />
i<br />
+ e<br />
y- odvisna spremenljivka<br />
x- neodvisna spremenljivka<br />
e- ostanek ali rezidual<br />
Korelacijski koeficient<br />
• Korelacijski koeficient kaže na jakost linearne<br />
zveze.<br />
– njegova vrednost se giblje med –1 in 1.<br />
Absolutna vrednost<br />
korelacijskega koeficienta<br />
0<br />
0,00 - 0,50<br />
0,51 - 0,79<br />
0,80 - 0,99<br />
1,00<br />
Primer 5.1<br />
i<br />
Moč linearne zveze<br />
ni<br />
slaba<br />
srednje močna<br />
močna<br />
popolna<br />
Problem<br />
• Podjetje prodaja svoje izdelke na 40<br />
prodajnih področjih in proučuje odvisnost<br />
prodaje od števila propagandnih akcij.<br />
Podatki<br />
• Podjetje je zbralo podatke o prodaji in številu<br />
propagandnih akcij na 40 prodajnih<br />
področjih.<br />
Rezultati: S programom SPSS in regre<strong>si</strong>jsko<br />
analizo so dobili naslednje rezultate<br />
Kakovost regre<strong>si</strong>jske enačbe<br />
• Določamo s:<br />
– korelacijskim koeficientom<br />
– determinacijskim koeficientom<br />
– F testom in stopnjo značilnosti<br />
– t testom in stopnjo značilnosti<br />
Dekompozicija celotne variance v<br />
regre<strong>si</strong>jski analizi<br />
2 n<br />
2 n<br />
2 2 2<br />
( y − y)<br />
= ( y − y)<br />
+ ( y yˆ<br />
) = σ + σ<br />
n<br />
∑ ˆ i ∑ i ∑ − i i<br />
xy ey<br />
i=<br />
1 i=<br />
1 i=<br />
1<br />
Rezultati<br />
Model Summary<br />
,880a Adjusted R<br />
Std. Error<br />
of the<br />
Model R R Square Square Estimate<br />
1<br />
,775 ,769 595,60<br />
a. Predictors: (Constant), propaganda<br />
ANOVA b<br />
4,6E+07 1 5,E+07 130,644 ,000a Sum of<br />
Mean<br />
Model<br />
Squares df Square F Sig.<br />
1 Regres<strong>si</strong>on<br />
Re<strong>si</strong>dual 1,3E+07 38 354742<br />
Total<br />
6,0E+07 39<br />
a. Predictors: (Constant), propaganda<br />
b.<br />
Dependent Variable: prodaja<br />
17
Rezultati<br />
Coefficients a<br />
Unstandardized<br />
Coefficients<br />
Standar<br />
dized<br />
Coeffici<br />
ents<br />
Model<br />
B Std. Error Beta t Sig.<br />
1 (Constant) 1354,34 259,065 5,228 ,000<br />
propaganda 253,077 22,142 ,880 11,430 ,000<br />
a. Dependent Variable: prodaja<br />
yˆ = 1354,<br />
34 +<br />
253,<br />
077x<br />
Multipla regre<strong>si</strong>ja<br />
• S pomočjo vzorca dobimo ocene regre<strong>si</strong>jskih<br />
koeficientov<br />
yˆ = â + â x + â x + ... + â<br />
i<br />
0<br />
1 i1<br />
â j − parcialni regre<strong>si</strong>jski<br />
koeficient<br />
2<br />
i2<br />
<strong>Metode</strong> za izbor neodvisnih<br />
spremenljivk v model<br />
• Hierarhične metode<br />
– Backward metoda – v model vključimo vse spremenljivke,<br />
nato postopno izločamo tiste spremenljivke z najmanjšo<br />
vrednostjo parcialnega F.<br />
2 2<br />
2<br />
( σ −σ<br />
) /<br />
F σ<br />
par =<br />
xy(<br />
v )<br />
xy(<br />
zun )<br />
xy(<br />
v )<br />
– Forward metoda – v model vključimo eno spremenljivko z<br />
največjim korelacijskim koeficientom, nato pa postopno<br />
vključujemo spremenljivke z največjo vrednostjo parcialnega<br />
F.<br />
– Stepwise metoda – podobna forward metodi, le da<br />
opazujemo parcialne F za spremenljivke v modelu in izven<br />
njega.<br />
• Nehierarhične metode – tvorimo regre<strong>si</strong>jske modele<br />
za vse možne kombinacije neodvisnih spremenljivk.<br />
k<br />
x<br />
ik<br />
Multipla regre<strong>si</strong>ja<br />
• Proučujemo odvisnost ene odvisne<br />
spremenljivke od več neodvisnih<br />
spremenljivk<br />
• Regre<strong>si</strong>jska enačba<br />
• y i = a o +a 1x i1+a 2x i2+…+a ikx k+e i<br />
• y i – vrednost odvisne spremenljivke pri i-ti enoti<br />
• a k – vrednost regre<strong>si</strong>jskega koeficienta pri k-ti neodvisni<br />
spremenljivki<br />
• x ik – vrednost k-te neodvisne spremenljivke pri i-ti enoti<br />
Regre<strong>si</strong>jska analiza in opisna<br />
spremenljivka<br />
• Opisne spremenljivke vključimo v regre<strong>si</strong>jsko analizo z ‘dummy’<br />
spremenljivkami. Potrebujemo m-1 dummy spremenljivk, kjer je<br />
m število skupin, določenih z opisno spremenljivko.<br />
Primer1: spremenljivka spol – ena spremenljivka<br />
– moški = 0<br />
– ženska = 1<br />
Primer 2: spremenljivka velikost podjetja (majhno, srednje,<br />
veliko) – dve dummy spremenljivki<br />
malo<br />
srednje<br />
Veliko<br />
x 1<br />
1<br />
0<br />
0<br />
x 2<br />
0<br />
1<br />
0<br />
Kakovost regre<strong>si</strong>jske enačbe<br />
• Multipli korelacijski koeficient – jakost<br />
odvisnosti med odvisno in k neodvisnimi<br />
spremenljivkami<br />
• Multipli determinacijski koeficient – delež<br />
variance v odvisni spremenljivki, pojasnjen z<br />
variabilnostjo k neodvisnih spremenljivk<br />
• F-test – zanesljivost regre<strong>si</strong>jske enačbe<br />
• t-test – zanesljivost regre<strong>si</strong>jskih koeficientov<br />
18
Problemi pri izvajanju regre<strong>si</strong>jske<br />
analize<br />
• Neodvisne spremenljivke so med seboj korelirane<br />
(multikolinearnost). Kolinearnost neodvisnih<br />
spremenljivk ugotavljamo z variance inflation factor<br />
(VIF).<br />
• VIF = 10 kaže na prisotnost kolinearnosti in<br />
izključimo pripadajočo spremenljivko<br />
1<br />
VIF =<br />
2<br />
1 − R<br />
• R 2 je determinacijski koeficient med i-to<br />
spremenljivko in ostalimi spremenljivkami<br />
Vpliv obrobnih vrednosti na<br />
regre<strong>si</strong>jsko enačbo<br />
Problemi pri izvajanju regre<strong>si</strong>jske<br />
analize<br />
• Obrobne vrednosti z vplivom na regre<strong>si</strong>jsko<br />
enačbo<br />
• Vzroki za pojav obrobnih vrednosti<br />
–Netipično obnašanje enote v vzorcu<br />
– Napaka pri vnosu podatkov<br />
• Kako jih odkrijemo?<br />
– Standardizirana vrednost reziduala večja od 3<br />
– Cookova razdalja (Cook’s distance) ≥ 1<br />
Reziduali<br />
• Reziduali so normalno porazdeljene slučajne<br />
spremenljivke s povprečno vrednostjo nič in<br />
standardnim odklonom 1<br />
• Homoskedastičnost – varianca re<strong>si</strong>dualov je<br />
konstantna pri vseh vrednostih odvisne<br />
spremenljivke<br />
• Nekoreliranost rezidualov – Durbin-Watsonov test<br />
• DW > 2 ⇒ prisotnost negativne korelacije<br />
• DW < 2 ⇒ prisotnost pozitivne korelacije<br />
• DW < 1 ali DW > 3 kažejo na problem kolinearnosti<br />
med reziduali<br />
Analiza rezidualov Primer 5.2<br />
Problem<br />
• Podjetje prodaja svoje izdelke na 40<br />
prodajnih področjih in proučuje odvisnost<br />
prodaje od<br />
– števila propagandnih akcij<br />
– števila trgovskih potnikov<br />
Podatki<br />
• Podjetje je zbralo podatke o prodaji in številu<br />
propagandnih akcij in številu trgovskih<br />
potnikov na 40 prodajnih področjih.<br />
19
Model Summary<br />
Rezultati<br />
,935a Adjusted R<br />
Std. Error<br />
of the<br />
Model R R Square Square Estimate<br />
1<br />
,874 ,867 451,65<br />
a. Predictors: (Constant), število trgovskih<br />
potnikov, propaganda<br />
ANOVA b<br />
5,2E+07 2 3,E+07 128,141 ,000a Sum of<br />
Mean<br />
Model<br />
Squares df Square F Sig.<br />
1 Regres<strong>si</strong>on<br />
Re<strong>si</strong>dual 7547456 37 203985<br />
Total<br />
6,0E+07 39<br />
a. Predictors: (Constant), število trgovskih potnikov, propaganda<br />
b. Dependent Variable: prodaja<br />
Primer<br />
• Podjetje želi proučiti vpliv stroškov<br />
propagande, števila prodajalcev v prodajalni<br />
in stroškov promocije na prodajo izdelka. V ta<br />
namen so zbrali podatke o prodaji v 10<br />
prodajalnah, podatke o stroških za<br />
propagando, število prodajalcev v<br />
prodajalnah in podatke o stroških za<br />
promocijo prodaje.<br />
Regre<strong>si</strong>jska analiza s tremi<br />
neodvisnimi spremenljivkami<br />
Model Summary<br />
,892a Adjusted Std. Error of<br />
Model R R Square R Square the Estimate<br />
1<br />
,795 ,692 46,984<br />
a. Predictors: (Constant), promocija, oprod, propag<br />
Model<br />
1<br />
Regres<strong>si</strong>on<br />
Re<strong>si</strong>dual<br />
Total<br />
ANOVA b<br />
51339,714 3 17113,238 7,752 ,017a Sum of<br />
Squares df Mean Square F Sig.<br />
13245,186 6 2207,531<br />
64584,900 9<br />
a. Predictors: (Constant), promocija, oprod, propag<br />
b. Dependent Variable: prodaja<br />
Model<br />
1<br />
(Constant)<br />
propaganda<br />
število trgovskih<br />
potnikov<br />
a. Dependent Variable: prodaja<br />
Rezultati<br />
Coefficients a<br />
Unstandardized<br />
Coefficients<br />
Standar<br />
dized<br />
Coeffici<br />
ents<br />
B Std. Error Beta t Sig.<br />
693,285 231,555 2,994 ,005<br />
141,562 26,636 ,492 5,315 ,000<br />
375,313 69,593 ,500 5,393 ,000<br />
yˆ = 693,<br />
285 + 141,<br />
562x<br />
+ 375,<br />
313x<br />
X 1 – število propagandnih akcij<br />
X 2 – število trgovskih potnikov<br />
prodaja<br />
propag<br />
oprod<br />
promocija<br />
1<br />
Korelacijska analiza<br />
Pearson Correlation<br />
Sig. (2-tailed)<br />
N<br />
Pearson Correlation<br />
Sig. (2-tailed)<br />
N<br />
Pearson Correlation<br />
Sig. (2-tailed)<br />
N<br />
Pearson Correlation<br />
Sig. (2-tailed)<br />
N<br />
2<br />
Correlations<br />
*. Correlation is <strong>si</strong>gnificant at the 0.05 level (2-tailed).<br />
Model<br />
1<br />
prodaja propag oprod promocija<br />
1 ,727* ,731* ,613<br />
,017 ,016 ,059<br />
10 10 10 10<br />
,727* 1 ,475 ,739*<br />
,017 ,165 ,015<br />
10 10 10 10<br />
,731* ,475 1 ,157<br />
,016 ,165 ,665<br />
10 10 10 10<br />
,613 ,739* ,157 1<br />
,059 ,015 ,665<br />
10 10 10 10<br />
Model za tri neodvisne<br />
spremenljivke<br />
(Constant)<br />
propag<br />
oprod<br />
promocija<br />
a.<br />
Dependent Variable: prodaja<br />
Unstandardized<br />
Coefficients<br />
Coefficients a<br />
Standardized<br />
Coefficients<br />
B Std. Error Beta<br />
t Sig.<br />
9,163 61,541 ,149 ,887<br />
2,486 6,546 ,124 ,380 ,717<br />
24,215 8,890 ,606 2,724 ,034<br />
33,589 22,839 ,427 1,471 ,192<br />
20
Regre<strong>si</strong>jska analiza z dvema<br />
neodvisnima spremenljivkama<br />
Model Summary<br />
,849a Adjusted Std. Error of<br />
Model R R Square R Square the Estimate<br />
1<br />
,721 ,641 50,738<br />
a. Predictors: (Constant), oprod, propag<br />
Model<br />
1<br />
(Constant)<br />
propag<br />
oprod<br />
a. Dependent Variable: prodaja<br />
Unstandardized<br />
Coefficients<br />
Coefficients a<br />
Standardized<br />
Coefficients<br />
B Std. Error Beta<br />
t Sig.<br />
34,596 63,780 ,542 ,604<br />
9,845 4,557 ,490 2,161 ,068<br />
19,933 9,071 ,499 2,197 ,064<br />
Diskriminantna analiza<br />
Problemi:<br />
• v banki proučujejo lastnosti, po katerih se<br />
razlikujejo dobičkonosni od nedobičkonosnih<br />
komitentov.<br />
• V podjetju proučujejo lastnosti, po katerih se<br />
kupci njihovega izdelka razlikujejo od kupcev<br />
konkurenčnih izdelkov<br />
• V podjetju proučujejo dejavnosti v celotnem<br />
razvoju novega izdelka, ki vplivajo na uspeh<br />
ali neuspeh novega izdelka.<br />
Diskriminantna analiza z dvema<br />
skupinama<br />
• Vrednosti odvisne opisne spremenljivke so<br />
razvrščene v dve skupini<br />
• Diskriminantno funkcijo zapišemo:<br />
• D = a 1y 1 + a 2y 2 +…+ a ky k<br />
• kjer je:<br />
• D- vrednost diskriminantne funkcije<br />
• a j - koeficient diskriminantne funkcije pri spremenljivki y j<br />
• y j - j-ta neodvisna spremenljivka<br />
• Koeficienti izražajo relativni prispevek<br />
posamezne neodvisne spremenljivke k<br />
vrednosti diskriminantne funkcije;<br />
Regre<strong>si</strong>jska analiza z dvema<br />
neodvisnima spremenljivkama<br />
Model Summary<br />
,889a Adjusted Std. Error of<br />
Model R R Square R Square the Estimate<br />
1<br />
,790 ,730 44,019<br />
a. Predictors: (Constant), promocija, oprod<br />
Model<br />
1<br />
(Constant)<br />
oprod<br />
promocija<br />
a. Dependent Variable: prodaja<br />
Unstandardized<br />
Coefficients<br />
Coefficients a<br />
Standardized<br />
Coefficients<br />
B Std. Error Beta<br />
t Sig.<br />
11,435 57,384 ,199 ,848<br />
26,037 7,012 ,651 3,713 ,008<br />
40,219 13,793 ,511 2,916 ,022<br />
Diskriminantna analiza<br />
• Z njo proučujemo odvisnost med opisno odvisno<br />
spremenljivko in neodvisnimi številskimi<br />
spremenljivkami.<br />
• Oblikujemo diskriminantno funkcijo, kot linearno<br />
kombinacijo neodvisnih spremenljivk<br />
• Ugotavljamo, ali obstajajo značilne razlike med<br />
skupinami z vidika izbranih neodvisnih spremenljivk<br />
• Prispevek neodvisnih spremenljivk k razlikovanju<br />
med skupinami<br />
• Kakovost diskriminantne funkcije – odstotek pravilno<br />
razvrščenih enot z diskriminantno funkcijo<br />
Koeficienti v diskriminantni<br />
funkciji<br />
• Koeficienti diskriminantne funkcije so<br />
določeni tako, da je količnik med<br />
Variabilnost<br />
med skupinami<br />
Variabilnost<br />
znotrajskupin<br />
• mak<strong>si</strong>malen<br />
• Diskriminantne uteži so enake korelacijskim<br />
koeficientom med diskriminantnimi<br />
vrednostmi in vrednostmi neodvisnih<br />
spremenljivk. Izražajo pomen neodvisnih<br />
spremenljivk k razlikovanju med skupinami.<br />
21
Kakovost diskriminantne funkcije<br />
• Lastna vrednost (eigenvalue) je razmerje<br />
med vsoto kvadratov med skupinami in vsoto<br />
kvadratov znotraj skupin. Večja kot je njena<br />
vrednost, boljša je diskriminantna funkcija.<br />
• Wilk’s lambda je enaka količniku med vsoto<br />
kvadratov znotraj skupin in celotno vsoto<br />
kvadratov.<br />
– Njene vrednosti so med 0 in 1.<br />
– Vrednosti blizu nič kažejo na to, da so<br />
diskriminantne vrednosti med skupinami značilno<br />
različne med seboj.<br />
Kakovost diskriminantne funkcije<br />
• Kla<strong>si</strong>fikacijska matrika kaže število in odstotek<br />
pravilno in nepravilno razvrščenih enot<br />
Dejanska<br />
skupina<br />
1<br />
2<br />
Predvidena skupina<br />
1<br />
a<br />
c<br />
2<br />
b<br />
d<br />
Primer 5.3<br />
• Proučujemo lastnosti družin, ki vplivajo na odločitev<br />
družine, da zdravilišče obišče ali ne (dve skupini)<br />
• Odvisna spremenljivka je torej obisk zdravilišča, ki<br />
lahko zavzame dve vrednosti; da=1 in ne=2.<br />
• Družine so glede na vrednost odvisne spremenljivke<br />
razvrščene v dve skupini.<br />
• Obe skupini primerjamo glede na vrednost<br />
neodvisnih spremenljivk (lastnosti družine), ki morajo<br />
biti številske spremenljivke:<br />
– dohodek,<br />
– odnos do potovanja (intervalna skala 1-9)<br />
– pomen dopusta (intervalna skala 1-9)<br />
– velikost družine<br />
– starost starša<br />
Kakovost diskriminantne funkcije<br />
• S hi-kvadrat testom testiramo domnevo, da<br />
so aritmetične sredine diskriminantnih<br />
vrednosti skupin enake.<br />
• Kanonična korelacija meri moč zveze med<br />
vrednostmi diskriminantne funkcije in<br />
spremenljivko (ali dummy spremenljivkami v<br />
primeru multiple diskriminantne analize), ki<br />
določa pripadnost skupini.<br />
• Centroid je povprečna vrednost<br />
diskriminantne funkcije za določeno skupino.<br />
Multipla diskriminantna analiza<br />
• Proučujemo odvisnost med opisno odvisno<br />
spremenljivko, katere opisne vrednosti so<br />
razvrščene v več skupin in med neodvisnimi<br />
številskimi spremenljivkami.<br />
• Oblikujemo lahko G-1 diskriminantnih funkcij,<br />
kjer je G število skupin.<br />
• Prva diskriminantna funkcija prispeva največ<br />
k razlikovanju, itd.<br />
Rezultati<br />
Eigenvalues<br />
1,786a % of Cumulative Canonical<br />
Function Eigenvalue Variance % Correlation<br />
1<br />
100,0 100,0 ,801<br />
a. First 1 canonical discriminant functions were used in the<br />
analy<strong>si</strong>s.<br />
Test of Function(s)<br />
1<br />
Wilks' Lambda<br />
Wilks'<br />
Lambda Chi-square df Sig.<br />
,359 26,130 5 ,000<br />
S hi testom preverjamo hipotezo<br />
Ho: D 1 =<br />
D2<br />
22
Diskriminantna funkcija<br />
Standardized Canonical<br />
Discriminant Function Coefficients<br />
LETNI DOHODEK<br />
DRUŽINE<br />
ODNOS DO<br />
ZDRAVILIŠČ<br />
POMEN DRUŽINSKIH<br />
POČITNIC<br />
ŠTEVILO DRUŽINSKIH<br />
ČLANOV<br />
STAROST OČETA ALI<br />
MATERE<br />
Function<br />
1<br />
,743<br />
,096<br />
,233<br />
,469<br />
,209<br />
Centroidi<br />
Functions at Group Centroids<br />
OBISK ZDRAVILIŠČA<br />
1<br />
2<br />
Function<br />
1<br />
1,291<br />
-1,291<br />
Unstandardized canonical discriminant<br />
functions evaluated at group means<br />
Standardizirani<br />
koeficienti<br />
kažejo na<br />
relativni pomen<br />
spremenljivk pri<br />
razlikovanju med<br />
skupinama.<br />
Kakovost diskriminantnih funkcij<br />
Eigenvalues<br />
3,819a 93,9 93,9 ,890<br />
,247a % of Cumulative Canonical<br />
Function Eigenvalue Variance % Correlation<br />
1<br />
2<br />
6,1 100,0 ,445<br />
a. First 2 canonical discriminant functions were used in the<br />
analy<strong>si</strong>s.<br />
Test of Function(s)<br />
1 through 2<br />
2<br />
Wilks' Lambda<br />
Wilks'<br />
Lambda Chi-square df Sig.<br />
,166 44,831 10 ,000<br />
,802 5,517 4 ,238<br />
Kla<strong>si</strong>fikacijska matrika<br />
Clas<strong>si</strong>fication Results a<br />
Predicted Group<br />
Membership<br />
OBISK ZDRAVILIŠČA 1 2 Total<br />
Original Count 1<br />
12 3 15<br />
2<br />
0 15 15<br />
% 1<br />
80,0 20,0 100,0<br />
2<br />
,0 100,0 100,0<br />
a. 90,0% of original grouped cases correctly clas<strong>si</strong>fied.<br />
Kla<strong>si</strong>fikacijska matrika prikazuje število z diskriminantno<br />
funkcijo pravilno razvrščenih enot v skupini<br />
Multipla diskriminantna analiza<br />
• Vzemimo primer, opisan pri enostavni<br />
diskriminantni analizi. Tokrat nas zanima,<br />
katere lastnosti družine prispevajo k višini<br />
porabljenega denarja na počitnicah. Enote v<br />
vzorcu bomo razvrstili v tri skupine: v eni<br />
skupini so tiste družine, ki porabijo malo<br />
denarja, v drugi tiste, ki porabijo srednje<br />
veliko denarja in v tretji skupini tiste, ki<br />
porabijo veliko denarja na počitnicah.<br />
LETNI DOHODEK<br />
DRUŽINE<br />
ŠTEVILO DRUŽINSKIH<br />
ČLANOV<br />
ODNOS DO<br />
ZDRAVILIŠČ<br />
POMEN DRUŽINSKIH<br />
POČITNIC<br />
Diskriminantne uteži<br />
Structure Matrix<br />
Function<br />
1 2<br />
,856* -,278<br />
,193* ,077<br />
,219 ,588*<br />
,149 ,454*<br />
STAROST OČETA ALI<br />
,166 ,341*<br />
MATERE<br />
Pooled within-groups correlations between<br />
discriminating variables and standardized<br />
canonical discriminant functions<br />
Variables ordered by absolute <strong>si</strong>ze of correlation<br />
within function.<br />
*. Largest absolute correlation between each<br />
variable and any discriminant function<br />
Prva funkcija je<br />
povezana s<br />
spremenljivkama<br />
letni dohodek<br />
družine in število<br />
družinskih članov.<br />
Druga funkcija pa z<br />
ostalimi<br />
spremenljivkami.<br />
23
Function 2<br />
3<br />
2<br />
1<br />
0<br />
-1<br />
-2<br />
-3<br />
Razsevni grafikon<br />
Canonical Discriminant Functions<br />
-4<br />
Function 1<br />
1<br />
-2<br />
2<br />
0<br />
2<br />
3<br />
4<br />
6<br />
ZNESEK DRUŽINE ZA LE<br />
Group Centroids<br />
Ungrouped Cases<br />
3<br />
2<br />
1<br />
Analiza skupin<br />
cluster analy<strong>si</strong>s<br />
• Problemi: segmentacija tržišča, segmentacija<br />
dobaviteljev, strank podjetja, študentov, ipd<br />
• Uporablja pri razvrščanju enot v čim bolj<br />
homogene skupine, ki se pa med seboj čim<br />
bolj razlikujejo<br />
• Temeljne naloge pri analizi skupin<br />
–Določiti lastnosti enot pri razvrščanju – izbor<br />
ustreznih spremenljivk<br />
–Določiti merilo za določanje razlik<br />
–Določiti kriterij pri razvrščanju enot v skupine<br />
Merilo za določanje razlik med<br />
enotami<br />
• Obstaja več načinov merjenja razlik<br />
• Najbolj pogosto se uporablja evklidska razdalja<br />
d<br />
p<br />
2<br />
rs =<br />
j=<br />
1<br />
( x x )<br />
∑ −<br />
rj<br />
sj<br />
2<br />
2<br />
• drs-<br />
kvadrirana evklidska razdalja<br />
• xrj – vrednost j-te spremenljivke pri enoti r<br />
• xsj – vrednost j-te spremenljivke pri enoti s<br />
Analize medsebojne odvisnosti<br />
(podobnosti)<br />
• Analiza skupin (cluster analy<strong>si</strong>s)<br />
• Faktorska analiza<br />
Grafični prikaz združevanja<br />
Najpogostejši primer<br />
pred združevanjem<br />
Idealni primer<br />
združevanja enot v<br />
skupine<br />
Izbira metode za združevanje enot<br />
v skupine<br />
• Najbolj pogosto se uporablja Wardova<br />
metoda – minimizira variiranje znotraj skupin<br />
• Hierarhično razvrščanje enot v skupine<br />
– Število skupin na začetku je enako številu enot<br />
– V vsaki iteraciji še število skupin zmanjša za ena<br />
–Razvrščanje na višjem nivoju je odvisno od<br />
razvrščanja na nižjih nivojih<br />
– Ni potrebno vnaprej določiti število skupin<br />
• Nehierarhično razvrščanje enot v skupine –<br />
ni odvisno od predhodnih razvrščanj<br />
– Potrebno vnaprej določiti število želenih skupin<br />
24
Definicija raziskovalnega problema<br />
• Pravilni zbor značilnosti enot – spremenljivk,<br />
• Spremenljivke se določajo<br />
– Rezultati preteklih raziskovanj<br />
– Teorije<br />
– Hipotez, ki se preverjajo z raziskavo<br />
Odločanje o številu skupin<br />
Kriteriji za odločanje o številu skupin<br />
• Spoznanja teorije<br />
• Razlike, pri katerih pride do združevanja<br />
• Število enot v skupini ne sme biti premalo<br />
Grafični prikaz dveh metod<br />
združevanja enot v skupine<br />
Primer 6.1<br />
• Podjetje želi segmentirati svoje kupce glede<br />
na njihove nakupne navade. 20 njihovih<br />
kupcev je na intervalni skali od 1-7 izrazilo<br />
svoje mnenje o naslednjih trditvah<br />
– Nakupovanje je zabava (zabava)<br />
– Nakupovanje zmanjšuje družinski proračun<br />
(strošek)<br />
– Ob nakupovanju običajno ne ko<strong>si</strong>m doma (ko<strong>si</strong>lo)<br />
– Stremim za najugodnejšim nakupom (ugodno)<br />
– Nakupovanje me ne zanima (nezanima)<br />
– S primerljivo ceno lahko dosti prihranim<br />
(prihranek)<br />
Dendrogram Razvrstitev enot v skupine<br />
Cluster Membership<br />
Case<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
10<br />
11<br />
12<br />
13<br />
14<br />
15<br />
16<br />
17<br />
18<br />
19<br />
20<br />
3 Clusters<br />
1<br />
2<br />
1<br />
3<br />
2<br />
1<br />
1<br />
1<br />
2<br />
3<br />
2<br />
1<br />
2<br />
3<br />
1<br />
3<br />
1<br />
3<br />
3<br />
2<br />
25
Faktorska analiza<br />
• Problem: pri proučevanju pojava uporabimo<br />
veliko med seboj odvisnih spremenljivk.<br />
Medsebojno odvisne spremenljivke združimo<br />
v nove spremenljivke – faktorje<br />
• Potek<br />
• Določitev spremenljivk in analiza njihove<br />
medsebojne odvisnosti<br />
• Določitev števila faktorjev<br />
• Vsebinska opredelitev faktorjev<br />
Metoda glavnih komponent<br />
• z 1 = a 11F 1 + a 12F 2 + … + a 1kF k<br />
• z 2 = a 21F 1 + a 22F 2 + … + a 2kF k<br />
• M<br />
• z k = a k1F 1 + a k2F 2 + … + a kkF k<br />
z i – standardizirana vrednost i-te spremenljivke<br />
F j – j-ti faktor<br />
a ij – faktorska utež pri i-ti spremenljivki in j-tem<br />
faktorju<br />
Faktorji so določeni tako, da prvi faktor pojasni<br />
največji del celotne variance, drugi največji<br />
del preostale nepojasnjene variance, itd..<br />
Lastna vrednost<br />
• Izraža prispevek j-tega faktorja k pojasnitvi celotne<br />
variance<br />
• Opredeljena je z vsoto kvadratov faktorskih uteži za<br />
j-ti faktor<br />
2<br />
1 j<br />
2<br />
2 j<br />
2<br />
kj<br />
a + a + ... + a = λ<br />
• pri čemer velja<br />
• λ1 > λ2 > … > λk • Odstotek s k-tim faktorjem pojasnjene variance je<br />
λ<br />
100<br />
j<br />
k<br />
j<br />
Izbor spremenljivk<br />
• Poznavanje problema, študij literature<br />
pomaga pri izboru ustreznih spremenljivk<br />
• Velikost vzorca vsaj 4k, kjer je k število<br />
spremenljivk<br />
• Analiza odvisnosti med spremenljivkami<br />
– Barlettov test sferičnosti<br />
– Keiser-Meyer-Olkinova statistika (KMO), ki naj bo<br />
večja od 0,5<br />
Komunaliteta<br />
• Izraža prispevek m faktorjev k pojasnitvi<br />
celotne variance i-te spremenljivke; m < k<br />
• Komunaliteta je določena z:<br />
h = a + a + ... + a<br />
2<br />
i<br />
2<br />
i1<br />
2<br />
i 2<br />
2<br />
im<br />
• Delež nepojasnjene variance pri m faktorjih<br />
je 1 – h i 2<br />
Določitev števila faktorjev<br />
• Izkušnje<br />
• Faktorji z lastno vrednostjo λj, ki je večja od<br />
ena<br />
• Diagram lastnih vrednosti – prelom.<br />
• Odstotek celotne pojasnjene variance – vsaj<br />
60 %<br />
• Statistični test značilnosti faktorjev<br />
26
Poimenovanje faktorjev<br />
• Uporabimo faktorske uteži po rotaciji<br />
faktorjev<br />
• Vsebinski pomen in ime faktorja najbolj<br />
opredeljujejo spremenljivke z visoko<br />
vrednostjo faktorskih uteži<br />
• Rotacijo faktorjev – varimax metoda<br />
– Ortogonalna metoda<br />
– Da medsebojno neodvisne faktorje<br />
Correlation<br />
Analiza odvisnosti med<br />
spremenljivkami<br />
V1<br />
V2<br />
V3<br />
V4<br />
V5<br />
V6<br />
V7<br />
V1 V2<br />
Correlation Matrix<br />
V3 V4 V5 V6 V7<br />
1.000 -.004 .628 .082 .675 -.100 -.338<br />
-.004 1.000 .151 -.248 .048 .582 -.251<br />
.628 .151 1.000 -.182 .480 .090 -.588<br />
.082 -.248 -.182 1.000 .272 .017 .469<br />
.675 .048 .480 .272 1.000 -.110 -.082<br />
-.100 .582 .090 .017 -.110 1.000 .014<br />
-.338 -.251 -.588 .469 -.082 .014 1.000<br />
KMO and Bartlett's Test<br />
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.<br />
Bartlett's Test of Sphericity<br />
Eigenvalue<br />
Approx. Chi-Square<br />
df<br />
Sig.<br />
.550<br />
57.994<br />
21<br />
.000<br />
Diagram lastnih vrednosti<br />
3.0<br />
2.5<br />
2.0<br />
1.5<br />
1.0<br />
.5<br />
0.0<br />
1<br />
Scree Plot<br />
2<br />
Component Number<br />
3<br />
4<br />
5<br />
6<br />
7<br />
Primer 6.2<br />
• Pri proučevanju odvisnosti med načinom preživljanja<br />
prostega časa in nakupnim obnašanjem bomo<br />
uporabili 7 spremenljivk<br />
• V1: Raje bi preživel-a miren večer doma, kot<br />
odšel(a) na zabavo.<br />
• V2: Vedno preverim ceno izdelka, tudi za izdelke z<br />
nizko ceno.<br />
• V3: Branje revij je zanimivejše od gledanja televizije.<br />
• V4: Odločitve o nakupu izdelka ne sprejemam pod<br />
vplivom oglaševanja.<br />
• V5: Najraje sem doma.<br />
• V6: Hranim in unovčim kupone za popust pri ceni.<br />
• V7: Podjetja potrošijo preveč denarja za<br />
oglaševanje.<br />
Lastne vrednosti in pojasnjena<br />
varianca<br />
Compon.<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
Total<br />
Initial Eigenvalues<br />
% of<br />
Variance<br />
Cumul.<br />
%<br />
Total<br />
Extraction Sums of<br />
Squared loadings<br />
% of<br />
Variance<br />
Cumul.<br />
%<br />
2,485 35,505 35,505 2,485 35,505 35,505<br />
1,821 26,013 61,518 1,821 26,013 61,518<br />
1,339 19,131 80,649 1,339 19,131 80,649<br />
0,508 7,258 87,907<br />
0,376 5,373 93,280<br />
0,279 3,990 97,270<br />
0,191 2,730 100,00<br />
Lastne vrednosti in pojasnjene<br />
variance po rotaciji<br />
Component<br />
1<br />
2<br />
3<br />
Rotation Sums of Squared Loadings<br />
Total<br />
2,315<br />
1,731<br />
1,599<br />
% of Variance<br />
33,076<br />
24,729<br />
22,844<br />
Cumulative<br />
%<br />
33,076<br />
57,805<br />
80,649<br />
27
Faktor<br />
F1<br />
F2<br />
F3<br />
V1<br />
V2<br />
V3<br />
V4<br />
V5<br />
V6<br />
V7<br />
Faktorske uteži<br />
Rotated Component Matrix a<br />
1<br />
Component<br />
2 3<br />
.897 -8.2E-02 -7.6E-02<br />
4.86E-02 -.232 .860<br />
.762 -.440 .125<br />
.214 .867 -5.2E-02<br />
.868 .224 -1.7E-02<br />
-5.7E-02 9.06E-02 .911<br />
-.351 .817 -7.3E-02<br />
Extraction Method: Principal Component Analy<strong>si</strong>s.<br />
Rotation Method: Varimax with Kaiser Normalization.<br />
a. Rotation converged in 4 iterations.<br />
Poimenovanje faktorjev<br />
Spremenljivke<br />
V1, V3, V5<br />
V4, V7<br />
V2, V6<br />
Pojasnjena<br />
varianca<br />
33,1 %<br />
24,7 %<br />
22,8 %<br />
Ime faktorja<br />
Način preživljanja<br />
prostega časa<br />
Oglaševanje<br />
Cena in popusti<br />
Analiza notranje konzistentnosti<br />
faktorja (Reliability analy<strong>si</strong>s)<br />
• Uporabimo, kadar želimo preveriti zanesljivost<br />
vnaprej opredeljenega faktorja<br />
• Preverimo pravilnost izbora spremenljivk, s katerim<br />
merimo faktor<br />
• Cronbach-ova α meri notranjo konzistentnost<br />
faktorja. Njena vrednost je odvisna od korelacijskih<br />
koeficientov med spremenljivkami, ki sestavljajo<br />
faktor. Višji so ti korelacijski koeficienti, večja je<br />
notranja konzistentnost faktorja, večja je<br />
Cronbachova α.<br />
• Izkustveno pravilo: Konzistentnost faktorja je<br />
zadovoljiva, če je Cronbachova α večja od 0,7.<br />
V1<br />
V2<br />
V3<br />
V4<br />
V5<br />
V6<br />
V7<br />
komunalitete<br />
Communalities<br />
Initial Extraction<br />
1.000 .818<br />
1.000 .796<br />
1.000 .790<br />
1.000 .800<br />
1.000 .805<br />
1.000 .841<br />
1.000 .796<br />
Extraction Method: Principal Component Analy<strong>si</strong>s.<br />
Analiza kon<strong>si</strong>stentnosti faktorja<br />
• Z njo merimo stopnjo homogenosti<br />
spremenljivk, s katerimi merimo faktor<br />
• Stopnjo kon<strong>si</strong>stentnosti (zanesljivost faktorja)<br />
merimo s Cronbachovo α.<br />
• Vrednost Cronbachove α je odvisna od:<br />
– Homogenosti spremenljivk, s katerimi merimo<br />
faktor<br />
– Števila spremenljivk, s katerimi merimo faktor<br />
• Cronbach α zavzame vrednost med 0 in 1<br />
• Nunnaly (1978) predlaga minimalno vrednost<br />
0,7<br />
28