10.07.2015 Views

osnove za ponavljanje - Ekonomski Fakultet

osnove za ponavljanje - Ekonomski Fakultet

osnove za ponavljanje - Ekonomski Fakultet

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Ekonomski</strong> fakultet Split - Studij u ZagrebuStatistika - razlika ispitaDoc. dr. Snježana Pivac(Predavanja - 2004./2005.)Ponavljanje1. UVOD1.1. Pojam i <strong>za</strong>daća statistikeStatistika je posebna znanstvena disciplina koja u svrhu reali<strong>za</strong>cijepostavljenih ciljeva istraživanja na organiziran način prikuplja, odabire,grupira, prezentira i vrši analizu informacija ili podataka, te interpretirarezultate provedene analize.Deskriptivna ili opisna statistika temelji se na potpunom obuhvatustatističkog skupa, čiju masu podataka organizirano prikuplja, odabire,grupira, prezentira i interpretira dobivene rezultate analize.Inferencijalna statistika temelji se na dijelu (uzorku) jedinicai<strong>za</strong>branih iz cjelovitog statističkog skupa, pomoću kojeg se uz primjenuodgovarajućih statističkih metoda i tehnika donose <strong>za</strong>ključci o čitavomstatističkom skupu.Statistički skup potrebno je definirati pojmovno, prostorno ivremenski.Pojmovno odrediti statistički skup podrazumijeva odrediti pojam ilisvojstvo svakog elementa promatranog skupa.Prostorno odrediti statistički skup znači odrediti prostor na koji seodnosi ili kojemu pripadaju elementi statističkog skupa.Vremenski odrediti statistički skup znači odrediti vremenski trenutak ilirazdoblje kojim će se obuhvatiti svi elementi koji ulaze u statistički skup.1.2. Statistička obilježja1


Statistička obilježja su opće karakteristike elemenata statističkogskupa, po kojima su ti elementi međusobno slični i po kojima se međusobnorazlikuju.Općenito se statistička obilježja mogu podijeliti na:1. kvalitativna statistička obilježja, koja mogu poprimiti različite oblike, ali seizražavaju opisno. Ako se modalitetima ovog obilježja slučajno pridružebrojevi, s njima nisu dopuštene nikakve računske operacije.2. kvantitativna statistička obilježja, koja se izražavaju brojčano.1. Kvalitativna statistička obilježja se mogu podijeliti na: a)nominalna statistička obilježja i b) redoslijedna statistička obilježja.a) Nominalna statistička obilježja se izražavaju opisno, a nazivaju se još iatributivna statistička obilježja. Primjeri ovog obilježja su: spol, nacionalnost,bračno stanje, i slično. Nominalna obilježja koja mogu poprimiti samo 2modaliteta nazivaju se alternativna obilježja. Na primjer, obilježje spol možepoprimiti oblike: muški i ženski.Posebnu grupu nominalnih statističkih obilježja predstavljaju zemljopisnastatistička obilježja, koja označavaju prostor s kojim su elementi statističkogskupa u vezi. Na primjer, to su obilježja: mjesto rođenja, mjesto stanovanja,lokacija podružnica tvrtke prema regijama i slično.b) Redoslijedna statistička obilježja predstavljaju takvu vrstu obilježja koja semijenjaju prema intenzitetu ili rangu. Primjer takvih obilježja su: uspjeh na testuiz predmeta Statistika (ovdje se javljaju modaliteti ovog obilježja od 1 do 5, alitreba voditi računa o tome da se s njima ne vrše nikakve računske operacije, većse pomoću njih elementi skupa, odnosno učenici, mogu rangirati), stručnasprema <strong>za</strong>poslenih u nekom poduzeću i slično.2. Kvantitativna statistička obilježja mogu se izraziti brojčano.Nazivaju se još i numerička statistička obilježja, a mogu se podijeliti na: a)neprekidna ili kontinuirana statistička obilježja i b) prekidna ilidiskontinuirana statistička obilježja.a) Neprekidna ili kontinuirana statistička obilježja su takva numeričkaobilježja koja mogu poprimiti neprebrojivo beskonačno mnogo vrijednosti (npr.u skupu realnih brojeva, koji je beskonačan, na <strong>za</strong>tvorenom intervalu od 1 do 2ima neprebrojivo mnogo elemenata tog skupa). Primjeri takvog obilježja su:visina, težina, duljina, starost itd.b) Prekidna ili diskontinuirana statistička obilježja su takva numeričkaobilježja koja mogu poprimiti prebrojivo beskonačno mnogo vrijednosti (npr. uskupu cijelih brojeva, koji je beskonačan, na <strong>za</strong>tvorenom intervalu od 1 do 2ima prebrojivo mnogo elemenata tog skupa, tj. 2). Primjeri takvog obilježja su:broj djece, broj učenika u razredu, starost u godinama (godine se moguprebrojati), visina plaće u kunama itd.2


1.3. Izvori podataka i metode njihova pribavljanjaOsnovne faze statističkog istraživanja su:a) statističko promatranjeb) grupiranje (tabelarno i grafičko prikazivanje statističkih podataka)c) statistička anali<strong>za</strong> i interpretacija rezultata provedene analize.1.4. Načini prikupljanja podatakaPojedinačne metode statističkog promatranja su:a) mjerenje,b) brojanje,c) ocjenjivanje,d) evidentiranje ie) anketiranje.1.5. Priprema podataka <strong>za</strong> statističku analizuPrije početka obrade prikupljenih podataka potrebno je izvršiti kontrolusirove statističke građe. Kontrola se može vršiti u tijeku ili na kraju postupkaprikupljanja podataka, što ovisi i o različitim metodama prikupljanja.Preventivna kontrola obavlja se već u tijeku samog postupkaprikupljanja statističkih podataka. Pri provođenju ankete to podrazumijevakontrolu upitnika pri njegovom preuzimanju od ispitanika. Kontrolira se da li sudani odgovori na sva pitanja i da li su pravilno popunjena predviđena mjesta <strong>za</strong>tražene odgovore.Naknadna kontrola prikupljenih podataka obavlja se nakon postupkaprikupljanja. Formalnom kontrolom se uspoređuje realizirani broj prikupljenihpodataka s onim planiranim obuhvatom statističkog skupa. Ako je anketa vršenaneizravnim putem, na primjer poštom, uspoređuje se broj odaslanih upitnika sbrojem vraćenih upitnika. Materijalnom kontrolom ispituje se potpunost i3


točnost sadržaja prikupljenih podataka. Na primjeru ankete to podrazumijevakontrolu potpunosti i logičnosti danih odgovora.1.6. Koraci u istraživanju pomoću statističkih metodaPrema samoj definiciji statistike kao posebne znanstvene discipline kojau svrhu reali<strong>za</strong>cije postavljenih ciljeva istraživanja na organiziran način koristisvoje metode i tehnike mogu se definirati koraci pri statističkom istraživanju:1. Definiranje <strong>za</strong>datka, cilja i predmeta istraživanja, tj. statističkog skupa.U ovoj početnoj fazi istraživanja, u skladu s postavljenim ciljem,definira se statistički skup, njegove karakteristike ili obilježja. Donosi se iodluka da li će se koristiti primarni ili sekundarni izvori podataka, tj. da li će sevršiti neposredno promatranje svojstava elemenata statističkog skupa ili će sepribavljati iz već postojećih ba<strong>za</strong> podataka.2. Promatranje i anali<strong>za</strong> prikupljenih podataka.U ovoj fazi vrši se konkretno prikupljanje podataka iz odabranih izvora,te se ocjenjuje kvaliteta takve "sirove" statističke građe. Nakon toga potrebno jeprikupljene statističke podatke unijeti i pohraniti u odgovarajuću datotekuodabranog statističkog paketa.3. Grupiranje, tabelarno i grafičko prikazivanje podataka.U ovom koraku statističkog istraživanja vrši se grupiranje prikupljenihstatističkih podataka. Tabelarnim i grafičkim prikazivanjem postiže se jasnija ipreglednija prezentacija grupiranih podataka. Uz vizualnu prezentacijustatističkih informacija, tablice i grafikoni služe i kao pomoćno sredstvoistraživanja i analize prikupljenih podataka.4a. Za podatke koji potpuno obuhvaćaju statistički skup koriste se metode itehnike deskriptivne ili opisne statistike.U ovoj fazi kada su prikupljeni svi podaci čitavog statističkog skuparačunaju se apsolutni i relativni poka<strong>za</strong>telji odnosa unutar jedne ili više pojava.4b. Za podatke koji obuhvaćaju dio tj. slučajni uzorak statističkog skupakoriste se metode i tehnike inferencijalne statistike.Kada se pri statističkom istraživanju raspolaže samo podacima izuzorka, računaju se procjene parametara iz čitavog osnovnog statističkog skupa,te se vrši testiranje hipote<strong>za</strong> o tim parametrima.5. Interpretacija rezultata i <strong>za</strong>ključci provedene analize.4


Nakon deskriptivne analize čitavog statističkog skupa vrši se tumačenjedobivenih brojčanih rezultata i statističkih tablica, te se donose <strong>za</strong>ključci uskladu s postavljenim ciljem statističkog istraživanja.Nakon inferencijalne analize statističkog skupa na bazi uzorka, opet uskladu s postavljenim ciljevima istraživanja, donosi se izvješće o procijenjenimparametrima iz čitavog osnovnog statističkog skupa i rezultatima postavljenihhipote<strong>za</strong> o tim parametrima.5


2. UREĐIVANJE I PRIKAZIVANJE PODATAKA2.1. Formiranje statističkih nizovaAko se urede prikupljeni statistički podaci prema nekom obilježjuili karakteristici dobiva se statistički niz.Grupiranje statističkih podataka je postupak diobe statističkogskupa na određeni broj podskupova prema prethodno utvrđenimmodalitetima promatranog obilježja i uz poštivanje principa isključivosti iiscrpnosti.Princip isključivosti podrazumijeva da svaki element statističkog skupaistovremeno može pripadati samo jednoj grupi tj. podskupu. Princip iscrpnostipodrazumijeva da postupkom grupiranja trebaju biti obuhvaćeni svi elementistatističkog skupa.Statistička obilježja, odnosno opće karakteristike elemenatastatističkog skupa općenito se označavaju sX i , i = 1, 2, …, N.Prema tome postoji N modaliteta, tj. pojavnih oblika promatranihobilježja.Broj elemenata statističkog skupa koji pripadaju određenoj grupi,tj. jednom modalitetu ili pojavnom obliku promatranog obilježja naziva seapsolutna frekvencija.Oznaka <strong>za</strong> apsolutnu frekvenciju jef i , i = 1, 2, …,N.Zbroj svih elemenata statističkog skupa naziva se opseg statističkogskupa. Zbog principa isključivosti i iscrpnosti taj broj odgovara i zbroju svihapsolutnih frekvencija, kako je prika<strong>za</strong>no izrazom (2.1). 1Nf ii=11 U izrazu (2.1) dan je znak zbrajanja ∑ , koji se čita: zbroj apsolutnih frekvencijaf i , gdje i ide od 1 do N. Neke od karakteristika znaka zbrajanja ili znaka sume suslijedeće:N1. ∑ X i = X 1 + X 2 + ... + X N , gdje je i = indeks zbrajanjai=1N2. ( X ± Y ± Z ...) = X Y ± Z ± ...∑ ±i=1iiiN∑i=1iN± ∑ii=1N∑i=1i6


f1 + f 2 + f 3 + ...+ fN= ∑N f ii=1(2.1)Može se definirati da je skup uređenih parova modalitetapromatranog obilježja i njima pripadajućih apsolutnih frekvencijastatistički niz.2.2. Nizovi kvalitativnih podatakaKvalitativni statistički nizovi su nominalni (atributivni i zemljopisni) iredoslijedni.Nominalni statistički nizovi formiraju se grupiranjem elemenatastatističkog skupa prema modalitetima odgovarajućeg nominalnogobilježja.Modaliteti nominalnog obilježja izražavaju se pomoću atributa,kategorija i slovnih oznaka, a mogu se navoditi abecednim redom, premaveličini apsolutnih frekvencija, te dogovorno ili <strong>za</strong>konski utvrđenim popisima.Na primjer službena statistika koristi: SMTK ili Standardnu međunarodnutrgovinsku klasifikaciju i NKD ili Nacionalnu klasifikaciju djelatnosti.Zemljopisni statistički nizovi formiraju se grupiranjem elemenatastatističkog skupa prema modalitetima odgovarajućeg zemljopisnog iliprostornog obilježja.Modaliteti prostornog obilježja najčešće odgovaraju teritorijalnoadministrativnojpodjeli određenog geografskog prostora, kao na primjer:gradovi, županije, regije, države, kontinenti. Grupe ovog obilježja mogu bitiN3. ∑ X Y = X Y + X Y + ...+ X Y ≠ ∑ X ⋅ ∑Y(ovdje se <strong>za</strong> desni dioi=1ii1122NNNi=1Ni ii=1nejednakosti, primjenom izra<strong>za</strong> 1., može <strong>za</strong>ključiti da suma produkta nijejednaka produktu suma)∑ XNiX i X 1 X 2 X N i=14. ∑ = + + ... + ≠ (ovdje se može <strong>za</strong>ključiti da je sumaNi=1 YiY1Y2YN∑Yii=1kvocijenta različita od kvocijenta suma)N5. ∑ aX = aX + aX + .. + aX = a( X + X + ... + X ) = a∑i=1i12konstanta, jer ne ovisi o indeksu zbrajanja i.NNN. X , gdje je "a"6. ( ± bY ± cZ ... ) = a X ± b Y ± c Z ± ...∑ aX ± ∑ ∑ ∑ , gdje su a, b, c, …i=1konstante.iiiNi=1i1Nii=12Ni=1iNNi=1i7


poredane po abecednom redu, po veličinama apsolutnih frekvencija ili pogeografskom položaju. Ako se zbog veće preglednosti nekoliko modaliteta stavi<strong>za</strong>jedno u grupu "ostalo", ona obično dolazi na kraju statističkog ni<strong>za</strong>.Redoslijedni statistički nizovi formiraju se grupiranjem elemenatastatističkog skupa prema modalitetima odgovarajućeg redoslijednogobilježja.Grupiranje podataka statističkog skupa prema redoslijednom obilježjuvrši se slično kao kod nominalnih obilježja, ali je redoslijed grupa ovdjeodređen rangom koji pojedina grupa obilježja predstavlja. Rangiranje se moževršiti polazeći od najnižeg ranga prema najvišem ili obrnuto.2.3. TabeliranjeTabeliranje je postupak svrstavanja grupiranih prikupljenihstatističkih podataka u tablice.Statističke tablice kao jedan od oblika prikazivanja statističkihpodataka prisutne su u literaturi svuda oko nas.Tablica nastaje crtanjem okomitih i vodoravnih linija prema određenimpravilima. Svaka statistička tablica mora imati: naslov, broj tablice (ako ihima više), tekstualni dio, numerički ili brojčani dio i izvor podataka.Tablica 2.1.Naslov tabliceOznakestupcaZaglavlje0 1 2 … nPred- Oznakeredakstu- redka stupacpacpoljepoljeZbirni redak:m∑i=1Izvor podatakaTablica 2.4. prikazuje opći oblik statističke tablice.Zbirninstupac: ∑Naslov tablice mora biti jasan i kratak, a istovremeno u sebi morasadržavati pojmovnu, prostornu i vremensku definiciju statističkog skupa, da bionaj tko je čita mogao precizno odrediti njezine elemente.j=18


Tekstualni dio statističke tablice sastoji se od dva dijela: <strong>za</strong>glavlja ipredstupca. U <strong>za</strong>glavlju ili tumaču stupaca opisuje se i objašnjava sadržajstupaca. U predstupcu ili tumaču redaka opisuje se i objašnjava sadržaj redaka.To su najčešće oblici statističkog obilježja po kojemu je promatran statističkiniz. Uz tekstualni dio, svaki stupac može biti označen i odgovarajućim brojem.Kako se vidi u tablici 2.4., predstupac se često označava s nulom, a numeriranjedalje ide po redu: 1, 2, …, n.Brojčani ili numerički dio tablice sastoji se od polja u koja se unosefrekvencije, odnosno rezultati grupiranja statističkih podataka. Zbirni ilimarginalni stupac sadrži zbrojeve pojedinih redaka. Njegova sumazbrajaelemente svakog retka po j - stupcima. Zbirni ili marginalni redak sadržizbrojeve pojedinih stupaca. Njegova sumapo i- redcima.m∑i=1∑j=1zbraja elemente svakog stupcaIzvor podataka se navodi ispod tablice. On omogućuje provjeruispravnosti prikupljenih podataka u tablici, kao i eventualnu dopunu podataka,naravno, ako to <strong>za</strong>htjeva statističko istraživanje.Zbog veće preglednosti tablice, često se <strong>za</strong>glavlje, predstupac, zbirniredak i zbirni stupac odvajaju debljim crtama od brojčanog dijela, kao što semože vidjeti u tablici 2.4..Dakle, statistička tablica mora poštivati 3 načela: preglednost,potpunost i jasnoća.Statističke tablice mogu se podijeliti na:1) opće ili izvještajne statističke tablice, i2) analitičke ili sumarne statističke tablice.Opće statističke tablice prikazuju ogroman broj statističkih podataka onekome promatranom statističkom skupu.Analitičke statističke tablice se konstruiraju <strong>za</strong> neku posebnu analizu ione su u pravilu preglednije.U ovisnosti o tome da li se prikupljeni statistički podaci u tabliciprikazuju prema jednom ili više statističkih obilježja i da li se prikazuje jedan iliviše statističkih skupova razlikuju se:1) jednostavne statističke tablice, i2) složene statističke tablice, koje se mogu podijeliti na:• skupne statističke tablice, i• kombinirane statističke tablice.n9


Jednostavne statističke tablice prikazuju jedan statistički skup,grupiran u jedan statistički niz, prema jednom obilježju.Skupne statističke tablice prikazuju dva ili više statistička skupa,grupirana u dva ili više statistička ni<strong>za</strong> prema jednom obilježju.Kombinirane statističke tablice prikazuju jedan statistički skup,grupiran u dva ili više statističkih nizova prema dva ili više obilježja. Ako kodkombinirane tablice s dva obilježja, jedno obilježje ulazi u tablicu iz predstupca,a drugo iz <strong>za</strong>glavlja, kaže se da je to tablica s dva ula<strong>za</strong>. U skladu s tim, postojekombinirane tablice s više ula<strong>za</strong>, ali pri njihovom kreiranju gubi se jasnoća ipreglednost.2.4. Grafičko prikazivanjeUz statističke tablice, pomoćno sredstvo u analizi statističkih nizova sugrafički prikazi.Grafikonima se na jednostavan i pregledan način uz pomoćrazličitih geometrijskih likova prezentiraju osnovne karakteristikestatističkih nizova.Oznake na grafikonu moraju biti takve da onaj tko čita sliku može jasnoraspoznati koji su elementi i koja je pojava prikana. Stoga i grafikon mora imatinaslov, jedinice mjere promatranog obilježja, oznake modaliteta obilježja,izvor podataka i po potrebi ka<strong>za</strong>lo ili tumač oznaka.Postoje tri skupine grafičkih prika<strong>za</strong>:1) površinski grafikoni,2) linijski grafikoni, i3) kartogrami.Nominalni atributivni statistički nizovi grafički se prikazujupovršinskim grafikonima. Površinski grafikoni mogu biti: jednostavni stupci,dvostruki i razdijeljeni stupci, strukturni stupci, proporcionalni strukturnikrugovi i polukrugovi. Osim nabrojenih mogu se koristiti i neki drugigeometrijski likovi (trokuti, kvadrati i slično), raznih veličina i strukture uskladu s frekvencijama promatranog statističkog ni<strong>za</strong>.Grafikon ima naslov i izvor podataka, koji odgovara izvoru podataka utablici po kojoj je konstruiran. Ako se grafikon nalazi na istoj stranici gdje je injegova tablica, na njemu se može izostaviti izvor podataka.Pri konstrukciji jednostavnih stupaca na apscisi se označavaju svimodaliteti obilježja, a na ordinati je skala apsolutnih frekvencija s aritmetičkim10


mjerilom, dakle s originalnim jedinicama. Jednostavni stupci imaju jednakebaze i jednako su udaljeni jedan od drugog i razlikuju se samo po visini kojaodgovara veličini apsolutnih frekvencija. Stoga vrijedi da je i površina stupacaproporcionalna apsolutnim frekvencijama (ba<strong>za</strong> × visina).Dvostruki i razdijeljeni stupci upotrebljavaju se <strong>za</strong> grafičkoprikazivanje dvaju ili više statističkih skupova koji su grupirani premamodalitetima istog obilježja. I ovdje vrijedi da se na apscisi označavaju svimodaliteti obilježja, a na ordinati skala apsolutnih frekvencija.Strukturni stupci također služe <strong>za</strong> prikazivanje više statističkihskupova podijeljenih na iste grupe prema jednom obilježju. Oni su jednakeveličine, a razlikuju se po strukturi.Proporcionalni strukturni krugovi i polukrugovi također prikazujudva ili više skupova podijeljena na jednake grupe. Krugovi, odnosnopolukrugovi, mogu biti iste veličine i razlikovati se samo po strukturi, a mogubiti i različitih polumjera, tj. proporcionalni veličinama promatranih statističkihskupova.Izraz <strong>za</strong> površinu kruga je:P = r2πskupa, tj. sumi svih apsolutnih frekvencija: ∑ f .ni=1iU skladu s tim računa se polumjer ili radijus kruga:r =n∑ f ii=1π, a ona je proporcionalna opsegu(2.2)Na taj način se statistički skupovi mogu uspoređivati po obujmu. Strukturnikrugovi se razlikuju po strukturi, koja odgovara frekvencijama modalitetaobilježja skupa. Dijelovi strukturnog kruga mogu se izraziti u postotcima (%) iliu stupnjevima ( 0 ). Postotci odgovaraju relativnim frekvencijama:fri=diocjelinaf i=n∑ fii=1Relativne frekvencije imaju svojstva:a) 0 ≤ fr i ≤ 1, ∑ fr i = 1, ilini=1ndio f iili fri= ⋅100= ⋅100( u%)cjelinan∑ fii=1(2.3)b) 0 ≤ fr ≤ 100, ∑ = 100 . (2.4)i fr ii=1Stupnjevi strukturnog kruga (S 0 i) računaju se:11


diocjelinaf00 i 0S i = ⋅360 = ⋅360(2.5)n∑ fii=1Ako se konstruiraju strukturni polukrugovi, njegovi se stupnjevi računajuprema (2.6):diocjelinaf00 i 0S i = ⋅180 = ⋅180(2.6)n∑ fii=1Nominalni prostorni statistički nizovi uz navedene grafikone mogu seprikazivati kartogramima.Kartogrami su zemljovidi na kojima se na različite načine(točkama, geometrijskim likovima, slikama i bojama) prikazuje prostornarasprostranjenost elemenata statističkog skupa.Postoje tri vrste kartograma:a) dijagramske karte,b) statističke karte, ic) piktogrami.Dijagramske karte crtaju se spajanjem zemljovida i površinskih grafikona,na primjer, kvadrata, trokuta, krugova, i slično. Površinski grafikoni, odnosnolikovi, moraju biti proporcionalni apsolutnim frekvencijama skupa, čime seizražava intenzitet promatranog obilježja ili pojave. Likovi se ucrtavaju unutargranica površine na zemljovidu koja predočava odgovarajući modalitetprostornog statističkog obilježja, čime se izražava prostorna rasprostranjenostelemenata statističkog skupa.Statističke karte crtaju se tako da se na zemljovidu različitim bojamaili sjenčanjem po pojedinim dijelovima nekog područja pokazuje intenzitet nekepojave, koji je najčešće izražen relativnim brojevima.Piktogrami prostornu rasprostranjenost i intenzitet elemenatastatističkog skupa prikazuju gušće ili rjeđe raspoređenim točkama (ili nekimdrugim znakovima) na odgovarajućem zemljovidu.Redoslijedni statistički nizovi grafički se najčešće prikazujujednostavnim stupcima, a u obzir dolaze i ostali površinski grafikoni(strukturni stupci, strukturni polukrugovi, krugovi i slično).12


2.5. Numerički niz i njegovo grafičko prikazivanjeGrupiranjem elemenata statističkog skupa prema numeričkom ilikvantitativnom obilježju nastaje numerički statistički niz.Grupiranje i uređivanje elemenata numeričkog statističkog skupa ovisio broju podataka i o njihovoj vrsti, odnosno o tome da li se radi o neprekidnim(kontinuiranim) ili prekidnim (diskontinuiranim) numeričkim statističkimobilježjima.Ako numeričko obilježje može poprimiti samo mali broj numeričkihvrijednosti, tada ta svaka vrijednost može biti posebna grupa u nizu. To jenajčešće slučaj kod prekidnog ili diskontinuiranog numeričkog obilježja.Uređen negrupiran prekidni numerički statistički niz ima karakteristikuda su njegove vrijednosti složene po veličini počevši, najčešće, od najmanje:X 1, X 2 ,..., X N ; X i− 1 < X i , i = 2,3,..., N.(2.7)Općenito je pojedina vrijednost obilježja: X i , i = 1,2, ..., k , apripadajuća apsolutna frekvencija: f i , i = 1,2, ..., k .Skup uređenih parova:( X i , f i ), i = 1,2,3, ..., k(2.8)je distribucija frekvencija promatranog prekidnog numeričkog obilježja.Također vrijedi da je suma svih apsolutnih frekvencija jednaka opseguki =i=1statističkog skupa: ∑ f N .Za vrijednosti koje se pojavljuju manje puta formiraju se<strong>za</strong>jedničke grupe ili "razredi". U razredima se nalaze elementi skupa svrijednostima obilježja koje se nalaze između donje i gornje granicerazreda.Na taj način formiranjem razreda se postiže veća preglednost, ali segubi na preciznosti i potpunosti informacija. U slučaju diskontinuiranognumeričkog obilježja donja granica slijedećeg (i+1) razreda razlikuje se odgornje granice prethodnog (i) razreda <strong>za</strong> jedinicu mjere promatranogobilježja.Ove originalne granice razreda nazivaju se još i nominalne granice.Prije provođenja statističke analize potrebno je nominalne granice <strong>za</strong>mijenitipreciznim ili pravim granicama. To se najčešće radi na način da se donjagranica slijedećeg (i+1) nominalnog razreda umanji, a gornja granicaprethodnog (i) nominalnog razreda uveća <strong>za</strong> polovinu razlike između tihgranica. Ponekad se precizne granice formiraju jednostavno na način da se sve13


gornje granice uvećaju <strong>za</strong> 1 jedinicu obilježja i tako izjednače sa svojomslijedećom donjom granicom ili da se sve donje granice umanje <strong>za</strong> 1 jedinicuobilježja i tako izjednače sa svojom prethodnom gornjom granicom.Tablica 2.2.Formiranje preciznih granica tako da se sve gornje granice uvećaju <strong>za</strong> 0,5,a donje umanje <strong>za</strong> 0,5 jedinica promatranog obilježjaDiskontinuirano obilježjeX ia - bc - de - fg - hPrecizne graniceX i(a-0,5) - (b+0,5)(c-0,5) - (d+0,5)(e-0,5) - (f+0,5)(g-0,5) - (h+0,5)Tablica 2.3.Formiranje preciznih granica tako da se sve gornje granice uvećaju <strong>za</strong> 1jedinicu promatranog obilježjaDiskontinuirano obilježjeX ia - bc - de - fg - hPreciznegraniceX ia - (b+1)c - (d+1)e - (f+1)g - (h+1)Kontinuirano ili neprekidno statističko obilježje može poprimitivrijednosti iz nekog intervala, pa se njegovi modaliteti formiraju kao razredi.Skup uređenih parova razreda obilježja i njima pripadajućih frekvencija( DGi ≤ X i < GGi, f i ), i = 1,2,3, ..., k(2.9)je distribucija frekvencija promatranog neprekidnog numeričkog obilježja.U slučaju kontinuiranog numeričkog obilježja donja granica slijedećeg(i+1) razreda jednaka je gornjoj granici prethodnog (i) razreda, pa ovdjenije potrebno računati precizne ili prave granice.Ako nije definirana najmanja vrijednost obilježja <strong>za</strong> neki skup, donjagranica početnog razreda pri grupiranju se može ostaviti otvorena. Isto takoako nije definirana najveća vrijednost obilježja <strong>za</strong> neki skup gornja granicaposljednjeg razreda se može ostaviti otvorena. Međutim prije početka samestatističke analize, ove otvorene granice potrebno je <strong>za</strong>tvoriti takozvanimprocijenjenim granicama, koje se stavljaju u <strong>za</strong>grade, jer njima istraživačprocjenjuje da niti jedan element skupa nema vrijednost manju od prve donje iliveću od <strong>za</strong>dnje gornje procijenjene granice.14


Veličina razreda (i) je razlika između gornje i donje granicerazreda (kada je riječ o diskontinuiranom numeričkom obilježju radi se spreciznim ili pravim granicama).i = GG − DG , i 1,2,..., k.(2.10.)i i =Sredina razreda (sredX i ) je prosjek, (odnosno jednostavna aritmetičkasredina), između donje i gornje granice razreda.:sredXDGi+ GGi= , i 1,2,..., k.(2.11)2i =Ako vrijednosti promatranog numeričkog ni<strong>za</strong> nisu ravnomjernoraspoređene, veličine koje se izračunavaju pomoću sredine razreda sadrže tzv.grešku grupiranja.Grupirani numerički (prekidni i neprekidni) statistički nizovi,odnosno njihove distribucije frekvencija grafički se prikazuju pomoću:a) histograma (površinski grafikoni)b) linijski grafikoni ili poligoni frekvencija.Histogram se konstruira pomoću stupaca koji su naslonjeni jedan nadrugi, a njihova visina je proporcionalna s odgovarajućim frekvencijamanumeričkog ni<strong>za</strong>. Baze stupaca naslonjene su na os apscisu na kojoj jearitmetičko mjerilo promatranog obilježja X.Pri konstrukciji histograma moguća su dva slučaja. Prvi, kada surazredi ili grupe promatranog obilježja jednake veličine, pa su tada i bazestupaca grafikona također jednake, a visine stupaca su proporcionalneoriginalnim apsolutnim frekvencijama.U drugom slučaju, kada veličine razreda obilježja nisu jednake, pa nibaze stupaca histograma nisu jednake, a <strong>za</strong> visinu stupaca potrebno jekorigirati originalne apsolutne frekvencije, dakle izračunati korigiranefrekvencije fc i .f ifci = (2.12)iKorigirane frekvencije (2.12) su omjer apsolutnih frekvencija iveličine razreda. Pri tom veličina razreda (i) može biti originalna, ili tojveličini proporcionalna vrijednost.Linijski grafikon ili poligon frekvencija konstruira se spajanjemsredina vrhova histograma.Ponekad se u statističkoj analizi statističkih nizova želi utvrditi kolikoelemenata (apsolutno i/ili relativno) promatranog statističkog numeričkog ni<strong>za</strong>ima vrijednost obilježja manju ili veću od neke vrijednosti. Odgovor na to15


pitanje može se dobiti formiranjem odgovarajućih nizova kumulativnihapsolutnih i relativnih frekvencija. Postoje:a) Kumulativni niz apsolutnih frekvencija "manje od",b) Kumulativni niz apsolutnih frekvencija "više od",c) Kumulativni niz relativnih frekvencija "manje od" id) Kumulativni niz relativnih frekvencija "više od".Kumulativni niz apsolutnih frekvencija "manje od" dobije sepostupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencijapočevši od prve u nizu prema posljednjoj. Frekvencije kumulativnog ni<strong>za</strong>apsolutnih frekvencija "manje od" pokazuju koliki broj elemenata promatranogstatističkog skupa ima vrijednost obilježja manju od gornje granicepripadajućeg razreda.Kumulativni niz apsolutnih frekvencija "više od" dobije sepostupnim ili sukcesivnim zbrajanjem vrijednosti apsolutnih frekvencijapočevši od posljednje u nizu prema prvoj. Frekvencije kumulativnog ni<strong>za</strong>apsolutnih frekvencija "više od" pokazuju koliki broj elemenata promatranogstatističkog skupa ima vrijednost obilježja višu ili jednaku od gornje granicepripadajućeg razreda.Kumulativni niz relativnih frekvencija "manje od" dobije sepostupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija počevšiod prve u nizu prema posljednjoj. Frekvencije kumulativnog ni<strong>za</strong> relativnihfrekvencija "manje od" pokazuju koliki udio (ili postotak ako su izražene u %)elemenata promatranog statističkog skupa ima vrijednost obilježja manju odgornje granice pripadajućeg razreda.Kumulativni niz relativnih frekvencija "više od" dobije sepostupnim ili sukcesivnim zbrajanjem vrijednosti relativnih frekvencija počevšiod posljednje u nizu prema prvoj. Frekvencije kumulativnog ni<strong>za</strong> relativnihfrekvencija "više od" pokazuju koliki udio (ili postotak ako su izražene u %)elemenata promatranog statističkog skupa ima vrijednost obilježja višu ilijednaku od gornje granice pripadajućeg razreda.Grafički prikaz kumulativnih nizova jeste primjena linijskoggrafikona, tj. poligona kumulativnih frekvencija.16


3. RELATIVNI BROJEVI I NJIHOVO GRAFIČKOPRIKAZIVANJERelativni brojevi su neimenovani, te se stoga pomoću njih moguuspoređivati i analizirati pojave koje imaju različitu jedinicu mjere ilirazličit broj elemenata. Na taj način dobije se relativna važnost dijela ilicjeline statističkog ni<strong>za</strong>.Relativni brojevi nastaju dijeljenjem dviju veličina. Veličina skojom se dijeli zove se osnova relativnog broja i po njoj se relativni brojevimeđusobno razlikuju.Općenito se relativni brojevi mogu podijeliti na:a) relativni brojevi strukture,b) relativni brojevi koordinacije, ic) indeksi (ni<strong>za</strong> kvalitativnih podataka).Relativni brojevi strukture pokazuju odnos dijela prema cjelini, i njimase olakšava anali<strong>za</strong> rasporeda podataka prema modalitetima obilježja u jednomstatističkom nizu, odnosno njihova struktura. Najčešće se izražavaju upostocima, a mogu i u promilima.Ako relativni brojevi strukture (P i ) pokazuju odnos apsolutnih frekvencijaprema opsegu statističkog skupa (tj. ukupnom broju elemenata statističkogskupa) tada se zovu relativne frekvencije (fr i ).Pi=diocjelinaf i; fri=(3.1)n∑ fii=1Pi=diocjelina⋅100( u%);frif i=n∑ fii=1⋅100( u%)(3.2)Pi=diocjelina⋅1000( u prom.);f ifri=n∑ fii=1⋅1000( u prom.)(3.3)Zbroj svih relativnih brojeva u jednom statističkom nizu je 1, ili 100, ili1000, u ovisnosti o tome kako je relativni broj izražen.Relativni brojevi strukture se grafički mogu prikazivati pomoćustrukturnih stupaca, strukturnih krugova, polukrugova, ili nekim drugimgeometrijskim likom. Pri tom se konstruiraju geometrijski likovi jednakihpovršina, jer je zbroj relativnih frekvencija uvijek isti. Likovi će se razlikovatisamo po strukturi.17


Relativni brojevi koordinacije pokazuju odnos dviju pojava ilifrekvencija u različitim statističkim nizovima, koje mogu imati različitujedinicu mjere, a koje ima smisla uspoređivati. Na primjer, to je brojstanovnika po km 2 .gdje je:Računaju se:AiR i = , (3.4)BiA i - veličina koja se uspoređuje,B i - veličina s kojom se A i uspoređuje.Grafički prikaz relativnih brojeva koordinacije je tzv. Var<strong>za</strong>rov znak.To su stupci, odnosno pravokutnici, čija ba<strong>za</strong> na apscisi odgovara nazivniku(B i ), a visina samom omjeru relativnog broja koordinacije (R i ). Ako se zna da jepovršina stupca (pravokutnika), ba<strong>za</strong> × visina, može se <strong>za</strong>ključiti da površinaodgovara brojniku (A i ), tj. veličini koja se uspoređuje.Indeksima ni<strong>za</strong> kvalitativnih podataka uspoređuje se smjer iintenzitet varijacija frekvencija nekog statističkog ni<strong>za</strong> s takvimvarijacijama drugog statističkog ni<strong>za</strong>.Računaju se tako da se svaki član promatranog ni<strong>za</strong> stavi u odnos premaodabranoj bazi, koja može biti jedan od članova ni<strong>za</strong> ili neka druga <strong>za</strong>danaveličina.f iI i = ⋅100(3.5)BDakle, prema izrazu (3.5) indeksi se računaju kao omjer frekvencijepromatranog ni<strong>za</strong> i odabrane baze (B).Grafički prikaz indeksa kvalitativnih nizova su jednostavni stupci kojiimaju jednake baze, jer se ovdje članovi ni<strong>za</strong> uspoređuju uvijek s istomveličinom. Specifičnost ovog grafikona jeste da se stupci naslanjaju, na bazukoja je jednaka 100.18


4. SREDNJE VRIJEDNOSTIRačunanjem srednjih vrijednosti dolazi se do informacija ovrijednostima statističkog obilježja oko kojih se raspoređuju elementistatističkog ni<strong>za</strong>.Srednja vrijednost je vrijednost statističkog obilježja oko koje segrupiraju podaci statističkog ni<strong>za</strong>. Još se zove i "mjera centralnetendencije".Srednje vrijednosti mogu se podijeliti na:1. Potpune srednje vrijednosti računaju se upotrebom svih podataka ustatističkom nizu. Potpune srednje vrijednost su:a) aritmetička sredina,b) harmonijska sredina,c) geometrijska sredina.2. Položajne srednje vrijednosti određuju se položajem podataka u nizu.Najvažnije položajne srednje vrijednosti su :a) medijanb) mod.4.1. Aritmetička sredinaAritmetička sredina spada u potpune srednje vrijednosti i računa seupotrebom svih podataka u statističkom nizu.Aritmetička sredina je omjer zbroja svih vrijednosti numeričkogobilježja jednog ni<strong>za</strong> i broja elemenata tog ni<strong>za</strong>.Ako se radi o negrupiranom statističkom numeričkom nizu računase jednostavna aritmetička sredina:N∑ Xi X + X +X = = 1 2 ...=NNi1 + X N(4.1)Ako se radi o grupiranom statističkom numeričkom nizu računa sesložena, vagana ili ponderirana aritmetička sredina.Poznato je da apsolutne frekvencije označavaju broj elemenata skupakoji pripadaju određenom modalitetu promatranog statističkog obilježja. Iz toga19


se može <strong>za</strong>ključiti da je važnost svake vrijednosti obilježja ovisna o frekvenciji,jer veća frekvencija znači veći udio tog oblika obilježja u promatranom skupu.Zato se frekvencija još naziva težinski faktor ili ponder kod grupiranih nizova.Vagana ili ponderirana aritmetička sredina računa se premaizrazu:f1 x1+ f2x2+ ... + fkxkf1x1+ f2x2+ ... + fkxX ==f + f + ... + fN12kkk∑ fixi=1=k∑ fi=1ii(4.2)U jednadžbi (4.2), k predstavlja broj grupa, odnosno modalitetapromatranog numeričkog obilježja. Nazivnik ovog izra<strong>za</strong>, kao suma svihapsolutnih frekvencija, odgovara opsegu statističkog skupa.S obzirom da su relativne frekvencije upravno proporcionalneapsolutnim frekvencijama, aritmetička sredina se može izračunati i pomoćunjih:X =fr x + fr x11fr + fr1222+ ... + fr x+ ... + frkkkk∑ frixi=1=k∑ fri=1ii(4.3)Nazivnik jednadžbe (4.3) može biti 1 ili 100, što ovisi o tome da li surelativne frekvencije dane u decimalnom obliku ili u postotcima.Ako su veličine razreda grupiranog numeričkg ni<strong>za</strong> različite od 1,<strong>za</strong> računanje vagane ili ponderirane aritmetičke sredine potrebno jeizvršiti aproksimaciju pomoću sredine razreda. Sredina razreda, kako je većrečeno, dobije se kao jednostavan prosjek donje i gornje granice razreda. Na tajnačin ona predstavlja sve vrijednosti obilježja koje se javljaju u jednoj grupi.Stoga je, u ovom slučaju, aritmetička sredina procjena stvarne aritmetičkesredine numeričkog ni<strong>za</strong>.Aritmetička sredina izražava se u originalnim jedinicama mjerepromatranog numeričkog obilježja, obuhvaća sve elemente nekog skupa, te sepomoću nje mogu uspoređivati nizovi koji su grupirani po jednakom obilježju.Uz ove, aritmetička sredina <strong>za</strong>dovoljava i slijedeće kriterije:a) Aritmetička sredina nalazi su između najveće i najmanje vrijednostipromatranog numeričkog obilježja:x≤ X ≤(4.4)min x maxb) Zbroj odstupanja vrijednosti numeričkog obilježja od aritmetičkesredine u jednoj distribuciji je uvijek nula.N∑(xi − X ) = 0 , <strong>za</strong> negrupirani niz (4.5)i=120


k∑ fi ( xi− X ) = 0 , <strong>za</strong> grupirani niz (4.6)i=1c) Zbroj kvadrata odstupanja vrijednosti numeričkog obilježja odaritmetičke sredine u jednoj distribuciji je manji ili jednak zbrojukvadrata odstupanja vrijednosti numeričkog obilježja u istoj distribucijiod bilo koje druge vrijednosti (a).Ni=1iN22∑( x − X ) ≤ ∑(x − a), <strong>za</strong> negrupirani niz (4.7)kii=1ii=1ki22∑ f ( x − X ) ≤ ∑ f ( x − a), <strong>za</strong> grupirani niz (4.8)ii=1iAko neki numerički niz sadrži ekstremno male ili velike vrijednostiobilježja, aritmetička sredina kao prosječna vrijednost gubi na svojojreprezentativnosti. Taj problem je dodatno izražen kada u distribuciji postojerazredi s otvorenom donjom, odnosno gornjom granicom obilježja, i kada nijemoguće te granice objektivno procijeniti.4.2. Harmonijska sredinaHarmonijska sredina spada u potpune srednje vrijednosti i računase upotrebom svih podataka u statističkom nizu.Harmonijska sredina je recipročna vrijednost aritmetičke sredinerecipročnih vrijednosti numeričkog obilježja u jednom nizu.Ako se radi o negrupiranom statističkom numeričkom nizu računase jednostavna harmonijska sredina:1H =N 1∑= 1 xN1=1 1 1+ + ... +x1x2xNNN=1 1 1+ + ... +x x xN=N 1∑i i 1 2N i=1 xi(4.9)Ako se radi o grupiranom statističkom numeričkom nizu računa sesložena ili vagana harmonijska sredina:H =1k fi∑i=1 xki∑ fii=1=f1f2+x x12k1f+ ... +x∑ fii=1kk=kf1f2+x x1∑ fii=12f+ ... +xkkk∑ fii=1=k fi∑i=1 xi(4.10)21


Ponderi su i ovdje apsolutne frekvencije. Ako su veličine razredarazličite od 1, i <strong>za</strong> harmonijsku sredinu se radi aproksimacija na način da seračunaju sredine razreda x i .Harmonijska sredina rijetko se primjenjuje u praksi. Specifičnopodručje njene primjene je izračunavanje srednjih vrijednosti relativnihbrojeva koordinacije.Relativni brojevi koordinacije (R i ) pokazuju odnos dviju pojavakoje ima smisla uspoređivati (A i i B i ).AiR i = (4.11)BiOpćenito srednja vrijednost relativnih brojeva koordinacije jeomjer zbroja svih vrijednosti veličine koja se uspoređuje (k∑ A ii=1) i zbrojak∑ B ii=1svih vrijednosti veličine s kojom se uspoređuje veličina iz brojnika ( ):k∑ Aii=1R =(4.12)k∑ Bii=1Ponekad u konkretnom statističkom istraživanju nisu dostupni podacio veličinama sadržanim u relativnom broju koordinacije, pa su priizračunavanju njegove srednje vrijednosti moguće 3 situacije:a) Ako su dostupni podaci o relativnom broju koordinacije (R i ) i o veličinis kojom se uspoređuje veličina iz brojnika (B i ), srednja vrijednost ( R )će se izračunati pomoću izra<strong>za</strong> <strong>za</strong> složenu ili vaganu aritmetičkusredinu:k∑ RiBii=1R =(4.13)k∑ Bii=1Na temelju osnovne relacije (4.12) jasno je da vrijedi, da je veličina izbrojnika:kk∑ A = ∑ R B . Ponderi su ovdje vrijednosti veličine s kojom sei ii= 1 i=1uspoređuje veličina iz brojnika: Bi.ib) Ako su dostupni podaci o relativnom broju koordinacije (R i ), bezinformacija o veličinama u brojniku (A i ) i nazivniku (B i ), srednjuvrijednost R nije moguće izračunati. Pokušaj aproksimacije ove srednjevrijednosti ne daje vjerodostojan rezultat.22


c) Ako su dostupni podaci o relativnom broju koordinacije (R i ) i oveličini koja se uspoređuje (A i ), srednja vrijednost ( R ) će se izračunatipomoću izra<strong>za</strong> <strong>za</strong> složenu ili vaganu harmonijsku sredinu:k∑ Aii=1R =(4.14)k Ai∑i=1 RiNa temelju osnovne relacije (4.12) jasno je da vrijedi, da je veličina iznazivnika:k∑ Bii=1k= ∑ A Rii=1uspoređuje brojnika: A i .i. Ponderi su ovdje vrijednosti veličine koja se4.3. Geometrijska sredinaGeometrijska sredina spada u potpune srednje vrijednosti i računase upotrebom svih podataka u statističkom nizu.Geometrijska sredina je N-ti korijen umnoška 2 svih vrijednostinegrupiranog numeričkog obilježja jednog ni<strong>za</strong>.G =NN ∏ xii=1=Nx ⋅ x ⋅...⋅ x12N(4.15)U izrazu (4.15) dana je jednostavna geometrijska sredina koja sekoristi <strong>za</strong> negrupirane statističke numeričke nizove. Ako su nizovi grupirani porazredima računa se složena ili vagana geometrijska sredina:G =NN ∏ fii=1xi=Nf x ⋅ f x ⋅...⋅ f x1 122NN(4.16)Ponderi su i ovdje apsolutne frekvencije. Ako su veličine razredarazličite od 1, i <strong>za</strong> geometrijsku sredinu se radi aproksimacija na način da seračunaju sredine razreda x i .Geometrijska sredina kod numeričkih nizova nema neku logičnuinterpretaciju. U poslovnoj i makroekonomskoj statistici geometrijskasredina se najčešće upotrebljava u analizi vremenskih nizova.4.4. Medijan2 Znak produkta ili umnoška ni<strong>za</strong> vrijednosti je: ∏ xNii=1= x ⋅ x ⋅...⋅ x12N23


Medijan je vrijednost statističkog obilježja koja statistički niz dijelina dva jednaka dijela.Medijan se može primijeniti na redosljedne i kvantitativne statističkenizove, a spada u položajne srednje vrijednosti. Medijan se ne primjenjuje kodnominalnih nizova, jer poredak oblika ovog obilježja može biti proizvoljan.Kod negrupiranog, a uređenog ni<strong>za</strong> (po veličini vrijednostiobilježja), medijan je vrijednost obilježja koja pripada elementu statističkogni<strong>za</strong> koji se nalazi u sredini ni<strong>za</strong>. Ako je broj elemenata statističkog ni<strong>za</strong> paran,onda se <strong>za</strong> medijan uzima jednostavan prosjek vrijednosti obilježja dvajučlanova koji se nalaze na sredini statističkog ni<strong>za</strong>. (Npr. <strong>za</strong> niz s 10 podataka,nakon što se vrijednosti obilježja poredaju po veličini medijan je prosjek 5. i 6.vrijednosti obilježja.)Ako je statistički niz grupiran u razrede, prije računanja medijanapotrebno je izračunati frekvencije kumulativnog ni<strong>za</strong> "manje od" ili "više od", tese u takvom nizu traži središnji član. Ako se računaju frekvencijekumulativnog ni<strong>za</strong> "manje od" traži se prva frekvencija ni<strong>za</strong> koja sadržiN 2 . Razred koji odgovara ovoj frekvenciji kumulativnog ni<strong>za</strong> "manje od"je medijalni razred.Ako su veličine razreda obilježja jednake 1, vrijednost obilježjakoja odgovara odabranoj frekvenciji kumulativnog ni<strong>za</strong> je medijan.Ako su veličine razreda obilježja različite od 1, medijan se računapo izrazu:MeN m− ∑ fiiL +21⋅i, (4.17)f==1gdje je:medL1- donja prava ili precizna granica medijalnog razreda,N 2 - polovina elemenata statističkog ni<strong>za</strong>,m∑ f ii=1- zbroj svih apsolutnih frekvencija do medijalnog razreda, ne uključujućimedijalni razred (tj. kumulativna frekvencija ispred kumulativne frekvencijemedijalnog razreda),fmed- apsolutna frekvencija medijalnog razreda,i - originalna veličina medijalnog razreda.24


4.4.1. KvantiliKvantili su vrijednosti statističkog obilježja koje statistički nizdijele na q jednakih dijelova.Kvartili su vrijednosti statističkog obilježja koje statistički nizdijele na 4 jednaka dijela. Kvartili se mogu podijeliti na:a) donji kvartil (Q 1 ) ib) gornji kvartil (Q 3 ) .Donji kvartil dijeli statistički niz na četiri jednaka dijela u omjeru1:3, odnosno 25% elemenata statističkog skupa ima vrijednost obilježjamanju od donjeg kvartila, a 75% elemenata statističkog skupa imavrijednost obilježja veću od donjeg kvartila.Gornji kvartil dijeli statistički niz na četiri jednaka dijela u omjeru3:1, odnosno 75% elemenata statističkog skupa ima vrijednost obilježjamanju od donjeg kvartila, a 25% elemenata statističkog skupa imavrijednost obilježja veću od gornjeg kvartila.Kvartili se, slično kao i medijan, mogu primijeniti na redosljedne ikvantitativne statističke nizove, a određuju se položajem u nizu. Ni oni se neprimjenjuju kod nominalnih nizova, jer kako je već naglašeno poredak oblikaovog obilježja može biti proizvoljan.Kod negrupiranog, a uređenog ni<strong>za</strong> (po veličini vrijednostiobilježja), donji kvartil je vrijednost obilježja koja pripada elementustatističkog ni<strong>za</strong> čiji rang (r) tj. mjesto u nizu odgovara:1 x r , gdje je = INT ( N 4) + 1Q =r , ako N nije djeljiv s 4; 3x + r + 11 = r xQ , gdje je r = N 4 , ( r + 1) = N 4 + 1, ako je N djeljivo s 4,2računa se prosjek obilježja koji se nalaze na mjestu u nizu: r i ( r +1) .Kod negrupiranog, a uređenog ni<strong>za</strong> (po veličini vrijednostiobilježja), gornji kvartil je vrijednost obilježja koja pripada elementustatističkog ni<strong>za</strong> čiji rang tj. mjesto u nizu odgovara:Q 3 = x r , gdje je r = INT ( 3N4) + 1 , ako N nije djeljiv s 4;3 INT predstavlja cijeli dio decimalnog broja dobivenog dijeljenjem (eng. integer). npr.:INT (6,3) = 6,INT (6,7) = 6.25


x + r+13 = r xQ , gdje je r = 3N 4 , ( r + 1) = 3N4 + 1, ako je N djeljivo s 4,2računa se prosjek obilježja koji se nalaze na mjestu u nizu: r i ( r +1) .Ako je statistički niz grupiran u razrede, prije računanja kvartilapotrebno je izračunati frekvencije kumulativnog ni<strong>za</strong> "manje od" ili "više od", tese u takvom nizu traži odgovarajući član. Ako se računaju frekvencijekumulativnog ni<strong>za</strong> "manje od" <strong>za</strong> donji kvartil se traži prva frekvencijani<strong>za</strong> koja sadrži N 4 . Za gornji kvartil se traži prva frekvencija ni<strong>za</strong> kojasadrži 3N 4 . Razred koji odgovara odabranoj frekvenciji kumulativnogni<strong>za</strong> "manje od" je razred donjeg, odnosno gornjeg kvartila.Ako su veličine razreda obilježja jednake 1, vrijednost obilježjakoja odgovara odabranoj frekvenciji kumulativnog ni<strong>za</strong> je donji, odnosnogornji kvartil.Ako su veličine razreda obilježja različite od 1, donji kvartil seračuna po izrazu:QN q− ∑ fiiL +4 11⋅ i , (4.18)f=1 =k var tgdje je:L1- donja prava ili precizna granica donje kvatilnog razreda,N4q∑ f ii=1- četvrtina elemenata statističkog ni<strong>za</strong>,- zbroj svih apsolutnih frekvencija do donje kvartilnog razreda, neuključujući taj razred (tj. kumulativna frekvencija ispred kumulativnefrekvencije donje kvartilnog razreda),fkvar t- apsolutna frekvencija donje kvartilnog razreda,i - originalna veličina kvartilnog razreda.Ako su veličine razreda obilježja različite od 1, gornji kvartil seračuna po izrazu:Q3Nq− ∑ fii 1L1+4f=3 =k var tgdje je:⋅i, (4.19)L1- donja prava ili precizna granica gornje kvatilnog razreda,3N 4 - tri četvrtine elemenata statističkog ni<strong>za</strong>,26


q∑ f ii=1- zbroj svih apsolutnih frekvencija do gornje kvartilnog razreda, neuključujući taj razred (tj. kumulativna frekvencija ispred kumulativnefrekvencije gornje kvartilnog razreda),fkvar t- apsolutna frekvencija gornje kvartilnog razreda,i - originalna veličina kvartilnog razreda.4.5. ModMod je vrijednost statističkog obilježja koja se najčešće javlja unekom nizu, tj. vrijednost obilježja kojoj pripada najveća frekvencija.Mod se može primijeniti na kvalitativne i kvantitativne statističkenizove, a spada u položajne srednje vrijednosti.Kod nominalnih obilježja mod se određuje brojanjem, na način da setraži koja se vrijednost obilježja u nizu najčešće javlja. Ako je niz grupiran, tražise najveća apsolutna frekvencija. Vrijednost obilježja kojoj pripada ta najvećaapsolutna frekvencija je mod.Kod kvantitativnih statističkih obilježja vrijednost moda odgovaravrijednosti obilježja kojoj pripada najveća korigirana frekvencija ( fc i ). Ako suveličine razreda ili grupa numeričkog obilježja jednake nije potrebno korigiratifrekvencije, već se radi s originalnim apsolutnim frekvencijama. Ukoliko sevrijednost moda ne može točno odrediti primjenjuje se slijedeći izraz <strong>za</strong>izračunavanje moda:Mo( b − a)= L +⋅( b − a) + ( b − c) i1 , (4.20)gdje je:L1- donja prava ili precizna granica modalnog razreda,b - najveća korigirana frekvencija (tj. frekvencija modalnog razreda),a - korigirana frekvencija ispred frekvencije modalnog razreda,c - korigirana frekvencija i<strong>za</strong> frekvencije modalnog razreda,i - veličina modalnog razreda.U izrazu 3.1 frekvencije ispred (a ) i i<strong>za</strong> ( c ) modalnog razreda služekao ponderi koji pomiču mod od sredine odgovarajućeg modalnog razredaprema njegovoj donjoj ili gornjoj granici.27


Potrebno je napomenuti da kod kontinuiranog numeričkog ni<strong>za</strong> modnema logičnu i jasnu interpretaciju, pa njegovo izračunavanje u tom slučajunema smisla.Osim. unimodalnih nizova koji imaju samo jedan mod, postojestatistički nizovi u kojima se dvije ili više vrijednosti obilježja mogu pojavljivatičešće u odnosu na ostale modalitete obilježja. U tom slučaju kaže se su tobimodalni ili multimodalni nizovi. Kod bimodalne distribucije, koja ima dvavrha, postoji glavni mod i lokalni mod. U takvom slučaju kada je u nizuprisutno više od jednog moda, potrebno je statistički skup podijeliti na višepodskupova, od kojih će svaki imati svoja karakteristična svojstva, te izvršitianalizu svakog podskupa posebno.4.6. Odnosi među srednjim vrijednostimaSrednje vrijednosti oko koje se grupiraju podaci statističkog ni<strong>za</strong> ilimjere centralne tendencije određuju se položajem podataka u statističkom nizukao i obuhvatom svih podataka ni<strong>za</strong>. Izbor srednje vrijednosti u nekomskupu ovisi o svojstvima elemenata skupa i o vrsti statističkog obilježja pokojem se ti elementi promatraju:a) <strong>za</strong> nominalna obilježja može se računati: mod (Mo),b) <strong>za</strong> redosljedna obilježja može se računati: mod (Mo) i medijan (Me),c) <strong>za</strong> numerička obilježja može se računati: mod (Mo), medijan (Me),aritmetička sredina ( X ), geometrijska sredina (G) i harmonijskasredina (H).Elementi numeričkog statističkog ni<strong>za</strong> mogu biti i negativni. U tom slučajumože se računati samo geometrijska (G) i harmonijska (H) sredina.Kod numeričkih statističkih nizova sa strogo pozitivnim vrijednostimavrijedi slijedeći odnos između harmonijske, geometrijske i aritmetičke sredine:x≤ H ≤ G ≤ X ≤(4.21)min x maxDakle, harmonijska, geometrijska i aritmetička sredina se nalaze izmeđunajveće i najmanje vrijednosti numeričkog obilježja, a aritmetička sredina imanajveću srednju vrijednost. Njihove veličine se poklapaju samo onda kada ujednom nizu svi elementi imaju jednake vrijednosti obilježja.Prema rasporedu po veličini srednjih vrijednosti u jednom nizu može se<strong>za</strong>ključiti kakav je raspored elemenata skupa. Naime, elementi skupa mogu bitiravnomjerno ili simetrično raspoređeni oko srednjih vrijednosti, a mogu bitiraspršeni pozitivno tj. na desnu stranu ili negativno tj. na lijevu stranu.28


Slika 4.1.f if iXx if ia) b) c)M o M e Xx iX M e M ox iM eM oSimetrična Pozitivna ili desnostrana Negativna ili lijevostranadistribucuja asimetrija asimetrijaNa dijelu slike pod (a) prika<strong>za</strong>na je jedna savršeno simetrična distribucijau kojoj su aritmetička sredina (prosjek), medijan (vrijednost obilježja kojaskup dijeli na dva jednaka dijela) i mod (najčešća vrijednost obilježja, kojaodgovara vrhu krivulje) u istoj točki, odnosno jednaki:X = Me = Mo . (4.22)Na dijelu slike pod (b) prika<strong>za</strong>na je jedna pozitivno ili desnostranoasimetrična distribucija (vidi se rasipanje vrijednosti obilježja na desnustranu) u kojoj je aritmetička sredina veća od medijana, koji je veći odmoda.X > Me > Mo . (4.23)Na dijelu slike pod (c) prika<strong>za</strong>na je jedna negativno ili lijevostranoasimetrična distribucija (vidi se rasipanje vrijednosti obilježja na lijevu stranu)u kojoj je aritmetička sredina manja od medijana, koji je manji od moda.X < Me < Mo . (4.24)29


5. MJERE DISPERZIJE ILI RASPRŠENOSTIInformaciju o rasporedu elemenata daju mjere raspršenosti ilidisperzije elemenata numeričkog statističkog skupa.Postoje apsolutne i relativne mjere raspršenosti. Apsolutni poka<strong>za</strong>teljiizraženi su u originalnim jedinicama mjere i omogućavaju usporedbu nizovaprema istom obilježju (apsolutni poka<strong>za</strong>telji su: raspon varijacije,interkvartil, varijanca i standardna devijacija).Usporedbu raspršenosti elemenata nizova s različitom mjernomjedinicom omogućuju relativni poka<strong>za</strong>telji, koji su najčešće izraženi upostocima (relativni poka<strong>za</strong>telji su: koeficijent kvartilne devijacije ikoeficijent varijacije).Neke mjere raspršenosti temelje se na dijelu podataka, a nekeobuhvaćaju sve elemente promatranog statističkog ni<strong>za</strong>. Stoga se razlikuju:a) Nepotpune mjere raspršenosti: raspon varijacije,interkvartil i koeficijent kvartilne devijacije.b) Potpune mjere raspršenosti: varijanca, standardnadevijacija i koeficijent varijacije.5.1. Raspon varijacije, interkvartilni raspon i koeficijentkvartilne devijacijeRaspon varijacije je najjednostvnija mjera disperzije, a predstavljarazliku između najveće i najmanje vrijednosti numeričkog obilježjapromatranog ni<strong>za</strong>.R = x max − x min(5.1)Ovaj apsolutni poka<strong>za</strong>telj raspršenosti izražen je u originalnimjedinicama mjere numeričkog obilježja. Može poprimiti vrijednost 0. To sedogađa u slučaju kada svi elementi ni<strong>za</strong> imaju jednaku vrijednost obilježja.Najveća vrijednost ovog poka<strong>za</strong>telja nije ograničena, jer ona ovisi o konkretnojraspršenosti promatranih vrijednosti obilježja.Raspon varijacije je nepotpuna mjera disperzije jer se računa samo natemelju dvije vrijednosti obilježja, odnosno na temelju najveće i najmanjevrijednosti.Interkvartil je apsolutna, nepotpuna mjera raspršenosti, kojapokazuje disperziju srednjih 50% elemenata uređenog numeričkog ni<strong>za</strong>.30


I q= Q 3 − Q(5.2)1Interkvartil predstavlja razliku gornjeg i donjeg kvartila. Na tajnačin se eliminira 25% ekstremno malih i 25% ekstremno velikih vrijednostiobilježja u nizu.Slika 5.1.f i25%50%25%Q 1 Q 3x iSlika 5.1. prikazuje jednu simetričnu distribuciju, gdje su elementiskupa ravnomjerno raspoređeni oko srednjih vrijednosti. Poznato je da donjikvartil (Q 1 ) dijeli distribuciju u omjeru 1:3, tj. da 25% elemenata skupa imavrijednost obilježja manju od donjeg kvartila, a 75% elemenata skupa imavrijednost obilježja veću od donjeg kvartila. Isto tako, gornji kvartil (Q 3 ) dijelidistribuciju u omjeru 3:1, tj. da 75% elemenata skupa ima vrijednost obilježjamanju od gornjeg kvartila, a 25% elemenata skupa ima vrijednost obilježja većuod gornjeg kvartila. Na taj način interkvartil pokazuje disperziju srednjih 50%elemenata skupa.Koeficijent kvartilne devijacije je relativna nepotpuna mjeraraspršenosti. Predstavlja relativnu disperziju srednjih 50% elemenatanumeričkog ni<strong>za</strong>. Računa se na temelju samo dvije vrijednosti obilježja, a to sudonji i gornji kvartil.Q − QV q+3 1= (5.3)Q3Q1Koeficijent kvartilne devijacije se računa kao omjer interkvarila (razlikakvartila) i zbroja donjeg i gornjeg kvartila. Vrijedi da je:0 ≤ V < 1(5.4)qOvaj poka<strong>za</strong>telj je jednak 0 samo u slučaju kada nema disperzije. Akose njegova vrijednost približava 1, to znači da je raspršenost vrijednostiobilježja veća.S obzirom da je ovo relativni poka<strong>za</strong>telj, pomoću njega je mogućeuspoređivati raspršenost srednjih 50% elemenata različitih numeričkihdistribucija s različitim jedinicama mjere.31


5.2. Varijanca, standardna devijacija i koeficijentvarijacijeVarijanca spada u potpune mjere raspršenosti, jer obuhvaća sveelemente odabranog numeričkog statističkog ni<strong>za</strong>. Ovaj poka<strong>za</strong>telj mjeriodstupanja, tj. raspršenost elemenata skupa od aritmetičke sredine.S obzirom na poznato svojstvo aritmetičke sredine da je zbrojodstupanja vrijednosti obilježja od aritmetičke sredine u jednoj distribucijiNuvijek nula, tj. da je: ∑(xi − X ) = 0 (<strong>za</strong> negrupirani niz) i ∑ fi ( xi− X ) = 0 (<strong>za</strong>i=1grupirani niz), varijanca se izražava preko kvadrata ovih odstupanja.Varijanca je prosječno kvadratno odstupanje vrijednostinumeričkog obilježja od aritmetičke sredine.( x − X )N2 N2∑ i ∑ xi2 i = 1i = 1 2σ == − X , <strong>za</strong> negrupirani niz (5.5)N( x − X )Nk2 k2∑ fii ∑ fixi2 i=1i=12σ == − X , <strong>za</strong> grupirani niz (5.6)kk∑ fii=1∑ fii=1Varijanca je mjera raspršenosti izražena u drugom stupnju, pa kaorezultat daje jedinice mjere numeričkog obilježja na kvadrat. Stoga je otežananjena interpretacija.Standardna devijacija je pozitivan korijen iz varijance i izražena jeu originalnim jedinicama mjere. Može se definirati kao kvadratnoodstupanje vrijednosti numeričkog obilježja od aritmetičke sredine.( x − X )N2 N2∑ i∑ xi2 i 1i=1 2σ = + σ = += = + − X , <strong>za</strong> negrupirani niz (5.7)N( x − X )Nk2 k2∑ fii∑ fixi2 i=1i=12σ = + σ = += + − X , <strong>za</strong> grupirani niz (5.8)kk∑ fii=1∑ fii=1Pomoću standardne devijacije u originalnim mjernim jedinicamaobilježja može se uspoređivati raspršenost oko aritmetičke sredine nizova kojisu grupirani po jednakom obilježju.Varijanca i standardna devijacija, kao apsolutne mjere disperzije neomogućuju usporedbu disperzije vrijednosti obilježja koje imaju različitujedinicu mjere. Također mogu uputiti na pogrešan <strong>za</strong>ključak pri usporedbiki=132


disperzije obilježja nizova s različitim pojedinačnim vrijednostima obilježja. Utom slučaju se može računati:a) standardizirano obilježjeb) relativni poka<strong>za</strong>telji disperzijeStandardizirano obilježje (z i ) je linearna transformacija originalnihvrijednosti numeričkog obilježja x i , a pokazuje odstupanje vrijednostiobilježja od aritmetičke sredine u standardnim devijacijama.xi− Xzi = , i = 1,2,3, ... , N.σVrijede slijedeća svojstva standardiziranog obilježja:(5.9)a) aritmetička sredina standardiziranog obilježja je uvijek jednakanuli: Z = 0 ,b) standardna devijacija standardiziranog obilježja je jednakajedinici: = 1.σ zOva svojstva omogućuju usporedbu relativnih položaja elemenatanumeričkih nizova.Ruski matematičar P. L. Čebišev (1821.-1894.) utvrdio je teorem kojidefinira najmanju proporciju vrijednosti numeričke varijable koja pripadaodređenom intervalu oko aritmetičke sredine.Teorem Čebiševa: Najmanja proporcija vrijednosti numeričke2varijable koje pripadaju intervalu ( X ± kσ) , gdje je > 1, iznosi: 1− (1 k).Prema ovom Teoremu vrijedi da se:k [ ]• u intervalu ( X ± σ ) nalazi najmanje 68% svih vrijednostinumeričke varijable• u intervalu ( X ± 2σ) nalazi najmanje 95% svih vrijednostinumeričke varijable• u intervalu ( X ± 3σ) nalazi najmanje 99,7% svih vrijednostinumeričke varijableAko se definira jedna savršeno simetrična distribucija zvonastog oblika oviodnosi aritmetičke sredine i standardne devijacije se mogu prika<strong>za</strong>ti kao na slici5.2..33


Slika 5.2.f iX-3σ X-2σ X-σX+σX+2σ X+3σ68%95%99.7%x iKoeficijent varijacije spada u potpune relativne mjere raspršenosti,jer obuhvaća sve elemente odabranog numeričkog statističkog ni<strong>za</strong>, a izražavase u postotcima (%).Koeficijent varijacije je postotak standardne devijacije odaritmetičke sredine.σV = ⋅100 X(5.10)Vrijednost koeficijenta varijacije se kreće u intervalu 0 ≤ 0 < +∞ .Vrijednost od 0% će poprimiti samo u slučaju kada su sve vrijednostinumeričkog obilježja u jednom nizu jednake, odnosno kada nema disperzije.Veća vrijednost ovog poka<strong>za</strong>telja upućuje na veću disperziju elemenatapromatranog ni<strong>za</strong>.Ovaj poka<strong>za</strong>telj raspršenosti je izražen u postotcima, pa omogućujeusporedbu disperzije numeričkih nizova s različitim jedinicama mjere.6. MOMENTI NUMERIČKIH NIZOVAMomenti numeričkih nizova mogu biti glavni i pomoćni.6.1. Glavni momenti numeričkih nizovaGlavni ili centralni momenti numeričkih nizova su momenti okoaritmetičke sredine:34


Nr( x − X )∑1= = iiµ r, r = 0,1,2,... - <strong>za</strong> negrupirani niz. (6.1)Nk( x − X )∑ f i ii=1µ r =, r = 0,1,2,... - <strong>za</strong> grupirani niz. (6.2)k∑ fii=1rCentralni moment nultog reda: µ 0 = 1.Centralni moment prvog reda: µ 1 = 0 .Centralni momenti oko aritmetičke sredine se mogu izraziti prekopomoćnih momenata.Centralni moment drugog reda:µ22 = m2− m1. (6.3)Centralni moment trećeg reda:µ3 = m 3 − m1m2+ 23 m31Centralni moment četvrtog reda:µ24 = m4− m3m1+ 6m2m1− 34 m. (6.4)4. (6.5)16.2. Pomoćni momenti numeričkih nizovaPomoćni momenti numeričkih nizova su momenti oko nule:Nr∑ x1= = iimr , r = 0,1,2,...- <strong>za</strong> negrupirani niz. (6.6)Nk∑ f i xii=1mr = , r = 0,1,2,...- <strong>za</strong> grupirani niz. (6.7)k∑ fii=1rPomoćni moment nultog reda: m 0 = 1.Pomoćni moment prvog reda: m = X1 .35


7. MJERE ASIMETRIJE I MJERA ZAOBLJENOSTI7.1. Mjere asimetrijeAsimetrija distribucije podrazumijeva nagnutost distribucije na lijevu ilidesnu stranu.7.1.1. Pearsonov koeficijent asimetrijegdje je:Pearsonov koeficijent asimetrije je:µ 3α 3 = , (7.1)3σµ 3 - centralni moment trećeg reda,3σ - standardna devijacija na treću potenciju.Interval u kojem se kreće vrijednost ovog koeficijenta:−2 ≤ α 3 ≤ 2 . (7.2)U slučaju izrazito asimetričnih distribucija ovaj koeficijent može− 2,2 .poprimiti i vrijednosti izvan intervala: [ ]Ako je:α 3 = 0 ⇒ simetrična distribucija,0 < α 3 ≤ 2 ⇒ pozitivna ili desnostrana asimetrija,−2 ≤ α 3 < 0 ⇒ negativna ili ljevostrana asimetrija.7.1.2. Pearsonova mjera asimetrijePearsonova mjera asimetrije je:S k( X − Mo)= , (7.3)σ36


gdje je:XMoσ- aritmetička sredina,- mod,- standardna devijacija.Za umjereno asimetrične distribucije vrijedi da je Pearsonova mjeraasimetrije:gdje je:XMeσAko je:S k3⋅(X − Me)= , (7.4)σ- aritmetička sredina,- medijan,- standardna devijacija.S kS kS k= 0> 0< 0⇒⇒⇒simetrična distribucija,pozitivna ili desnostrana asimetrija,negativna ili ljevostrana asimetrija.Odnosi među srednjim vrijednostima kod različitih distribucija:a) simetrična distribucija ima jednake aritmetičku sredinu, medijan imod:X = Me = Mo . (7.5)b) pozitivno ili desnostrano asimetrična distribucija imaaritmetičku sredinu veću od medijana, koji je veći od moda.X > Me > Mo . (7.6)c) negativno ili ljevostrano asimetrična distribucija ima aritmetičkusredinu manju od medijana, koji je manji od moda.X < Me < Mo . (7.7)7.1.3. Bowleyeva mjera asimetrijeBowleyeva mjera asimetrije <strong>za</strong>snovana je na odnosu medijana ikvartila:37


gdje je:MeQ 1Q 3Ako je:S kqQ3 + Q1− 2Me= , (7.8)Q − Q- medijan,3- donji kvartil,- gornji kvartil.S = 0 ⇒ ( Q + Q1)2Me⇒kq13 =( Q −Me= ( Me − ) ⇒simetrična distribucija,3 ) Q1S > 0 ⇒ ( Q + Q1)2Me⇒k3 >( Q −Me> ( Me − ) ⇒pozitivna ili desnostrana asimetrija,3 ) Q1S < 0 ⇒ ( Q + Q1)2Me⇒k3 3 ⇒ šiljatiji vrh od normalno <strong>za</strong>obljene distribucije,1,8< α 4 < 3 ⇒ tupi oblik distribucije,α 4 = 1,8 ⇒ pravokutni oblik distribucije,α 4 < 1,8 ⇒ U - distribucija.38

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!