12.07.2015 Views

TILASTOTIETEEN PERUSTEET

TILASTOTIETEEN PERUSTEET

TILASTOTIETEEN PERUSTEET

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Lisätehtäviä1. Erään yrityksen satunnaisesti valittujen työntekijöiden poissaolopäivien määrät olivat vuonna 2003:5, 3, 16, 9, 0, 12, 3, 2, 19, 5, 19, 11, 2, 0, 4, 6, 1, 15, 4, 0, 2, 4, 3, 3, 8, 3, 9, 11, 19, 17, 14, 7a) Luokittele havainnot tasavälisesti siten, että luokkavälin pituus on 4. Esitä poissaolopäivienfrekvenssijakauma taulukkona.b) Muodosta jakaumasta sellainen tilastokuvio, jonka perusteella voit arvioida mediaanin. Mikäon mediaaniarvo? Kuvaile myös lyhyesti arviointitapaasi.c) Laske jakauman aritmeettinen keskiarvo, keskihajonta ja variaatiokerroin.2. Sanomalehtipaperin neliömetripainoja tutkittaessa saatiin painon frekvenssijakaumaksi eräässäotoksessa seuraava:paino (g/m 2 ) lukumäärä42.0 – 42.9 443.0 – 43.9 7 a) Määritä painojakauman mediaani44.0 – 44.9 15 ja kvartiiliväli esim. sopivan kuvion45.0 – 45.9 16 avulla.46.0 – 46.9 7 b) Määritä painojakauman keskiarvo47.0 – 47.9 10 ja keskihajonta.48.0 – 48.9 1 c) Kuvaile määrittämiesi tunnuslukujenavulla jakauman muotoa.3. Metsäntutkimuslaitoksen koealalta mitattiin koivujen läpimittaa (rinnankorkeudelta) ja huomattiinsen olevan normaalijakautunut odotusarvolla 20.5 cm ja varianssina 6.25 cm 2 .a) Kuinka monta prosenttia koivuista on läpimitaltaan ainakin 18 cm?b) Määritä rinnankorkeusläpimitan alakvartiili.4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunienlukumäärät eri työvuoroissa:Leikkijunan kuntotoimiva ei-toimivaTyövuoro aamuvuoro 473 30päivävuoro 560 26iltavuoro 327 30Laske sellaisen tilastollisen riippuvuustunnusluvun arvo, jonka perusteella voit päätellä, onkotyövuorolla ja leikkijunan kunnolla yhteyttä. Mitkä ovat johtopäätöksesi?5. Kuluttajavirasto on jälleen joulun alla testannut lelujen turvallisuutta. Tutkimukseen valittiinmyymälöistä sattumanvaraisesti 101 leikkikalua. Testatuista leluista 69 täytti turvallisuusvaatimukset(Lähde: YLEn uutiset, 9.12.2004).Muodosta sellainen 95 %:n luottamusväli, jonka avulla voit arvioida, kuinka monta prosenttiakaikista myytävistä leikkikaluista on turvallisuusvaatimukset täyttäviä.6. Oheisessa taulukossa on esitetty kolmen kulutusmuuttujan tilastollisia tunnuslukuja vuodelta 2000.Havaintoaineiston tilastoyksiköt ovat Euroopan maita (Lähde: Tilastokeskus, Maailma numeroina.)Tulkitse tuloksia ja vastaa seuraaviin kysymyksiin.


StatisticsN = havaintojen määräMean = keskiarvoMedian = mediaaniMode = moodiStd. Deviation = keskihajontaVariance = varianssiSkewness = vinousKurtosis = huipukkuusMinimum = pienin arvoMaximum = suurin arvoPercentiles = fraktiilit255075a. Multiple modes exist. The smallest value is shownViinin kulutusl/henk.Oluen kulutusl/henk.Väkevienkulutusl/henk.27 27 2723,333 67,111 2,28120,000 59,600 1,9007,9 3,5 a 2,415,5075 39,6603 1,4754240,4838 1572,9356 2,1770,482 ,702 1,175-,582 ,237 ,6101,0 3,5 ,556,0 160,0 5,69,700 37,100 1,20020,000 59,600 1,90033,200 95,400 2,800= Moodeja on useita. Niistä esitetään pienin.a) Onko muuttujan Oluen kulutus jakauma normaalijakauma? Perustele vastauksesi.b) Mikä keskiluku sopii nyt kuvaamaan muuttujan Oluen kulutus jakauman keskikohtaa?Perustele vastauksesi.c) Onko muuttujan Viinin kulutus jakauma symmetrinen? Perustele vastauksesi.d) Mikä on muuttujan Väkevien kulutus kvartiilivälin pituus?e) Millä muuttujalla on absoluuttisesti pienin hajonta? Perustele vastauksesi.f) Millä muuttujalla on suhteellisesti suurin hajonta? Perustele vastauksesi.7. Tietyllä alueella suoritettiin kallioperän nikkelipitoisuuden selvitystyötä. Alueelta valittiin 25kivinäytettä, joiden nikkelipitoisuuden keskiarvo oli 10.2 % ja keskihajonta 3.1 %.a) Määritä ko. alueen keskimääräiselle nikkelipitoisuudelle 95 %:n luottamusväli.b) Määritä ko. alueen keskimääräisen nikkelipitoisuuden 99 %:n luottamusväli, kun valittujakivinäytteitä olisi ollutkin 40 kpl (keskiarvo ja keskihajonta pysyvät samoina).8. Winnfear Oy:n johtaja on kiinnostunut siitä, onko uimapukujen myynnillä (y) ja kesäkuun päivienkeskilämpötilalla (x) yhteyttä. Vuosien varrelta on saatu seuraavia tietoja:x 19 23 25 24 26 21y 660 740 720 760 780 720Laske Pearsonin korrelaation arvo.22(Avuksi x 138, x 3208, y 4380, y 3206000, x y 101200) i i ii9. Itikoita inisee juhannuskokon ympärillä. Aikaisempien juhannuskokemusten perusteella tiedät, ettätodennäköisyys sille, että saat tapetuksia yhden itikan on 0.4. Kokon ympärillä inisee 100 itikkaa.Millä todennäköisyydellä saat tapettua niistä ainakin 35? (Voit arvioida sopivalla jakaumalla.)10. Yritys ilmoitti valmistavansa kasvisrasvan markkinaosuudeksi 13.6 %. Kilpailija tutki väitettäpoimimalla eri puolilta maata 12 myymälän otoksen, jossa ko. rasvan keskimääräinen markkinaosuusoli 12.2.% ja markkinaosuuksien keskihajonta 3.6 %. Testaa merkitsevyystasolla 0.05, onkovalmistajan ilmoitus oikea, kun oletetaan, että markkinaosuuden jakauma on normaalijakauma.ii


VastauksiaTehtävä 1.a) Luokkavälin pituus 4, joten luokkia viisi:päivien lkm työntekijälkm0 – 3 124 – 7 78 – 11 512 – 15 316 – 19 5Yhteensä 32b) useita vaihtoehtoja, esim. frekvenssihistogramma, summakäyrä tai runkolehtikuvio ja mediaani n. 5(kuviosta riippuen arvio voi olla hiukan isompikin)c) x = 7.39 ja s = 6.121 ja V = 0.828Tehtävä 2.a) Esim. summakäyrästä katsottuna Md noin 45.2 ja kvartiiliväli noin (44.3, 46.4)b)m i f i m i2f i m i42.45 169.8 7208.0143.45 304.15 13215.317544.45 666.75 29637.037545.45 727.2 33051.2446.45 325.15 15103.217547.45 474.5 22515.02548.45 48.45 2347.40252716 123077.25x = 45.3 ja s = 1.5c) Koska keskiarvo ja mediaani ovat lähes samat, on jakauma melko symmetrinen.Koska kvartiiliväli on melko kapea, on muuttuja-arvojen keskittyminen melko voimakasta.Tehtävä 3.a) P(x > 18) = 1- P(x < 18) = 1- ( 18 20.5 ) = 1- [ 1- 0.8413 ; 84%6.25b) Standardoidun normaalijakauman alakvartiili on -0.67, koska (0.67) 0.75 ja edelleen symmetriantakia (-0.67) 0.25. Kun satunnaismuuttujan x yläkvartiili Q 1 standardoidaan: Q1 20.5 täytyy sen6.25vastata luku -0.67 eli saadaan yhtälöQ1 20.5 = -0.67, josta Q 1 = 18.8256.25


Tehtävä 4.Riippuvuuslukuna voidaan käyttää kontingenssikerrointa.Seuraavassa taulukossa on teoreettiset frekvenssitLeikkijunan kuntotoimiva ei-toimiva YhteensäTyövuoro aamuvuoro 473 30 503päivävuoro 551 35 586iltavuoro 336 21 357Yhteensä 1360 86 14462C 22222473 473 30 30 560 551 26 35 327 336 30 214736.66.6 1446 0.073055135336212 6.6Kontingenssikertoimen arvo niin lähellä lukua 0, että kunnolla ja työvuorolla ei ole yhteyttä.Tehtävä 5.n = 101Otoksessa turvallisia leluja oli P =69 100= 68.3 %; = 0.05, z = 1.961010.02595 %:n luottamusväli turvallisten lelujen prosenttiosuudelle on (59.2 , 77.4)Tehtävä 6.a) ei ole, koska jakauma ei ole symmetrinen, vaan oikealle loiveneva eli positiivisesti vino (vinous > 0.5)b) mediaaniarvo 59.6 (koska jakauma ei ole symmetrinen)c) kohtalaisen symmetrinen, koska vinous välillä (-0.5 , 0.5)d) kvartiilivälin pituus = 2.8 – 1.2 = 1.6e) keskihajonta mittaa absoluuttista hajaantumista, ja pienin keskihajonta on väkevien kulutuksellaf) suhteellista hajaantumista mittaa variaatiokerroin ( keskihajonnan ja keskiarvon suhde) ja suurinvariaatiokerroin (0.665) on viinin kulutuksellaTehtävä 7.Sekä a) – että b) –kohdissa ei tunneta populaatiovarianssia 2 , joten luottamusväli populaationkeskiarvolle määritetään sen esityksen avulla, missä käytetään t-jakaumaa.a) n = 25, x = 10.2 ja s = 3.1; = 0.05, t 0.025 (25-1) = 2.06495 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten(10.2 – 2.064 3.1 , 10.2 + 2.064 3.1 ) = (8.9 , 11.5)2525b) n = 40, x = 10.2 ja s = 3.1; = 0.01, t 0.005 (40-1) t 0.005 (40) = 2.704


99 %:n luottamusväli koko alueen keskimääräiselle nikkelipitoisuudelle on siten(10.2 – 2.704 3.1 , 10.2 + 2.704 3.1 ) = (8.9 , 11.5)4040Tehtävä 8.1384380101200 r 62 138 43803208 3206000 6 62= 0.851Keskilämpötilan ja uimapukujen myynnin välillä on positiivista lineaarista riippuvuutta, ja sehäntarkoittaa, että mitä lämpimämpi kesäkuu on ollut, sitä enemmän on uimapukujakin myyty.Tehtävä 9.x = tapettujen itikoiden lkm, tarkkana jakaumana Bin(100, 0.4)Likimain jakaumana N(40, 24)P(x > 35) = 1- P(x < 35)= 1- ( 35 40 ) 0.8524Tehtävä 10.Yhden otoksen keskiarvotesti, populaatiovarianssi 2 tuntematonn = 12, x = 12.2, s= 3.6Hypoteesit: H 0 : = 13.6H 1 : 13.6 = 0.05, t 0.025 (12-1) =2.201 ja kriittinen alue C ={ t | |t |> 2.201}t =12.2 13.63.6 / 12= -1.34Testisuureen arvo ei ole kriittisellä alueella, joten nollahypoteesi hyväksytään. Valmistajan ilmoitusnäyttää oikealta.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!