Statistika, vÄdecký výzkum, mÄÅenà v pedagogickém ... - Lide na UHK
Statistika, vÄdecký výzkum, mÄÅenà v pedagogickém ... - Lide na UHK
Statistika, vÄdecký výzkum, mÄÅenà v pedagogickém ... - Lide na UHK
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
1. STATISTIKA<br />
z latin. „Status“ (stav nebo stát)<br />
1562 Benátky<br />
17. stol. Německo<br />
Anglie 16.-17. st. tzv. „politická aritmetika“<br />
Ideální typ člověka - Adolphe QUETÉLET<br />
18. a 19. st. – pozorování a popis zákonitostí<br />
pozorovaných <strong>na</strong> tzv. hromadných jevech<br />
(bratři Bernoulliové, Langrange, Euler, de Moivre,<br />
Gauss, Laplacce, Bayes,…)<br />
až do poč. 20. st. tzv. vyčerpávající šetření<br />
20. a 30. léta 20. st. metody náhodného výběru a<br />
dílčích šetření<br />
rozvoj statistiky s rozvojem výpočetní techniky<br />
(Fischer, Yule, Pearson, Neyman,…)
<strong>Statistika</strong> v současnosti<br />
1. Vědní obor<br />
• deskriptivní<br />
• induktivní<br />
2. Metoda sběru, zpracování a<br />
vyhodnocování dat<br />
3. Informace
Předmětem zkoumání<br />
statistiky ve<br />
společenských vědách je
člověk
2. Vědecký výzkum v<br />
pedagogice<br />
vytvoření příslušné teorie<br />
prvky teorie vznikají <strong>na</strong> základě výzkumu<br />
různé pojetí výzkumu<br />
Gavora – „.... veškeré systematicky<br />
prováděné aktivity vedoucí ke získávání<br />
nových poz<strong>na</strong>tků ...“
Kerlinger (1972):<br />
„Vědecký výzkum je systematické,<br />
kontrolované, empirické a<br />
kritické zkoumání hypotetických<br />
výroků o předpokládaných<br />
vztazích mezi přirozenými jevy.“
Základní metody poznávání<br />
(Charles Pierce)<br />
Metoda tradice<br />
Metoda autority<br />
Metoda a priori<br />
Metoda vědy
Výzkumy<br />
Kvantitativní<br />
Kvalitativní<br />
Ex-post-facto<br />
Experimenty
Pedagogický výzkum a<br />
jeho fáze<br />
• Nápad, idea - stanovení<br />
problému<br />
• Formulace hypotéz<br />
• (Sběr dat)<br />
• Testování hypotéz<br />
• Závěry a jejich prezentace
2.1 Stanovení problému<br />
formulace problému<br />
• cíl šetření<br />
• výzkumná otázka –ústřední hypotéza<br />
vyjádřit cíle ve „zvládnutelné“ podobě<br />
• konkrétní<br />
• jednoz<strong>na</strong>čné<br />
• empiricky ověřitelné<br />
studium odborných pramenů<br />
formulace operacio<strong>na</strong>lizovaných definic,<br />
proměnných
2.2 Formulace hypotézy<br />
pokusné<br />
předběžné<br />
prozatímní odpovědi <strong>na</strong><br />
položené otázky (problémy)
Pravidla stanovení<br />
hypotézy (Gavora)<br />
H je tvrzení, v oz<strong>na</strong>movací větě<br />
(Výzkumný problém je <strong>na</strong>opak lepší<br />
vyjádřit tázací větou)<br />
H musí vyjadřuje vztah mezi dvěma<br />
proměnnými – vždy je to o rozdílech,<br />
vztazích nebo následcích<br />
H musí být možno empiricky ověřitelné,<br />
proměnné musí být měřitelné
H jsou vlastně predikcí o vztazích mezi<br />
proměnnými<br />
Málokdy je to důsledek jediného faktoru<br />
Chyby při formulacích H<br />
• Nesprávná, neurčitá formulace<br />
• Složité souvětí<br />
• Věcná hypotéza X statistická hypotéza
Proměnné - xi<br />
je to jev nebo vlastnost<br />
ve výzkumu se mění – věk, klasifikace, .<br />
dělíme je <strong>na</strong>:<br />
• Nezávisle proměnné = jev, vlastnost, která<br />
je příčinou nebo podmínkou vzniku jiné<br />
vlastnosti, jevu<br />
• Závisle p. = je vlastnost, jev, která je<br />
výsledkem působení nezávislé proměnné
2.3 Testování / verifikace<br />
hypotézy<br />
Prokazujeme pravdivost nebo nepravdivost<br />
hypotézy<br />
Rozhodujeme <strong>na</strong> základě:<br />
• třídění<br />
• zpracování<br />
• vyhodnocení shromážděných dat<br />
Data shromažďujeme od ……respondentů
Výzkumný vzorek<br />
základní soubor – populace<br />
výběrový soubor – výběr<br />
výběr prvků do výzkumných souborů<br />
volba jedinců – situací, jejich počtu,.. =<br />
výběr prvků do výzkumného souboru
Druhy výběrů<br />
Prostý náhodný výběr (náhodná čísla)<br />
• Výběr s vracením<br />
• Výběr bez vracení<br />
Skupinový výběr<br />
Stratifikovaný výběr<br />
Kontrolovaný výběr<br />
Vícenásobný výběr<br />
Záměrný výběr<br />
Mechanický výběr<br />
Spárované výběry
Rozsah (velikost) výběru<br />
Čím větší soubor pořídíme, tím více se<br />
blížíme skutečným vlastnostem<br />
základního souboru<br />
Odhady rozsahu výběru<br />
• u metrických dat : n = ( t²α . s²) / ²<br />
• u nominálních či ordinálních dat:<br />
n = [ t²α . p . (1 – p) ] / d²
3. Měření v<br />
pedagogickém výzkumu<br />
„Měření v nejširším slova smyslu je<br />
přiřazování čísel předmětům nebo<br />
jevům podle pravidel“<br />
(Stevens, 1951, s. 51)
3 postuláty<br />
Jestliže (a = b) (a ≠ b) ne však oboje<br />
Jestliže (a = b) (b = c) (a = c)<br />
Jestliže (a > b) (b > c) (a > c)<br />
Platí tyto postuláty při sledovaní jevů<br />
<strong>na</strong>př. u lidí?!
Úrovně měření<br />
Nominální (tj. oz<strong>na</strong>čkování)<br />
Ordinální (pořadové)<br />
Metrické<br />
•Intervalové<br />
•Poměrové
Vlastnosti dobrého<br />
měření:<br />
Validita<br />
Reliabilita<br />
Praktičnost – jednoduchost,<br />
hospodárnost, ....
2.4 Vyvozování závěrů a<br />
jejich prezentace<br />
Interpretujeme dosažené výsledky<br />
Srovnáváme je s jinými<br />
Zdůvodňujeme rozdíly<br />
Dedukujeme další podmíněné výroky<br />
Přijímáme nebo odmítáme H<br />
Vyslovujeme závěry výzkumu
4. Metody sběru dat<br />
Experiment<br />
Dotazovací techniky<br />
• Dotazník<br />
• Anketa<br />
• Interview<br />
• Focus group,..<br />
Pozorování<br />
Studium dokumentů<br />
Sociometrie
5. Metody uspořádání a<br />
zpracování dat<br />
Tzv. popisná statistika
5.1 Uspořádání a<br />
sestavování tabulek<br />
Čárkovací metoda<br />
Interval - jeho hloubka a střed<br />
Zásady tvorby tabulek<br />
Četnost – absolutní, relativní,<br />
kumulativní<br />
Využití MS Excell – s přenosem dat do<br />
NCSS, SPSS, ….
Četnostní tabulky<br />
Př. Bylo sledováno 92 rodin a zkoumal se počet<br />
členů domácnosti<br />
Základní pojmy<br />
Z<strong>na</strong>k – xi<br />
Četnost – ni<br />
Relativní četnost – ni/n<br />
Kumulativní četnost n1, n1+n2,….<br />
Kumulativní relativní četnost p1, p1+p2, …
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
kumul.<br />
četnost<br />
kumul. rel.<br />
četnost
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
1<br />
2<br />
3<br />
4<br />
5<br />
6<br />
7<br />
8<br />
9<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
1 10<br />
2 15<br />
3 23<br />
4 28<br />
5 9<br />
6 4<br />
7 2<br />
8 0<br />
9 1<br />
92<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
1 10 0,109<br />
2 15 0,163<br />
3 23<br />
4 28<br />
5 9<br />
6 4<br />
7 2<br />
8 0<br />
9 1<br />
92<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
1 10 0,109<br />
2 15 0,163<br />
3 23 0,250<br />
4 28 0,304<br />
5 9 0,098<br />
6 4 0,043<br />
7 2 0,022<br />
8 0 0,000<br />
9 1 0,011<br />
92 1,000<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …<br />
1 10 0,109 10<br />
2 15 0,163 25<br />
3 23 0,250<br />
4 28 0,304<br />
5 9 0,098<br />
6 4 0,043<br />
7 2 0,022<br />
8 0 0,000<br />
9 1 0,011<br />
92 1,000
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …<br />
1 10 0,109 10<br />
2 15 0,163 25<br />
3 23 0,250 48<br />
4 28 0,304 76<br />
5 9 0,098 85<br />
6 4 0,043 89<br />
7 2 0,022 91<br />
8 0 0,000 91<br />
9 1 0,011 92<br />
92 1,000
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …<br />
1 10 0,109 10 0,109<br />
2 15 0,163 25 0,272<br />
3 23 0,250 48<br />
4 28 0,304 76<br />
5 9 0,098 85<br />
6 4 0,043 89<br />
7 2 0,022 91<br />
8 0 0,000 91<br />
9 1 0,011 92<br />
92 1,000
počet členů<br />
domácnosti<br />
absolutní<br />
četnost<br />
relativní<br />
četnost<br />
xi ni ni/n<br />
kumul.<br />
četnost<br />
n1,<br />
n1+n2,…<br />
kumul. rel.<br />
četnost<br />
p1,<br />
p1+p2, …<br />
1 10 0,109 10 0,109<br />
2 15 0,163 25 0,272<br />
3 23 0,250 48 0,522<br />
4 28 0,304 76 0,826<br />
5 9 0,098 85 0,924<br />
6 4 0,043 89 0,967<br />
7 2 0,022 91 0,989<br />
8 0 0,000 91 0,989<br />
9 1 0,011 92 1,000<br />
92 1,000
Intervalové rozdělení<br />
četností<br />
Obor všech možných hodnot<br />
sledovaného z<strong>na</strong>ku rozdělíme do<br />
vzájemně se vylučujících intervalů – tříd<br />
Čím větší rozsah sledovaného souboru<br />
– tím větší počet intervalů (max. 15 –<br />
pro přehlednost)
Výpočet intervalu<br />
Diskrétní náhodná veliči<strong>na</strong> h = 0,08 × R<br />
R<br />
24<br />
<br />
h<br />
<br />
R<br />
12<br />
h – hloubka (šířka) intervalu<br />
R – variační šíře (max. – min.)<br />
Spojitá náhodná veliči<strong>na</strong> k = 1 + 3,3 log(n)<br />
k – počet dílčích intervalů<br />
n – počet různých hodnot z<strong>na</strong>ku
Příklad intervalového<br />
rozdělení četností<br />
Na ZŠ se měřila výška žáků v cm: 144, 149, 145,<br />
142, 146, 147, 141, 150, 143, 146, 150, 141,<br />
148, 148, 144, 141, 145, 148, 144, 143, 155,<br />
133, 158, 154, 151, 140, 136, 137, 153, 139,<br />
138.<br />
R = 158 – 133 = 25<br />
h = 0,08 * 25 = 2<br />
25<br />
25<br />
<br />
1,04<br />
h<br />
<br />
<br />
2,08<br />
24<br />
12
5.2 Grafické metody<br />
zobrazování dat<br />
100<br />
Histogramy četností<br />
(sloupcový graf)<br />
80<br />
60<br />
40<br />
20<br />
Východ<br />
Západ<br />
Sever<br />
Polygony četností<br />
(spojnicový graf)<br />
90<br />
80<br />
70<br />
60<br />
0<br />
1.<br />
čtvrt.<br />
3.<br />
čtvrt.<br />
Výsečové grafy<br />
50<br />
40<br />
30<br />
20<br />
Sever<br />
Východ<br />
Západ<br />
Sever<br />
Kartografy<br />
10<br />
0<br />
1. čtvrt.<br />
2. čtvrt.<br />
3. čtvrt.<br />
Západ<br />
Východ<br />
4. čtvrt.<br />
1. čtvrt.<br />
2. čtvrt.<br />
3. čtvrt.<br />
4. čtvrt.
Count<br />
Histogram<br />
Sloupcový graf<br />
Osa x – jednotlivé <strong>na</strong>měřené hodnoty<br />
Osa y – četnosti hodnot (absolutní či<br />
relativní)<br />
Histogram of CS_SUPKT<br />
140,0<br />
105,0<br />
70,0<br />
35,0<br />
0,0<br />
15,0 23,8 32,5 41,3 50,0<br />
CS_SUPKT
absolutní četnost<br />
Polygon<br />
Četnosti spojujeme úsečkami ve středu<br />
jednotlivých intervalů<br />
Polygon četností<br />
30<br />
25<br />
20<br />
15<br />
10<br />
5<br />
0<br />
1 2 3 4 5 6 7 8 9<br />
počet členů domácnosti
Stromový graf
Stromový graf - příklad<br />
Máme k dispozici výkony v určité sportovní disciplíně:<br />
784, 810, 806, 811, 815, 796, 811, 796, 819, 802,<br />
807, 803, 820, 815.<br />
78<br />
79<br />
80<br />
81<br />
82<br />
4<br />
66<br />
2367<br />
011559<br />
0
Krabicový graf<br />
Kvantil k<br />
• 25% kvantil = dolní kvartil<br />
• 50% kvantil = medián<br />
• 75% kvantil = horní kvartil<br />
• 10% kvantily = decily<br />
• 100% kvantily = percentily
Amount<br />
Krabicový graf<br />
50,00<br />
Box Plot<br />
horní kvartil<br />
41,25<br />
32,50<br />
23,75<br />
15,00<br />
CS_SUPKT<br />
Variables<br />
JZ_SUPKT<br />
dolní kvartil
6. Základní statistické<br />
charakteristiky<br />
(číselný popis dat)<br />
Střední hodnoty – charakteristiky polohy<br />
Míry rozptýlenosti - variability<br />
Míry koncentrace
6.1 Charakteristiky<br />
Modus (Mode)<br />
oz<strong>na</strong>čení<br />
polohy<br />
xˆ<br />
nejčastěji se vyskytující hodnota<br />
(nejčetnější)<br />
může odhalit nehomogenitu výběru<br />
neříká nic o extrémních hodnotách
Medián (Median)<br />
oz<strong>na</strong>čení<br />
x~<br />
prostřední hodnota v řadě hodnot<br />
uspořádaných podle velikosti<br />
používá se jako charakteristika polohy,<br />
chceme-li odstranit vliv extrémních<br />
hodnot
Aritmetický průměr (Mean)<br />
oz<strong>na</strong>čení<br />
x<br />
n<br />
x<br />
x<br />
x<br />
i …x n hodnoty z<strong>na</strong>ku<br />
n počet hodnot<br />
i<br />
<br />
i<br />
1 n<br />
má velký výz<strong>na</strong>m, nelze však přeceňovat<br />
citlivý <strong>na</strong> extrémní hodnoty
Další charakteristiky<br />
polohy<br />
V symetrickém rozdělení se modus,<br />
medián i aritmetický průměr shodují!<br />
Vážený průměr<br />
Useknutý průměr<br />
Harmonický průměr (Harmonic Mean)<br />
Geometrický průměr (Geometric Mean)
6.2 Míry variability<br />
Rozpětí (Range)<br />
oz<strong>na</strong>čení<br />
R<br />
výpočet max. hodnota – min. hodnota<br />
z<strong>na</strong>čně ovlivněno extrémními<br />
hodnotami
Mezikvartilové rozpětí (Interquartile<br />
Range)<br />
výpočet horní kvartil – dolní kvartil<br />
délka obdélníka v krabicovém grafu<br />
není ovlivněno extrémními hodnotami
Amount<br />
Krabicový graf<br />
50,00<br />
Box Plot<br />
horní kvartil<br />
41,25<br />
32,50<br />
23,75<br />
mezikvartilové<br />
rozpětí<br />
15,00<br />
CS_SUPKT<br />
Variables<br />
JZ_SUPKT<br />
dolní kvartil
Střední kvadratická odchylka, rozptyl<br />
doplňuje průměr<br />
rozdělení se stejným průměrem může být<br />
více – liší se rozptylem<br />
s<br />
2<br />
n<br />
<br />
( x x)<br />
2<br />
i<br />
<br />
i<br />
1 n<br />
. ni
Směrodatná odchylka (Standard<br />
Deviation)<br />
s <br />
s<br />
2<br />
spolu s rozptylem nejužívanější<br />
doplnění průměru<br />
kritérium věrohodnosti průměru
Variační koeficient (Coefficient of Variation)<br />
V<br />
s<br />
( c)<br />
100<br />
x<br />
bezrozměrný<br />
pro porovnání variability hodnot měřených v<br />
různých jednotkách<br />
orientačně sig<strong>na</strong>lizuje případnou hrubou<br />
nesourodost dat
Další míry variability<br />
Průměrná odchylka<br />
d<br />
n<br />
<br />
/ xi<br />
x /.<br />
ni<br />
i<br />
1 n<br />
Relativní průměrná<br />
odchylka<br />
rd<br />
x<br />
d<br />
100
6.3 Míry koncentrace<br />
Šikmost (angl. Skewness)<br />
oz<strong>na</strong>čení S m<br />
S m = 0 rozdělení symetrické
S m > 0 zešikmené zprava<br />
(kladné hodnoty šikmosti)<br />
S m < 0 zešikmené zleva<br />
(záporné hodnoty šikmosti)
Špičatost (angl. Kurtosis – někdy<br />
také Exces)<br />
oz<strong>na</strong>čení K m<br />
K m = 0 normované normální rozdělení
K m > 0 špičatost<br />
(větší četnosti<br />
prostředních hodnot)<br />
K m 0 plochost<br />
(přibližně stejně velké<br />
četnosti prostředních<br />
a ostatních hodnot)
Normální rozdělení
Pravděpodobnost<br />
výskytu hodnot<br />
V intervalu od – S do + S (kolem aritm. Ø)<br />
se <strong>na</strong>chází přibližně 2/3 (68,27%) všech<br />
hodnot<br />
V intervalu od – 2S do + 2S (kolem Ø) se<br />
<strong>na</strong>chází přibližně 19/20 (95,4%)<br />
V intervalu od – 3S do + 3S (kolem Ø) se<br />
<strong>na</strong>chází téměř všechny hodnoty (99,73%)