Statistiek Deel 1 Beschrijvende statistiek - Studiant

Samenvatting statistiek Academiejaar 2006-2007 

Statistiek 

4 examenvragen: 

- tabel aanvullen met spreidings- en centrummaten 

- poisson- en binomiale verdeling 

Deel 1 Beschrijvende statistiek 

1 Soorten variabelen 

Kwalitatief: geen getallen 

- ordinaal: ordening (rangschikbaar) 

- nominaal: geen ordening 

Kwantitatief: getallen 

- discreet: in stapjes 

- continu: kommagetallen 

- ratio: natuurlijk nulpunt 

- interval: geen natuurlijk nulpunt 

2 Grafieken 

(relatieve) frequenties: histogram 

cumulatieve (relatieve) frequenties: cumulatief frequentiepolygoon of ogief 

! Bliksemschichtje bij assen die niet vanaf 0 beginnen. 

2.1 Kwantitatief discrete variabele 

- histogram of staafdiagram: staafjes raken elkaar niet 

- ogief: snijden op x-as, midden van de klasse, verbinding met punten in lijnen 

2.2 Kwantitatief continu ratio variabele 

- ogief: punt op rechterklassegrens 

- stengel-bladdiagram 

2.3 Kwalitatief nominale variabele 

- strookdiagram in relatieve frequentie in percentage 

- cirkel- taart- of schijfdiagram in relatieve frequentie in percentage 

Jolien De Veirman 1/10


3 Centrummaten voor discrete gegroepeerde gegevens 

3.1 Rekenkundig gemiddelde 

3.1.1 Ongewogen gemiddelde 

Som van Xi waarden (soms . Fi), delen door n (of door de som van Fi) 

3.1.2 Gewogen gemiddelde 

Som van Xi . Wi gedeeld door de som van Wi waarbij W= wegingsfactor 

3.2 Mediaan 

Middelste waarneming of rekenkundig gemiddelde van de 2 middelste waarnemingen 

3.2.1 Mediaan bij continue gegroepeerde gegevens 

Linkerklassegrens + aantal waarnemingen kleiner dan de mediaan . klassenbreedte 

aantal waarnemingen kleiner dan de mediaan 

+ aantal waarnemingen groter dan de mediaan 

Opmerking: Indien n = even mediaan tussen 2 getallen links en rechts meetellen voor 

het aantal waarnemingen 

Indien n = oneven mediaan is 1 getal mediaan niet meetellen 

3.3 Modus 

Meest voorkomende waarneming. 2 modussen “bestaan niet”. 

3.4 Kwartielen 

Q1: 25% crf, helft van MED 

Q3: 75% crf, heft van MED 



4 Spreidingsmaten 

4.1 Variatiebreedte 

Grootste – kleinste waarneming 

Rechtergrens grootste klasse – linkergrens kleinste klasse 

4.2 Interkwartielafstand (IQR) 

Q3 – Q1 

4.3 Gemiddelde afwijking (gemiddelde absolute fout) 

Absolute som van Xi – rekenkundig gemiddelde, gedeeld door n 

1 n 

∑ x x fi 

i i 

. 

1 

n = 

− 

4.4 Standaardafwijking 

Vergelijking met het gemiddelde in hoeverre deze van het gemiddelde afwijkt 

σ = 

1 

n 

2 

( x − x) fi 

n 

∑ i = i 

. 

1 

[ x −σ 

, x + σ ] = 70% waarne min gen 

Opm: 

[ x − 2σ 

, x + 2σ 

] = 95% waarne min gen 

4.5 Variantie 

Standaardafwijking zonder vierkantswortel 

4.6 Variatiecoëfficiënt 

Spreidingsvergelijking met een verschillend gemiddelde 

σ 

x 

4.7 Boxplot 

Xmin, Xmax, MED, Q1, Q3, onderaan as 



5 Verband tussen kwalitatieve ordinale verbanden 

5.1 Spearman rangcorrelatie coëfficiënt 

r 

s 

6 

= 1 − 

n 

n 

∑ i = 1 

3 

d 

− n 

2 

i 

Di = rang 1 - rang 2 

- 1 - 0,7 - 0,3 0 0,3 0,7 1 

- 1 tot – 0,7 perfect omgekeerd verband 

1 tot 0,7 perfect verband 

- 0,3 tot 0,3 geen verband 

Bij exaeco voor rangschikken van kwalitatieve nominale gegevens: 

Neem de gemiddelde waarde van wat er nog overblijft. 

6 Verband tussen kwantitatieve variabelen 

6.1 Rangcorrelatie coëfficiënt 

r = 

∑ 

n 

i= 

1 

n 

( x − )( − ) 

i= 

i 

x . yi 

y 

1 

2 n 

( x − x) . ( y − y) 

∑ 

i 

∑ 

i= 

1 

i 

2 

X: gegevens kolom 1 

Y: gegevens kolom 2 

Uitkomst: zie as hierboven 

Weergave: puntenwolk of Scatterdiagram 



6.2 Puntenwolk 



6.3 Regressielijn 

Rechte die het beste door de puntenwolk gaat 

m = 

n 

∑i= 

1 

∑ 

q = y − mx 

y = mx + q 

( xi 

− x)( . yi 

− y) 

n 

2 

( x − x) 

i= 

1 

i 

6.3.1 Voorspelling op basis van de regressielijn 

Het missende cijfer (x) ingeven in de formule y = mx + q 

6.4 Seizoenspatroon 

Formule van de regressierechte + gemiddelde vd som vd positieve(Yi – Ykansberekening) 

Ykansberekening = voor iedere x-waarde, regressierechte opnieuw berekenen. 

7 Verband tussen nominale variabelen of tussen nominale en 

ordinale variabelen 

Bvb verband opleidingsniveau en supermarkt 

7.1 Verwachte frequenties Eij 

(kolomtotaal . rijtotaal) / volledig totaal 

7.2 Chi-kwadraat test 

χ 

² 

obs 

( f e ) 

= ∑ − ij 

e 

ij 

ij 

² 

Waarbij Fij = waargenomen (gegeven) frequenties 

7.3 Vrijheidsgraad of degree of freedom (df) 

(aantal kolommen – 1) . (aantal rijen -1) 

7.4 Kritieke waarden 

² 

χ 

krit 

In gegeven tabel bij 5% rechteroverschrijdingskans kijken, per berekende vrijheidsgraad. 

Kritieke waarden kleiner dan chi obs verband met 5% foutkans 



Deel 2: Kansberekening 

1 Regel van Laplace 

Kans (P) = aantal gunstige uitkomsten 

aantal mogelijke uitkomsten 

1.1 Complementaire gebeurtenissen 

P (niet A) = 1 – P(A) 

1.2 Productregel 

Als A en B onafhankelijke gebeurtenissen zijn, dan is P(A en B) = P(A).P(B) 

Vb. Kans om lotto te winnen (6 juiste kruisjes uit 42) 

6/42 . 5/41 . 4/40 . 3/39 . 2/38 . 1/37 = 0,00000019 (1 / 5245786) 

Vb. Kans dat persoon 30 jaar lang wekelijks lotto speelt ooit zou winnen? 

52 . 30 deelnames = 1560 deelnames 

1. Kans om bij 1 deelname te winnen: 1 / 5245786 

2. Kans om bij 1 deelname niet te winnen: 1 – (1 / 5245786) = 5245785 / 5245786 

3. Kans om bij 1560 deelnames niet te winnen: (5245785 / 5245786) 1560 

4. Kans om ooit te winnen bij 1560 deelnames: 1 – (5245785 / 5245786) 1560 

2 Discrete kansverdelingen 

De kansverdeling van een discrete variabele x is een tabel die voor elke mogelijke waarde k 

van X aangeeft wat de kans is dat X precies gelijk is aan k. 

k 0 

P (X=k) x/n 

2.1 Verwachtingswaarde 

µ = E 

n 

[ X ] = ∑ = 

k. 

P( X = k) 

k 

0 

Vb. Hoeveel keer kruis gooi je gemiddeld met 2 munten? 

µ = E[ X ]= 0 . 1/4 + 1 . 2/4 + 2 . 1/4 = 1 



2.2 Standaardafwijking 

( k − µ) 2 ).P 

( X ) 

σ = ∑ = k 

Hoe groter, hoe gevaarlijker de kans. 

2.3 Binomiale verdeling 

X is het aantal successen van een veranderlijke x, bij het n keer herhalen van een experiment 

met een vaste kans p op een succes bij elk experiment 

Als X ~ Bin (n, p) 

dan 

P( 

X 

n! 

k!( 

n − k)! 

2.4 Poisson verdeling 

k n−k 

= k) 

= p (1 − p) 

Telt het aantal keer iets gebeurt (per tijdseenheid) als je weet dat het gemiddeld aantal keer 

(per tijdseenheid) gelijk is aan µ . 

Als X ~Pois ( µ ) 

dan P( 

X 

= k) 

= 

e 

k! 

k µ 

µ − 

3 Continue kansverdelingen 

3.1 Normale verdeling (heeft veel invloeden) 

De normale verdeling met gemiddelde µ en standaardafwijking σ . 

Als X ~ N ( µ ,σ ) 

X − µ 

dan (= Z) ~ N (0,1) 

σ 

P (Z < a): rechtstreeks aflezen in tabel 

P (Z > a): 1 – P (Z < a) 

P (a < Z < b): P (Z < b) – P (Z < a) 



4 Verdelingen benaderen met andere verdelingen 

4.1 Possion ipv Bin als 

Als n ≥ 30 dan Bin (n , p) ≈ P (n . p) 

n . p ≤ 5 

of n (1 – p) ≤ 5 

4.2 Normaal ipv Bin als 

Als n ≥ 30 dan Bin (n,p) ≈ N( n. 

p, 

n. 

p(1 

− p) 

) 

N . p > 5 

En n (1 – 5) > 5 

4.3 Vuistregeltjes 

P ( x ≤ a ) rechtstreeks uit tabel 

P ( x ≥ a ) 1 – P ( x ≤ a ) 

P ( x = a ) P ( x ≤ a ) – P ( x ≤ a -1 ) 

P (a ≤ x ≤ b ) P ( x ≤ b ) – P ( x ≤ a - 1 ) 

5 Kansen over het gemiddelde 

Populatie (N) 

Steekproef (n) 

Gemiddelde µ X 

Standaardafwijking σ s 

5.1 σ bekend 

Als X ~ N ( µ ,σ ) 

dan X ~ N ( µ , 

σ ) 

n 

5.2 σ onbekend (maar wordt geschat door steekproef s) 

Als X ~ N ( µ ,σ ) 

dan X ~ t 

n 

− 1 ( 

s 

X − µ 

) 

n 



6 Betrouwbaarheidsintervallen over het gemiddelde 

6.1 σ bekend 

⎡ 

⎢X 

⎣ 

− 

z 

α 

2 

σ 

; x + 

n 

z 

α 

2 

σ ⎤ 

⎥ 

n ⎦ 

% zekerheid tabel normale verdeling 

90 1,64 

95 1,96 

99 2,57 

6.2 σ onbekend (met steekproefstandaardafwijking s) 

⎡ 

⎢X 

⎣ 

− t 

n 

s 

−1α 

; x + tn 

−1α 

n 

2 

2 

s 

n 

⎤ 

⎥ 

⎦

Statistiek Deel 1 Beschrijvende statistiek - Studiant

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?