Statistiek.
Statistiek.
Statistiek.
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
<strong>Statistiek</strong>.<br />
<strong>Statistiek</strong> is de wetenschap, de methodiek en de techniek van het verzamelen,<br />
bewerken, interpreteren en presenteren van gegevens<br />
R.Spierings <strong>Statistiek</strong> 1
Inleiding<br />
Bij voorraadbeheer is er gesproken over allerlei zaken die niet altijd volgens<br />
vaste patronen verlopen. Bijvoorbeeld de levertijd, wat zijn de consequenties als<br />
de toeleverancier het voorraad artikel te laat levert. Ook kan de afname van een<br />
bepaald artikel ineens gaan stijgen waardoor de voorraad in het magazijn al op is<br />
voordat de nieuwe levering binnen is. Het bedrijfsleven wil de een zo nauwkeurig<br />
mogelijk gegevens kunnen interpreteren en een inschatting maken over de<br />
risico’s die ze lopen. Bij de berekening van de veiligheidsvoorraad wordt<br />
gesproken over een service graag en een veiligheidsfactor. De statistiek<br />
onderbouwd de berekening van de veiligheidsfactor. In het voorgaande hebben<br />
we het over voorraad beheer gehad. Maar bovenstaande vraagstukken zijn ook<br />
van belang bij kwaliteitsbeheersing van producten en klanttevredenheid<br />
onderzoeken. Vaak hoor je termen als “Jan Modaal” en hoe lang is de gemiddelde<br />
Nederlandse man. Dit en nog veel meer zaken heeft te maken met statistische<br />
berekeningen.<br />
Wat is statistiek.<br />
<strong>Statistiek</strong> is een methode en techniek om een hoop “meet”gegevens te<br />
verzamelen om daarna allerlei berekeningen er op los te laten. De berekeningen<br />
geven je dan bepaalde uitkomsten die ook wel kengetallen genoemd worden. Uit<br />
deze kengetallen kun je een aantal conclusies trekken. De statistiek geeft<br />
antwoord op allerlei vragen en het is mogelijk resultaten is geloofwaardig te<br />
presenteren. Helaas is de verkregen informatie altijd onvolledig, immers 100%<br />
alles meten gebeurd over het algemeen niet. Er is sprake van steekproeven of<br />
over metingen over een bepaalde tijdsperiode. De verkregen informatie is bijna<br />
altijd onvolledig en daardoor onnauwkeurig. Een goede beheersing van deze<br />
onnauwkeurigheid is dan ook een belangrijk onderdeel van de statistiek.<br />
Frequentie verdeling.<br />
Aan de hand van een voorbeeld gaan we de statistische berekeningsmethode en<br />
kenmerken nader bekijken. <strong>Statistiek</strong> begint altijd met het verzamelen van<br />
gegeven. Bijvoorbeeld de diameter van een cilinder met een boring van 30,5<br />
millimeter. De fabricage tolerantie in 0,5 mm. Uit de productie wordt een<br />
steekproef opgehaald van 100 cilinders. Die worden allemaal gemeten. De<br />
meetwaarden worden genoteerd (figuur 1).<br />
R.Spierings <strong>Statistiek</strong> 2
Figuur 1<br />
Deze meting zegt ons nog niet zoveel. We kunnen in ieder geval concluderen dat<br />
ze allemaal binnen de tolerantie vallen. Met behulp van Excel gaan we de<br />
gegevens bewerken zodat we onderstaande tabel en grafiek kunnen maken. Zo<br />
krijgen we al wat inzicht in het fabricage proces.<br />
De tabel van figuur 2 is een optellingen van alle metingen (waarnemingen) en<br />
wordt in de statistiek frequentietabel genoemd. Je zie nu gemakkelijk welke<br />
meetwaarden het vaakste voorkomen en welke minder. Ook zie je hun<br />
onderlinge relatie . Onthoud dat een frequentie (symbool:f) het aantal<br />
waarnemingen is in een bepaald gebied. We kunnen van de frequentietabel<br />
vervolgens in een grafiek maken (figuur 3)<br />
Figuur 2<br />
Figuur 3<br />
R.Spierings <strong>Statistiek</strong> 3
Klasse en klassebreedte.<br />
De klassebreedte in bovenstaand voorbeeld is 0,1 mm en we hebben voor 11<br />
klasse gekozen. Stel we meten op 0,01 mm nauwkeurig en we voeren 500<br />
metingen uit. Wanneer je de klasse breedte op 0,01 zou instellen betekend dat<br />
de frequentie tabel 10 keer breder zou worden. Het gevolg hiervan is dat de<br />
frequentiegrafiek te “vlak” wordt waardoor de statistische berekeningen<br />
onnauwkeurig worden. Ook wanneer je te weinig klasse hebt dan wordt de<br />
frequentie verdeling te “spits” . Een goede tussenoplossing om het aantal klassen<br />
de kiezen is de √ (wortel) van de waarnemingen. Met de uitkomst wordt een<br />
gunstige klassebreedte beredeneerd. We hebben in dit voorbeeld 500 metingen.<br />
De √500 is ca 22. Wanneer we voor 20 klasse kiezen wordt de klasse breedte<br />
0,05mm. Dit is een goed alternatief<br />
(1) Te weinig klassen (2)Te veel klassen (3)Juiste aantal klassen<br />
De gevonden klassebreedte die een juist beeld geven zoals hierboven grafiek (3)<br />
noemen we een “normaalverdeling” alle verdere statistische berekeningen zijn op<br />
deze verdeling van toepassing (ze zijn waar).<br />
R.Spierings <strong>Statistiek</strong> 4
Het gemiddelde van een aantal meting<br />
is het rekenkundig gemiddelde en<br />
aangeduid met het symbool µ. In dit<br />
voorbeeld: µ = 30,5.<br />
De mediaan (Me) is de middelste<br />
waarde. Dus Me = 30,5.<br />
Modus of modale klasse is de klasse<br />
met de meeste waarnemingen. In dit<br />
voorbeeld dus ook 30,5.<br />
Wanneer het gemiddelde samenvalt<br />
met mediaan en modus spreken we<br />
over een “normaalverdeling”<br />
Gemiddelde, mediaan en modus.<br />
Figuur 5<br />
Figuur 4<br />
In bovenstaand voorbeeld (figuur 5) vallen het gemiddelde, modus en mediaan niet samen.<br />
Het beeld wat de grafiek geeft is ongunstig. Immers het “proces” is niet op 6 ingesteld.<br />
R.Spierings <strong>Statistiek</strong> 5
Spreiding en standaardafwijking.<br />
Nog een belangrijk onderdeel van een frequentie verdeling is de mate waarin de<br />
waarnemingen uit elkaar liggen. Dit noemen we de spreiding. Het gemiddelde<br />
van de getallen 22.24 en 26 is 24. Het gemiddelde van de getallen 12,24 en 36<br />
is ook 24 maar de spreiding is veel groter. Door de spreiding te benoemen wordt<br />
samen met het gemiddelde, mediaan en modus een (statistisch)beeld gegeven<br />
van de gegevens die verzameld zijn. De spreiding zegt over het algemeen iets<br />
over de kwaliteit van een proces. Hoe nauwkeuriger een proces hoe kleiner de<br />
spreiding. De spreiding wordt benoemd door R= Xmax-Xmin.<br />
Naast de spreiding kennen wij ook nog de standaardafwijking. De<br />
standaardafwijking of standaarddeviatie, een begrip in de statistiek, is een maat<br />
voor de spreiding. De standaardafwijking wordt berekend door de wortel te<br />
nemen van de variantie. De variantie (ongeveer) het gemiddelde van de<br />
kwadraten van de afwijking van de waarnemingen ten opzichte van het<br />
gemiddelde. Klink moeilijk maar gelukkig kunnen we met Excel een en ander<br />
doorrekenen. De standaardafwijking is interessant wanneer je naar onderstaande<br />
grafiek bekijkt. Wanneer de grafiek het beeld geeft zoals figuur 6 noemen wij dat<br />
een normaalverdeling. Wanneer de standaardafwijking 1 is betekend dat binnen<br />
de grens van 1 68,2% van de metingen valt. Is de standaardafwijking 2 dan<br />
vallen binnen die grenzen 95,4% van de metingen. Buiten 3 keer de standaard<br />
afwijking zie je dat het nog maar 0,2% is. Metingen die in dit gebied vallen<br />
worden vaak dan ook niet betrokken bij nemen van besluiten (overmacht).<br />
Figuur 6<br />
De formule om de standaardafwijking is:<br />
R.Spierings <strong>Statistiek</strong> 6
Weer een moeilijke formule, maar gelukkig Excel help zie onderstaand.<br />
R.Spierings <strong>Statistiek</strong> 7
Eigenschappen van de normale verdeling.<br />
Een normale verdeling is symmetrisch (zie figuur 6). Het gemiddelde, modes en<br />
mediaan liggen precies in het midden. Alle waarnemingen liggen tussen 6 (3 x<br />
links 3 en 3 x rechts) keer de standaardafwijking (99,8%). Met deze gegevens<br />
we op eenvoudige wijze de oppervlakte van een deel onder de normale verdeling<br />
uitreken. Dit is van toepassing wanneer bijvoorbeeld bepaald moet worden<br />
hoeveel waarnemingen er in een bepaald gebied voorkomen. Bestudeer eerst<br />
onderstaande tabel. Tussen u= 0,00 en u=2.95 zit een verschil van A = 0,498.<br />
Dit komt overeen met 49,8% van de waarnemingen. Hiermee wordt het<br />
oppervlak van het deel onder de normale verdeling links of rechts van het<br />
gemiddelde bedoeld.<br />
R.Spierings <strong>Statistiek</strong> 8
R.Spierings <strong>Statistiek</strong> 9
R.Spierings <strong>Statistiek</strong> 10
Ten slotte.<br />
We hebben statistisch het gemiddelde, de mediaan, de modus, de spreiding en<br />
de standaardafwijking nader beschouwd. We kunnen (technische) processen in<br />
beeld brengen en daar uitspaken over doen.<br />
Voorbeelden uit de voorraad beheer zijn:<br />
Hoe groot wordt mijn veiligheidsvoorraad bij een artikel waarvan de<br />
toeleverancier een bepaalde spreiding in de levertijd heeft.<br />
Hoe groot wordt de veiligheidsvoorraad wanneer de afname van de artikelen<br />
uit de voorraad nog al eens verschild.<br />
Voorbeelden uit een productie proces:<br />
Op welke nominale maten kan ik de verspaningsmachines instellen zodat de<br />
standtijd van het gereedschap optimaal is.<br />
Hoeveel afkeur maakt mijn productie proces.<br />
Dit zijn maar een paar voorbeelden uit de techniek.<br />
R.Spierings <strong>Statistiek</strong> 11