27.09.2013 Views

Statistiek.

Statistiek.

Statistiek.

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong>Statistiek</strong>.<br />

<strong>Statistiek</strong> is de wetenschap, de methodiek en de techniek van het verzamelen,<br />

bewerken, interpreteren en presenteren van gegevens<br />

R.Spierings <strong>Statistiek</strong> 1


Inleiding<br />

Bij voorraadbeheer is er gesproken over allerlei zaken die niet altijd volgens<br />

vaste patronen verlopen. Bijvoorbeeld de levertijd, wat zijn de consequenties als<br />

de toeleverancier het voorraad artikel te laat levert. Ook kan de afname van een<br />

bepaald artikel ineens gaan stijgen waardoor de voorraad in het magazijn al op is<br />

voordat de nieuwe levering binnen is. Het bedrijfsleven wil de een zo nauwkeurig<br />

mogelijk gegevens kunnen interpreteren en een inschatting maken over de<br />

risico’s die ze lopen. Bij de berekening van de veiligheidsvoorraad wordt<br />

gesproken over een service graag en een veiligheidsfactor. De statistiek<br />

onderbouwd de berekening van de veiligheidsfactor. In het voorgaande hebben<br />

we het over voorraad beheer gehad. Maar bovenstaande vraagstukken zijn ook<br />

van belang bij kwaliteitsbeheersing van producten en klanttevredenheid<br />

onderzoeken. Vaak hoor je termen als “Jan Modaal” en hoe lang is de gemiddelde<br />

Nederlandse man. Dit en nog veel meer zaken heeft te maken met statistische<br />

berekeningen.<br />

Wat is statistiek.<br />

<strong>Statistiek</strong> is een methode en techniek om een hoop “meet”gegevens te<br />

verzamelen om daarna allerlei berekeningen er op los te laten. De berekeningen<br />

geven je dan bepaalde uitkomsten die ook wel kengetallen genoemd worden. Uit<br />

deze kengetallen kun je een aantal conclusies trekken. De statistiek geeft<br />

antwoord op allerlei vragen en het is mogelijk resultaten is geloofwaardig te<br />

presenteren. Helaas is de verkregen informatie altijd onvolledig, immers 100%<br />

alles meten gebeurd over het algemeen niet. Er is sprake van steekproeven of<br />

over metingen over een bepaalde tijdsperiode. De verkregen informatie is bijna<br />

altijd onvolledig en daardoor onnauwkeurig. Een goede beheersing van deze<br />

onnauwkeurigheid is dan ook een belangrijk onderdeel van de statistiek.<br />

Frequentie verdeling.<br />

Aan de hand van een voorbeeld gaan we de statistische berekeningsmethode en<br />

kenmerken nader bekijken. <strong>Statistiek</strong> begint altijd met het verzamelen van<br />

gegeven. Bijvoorbeeld de diameter van een cilinder met een boring van 30,5<br />

millimeter. De fabricage tolerantie in 0,5 mm. Uit de productie wordt een<br />

steekproef opgehaald van 100 cilinders. Die worden allemaal gemeten. De<br />

meetwaarden worden genoteerd (figuur 1).<br />

R.Spierings <strong>Statistiek</strong> 2


Figuur 1<br />

Deze meting zegt ons nog niet zoveel. We kunnen in ieder geval concluderen dat<br />

ze allemaal binnen de tolerantie vallen. Met behulp van Excel gaan we de<br />

gegevens bewerken zodat we onderstaande tabel en grafiek kunnen maken. Zo<br />

krijgen we al wat inzicht in het fabricage proces.<br />

De tabel van figuur 2 is een optellingen van alle metingen (waarnemingen) en<br />

wordt in de statistiek frequentietabel genoemd. Je zie nu gemakkelijk welke<br />

meetwaarden het vaakste voorkomen en welke minder. Ook zie je hun<br />

onderlinge relatie . Onthoud dat een frequentie (symbool:f) het aantal<br />

waarnemingen is in een bepaald gebied. We kunnen van de frequentietabel<br />

vervolgens in een grafiek maken (figuur 3)<br />

Figuur 2<br />

Figuur 3<br />

R.Spierings <strong>Statistiek</strong> 3


Klasse en klassebreedte.<br />

De klassebreedte in bovenstaand voorbeeld is 0,1 mm en we hebben voor 11<br />

klasse gekozen. Stel we meten op 0,01 mm nauwkeurig en we voeren 500<br />

metingen uit. Wanneer je de klasse breedte op 0,01 zou instellen betekend dat<br />

de frequentie tabel 10 keer breder zou worden. Het gevolg hiervan is dat de<br />

frequentiegrafiek te “vlak” wordt waardoor de statistische berekeningen<br />

onnauwkeurig worden. Ook wanneer je te weinig klasse hebt dan wordt de<br />

frequentie verdeling te “spits” . Een goede tussenoplossing om het aantal klassen<br />

de kiezen is de √ (wortel) van de waarnemingen. Met de uitkomst wordt een<br />

gunstige klassebreedte beredeneerd. We hebben in dit voorbeeld 500 metingen.<br />

De √500 is ca 22. Wanneer we voor 20 klasse kiezen wordt de klasse breedte<br />

0,05mm. Dit is een goed alternatief<br />

(1) Te weinig klassen (2)Te veel klassen (3)Juiste aantal klassen<br />

De gevonden klassebreedte die een juist beeld geven zoals hierboven grafiek (3)<br />

noemen we een “normaalverdeling” alle verdere statistische berekeningen zijn op<br />

deze verdeling van toepassing (ze zijn waar).<br />

R.Spierings <strong>Statistiek</strong> 4


Het gemiddelde van een aantal meting<br />

is het rekenkundig gemiddelde en<br />

aangeduid met het symbool µ. In dit<br />

voorbeeld: µ = 30,5.<br />

De mediaan (Me) is de middelste<br />

waarde. Dus Me = 30,5.<br />

Modus of modale klasse is de klasse<br />

met de meeste waarnemingen. In dit<br />

voorbeeld dus ook 30,5.<br />

Wanneer het gemiddelde samenvalt<br />

met mediaan en modus spreken we<br />

over een “normaalverdeling”<br />

Gemiddelde, mediaan en modus.<br />

Figuur 5<br />

Figuur 4<br />

In bovenstaand voorbeeld (figuur 5) vallen het gemiddelde, modus en mediaan niet samen.<br />

Het beeld wat de grafiek geeft is ongunstig. Immers het “proces” is niet op 6 ingesteld.<br />

R.Spierings <strong>Statistiek</strong> 5


Spreiding en standaardafwijking.<br />

Nog een belangrijk onderdeel van een frequentie verdeling is de mate waarin de<br />

waarnemingen uit elkaar liggen. Dit noemen we de spreiding. Het gemiddelde<br />

van de getallen 22.24 en 26 is 24. Het gemiddelde van de getallen 12,24 en 36<br />

is ook 24 maar de spreiding is veel groter. Door de spreiding te benoemen wordt<br />

samen met het gemiddelde, mediaan en modus een (statistisch)beeld gegeven<br />

van de gegevens die verzameld zijn. De spreiding zegt over het algemeen iets<br />

over de kwaliteit van een proces. Hoe nauwkeuriger een proces hoe kleiner de<br />

spreiding. De spreiding wordt benoemd door R= Xmax-Xmin.<br />

Naast de spreiding kennen wij ook nog de standaardafwijking. De<br />

standaardafwijking of standaarddeviatie, een begrip in de statistiek, is een maat<br />

voor de spreiding. De standaardafwijking wordt berekend door de wortel te<br />

nemen van de variantie. De variantie (ongeveer) het gemiddelde van de<br />

kwadraten van de afwijking van de waarnemingen ten opzichte van het<br />

gemiddelde. Klink moeilijk maar gelukkig kunnen we met Excel een en ander<br />

doorrekenen. De standaardafwijking is interessant wanneer je naar onderstaande<br />

grafiek bekijkt. Wanneer de grafiek het beeld geeft zoals figuur 6 noemen wij dat<br />

een normaalverdeling. Wanneer de standaardafwijking 1 is betekend dat binnen<br />

de grens van 1 68,2% van de metingen valt. Is de standaardafwijking 2 dan<br />

vallen binnen die grenzen 95,4% van de metingen. Buiten 3 keer de standaard<br />

afwijking zie je dat het nog maar 0,2% is. Metingen die in dit gebied vallen<br />

worden vaak dan ook niet betrokken bij nemen van besluiten (overmacht).<br />

Figuur 6<br />

De formule om de standaardafwijking is:<br />

R.Spierings <strong>Statistiek</strong> 6


Weer een moeilijke formule, maar gelukkig Excel help zie onderstaand.<br />

R.Spierings <strong>Statistiek</strong> 7


Eigenschappen van de normale verdeling.<br />

Een normale verdeling is symmetrisch (zie figuur 6). Het gemiddelde, modes en<br />

mediaan liggen precies in het midden. Alle waarnemingen liggen tussen 6 (3 x<br />

links 3 en 3 x rechts) keer de standaardafwijking (99,8%). Met deze gegevens<br />

we op eenvoudige wijze de oppervlakte van een deel onder de normale verdeling<br />

uitreken. Dit is van toepassing wanneer bijvoorbeeld bepaald moet worden<br />

hoeveel waarnemingen er in een bepaald gebied voorkomen. Bestudeer eerst<br />

onderstaande tabel. Tussen u= 0,00 en u=2.95 zit een verschil van A = 0,498.<br />

Dit komt overeen met 49,8% van de waarnemingen. Hiermee wordt het<br />

oppervlak van het deel onder de normale verdeling links of rechts van het<br />

gemiddelde bedoeld.<br />

R.Spierings <strong>Statistiek</strong> 8


R.Spierings <strong>Statistiek</strong> 9


R.Spierings <strong>Statistiek</strong> 10


Ten slotte.<br />

We hebben statistisch het gemiddelde, de mediaan, de modus, de spreiding en<br />

de standaardafwijking nader beschouwd. We kunnen (technische) processen in<br />

beeld brengen en daar uitspaken over doen.<br />

Voorbeelden uit de voorraad beheer zijn:<br />

Hoe groot wordt mijn veiligheidsvoorraad bij een artikel waarvan de<br />

toeleverancier een bepaalde spreiding in de levertijd heeft.<br />

Hoe groot wordt de veiligheidsvoorraad wanneer de afname van de artikelen<br />

uit de voorraad nog al eens verschild.<br />

Voorbeelden uit een productie proces:<br />

Op welke nominale maten kan ik de verspaningsmachines instellen zodat de<br />

standtijd van het gereedschap optimaal is.<br />

Hoeveel afkeur maakt mijn productie proces.<br />

Dit zijn maar een paar voorbeelden uit de techniek.<br />

R.Spierings <strong>Statistiek</strong> 11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!