20.03.2014 Views

l9clshg

l9clshg

l9clshg

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Latente Klasse Analyse<br />

Eén van de subdoelen van deze studie was het verkrijgen van inzicht in het voorkomen van<br />

subgroepen, gekarakteriseerd door het voorkomen van (specifieke combinaties van ) risicofactoren,<br />

waaraan een hoge of juist een lage kans op het voortzetten van crimineel (gewelddadig) gedrag tot<br />

in de volwassenheid kan worden gerelateerd (onderzoeksvraag 7). Hiervoor is een clusteranalyse<br />

uitgevoerd, in het bijzonder ‘Latente Klasse Analyse’.<br />

Latente Klasse Analyse (of Latent Class Analysis; LCA) is een statistische techniek die speciaal is<br />

gericht op het creëren van homogene subgroepen van individuen binnen een grotere<br />

onderzoekspopulatie (zoals de Top 600). De toevoeging ‘Latent’ verwijst naar het gegeven dat de<br />

verschillende subgroepen niet direct waarneembaar zijn, maar wel latent aanwezig zijn in de data.<br />

Een bekend toepassingsgebied van LCA is marketingonderzoek, waarbij deze techniek helpt om<br />

aparte producten te ontwikkelen voor specifieke klantgroepen. Een belangrijk verschil tussen LCA<br />

en traditionele cluster technieken (bijvoorbeeld K-means clustering) is dat LCA een statistisch model<br />

is, wat betekent dat statistisch getoetst kan worden welk aantal clusters, en daarmee welke<br />

profielen, de beste oplossing biedt.<br />

De LCA is uitgevoerd met het statistische programma LATENT – GOLD 4.0 (Vermunt, 2004;<br />

Madginson & Vermunt, 2005). Met kenmerken uit de FPJ als input berekent het programma<br />

verschillende modellen, uiteenlopend van één tot meerdere (in dit onderzoek is gekozen voor<br />

maximaal vier) latente klassen in de data. De kwaliteit van de uitkomst van elk van deze modellen is<br />

leidend voor het aantal ‘zinvolle’ profielen dat is te onderscheiden. Voor het bepalen van de<br />

kwaliteit van een model wordt gekeken naar het ‘Bayesiaanse Informatie Critrium’ (BIC). Het model<br />

met de laagste BIC waarde, daarmee het ‘best passende’ model, geeft aan tussen hoeveel profielen<br />

onderscheid kan worden gemaakt in de data.<br />

Het was niet mogelijk om een latente klasse analyse uit te voeren waarbij alle afzonderlijke<br />

risicofactoren van alle FPJ-domeinen tegelijkertijd aan een model werden toegevoegd. De<br />

belangrijkste reden daarvoor was dat het programma LATENT – GOLD elke ‘case’ met minimaal één<br />

missende waarde niet includeert in de analyse. Hoe groter het aantal variabelen in een model, hoe<br />

groter de kans op missende waardes en dus hoe groter de kans op uitval van ‘cases’ in de<br />

modeloplossing. Met 65 risicofactoren als inputvariabele in één model werd dan ook een grote<br />

meerderheid van de ‘cases’ geëxcludeerd uit het model. Een optie om missende waarden te<br />

vervangen door de gemiddelde score van de gehele groep was onwenselijk. Bij twijfel over het<br />

toekennen van een score 1 of 2 (“ik vermoed 2, maar ik kan het niet hard maken”) was namelijk<br />

afgesproken om de optie “?” te scoren (ik weet het niet), en niet te kiezen voor een 1. Bij het<br />

vervangen van een missende waarde voor het gemiddelde zou het aannemelijk zijn dat hierdoor in<br />

veel gevallen een onderschatting van de gemiddelde ernst van de aanwezigheid van een risicofactor<br />

zou ontstaan. Bovendien zou het vervangen door gemiddelde scores mogelijk afbreuk doen aan de<br />

grootte van eventuele contrasten tussen de Top 600 en de Boefjes.<br />

Er is daarom niet gewerkt met één model met daarin alle 65 afzonderlijke items maar er zijn, naar<br />

analogie van de probleemdomeinen van de FPJ, zeven analyses met elk ongeveer 10 (variërend van<br />

5 tot 15) items uitgevoerd. Aangezien per FPJ-domein minder afzonderlijke risicofactoren aanwezig<br />

zijn, is de kans op missende waardes dus ook kleiner. De oplossingen worden zo robuuster omdat<br />

22

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!