l9clshg
l9clshg
l9clshg
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Latente Klasse Analyse<br />
Eén van de subdoelen van deze studie was het verkrijgen van inzicht in het voorkomen van<br />
subgroepen, gekarakteriseerd door het voorkomen van (specifieke combinaties van ) risicofactoren,<br />
waaraan een hoge of juist een lage kans op het voortzetten van crimineel (gewelddadig) gedrag tot<br />
in de volwassenheid kan worden gerelateerd (onderzoeksvraag 7). Hiervoor is een clusteranalyse<br />
uitgevoerd, in het bijzonder ‘Latente Klasse Analyse’.<br />
Latente Klasse Analyse (of Latent Class Analysis; LCA) is een statistische techniek die speciaal is<br />
gericht op het creëren van homogene subgroepen van individuen binnen een grotere<br />
onderzoekspopulatie (zoals de Top 600). De toevoeging ‘Latent’ verwijst naar het gegeven dat de<br />
verschillende subgroepen niet direct waarneembaar zijn, maar wel latent aanwezig zijn in de data.<br />
Een bekend toepassingsgebied van LCA is marketingonderzoek, waarbij deze techniek helpt om<br />
aparte producten te ontwikkelen voor specifieke klantgroepen. Een belangrijk verschil tussen LCA<br />
en traditionele cluster technieken (bijvoorbeeld K-means clustering) is dat LCA een statistisch model<br />
is, wat betekent dat statistisch getoetst kan worden welk aantal clusters, en daarmee welke<br />
profielen, de beste oplossing biedt.<br />
De LCA is uitgevoerd met het statistische programma LATENT – GOLD 4.0 (Vermunt, 2004;<br />
Madginson & Vermunt, 2005). Met kenmerken uit de FPJ als input berekent het programma<br />
verschillende modellen, uiteenlopend van één tot meerdere (in dit onderzoek is gekozen voor<br />
maximaal vier) latente klassen in de data. De kwaliteit van de uitkomst van elk van deze modellen is<br />
leidend voor het aantal ‘zinvolle’ profielen dat is te onderscheiden. Voor het bepalen van de<br />
kwaliteit van een model wordt gekeken naar het ‘Bayesiaanse Informatie Critrium’ (BIC). Het model<br />
met de laagste BIC waarde, daarmee het ‘best passende’ model, geeft aan tussen hoeveel profielen<br />
onderscheid kan worden gemaakt in de data.<br />
Het was niet mogelijk om een latente klasse analyse uit te voeren waarbij alle afzonderlijke<br />
risicofactoren van alle FPJ-domeinen tegelijkertijd aan een model werden toegevoegd. De<br />
belangrijkste reden daarvoor was dat het programma LATENT – GOLD elke ‘case’ met minimaal één<br />
missende waarde niet includeert in de analyse. Hoe groter het aantal variabelen in een model, hoe<br />
groter de kans op missende waardes en dus hoe groter de kans op uitval van ‘cases’ in de<br />
modeloplossing. Met 65 risicofactoren als inputvariabele in één model werd dan ook een grote<br />
meerderheid van de ‘cases’ geëxcludeerd uit het model. Een optie om missende waarden te<br />
vervangen door de gemiddelde score van de gehele groep was onwenselijk. Bij twijfel over het<br />
toekennen van een score 1 of 2 (“ik vermoed 2, maar ik kan het niet hard maken”) was namelijk<br />
afgesproken om de optie “?” te scoren (ik weet het niet), en niet te kiezen voor een 1. Bij het<br />
vervangen van een missende waarde voor het gemiddelde zou het aannemelijk zijn dat hierdoor in<br />
veel gevallen een onderschatting van de gemiddelde ernst van de aanwezigheid van een risicofactor<br />
zou ontstaan. Bovendien zou het vervangen door gemiddelde scores mogelijk afbreuk doen aan de<br />
grootte van eventuele contrasten tussen de Top 600 en de Boefjes.<br />
Er is daarom niet gewerkt met één model met daarin alle 65 afzonderlijke items maar er zijn, naar<br />
analogie van de probleemdomeinen van de FPJ, zeven analyses met elk ongeveer 10 (variërend van<br />
5 tot 15) items uitgevoerd. Aangezien per FPJ-domein minder afzonderlijke risicofactoren aanwezig<br />
zijn, is de kans op missende waardes dus ook kleiner. De oplossingen worden zo robuuster omdat<br />
22