Caracterización de la Población Carcelaria en ... - Iidia.com.ar
Caracterización de la Población Carcelaria en ... - Iidia.com.ar
Caracterización de la Población Carcelaria en ... - Iidia.com.ar
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
TESIS DE GRADO<br />
INGENIERÍA INDUSTRIAL<br />
CARACTERIZACIÓN DE LA POBLACIÓN<br />
CARCELARIA EN ARGENTINA MEDIANTE LA<br />
APLICACIÓN DE MINERÍA DE DATOS PARA LA<br />
PREVENCIÓN DE HECHOS DELICTIVOS.<br />
AUTOR:<br />
PATRICIO GUTIÉRREZ RÜEGG<br />
DIRECTOR DE TESIS:<br />
M. ING. PAOLA BRITOS<br />
DR. RAMÓN GARCÍA-MARTÍNEZ<br />
2008
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.
RESUMEN<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Des<strong>de</strong> hace ya v<strong>ar</strong>ios años <strong>la</strong> inseguridad pasó a ser un tema recurr<strong>en</strong>te <strong>en</strong> <strong>la</strong> vida <strong>de</strong> los<br />
<strong>ar</strong>g<strong>en</strong>tinos. Reducir el índice <strong>de</strong> <strong>de</strong>litos es un tema que ti<strong>en</strong>e muy pres<strong>en</strong>te cada nuevo<br />
gobierno. La toma <strong>de</strong> <strong>de</strong>cisiones efici<strong>en</strong>tes y <strong>la</strong> implem<strong>en</strong>tación <strong>de</strong> medidas prev<strong>en</strong>tivas<br />
<strong>en</strong> lo que respecta a política criminal y social, es el primer paso que se <strong>de</strong>bería analiz<strong>ar</strong> a<br />
fin <strong>de</strong> logr<strong>ar</strong> reducir <strong>la</strong> cantidad <strong>de</strong> hechos <strong>de</strong>lictivos.<br />
El análisis <strong>de</strong> <strong>la</strong> información criminal que los difer<strong>en</strong>tes <strong>en</strong>tes <strong>de</strong>l Estado g<strong>en</strong>eran es un<br />
punto <strong>de</strong> vital importancia a los fines <strong>de</strong> prev<strong>en</strong>ción <strong>de</strong>l <strong>de</strong>lito. Se cree que no basta solo<br />
con analiz<strong>ar</strong> los registros sobre los distintos <strong>de</strong>litos <strong>com</strong>etidos <strong>en</strong> el pasado, sino que es<br />
neces<strong>ar</strong>io po<strong>de</strong>r llev<strong>ar</strong> a cabo estudios que involucr<strong>en</strong> a los autores materiales <strong>de</strong> dichos<br />
hechos. G<strong>en</strong>eralm<strong>en</strong>te se analizan estadísticas <strong>de</strong>scriptivas clásicas re<strong>la</strong>cionadas con los<br />
hechos propiam<strong>en</strong>te dichos, pero nunca se hace verda<strong>de</strong>ro foco <strong>en</strong> <strong>la</strong> persona que<br />
ejecuta dicho <strong>de</strong>lito, el <strong>de</strong>lincu<strong>en</strong>te. Se <strong>en</strong>ti<strong>en</strong><strong>de</strong> que es neces<strong>ar</strong>io un tratami<strong>en</strong>to más<br />
<strong>com</strong>plejo sobre <strong>la</strong> información criminal.<br />
El pres<strong>en</strong>te proyecto se p<strong>la</strong>ntea <strong>en</strong> el p<strong>la</strong>no <strong>de</strong> <strong>la</strong> información criminal, <strong>en</strong>focándose<br />
específicam<strong>en</strong>te <strong>en</strong> los datos <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina registrados por <strong>la</strong><br />
Dirección Nacional <strong>de</strong> Política Criminal <strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong>l Ministerio <strong>de</strong> Justicia y<br />
Derechos Humanos <strong>de</strong> <strong>la</strong> Nación Arg<strong>en</strong>tina.<br />
Se busca <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r y proponer un mo<strong>de</strong>lo metodológico basado <strong>en</strong> <strong>la</strong> minería <strong>de</strong> datos<br />
que ayu<strong>de</strong> a c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> sociedad c<strong>ar</strong>ce<strong>la</strong>ria a fines <strong>de</strong> obt<strong>en</strong>er patrones <strong>de</strong><br />
<strong>com</strong>portami<strong>en</strong>to y conducta <strong>de</strong> los <strong>de</strong>lincu<strong>en</strong>tes. Si se logr<strong>ar</strong>a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r los posibles<br />
motivos que llev<strong>ar</strong>on a <strong>de</strong>linquir a esta porción <strong>de</strong> <strong>la</strong> sociedad, se facilit<strong>ar</strong>ía <strong>la</strong><br />
g<strong>en</strong>eración <strong>de</strong> estrategias <strong>de</strong> prev<strong>en</strong>ción efectivas.<br />
A
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
B
ABSTRACT<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
For several ye<strong>ar</strong>s security has be<strong>en</strong> a recurr<strong>en</strong>t theme in the lives of Arg<strong>en</strong>tineans.<br />
Reducing the crime in<strong>de</strong>x is a very pressing premise for every new administration. To<br />
reduce the amount of criminal acts the first step should be to analyze the politics of<br />
effici<strong>en</strong>t <strong>de</strong>cision-making and the implem<strong>en</strong>tation of prev<strong>en</strong>tive measures reg<strong>ar</strong>ding<br />
criminal and social politics.<br />
The analysis of criminal data g<strong>en</strong>erated by differ<strong>en</strong>t fe<strong>de</strong>ral ag<strong>en</strong>cies is of vital<br />
importance for crime prev<strong>en</strong>tion. It is believed that it is not <strong>en</strong>ough to analyze the<br />
reports on differ<strong>en</strong>t crimes <strong>com</strong>mitted in the past, but it is also necess<strong>ar</strong>y to study the<br />
actual perpetrators of such acts. G<strong>en</strong>erally, studies focus on c<strong>la</strong>ssic <strong>de</strong>scriptive statistics<br />
re<strong>la</strong>ted to the ev<strong>en</strong>ts in question, but never truly focus on the person who <strong>com</strong>mitted the<br />
crime, the criminal. It is therefore un<strong>de</strong>rstood that a more <strong>com</strong>plex managem<strong>en</strong>t of<br />
criminal data is nee<strong>de</strong>d.<br />
The curr<strong>en</strong>t project is based on the criminal information focusing specifically on the<br />
data from the inc<strong>ar</strong>cerated popu<strong>la</strong>tion in Arg<strong>en</strong>tina registered by the Dirección Nacional<br />
<strong>de</strong> Política Criminal (National Dep<strong>ar</strong>tm<strong>en</strong>t of Criminal Law) <strong>de</strong>p<strong>en</strong>ding on the<br />
Ministerio <strong>de</strong> Justicia y Derechos Humanos <strong>de</strong> <strong>la</strong> Nación Arg<strong>en</strong>tina (The Arg<strong>en</strong>tinean<br />
National Ministry of Justice and Human Rights.)<br />
The objective is to <strong>de</strong>velop and propose a methodological mo<strong>de</strong>l based on data mining<br />
that helps ch<strong>ar</strong>acterize the inmate popu<strong>la</strong>tion thus obtaining behavioral and personality<br />
traits of criminals. If an un<strong>de</strong>rstanding can be achieved of the possible motives that<br />
drove this sector of our society to crime, th<strong>en</strong> <strong>de</strong>velopm<strong>en</strong>t of strategies for effective<br />
prev<strong>en</strong>tion would be facilitated.<br />
C
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
D
TABLA DE CONTENIDOS<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
1. INTRODUCCIÓN.....................................................................................................................1<br />
1.1 INTRODUCCIÓN AL PROBLEMA .................................................................................1<br />
1.2 MOTIVACIONES Y DESTINATARIOS ..........................................................................3<br />
1.3 COMPOSICIÓN DEL TRABAJO......................................................................................3<br />
2. ESTADO DE LA CUESTIÓN ..................................................................................................5<br />
2.1 INTRODUCCIÓN A LA MINERÍA DE DATOS..............................................................5<br />
2.1.1 Algoritmos <strong>de</strong> Minería <strong>de</strong> Datos..................................................................................6<br />
2.1.1.1 Algoritmos <strong>de</strong> Clustering o Agrupami<strong>en</strong>to...........................................................7<br />
2.1.1.1.1 SOM ..............................................................................................................7<br />
2.1.1.1.2 K-Means........................................................................................................9<br />
2.1.1.2 Algoritmos <strong>de</strong> C<strong>la</strong>sificación: Inducción .............................................................10<br />
2.1.1.2.1 ID3...............................................................................................................10<br />
2.1.1.2.2 C4.5 .............................................................................................................11<br />
2.1.1.2.3 CHAID ........................................................................................................12<br />
2.1.1.3 Selección <strong>de</strong> atributos.........................................................................................13<br />
2.2 CRIPS-DM: METODOLOGÍA DE PROYECTOS DE MINERÍA DE DATOS.............14<br />
2.2.1 Objetivos <strong>de</strong> cada fase <strong>en</strong> <strong>la</strong> metodología CRISP-DM. .............................................16<br />
2.3 MINERÍA DE DATOS APLICADA A LA INFORMACIÓN CRIMINAL ....................17<br />
2.3.1 Proyecto Able Danger................................................................................................18<br />
2.3.2 Proyecto COPLINK – Universidad <strong>de</strong> Arizona .........................................................19<br />
2.4 INFORMACIÓN CRIMINAL EN ARGENTINA ...........................................................23<br />
2.4.1 Dirección Nacional <strong>de</strong> Política Criminal ...................................................................23<br />
2.4.1.1 Fu<strong>en</strong>tes Oficiales <strong>de</strong> Información y Estudios <strong>de</strong> Victimización........................23<br />
2.4.1.1.1 Sistema Nacional <strong>de</strong> Información Criminal (SNIC) ...................................24<br />
2.4.1.1.2 Sistema Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ)...................................26<br />
2.4.1.1.3 Encuestas <strong>de</strong> Victimización.........................................................................27<br />
2.4.1.1.4 Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) ...28<br />
2.4.1.1.5 Sistema Unificado <strong>de</strong> Registros Criminales (SURC)..................................31<br />
2.4.1.1.6 Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires .........................33<br />
2.5 DIAGNÓSTICO DEL SERVICIO PENITENCIARIO EN ARGENTINA......................34<br />
2.5.1 Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción P<strong>en</strong>al <strong>en</strong> Arg<strong>en</strong>tina..........................................................34<br />
2.5.2 Situación a nivel internacional...................................................................................37<br />
2.5.3 Sobrepob<strong>la</strong>ción y hacinami<strong>en</strong>to <strong>en</strong> Arg<strong>en</strong>tina ...........................................................39<br />
2.5.3.1 Sobrepob<strong>la</strong>ción. Dim<strong>en</strong>sión <strong>de</strong>l problema..........................................................40<br />
2.5.4 Situación p<strong>en</strong>al <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos ................................................................................41<br />
2.5.5 Costo promedio <strong>de</strong> cada preso. ..................................................................................42<br />
2.5.6 Trabajo <strong>en</strong> <strong>la</strong>s cárceles ...............................................................................................43<br />
2.5.7 Reflexiones acerca <strong>de</strong>l diagnóstico <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io..................................43<br />
I
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
3. DESCRIPCIÓN DEL PROBLEMA ....................................................................................... 45<br />
II<br />
3.1. TRATAMIENTO DE LA INFORMACIÓN................................................................... 45<br />
3.2. EL PROBLEMA ESPECÍFICO ...................................................................................... 45<br />
4. SOLUCIÓN............................................................................................................................. 47<br />
4.1 PROPUESTA DE SOLUCIÓN ........................................................................................ 47<br />
4.2 APLICACIÓN DE CRISP-DM ........................................................................................ 47<br />
4.2.1 Fase I: Compr<strong>en</strong>sión <strong>de</strong>l negocio .............................................................................. 48<br />
4.2.1.1 Determin<strong>ar</strong> los objetivos <strong>de</strong>l negocio................................................................ 48<br />
4.2.1.2 Evaluación <strong>de</strong> <strong>la</strong> Situación ................................................................................ 48<br />
4.2.1.3 P<strong>la</strong>n <strong>de</strong> Proyecto................................................................................................. 50<br />
4.2.2 Fase II: Compr<strong>en</strong>sión <strong>de</strong> los datos............................................................................. 51<br />
4.2.2.1 Recolección <strong>de</strong> los datos iniciales...................................................................... 51<br />
4.2.2.2 Descripción <strong>de</strong> los datos iniciales ...................................................................... 52<br />
4.2.2.2.1 Dataset seleccionado .................................................................................. 54<br />
4.2.2.3 Exploración <strong>de</strong> los datos .................................................................................... 58<br />
4.2.2.4 Verificación <strong>de</strong> Calidad <strong>de</strong> los Datos................................................................. 64<br />
4.2.3 Fase III: Prep<strong>ar</strong>ación <strong>de</strong> los datos.............................................................................. 65<br />
4.2.3.1 Prep<strong>ar</strong>ación <strong>de</strong>l Dataset...................................................................................... 65<br />
4.2.3.2 Selección <strong>de</strong> los Datos ...................................................................................... 66<br />
4.2.3.3 Limpieza <strong>de</strong> los Datos....................................................................................... 68<br />
4.2.3.4 Construcción e integración <strong>de</strong> los Datos ........................................................... 68<br />
4.2.4 Fase IV: Mo<strong>de</strong><strong>la</strong>do .................................................................................................... 70<br />
4.2.4.1 Selección <strong>de</strong> <strong>la</strong> técnica <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.................................................................. 71<br />
4.2.4.2 Construcción <strong>de</strong>l mo<strong>de</strong>lo y resultados experim<strong>en</strong>tales ...................................... 71<br />
4.2.4.2.1 Clustering.................................................................................................... 71<br />
4.2.4.2.2 Resultados <strong>de</strong>l Clustering ........................................................................... 72<br />
4.2.4.2.3 Selección <strong>de</strong> Atributos................................................................................ 86<br />
4.2.4.2.4 C<strong>la</strong>sificación ............................................................................................... 87<br />
4.2.4.3 Evalu<strong>ar</strong> el mo<strong>de</strong>lo. ............................................................................................. 96<br />
4.2.5 Fase V: Evaluación.................................................................................................... 97<br />
5. CONCLUSIONES Y REFLEXIONES................................................................................... 99<br />
5.1 CONCLUSIONES DEL PROYECTO ............................................................................. 99<br />
5.2 REFLEXIONES.............................................................................................................. 100<br />
6. FUTURAS LÍNEAS DE INVESTIGACIÓN ....................................................................... 103<br />
7. APORTES REALIZADOS................................................................................................... 105<br />
8. REFERENCIAS.................................................................................................................... 107<br />
9. ANEXOS............................................................................................................................... 111
1. INTRODUCCIÓN<br />
1.1 INTRODUCCIÓN AL PROBLEMA<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
La situación <strong>de</strong>l régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina es un tema que ti<strong>en</strong>e preocupado a<br />
los últimos gobiernos <strong>de</strong>s<strong>de</strong> hace ya v<strong>ar</strong>ios años. Los increm<strong>en</strong>tos <strong>en</strong> <strong>la</strong> pob<strong>la</strong>ción<br />
c<strong>ar</strong>ce<strong>la</strong>ria hac<strong>en</strong> suponer que <strong>la</strong>s tasas <strong>de</strong> <strong>de</strong>litos <strong>de</strong>berían haber bajado, sin emb<strong>ar</strong>go<br />
ocurrió lo contr<strong>ar</strong>io. Des<strong>de</strong> el año 1990 al 2006 el total <strong>de</strong> hechos <strong>de</strong>lictuosos creció <strong>de</strong><br />
560.240 a 1.224.293, lo que repres<strong>en</strong>ta un aum<strong>en</strong>to <strong>de</strong> aproximadam<strong>en</strong>te 119%. A su<br />
vez, <strong>la</strong> pob<strong>la</strong>ción alojada <strong>en</strong> cárceles fe<strong>de</strong>rales creció un 110% <strong>en</strong> el mismo período<br />
[Dirección Nacional <strong>de</strong> Política Criminal, 2006]. Aún más, según un estudio e<strong>la</strong>borado<br />
<strong>en</strong> el Ministerio <strong>de</strong> Justicia, se prevé que el número <strong>de</strong> presos <strong>en</strong> cárceles fe<strong>de</strong>rales<br />
seguirá creci<strong>en</strong>do <strong>en</strong> el futuro llegando a unos 22.000 p<strong>ar</strong>a el año 2025. Esto <strong>de</strong>muestra<br />
que el número <strong>de</strong> personas presas crece a un ritmo mucho mayor que <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>l<br />
país, <strong>la</strong> cual creció solo un 20% <strong>de</strong>s<strong>de</strong> el año 1990 al 2006 [INDEC, 2007].<br />
En lo que refiere al régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina, <strong>la</strong>s estadísticas muestran<br />
números realm<strong>en</strong>te preocupantes <strong>en</strong> todos los aspectos a t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta cuando se<br />
hab<strong>la</strong> <strong>de</strong> cárceles <strong>en</strong> Latinoamérica, p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te <strong>en</strong> Arg<strong>en</strong>tina. La sobrepob<strong>la</strong>ción, el<br />
hacinami<strong>en</strong>to, <strong>la</strong> promiscuidad, el avance <strong>de</strong>l sida, <strong>la</strong> viol<strong>en</strong>cia, son algunos <strong>de</strong> los<br />
temas que se pres<strong>en</strong>tan cuando se hab<strong>la</strong> <strong>de</strong> socieda<strong>de</strong>s c<strong>ar</strong>ce<strong>la</strong>rias <strong>en</strong> Arg<strong>en</strong>tina. Por lo<br />
tanto, se cree que sin una política criminal efici<strong>en</strong>te y rep<strong>ar</strong>adora, será imposible baj<strong>ar</strong><br />
<strong>en</strong> el mediano p<strong>la</strong>zo el alto índice <strong>de</strong> <strong>de</strong>litos exist<strong>en</strong>te. En el capitulo 2.5 se realiza un<br />
diagnóstico sobre el sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> nuestro país, <strong>en</strong> don<strong>de</strong> se pue<strong>de</strong>n observ<strong>ar</strong><br />
<strong>la</strong>s cuestiones p<strong>la</strong>nteadas y sus indicadores.<br />
Debido a estos increm<strong>en</strong>tos y cuestiones a<strong>la</strong>rmantes se cree <strong>de</strong> suma importancia y<br />
relevancia realiz<strong>ar</strong> un estudio que involucre a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina <strong>com</strong>o<br />
punto insos<strong>la</strong>yable <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> política criminal.<br />
La problemática p<strong>la</strong>nteada lleva a <strong>la</strong> necesidad <strong>de</strong> cont<strong>ar</strong> con herrami<strong>en</strong>tas que permitan<br />
<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r un diagnóstico válido sobre el estado actual <strong>de</strong> <strong>la</strong> cuestión c<strong>ar</strong>ce<strong>la</strong>ria, ya que<br />
es <strong>de</strong> vital importancia a los fines <strong>de</strong> aplic<strong>ar</strong> una política eficaz <strong>en</strong> <strong>la</strong> materia. El Sistema<br />
Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) es un aporte <strong>en</strong> tal<br />
s<strong>en</strong>tido. Este sistema <strong>de</strong> información fue implem<strong>en</strong>tado <strong>en</strong> el año 2002 por <strong>la</strong> Dirección<br />
Nacional <strong>de</strong> Política Criminal con el fin <strong>de</strong> cont<strong>ar</strong> con información periódica y uniforme<br />
acerca <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción p<strong>en</strong>al privada <strong>de</strong> libertad <strong>en</strong> <strong>la</strong> República Arg<strong>en</strong>tina. Si bi<strong>en</strong><br />
surg<strong>en</strong> ciertos límites metodológicos, y hasta i<strong>de</strong>ológicos, al result<strong>ar</strong> <strong>la</strong> fu<strong>en</strong>te prim<strong>ar</strong>ia<br />
<strong>de</strong> información los propios organismos <strong>de</strong> ejecución <strong>de</strong> <strong>la</strong> p<strong>en</strong>a, se cree que se trata <strong>de</strong><br />
una bu<strong>en</strong>a mirada sobre <strong>la</strong> cuestión que ti<strong>en</strong>e una <strong>en</strong>orme relevancia [Dirección<br />
Nacional <strong>de</strong> Política Criminal, 2005].<br />
Introducción Patricio Gutiérrez Rüegg 1
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Sin emb<strong>ar</strong>go, se cree que con el solo cont<strong>ar</strong> con estadísticas vincu<strong>la</strong>das a los registros<br />
criminales o, <strong>en</strong> el caso <strong>de</strong>l SNEEP, <strong>de</strong> los criminales propiam<strong>en</strong>te dichos, no es<br />
sufici<strong>en</strong>te p<strong>ar</strong>a po<strong>de</strong>r tom<strong>ar</strong> <strong>de</strong>cisiones <strong>com</strong>pletas y correctas <strong>en</strong> lo que a política<br />
criminal respecta. Tradicionalm<strong>en</strong>te se han hecho análisis <strong>en</strong> intervalos <strong>de</strong> tiempos<br />
acotados sobre alocación <strong>de</strong> recursos p<strong>ar</strong>a <strong>la</strong> prev<strong>en</strong>ción <strong>de</strong> <strong>de</strong>litos basándose <strong>en</strong><br />
resultados obt<strong>en</strong>idos <strong>de</strong> herrami<strong>en</strong>tas estadísticas clásicas. El problema es que estos no<br />
reflejan <strong>la</strong> distribución real <strong>de</strong> <strong>la</strong> actividad criminal, volviéndose no tan útiles p<strong>ar</strong>a el<br />
<strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> medidas prev<strong>en</strong>tivas con el fin <strong>de</strong> evit<strong>ar</strong> hechos <strong>de</strong>lictivos [Corcoran et al,<br />
2004].<br />
Es neces<strong>ar</strong>io un tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información estadística más <strong>com</strong>plejo, aún más<br />
cuando se trabajan con base <strong>de</strong> datos <strong>de</strong> más <strong>de</strong> 50,000 registros, <strong>com</strong>o es el caso <strong>de</strong> <strong>la</strong><br />
pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina. El objetivo prim<strong>ar</strong>io <strong>de</strong> estas bases <strong>de</strong> datos es, <strong>com</strong>o<br />
su nombre indica, almac<strong>en</strong><strong>ar</strong> gran<strong>de</strong>s cantida<strong>de</strong>s <strong>de</strong> datos organizados sigui<strong>en</strong>do un<br />
<strong>de</strong>terminado esquema o mo<strong>de</strong>lo <strong>de</strong> datos que facilite su almac<strong>en</strong>ami<strong>en</strong>to, recuperación y<br />
modificación, pero no así su posterior uso o análisis. En muchos casos los registros<br />
almac<strong>en</strong>ados son <strong>de</strong>masiados gran<strong>de</strong>s y <strong>com</strong>plejos <strong>com</strong>o p<strong>ar</strong>a analiz<strong>ar</strong> [Kant<strong>ar</strong>dzic,<br />
2003].<br />
Una posible herrami<strong>en</strong>ta a utiliz<strong>ar</strong> p<strong>ar</strong>a trat<strong>ar</strong> los gran<strong>de</strong>s volúm<strong>en</strong>es <strong>de</strong> información<br />
almac<strong>en</strong>ados <strong>en</strong> dichas bases <strong>de</strong> datos es <strong>la</strong> técnica <strong>de</strong> Minería <strong>de</strong> Datos. El termino<br />
Minería <strong>de</strong> Datos (Data Mining) pue<strong>de</strong> ser <strong>de</strong>finido <strong>com</strong>o <strong>la</strong> manera no trivial <strong>de</strong><br />
extracción <strong>de</strong> información no implícita, previam<strong>en</strong>te <strong>de</strong>sconocida y pot<strong>en</strong>cialm<strong>en</strong>te útil,<br />
<strong>de</strong> una base <strong>de</strong> datos [Frawley, et al, 1992]. Minería <strong>de</strong> datos repres<strong>en</strong>ta <strong>la</strong> posibilidad<br />
<strong>de</strong> busc<strong>ar</strong> exhaustivam<strong>en</strong>te <strong>de</strong>ntro <strong>de</strong> un gran volum<strong>en</strong> <strong>de</strong> datos, información y<br />
conocimi<strong>en</strong>to que pue<strong>de</strong>n result<strong>ar</strong> <strong>de</strong> mucho valor. Es consi<strong>de</strong>rada uno <strong>de</strong> los puntos<br />
más importantes <strong>de</strong> los sistemas expertos <strong>de</strong> base <strong>de</strong> datos, y uno <strong>de</strong> los <strong>de</strong>s<strong>ar</strong>rollos más<br />
prometedores <strong>en</strong> <strong>la</strong> industria <strong>de</strong>l manejo <strong>de</strong> <strong>la</strong> información [C<strong>ar</strong>tag<strong>en</strong>ova, 2005].<br />
En el m<strong>ar</strong>co internacional el uso <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos aplicado a <strong>la</strong> intelig<strong>en</strong>cia<br />
criminal ha t<strong>en</strong>ido un gran crecimi<strong>en</strong>to <strong>en</strong> los últimos años <strong>en</strong> EEUU [Ch<strong>en</strong> et al, 2004].<br />
A modo <strong>de</strong> ejemplo, ha sido m<strong>en</strong>cionado <strong>com</strong>o el método mediante el cual<br />
supuestam<strong>en</strong>te <strong>la</strong>s fuerzas <strong>ar</strong>madas estadouni<strong>de</strong>nses habrían i<strong>de</strong>ntificado al lí<strong>de</strong>r <strong>de</strong> los<br />
ataques <strong>de</strong>l 11 <strong>de</strong> Septiembre <strong>de</strong> 2001, Mohamed Atta, junto a otros 3 terroristas <strong>com</strong>o<br />
posibles miembros <strong>de</strong> una célu<strong>la</strong> <strong>de</strong> Al Qaeda operando <strong>en</strong> ese país más <strong>de</strong> un año<br />
previo a los ataques.<br />
En este contexto, el objetivo principal <strong>de</strong> este trabajo es estudi<strong>ar</strong> <strong>la</strong> factibilidad y valor<br />
agregado <strong>de</strong> aplic<strong>ar</strong> técnicas <strong>de</strong> minería <strong>de</strong> datos p<strong>ar</strong>a c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción<br />
ubicada <strong>en</strong> <strong>la</strong>s cárceles <strong>ar</strong>g<strong>en</strong>tinas, obt<strong>en</strong>i<strong>en</strong>do patrones <strong>de</strong> <strong>com</strong>portami<strong>en</strong>tos y<br />
conductas, a fines <strong>de</strong> po<strong>de</strong>r extraer conclusiones p<strong>ar</strong>a <strong>la</strong> prev<strong>en</strong>ción <strong>de</strong> <strong>de</strong>litos.<br />
2<br />
Patricio Gutiérrez Rüegg Introducción
1.2 MOTIVACIONES Y DESTINATARIOS<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Luego <strong>de</strong> leer proyectos <strong>de</strong> colegas re<strong>la</strong>cionados con <strong>la</strong> minería <strong>de</strong> datos e información<br />
criminal [Perversi, 2007; Val<strong>en</strong>ga, 2007], me p<strong>ar</strong>eció muy interesante po<strong>de</strong>r seguir<br />
dicha línea <strong>de</strong> investigación pero haci<strong>en</strong>do foco no <strong>en</strong> los <strong>de</strong>litos propiam<strong>en</strong>te dichos<br />
sino precisam<strong>en</strong>te <strong>en</strong> <strong>la</strong>s personas que <strong>com</strong>et<strong>en</strong> dichos hechos <strong>de</strong>lictuosos. Se espera<br />
que mediante el pres<strong>en</strong>te trabajo se pueda contribuir p<strong>ar</strong>a llev<strong>ar</strong> a cabo t<strong>ar</strong>eas y<br />
activida<strong>de</strong>s <strong>en</strong> materia <strong>de</strong> política criminal, que logr<strong>en</strong> disminuir hechos <strong>de</strong>lictivos a<br />
través <strong>la</strong> pres<strong>en</strong>tación, <strong>de</strong>scripción y aplicación <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos <strong>com</strong>o herrami<strong>en</strong>ta<br />
que ayuda al análisis y tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información criminal.<br />
Es importante <strong>de</strong>stac<strong>ar</strong>, que no se <strong>en</strong>contr<strong>ar</strong>on registros sobre trabajos o proyectos <strong>en</strong><br />
don<strong>de</strong> se aplic<strong>ar</strong>an herrami<strong>en</strong>tas <strong>com</strong>o <strong>la</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones c<strong>ar</strong>ce<strong>la</strong>rias, lo<br />
cual repres<strong>en</strong>ta una motivación extra.<br />
El pres<strong>en</strong>te informe se <strong>en</strong>cu<strong>en</strong>tra dirigido a aquel<strong>la</strong>s personas involucradas <strong>en</strong> <strong>la</strong><br />
creación <strong>de</strong> política criminal <strong>com</strong>o a los interesados <strong>en</strong> conocer <strong>la</strong> utilidad <strong>de</strong> esta<br />
técnica p<strong>ar</strong>a <strong>la</strong> mo<strong>de</strong>rnización <strong>de</strong> <strong>la</strong>s prácticas <strong>de</strong> información criminal <strong>en</strong> Arg<strong>en</strong>tina.<br />
1.3 COMPOSICIÓN DEL TRABAJO<br />
El pres<strong>en</strong>te trabajo se <strong>en</strong>cu<strong>en</strong>tra estructurado <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera.<br />
Capitulo 1: Introducción.<br />
Se da una breve <strong>de</strong>scripción a <strong>la</strong>s razones que llev<strong>ar</strong>on a <strong>la</strong> realización <strong>de</strong>l proyecto<br />
final. A su vez se nombran <strong>la</strong>s motivaciones, <strong>de</strong>stinat<strong>ar</strong>ios y <strong>com</strong>o se organiza el<br />
trabajo.<br />
Capitulo 2: Estado <strong>de</strong> <strong>la</strong> cuestión.<br />
Comi<strong>en</strong>za con una introducción a <strong>la</strong> minería <strong>de</strong> datos (MD) y <strong>la</strong> metodología elegida<br />
p<strong>ar</strong>a llev<strong>ar</strong> a cabo el proyecto <strong>de</strong> MD. Continúa con aplicaciones <strong>de</strong> <strong>la</strong> MD <strong>en</strong><br />
información criminal, tanto a nivel nacional <strong>com</strong>o internacional. Luego sigue con <strong>la</strong><br />
<strong>de</strong>scripción <strong>de</strong> <strong>la</strong> información criminal exist<strong>en</strong>te <strong>en</strong> Arg<strong>en</strong>tina. Finalm<strong>en</strong>te, se da un<br />
diagnóstico <strong>de</strong> <strong>la</strong> situación c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina, mostrando todos los problemas<br />
exist<strong>en</strong>tes <strong>en</strong> dicho régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io.<br />
Capitulo 3: Descripción <strong>de</strong>l problema.<br />
Pres<strong>en</strong>ta al problema que se quiere resolver y los principales motivos <strong>de</strong> su elección.<br />
Introducción Patricio Gutiérrez Rüegg 3
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Capitulo 4: Solución<br />
En el pres<strong>en</strong>te capitulo se propone una solución al problema p<strong>la</strong>nteado <strong>en</strong> el capitulo 3.<br />
Se <strong>de</strong>ci<strong>de</strong> aplic<strong>ar</strong> <strong>la</strong> metodología CRISP-DM al trabajo, pasando por todas sus fases.<br />
Capitulo 5: Conclusiones y Reflexiones.<br />
Se pres<strong>en</strong>tan <strong>la</strong>s principales conclusiones <strong>de</strong>l proyecto. Se escrib<strong>en</strong> reflexiones sobre el<br />
tema investigado y el conocimi<strong>en</strong>to adquirido.<br />
Capitulo 6: Futuras líneas <strong>de</strong> investigación.<br />
El pres<strong>en</strong>te capítulo contemp<strong>la</strong> el abordaje <strong>de</strong> <strong>la</strong>s futuras líneas <strong>de</strong> investigación<br />
re<strong>la</strong>cionadas al proyecto <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do.<br />
Capitulo 7: Aportes realizados.<br />
Se m<strong>en</strong>cionan los aportes realizados por el proyecto realizado.<br />
Capitulo 8: Refer<strong>en</strong>cias.<br />
Bibliografía utilizada p<strong>ar</strong>a <strong>la</strong> e<strong>la</strong>boración <strong>de</strong> <strong>la</strong> tesis.<br />
Capitulo 9: Anexos.<br />
4<br />
Patricio Gutiérrez Rüegg Introducción
2. ESTADO DE LA CUESTIÓN<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
2.1 INTRODUCCIÓN A LA MINERÍA DE DATOS<br />
El termino minería <strong>de</strong> datos es una etapa <strong>de</strong>ntro <strong>de</strong> un proceso mayor l<strong>la</strong>mado<br />
Extracción <strong>de</strong> Conocimi<strong>en</strong>to <strong>en</strong> Bases <strong>de</strong> Datos (Knowledge Discovery in Databases o<br />
KDD) [Figura 2.1], aunque ambos términos se usan <strong>de</strong> manera indistinta. Lo que <strong>en</strong><br />
verdad hace <strong>la</strong> minería <strong>de</strong> datos es reunir <strong>la</strong>s v<strong>en</strong>tajas <strong>de</strong> v<strong>ar</strong>ias áreas <strong>com</strong>o <strong>la</strong><br />
estadística, <strong>la</strong> intelig<strong>en</strong>cia <strong>ar</strong>tificial, <strong>la</strong> <strong>com</strong>putación gráfica, <strong>la</strong>s bases <strong>de</strong> datos y el<br />
procesami<strong>en</strong>to masivo, principalm<strong>en</strong>te usando <strong>com</strong>o materia prima <strong>la</strong>s bases <strong>de</strong> datos.<br />
Una <strong>de</strong>finición tradicional [Fayyad et al, 1996] podría ser <strong>la</strong> sigui<strong>en</strong>te: “Un proceso no<br />
trivial <strong>de</strong> i<strong>de</strong>ntificación válida, novedosa, pot<strong>en</strong>cialm<strong>en</strong>te útil y <strong>en</strong>t<strong>en</strong>dible, <strong>de</strong> patrones<br />
<strong>com</strong>pr<strong>en</strong>sibles que se <strong>en</strong>cu<strong>en</strong>tran ocultos <strong>en</strong> los datos”<br />
Figura 2.1. Proceso <strong>de</strong> Knowledge Discovery in Databases.<br />
El creci<strong>en</strong>te volum<strong>en</strong> <strong>de</strong> datos <strong>en</strong> todas <strong>la</strong>s áreas <strong>de</strong> aplicación humana <strong>de</strong>manda nuevas<br />
y po<strong>de</strong>rosas técnicas <strong>de</strong> transformación <strong>de</strong> los datos <strong>en</strong> conocimi<strong>en</strong>to útil. Se pue<strong>de</strong><br />
<strong>de</strong>cir que <strong>la</strong> minería <strong>de</strong> datos es un avance <strong>en</strong> dicha cuestión. Busca g<strong>en</strong>er<strong>ar</strong> información<br />
simi<strong>la</strong>r a <strong>la</strong> que podría producir un experto humano, que a<strong>de</strong>más satisfaga el Principio<br />
<strong>de</strong> Compr<strong>en</strong>sibilidad (utiliz<strong>ar</strong> l<strong>en</strong>guaje a<strong>de</strong>cuado a <strong>la</strong> temática <strong>de</strong>l trabajo) [Britos et al,<br />
2005].<br />
El objetivo <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos es <strong>de</strong>scubrir <strong>com</strong>portami<strong>en</strong>tos interesantes <strong>com</strong>o lo<br />
son patrones, asociaciones, cambios, anomalías y estructuras significativas a p<strong>ar</strong>tir <strong>de</strong><br />
gran<strong>de</strong>s cantida<strong>de</strong>s <strong>de</strong> datos almac<strong>en</strong>ados <strong>en</strong> bases <strong>de</strong> datos, data w<strong>ar</strong>ehouses o<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 5
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
cualquier otro medio <strong>de</strong> almac<strong>en</strong>ami<strong>en</strong>to <strong>de</strong> información [Britos et Al, 2005].<br />
La minería <strong>de</strong> datos produce, mediante diversas técnicas y algoritmos, cinco tipos <strong>de</strong><br />
información:<br />
6<br />
• Clustering o agrupami<strong>en</strong>to<br />
• Inducciones o c<strong>la</strong>sificaciones<br />
• Asociaciones<br />
• Secu<strong>en</strong>cias<br />
• Pronósticos<br />
2.1.1 Algoritmos <strong>de</strong> Minería <strong>de</strong> Datos<br />
Se <strong>de</strong>fine algoritmo <strong>de</strong> minería <strong>de</strong> datos [The<strong>ar</strong>ling, 2007] al mecanismo utilizado p<strong>ar</strong>a<br />
<strong>la</strong> creación <strong>de</strong> mo<strong>de</strong>los. P<strong>ar</strong>a cre<strong>ar</strong> un mo<strong>de</strong>lo, un algoritmo analiza primero un conjunto<br />
<strong>de</strong> datos, buscando patrones y t<strong>en</strong><strong>de</strong>ncias específicos. Después, el algoritmo utiliza los<br />
resultados <strong>de</strong> este análisis p<strong>ar</strong>a <strong>de</strong>finir los p<strong>ar</strong>ámetros <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos.<br />
Los algoritmos <strong>de</strong> minería <strong>de</strong> datos [Weiss & Indurkhya, 1998] se c<strong>la</strong>sifican <strong>en</strong> dos<br />
gran<strong>de</strong>s categorías:<br />
• Supervisados (o predictivos): Predic<strong>en</strong> el valor <strong>de</strong> un atributo (etiqueta) <strong>de</strong> un<br />
conjunto <strong>de</strong> datos, conocidos otros atributos (atributos <strong>de</strong>scriptivos). A p<strong>ar</strong>tir <strong>de</strong><br />
datos cuya etiqueta se conoce se induce una re<strong>la</strong>ción <strong>en</strong>tre dicha etiqueta y otra<br />
serie <strong>de</strong> atributos. Esas re<strong>la</strong>ciones sirv<strong>en</strong> p<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> predicción <strong>en</strong> datos<br />
cuya etiqueta es <strong>de</strong>sconocida. Se <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong> <strong>en</strong> dos fases: Entr<strong>en</strong>ami<strong>en</strong>to y<br />
prueba.<br />
• No Supervisados (o <strong>de</strong> <strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> conocimi<strong>en</strong>to): Cuando una aplicación<br />
no es lo sufici<strong>en</strong>tem<strong>en</strong>te madura no ti<strong>en</strong>e el pot<strong>en</strong>cial neces<strong>ar</strong>io p<strong>ar</strong>a una<br />
solución predictiva. En ese caso hay que utiliz<strong>ar</strong> métodos no supervisados o <strong>de</strong><br />
<strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> conocimi<strong>en</strong>to, los cuales <strong>de</strong>scubr<strong>en</strong> <strong>com</strong>portami<strong>en</strong>tos,<br />
patrones y t<strong>en</strong><strong>de</strong>ncias <strong>en</strong> los datos actuales (no utilizan información histórica). El<br />
<strong>de</strong>scubrimi<strong>en</strong>to sirve p<strong>ar</strong>a llev<strong>ar</strong> a cabo acciones y obt<strong>en</strong>er un b<strong>en</strong>eficio <strong>de</strong> el<strong>la</strong>s.<br />
En <strong>la</strong> tab<strong>la</strong> 2.1 se pue<strong>de</strong>n observ<strong>ar</strong> algunas <strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos <strong>de</strong> ambas<br />
categorías, supervisados y no supervisados.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Supervisados No Supervisados<br />
Arboles <strong>de</strong> Decisión Detección <strong>de</strong> <strong>de</strong>svíos<br />
Inducción Neuronal Segm<strong>en</strong>tación<br />
Regresión Agrupami<strong>en</strong>to ("clustering")<br />
Series Temporales Reg<strong>la</strong>s <strong>de</strong> Asociación<br />
Patrones Secu<strong>en</strong>ciales<br />
Tab<strong>la</strong> 2.1. C<strong>la</strong>sificación <strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos.<br />
2.1.1.1 Algoritmos <strong>de</strong> Clustering o Agrupami<strong>en</strong>to<br />
El clustering consiste <strong>en</strong> agrup<strong>ar</strong> un conjunto <strong>de</strong> datos sin t<strong>en</strong>er c<strong>la</strong>ses pre<strong>de</strong>finidas,<br />
basándose <strong>en</strong> <strong>la</strong> similitud <strong>de</strong> los valores <strong>de</strong> los atributos <strong>de</strong> los distintos datos. Este tipo<br />
<strong>de</strong> algoritmo, tal <strong>com</strong>o lo muestra <strong>la</strong> tab<strong>la</strong> 2.1, se realiza <strong>en</strong> forma no supervisada, ya<br />
que no se sab<strong>en</strong> <strong>de</strong> antemano <strong>la</strong>s c<strong>la</strong>ses <strong>de</strong>l conjunto <strong>de</strong> datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to. El<br />
clustering i<strong>de</strong>ntifica regiones <strong>de</strong>nsam<strong>en</strong>te pob<strong>la</strong>das, <strong>de</strong> acuerdo a alguna medida <strong>de</strong><br />
distancia, <strong>en</strong> un gran conjunto <strong>de</strong> datos multidim<strong>en</strong>sional [Ch<strong>en</strong> & Han, 1996]. Se basa<br />
<strong>en</strong> maximiz<strong>ar</strong> <strong>la</strong> similitud <strong>de</strong> <strong>la</strong>s instancias <strong>en</strong> cada cluster y minimiz<strong>ar</strong> <strong>la</strong> similitud <strong>en</strong>tre<br />
clusters [Han & Kamber, 2001].<br />
El análisis <strong>de</strong> clusters [C<strong>ar</strong>tag<strong>en</strong>ova, 2005] es utilizado <strong>en</strong> numerosas aplicaciones tales<br />
<strong>com</strong>o reconocimi<strong>en</strong>to <strong>de</strong> patrones, análisis <strong>de</strong> datos, procesami<strong>en</strong>to <strong>de</strong> imág<strong>en</strong>es e<br />
investigaciones <strong>de</strong> mercado. Como función <strong>de</strong> <strong>la</strong> MD, el análisis <strong>de</strong> clusters pue<strong>de</strong> ser<br />
utilizado <strong>com</strong>o una herrami<strong>en</strong>ta in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>te p<strong>ar</strong>a obt<strong>en</strong>er una visión <strong>de</strong> <strong>la</strong> distribución<br />
<strong>de</strong> los datos, p<strong>ar</strong>a observ<strong>ar</strong> <strong>la</strong>s c<strong>ar</strong>acterísticas <strong>de</strong> cada cluster y <strong>en</strong>foc<strong>ar</strong> un análisis más<br />
exhaustivo hacia un grupo o cluster <strong>de</strong>terminado. Alternativam<strong>en</strong>te, pue<strong>de</strong> servir <strong>com</strong>o<br />
un paso <strong>de</strong>l preprocesami<strong>en</strong>to <strong>de</strong> los datos p<strong>ar</strong>a otros algoritmos, <strong>com</strong>o por ejemplo, el<br />
<strong>de</strong> c<strong>la</strong>sificaciones <strong>en</strong> el cual se trabaj<strong>ar</strong>ía luego sobre los clusters originados.<br />
El clustering <strong>de</strong> datos esta <strong>en</strong> continuo <strong>de</strong>s<strong>ar</strong>rollo, y <strong>de</strong>bido a los gran<strong>de</strong>s volúm<strong>en</strong>es <strong>de</strong><br />
datos almac<strong>en</strong>ados <strong>en</strong> <strong>la</strong>s bases <strong>de</strong> datos, el análisis <strong>de</strong> clusters se ha vuelto muy<br />
importante <strong>en</strong> los estudios <strong>de</strong> MD.<br />
2.1.1.1.1 SOM<br />
Una <strong>de</strong> <strong>la</strong>s técnicas más utilizadas p<strong>ar</strong>a realiz<strong>ar</strong> clustering es <strong>la</strong> <strong>de</strong> SOM (Self<br />
Organizing Maps). Este mo<strong>de</strong>lo no supervisado <strong>de</strong> red neuronal fue creado por Teuvo<br />
Kohon<strong>en</strong> <strong>en</strong> 1982, basándose <strong>en</strong> el funcionami<strong>en</strong>to <strong>de</strong> <strong>la</strong>s neuronas biológicas. Vale<br />
record<strong>ar</strong>, que <strong>la</strong>s re<strong>de</strong>s neuronales son mo<strong>de</strong>los que int<strong>en</strong>tan reproducir el<br />
<strong>com</strong>portami<strong>en</strong>to <strong>de</strong>l cerebro. Del mismo modo que aquél, realiza una simplificación,<br />
averiguando cuales son los elem<strong>en</strong>tos relevantes <strong>de</strong>l sistema. El objetivo <strong>de</strong> Kohon<strong>en</strong><br />
era <strong>de</strong>mostr<strong>ar</strong> que un estímulo externo por sí solo, suponi<strong>en</strong>do una estructura propia y<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 7
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
una <strong>de</strong>scripción funcional <strong>de</strong>l <strong>com</strong>portami<strong>en</strong>to <strong>de</strong> <strong>la</strong> red, era sufici<strong>en</strong>te p<strong>ar</strong>a forz<strong>ar</strong> <strong>la</strong><br />
formación <strong>de</strong> los mapas.<br />
El mo<strong>de</strong>lo ti<strong>en</strong>e dos v<strong>ar</strong>iantes, LVQ (Le<strong>ar</strong>ning Vector Quantization) y TPM (Topology<br />
Preserving Map) o SOM (Self Organizing Map). Ambas se basan <strong>en</strong> el principio <strong>de</strong><br />
formación <strong>de</strong> mapas topológicos p<strong>ar</strong>a establecer c<strong>ar</strong>acterísticas <strong>com</strong>unes <strong>en</strong>tre <strong>la</strong>s<br />
informaciones (vectores) <strong>de</strong> <strong>en</strong>trada a <strong>la</strong> red, aunque difier<strong>en</strong> <strong>en</strong> <strong>la</strong>s dim<strong>en</strong>siones <strong>de</strong><br />
éstos, si<strong>en</strong>do <strong>de</strong> una so<strong>la</strong> dim<strong>en</strong>sión <strong>en</strong> el caso <strong>de</strong> LVQ y bidim<strong>en</strong>sional e incluso<br />
tridim<strong>en</strong>sional <strong>en</strong> <strong>la</strong> red SOM o TPM.<br />
El mo<strong>de</strong>lo pres<strong>en</strong>ta dos capas con N neuronas <strong>de</strong> <strong>en</strong>trada y M <strong>de</strong> salida [Figura 2.2].<br />
Cada una <strong>de</strong> <strong>la</strong>s N neuronas <strong>de</strong> <strong>en</strong>trada se conecta a <strong>la</strong>s M <strong>de</strong> salida a través <strong>de</strong><br />
conexiones hacia <strong>de</strong><strong>la</strong>nte (feedforw<strong>ar</strong>d). Entre <strong>la</strong>s neuronas <strong>de</strong> <strong>la</strong> capa <strong>de</strong> salida, exist<strong>en</strong><br />
conexiones <strong>la</strong>terales <strong>de</strong> inhibición (peso negativo) implícitas, a pes<strong>ar</strong> <strong>de</strong> no est<strong>ar</strong><br />
conectadas, cada una <strong>de</strong> estas neuronas va a t<strong>en</strong>er cierta influ<strong>en</strong>cia sobre sus vecinas. El<br />
valor que se asigne a los pesos <strong>de</strong> <strong>la</strong>s conexiones feedforw<strong>ar</strong>d <strong>en</strong>tre <strong>la</strong>s capas <strong>de</strong> <strong>en</strong>trada<br />
y salida (Wij) durante el proceso <strong>de</strong> apr<strong>en</strong>dizaje <strong>de</strong> <strong>la</strong> red va a <strong>de</strong>p<strong>en</strong><strong>de</strong>r precisam<strong>en</strong>te <strong>de</strong><br />
esta interacción <strong>la</strong>teral. La influ<strong>en</strong>cia que cada neurona ejerce sobre <strong>la</strong>s <strong>de</strong>más es<br />
función <strong>de</strong> <strong>la</strong> distancia <strong>en</strong>tre el<strong>la</strong>s, si<strong>en</strong>do muy pequeñas cuando están muy alejadas.<br />
8<br />
Figura 2.2. Estructura <strong>de</strong> una red <strong>de</strong> Kohon<strong>en</strong>.<br />
Los puntos que están cerca unos <strong>de</strong> los otros <strong>en</strong> el espacio original <strong>de</strong> <strong>en</strong>trada son<br />
“mapeados” a neuronas cercanas <strong>en</strong> SOM. Las neuronas usualm<strong>en</strong>te forman un mapa<br />
bidim<strong>en</strong>sional, por lo que el mapeo transforma un problema <strong>de</strong> muchas dim<strong>en</strong>siones <strong>en</strong><br />
el espacio, a un p<strong>la</strong>no.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
2.1.1.1.2 K-Means<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Otro <strong>de</strong> los algoritmos más utilizados cuando se hab<strong>la</strong> <strong>de</strong> clustering es el K-Medias o<br />
K-Means. Se trata <strong>de</strong> un método <strong>de</strong> agrupami<strong>en</strong>to por vecindad <strong>en</strong> el que se p<strong>ar</strong>te <strong>de</strong> un<br />
número <strong>de</strong>terminado <strong>de</strong> prototipos y <strong>de</strong> un conjunto <strong>de</strong> ejemplos a agrup<strong>ar</strong> sin etiquet<strong>ar</strong>.<br />
Es el método más popu<strong>la</strong>r <strong>de</strong> los métodos <strong>de</strong> agrupami<strong>en</strong>to “por p<strong>ar</strong>tición”.<br />
La i<strong>de</strong>a <strong>de</strong> K-Means es situ<strong>ar</strong> a los prototipos o c<strong>en</strong>tros <strong>en</strong> el espacio, <strong>de</strong> forma que los<br />
datos pert<strong>en</strong>eci<strong>en</strong>tes al mismo prototipo t<strong>en</strong>gan c<strong>ar</strong>acterísticas simi<strong>la</strong>res [Moody &<br />
Drak<strong>en</strong>, 1989]. Todo ejemplo nuevo, una vez que los prototipos han sido correctam<strong>en</strong>te<br />
situados, es <strong>com</strong>p<strong>ar</strong>ado con estos y asociado a aquel que sea el más próximo, <strong>en</strong> los<br />
términos <strong>de</strong> una distancia previam<strong>en</strong>te elegida. Normalm<strong>en</strong>te, se utiliza <strong>la</strong> distancia<br />
euclidiana.<br />
La etapa <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to <strong>de</strong>l método pue<strong>de</strong> ser l<strong>en</strong>ta <strong>de</strong>p<strong>en</strong>di<strong>en</strong>do <strong>de</strong>l número <strong>de</strong><br />
puntos a c<strong>la</strong>sific<strong>ar</strong> y <strong>de</strong> <strong>la</strong> dim<strong>en</strong>sión <strong>de</strong>l problema. Una vez superada esta fase, <strong>la</strong><br />
c<strong>la</strong>sificación <strong>de</strong> nuevos datos se torna rápida, <strong>de</strong>bido a que <strong>la</strong> <strong>com</strong>p<strong>ar</strong>ación <strong>de</strong> distancias<br />
es solo con los prototipos.<br />
El objetivo que se busca mediante el algoritmo K-Means es minimiz<strong>ar</strong> <strong>la</strong> v<strong>ar</strong>ianza total<br />
intra-grupo o <strong>la</strong> función <strong>de</strong> error cuadrático [Figura 2.3]:<br />
K<br />
∑∑<br />
V = χ − μ<br />
i= 0 j∈Si<br />
Figura 2.3. Error cuadrático K-Means<br />
Don<strong>de</strong> exist<strong>en</strong> K grupos Si i=1,2,…, k y μi es el punto medio o c<strong>en</strong>troi<strong>de</strong> <strong>de</strong> todos los<br />
puntos Xj Si.<br />
K-Means <strong>com</strong>i<strong>en</strong>za p<strong>ar</strong>ticionando los datos <strong>en</strong> k subconjuntos no vacíos, aleatoriam<strong>en</strong>te<br />
o usando alguna heurística. Luego calcu<strong>la</strong> el c<strong>en</strong>troi<strong>de</strong> <strong>de</strong> cada p<strong>ar</strong>tición <strong>com</strong>o el punto<br />
medio <strong>de</strong>l cluster y asigna cada dato al cluster cuyo c<strong>en</strong>troi<strong>de</strong> sea el más próximo.<br />
Luego los c<strong>en</strong>troi<strong>de</strong>s son recalcu<strong>la</strong>dos p<strong>ar</strong>a los grupos nuevos y el algoritmo se repite<br />
hasta <strong>la</strong> converg<strong>en</strong>cia, <strong>la</strong> cual es obt<strong>en</strong>ida cuando no haya más datos que cambi<strong>en</strong> <strong>de</strong><br />
grupo <strong>de</strong> una iteración a otra.<br />
P<strong>ar</strong>a calcu<strong>la</strong>r el c<strong>en</strong>troi<strong>de</strong> más cercano a cada punto se <strong>de</strong>be utiliz<strong>ar</strong> una función <strong>de</strong><br />
distancia. P<strong>ar</strong>a datos reales se suele utiliz<strong>ar</strong> <strong>la</strong> distancia euclidiana. P<strong>ar</strong>a datos<br />
categóricos se <strong>de</strong>be establecer una función específica <strong>de</strong> distancia p<strong>ar</strong>a ese conjunto <strong>de</strong><br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 9<br />
j<br />
i<br />
2
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
datos. Algunas <strong>de</strong> <strong>la</strong>s opciones son utiliz<strong>ar</strong> una matriz <strong>de</strong> distancias pre<strong>de</strong>finidas o una<br />
función heurística.<br />
Dado k, el algoritmo K-Means se implem<strong>en</strong>ta <strong>en</strong> los sigui<strong>en</strong>tes 4 pasos [Ale, 2005]:<br />
10<br />
1. P<strong>ar</strong>ticion<strong>ar</strong> los objetos <strong>en</strong> k subconjuntos no vacíos.<br />
2. Comput<strong>ar</strong> los c<strong>en</strong>troi<strong>de</strong>s <strong>de</strong> los clusters <strong>de</strong> <strong>la</strong> p<strong>ar</strong>tición corri<strong>en</strong>te. El c<strong>en</strong>troi<strong>de</strong> es<br />
el c<strong>en</strong>tro (punto medio) <strong>de</strong>l cluster.<br />
3. Asign<strong>ar</strong> cada objeto al cluster cuyo c<strong>en</strong>troi<strong>de</strong> sea más cercano.<br />
4. Volver al paso 2, y p<strong>ar</strong><strong>ar</strong> cuando no existan más reasignaciones.<br />
2.1.1.2 Algoritmos <strong>de</strong> C<strong>la</strong>sificación: Inducción<br />
Los algoritmos <strong>de</strong> c<strong>la</strong>sificación se utilizan p<strong>ar</strong>a c<strong>la</strong>sific<strong>ar</strong> un conjunto <strong>de</strong> datos basado<br />
<strong>en</strong> los valores <strong>de</strong> sus atributos [Serv<strong>en</strong>te & G<strong>ar</strong>cía-M<strong>ar</strong>tínez, 2002].<br />
Este proceso <strong>en</strong>cu<strong>en</strong>tra <strong>la</strong>s propieda<strong>de</strong>s <strong>com</strong>unes <strong>en</strong>tre un conjunto <strong>de</strong> objetos y los<br />
c<strong>la</strong>sifica <strong>en</strong> difer<strong>en</strong>tes c<strong>la</strong>ses <strong>de</strong> acuerdo al mo<strong>de</strong>lo utilizado. P<strong>ar</strong>a construir el mismo se<br />
utiliza un conjunto <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to, <strong>en</strong> que cada instancia consiste <strong>en</strong> un conjunto <strong>de</strong><br />
atributos y el valor <strong>de</strong> <strong>la</strong> c<strong>la</strong>se a <strong>la</strong> cual pert<strong>en</strong>ece. El objetivo <strong>de</strong> <strong>la</strong> c<strong>la</strong>sificación es<br />
analiz<strong>ar</strong> los datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to y, mediante un método supervisado, <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r una<br />
<strong>de</strong>scripción o un mo<strong>de</strong>lo p<strong>ar</strong>a cada c<strong>la</strong>se utilizando <strong>la</strong>s c<strong>ar</strong>acterísticas disponibles <strong>en</strong> los<br />
datos. Esta <strong>de</strong>scripción o mo<strong>de</strong>lo es utilizado p<strong>ar</strong>a c<strong>la</strong>sific<strong>ar</strong> otras instancias, cuya c<strong>la</strong>se<br />
es <strong>de</strong>sconocida. El método se conoce <strong>com</strong>o supervisado <strong>de</strong>bido a que, p<strong>ar</strong>a el conjunto<br />
<strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to, se conoce <strong>la</strong> c<strong>la</strong>se a <strong>la</strong> cual pert<strong>en</strong>ece cada instancia y se lo indica al<br />
mo<strong>de</strong>lo si <strong>la</strong> c<strong>la</strong>sificación que realiza es correcta [Ch<strong>en</strong> et al,1996].<br />
Los algoritmos más utilizados p<strong>ar</strong>a <strong>la</strong> c<strong>la</strong>sificación son los algoritmos <strong>de</strong> inducción.<br />
Aún cuando exist<strong>en</strong> v<strong>ar</strong>ios <strong>en</strong>foques p<strong>ar</strong>a los algoritmos <strong>de</strong> inducción, se trabaj<strong>ar</strong>á con<br />
aquellos que g<strong>en</strong>eran árboles <strong>de</strong> <strong>de</strong>cisión conocida <strong>com</strong>o <strong>la</strong> familia TDIT (Top Down<br />
Induction Trees). Cada hoja <strong>de</strong>l árbol posee un nombre <strong>de</strong> c<strong>la</strong>se, cada nodo interior<br />
especifica una evaluación <strong>en</strong> un atributo y cada rama repres<strong>en</strong>ta un resultado <strong>de</strong> esa<br />
evaluación. La calidad <strong>de</strong> un árbol <strong>de</strong>p<strong>en</strong><strong>de</strong> <strong>de</strong> <strong>la</strong> precisión <strong>de</strong> <strong>la</strong> c<strong>la</strong>sificación y <strong>de</strong>l<br />
tamaño <strong>de</strong>l árbol. En p<strong>ar</strong>ticu<strong>la</strong>r se h<strong>ar</strong>á hincapié <strong>en</strong> los algoritmos ID3, C4.5 y CHAID.<br />
2.1.1.2.1 ID3<br />
El ID3 (Iterative Dichotomiser 3) <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do <strong>en</strong> los años och<strong>en</strong>ta por Ross Quin<strong>la</strong>n, es<br />
un sistema <strong>de</strong> apr<strong>en</strong>dizaje supervisado que construye árboles <strong>de</strong> <strong>de</strong>cisión a p<strong>ar</strong>tir <strong>de</strong> un<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
conjunto <strong>de</strong> ejemplos [Serv<strong>en</strong>te & G<strong>ar</strong>cía M<strong>ar</strong>tínez, 2002]. Estos ejemplos están<br />
constituidos por un conjunto <strong>de</strong> atributos y un c<strong>la</strong>sificador o c<strong>la</strong>se. Los dominios <strong>de</strong> los<br />
atributos y <strong>de</strong> <strong>la</strong>s c<strong>la</strong>ses <strong>de</strong>b<strong>en</strong> ser discretos. A<strong>de</strong>más, <strong>la</strong>s c<strong>la</strong>ses <strong>de</strong>b<strong>en</strong> ser disjuntas. Las<br />
primeras versiones <strong>de</strong>l ID3 g<strong>en</strong>eraban <strong>de</strong>scripciones únicam<strong>en</strong>te p<strong>ar</strong>a dos c<strong>la</strong>ses, <strong>com</strong>o<br />
ser positiva y negativa. En <strong>la</strong>s versiones posteriores, se eliminó esta restricción, pero se<br />
mantuvo <strong>la</strong> restricción <strong>de</strong> <strong>la</strong>s c<strong>la</strong>ses disjuntas.<br />
El ID3 g<strong>en</strong>era <strong>de</strong>scripciones que c<strong>la</strong>sifican a cada uno <strong>de</strong> los ejemplos <strong>de</strong>l conjunto <strong>de</strong><br />
<strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to. El nivel <strong>de</strong> precisión <strong>en</strong> <strong>la</strong> c<strong>la</strong>sificación g<strong>en</strong>eralm<strong>en</strong>te es alto. Sin<br />
emb<strong>ar</strong>go, el sistema ti<strong>en</strong>e algunas <strong>de</strong>sv<strong>en</strong>tajas. Los atributos y c<strong>la</strong>ses <strong>de</strong>b<strong>en</strong> ser discretos<br />
y no pue<strong>de</strong>n ser continuos. A<strong>de</strong>más, aún cuando se cu<strong>en</strong>ta con conocimi<strong>en</strong>tos <strong>de</strong><br />
dominio o conocimi<strong>en</strong>tos previos, el sistema no hace uso <strong>de</strong> ellos. A veces, lo árboles<br />
son <strong>de</strong>masiado frondosos, lo cual conlleva una difícil interpretación. En esos casos<br />
pue<strong>de</strong>n ser transformados <strong>en</strong> reg<strong>la</strong>s <strong>de</strong> <strong>de</strong>cisión p<strong>ar</strong>a hacerlos más <strong>com</strong>pr<strong>en</strong>sibles.<br />
Hay v<strong>ar</strong>ias razones p<strong>ar</strong>a pod<strong>ar</strong> los árboles g<strong>en</strong>erados por los métodos <strong>de</strong> TDIDT: <strong>la</strong><br />
sobreg<strong>en</strong>eralización, evaluación <strong>de</strong> atributos poco importantes o significativos, y el gran<br />
tamaño <strong>de</strong>l árbol. Si el árbol es <strong>de</strong>masiado gran<strong>de</strong>, se dificulta <strong>la</strong> interpretación, con lo<br />
cual hubiera sido lo mismo utiliz<strong>ar</strong> un método <strong>de</strong> caja negra.<br />
Exist<strong>en</strong> dos <strong>en</strong>foques p<strong>ar</strong>a pod<strong>ar</strong> árboles [Ochoa, 2004]:<br />
• Pre-poda (pre-prunning): <strong>de</strong>ti<strong>en</strong>e el crecimi<strong>en</strong>to <strong>de</strong>l árbol cuando <strong>la</strong> ganancia <strong>de</strong><br />
información producida al dividir un conjunto no supera un umbral <strong>de</strong>terminado<br />
• Post-poda (post-prunning): se aplica sobre algunas ramas una vez que se ha<br />
terminado.<br />
2.1.1.2.2 C4.5<br />
El C4.5 [Quin<strong>la</strong>n, 1993] es una ext<strong>en</strong>sión <strong>de</strong>l ID3 que acaba con muchas <strong>de</strong> sus<br />
limitaciones. Por ejemplo, permite trabaj<strong>ar</strong> con valores continuos p<strong>ar</strong>a los atributos,<br />
sep<strong>ar</strong>ando los posibles resultados <strong>en</strong> dos ramas: una p<strong>ar</strong>a aquellos AN. A<strong>de</strong>más, los árboles son m<strong>en</strong>os frondosos porque cada hoja no cubre una c<strong>la</strong>se <strong>en</strong><br />
p<strong>ar</strong>ticu<strong>la</strong>r sino una distribución <strong>de</strong> c<strong>la</strong>ses, lo cual los hace m<strong>en</strong>os profundos y frondosos.<br />
El C4.5 g<strong>en</strong>era un árbol <strong>de</strong> <strong>de</strong>cisión a p<strong>ar</strong>tir <strong>de</strong> los datos mediante p<strong>ar</strong>ticiones realizadas<br />
recursivam<strong>en</strong>te, según <strong>la</strong> estrategia <strong>de</strong> profundidad-primero (<strong>de</strong>pth-first) [Serv<strong>en</strong>te &<br />
G<strong>ar</strong>cía M<strong>ar</strong>tínez, 2002]. Antes <strong>de</strong> cada p<strong>ar</strong>tición <strong>de</strong> datos, el algoritmo consi<strong>de</strong>ra todas<br />
<strong>la</strong>s pruebas posibles que pue<strong>de</strong>n dividir el conjunto <strong>de</strong> datos y selecciona <strong>la</strong> prueba que<br />
resulta <strong>en</strong> <strong>la</strong> mayor ganancia <strong>de</strong> información o <strong>en</strong> <strong>la</strong> mayor proporción <strong>de</strong> ganancia <strong>de</strong><br />
información. P<strong>ar</strong>a cada atributo discreto, se consi<strong>de</strong>ra una prueba con n resultados,<br />
si<strong>en</strong>do n el número <strong>de</strong> valores posibles que pue<strong>de</strong> tom<strong>ar</strong> el atributo. P<strong>ar</strong>a cada atributo<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 11
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
continuo, se realiza una prueba bin<strong>ar</strong>ia sobre cada uno <strong>de</strong> los valores que toma el<br />
atributo <strong>en</strong> los datos.<br />
Son numerosas <strong>la</strong>s mejoras que pres<strong>en</strong>ta C4.5 <strong>en</strong> re<strong>la</strong>ción a ID3 [Lopez Takeyas, 2005]:<br />
• Evit<strong>ar</strong> sobreajuste <strong>de</strong> los datos.<br />
• Determin<strong>ar</strong> que tan profundo <strong>de</strong>be crecer el árbol <strong>de</strong> <strong>de</strong>cisión.<br />
• Reducir errores <strong>en</strong> <strong>la</strong> poda.<br />
• Condicion<strong>ar</strong> <strong>la</strong> Post-Poda.<br />
• Manej<strong>ar</strong> atributos continuos.<br />
• Escoger un rango <strong>de</strong> medida apropiado.<br />
• Manej<strong>ar</strong> datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to con valores faltantes.<br />
• Manej<strong>ar</strong> <strong>de</strong> atributos con difer<strong>en</strong>tes valores.<br />
• Mejor<strong>ar</strong> <strong>la</strong> efici<strong>en</strong>cia <strong>com</strong>putacional.<br />
2.1.1.2.3 CHAID<br />
CHAID fue diseñada a p<strong>ar</strong>tir <strong>de</strong> una técnica conocida <strong>com</strong>o Detección Automática <strong>de</strong><br />
Interacciones (AID: Automatic Interaction Detection). De aquí obtuvo su nombre,<br />
Detección Automática <strong>de</strong> Interacciones con Prueba 2 , CHAID (Chi Squ<strong>ar</strong>ed Automatic<br />
Interaction Detection) [H<strong>ar</strong>tigan, 1975]. Es tanto una técnica <strong>de</strong> explotación <strong>de</strong> datos<br />
<strong>com</strong>o un mo<strong>de</strong>lo estadístico. Forma p<strong>ar</strong>te, al igual que el ID3 y C4.5, <strong>de</strong> los mo<strong>de</strong>los<br />
l<strong>la</strong>mados árboles <strong>de</strong> <strong>de</strong>cisión y se utiliza p<strong>ar</strong>a realiz<strong>ar</strong> c<strong>la</strong>sificaciones y pronósticos. La<br />
finalidad <strong>de</strong> <strong>la</strong> predicción es pronostic<strong>ar</strong> el objetivo o resultado según una futura serie <strong>de</strong><br />
criterios o v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes.<br />
El mo<strong>de</strong>lo utiliza el algoritmo CHAID p<strong>ar</strong>a dividir <strong>en</strong> grupos los registros que pres<strong>en</strong>t<strong>en</strong><br />
<strong>la</strong> misma probabilidad <strong>de</strong> resultado, basándose <strong>en</strong> los valores <strong>de</strong> <strong>la</strong>s v<strong>ar</strong>iables<br />
in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes. El algoritmo p<strong>ar</strong>te <strong>de</strong> un nodo raíz y se va bifurcando <strong>en</strong> nodos<br />
<strong>de</strong>sc<strong>en</strong>di<strong>en</strong>tes hasta lleg<strong>ar</strong> a los nodos hoja, don<strong>de</strong> finaliza <strong>la</strong> ramificación. El mismo se<br />
sirve <strong>de</strong> <strong>la</strong> Prueba <strong>de</strong> <strong>la</strong> 2 (chi squ<strong>ar</strong>ed test) p<strong>ar</strong>a <strong>de</strong>termin<strong>ar</strong> si se <strong>de</strong>be continu<strong>ar</strong> con <strong>la</strong><br />
ramificación y, <strong>en</strong> caso afirmativo, qué v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes us<strong>ar</strong>. Esta prueba se<br />
lleva a cabo mediante <strong>la</strong> tabu<strong>la</strong>ción cruzada <strong>en</strong>tre el resultado y cada una <strong>de</strong> <strong>la</strong>s<br />
v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes. El resultado es un “valor-p”. Este valor repres<strong>en</strong>ta <strong>la</strong><br />
probabilidad <strong>de</strong> que <strong>la</strong> hipótesis nu<strong>la</strong> sea correcta. Luego, los “valores-p” p<strong>ar</strong>a cada<br />
tabu<strong>la</strong>ción cruzada <strong>de</strong> todas <strong>la</strong>s v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes se c<strong>la</strong>sifican, y si el mejor (el<br />
valor más pequeño) se <strong>en</strong>cu<strong>en</strong>tra bajo un umbral <strong>de</strong>terminado, se realiza una<br />
ramificación <strong>de</strong>l nodo raíz <strong>en</strong> esa ubicación.<br />
Las valoraciones y ramificaciones se prolongan hasta construir un árbol. Cuanto más se<br />
a<strong>la</strong>rgu<strong>en</strong> <strong>la</strong>s ramas, m<strong>en</strong>os v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes habrá disponibles ya que el<br />
12<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
a<strong>la</strong>rgami<strong>en</strong>to se lleva a cabo precisam<strong>en</strong>te con <strong>la</strong>s v<strong>ar</strong>iables. La bifurcación llega a su<br />
fin cuando el mejor “valor-p” ya no se <strong>en</strong>cu<strong>en</strong>tra bajo dicho umbral <strong>de</strong>terminado. Los<br />
nodos hoja <strong>de</strong>l árbol son aquellos que no han sufrido ramificaciones.<br />
Entre los puntos fuertes <strong>de</strong>l CHAID figura <strong>la</strong> construcción s<strong>en</strong>cil<strong>la</strong> <strong>de</strong>l mo<strong>de</strong>lo, que<br />
permite manej<strong>ar</strong> v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes tanto categóricas <strong>com</strong>o continuas. CHAID<br />
requiere gran<strong>de</strong>s masas <strong>de</strong> datos p<strong>ar</strong>a asegur<strong>ar</strong>se <strong>de</strong> que <strong>la</strong> cantidad <strong>de</strong> observaciones <strong>de</strong><br />
los nodos hoja es significativa.<br />
2.1.1.3 Selección <strong>de</strong> atributos<br />
Exist<strong>en</strong> v<strong>ar</strong>ias razones p<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> selección <strong>de</strong> atributos [Hernán<strong>de</strong>z Orallo et al,<br />
2004].<br />
• Reducir el tamaño <strong>de</strong> los datos eliminando los irrelevantes o redundantes.<br />
• Elimin<strong>ar</strong> atributos que conti<strong>en</strong><strong>en</strong> numerosos datos erróneos o faltantes.<br />
• Mejor<strong>ar</strong> <strong>la</strong> calidad <strong>de</strong>l mo<strong>de</strong>lo c<strong>en</strong>trándose <strong>en</strong> atributos relevante.<br />
• Expres<strong>ar</strong> el mo<strong>de</strong>lo resultante <strong>en</strong> función <strong>de</strong> m<strong>en</strong>os v<strong>ar</strong>iables mejorando <strong>la</strong><br />
<strong>com</strong>pr<strong>en</strong>sión.<br />
• Reducir <strong>la</strong> dim<strong>en</strong>sionalidad a fin <strong>de</strong> repres<strong>en</strong>t<strong>ar</strong> los datos visualm<strong>en</strong>te.<br />
El problema <strong>de</strong> hacer uso <strong>de</strong> todos los atributos disponibles consiste <strong>en</strong> que <strong>la</strong> mayoría<br />
<strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos pue<strong>de</strong>n actu<strong>ar</strong> incorrectam<strong>en</strong>te <strong>en</strong>tre tantos campos<br />
<strong>en</strong> un espacio que al t<strong>en</strong>er alta dim<strong>en</strong>sionalidad resulta est<strong>ar</strong> más <strong>de</strong>sierto (cuando hay<br />
irrelevantes, redundantes o con valores erróneos). Se busca obt<strong>en</strong>er mo<strong>de</strong>los que se<br />
ajust<strong>en</strong> a p<strong>ar</strong>ticu<strong>la</strong>rida<strong>de</strong>s <strong>de</strong> los datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to y no <strong>de</strong> los datos <strong>en</strong> g<strong>en</strong>eral.<br />
Exist<strong>en</strong> dos reg<strong>la</strong>s g<strong>en</strong>erales p<strong>ar</strong>a elimin<strong>ar</strong> atributos, <strong>en</strong> especial los nominales:<br />
• Eliminación <strong>de</strong> c<strong>la</strong>ves candidatas: <strong>la</strong> reg<strong>la</strong> es elimin<strong>ar</strong> cualquier atributo que<br />
pueda ser c<strong>la</strong>ve prim<strong>ar</strong>ia <strong>de</strong> <strong>la</strong> tab<strong>la</strong> (sea candidata o p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> c<strong>la</strong>ve candidata,<br />
p<strong>ar</strong>cial o totalm<strong>en</strong>te). Estos campos agregan un <strong>de</strong>talle al dominio <strong>de</strong> datos que<br />
pue<strong>de</strong> ser especialm<strong>en</strong>te problemático p<strong>ar</strong>a t<strong>ar</strong>eas <strong>de</strong> c<strong>la</strong>sificación o regresión.<br />
• Eliminación <strong>de</strong> atributos <strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes: cuando exist<strong>en</strong> <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias<br />
funcionales <strong>en</strong>tre atributos se int<strong>en</strong>ta normaliz<strong>ar</strong> <strong>en</strong> v<strong>ar</strong>ias tab<strong>la</strong>s. Dado que los<br />
datos a min<strong>ar</strong> pue<strong>de</strong>n prov<strong>en</strong>ir <strong>de</strong> una “vista minable” (tab<strong>la</strong> lógica con todos los<br />
atributos relevantes) que los ha <strong>de</strong>snormalizado, se <strong>de</strong>be evalu<strong>ar</strong> si realm<strong>en</strong>te se<br />
necesitan todos los atributos, ya que muchos pue<strong>de</strong>n ser redundantes. No<br />
elimin<strong>ar</strong> los atributos <strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes pue<strong>de</strong> perjudic<strong>ar</strong> <strong>la</strong> g<strong>en</strong>eración <strong>de</strong> reg<strong>la</strong>s <strong>de</strong><br />
asociación y <strong>la</strong>s <strong>de</strong> agrupami<strong>en</strong>to.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 13
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Por otra p<strong>ar</strong>te, se utilizan dos métodos p<strong>ar</strong>a seleccion<strong>ar</strong> atributos:<br />
14<br />
• Métodos <strong>de</strong> filtro: se filtran los atributos irrelevantes antes <strong>de</strong> cualquier proceso<br />
<strong>de</strong> minería <strong>de</strong> datos. Las técnicas son fundam<strong>en</strong>talm<strong>en</strong>te estadísticas (medidas<br />
<strong>de</strong> información, distancia, <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias o inconsist<strong>en</strong>cias). El criterio p<strong>ar</strong>a<br />
establecer el subconjunto óptimo <strong>de</strong> atributos se basa <strong>en</strong> medidas <strong>de</strong> calidad<br />
previa que se calcu<strong>la</strong>n a p<strong>ar</strong>tir <strong>de</strong> los datos.<br />
• Métodos <strong>en</strong>volv<strong>en</strong>tes (Wrappers): <strong>la</strong> selección óptima <strong>de</strong> atributos se evalúa<br />
respecto a <strong>la</strong> calidad <strong>de</strong> un mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos o estadístico extraído a<br />
p<strong>ar</strong>tir <strong>de</strong> los datos (utilizando algún método <strong>de</strong> validación). Este tipo <strong>de</strong> técnicas<br />
requier<strong>en</strong> más tiempo que <strong>la</strong>s otras ya que p<strong>ar</strong>a evalu<strong>ar</strong> hay que <strong>en</strong>tr<strong>en</strong><strong>ar</strong> un<br />
mo<strong>de</strong>lo.<br />
2.2 CRIPS-DM: METODOLOGÍA DE PROYECTOS DE MINERÍA DE DATOS<br />
CRISP-DM (Cross Industry Stand<strong>ar</strong>d Process for Data Mining) es una metodología<br />
creada <strong>en</strong> el año 1996, diseñada p<strong>ar</strong>a <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r proyectos <strong>de</strong> minería <strong>de</strong> datos.<br />
La misma consiste <strong>en</strong> una serie <strong>de</strong> activida<strong>de</strong>s o t<strong>ar</strong>eas <strong>de</strong>scriptas <strong>en</strong> cuatro niveles <strong>de</strong><br />
abstracción (<strong>de</strong>s<strong>de</strong> lo g<strong>en</strong>eral a lo específico): fases, t<strong>ar</strong>eas g<strong>en</strong>éricas, t<strong>ar</strong>eas específicas<br />
e instancias <strong>de</strong>l proceso [Figura 2.4].<br />
Figura 2.4. Los 4 niveles <strong>de</strong>l CRISP-DM. [CRIPS-DM, 2007]<br />
En el nivel superior el proceso <strong>de</strong> minería <strong>de</strong> datos esta organizado <strong>en</strong> fases; cada fase<br />
consiste <strong>en</strong> un número <strong>de</strong> t<strong>ar</strong>eas g<strong>en</strong>éricas <strong>de</strong> segundo nivel. A este segundo nivel <strong>de</strong> lo<br />
l<strong>la</strong>ma g<strong>en</strong>érico porque se pret<strong>en</strong><strong>de</strong> que sea lo sufici<strong>en</strong>tem<strong>en</strong>te g<strong>en</strong>eral p<strong>ar</strong>a cubrir todas<br />
<strong>la</strong>s posibles situaciones <strong>de</strong>l proceso <strong>de</strong> minería <strong>de</strong> datos. A su vez, se espera que sea<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
estable p<strong>ar</strong>a que el mo<strong>de</strong>lo sea válido p<strong>ar</strong>a nuevos técnicas <strong>de</strong> mo<strong>de</strong><strong>la</strong>do aún no<br />
<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>das.<br />
El tercer nivel (t<strong>ar</strong>es específicas) es el lug<strong>ar</strong> p<strong>ar</strong>a <strong>de</strong>scribir <strong>com</strong>o <strong>la</strong>s acciones g<strong>en</strong>éricas<br />
<strong>de</strong>b<strong>en</strong> ser llevadas a cabo <strong>en</strong> ciertas situaciones especificas. Por ejemplo, si <strong>en</strong> el<br />
segundo nivel se ti<strong>en</strong>e <strong>la</strong> t<strong>ar</strong>ea g<strong>en</strong>eral “limpieza <strong>de</strong> datos”, <strong>en</strong> el tercer nivel se <strong>de</strong>tal<strong>la</strong>n<br />
<strong>la</strong>s t<strong>ar</strong>eas que ti<strong>en</strong><strong>en</strong> que <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>rse p<strong>ar</strong>a un caso especifico, <strong>com</strong>o pue<strong>de</strong> serlo <strong>la</strong><br />
“limpieza <strong>de</strong> datos numéricos”, o “limpieza <strong>de</strong> datos categóricos”.<br />
La <strong>de</strong>scripción <strong>de</strong> fases y t<strong>ar</strong>eas, <strong>com</strong>o pasos discretos llevados a cabos <strong>en</strong> un or<strong>de</strong>n<br />
específico, repres<strong>en</strong>tan una secu<strong>en</strong>cia i<strong>de</strong>alizada <strong>de</strong> ev<strong>en</strong>tos. En <strong>la</strong> practica, muchas <strong>de</strong><br />
<strong>la</strong>s t<strong>ar</strong>eas pue<strong>de</strong>n llev<strong>ar</strong>se a<strong>de</strong><strong>la</strong>nte <strong>en</strong> distinto or<strong>de</strong>n y será neces<strong>ar</strong>io volver atrás v<strong>ar</strong>ias<br />
veces p<strong>ar</strong>a repetir ciertas acciones.<br />
El cu<strong>ar</strong>to nivel, instancias <strong>de</strong> proceso, es un registro <strong>de</strong> <strong>la</strong>s acciones, <strong>de</strong>cisiones y<br />
resultados <strong>de</strong> un proyecto <strong>de</strong> minería <strong>de</strong> datos específico. Esta organizado <strong>de</strong> acuerdo a<br />
<strong>la</strong>s t<strong>ar</strong>eas <strong>de</strong>finidas <strong>en</strong> los niveles superiores, pero repres<strong>en</strong>tan lo que suce<strong>de</strong> <strong>en</strong><br />
instancias p<strong>ar</strong>ticu<strong>la</strong>res durante el proceso <strong>de</strong> minería <strong>de</strong> datos.<br />
El ciclo <strong>de</strong> vida <strong>de</strong>l proyecto <strong>de</strong> minería <strong>de</strong> datos, según CRIPS-DM, consta <strong>de</strong> 6 fases<br />
[Figura 2.5]. Es importante ac<strong>la</strong>r<strong>ar</strong> que <strong>la</strong> secu<strong>en</strong>cia <strong>de</strong> <strong>la</strong>s fases no es rígida, por lo que<br />
cuando sea requerido los proyectistas <strong>de</strong>berán moverse <strong>en</strong>tre el<strong>la</strong>s.<br />
Figura 2.5:.CRISP-DM. Ciclo <strong>de</strong> vida <strong>de</strong>l proyecto. [CRISP-DM, 2007]<br />
Dep<strong>en</strong>di<strong>en</strong>do <strong>de</strong>l resultado <strong>de</strong> cada fase, se llev<strong>ar</strong>a a cabo <strong>la</strong> sigui<strong>en</strong>te fase<br />
correspondi<strong>en</strong>te. En <strong>la</strong> figura 2.5, <strong>la</strong>s flechas repres<strong>en</strong>tan <strong>la</strong>s más importantes y<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 15
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
frecu<strong>en</strong>tes <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias <strong>en</strong>tre fases. La circunfer<strong>en</strong>cia exterior simboliza <strong>la</strong> naturaleza<br />
cíclica <strong>de</strong> los proyectos propiam<strong>en</strong>te dichos.<br />
2.2.1 Objetivos <strong>de</strong> cada fase <strong>en</strong> <strong>la</strong> metodología CRISP-DM.<br />
Cada una <strong>de</strong> <strong>la</strong>s fases <strong>de</strong> <strong>la</strong> pres<strong>en</strong>te metodología apunta a una serie <strong>de</strong> objetivos<br />
principales.<br />
Fase I - Compr<strong>en</strong>sión <strong>de</strong>l negocio<br />
16<br />
Esta primera fase se focaliza <strong>en</strong> <strong>en</strong>t<strong>en</strong><strong>de</strong>r los objetivos <strong>de</strong>l negocio y los<br />
requerimi<strong>en</strong>tos <strong>de</strong>s<strong>de</strong> <strong>la</strong> perspectiva <strong>de</strong>l negocio, p<strong>ar</strong>a incluir estos<br />
conocimi<strong>en</strong>tos <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> <strong>de</strong>finición <strong>de</strong>l problema <strong>de</strong> Exploración <strong>de</strong><br />
información y el diseño <strong>de</strong>l p<strong>la</strong>n prelimin<strong>ar</strong> p<strong>ar</strong>a logr<strong>ar</strong> los objetivos.<br />
Fase II - Compr<strong>en</strong>sión <strong>de</strong> los datos<br />
La fase <strong>de</strong> <strong>com</strong>pr<strong>en</strong>sión <strong>de</strong> los datos <strong>com</strong>i<strong>en</strong>za con <strong>la</strong> recolección inicial <strong>de</strong> datos<br />
y prosigue con activida<strong>de</strong>s que apuntan a <strong>la</strong> famili<strong>ar</strong>ización <strong>de</strong> los datos,<br />
i<strong>de</strong>ntific<strong>ar</strong> problemas <strong>de</strong> calidad y <strong>de</strong>tect<strong>ar</strong> re<strong>la</strong>ciones interesantes <strong>en</strong>tre los<br />
mismos que permitan g<strong>en</strong>er<strong>ar</strong> hipótesis sobre información oculta.<br />
Fase III - Prep<strong>ar</strong>ación <strong>de</strong> los datos<br />
Esta fase contemp<strong>la</strong> un conjunto <strong>de</strong> activida<strong>de</strong>s <strong>de</strong>stinadas a <strong>la</strong> construcción <strong>de</strong>l<br />
dataset a p<strong>ar</strong>tir <strong>de</strong> los datos iniciales. Esta fase implica múltiples t<strong>ar</strong>eas que<br />
pue<strong>de</strong>n <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>rse al mismo tiempo sin un or<strong>de</strong>n estricto. Estas t<strong>ar</strong>eas incluy<strong>en</strong><br />
<strong>la</strong> selección, limpieza y transformación <strong>de</strong> tab<strong>la</strong>s, registros y atributos p<strong>ar</strong>a po<strong>de</strong>r<br />
ingres<strong>ar</strong><strong>la</strong>s <strong>en</strong> <strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.<br />
Fase IV - Mo<strong>de</strong><strong>la</strong>do<br />
En esta fase se seleccion<strong>ar</strong>án y aplic<strong>ar</strong>án v<strong>ar</strong>ias técnicas <strong>de</strong> mo<strong>de</strong><strong>la</strong>do, <strong>com</strong>o así<br />
también, opcionalm<strong>en</strong>te, se podrán <strong>de</strong>termin<strong>ar</strong> los valores <strong>de</strong> los p<strong>ar</strong>ámetros y<br />
v<strong>ar</strong>iables <strong>de</strong> calibración. P<strong>ar</strong>a esta t<strong>ar</strong>ea g<strong>en</strong>eralm<strong>en</strong>te se pue<strong>de</strong> cont<strong>ar</strong> con más<br />
<strong>de</strong> una técnica que realice <strong>la</strong> misma función. Algunas técnicas pue<strong>de</strong>n t<strong>en</strong>er<br />
requerimi<strong>en</strong>tos específicos <strong>en</strong> cuanto a <strong>la</strong> conformación <strong>de</strong> los datos, lo cual<br />
pue<strong>de</strong> hacer que se <strong>de</strong>ba volver a <strong>la</strong> fase <strong>de</strong> prep<strong>ar</strong>ación <strong>de</strong> los datos p<strong>ar</strong>a realiz<strong>ar</strong><br />
algún ajuste.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Fase V - Evaluación<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
En esta fase se verifica que los resultados obt<strong>en</strong>idos <strong>en</strong> <strong>la</strong> fase <strong>de</strong> mo<strong>de</strong><strong>la</strong>do sean<br />
<strong>de</strong> alta calidad <strong>de</strong>s<strong>de</strong> <strong>la</strong> perspectiva <strong>de</strong>l análisis <strong>de</strong> datos. Antes <strong>de</strong> realiz<strong>ar</strong> <strong>la</strong><br />
implem<strong>en</strong>tación <strong>de</strong>l mo<strong>de</strong>lo, es importante evalu<strong>ar</strong> que los resultados <strong>de</strong>l<br />
mo<strong>de</strong><strong>la</strong>do y revis<strong>ar</strong> los pasos realizados p<strong>ar</strong>a <strong>la</strong> construcción <strong>de</strong>l mo<strong>de</strong>lo y<br />
verific<strong>ar</strong> que estos sean apropiados <strong>en</strong> función <strong>de</strong> los objetivos <strong>de</strong>l negocio.<br />
Fase VI - Implem<strong>en</strong>tación<br />
El final <strong>de</strong>l proyecto, g<strong>en</strong>eralm<strong>en</strong>te, no se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> <strong>la</strong> creación <strong>de</strong>l mo<strong>de</strong>lo.<br />
En <strong>la</strong> mayoría <strong>de</strong> los casos el analista <strong>de</strong> datos <strong>de</strong>be g<strong>en</strong>er<strong>ar</strong> un informe final<br />
p<strong>ar</strong>a ser pres<strong>en</strong>tado al cli<strong>en</strong>te o <strong>en</strong> caso <strong>de</strong> que el propio cli<strong>en</strong>te <strong>de</strong>see realiz<strong>ar</strong> el<br />
informe final se <strong>de</strong>berá transferir a éste el conocimi<strong>en</strong>to p<strong>ar</strong>a que pueda hacer<br />
una correcta interpretación <strong>de</strong> los datos.<br />
2.3 MINERÍA DE DATOS APLICADA A LA INFORMACIÓN CRIMINAL<br />
A p<strong>ar</strong>tir <strong>de</strong> los ataques terroristas <strong>de</strong>l 11 <strong>de</strong> Septiembre <strong>de</strong> 2001 a <strong>la</strong>s torres geme<strong>la</strong>s <strong>en</strong><br />
<strong>la</strong> ciudad <strong>de</strong> Nueva York, EE.UU., <strong>la</strong> cantidad <strong>de</strong> información recolectada, reunida y<br />
<strong>com</strong>pi<strong>la</strong>da por <strong>la</strong>s ag<strong>en</strong>cias locales, estatales y fe<strong>de</strong>rales (CIA, FBI, etc.) <strong>de</strong> dicho país<br />
fue increm<strong>en</strong>tándose significativam<strong>en</strong>te, buscando <strong>de</strong> esta forma logr<strong>ar</strong> prev<strong>en</strong>ir futuros<br />
ataques. El manejo y capacidad <strong>de</strong> análisis <strong>de</strong> dicha información, mediante <strong>la</strong> creación<br />
<strong>de</strong> diversas herrami<strong>en</strong>tas, técnicas y sistemas, tampoco se ha quedado atrás [McCue,<br />
2005].<br />
Las mismas herrami<strong>en</strong>tas y técnicas que son usadas p<strong>ar</strong>a <strong>de</strong>termin<strong>ar</strong> riesgo crediticio,<br />
<strong>de</strong>scubrir frau<strong>de</strong>s e i<strong>de</strong>ntific<strong>ar</strong> hábitos <strong>de</strong> consumos <strong>en</strong> <strong>la</strong>s personas, <strong>en</strong>tre otros usos,<br />
pue<strong>de</strong>n ser utilizadas p<strong>ar</strong>a <strong>la</strong> lucha contra <strong>la</strong> <strong>de</strong>lincu<strong>en</strong>cia, terrorismo y <strong>la</strong> protección <strong>de</strong><br />
<strong>la</strong> seguridad interior.<br />
La minería <strong>de</strong> datos es muy aplicable <strong>en</strong> <strong>la</strong> información criminal, ya que se trata <strong>de</strong> una<br />
herrami<strong>en</strong>ta muy pot<strong>en</strong>te que le permite a los investigadores <strong>de</strong>l crim<strong>en</strong> que pose<strong>en</strong><br />
poco <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to <strong>com</strong>o analistas <strong>de</strong> datos explor<strong>ar</strong> gran<strong>de</strong>s bases <strong>de</strong> datos <strong>de</strong> manera<br />
rápida y efici<strong>en</strong>te [Fayyad & Uthurusamy, 2002]. Al ser <strong>la</strong>s modalida<strong>de</strong>s criminales<br />
cada vez más <strong>com</strong>plejas y dinámicas, se cree que es sumam<strong>en</strong>te útil <strong>la</strong> utilización <strong>de</strong><br />
herrami<strong>en</strong>tas específicas p<strong>ar</strong>a po<strong>de</strong>r t<strong>en</strong>er un mejor tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información<br />
criminal. El uso <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos aplicado a <strong>la</strong> intelig<strong>en</strong>cia criminal ha t<strong>en</strong>ido un<br />
gran crecimi<strong>en</strong>to <strong>en</strong> los últimos años <strong>en</strong> EE.UU. [Ch<strong>en</strong> et al., 2004].<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 17
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Finalm<strong>en</strong>te, con respecto a <strong>la</strong> aplicación <strong>de</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias, no se ha <strong>en</strong>contrado estudio alguno tanto <strong>en</strong> Arg<strong>en</strong>tina <strong>com</strong>o a nivel<br />
internacional. Por lo tanto, se cree que esta es una muy bu<strong>en</strong>a oportunidad p<strong>ar</strong>a aplic<strong>ar</strong><br />
minería <strong>de</strong> datos <strong>en</strong> información re<strong>la</strong>tiva a <strong>la</strong>s cárceles <strong>de</strong> <strong>la</strong> <strong>ar</strong>g<strong>en</strong>tina<br />
A continuación se <strong>de</strong>scrib<strong>en</strong> diversos proyectos <strong>de</strong> aplicación <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos <strong>en</strong><br />
información criminal.<br />
2.3.1 Proyecto Able Danger<br />
En el año 1999, los Comandos <strong>de</strong> Operaciones Especiales <strong>de</strong> EE.UU., buscaban <strong>la</strong><br />
forma <strong>de</strong> acrec<strong>en</strong>t<strong>ar</strong> <strong>la</strong> lucha contra el terrorismo luego <strong>de</strong> los ataques que sufrieron sus<br />
embajadas <strong>en</strong> K<strong>en</strong>ya y Tanzania por p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> red Al Qaeda.<br />
Able Danger [H<strong>ar</strong>ris, 2005] fue el nombre <strong>en</strong> código <strong>de</strong>l proyecto <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do por una<br />
<strong>de</strong> <strong>la</strong>s ag<strong>en</strong>cias <strong>de</strong> intelig<strong>en</strong>cia <strong>de</strong> los EE.UU., <strong>la</strong> IDC (Information Dominance C<strong>en</strong>ter).<br />
Mediante el mismo, supuestam<strong>en</strong>te se habrían i<strong>de</strong>ntificado al lí<strong>de</strong>r <strong>de</strong> los ataques <strong>de</strong>l 11<br />
<strong>de</strong> Septiembre <strong>de</strong> 2001, Mohamed Atta, junto a otros 3 terroristas <strong>com</strong>o posibles<br />
miembros <strong>de</strong> una célu<strong>la</strong> <strong>de</strong> Al Qaeda operando <strong>en</strong> ese país más <strong>de</strong> un año previo a los<br />
ataques.<br />
El proyecto, basado <strong>en</strong> <strong>la</strong> minería <strong>de</strong> datos, cont<strong>en</strong>ía un gran volum<strong>en</strong> <strong>de</strong> información<br />
(2.5 terabytes), lo cual repres<strong>en</strong>taba aproximadam<strong>en</strong>te al 12% <strong>de</strong> todas <strong>la</strong>s páginas<br />
impresas gu<strong>ar</strong>dadas <strong>en</strong> <strong>la</strong>s bibliotecas <strong>de</strong>l Congreso Norteamericano.<br />
El resultado <strong>de</strong>l Able Danger trajo a <strong>la</strong> luz diagramas y mapas que mostraban nombres<br />
<strong>de</strong> sospechosos, los re<strong>la</strong>cionaban e interconectaban. Entre estos se <strong>en</strong>contraba Mohamed<br />
Atta, que lo vincu<strong>la</strong>ba con un terrorista aún <strong>de</strong>t<strong>en</strong>ido <strong>en</strong> una prisión fe<strong>de</strong>ral, qui<strong>en</strong> a su<br />
vez había t<strong>en</strong>ido p<strong>ar</strong>ticipación <strong>en</strong> los ataques al World Tra<strong>de</strong> C<strong>en</strong>ter <strong>en</strong> el año 1993. Los<br />
resultados fueron obt<strong>en</strong>idos sobre <strong>la</strong> base <strong>de</strong> búsquedas int<strong>en</strong>sas <strong>de</strong> <strong>de</strong>c<strong>en</strong>as <strong>de</strong> miles <strong>de</strong><br />
páginas Web que cont<strong>en</strong>ían <strong>la</strong>s pa<strong>la</strong>bras c<strong>la</strong>ve <strong>com</strong>o por ejemplo “Al Qaeda” o “Bin<br />
La<strong>de</strong>n”. Luego, una herrami<strong>en</strong>ta <strong>de</strong> visualización <strong>de</strong> datos, creaba un mapa<br />
tridim<strong>en</strong>sional mostrando cuales pa<strong>la</strong>bras ap<strong>ar</strong>ecían más frecu<strong>en</strong>tem<strong>en</strong>te y <strong>com</strong>o se<br />
re<strong>la</strong>cionaban. Nombres, ubicaciones, capacida<strong>de</strong>s y hasta <strong>la</strong>s fu<strong>en</strong>tes <strong>de</strong> financiami<strong>en</strong>to<br />
<strong>de</strong> <strong>la</strong> red fue alguna <strong>de</strong> <strong>la</strong> información <strong>de</strong>tectada.<br />
En <strong>la</strong> figura 2.6 se pue<strong>de</strong> observ<strong>ar</strong> un ejemplo <strong>de</strong> los resultados obt<strong>en</strong>idos mediante <strong>la</strong><br />
Minería <strong>de</strong> Datos llevada a cabo durante el proyecto Able Danger.<br />
18<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Figura 2.6. Mapas <strong>de</strong> re<strong>la</strong>ciones <strong>de</strong>l Able Danger [Lance, 2007].<br />
Sin emb<strong>ar</strong>go, cuando se creía t<strong>en</strong>er <strong>la</strong> herrami<strong>en</strong>ta que permitiría <strong>en</strong>contr<strong>ar</strong> a los<br />
terroristas antes <strong>de</strong> que estos ejecut<strong>en</strong> sus actos, al mismo tiempo se estaba fr<strong>en</strong>te a una<br />
importante línea legal. La metodología básica <strong>de</strong> búsqueda sugería que todos los<br />
ciudadanos <strong>de</strong> los EE.UU. podrían ap<strong>ar</strong>ecer <strong>en</strong> el<strong>la</strong>. Esta fue una <strong>de</strong> <strong>la</strong>s principales<br />
causas por <strong>la</strong>s cuales <strong>la</strong> IDC fue obligada a <strong>de</strong>struir cualquier información recolectada<br />
sobre ciudadanos estadouni<strong>de</strong>nses <strong>de</strong>ntro <strong>de</strong> los 90 días. Así fue, <strong>com</strong>o <strong>en</strong> <strong>la</strong> primavera<br />
<strong>de</strong>l año 2000, el proyecto quedó relegado y ningún rastro <strong>de</strong>l mismo pudo ser rescatado.<br />
Nunca <strong>la</strong> CIA ni el FBI pudo t<strong>en</strong>er <strong>en</strong> sus oficinas toda <strong>la</strong> información recolectada y<br />
procesada.<br />
P<strong>ar</strong>a más información acerca <strong>de</strong> este proyecto remitirse al “Able Danger Investigation<br />
Report” [Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong> Def<strong>en</strong>sa EE.UU., 2006], <strong>en</strong> don<strong>de</strong> se <strong>en</strong>cu<strong>en</strong>tran publicados<br />
todos los cuadros <strong>de</strong> re<strong>la</strong>ciones realizados.<br />
2.3.2 Proyecto COPLINK – Universidad <strong>de</strong> Arizona<br />
Este producto, creado <strong>en</strong> 1997 por el Laboratorio <strong>de</strong> Intelig<strong>en</strong>cia Artificial <strong>de</strong> <strong>la</strong><br />
Universidad <strong>de</strong> Arizona (Tucson, EE.UU.), se <strong>la</strong>nza con el objetivo <strong>de</strong> proveer soporte<br />
al análisis y toma <strong>de</strong> <strong>de</strong>cisiones p<strong>ar</strong>a <strong>la</strong> i<strong>de</strong>ntificación <strong>de</strong> <strong>com</strong>portami<strong>en</strong>tos criminales,<br />
re<strong>la</strong>ciones y patrones, ayudando a resolver crím<strong>en</strong>es <strong>de</strong> distinta índole y <strong>de</strong>tección <strong>de</strong><br />
pot<strong>en</strong>ciales ataques terroristas [Artificial Intellig<strong>en</strong>ce Lab, 2007].<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 19
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Este interesante <strong>de</strong>s<strong>ar</strong>rollo posee diversas aplicaciones, permiti<strong>en</strong>do trabaj<strong>ar</strong> con datos<br />
prov<strong>en</strong>i<strong>en</strong>tes <strong>de</strong> diversas fu<strong>en</strong>tes y analizando <strong>la</strong> información a través <strong>de</strong> una red segura<br />
y “amigable”.<br />
Entre <strong>la</strong>s aplicaciones más interesantes <strong>de</strong>l COPLINK se pue<strong>de</strong>n nombr<strong>ar</strong> a <strong>la</strong>s<br />
sigui<strong>en</strong>tes:<br />
20<br />
• Seguridad Fronteriza (COPLINK Bor<strong>de</strong>rSafe)<br />
Este proyecto busca logr<strong>ar</strong> que <strong>la</strong>s distintas ag<strong>en</strong>cias g<strong>en</strong>eradores <strong>de</strong> información<br />
p<strong>ar</strong>ticip<strong>en</strong> <strong>en</strong> una p<strong>la</strong>taforma piloto p<strong>ar</strong>a <strong>la</strong> investigación y análisis <strong>de</strong> información<br />
cruzada prov<strong>en</strong>i<strong>en</strong>te <strong>de</strong> distintas jurisdicciones. Registros <strong>de</strong>l Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong> Policía<br />
<strong>de</strong> Tucson, Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong>l condado <strong>de</strong> Pima y Patrul<strong>la</strong>s fronterizas han sido<br />
integrados a esta p<strong>la</strong>taforma p<strong>ar</strong>a extraer conclusiones acerca <strong>de</strong> <strong>la</strong> actividad <strong>de</strong> re<strong>de</strong>s <strong>de</strong><br />
traficantes <strong>de</strong> drogas <strong>com</strong>o también <strong>de</strong> “cruzadores” <strong>de</strong> fronteras (bor<strong>de</strong>r crossing<br />
vehicles).<br />
Figura 2.7. Red criminal obt<strong>en</strong>ida con el COPLINK Bo<strong>ar</strong><strong>de</strong>rSafe.<br />
La figura 2.7 es un típico ejemplo <strong>de</strong> actividad <strong>de</strong> una red criminal, integrando los<br />
registros <strong>de</strong> distintas ag<strong>en</strong>cias. En este caso, <strong>la</strong> red es usada p<strong>ar</strong>a i<strong>de</strong>ntific<strong>ar</strong> vehículos<br />
asociados al sospechoso <strong>de</strong> un homicidio.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
• Análisis <strong>de</strong> Re<strong>de</strong>s Criminales (COPLINK Criminal Network Analysis)<br />
Es una herrami<strong>en</strong>ta que pret<strong>en</strong><strong>de</strong> facilit<strong>ar</strong> <strong>la</strong> investigación <strong>de</strong> crím<strong>en</strong>es <strong>com</strong>o terrorismo,<br />
tráfico <strong>de</strong> drogas y crím<strong>en</strong>es <strong>com</strong>etidos por bandas autoorganizadas. Se busca<br />
<strong>de</strong>termin<strong>ar</strong> el <strong>com</strong>portami<strong>en</strong>tos <strong>de</strong> bandas, li<strong>de</strong>res y ver <strong>com</strong>o se re<strong>la</strong>cionan y operan<br />
<strong>en</strong>tre sí p<strong>ar</strong>a llev<strong>ar</strong> a cabo v<strong>ar</strong>ios tipos <strong>de</strong> activida<strong>de</strong>s ilegales [Ch<strong>en</strong> et al., 2004].<br />
Se utilizan técnicas <strong>de</strong> Concept Space p<strong>ar</strong>a cre<strong>ar</strong> una red <strong>de</strong> pot<strong>en</strong>ciales sospechosos. El<br />
vínculo <strong>en</strong>tre dos sospechosos está dado por <strong>la</strong> cantidad <strong>de</strong> veces <strong>en</strong> que ambos fueron<br />
i<strong>de</strong>ntificados <strong>en</strong> el mismo inci<strong>de</strong>nte. Se divi<strong>de</strong>n <strong>en</strong> subgrupos mediante el clustering<br />
jerárquico y block mo<strong>de</strong>ling p<strong>ar</strong>a <strong>de</strong>tect<strong>ar</strong> patrones <strong>de</strong> interacción <strong>en</strong>tre los subgrupos.<br />
También se calcu<strong>la</strong>n distancias c<strong>en</strong>trales (grados, intersecciones y cercanías) p<strong>ar</strong>a<br />
<strong>de</strong>tect<strong>ar</strong> a los miembros c<strong>la</strong>ve <strong>de</strong> cada subgrupo, <strong>com</strong>o lo son los lí<strong>de</strong>res.<br />
Figura 2.8. Red criminal obt<strong>en</strong>ida con el COPLINK Criminal Network Analysis.<br />
La figura 2.8 muestra a los nodos repres<strong>en</strong>tados por los criminales con sus respectivos<br />
nombres. Las líneas conectores repres<strong>en</strong>tan re<strong>la</strong>ciones <strong>en</strong>tre los criminales.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 21
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Se pue<strong>de</strong> hacer foco <strong>en</strong> <strong>la</strong>s re<strong>de</strong>s individuales aum<strong>en</strong>tando el porc<strong>en</strong>taje <strong>de</strong> abstracción<br />
(level of abastraction %) obt<strong>en</strong>iéndose <strong>la</strong> figura 2.9. En el<strong>la</strong> se pue<strong>de</strong>n observ<strong>ar</strong> círculos<br />
que repres<strong>en</strong>tan grupos. El tamaño <strong>de</strong> los círculos es proporcional al número <strong>de</strong><br />
miembros <strong>de</strong> los distintos grupos. Cada grupo esta etiquetado con el nombre <strong>de</strong>l lí<strong>de</strong>r<br />
<strong>de</strong>l grupo.<br />
22<br />
Figura 2.9. El lí<strong>de</strong>r, su grupo y red. COPLINK Criminal Network Analysis.<br />
Exist<strong>en</strong> otras aplicaciones <strong>de</strong>ntro <strong>de</strong>l COPLINK <strong>com</strong>o <strong>la</strong> Extracción <strong>de</strong> Entida<strong>de</strong>s<br />
automáticam<strong>en</strong>te <strong>de</strong>s<strong>de</strong> los reportes policiales y <strong>la</strong> Detección <strong>de</strong> I<strong>de</strong>ntida<strong>de</strong>s Múltiples<br />
<strong>en</strong> gran<strong>de</strong>s bases <strong>de</strong> datos.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
2.4 INFORMACIÓN CRIMINAL EN ARGENTINA<br />
A continuación se pres<strong>en</strong>ta, a modo <strong>de</strong> refer<strong>en</strong>cia, una <strong>de</strong>scripción <strong>de</strong>l estado actual <strong>de</strong><br />
<strong>la</strong> información criminal <strong>en</strong> Arg<strong>en</strong>tina.<br />
2.4.1 Dirección Nacional <strong>de</strong> Política Criminal<br />
A p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong> sanción <strong>de</strong> <strong>la</strong> Ley 25.266 se le otorgó a <strong>la</strong> Dirección Nacional <strong>de</strong> Política<br />
Criminal (DNPC), creada <strong>en</strong> el año 1991 y <strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong>l Ministerio <strong>de</strong> Justicia y<br />
Derechos Humanos, <strong>la</strong> potestad no sólo <strong>de</strong> diseñ<strong>ar</strong> y producir <strong>la</strong>s estadísticas <strong>de</strong><br />
criminalidad, sino también <strong>la</strong>s estadísticas sobre el sistema p<strong>en</strong>al <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina. En<br />
este s<strong>en</strong>tido, esta nueva legis<strong>la</strong>ción procura un principio <strong>de</strong> organización p<strong>ar</strong>a <strong>la</strong><br />
producción <strong>de</strong> <strong>la</strong>s fu<strong>en</strong>tes estadísticas <strong>de</strong> conocimi<strong>en</strong>to sobre <strong>la</strong> cuestión criminal y abre<br />
una oportunidad p<strong>ar</strong>a g<strong>en</strong>er<strong>ar</strong> fuertes avances <strong>en</strong> <strong>la</strong> materia.<br />
El análisis <strong>de</strong> <strong>la</strong>s estadísticas sobre criminalidad pue<strong>de</strong> ser dividido <strong>en</strong> dos gran<strong>de</strong>s<br />
áreas: <strong>la</strong>s estadísticas oficiales, que toman <strong>com</strong>o fu<strong>en</strong>te el registro <strong>de</strong> ag<strong>en</strong>cias estatales<br />
(Policía, Po<strong>de</strong>r Judicial, P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias) y los estudios <strong>de</strong> victimización, que se basan <strong>en</strong><br />
<strong>en</strong>cuestas pob<strong>la</strong>cionales.<br />
La DNPC cu<strong>en</strong>ta con cinco sistemas <strong>de</strong> información que se utilizan <strong>com</strong>o fu<strong>en</strong>te p<strong>ar</strong>a <strong>la</strong><br />
g<strong>en</strong>eración <strong>de</strong> estadísticas oficiales:<br />
• Sistema Nacional <strong>de</strong> Información Criminal (SNIC).<br />
• Sistema <strong>de</strong> Alerta Temprano (SAT).<br />
• Sistema Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ).<br />
• Encuestas <strong>de</strong> Victimización.<br />
• Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP).<br />
2.4.1.1 Fu<strong>en</strong>tes Oficiales <strong>de</strong> Información y Estudios <strong>de</strong> Victimización.<br />
Las fu<strong>en</strong>tes oficiales <strong>de</strong> información criminal p<strong>en</strong>al son, <strong>com</strong>o se dijo anteriorm<strong>en</strong>te, los<br />
sistemas Policial, Judicial y al final <strong>de</strong> <strong>la</strong> “ca<strong>de</strong>na”, el P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io.<br />
Los <strong>de</strong>litos ingresan, <strong>en</strong> forma <strong>de</strong> <strong>de</strong>nuncias, a través <strong>de</strong>l Sistema Policial. Luego pasan<br />
por el Sistema Judicial, <strong>en</strong> don<strong>de</strong> se observa cuantitativam<strong>en</strong>te <strong>la</strong> imag<strong>en</strong> <strong>de</strong> un embudo,<br />
cuya boca es <strong>la</strong> institución policial, y se va angostando a medida <strong>en</strong> que se van<br />
atravesando <strong>la</strong>s diversas etapas <strong>de</strong>l proceso p<strong>en</strong>al. En esta instancia no se pres<strong>en</strong>ta<br />
ningún tipo <strong>de</strong> información sobre <strong>la</strong>s victimas <strong>de</strong> los <strong>de</strong>litos, a difer<strong>en</strong>cia <strong>de</strong> <strong>la</strong>s<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 23
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
estadísticas policiales. Sobre los pot<strong>en</strong>ciales of<strong>en</strong>sores, sólo se pres<strong>en</strong>ta <strong>la</strong> información<br />
referida a si se <strong>en</strong>cu<strong>en</strong>tran <strong>de</strong>t<strong>en</strong>idos o no durante <strong>en</strong> el proceso p<strong>en</strong>al. Finalm<strong>en</strong>te se<br />
ti<strong>en</strong>e al Sistema <strong>de</strong> Información P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia, don<strong>de</strong> <strong>la</strong> calidad <strong>de</strong> dicha información es<br />
<strong>la</strong> que provi<strong>en</strong>e <strong>de</strong>l sistema judicial [Figura 2.10].<br />
24<br />
Figura 2.10. Flujo <strong>de</strong> información criminal. [DNPC, 2007]<br />
Tal <strong>com</strong>o el título <strong>de</strong>l proyecto lo indica, se trabaj<strong>ar</strong>á con <strong>la</strong> información prov<strong>en</strong>i<strong>en</strong>te<br />
<strong>de</strong>l sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io únicam<strong>en</strong>te, <strong>de</strong>jando <strong>de</strong> <strong>la</strong>do <strong>la</strong> información prov<strong>en</strong>i<strong>en</strong>te <strong>de</strong>l<br />
SNIC (Sistema Nacional <strong>de</strong> Información Criminal) <strong>com</strong>o también <strong>de</strong>l SNEJ (Sistema<br />
Nacional <strong>de</strong> Estadísticas Judiciales). Se cree conv<strong>en</strong>i<strong>en</strong>te, igualm<strong>en</strong>te, <strong>de</strong>scribir<br />
brevem<strong>en</strong>te a estos dos últimos sistemas <strong>en</strong> c<strong>ar</strong>ácter informativo <strong>com</strong>o así también los<br />
métodos no oficiales <strong>de</strong> información <strong>de</strong>nominados estudios <strong>de</strong> victimización.<br />
2.4.1.1.1 Sistema Nacional <strong>de</strong> Información Criminal (SNIC)<br />
En el año 1999 <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal implem<strong>en</strong>tó el Sistema<br />
Nacional <strong>de</strong> Información Criminal <strong>com</strong>o p<strong>ar</strong>te <strong>de</strong> un programa <strong>de</strong> recolección,<br />
producción y análisis <strong>de</strong> informaciones estadísticas sobre el <strong>de</strong>lito <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina<br />
pret<strong>en</strong>di<strong>en</strong>do asumir <strong>la</strong> <strong>com</strong>pleja t<strong>ar</strong>ea <strong>de</strong> medir el <strong>de</strong>lito. Este sistema recopi<strong>la</strong> <strong>la</strong><br />
información registrada por <strong>la</strong>s fuerzas <strong>de</strong> seguridad (policías provinciales, policía<br />
fe<strong>de</strong>ral, g<strong>en</strong>d<strong>ar</strong>mería y prefectura naval) sobre <strong>la</strong> cantidad <strong>de</strong> sum<strong>ar</strong>ios iniciados<br />
m<strong>en</strong>sualm<strong>en</strong>te por hechos <strong>de</strong>lictuosos.<br />
Las policías y fuerzas <strong>de</strong> seguridad <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina pue<strong>de</strong>n tom<strong>ar</strong> conocimi<strong>en</strong>to <strong>de</strong> <strong>la</strong><br />
realización <strong>de</strong> una conducta que presuntam<strong>en</strong>te coinci<strong>de</strong> con <strong>la</strong> tipificada <strong>com</strong>o <strong>de</strong>lito<br />
por p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> ley p<strong>en</strong>al por dos mecanismos:<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
• Como consecu<strong>en</strong>cia <strong>de</strong> <strong>la</strong> actividad <strong>de</strong> prev<strong>en</strong>ción <strong>de</strong>l <strong>de</strong>lito (<strong>la</strong> vigi<strong>la</strong>ncia <strong>en</strong> sus<br />
diversas formas).<br />
• Como consecu<strong>en</strong>cia <strong>de</strong> <strong>la</strong> <strong>de</strong>nuncia realizada por un ciudadano que da lug<strong>ar</strong> a <strong>la</strong><br />
actividad <strong>de</strong> investigación <strong>de</strong>l <strong>de</strong>lito.<br />
El segundo mecanismo es cuantitativam<strong>en</strong>te más importante que el primero.<br />
En suma, los reportes que se realizan utilizando <strong>com</strong>o fu<strong>en</strong>te los hechos presuntam<strong>en</strong>te<br />
<strong>de</strong>lictuosos registrados por <strong>la</strong>s policías y <strong>de</strong>más fuerzas <strong>de</strong> seguridad, no incluy<strong>en</strong> los<br />
<strong>de</strong>litos no <strong>de</strong>nunciados ni los que ingresan directam<strong>en</strong>te por algún tribunal judicial<br />
(Juzgado, Fiscalía, Cám<strong>ar</strong>a). Esto quiere <strong>de</strong>cir, que existe una amplia gama <strong>de</strong> <strong>de</strong>litos<br />
que, al no ser <strong>de</strong>nunciados por sus víctimas ni captados por <strong>la</strong> policía, no ingresan al<br />
circuito judicial y, por lo tanto, no son registrados <strong>en</strong> <strong>la</strong> estadística oficial. Estos<br />
hechos ab<strong>ar</strong>can principalm<strong>en</strong>te a gran p<strong>ar</strong>te <strong>de</strong> robos, hurtos, lesiones y <strong>de</strong>litos sexuales,<br />
que por difer<strong>en</strong>tes razones no son <strong>de</strong>nunciados (porque <strong>la</strong> víctima no quiere per<strong>de</strong>r el<br />
tiempo, no cree que se pueda ac<strong>la</strong>r<strong>ar</strong> el hecho, etc.). Asimismo también hay una elevada<br />
cantidad <strong>de</strong> <strong>de</strong>litos que son muy difíciles <strong>de</strong> capt<strong>ar</strong> por el sistema <strong>de</strong> justicia por<br />
<strong>de</strong>fici<strong>en</strong>cias propias <strong>de</strong> los organismos <strong>de</strong> control (<strong>com</strong>o el caso <strong>de</strong> los <strong>de</strong>nominados<br />
“<strong>de</strong>litos <strong>com</strong>plejos”). Por tal motivo <strong>la</strong>s v<strong>ar</strong>iaciones que se produc<strong>en</strong> <strong>en</strong> <strong>la</strong>s cifras que<br />
reflejan estos reportes se limitan a <strong>la</strong>s v<strong>ar</strong>iaciones <strong>de</strong>tectadas por los propios organismos<br />
que <strong>la</strong> registran sin que esto, neces<strong>ar</strong>iam<strong>en</strong>te, implique un cambio real <strong>en</strong> <strong>la</strong> ocurr<strong>en</strong>cia<br />
<strong>de</strong> <strong>de</strong>litos (Cifras Negras <strong>de</strong>l Delito).<br />
Los registros m<strong>en</strong>suales se realizan <strong>en</strong> base a una p<strong>la</strong>nil<strong>la</strong> diseñada a tal fin, que <strong>la</strong>s<br />
policías y fuerzas <strong>de</strong> seguridad <strong>en</strong>vían a <strong>la</strong> DNPC [Anexo 1]. La tipificación <strong>de</strong> los<br />
hechos presuntam<strong>en</strong>te <strong>de</strong>lictuosos <strong>en</strong> esta p<strong>la</strong>nil<strong>la</strong>, continuando con una tradición <strong>de</strong><br />
relevami<strong>en</strong>to llevado a cabo por el Registro Nacional <strong>de</strong> Reinci<strong>de</strong>ncia y Estadística<br />
(antiguo consolidador <strong>de</strong> estadísticas a nivel Nacional), se <strong>en</strong>cu<strong>en</strong>tra fuertem<strong>en</strong>te<br />
asociada a <strong>la</strong>s figuras y tipos p<strong>en</strong>ales <strong>de</strong>scritos <strong>en</strong> el Código P<strong>en</strong>al. Los datos<br />
disponibles han sido agrupados sigui<strong>en</strong>do <strong>en</strong> p<strong>ar</strong>te <strong>la</strong> tipificación <strong>de</strong>l Código P<strong>en</strong>al (<strong>la</strong><br />
excepción ha sido los Delitos contra el Estado y <strong>la</strong> Comunidad) <strong>de</strong> modo tal que puedan<br />
a simple vista i<strong>de</strong>ntific<strong>ar</strong>se grupos según los bi<strong>en</strong>es jurídicos afectados:<br />
1 er Grupo - Delitos contra <strong>la</strong>s personas:<br />
Todos aquellos tipos <strong>de</strong> <strong>de</strong>litos que con un grado mayor o m<strong>en</strong>or <strong>de</strong> viol<strong>en</strong>cia afectan <strong>la</strong><br />
vida <strong>de</strong> <strong>la</strong>s personas.<br />
2 do Grupo - Delitos contra <strong>la</strong> honestidad y el honor:<br />
Las <strong>de</strong>nuncias por vio<strong>la</strong>ción han sido individualizadas p<strong>ar</strong>a po<strong>de</strong>r d<strong>ar</strong> cu<strong>en</strong>ta <strong>de</strong> este<br />
dato <strong>de</strong> manera <strong>de</strong>sagregada.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 25
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
3 er Grupo - Delitos contra <strong>la</strong> propiedad:<br />
Reúne todos aquellos hechos que afectan este bi<strong>en</strong> jurídico, se trate <strong>de</strong> robos, hurtos<br />
(incluy<strong>en</strong>do <strong>la</strong>s t<strong>en</strong>tativas <strong>en</strong> ambos casos) así <strong>com</strong>o todos los otros <strong>de</strong>litos que han sido<br />
agrupados <strong>en</strong> el Código P<strong>en</strong>al bajo este ítem.<br />
4 to Grupo - Delitos contra el Estado y <strong>la</strong> Comunidad:<br />
Incluye todos aquellos <strong>de</strong>litos que afectan al Estado <strong>en</strong> mayor o m<strong>en</strong>or medida.<br />
Otros Grupos:<br />
Los otros grupos son Delitos contra <strong>la</strong> libertad, Delitos contra el estado civil, Delitos<br />
previstos <strong>en</strong> leyes especiales, con <strong>la</strong> excepción <strong>de</strong> <strong>la</strong> ley 23.737 <strong>de</strong> Estupefaci<strong>en</strong>tes que,<br />
por trat<strong>ar</strong>se <strong>de</strong> aquél<strong>la</strong> que <strong>de</strong>ntro <strong>de</strong> <strong>la</strong>s leyes especiales conc<strong>en</strong>tra <strong>la</strong> mayor frecu<strong>en</strong>cia<br />
<strong>de</strong> hechos, ha sido consi<strong>de</strong>rada ap<strong>ar</strong>te (<strong>en</strong> el interior <strong>de</strong>l país sólo están informados los<br />
casos <strong>en</strong> los que p<strong>ar</strong>ticip<strong>ar</strong>on <strong>la</strong>s policías provinciales, restando los datos <strong>de</strong> <strong>la</strong>s<br />
<strong>de</strong>legaciones <strong>en</strong> el interior <strong>de</strong> <strong>la</strong> Policía Fe<strong>de</strong>ral Arg<strong>en</strong>tina).<br />
Adicional al SNIC, existe el Sistema <strong>de</strong> Alerta Temprana (SAT). Este se nutre <strong>de</strong> cuatro<br />
p<strong>la</strong>nil<strong>la</strong>s <strong>com</strong>plem<strong>en</strong>t<strong>ar</strong>ias a <strong>la</strong> <strong>de</strong>l SNIC que relevan información <strong>de</strong>tal<strong>la</strong>da sobre cuatro<br />
aspectos <strong>en</strong> p<strong>ar</strong>ticu<strong>la</strong>r:<br />
• homicidios dolosos.<br />
• homicidios culposos <strong>en</strong> acci<strong>de</strong>ntes <strong>de</strong> tránsito.<br />
• Suicidios.<br />
• <strong>de</strong>litos contra <strong>la</strong> propiedad.<br />
En los primeros tres casos se releva información puntual <strong>de</strong> cada hecho, mi<strong>en</strong>tras que el<br />
último consta <strong>de</strong> sum<strong>ar</strong>izaciones p<strong>ar</strong>ciales según distintas v<strong>ar</strong>iables [G<strong>ar</strong>cía M<strong>ar</strong>tínez et<br />
al, 2007].<br />
2.4.1.1.2 Sistema Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ)<br />
Las estadísticas judiciales sobre <strong>la</strong> criminalidad son el conjunto <strong>de</strong> <strong>la</strong>s informaciones<br />
cuantificadas sobre los <strong>com</strong>portami<strong>en</strong>tos efectivam<strong>en</strong>te producidos <strong>en</strong> <strong>la</strong> vida social,<br />
presuntam<strong>en</strong>te <strong>de</strong>lictuosos, que nac<strong>en</strong> <strong>de</strong> <strong>la</strong> actividad <strong>de</strong> <strong>de</strong>finición y registro por p<strong>ar</strong>te<br />
<strong>de</strong> <strong>la</strong>s instituciones judiciales p<strong>en</strong>ales, <strong>en</strong> el m<strong>ar</strong>co <strong>de</strong>l <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> los procesos p<strong>en</strong>ales<br />
[Sozzo, 2000]. En <strong>la</strong> Arg<strong>en</strong>tina, existe una administración fe<strong>de</strong>ral <strong>de</strong> justicia p<strong>en</strong>al con<br />
jurisdicción sobre todo el territorio nacional y <strong>com</strong>pet<strong>en</strong>cia sobre <strong>de</strong>terminados tipos <strong>de</strong><br />
<strong>de</strong>litos, una administración “nacional” <strong>de</strong> justicia p<strong>en</strong>al cuya jurisdicción es <strong>la</strong> Ciudad<br />
26<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
<strong>de</strong> Bu<strong>en</strong>os Aires y veinticuatro provinciales administraciones <strong>de</strong> justicia p<strong>en</strong>al. Esto<br />
hace que cada una <strong>de</strong> dichas instituciones estatales produzca su propia información<br />
sobre los <strong>com</strong>portami<strong>en</strong>tos presuntam<strong>en</strong>te <strong>de</strong>lictuosos procesados.<br />
Existe, <strong>en</strong>tonces, una pulverización <strong>de</strong> esta fu<strong>en</strong>te estadística <strong>de</strong> conocimi<strong>en</strong>to sobre <strong>la</strong><br />
cuestión criminal <strong>en</strong> torno a, por un <strong>la</strong>do, el po<strong>de</strong>r judicial fe<strong>de</strong>ral y por el otro, los<br />
diversos po<strong>de</strong>res judiciales provinciales. Esto se traduce <strong>en</strong> una diversidad <strong>de</strong> criterios<br />
p<strong>ar</strong>a <strong>la</strong> recolección y producción <strong>de</strong> información estadística <strong>en</strong> manos <strong>de</strong> oficinas<br />
administrativas <strong>de</strong> los diversos po<strong>de</strong>res judiciales, <strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes <strong>de</strong> <strong>la</strong>s distintas cortes<br />
supremas o tribunales supremos [Sozzo, 2000].<br />
Por otro <strong>la</strong>do, a difer<strong>en</strong>cia <strong>de</strong> lo que suce<strong>de</strong> con <strong>la</strong>s estadísticas policiales, aún no se ha<br />
avanzado <strong>de</strong>masiado <strong>en</strong> <strong>la</strong> creación <strong>de</strong> un sistema c<strong>en</strong>tralizado <strong>de</strong> estadísticas judiciales<br />
p<strong>ar</strong>a todo el país. Actualm<strong>en</strong>te <strong>en</strong> <strong>la</strong> DNPC se esta e<strong>la</strong>borando un diseño p<strong>ar</strong>a <strong>la</strong><br />
creación y funcionami<strong>en</strong>to <strong>de</strong> un Sistema Nacional <strong>de</strong> Estadísticas Judiciales<br />
automatizado [Sozzo, 2000].<br />
2.4.1.1.3 Encuestas <strong>de</strong> Victimización<br />
A fin <strong>de</strong> evalu<strong>ar</strong> <strong>en</strong> forma más certera el impacto que ti<strong>en</strong><strong>en</strong> los datos que registra <strong>la</strong><br />
policía (SNIC), es importante el aporte que han brindado los estudios <strong>de</strong> victimización,<br />
especialm<strong>en</strong>te a los fines <strong>de</strong> percibir el nivel <strong>de</strong> <strong>de</strong>nuncias <strong>de</strong> los <strong>de</strong>litos. Si bi<strong>en</strong> estos<br />
estudios ti<strong>en</strong><strong>en</strong> objetivos y metodologías distintas a <strong>la</strong>s estadísticas policiales, pue<strong>de</strong>n<br />
ser <strong>de</strong> suma utilidad p<strong>ar</strong>a <strong>com</strong>plem<strong>en</strong>t<strong>ar</strong> los resultados obt<strong>en</strong>idos por estas últimas.<br />
Las <strong>en</strong>cuestas <strong>de</strong> victimización nos permit<strong>en</strong> observ<strong>ar</strong> que es muy alta <strong>la</strong> cantidad <strong>de</strong><br />
<strong>de</strong>litos que no capta el sistema <strong>de</strong> justicia y, por <strong>en</strong><strong>de</strong>, el valor <strong>de</strong> <strong>la</strong> estadística oficial se<br />
<strong>en</strong>cu<strong>en</strong>tra condicionado. Estas limitaciones no implican que <strong>la</strong>s estadísticas policiales<br />
no sean <strong>de</strong> gran valor sino más bi<strong>en</strong> que su interpretación <strong>de</strong>be realiz<strong>ar</strong>se t<strong>en</strong>i<strong>en</strong>do <strong>en</strong><br />
cu<strong>en</strong>ta los condicionami<strong>en</strong>tos aludidos. En otras pa<strong>la</strong>bras, <strong>la</strong> información que surge <strong>de</strong><br />
<strong>la</strong>s estadísticas oficiales pres<strong>en</strong>tan fuertes limitaciones que <strong>de</strong>b<strong>en</strong> ser t<strong>en</strong>idas <strong>en</strong> cu<strong>en</strong>ta<br />
p<strong>ar</strong>a no tergivers<strong>ar</strong> su interpretación, pero esto no le resta importancia ni utilidad.<br />
Estos estudios ti<strong>en</strong><strong>en</strong> muchos b<strong>en</strong>eficios, <strong>en</strong>tre los que se <strong>de</strong>staca que, <strong>en</strong> muchos casos,<br />
son más repres<strong>en</strong>tativas que <strong>la</strong>s estadísticas oficiales ya que incluy<strong>en</strong> aquellos <strong>de</strong>litos<br />
que no ingres<strong>ar</strong>on al sistema <strong>de</strong> justicia. En efecto, una <strong>de</strong> <strong>la</strong>s cuestiones que abordan<br />
<strong>la</strong>s <strong>en</strong>cuestas <strong>de</strong> victimización son <strong>la</strong> cantidad <strong>de</strong> <strong>de</strong>litos que <strong>la</strong> g<strong>en</strong>te dijo haber sufrido<br />
<strong>en</strong> el período <strong>de</strong> estudio y su nivel <strong>de</strong> <strong>de</strong>nuncia. Es <strong>de</strong>cir que, sobre <strong>la</strong> base <strong>de</strong> estos<br />
estudios, se pue<strong>de</strong> conocer cual es el porc<strong>en</strong>taje <strong>de</strong> <strong>de</strong>litos que realm<strong>en</strong>te son<br />
<strong>de</strong>nunciados (el <strong>de</strong>nominado f<strong>en</strong>óm<strong>en</strong>o <strong>de</strong> <strong>la</strong> “cifras negras <strong>de</strong>l <strong>de</strong>lito”). Por otro <strong>la</strong>do,<br />
otra <strong>de</strong> <strong>la</strong>s c<strong>ar</strong>acterísticas <strong>de</strong>stacadas <strong>de</strong> <strong>la</strong>s <strong>en</strong>cuestas es que permit<strong>en</strong> acce<strong>de</strong>r al<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 27
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
conocimi<strong>en</strong>to <strong>de</strong>l “problema criminal” <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>la</strong>s propias víctimas y<br />
no <strong>de</strong> <strong>la</strong>s ag<strong>en</strong>cias estatales.<br />
De todas maneras, los estudios <strong>de</strong> victimización también ti<strong>en</strong><strong>en</strong> sus limitaciones, <strong>en</strong><br />
especial <strong>en</strong> cuanto a su alcance, tanto territorial <strong>com</strong>o a <strong>la</strong>s cuestiones que ab<strong>ar</strong>ca. En<br />
ese s<strong>en</strong>tido, <strong>la</strong>s <strong>en</strong>cuestas se realizan básicam<strong>en</strong>te <strong>en</strong> gran<strong>de</strong>s c<strong>en</strong>tros urbanos y los<br />
<strong>de</strong>litos que más óptimam<strong>en</strong>te capta son los <strong>de</strong>litos contra <strong>la</strong> propiedad (<strong>en</strong> especial<br />
robos y hurtos). En re<strong>la</strong>ción a otros <strong>de</strong>litos (homicidios, <strong>de</strong>litos sexuales, viol<strong>en</strong>cia<br />
famili<strong>ar</strong>, <strong>de</strong>litos <strong>com</strong>plejos), no resulta un instrum<strong>en</strong>to muy efectivo ya que son<br />
conductas difíciles <strong>de</strong> abord<strong>ar</strong> <strong>en</strong> <strong>en</strong>trevistas <strong>de</strong> estas c<strong>ar</strong>acterísticas [O<strong>la</strong>eta, 2006].<br />
2.4.1.1.4 Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP)<br />
El Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) es un aporte<br />
vital p<strong>ar</strong>a el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> un diagnóstico válido sobre el estado actual <strong>de</strong> <strong>la</strong> cuestión<br />
c<strong>ar</strong>ce<strong>la</strong>ria a fines <strong>de</strong> aplic<strong>ar</strong> una política criminal eficaz.<br />
El Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) fue<br />
implem<strong>en</strong>tado <strong>en</strong> el año 2002 por <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal con el fin<br />
<strong>de</strong> cont<strong>ar</strong> con información periódica y uniforme acerca <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción p<strong>en</strong>al privada <strong>de</strong><br />
libertad <strong>en</strong> <strong>la</strong> República Arg<strong>en</strong>tina.<br />
En nuestro país exist<strong>en</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias a nivel fe<strong>de</strong>ral, el Servicio<br />
P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral, con unida<strong>de</strong>s ubicadas <strong>en</strong> todo el país, y a nivel provincial,<br />
veintitrés provincias pose<strong>en</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias propias organizadas<br />
g<strong>en</strong>eralm<strong>en</strong>te bajo <strong>la</strong> forma <strong>de</strong> un servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io provincial o esquema análogo.<br />
Es <strong>de</strong>cir, que se trata <strong>de</strong> una pluralidad <strong>de</strong> instituciones ubicadas bajos <strong>com</strong>pet<strong>en</strong>cias<br />
jurídicas y políticas difer<strong>en</strong>tes [DNPC, 2003]. A<strong>de</strong>más, <strong>en</strong> nuestro país se ha constatado<br />
<strong>en</strong> los últimos años una creci<strong>en</strong>te cantidad <strong>de</strong> casos <strong>de</strong> personas privadas <strong>de</strong> libertad<br />
alojadas <strong>en</strong> lug<strong>ar</strong>es no aptos a tal fin tal, <strong>com</strong>o <strong>com</strong>is<strong>ar</strong>ías u otros <strong>de</strong>stacam<strong>en</strong>tos<br />
policiales. Esta <strong>com</strong>pleja organización dificultó el diseño <strong>de</strong> un sistema válido <strong>de</strong><br />
recopi<strong>la</strong>ción periódica <strong>de</strong> datos <strong>com</strong>p<strong>ar</strong>ables p<strong>ar</strong>a todo el país, que tuviera <strong>la</strong>s mismas<br />
unida<strong>de</strong>s <strong>de</strong> análisis y cu<strong>en</strong>te con el rigor ci<strong>en</strong>tífico neces<strong>ar</strong>io.<br />
En el campo <strong>de</strong> <strong>la</strong>s estadísticas sobre el sistema p<strong>en</strong>al, <strong>com</strong>o se observó <strong>en</strong> el punto<br />
2.2.1.1, el SNEEP ab<strong>ar</strong>ca uno <strong>de</strong> los tres ejes básicos <strong>de</strong> información, el correspondi<strong>en</strong>te<br />
a <strong>la</strong> ag<strong>en</strong>cia p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia; mi<strong>en</strong>tras que <strong>la</strong>s otras dos ag<strong>en</strong>cias, policial y judicial, son<br />
abordadas por el Sistema Nacional <strong>de</strong> Información Criminal (SNIC) y el Sistema<br />
Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ), respectivam<strong>en</strong>te [Figura 2.1]. En tal s<strong>en</strong>tido,<br />
los resultados que nac<strong>en</strong> <strong>de</strong> <strong>la</strong> aplicación <strong>de</strong> estos sistemas <strong>de</strong> información permit<strong>en</strong><br />
28<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
trabaj<strong>ar</strong> <strong>en</strong> un diagnóstico acerca <strong>de</strong> <strong>la</strong> criminalidad <strong>de</strong>s<strong>de</strong> <strong>la</strong> p<strong>ar</strong>ticu<strong>la</strong>r mirada <strong>de</strong> <strong>la</strong>s<br />
ag<strong>en</strong>cias productoras <strong>de</strong> datos. Se cree que el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong>l SNEEP permite afront<strong>ar</strong> <strong>de</strong><br />
modo sust<strong>en</strong>table el diseño <strong>de</strong> políticas <strong>en</strong> materia p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia tanto a nivel fe<strong>de</strong>ral<br />
<strong>com</strong>o provincial.<br />
2.4.1.1.4.1 Metodología <strong>de</strong>l Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong><br />
P<strong>en</strong>a<br />
El SNEEP ti<strong>en</strong>e <strong>com</strong>o <strong>de</strong>stinat<strong>ar</strong>ios a todas <strong>la</strong>s unida<strong>de</strong>s <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción p<strong>en</strong>al <strong>de</strong> país,<br />
<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes <strong>de</strong>l sistema fe<strong>de</strong>ral y provincial. Es <strong>de</strong>cir no se incluye <strong>en</strong> esta etapa a <strong>la</strong>s<br />
personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías y a los niños y jóv<strong>en</strong>es privados <strong>de</strong> libertad que no se<br />
<strong>en</strong>cu<strong>en</strong>tran <strong>en</strong> una unidad <strong>de</strong> ejecución p<strong>en</strong>al. Cabe ac<strong>la</strong>r<strong>ar</strong> que si bi<strong>en</strong> <strong>la</strong>s <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias<br />
policiales no <strong>de</strong>b<strong>en</strong> consi<strong>de</strong>r<strong>ar</strong>se p<strong>la</strong>zas c<strong>ar</strong>ce<strong>la</strong>rias, <strong>en</strong> tanto no reún<strong>en</strong> <strong>la</strong>s condiciones<br />
requeridas p<strong>ar</strong>a los lug<strong>ar</strong>es <strong>de</strong> cumplimi<strong>en</strong>to <strong>de</strong> p<strong>en</strong>a y/o prisión prev<strong>en</strong>tiva [CELS,<br />
2005] constituy<strong>en</strong> una realidad insos<strong>la</strong>yable a <strong>la</strong> hora <strong>de</strong> analiz<strong>ar</strong> <strong>la</strong> situación <strong>de</strong>l sistema<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> nuestro país.<br />
El relevami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información se realiza <strong>en</strong> forma anual a través <strong>de</strong> dos<br />
cuestion<strong>ar</strong>ios que se <strong>com</strong>pletan <strong>en</strong> cada unidad <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción. El diseño <strong>de</strong> los<br />
instrum<strong>en</strong>tos <strong>de</strong> recolección <strong>de</strong> datos se llevó a cabo t<strong>en</strong>i<strong>en</strong>do <strong>com</strong>o refer<strong>en</strong>cia <strong>la</strong> ley<br />
24.660.<br />
El primero <strong>de</strong> los instrum<strong>en</strong>tos consiste <strong>en</strong> una serie <strong>de</strong> cuadros básicos con información<br />
agrupada, tomando <strong>com</strong>o unidad <strong>de</strong> análisis al establecimi<strong>en</strong>to, <strong>en</strong> base a <strong>la</strong>s personas<br />
alojadas <strong>en</strong> el establecimi<strong>en</strong>to <strong>en</strong> cuestión durante el último año. Los datos requeridos<br />
son los sigui<strong>en</strong>tes [Anexo 2]:<br />
• Cantidad total <strong>de</strong> <strong>de</strong>t<strong>en</strong>idos<br />
• Situación legal<br />
• Egresos<br />
• Cantidad <strong>de</strong> visitas<br />
• Cantidad <strong>de</strong> alteraciones al or<strong>de</strong>n<br />
• Cantidad <strong>de</strong> suicidios<br />
• Cantidad <strong>de</strong> fallecidos<br />
• Cantidad <strong>de</strong> fugas<br />
• Cantidad <strong>de</strong> evasiones<br />
El segundo instrum<strong>en</strong>to consiste <strong>en</strong> un c<strong>en</strong>so sobre el total <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>t<strong>en</strong>ida al<br />
día 31 <strong>de</strong> diciembre <strong>de</strong> cada año <strong>en</strong> el establecimi<strong>en</strong>to. Aquí <strong>la</strong> unidad <strong>de</strong> análisis son<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 29
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
<strong>la</strong>s personas <strong>de</strong>t<strong>en</strong>idas a esa fecha. En el anexo 3 se pres<strong>en</strong>ta <strong>la</strong> información que se<br />
recava sobre cada interno mediante el c<strong>en</strong>so <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción.<br />
Cabe <strong>de</strong>stac<strong>ar</strong> que <strong>la</strong> p<strong>la</strong>nil<strong>la</strong> se ll<strong>en</strong>a mediante una codificación <strong>de</strong> <strong>la</strong>s v<strong>ar</strong>iables, por lo<br />
que es importante ac<strong>la</strong>r<strong>ar</strong> que el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> <strong>la</strong>s estadísticas criminales <strong>en</strong> <strong>la</strong>s unida<strong>de</strong>s<br />
<strong>de</strong> <strong>de</strong>t<strong>en</strong>ción ti<strong>en</strong>e sus limitaciones.<br />
La falta <strong>de</strong> recursos y <strong>de</strong> personal capacitado, conjuntam<strong>en</strong>te con una poca tradición <strong>en</strong><br />
el manejo y producción <strong>de</strong> información por p<strong>ar</strong>te <strong>de</strong> <strong>la</strong>s instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias,<br />
<strong>com</strong>plica <strong>la</strong> t<strong>ar</strong>ea <strong>de</strong> recolección <strong>de</strong> datos. Esta <strong>de</strong>fici<strong>en</strong>cia trae <strong>com</strong>o consecu<strong>en</strong>cia <strong>la</strong><br />
falta <strong>de</strong> datos o <strong>la</strong> exist<strong>en</strong>cia <strong>de</strong> ciertas inconsist<strong>en</strong>cias <strong>en</strong> <strong>la</strong> información remitida <strong>en</strong><br />
algunos casos p<strong>ar</strong>ticu<strong>la</strong>res. En este s<strong>en</strong>tido, <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal<br />
t<strong>en</strong>drá que reforz<strong>ar</strong> los esfuerzos <strong>en</strong> lo refer<strong>en</strong>te a <strong>la</strong>s t<strong>ar</strong>eas <strong>de</strong> capacitación <strong>de</strong>l personal<br />
y cada organismo provincial y fe<strong>de</strong>ral <strong>com</strong>pet<strong>en</strong>te <strong>en</strong> esta materia t<strong>en</strong>drá que apoy<strong>ar</strong> el<br />
esfuerzo que realizan los <strong>en</strong>c<strong>ar</strong>gados <strong>de</strong> confeccion<strong>ar</strong> <strong>la</strong>s estadísticas <strong>en</strong> cada instituto.<br />
La información remitida pres<strong>en</strong>ta limitaciones propias <strong>de</strong> <strong>la</strong> fu<strong>en</strong>te <strong>de</strong> orig<strong>en</strong>. Se trata <strong>de</strong><br />
un relevami<strong>en</strong>to <strong>en</strong> el que <strong>la</strong> visión <strong>de</strong> los servicios p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios o policías locales<br />
acerca <strong>de</strong> <strong>la</strong>s personas <strong>de</strong>t<strong>en</strong>idas resulta fundam<strong>en</strong>tal. En tal s<strong>en</strong>tido, <strong>la</strong> principal fu<strong>en</strong>te<br />
<strong>de</strong> información es el legajo <strong>de</strong> cada interno por lo que exist<strong>en</strong> datos que no pue<strong>de</strong>n ser<br />
profundizados y otros que se <strong>en</strong>cu<strong>en</strong>tran sesgados por <strong>la</strong> propia fu<strong>en</strong>te. De todas<br />
maneras, se cree que t<strong>en</strong>er pres<strong>en</strong>te <strong>la</strong>s limitaciones referidas no le resta importancia al<br />
c<strong>en</strong>so <strong>en</strong> tanto se interprete con <strong>la</strong>s <strong>de</strong>bidas precauciones metodológicas y teóricas<br />
[Dirección Nacional <strong>de</strong> Política Criminal, 2005].<br />
Finalm<strong>en</strong>te, <strong>la</strong> oficina c<strong>en</strong>tral <strong>de</strong> cada servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io, o policía local, es <strong>la</strong><br />
<strong>en</strong>c<strong>ar</strong>gada <strong>de</strong> recopi<strong>la</strong>r <strong>la</strong>s p<strong>la</strong>nil<strong>la</strong>s <strong>de</strong> todos sus establecimi<strong>en</strong>tos y remitir<strong>la</strong>s a <strong>la</strong><br />
Dirección Nacional <strong>de</strong> Política Criminal <strong>en</strong> don<strong>de</strong> se vuelcan los datos <strong>en</strong> una base <strong>de</strong><br />
datos diseñada p<strong>ar</strong>a tal fin. Con los principales resultados obt<strong>en</strong>idos <strong>de</strong>l análisis <strong>de</strong> <strong>la</strong><br />
información se realizan informes que son remitidos a <strong>la</strong>s autorida<strong>de</strong>s nacionales y<br />
provinciales <strong>com</strong>pet<strong>en</strong>tes y se publican <strong>en</strong> <strong>la</strong> página Web <strong>de</strong>l Ministerio <strong>de</strong> Justicia y<br />
Derechos Humanos.<br />
Como se <strong>com</strong><strong>en</strong>ta <strong>en</strong> el punto 2.4.1.1 el trabajo se bas<strong>ar</strong>á <strong>en</strong> <strong>la</strong> c<strong>ar</strong>acterización <strong>de</strong> <strong>la</strong><br />
pob<strong>la</strong>ción ubicada <strong>en</strong> los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios <strong>de</strong> <strong>la</strong> Arg<strong>en</strong>tina. Los datos a<br />
utiliz<strong>ar</strong> se analiz<strong>ar</strong>án <strong>en</strong> <strong>la</strong> sección 4.2.2.Compresión <strong>de</strong> los Datos.<br />
30<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
2.4.1.1.5 Sistema Unificado <strong>de</strong> Registros Criminales (SURC)<br />
En el año 2003 se crea el SURC a c<strong>ar</strong>go <strong>de</strong>l Ministerio <strong>de</strong> Justicia, Seguridad y<br />
Derechos Humanos, con el fin <strong>de</strong> integr<strong>ar</strong> y unific<strong>ar</strong> <strong>en</strong> una so<strong>la</strong> base <strong>de</strong> datos el manejo<br />
<strong>de</strong> información criminal y logr<strong>ar</strong> servir al Mapa <strong>de</strong>l Delito. Era sumam<strong>en</strong>te neces<strong>ar</strong>io<br />
p<strong>ar</strong>a ese <strong>en</strong>tonces logr<strong>ar</strong> interconect<strong>ar</strong> <strong>la</strong>s bases <strong>de</strong> datos criminales <strong>de</strong> <strong>la</strong>s fuerzas<br />
policiales, <strong>de</strong> seguridad y fiscalías <strong>de</strong>l país, mediante una red que permitiría realiz<strong>ar</strong> una<br />
consulta on line a un banco <strong>de</strong> datos alim<strong>en</strong>tado <strong>en</strong> tiempo real. El Mapa <strong>de</strong>l Delito iba a<br />
est<strong>ar</strong> disponible <strong>en</strong> Internet p<strong>ar</strong>a que pudiera ser consultado por todos los ciudadanos.<br />
La iniciativa <strong>de</strong> <strong>la</strong> Secret<strong>ar</strong>ía <strong>de</strong> Seguridad Interior pret<strong>en</strong>día, <strong>en</strong> una primera etapa,<br />
interconect<strong>ar</strong> <strong>la</strong> Capital Fe<strong>de</strong>ral; <strong>en</strong> <strong>la</strong> segunda, <strong>la</strong>s fiscalías <strong>de</strong> <strong>la</strong> zona norte <strong>de</strong>l<br />
conurbano; luego, ext<strong>en</strong><strong>de</strong>r <strong>la</strong> experi<strong>en</strong>cia al primer y segundo cordón <strong>de</strong>l conurbano y<br />
al resto <strong>de</strong>l país. Y <strong>la</strong> última etapa <strong>de</strong>l proyecto consistía <strong>en</strong> interconect<strong>ar</strong> el banco <strong>de</strong><br />
datos con diversas bases <strong>de</strong>l MERCOSUR p<strong>ar</strong>a <strong>la</strong> persecución <strong>de</strong> <strong>de</strong>litos<br />
transnacionales <strong>com</strong>o el terrorismo, el n<strong>ar</strong>cotráfico y el robo y contrabando <strong>de</strong> vehículos<br />
importados.<br />
Los objetivos <strong>de</strong> mejora <strong>de</strong>l SURC consistían <strong>en</strong> [Val<strong>en</strong>ga, 2007]:<br />
• Interconect<strong>ar</strong> y sincroniz<strong>ar</strong> los sistemas judiciales, <strong>de</strong>l Ministerio Público, <strong>la</strong>s<br />
policías y Fuerzas <strong>de</strong> Seguridad p<strong>ar</strong>a llev<strong>ar</strong> a cabo investigaciones a nivel b<strong>ar</strong>rial<br />
y urbano.<br />
• Fortalecer el esfuerzo nacional <strong>de</strong> Policía, el Sistema <strong>de</strong> Seguridad Interior, <strong>la</strong><br />
Intelig<strong>en</strong>cia Criminal con su vincu<strong>la</strong>ción al Sistema P<strong>en</strong>al, y <strong>de</strong> todos ellos, con<br />
los países <strong>de</strong>l MERCOSUR.<br />
• Hacer uso <strong>de</strong> mapas <strong>de</strong>l <strong>de</strong>lito basados <strong>en</strong> Sistemas <strong>de</strong> Información Geográfica<br />
(SIG) <strong>com</strong>o herrami<strong>en</strong>ta p<strong>ar</strong>a automatiz<strong>ar</strong> t<strong>ar</strong>eas <strong>de</strong> recopi<strong>la</strong>ción <strong>de</strong> datos, el<br />
acceso y análisis <strong>de</strong> los mismos <strong>en</strong> tiempo real.<br />
• Agiliz<strong>ar</strong> los procedimi<strong>en</strong>tos, facilitando el acceso a <strong>la</strong> información por p<strong>ar</strong>te <strong>de</strong><br />
todos los actores involucrados <strong>en</strong> el sistema.<br />
• Estand<strong>ar</strong>iz<strong>ar</strong> <strong>la</strong> información sobre <strong>de</strong>litos y su uso p<strong>ar</strong>a <strong>la</strong>s estrategias <strong>de</strong><br />
investigación.<br />
• Sistematiz<strong>ar</strong> los procesos administrativos <strong>de</strong> los expedi<strong>en</strong>tes y <strong>de</strong> recopi<strong>la</strong>ción <strong>de</strong><br />
información sobre hechos criminales <strong>en</strong> una fiscalía.<br />
• Sistematiz<strong>ar</strong> <strong>la</strong> re<strong>la</strong>ción <strong>en</strong>tre los hechos, los imputados (individuales, grupos o<br />
bandas <strong>de</strong>lictivas), con los <strong>de</strong>nunciantes o victimas.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 31
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
El sistema permitiría, a p<strong>ar</strong>tir <strong>de</strong> los resultados proporcionados por <strong>la</strong>s búsquedas <strong>de</strong><br />
hechos con c<strong>ar</strong>acterísticas simi<strong>la</strong>res, individualiz<strong>ar</strong> y responsabiliz<strong>ar</strong> a personas<br />
imputadas por otros hechos <strong>en</strong> <strong>la</strong>s que pudier<strong>en</strong> haber p<strong>ar</strong>ticipado.<br />
La base <strong>de</strong> datos <strong>de</strong>l SURC almac<strong>en</strong>aba todo tipo <strong>de</strong> información diversa re<strong>la</strong>cionada a<br />
hechos <strong>de</strong>lictivos [Perversi ,2007; Val<strong>en</strong>ga, 2007]:<br />
32<br />
• Registro <strong>de</strong> Hechos: c<strong>ar</strong>acterísticas principales <strong>de</strong>l hecho (lug<strong>ar</strong>, <strong>de</strong>lito<br />
<strong>de</strong>nunciado, <strong>com</strong>is<strong>ar</strong>ía intervini<strong>en</strong>te).<br />
• Registro <strong>de</strong> <strong>de</strong>nunciantes: toda aquel<strong>la</strong> información que permite i<strong>de</strong>ntific<strong>ar</strong> a <strong>la</strong><br />
víctima o <strong>de</strong>nunciante.<br />
• Registro <strong>de</strong> autores i<strong>de</strong>ntificados: i<strong>de</strong>ntidad, c<strong>ar</strong>acterísticas, historial criminal<br />
e imág<strong>en</strong>es <strong>de</strong> los autores. Aquí se p<strong>la</strong>nificaba gu<strong>ar</strong>d<strong>ar</strong> lo neces<strong>ar</strong>io p<strong>ar</strong>a <strong>la</strong><br />
i<strong>de</strong>ntificación <strong>de</strong>l autor, <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>ndo el primer banco <strong>de</strong> imág<strong>en</strong>es <strong>de</strong> Autores<br />
Individualizados.<br />
• Registro <strong>de</strong> autos No i<strong>de</strong>ntificados: <strong>de</strong>scripción fisonómica <strong>de</strong> los NN tal<br />
<strong>com</strong>o <strong>la</strong> contextura física, edad aproximada, estatura aproximada, tonada, señas<br />
p<strong>ar</strong>ticu<strong>la</strong>res, tipo <strong>de</strong> rostro, color <strong>de</strong>l pelo, frases o <strong>com</strong><strong>en</strong>t<strong>ar</strong>ios.<br />
• Registro <strong>de</strong> Elem<strong>en</strong>tos Sustraídos: dispone <strong>de</strong> <strong>la</strong> información <strong>de</strong> aquellos<br />
elem<strong>en</strong>tos que fueron sustraídos <strong>en</strong> el hecho <strong>de</strong>lictivo.<br />
• Registro <strong>de</strong> autos robados: registra toda <strong>la</strong> información re<strong>la</strong>tiva a vehículos<br />
robados, <strong>com</strong>o el número <strong>de</strong> pat<strong>en</strong>te, motor, chasis, color, señas p<strong>ar</strong>ticu<strong>la</strong>res <strong>de</strong>l<br />
automotor, m<strong>ar</strong>ca, mo<strong>de</strong>lo, etc.<br />
• Registro <strong>de</strong> <strong>ar</strong>mas secuestradas: registros neces<strong>ar</strong>ios p<strong>ar</strong>a i<strong>de</strong>ntific<strong>ar</strong> <strong>ar</strong>mas<br />
vincu<strong>la</strong>ndo esta base <strong>de</strong> datos con otros sistemas.<br />
• Registro <strong>de</strong> evi<strong>de</strong>ncias: <strong>de</strong>scripción <strong>de</strong> todo aquello consi<strong>de</strong>rado huel<strong>la</strong> o pista<br />
<strong>en</strong> <strong>la</strong> esc<strong>en</strong>a <strong>de</strong>l crim<strong>en</strong>.<br />
• Mapas <strong>de</strong>l <strong>de</strong>lito: aportando <strong>la</strong> información <strong>de</strong>s<strong>de</strong> <strong>la</strong> perspectiva geográfica<br />
permiti<strong>en</strong>do g<strong>en</strong>er<strong>ar</strong> Mapas <strong>de</strong>l Delito. Estos mapas permitirán utiliz<strong>ar</strong> y<br />
administr<strong>ar</strong> más efici<strong>en</strong>tem<strong>en</strong>te los recursos <strong>de</strong> <strong>la</strong>s fuerzas policiales y <strong>la</strong>s<br />
fiscalías <strong>en</strong> <strong>la</strong> lucha contra el <strong>de</strong>lito<br />
Este proyecto, tal <strong>com</strong>o se dijo anteriorm<strong>en</strong>te, <strong>com</strong>pr<strong>en</strong>día v<strong>ar</strong>ias etapas progresivas. Sin<br />
emb<strong>ar</strong>go, con <strong>la</strong> salida <strong>en</strong> el año 2004 <strong>de</strong>l <strong>en</strong>tonces Ministro <strong>de</strong> Justicia, Seguridad y<br />
Derechos Humanos, Gustavo Béliz, el proyecto se conge<strong>la</strong>, sin conocimi<strong>en</strong>to alguno <strong>de</strong>l<br />
p<strong>ar</strong>a<strong>de</strong>ro actual <strong>de</strong>l mismo.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
2.4.1.1.6 Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires<br />
El Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires (CABA) [Beh<strong>ar</strong> & Lucilli,<br />
2003] surge a p<strong>ar</strong>tir <strong>de</strong> un conv<strong>en</strong>io <strong>en</strong>tre el C<strong>en</strong>tro <strong>de</strong> Información Metropolitana <strong>de</strong> <strong>la</strong><br />
Facultad <strong>de</strong> Arquitectura, Diseño y Urbanismo <strong>de</strong> <strong>la</strong> UBA y el Ministerio Público Fiscal<br />
<strong>de</strong> <strong>la</strong> Nación. Este proyecto nace con el objetivo <strong>de</strong> g<strong>en</strong>er<strong>ar</strong> un procedimi<strong>en</strong>to<br />
metodológico p<strong>ar</strong>a <strong>la</strong> <strong>de</strong>tección espacial <strong>de</strong> los <strong>de</strong>litos buscando reducir el increm<strong>en</strong>to<br />
<strong>de</strong> los mismos que se v<strong>en</strong>ia dando <strong>en</strong> <strong>la</strong> CABA <strong>en</strong> el año 2003.<br />
La fu<strong>en</strong>te sobre <strong>la</strong> cual se fundam<strong>en</strong>ta el Mapa <strong>de</strong>l <strong>de</strong>lito es una base única <strong>de</strong> hechos<br />
<strong>de</strong>lictivos g<strong>en</strong>erada por el Ministerio Público Fiscal <strong>de</strong> <strong>la</strong> Nación (MPF). Dicha base<br />
consta <strong>de</strong> más <strong>de</strong> 200,000 registros anuales, alim<strong>en</strong>tada <strong>en</strong> forma perman<strong>en</strong>te y<br />
sistemática. Cada registro conti<strong>en</strong>e <strong>la</strong> información acerca <strong>de</strong>l lug<strong>ar</strong> geográfico <strong>en</strong> que se<br />
produjo el hecho, fecha, tipo <strong>de</strong> <strong>de</strong>lito tipificado por el Código P<strong>en</strong>al, <strong>com</strong>is<strong>ar</strong>ías y<br />
fiscalías intervini<strong>en</strong>tes, número <strong>de</strong> actuación, cantidad <strong>de</strong> victimas, etc.<br />
Por otro <strong>la</strong>do se cu<strong>en</strong>ta con el Sistema <strong>de</strong> Información Territorial <strong>de</strong>l Área<br />
Metropolitana <strong>de</strong> Bu<strong>en</strong>os Aires (SIT/AMBA), g<strong>en</strong>erada <strong>en</strong> el C<strong>en</strong>tro <strong>de</strong> Información<br />
Metropolitana (CIM) a p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong> tecnología <strong>de</strong> Sistemas <strong>de</strong> Información Geográfica<br />
(SIG). Esta tecnología sirve <strong>de</strong> apoyo al Sistema <strong>de</strong> Información Territorial <strong>de</strong>l AMBA.<br />
La unión <strong>de</strong> estos dos <strong>com</strong>pon<strong>en</strong>tes, <strong>la</strong> base alfanumérica <strong>de</strong> <strong>de</strong>litos (MPF) y <strong>la</strong> base<br />
c<strong>ar</strong>tográfica digital (CIM), permit<strong>en</strong> g<strong>en</strong>er<strong>ar</strong> difer<strong>en</strong>tes salidas gráficas p<strong>ar</strong>a visualiz<strong>ar</strong> <strong>la</strong><br />
problemática <strong>de</strong>lictiva, <strong>de</strong>scubrir <strong>la</strong>s áreas <strong>de</strong> conc<strong>en</strong>tración, sus t<strong>en</strong><strong>de</strong>ncias, su<br />
estacionalidad y po<strong>de</strong>r vincu<strong>la</strong>r<strong>la</strong>s con <strong>la</strong>s v<strong>ar</strong>iables territoriales (urbanísticas,<br />
socioeconómicas, calidad <strong>de</strong> vida).<br />
El concepto <strong>en</strong> el que se basan los Mapas <strong>de</strong>l <strong>de</strong>lito es el <strong>de</strong> “áreas cali<strong>en</strong>tes”. Estas<br />
últimas son conc<strong>en</strong>traciones <strong>de</strong> inci<strong>de</strong>ntes <strong>de</strong>ntro <strong>de</strong> un área geográfica limitada que<br />
ap<strong>ar</strong>ece <strong>en</strong> un <strong>la</strong>pso <strong>de</strong> tiempo.<br />
En <strong>la</strong> figura 2.11 se muestran <strong>la</strong>s distintas pantal<strong>la</strong>s <strong>de</strong> <strong>la</strong> base c<strong>ar</strong>tográfica digital CIM.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 33
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
34<br />
Figura 2.11. Mapa <strong>de</strong> los Delitos contra <strong>la</strong> Propiedad [Beh<strong>ar</strong> & Lucilli, 2003].<br />
2.5 DIAGNÓSTICO DEL SERVICIO PENITENCIARIO EN ARGENTINA<br />
Esta p<strong>ar</strong>te <strong>de</strong>l estudio ti<strong>en</strong>e por objetivo analiz<strong>ar</strong> brevem<strong>en</strong>te el funcionami<strong>en</strong>to actual<br />
<strong>de</strong>l servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> su conjunto, <strong>de</strong>tal<strong>la</strong>ndo indicadores y aspectos c<strong>la</strong>ves que<br />
se <strong>de</strong>b<strong>en</strong> t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta a <strong>la</strong> hora <strong>de</strong> c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina.<br />
2.5.1 Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción P<strong>en</strong>al <strong>en</strong> Arg<strong>en</strong>tina<br />
La situación p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia repres<strong>en</strong>ta <strong>de</strong>s<strong>de</strong> hace ya v<strong>ar</strong>ios años un tema <strong>de</strong> especial<br />
preocupación <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina. El crecimi<strong>en</strong>to <strong>en</strong> <strong>la</strong>s tasas <strong>de</strong> <strong>de</strong>litos registrado a lo <strong>la</strong>rgo<br />
<strong>de</strong> <strong>la</strong> década <strong>de</strong>l nov<strong>en</strong>ta fue a<strong>com</strong>pañado por un fuerte aum<strong>en</strong>to <strong>en</strong> <strong>la</strong> pob<strong>la</strong>ción privada<br />
<strong>de</strong> libertad. Entre los años 1997 y 2006 dicha pob<strong>la</strong>ción aum<strong>en</strong>tó alre<strong>de</strong>dor <strong>de</strong>l 83%,<br />
afectado profundam<strong>en</strong>te por <strong>la</strong> crisis político social vivida <strong>en</strong>tre los años 2001 y 2002.<br />
Como se pue<strong>de</strong> observ<strong>ar</strong> <strong>en</strong> <strong>la</strong> figura 2.12, <strong>la</strong> cantidad <strong>de</strong> presos <strong>en</strong> el año 2005 llegaba<br />
a un pico 55.423 personas, con un índice <strong>de</strong> reclusos cada 100.000 habitantes. Estos<br />
increm<strong>en</strong>tos han insta<strong>la</strong>do el tema <strong>com</strong>o uno <strong>de</strong> los puntos inevitables <strong>de</strong> estudio <strong>de</strong>ntro<br />
<strong>de</strong> <strong>la</strong> política criminal [Dirección Nacional <strong>de</strong> Política Criminal, 2005].<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Presos<br />
60,000<br />
50,000<br />
40,000<br />
30,000<br />
20,000<br />
10,000<br />
0<br />
29,690 30,145<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
31,683<br />
83 84 87<br />
37,885<br />
103<br />
41,007<br />
110<br />
46,288<br />
51,998<br />
54,472 55,423<br />
54,000<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 35<br />
123<br />
137<br />
142 144<br />
C/ 100.000 Hab.<br />
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006<br />
Año<br />
Figura 2.12. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina. [DNPC, 2006]<br />
Vale <strong>de</strong>stac<strong>ar</strong>, que <strong>la</strong> estadística oficial sobre pob<strong>la</strong>ción p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia (SNEEP) <strong>com</strong><strong>en</strong>zó<br />
<strong>en</strong> el año 2002. De los años anteriores no se cu<strong>en</strong>ta con datos <strong>de</strong> algunas provincias.<br />
Por otro <strong>la</strong>do, <strong>en</strong> nuestro país exist<strong>en</strong> dos tipos <strong>de</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias según<br />
<strong>com</strong>o estén organizadas y bajo que <strong>com</strong>pet<strong>en</strong>cias jurídicas se <strong>en</strong>cu<strong>en</strong>tran. Las primeras<br />
a nivel fe<strong>de</strong>ral, Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral, que pose<strong>en</strong> unida<strong>de</strong>s ubicadas <strong>en</strong> v<strong>ar</strong>ias<br />
provincias <strong>de</strong>l país. El segundo tipo es a nivel provincial, y son veintitrés provincias que<br />
pose<strong>en</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias propias, organizadas g<strong>en</strong>eralm<strong>en</strong>te bajo <strong>la</strong> forma <strong>de</strong><br />
un servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io provincial. A estos dos tipos <strong>de</strong> instituciones habría que<br />
sum<strong>ar</strong>le <strong>la</strong>s <strong>com</strong>is<strong>ar</strong>ías u otros <strong>de</strong>stacam<strong>en</strong>tos policiales, ya que <strong>en</strong> los últimos años se<br />
ha constatado que hay una gran cantidad <strong>de</strong> casos <strong>de</strong> personas privadas <strong>de</strong> libertad<br />
alojadas <strong>en</strong> este tipo <strong>de</strong> establecimi<strong>en</strong>to no aptos p<strong>ar</strong>a tal fin. P<strong>ar</strong>a fines <strong>de</strong>l 2005 existía<br />
alre<strong>de</strong>dor <strong>de</strong> 8000 personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías alre<strong>de</strong>dor <strong>de</strong> todo el país [Anexo 4].<br />
Se ti<strong>en</strong>e, por lo tanto, una gran cantidad <strong>de</strong> instituciones ubicadas bajos <strong>com</strong>pet<strong>en</strong>cias<br />
jurídicas y políticas difer<strong>en</strong>tes.<br />
A nivel fe<strong>de</strong>ral, <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral (SPF) fue creci<strong>en</strong>do<br />
sost<strong>en</strong>idam<strong>en</strong>te a través <strong>de</strong> los años (promedio <strong>de</strong>l 8% anual) [Figura 2.13], hasta lleg<strong>ar</strong><br />
a fines <strong>de</strong> 2006 con un crecimi<strong>en</strong>to acumu<strong>la</strong>do <strong>de</strong>l casi 300% <strong>de</strong>s<strong>de</strong> el año 1984.<br />
Nuevam<strong>en</strong>te, es <strong>de</strong>stacable el crecimi<strong>en</strong>to que se dio <strong>en</strong>tre los años 2001 (10%) y 2002<br />
(12%).<br />
139<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
0
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
36<br />
Año<br />
2006<br />
2004<br />
2002<br />
2000<br />
1998<br />
1996<br />
1994<br />
1992<br />
1990<br />
1988<br />
1986<br />
1984<br />
3,185<br />
2,838<br />
2,662<br />
2,355<br />
5,467<br />
5,339<br />
5,067<br />
4,965<br />
4,473<br />
4,108<br />
3,830<br />
7,146<br />
6,767<br />
6,385<br />
6,177<br />
6,112<br />
6,243<br />
7,872<br />
9,380<br />
9,625<br />
9,738<br />
9,246<br />
8,795<br />
0 1,000 2,000 3,000 4,000 5,000 6,000 7,000 8,000 9,000 10,000 11,000<br />
Presos<br />
Figura 2.13. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>de</strong>l SPF. [DNPC, 2006]<br />
Un estudio realizado por el Ministerio <strong>de</strong> Justicia <strong>en</strong> base a técnicas estadísticas,<br />
proyecta que el número <strong>de</strong> <strong>de</strong>t<strong>en</strong>idos <strong>en</strong> establecimi<strong>en</strong>tos fe<strong>de</strong>rales lleg<strong>ar</strong>á a 15.000 <strong>en</strong><br />
el 2015, y se increm<strong>en</strong>t<strong>ar</strong>ía a unos 22.000 p<strong>ar</strong>a el año 2025 [Prieto, 2005].<br />
A nivel provincial se cu<strong>en</strong>ta con información que indica que <strong>en</strong> <strong>la</strong> Provincia <strong>de</strong> Bu<strong>en</strong>os<br />
Aires, <strong>de</strong>s<strong>de</strong> el año 1996 hasta el 2005, <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria creció un 136% [Figura<br />
2.14], mi<strong>en</strong>tras que <strong>la</strong> pob<strong>la</strong>ción g<strong>en</strong>eral lo hizo <strong>en</strong> un 10%.En el Anexo 5 se pue<strong>de</strong><br />
observ<strong>ar</strong> <strong>la</strong> evolución <strong>de</strong> esta pob<strong>la</strong>ción p<strong>en</strong>al <strong>en</strong> cada una <strong>de</strong> <strong>la</strong>s provincias. Este<br />
increm<strong>en</strong>to se produjo tanto <strong>en</strong> los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios <strong>com</strong>o <strong>en</strong> <strong>la</strong>s<br />
<strong>com</strong>is<strong>ar</strong>ías bonaer<strong>en</strong>ses, si<strong>en</strong>do estos últimos, lug<strong>ar</strong>es no aptos p<strong>ar</strong>a el cumplimi<strong>en</strong>to <strong>de</strong><br />
p<strong>en</strong>as.<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
Presos<br />
35,000<br />
30,000<br />
25,000<br />
20,000<br />
15,000<br />
10,000<br />
5,000<br />
0<br />
12,409<br />
9,898<br />
13,873<br />
11,719<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Total Procesados Con<strong>de</strong>nados Otros<br />
15,548<br />
13,471<br />
16,297<br />
14,513<br />
20,760<br />
17,933<br />
23,103<br />
20,131<br />
26,438<br />
23,038<br />
28,206<br />
24,091<br />
30,025<br />
25,213<br />
2,202 1,818 1,494 1,290 1,766 2,273 2,636 3,023 3,429<br />
309 336 583 494<br />
1,061 699 764 1,092 1,383<br />
29,313<br />
1996 1997 1998 1999 2000 2001 2002 2003 2004 2005<br />
Año<br />
Figura 2.14. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Bonaer<strong>en</strong>se<br />
Como se pue<strong>de</strong> observ<strong>ar</strong> <strong>en</strong> <strong>la</strong> figura 2.14, a principio <strong>de</strong> esta década <strong>la</strong>s cárceles y<br />
<strong>com</strong>is<strong>ar</strong>ías bonaer<strong>en</strong>ses alojaban 20.760 presos (16.567 <strong>en</strong> unida<strong>de</strong>s y 5748 <strong>en</strong><br />
<strong>com</strong>is<strong>ar</strong>ías), y <strong>la</strong> tasa <strong>de</strong> <strong>en</strong>c<strong>ar</strong>ce<strong>la</strong>mi<strong>en</strong>to era <strong>de</strong> 148 cada ci<strong>en</strong> mil habitantes<br />
bonaer<strong>en</strong>ses. Mi<strong>en</strong>tras que cinco años <strong>de</strong>spués, lo <strong>de</strong>t<strong>en</strong>idos lleg<strong>ar</strong>on a 29.313, con una<br />
tasa <strong>de</strong> <strong>en</strong>c<strong>ar</strong>ce<strong>la</strong>dos <strong>de</strong> aproximadam<strong>en</strong>te 200 cada ci<strong>en</strong> mil habitantes. Se observa, por<br />
lo tanto, que <strong>la</strong>s cárceles bonaer<strong>en</strong>ses alojan c<strong>la</strong>ram<strong>en</strong>te a más <strong>de</strong>l 50% <strong>de</strong> <strong>la</strong>s personas<br />
<strong>de</strong>t<strong>en</strong>idas <strong>de</strong>l país.<br />
En lo que respecta a <strong>la</strong> proporción procesados/con<strong>de</strong>nados, se analiz<strong>ar</strong>á el tema cuando<br />
se hable acerca <strong>de</strong> <strong>la</strong> situación p<strong>en</strong>al <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos <strong>en</strong> el ap<strong>ar</strong>tado 2.5.4.<br />
2.5.2 Situación a nivel internacional<br />
Durante el año 2002 existían <strong>en</strong> Arg<strong>en</strong>tina 123 internos <strong>en</strong> cárceles por cada 100,000<br />
habitantes, increm<strong>en</strong>tándose esta cifra <strong>en</strong> el año 2006 a 139 [Figura 2.15]. Si se tomase<br />
<strong>en</strong> cu<strong>en</strong>ta a <strong>la</strong>s personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías o <strong>de</strong>stacam<strong>en</strong>tos policiales, <strong>la</strong> tasa se<br />
increm<strong>en</strong>t<strong>ar</strong>ía a 159. Esta tasa es muy simi<strong>la</strong>r a países europeos <strong>com</strong>o España (147) y el<br />
Reino Unido (148), aunque m<strong>en</strong>or a <strong>la</strong> <strong>de</strong> países sudamericanos <strong>com</strong>o Uruguay (193),<br />
Brasil (219) y Chile (262). En cuanto a los países que pres<strong>en</strong>tan mayor cantidad <strong>de</strong><br />
presos por cada 100.000 habitantes, se ti<strong>en</strong>e a Estados unidos, con una pob<strong>la</strong>ción <strong>de</strong><br />
aproximadam<strong>en</strong>te 2.300.000 internos (tasa = 750 presos c/ 100.000 hab.) y a Rusia con<br />
628 reclusos por 100.000 habitantes. Se pue<strong>de</strong> <strong>en</strong>contr<strong>ar</strong> más <strong>de</strong>talles respecto a <strong>la</strong><br />
pob<strong>la</strong>ción p<strong>en</strong>al mundial <strong>en</strong> el anexo 6.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 37
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Presos<br />
800<br />
700<br />
600<br />
500<br />
400<br />
300<br />
200<br />
100<br />
38<br />
0<br />
EE.UU<br />
750<br />
628<br />
Rusia<br />
531<br />
Cuba<br />
356<br />
335<br />
288 281<br />
262<br />
219 209 198 193<br />
148 147 139 128 125 119 107 98 93 85 79 79 67 61<br />
Puerto Rico<br />
Sudafrica<br />
EAU<br />
Taiwan<br />
Chile<br />
Brasil<br />
Israel<br />
Mexico<br />
Uruguay<br />
Reino Unido<br />
Figura 2.15. Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> el mundo. [ICPS, 2007]<br />
La alta tasa <strong>de</strong> presos que registra Estados Unidos [Figura 2.15] se pue<strong>de</strong> explic<strong>ar</strong> <strong>de</strong> <strong>la</strong><br />
sigui<strong>en</strong>te manera. Las políticas <strong>de</strong> los 70 y 80 estuvieron impulsadas por el miedo al<br />
<strong>de</strong>lito y por el hecho <strong>de</strong> que éste figuraba <strong>com</strong>o tema <strong>de</strong> importancia c<strong>en</strong>tral <strong>en</strong> todas <strong>la</strong>s<br />
<strong>en</strong>cuestas nacionales [Morris & Rosales, 2007]. Hoy <strong>en</strong> día, m<strong>en</strong>os <strong>de</strong>l cinco por ci<strong>en</strong>to<br />
<strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción norteamericana consi<strong>de</strong>ra al crim<strong>en</strong> <strong>com</strong>o el mayor problema que<br />
<strong>en</strong>fr<strong>en</strong>ta Estados Unidos. La explicación es muy simple. Estados Unidos duplicó <strong>la</strong><br />
pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria. De casi un millón <strong>de</strong> presos que había a <strong>com</strong>i<strong>en</strong>zos <strong>de</strong> los 80, hoy<br />
pas<strong>ar</strong>on a ser dos millones. Con el doble <strong>de</strong> <strong>de</strong>lincu<strong>en</strong>tes <strong>en</strong> prisión, el crim<strong>en</strong> se redujo<br />
a <strong>la</strong> mitad. En el año 1971, el número <strong>de</strong> presos era aún mucho m<strong>en</strong>or, 200.000<br />
personas.<br />
C<strong>la</strong>ro que p<strong>ar</strong>a logr<strong>ar</strong> <strong>la</strong> reducción <strong>de</strong> hechos <strong>de</strong>lictuosos <strong>en</strong> EE.UU., se impusieron<br />
s<strong>en</strong>t<strong>en</strong>cias obligatorias a los criminales reinci<strong>de</strong>ntes. Aquellos que <strong>com</strong>etieran tres<br />
<strong>de</strong>litos fueron automáticam<strong>en</strong>te s<strong>en</strong>t<strong>en</strong>ciados a prisión perpetua sin ninguna posibilidad<br />
<strong>de</strong> exc<strong>ar</strong>ce<strong>la</strong>ción. A su vez, el <strong>en</strong>tonces presi<strong>de</strong>nte Bill Clinton aprobó p<strong>ar</strong>tidas masivas<br />
<strong>de</strong> dinero p<strong>ar</strong>a <strong>la</strong> construcción <strong>de</strong> prisiones, lo cual permitió remedi<strong>ar</strong> <strong>la</strong> superpob<strong>la</strong>ción<br />
y evito <strong>la</strong> liberación <strong>de</strong> criminales <strong>de</strong>bido a <strong>la</strong> saturación <strong>de</strong> <strong>la</strong>s cárceles. Otras <strong>de</strong> <strong>la</strong>s<br />
medidas tomadas fue <strong>la</strong> imposición <strong>de</strong> tácticas policiales novedosas. Se <strong>en</strong>fatizó el<br />
<strong>ar</strong>resto por <strong>de</strong>litos ap<strong>ar</strong><strong>en</strong>tem<strong>en</strong>te m<strong>en</strong>os graves que <strong>en</strong> ocasiones reve<strong>la</strong>ron evi<strong>de</strong>ncias<br />
<strong>de</strong> crím<strong>en</strong>es más serios. Finalm<strong>en</strong>te, se prosiguió a realiz<strong>ar</strong> un mayor seguimi<strong>en</strong>to y<br />
control <strong>de</strong> los <strong>de</strong>lincu<strong>en</strong>tes <strong>en</strong> libertad condicional, invirti<strong>en</strong>do bu<strong>en</strong>a p<strong>ar</strong>te <strong>de</strong>l tiempo<br />
<strong>en</strong> busc<strong>ar</strong> y apreh<strong>en</strong><strong>de</strong>r a aquellos que no acudían a <strong>la</strong>s pres<strong>en</strong>taciones judiciales<br />
obligatorias.<br />
España<br />
Arg<strong>en</strong>tina<br />
Colombia<br />
Australia<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión<br />
China<br />
Canadá<br />
P<strong>ar</strong>aguay<br />
Alemania<br />
Francia<br />
Suecia<br />
Suiza<br />
Italia<br />
Japón<br />
País
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Latinoamérica protagoniza, <strong>en</strong> este tema, una nueva p<strong>ar</strong>adoja: a pes<strong>ar</strong> <strong>de</strong> que <strong>la</strong>s tasas <strong>de</strong><br />
criminalidad son más altas, <strong>la</strong>s cárceles ti<strong>en</strong><strong>en</strong> m<strong>en</strong>os cantidad <strong>de</strong> reclusos que <strong>en</strong> los<br />
Estados Unidos.<br />
2.5.3 Sobrepob<strong>la</strong>ción y hacinami<strong>en</strong>to <strong>en</strong> Arg<strong>en</strong>tina<br />
Las condiciones <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción tanto <strong>en</strong> el ámbito fe<strong>de</strong>ral <strong>com</strong>o <strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os<br />
Aires, continúan si<strong>en</strong>do preocupantes. El <strong>en</strong>cierro <strong>en</strong> condiciones <strong>de</strong> hacinami<strong>en</strong>to y<br />
sobrepob<strong>la</strong>ción pone <strong>en</strong> serio riesgo <strong>la</strong> vida y <strong>la</strong> salud <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos, y constituye, sin<br />
lug<strong>ar</strong> a dudas, el sometimi<strong>en</strong>to a un trato cruel, inhumano y <strong>de</strong>gradante. La situación es<br />
p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te grave <strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os Aires, don<strong>de</strong> el trato inhumano <strong>de</strong> los<br />
<strong>de</strong>t<strong>en</strong>idos así <strong>com</strong>o su sometimi<strong>en</strong>to a torturas es el resultado <strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia sistemática<br />
y estructural que organiza <strong>la</strong> vida intramuros, in<strong>com</strong>patible con un or<strong>de</strong>nami<strong>en</strong>to<br />
<strong>de</strong>mocrático <strong>de</strong> <strong>la</strong> sociedad.<br />
El problema <strong>de</strong> <strong>la</strong> sobrepob<strong>la</strong>ción <strong>en</strong> <strong>la</strong>s unida<strong>de</strong>s p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias se <strong>en</strong>cu<strong>en</strong>tra<br />
estrecham<strong>en</strong>te vincu<strong>la</strong>do al f<strong>en</strong>óm<strong>en</strong>o <strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia al interior <strong>de</strong> <strong>la</strong>s cárceles. Si bi<strong>en</strong><br />
estos f<strong>en</strong>óm<strong>en</strong>os, el <strong>de</strong> <strong>la</strong> sobrepob<strong>la</strong>ción y el <strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia, no son únicam<strong>en</strong>te<br />
c<strong>ar</strong>acterísticos <strong>de</strong> <strong>la</strong>s cárceles <strong>en</strong> América Latina, sí es cierto que <strong>en</strong> nuestro contin<strong>en</strong>te<br />
<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>n niveles p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te altos. Situación que <strong>en</strong> el caso <strong>de</strong> <strong>la</strong> Arg<strong>en</strong>tina se<br />
pres<strong>en</strong>ta tanto a nivel fe<strong>de</strong>ral <strong>com</strong>o provincial [DNPC, 2005]. Es innegable que el<br />
hacinami<strong>en</strong>to g<strong>en</strong>era un constante increm<strong>en</strong>to <strong>de</strong> <strong>la</strong> t<strong>en</strong>sión <strong>en</strong>tre los internos, que<br />
<strong>de</strong>riva <strong>en</strong> problemas <strong>de</strong> conviv<strong>en</strong>cia <strong>en</strong> un espacio insufici<strong>en</strong>te e ina<strong>de</strong>cuado p<strong>ar</strong>a el<br />
<strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> <strong>la</strong> persona. Fom<strong>en</strong>ta, a<strong>de</strong>más, <strong>la</strong> propagación <strong>de</strong> <strong>en</strong>fermeda<strong>de</strong>s <strong>de</strong> todo<br />
tipo, producto <strong>de</strong> <strong>la</strong> falta <strong>de</strong> higi<strong>en</strong>e <strong>de</strong> los establecimi<strong>en</strong>tos y <strong>de</strong> a<strong>de</strong>cuada at<strong>en</strong>ción<br />
médica [CELS, 2005].<br />
La promiscuidad que se experim<strong>en</strong>ta <strong>en</strong> el interior <strong>de</strong> los establecimi<strong>en</strong>tos hace suponer<br />
que los internos se expon<strong>en</strong> a una alta probabilidad <strong>de</strong> contraer <strong>en</strong>fermeda<strong>de</strong>s<br />
infectocontagiosas, p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te SIDA. No se pue<strong>de</strong> saber con exactitud el número<br />
<strong>de</strong> infectados puesto que <strong>la</strong> realización <strong>de</strong>l correspondi<strong>en</strong>te análisis <strong>de</strong>be cont<strong>ar</strong> con <strong>la</strong><br />
autorización <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido, negada <strong>en</strong> <strong>la</strong> mayoría <strong>de</strong> los casos. P<strong>ar</strong>a el año 2001, se ha<br />
<strong>de</strong>tectado <strong>la</strong> afección <strong>de</strong>l 7% <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria, superando casi <strong>en</strong> doce veces a<br />
<strong>la</strong> tasa estadouni<strong>de</strong>nse (0,6%) y superior al porc<strong>en</strong>taje <strong>de</strong> personas adultas infectadas <strong>en</strong><br />
toda América Latina (<strong>en</strong>tre 0.5% y 1%) [Petrone, 2005]<br />
En cuanto a los regím<strong>en</strong>es <strong>de</strong> ejecución <strong>de</strong> p<strong>en</strong>as, el exceso <strong>de</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria<br />
imposibilita <strong>la</strong> asignación <strong>de</strong> t<strong>ar</strong>eas <strong>la</strong>borales a todos los internos y p<strong>ar</strong>ticipación <strong>en</strong><br />
activida<strong>de</strong>s educativas y recreativas, obstaculizando su reinserción <strong>la</strong>boral. Los presos<br />
no pue<strong>de</strong>n trabaj<strong>ar</strong> y gan<strong>ar</strong>se su dinero porque “<strong>la</strong>s p<strong>la</strong>zas <strong>de</strong> trabajo no alcanzan”<br />
[Alconada Mon, 2004].<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 39
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
2.5.3.1 Sobrepob<strong>la</strong>ción. Dim<strong>en</strong>sión <strong>de</strong>l problema<br />
El Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral administra 29 cárceles (contando los <strong>com</strong>plejos<br />
fe<strong>de</strong>rales), y 10 alcaldías <strong>en</strong> 11 provincias <strong>de</strong> <strong>la</strong> República Arg<strong>en</strong>tina [Anexo 7]. El<br />
índice <strong>de</strong> sobrepob<strong>la</strong>ción ha ido disminuy<strong>en</strong>do a través <strong>de</strong> los años, pasando <strong>de</strong> un<br />
3,3% <strong>en</strong> 2004 a t<strong>en</strong>er capacidad ociosa <strong>en</strong> 2006 <strong>de</strong>bido a <strong>la</strong> reducción <strong>en</strong> <strong>la</strong> pob<strong>la</strong>ción<br />
p<strong>en</strong>al pert<strong>en</strong>eci<strong>en</strong>te al SPF. Sin emb<strong>ar</strong>go hay que t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta que existían <strong>en</strong> el año<br />
2004 v<strong>ar</strong>ias <strong>de</strong> <strong>la</strong>s unida<strong>de</strong>s que alojaban una cantidad superior a <strong>la</strong> permitida, tales<br />
<strong>com</strong>o <strong>la</strong> unidad 3 (50% <strong>de</strong> sobrepob<strong>la</strong>ción), unidad 20 (82%), unidad 2 (14%), unidad<br />
13 (16%), <strong>en</strong>tre otras. P<strong>ar</strong>a el año 2006, había unos pocos alojami<strong>en</strong>tos con mayores<br />
p<strong>la</strong>zas ocupadas <strong>de</strong> <strong>la</strong>s disponibles, <strong>en</strong>tre el<strong>la</strong>s <strong>la</strong> unidad 13 que aum<strong>en</strong>to su tasa (25%<br />
<strong>de</strong> sobrepob<strong>la</strong>ción), unidad 17 (8.5%) y unidad 2 que pudo reducir el ratio <strong>en</strong> 10 puntos<br />
aproximadam<strong>en</strong>te (4.2%) En el anexo 8 se pue<strong>de</strong>n observ<strong>ar</strong> los distintos porc<strong>en</strong>tajes <strong>de</strong><br />
sobrepob<strong>la</strong>ción <strong>de</strong> los últimos 4 años c<strong>en</strong>sados p<strong>ar</strong>a cada provincia e instituto <strong>de</strong>l<br />
Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral.<br />
C<strong>la</strong>ro que <strong>la</strong> situación <strong>de</strong>l SPF es casi ejemp<strong>la</strong>r si se <strong>la</strong> <strong>com</strong>p<strong>ar</strong>a con lo que pasa <strong>en</strong> el<br />
resto <strong>de</strong> <strong>la</strong>s provincias. Por lo tanto resulta elem<strong>en</strong>tal analiz<strong>ar</strong> por sep<strong>ar</strong>ado <strong>la</strong> situación<br />
<strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os Aires y el resto <strong>de</strong> <strong>la</strong>s provincias.<br />
A fines <strong>de</strong>l 2006, <strong>la</strong>s cárceles <strong>de</strong> Bu<strong>en</strong>os Aires alojaban a 23.878 internos, casi el 50%<br />
<strong>de</strong>l total <strong>de</strong>l país, que era <strong>de</strong> 54.000 [Anexo 5]. T<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta que <strong>la</strong> capacidad<br />
disponible a esa fecha era <strong>de</strong> 22.164 p<strong>la</strong>zas, <strong>la</strong> sobrepob<strong>la</strong>ción llegaba al 7,7% [Anexo<br />
9]. Estos números aum<strong>en</strong>tan si se ti<strong>en</strong><strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta <strong>la</strong>s personas ubicadas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías<br />
<strong>de</strong> <strong>la</strong> provincia. P<strong>ar</strong>a fines <strong>de</strong> 2005, había unas 4592 personas alojadas alre<strong>de</strong>dor <strong>de</strong> <strong>la</strong>s<br />
340 <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias <strong>de</strong> <strong>la</strong> policía <strong>de</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os Aires. Si bi<strong>en</strong> significaba una<br />
mejoría con respecto a fines <strong>de</strong> 2002 cuando <strong>la</strong>s <strong>com</strong>is<strong>ar</strong>ías <strong>de</strong> <strong>la</strong> provincia tuvieron su<br />
pico <strong>de</strong> pob<strong>la</strong>ción (7.507 personas), son cifras que m<strong>ar</strong>can c<strong>la</strong>ram<strong>en</strong>te el problema <strong>de</strong> <strong>la</strong><br />
sobrepob<strong>la</strong>ción y el hacinami<strong>en</strong>to <strong>en</strong> el sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io bonaer<strong>en</strong>se [Ministerio<br />
Seguridad Prov. Bs.As., 2004]. Fr<strong>en</strong>te a esta situación es preciso <strong>de</strong>stac<strong>ar</strong> nuevam<strong>en</strong>te<br />
que <strong>la</strong>s <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias policiales no <strong>de</strong>b<strong>en</strong> consi<strong>de</strong>r<strong>ar</strong>se p<strong>la</strong>zas c<strong>ar</strong>ce<strong>la</strong>rias, <strong>en</strong> tanto no<br />
reún<strong>en</strong> <strong>la</strong>s condiciones requeridas p<strong>ar</strong>a los lug<strong>ar</strong>es <strong>de</strong> cumplimi<strong>en</strong>to <strong>de</strong> p<strong>en</strong>a y/o prisión<br />
prev<strong>en</strong>tiva. La pres<strong>en</strong>cia <strong>de</strong> personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> estos espacios es c<strong>la</strong>ram<strong>en</strong>te ilegal.<br />
Ni <strong>la</strong>s <strong>com</strong>is<strong>ar</strong>ías se <strong>en</strong>cu<strong>en</strong>tran <strong>en</strong> condiciones edilicias <strong>de</strong> mant<strong>en</strong>er <strong>en</strong> el<strong>la</strong>s por un<br />
tiempo prolongado a personas <strong>de</strong>t<strong>en</strong>idas, ni el personal policial está capacitado p<strong>ar</strong>a<br />
hacer fr<strong>en</strong>te a esta situación [CELS, 2005].<br />
En lo que refiere al resto <strong>de</strong> <strong>la</strong>s provincias, <strong>la</strong> situación se vuelve aún peor que <strong>en</strong><br />
Bu<strong>en</strong>os Aires. Analizando los números informados por <strong>la</strong>s provincias acerca <strong>de</strong><br />
capacida<strong>de</strong>s y <strong>de</strong>t<strong>en</strong>idos, se observa que a fines <strong>de</strong>l 2006 <strong>la</strong> sobrepob<strong>la</strong>ción llegaba al<br />
11.36%. Se pue<strong>de</strong> ver que aproximadam<strong>en</strong>te 50 <strong>de</strong> los 121 establecimi<strong>en</strong>tos<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios distribuidos por todas <strong>la</strong>s provincias se <strong>en</strong>cu<strong>en</strong>tran sobresaturados.<br />
40<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
2.5.4 Situación p<strong>en</strong>al <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
En su gran mayoría, qui<strong>en</strong>es <strong>de</strong>b<strong>en</strong> soport<strong>ar</strong> esta situación <strong>de</strong> <strong>en</strong>cierro <strong>en</strong> condiciones<br />
inhumanas e ilegítimas resultan ser personas <strong>de</strong>t<strong>en</strong>idas solo prev<strong>en</strong>tivam<strong>en</strong>te. Es <strong>de</strong>cir,<br />
que se <strong>en</strong>cu<strong>en</strong>tran a <strong>la</strong> espera <strong>de</strong> una resolución judicial que <strong>de</strong>termine si resultan o no<br />
culpables <strong>de</strong> los <strong>de</strong>litos que se les imputan. A su vez, <strong>la</strong> situación se torna más grave si<br />
se rep<strong>ar</strong>a <strong>en</strong> el tiempo <strong>en</strong> que se prolongan los procesos p<strong>en</strong>ales y, por <strong>en</strong><strong>de</strong>, también <strong>la</strong><br />
prisión prev<strong>en</strong>tiva. Este tema es <strong>de</strong> suma importancia, ya que existe todo un régim<strong>en</strong> <strong>de</strong><br />
progresividad (etapas <strong>de</strong> observación, tratami<strong>en</strong>to y prueba) <strong>en</strong> <strong>la</strong> ejecución <strong>de</strong> <strong>la</strong> p<strong>en</strong>a<br />
que es aplicable solo a los con<strong>de</strong>nados.<br />
Según el c<strong>en</strong>so sobre pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ías <strong>de</strong>l 2004, el 60% <strong>de</strong> los<br />
<strong>de</strong>t<strong>en</strong>idos se <strong>en</strong>contraba procesado, mi<strong>en</strong>tras que solo el 40% había recibido con<strong>de</strong>na.<br />
La situación es peor si se ti<strong>en</strong>e <strong>en</strong> cu<strong>en</strong>ta que los números <strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os<br />
Aires hab<strong>la</strong>n <strong>de</strong> solo un 20% <strong>de</strong> con<strong>de</strong>nados y un 80% <strong>de</strong> procesados. Si se consi<strong>de</strong>ran a<br />
los <strong>de</strong>t<strong>en</strong>idos <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías bonaer<strong>en</strong>ses, <strong>la</strong> proporción aum<strong>en</strong>ta a casi el 84% <strong>de</strong><br />
procesados, contra solo un 10% <strong>de</strong> con<strong>de</strong>nados y un 6% <strong>de</strong> inimputables y m<strong>en</strong>ores, tal<br />
<strong>com</strong>o se observó anteriorm<strong>en</strong>te <strong>en</strong> <strong>la</strong> figura 2.14. Finalm<strong>en</strong>te, <strong>en</strong> lo que respecta al SPF,<br />
se ti<strong>en</strong>e <strong>la</strong> misma proporción <strong>en</strong>tre con<strong>de</strong>nados y procesados.<br />
El porc<strong>en</strong>taje <strong>de</strong> personas procesadas <strong>en</strong> prisión prev<strong>en</strong>tiva <strong>en</strong> <strong>la</strong> Provincia <strong>de</strong> Bu<strong>en</strong>os<br />
Aires sólo es superado <strong>en</strong> América <strong>de</strong>l Sur por el <strong>de</strong> P<strong>ar</strong>aguay (92,7%), <strong>en</strong>contrándose<br />
muy por <strong>en</strong>cima <strong>de</strong> los porc<strong>en</strong>tajes <strong>de</strong> Uruguay (77,2%), Ecuador (68,3%) y Perú<br />
(63,2%) [Petrone, 2005].<br />
La situación p<strong>ar</strong>ece no haber cambiado tanto p<strong>ar</strong>a el año 2006, <strong>com</strong>o se pue<strong>de</strong> observ<strong>ar</strong><br />
<strong>en</strong> <strong>la</strong> sigui<strong>en</strong>te figura, ya que <strong>la</strong>s estadísticas oficiales hab<strong>la</strong>n <strong>de</strong> un 57% <strong>de</strong> procesados,<br />
41% <strong>de</strong> con<strong>de</strong>nados y un 2% inimputables o m<strong>en</strong>ores [DNPC, 2006].<br />
Porc<strong>en</strong>taje Procesados Con<strong>de</strong>nados Otros<br />
100%<br />
90%<br />
80%<br />
70%<br />
60%<br />
50%<br />
40%<br />
30%<br />
20%<br />
10%<br />
0%<br />
2002 2003 2004 2005 2006<br />
Figura 2.16. Proporción Procesados/Con<strong>de</strong>nados a nivel Nacional. [DNPC, 2006]<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 41<br />
Año
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
La sep<strong>ar</strong>ación <strong>de</strong> procesados y con<strong>de</strong>nados es un principio elem<strong>en</strong>tal <strong>de</strong>l tratami<strong>en</strong>to<br />
c<strong>ar</strong>ce<strong>la</strong>rio. Los procesados se <strong>en</strong>cu<strong>en</strong>tran <strong>en</strong> <strong>la</strong> p<strong>ar</strong>ticu<strong>la</strong>r situación <strong>de</strong> incertidumbre que<br />
<strong>de</strong>riva <strong>de</strong>l hecho <strong>de</strong> que el proceso que los ti<strong>en</strong>e <strong>de</strong>t<strong>en</strong>idos no ha sido <strong>de</strong>finido aún,<br />
<strong>de</strong>sconoc<strong>en</strong> cuanto tiempo <strong>de</strong>berá seguir <strong>en</strong> esa condición, cual será <strong>la</strong> resolución final<br />
y, por cierto, hasta tanto se lo con<strong>de</strong>ne, manti<strong>en</strong><strong>en</strong> su condición <strong>de</strong> inoc<strong>en</strong>tes. Por tales<br />
circunstancias, <strong>la</strong> inclusión <strong>de</strong> procesados <strong>en</strong> p<strong>la</strong>nes <strong>de</strong> trabajo y educación int<strong>en</strong>sos<br />
resulta por <strong>de</strong>más conflictiva [Petrone, 2005].<br />
2.5.5 Costo promedio <strong>de</strong> cada preso.<br />
Cada preso alojado <strong>en</strong> alguno <strong>de</strong> los establecimi<strong>en</strong>tos <strong>de</strong>l SPF le cuesta al Estado<br />
alre<strong>de</strong>dor <strong>de</strong> $ 4,285. Este número resulta por si elocu<strong>en</strong>te, pero lo es aún más si se<br />
consi<strong>de</strong>ra que, lejos <strong>de</strong> redund<strong>ar</strong> <strong>en</strong> un servicio ejemp<strong>la</strong>r, el hacinami<strong>en</strong>to, <strong>la</strong><br />
superpob<strong>la</strong>ción y <strong>la</strong> promiscuidad conviv<strong>en</strong> a di<strong>ar</strong>io <strong>de</strong>ntro <strong>de</strong>l servicio, tal <strong>com</strong>o se<br />
<strong>de</strong>scribió <strong>en</strong> los puntos anteriores. El cálculo está hecho sobre <strong>la</strong> base <strong>de</strong>l presupuesto<br />
oficial <strong>de</strong>l año 2006, dividi<strong>en</strong>do lo <strong>de</strong>stinado al SPF y <strong>la</strong> cantidad <strong>de</strong> <strong>de</strong>t<strong>en</strong>idos <strong>en</strong><br />
establecimi<strong>en</strong>tos fe<strong>de</strong>rales a fin <strong>de</strong> dicho año.<br />
Lo curioso es que si se ti<strong>en</strong>e <strong>en</strong> cu<strong>en</strong>ta el presupuesto <strong>de</strong>l año 2004, alre<strong>de</strong>dor <strong>de</strong>l 80%<br />
<strong>de</strong>l presupuesto <strong>de</strong>l SPF estaba afectado p<strong>ar</strong>a gastos <strong>de</strong> personal y pago a retirados y<br />
p<strong>en</strong>sionados. Como se observa <strong>en</strong> el anexo 10, unos 288 millones <strong>de</strong> pesos eran<br />
<strong>de</strong>stinados a gastos <strong>de</strong> personal, sobre un total <strong>de</strong> 372 millos <strong>de</strong>stinados <strong>en</strong>tre otras<br />
cosas p<strong>ar</strong>a <strong>la</strong> seguridad, manut<strong>en</strong>ción y rehabilitación <strong>de</strong> los internos p<strong>ar</strong>a logr<strong>ar</strong> una<br />
a<strong>de</strong>cuada reinserción posterior <strong>en</strong> <strong>la</strong> sociedad. P<strong>ar</strong>a dicho año el SPF t<strong>en</strong>ía más <strong>de</strong> 8100<br />
ag<strong>en</strong>tes, lo que establece una re<strong>la</strong>ción p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io-<strong>de</strong>t<strong>en</strong>ido cercana al 1 a 1. La<br />
re<strong>la</strong>ción baja a 1 a 0,4 si se ti<strong>en</strong><strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta los que realizan servicio <strong>en</strong> <strong>la</strong>s unida<strong>de</strong>s<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias. Esto último evi<strong>de</strong>ncia que gran p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> dotación se <strong>de</strong>dica a t<strong>ar</strong>eas<br />
administrativas fuera <strong>de</strong> <strong>la</strong>s cárceles [Petrone, 2005].<br />
En <strong>la</strong> tab<strong>la</strong> 2.2 se pue<strong>de</strong> observ<strong>ar</strong> <strong>la</strong> evolución <strong>de</strong>l presupuesto <strong>de</strong>stinado al SPF <strong>de</strong>s<strong>de</strong> el<br />
año 2001 al 2006, y <strong>la</strong> cantidad promedio por <strong>de</strong>t<strong>en</strong>ido <strong>en</strong> el mismo período.<br />
Activida<strong>de</strong>s Comunes al Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />
Fe<strong>de</strong>ral (Programas 16,17 y 15)<br />
$46,587,807 $26,150,299 $24,890,053 $61,127,136<br />
Seguridad y Rehabilitacion <strong>de</strong>l interno $96,937,642 $122,693,913 $116,632,790 $151,527,695<br />
Pagos a Retirados y P<strong>en</strong>sionados<br />
Cooperacion Tecnica y Financiera p<strong>ar</strong>a <strong>la</strong><br />
Laborterapia <strong>de</strong> Internos<br />
$89,424,056<br />
$7,660,004<br />
$95,518,206<br />
$5,894,010<br />
$100,135,408<br />
$6,255,851<br />
$125,856,449<br />
$7,670,190<br />
Sin Datos Sin Datos<br />
Formacion y Capacitacion $6,277,455 $8,195,581 $8,669,590 $11,743,253<br />
Obras P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias $39,292,439 $39,283,890 $30,076,587 $14,460,295<br />
Presupuesto Total +Obras P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias $286,179,403 $297,735,899 $286,660,279 $372,385,018 $432,281,000 $482,356,000<br />
Cantidad Det<strong>en</strong>idos 7,872 8,795 9,246 9,738 9,625 9,380<br />
Presupuesto M<strong>en</strong>sual por Det<strong>en</strong>ido $3,030 $2,821 $2,584 $3,187 $3,743 $4,285<br />
42<br />
PRESUPUESTO SPF 2001 2002 2003 2004 2005<br />
Tab<strong>la</strong> 2.2. Evolución <strong>de</strong>l presupuesto SPF. [Petrone, 2005]<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión<br />
2006
2.5.6 Trabajo <strong>en</strong> <strong>la</strong>s cárceles<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Las estadísticas reve<strong>la</strong>n que solo un 31% <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos posee algún trabajo <strong>de</strong>ntro <strong>de</strong><br />
<strong>la</strong> cárcel. De este 31% <strong>de</strong> mano <strong>de</strong> obra ocupada, solo un 9% ti<strong>en</strong>e un trabajo<br />
re<strong>la</strong>cionado con activida<strong>de</strong>s productivas. Haci<strong>en</strong>do foco <strong>en</strong> <strong>la</strong> situación legal, es <strong>de</strong><br />
esper<strong>ar</strong> que el porc<strong>en</strong>taje <strong>de</strong> no con<strong>de</strong>nados que trabaja sea m<strong>en</strong>or que el <strong>de</strong> los<br />
con<strong>de</strong>nados. Tal <strong>com</strong>o se dijo <strong>en</strong> el punto 2.5.4, <strong>la</strong> situación <strong>de</strong> los no con<strong>de</strong>nados<br />
asociados a un régim<strong>en</strong> <strong>la</strong>boral resulta por <strong>de</strong>más conflictiva.<br />
Situacion Legal<br />
Trabajo Remunerado<br />
Si No<br />
Trabajo Productivo<br />
Si No<br />
Con<strong>de</strong>nados 35% 65% 8% 92%<br />
No con<strong>de</strong>nados 28% 72% 10% 90%<br />
Figura 2.17. Distribución <strong>de</strong> trabajadores según Situación Legal.<br />
Más allá <strong>de</strong>l 9% <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria que trabaja <strong>en</strong> activida<strong>de</strong>s productivas,<br />
prácticam<strong>en</strong>te el trabajo <strong>en</strong> <strong>la</strong>s cárceles no existe. En rigor <strong>de</strong> verdad, no esta<br />
sucedi<strong>en</strong>do el mito <strong>de</strong> finales <strong>de</strong>l siglo XIX que <strong>de</strong>cía que todo el mundo iba a est<strong>ar</strong><br />
trabajando <strong>en</strong> <strong>la</strong>s cárceles y <strong>de</strong>spués iba a volver al mercado, recuperado y más dócil<br />
[D<strong>ar</strong>oqui, 2008].<br />
2.5.7 Reflexiones acerca <strong>de</strong>l diagnóstico <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />
Es importante ac<strong>la</strong>r<strong>ar</strong>, que mediante el diagnóstico <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do anteriorm<strong>en</strong>te se busca<br />
que el lector pueda, <strong>en</strong> alguna medida, introducirse <strong>en</strong> esta sociedad tan p<strong>ar</strong>ticu<strong>la</strong>r <strong>com</strong>o<br />
lo es <strong>la</strong> c<strong>ar</strong>ce<strong>la</strong>ria. Se cree que p<strong>ar</strong>a <strong>en</strong>t<strong>en</strong><strong>de</strong>r <strong>la</strong> problemática lo más a fondo posible, es<br />
sumam<strong>en</strong>te importante d<strong>ar</strong> a conocer estos indicadores.<br />
Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 43
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
44<br />
Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión
3. DESCRIPCIÓN DEL PROBLEMA<br />
3.1. TRATAMIENTO DE LA INFORMACIÓN<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
En <strong>la</strong> actualidad, <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal (DNPC) <strong>de</strong>l Ministerio <strong>de</strong><br />
Justicia y Derechos Humanos <strong>de</strong> <strong>la</strong> Nación (MJDHN) solo publica <strong>la</strong>s estadísticas<br />
prov<strong>en</strong>i<strong>en</strong>tes <strong>de</strong>l Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a sin<br />
tratami<strong>en</strong>to alguno <strong>de</strong> <strong>la</strong>s mismas. A través <strong>de</strong> un análisis estadístico básico, <strong>en</strong> el cuál<br />
lo que se hace es mostr<strong>ar</strong> <strong>la</strong>s frecu<strong>en</strong>cias <strong>de</strong> ocurr<strong>en</strong>cia <strong>de</strong> cada aspecto analizado, se<br />
esta <strong>de</strong>saprovechando toda <strong>la</strong> información que proporcionan los datos.<br />
En tiempos <strong>en</strong> los que los volúm<strong>en</strong>es <strong>de</strong> información son muy gran<strong>de</strong>s, se hace<br />
neces<strong>ar</strong>io un tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información más <strong>com</strong>plejo, esperando <strong>en</strong>contr<strong>ar</strong><br />
re<strong>la</strong>ciones subyac<strong>en</strong>tes y <strong>com</strong>portami<strong>en</strong>tos <strong>en</strong> los datos que no pue<strong>de</strong>n i<strong>de</strong>ntific<strong>ar</strong>se<br />
mediante un tratami<strong>en</strong>to estadístico clásico. Las técnicas estadísticas clásicas se c<strong>en</strong>tran<br />
g<strong>en</strong>eralm<strong>en</strong>te <strong>en</strong> técnicas confirmatorias, mi<strong>en</strong>tras que <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos<br />
son g<strong>en</strong>eralm<strong>en</strong>te exploratorias, pudi<strong>en</strong>do valid<strong>ar</strong> <strong>com</strong>portami<strong>en</strong>tos ya conocidos <strong>com</strong>o<br />
también p<strong>la</strong>nte<strong>ar</strong> nuevas hipótesis.<br />
3.2. EL PROBLEMA ESPECÍFICO<br />
Mi<strong>en</strong>tras que <strong>la</strong> cantidad <strong>de</strong> presos <strong>en</strong> establecimi<strong>en</strong>tos <strong>en</strong> <strong>la</strong> República Arg<strong>en</strong>tina<br />
continúa <strong>en</strong> asc<strong>en</strong>so continuo, lo mismo ocurre con <strong>la</strong>s tasas <strong>de</strong> <strong>de</strong>litos registradas año<br />
tras año. Estamos fr<strong>en</strong>te a una situación <strong>en</strong> <strong>la</strong> cual los <strong>de</strong>lincu<strong>en</strong>tes <strong>en</strong>tran a <strong>la</strong>s<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias p<strong>ar</strong>a <strong>la</strong> readaptación y resocialización, y sin emb<strong>ar</strong>go cuando <strong>la</strong> mayoría<br />
<strong>de</strong> ellos cumpl<strong>en</strong> sus p<strong>en</strong>as y <strong>de</strong>jan <strong>la</strong>s cárceles, vuelv<strong>en</strong> a busc<strong>ar</strong> al <strong>de</strong>lito <strong>com</strong>o medio<br />
<strong>de</strong> subsist<strong>en</strong>cia. Existe <strong>de</strong>ntro <strong>de</strong> estos establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios diversos factores<br />
<strong>com</strong>o el ocio, <strong>la</strong> viol<strong>en</strong>cia, el hacinami<strong>en</strong>to, <strong>la</strong> promiscuidad, <strong>la</strong> soledad, que hac<strong>en</strong> que<br />
los <strong>de</strong>t<strong>en</strong>idos sean <strong>de</strong>spersonalizados moral, psíquica y físicam<strong>en</strong>te.<br />
Por lo tanto se pue<strong>de</strong>n <strong>de</strong>stac<strong>ar</strong> dos fr<strong>en</strong>tes a atac<strong>ar</strong>. En primer lug<strong>ar</strong>, si se quiere<br />
readapt<strong>ar</strong> al <strong>de</strong>t<strong>en</strong>ido a una sociedad <strong>de</strong> <strong>la</strong> cual ya no forma p<strong>ar</strong>te, es fundam<strong>en</strong>tal que se<br />
llegue a cumplir con los fines que se buscan mediante <strong>la</strong> aplicación <strong>de</strong> <strong>la</strong> sanción:<br />
prev<strong>en</strong>ción, retribución, readaptación, resocialización y futura ubicación social <strong>de</strong> aquél.<br />
De esta manera, esper<strong>ar</strong>íamos que el preso pueda volver a integr<strong>ar</strong>se <strong>de</strong> manera<br />
<strong>de</strong>finitiva a <strong>la</strong> sociedad <strong>de</strong> <strong>la</strong> cual fue sep<strong>ar</strong>ado, sin necesidad m<strong>ar</strong>cada <strong>de</strong> volver a<br />
<strong>de</strong>linquir. En segundo lug<strong>ar</strong>, se ti<strong>en</strong>e que trabaj<strong>ar</strong> int<strong>en</strong>sivam<strong>en</strong>te <strong>en</strong> <strong>la</strong> prev<strong>en</strong>ción, es<br />
<strong>de</strong>cir, evit<strong>ar</strong> que nuevas personas <strong>com</strong>etan algún tipo <strong>de</strong> <strong>de</strong>lito y se conviertan <strong>en</strong> los<br />
futuros presos. Si no se logr<strong>ar</strong>a esto último se est<strong>ar</strong>ía fr<strong>en</strong>te a un “loop” interminable.<br />
Descripción <strong>de</strong>l Problema Patricio Gutiérrez Rüegg 45
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Por lo tanto, uno <strong>de</strong> los principales objetivos que se pret<strong>en</strong><strong>de</strong> alcanz<strong>ar</strong> mediante el<br />
pres<strong>en</strong>te proyecto es el sigui<strong>en</strong>te:<br />
Analiz<strong>ar</strong> <strong>la</strong> factibilidad y valor agregado <strong>de</strong> aplic<strong>ar</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones<br />
c<strong>ar</strong>ce<strong>la</strong>rias logrando <strong>en</strong>t<strong>en</strong><strong>de</strong>r mejor los motivos que pudieron haber motivado a esta<br />
fracción <strong>de</strong> <strong>la</strong> sociedad a <strong>de</strong>linquir y extraer conclusiones que sirvan <strong>de</strong> apoyo p<strong>ar</strong>a <strong>la</strong><br />
creación <strong>de</strong> políticas criminales rep<strong>ar</strong>adoras intramuros y prev<strong>en</strong>tivas fuera <strong>de</strong> <strong>la</strong>s<br />
cárceles.<br />
46<br />
Patricio Gutiérrez Rüegg Descripción <strong>de</strong>l Problema
4. SOLUCIÓN<br />
4.1 PROPUESTA DE SOLUCIÓN<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Una vez p<strong>la</strong>nteados tanto el estado <strong>de</strong> <strong>la</strong> cuestión, <strong>com</strong>o el problema que se requiere<br />
resolver, se continúa con <strong>la</strong> propuesta <strong>de</strong> solución al problema.<br />
A los fines <strong>de</strong> c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria y <strong>en</strong>contr<strong>ar</strong> conductas y patrones <strong>de</strong><br />
<strong>com</strong>portami<strong>en</strong>to <strong>en</strong> los reclusos, se <strong>de</strong>ci<strong>de</strong> <strong>en</strong>c<strong>ar</strong><strong>ar</strong> <strong>la</strong> problemática <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te<br />
manera:<br />
1. Proceso <strong>de</strong> clustering o agrupami<strong>en</strong>to utilizando los atributos más significativos <strong>de</strong><br />
los presos.<br />
2. Análisis <strong>de</strong> los clusters obt<strong>en</strong>idos. Validación con especialistas <strong>en</strong> temática criminal.<br />
3. Aplicación <strong>de</strong> algoritmos <strong>de</strong> inducción a cada cluster p<strong>ar</strong>a <strong>la</strong> i<strong>de</strong>ntificación <strong>de</strong> reg<strong>la</strong>s<br />
<strong>de</strong> <strong>de</strong>cisión que ayu<strong>de</strong>n a explic<strong>ar</strong> <strong>la</strong> <strong>com</strong>posición <strong>de</strong> cada grupo.<br />
De esta forma, mediante <strong>la</strong> utilización <strong>de</strong> algoritmos <strong>de</strong> agrupami<strong>en</strong>to y <strong>de</strong> c<strong>la</strong>sificación,<br />
se esperan obt<strong>en</strong>er <strong>com</strong>portami<strong>en</strong>tos <strong>com</strong>unes <strong>en</strong>tre los presos explorando los datos<br />
almac<strong>en</strong>ados <strong>en</strong> el sistema SNEEP. Se busca g<strong>en</strong>er<strong>ar</strong> grupos y reg<strong>la</strong>s relevantes que<br />
ayu<strong>de</strong>n a <strong>la</strong> toma <strong>de</strong> <strong>de</strong>cisiones <strong>de</strong> <strong>la</strong> DNPC.<br />
Se cree conv<strong>en</strong>i<strong>en</strong>te seguir una metodología <strong>de</strong> trabajo <strong>en</strong> minería <strong>de</strong> datos. Se utiliz<strong>ar</strong>á<br />
<strong>com</strong>o m<strong>ar</strong>co <strong>de</strong> trabajo a <strong>la</strong> CRISP-DM, explicada <strong>en</strong> el capítulo 2 “Estado <strong>de</strong> <strong>la</strong><br />
Cuestión” y <strong>com</strong>o herrami<strong>en</strong>ta informática al Rapid-i, un sólido programa <strong>de</strong> minería<br />
<strong>de</strong> datos libre uso (“freew<strong>ar</strong>e”) que posee gran cantidad <strong>de</strong> algoritmos.<br />
4.2 APLICACIÓN DE CRISP-DM<br />
P<strong>ar</strong>a po<strong>de</strong>r <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r el problema p<strong>la</strong>nteado <strong>de</strong> una forma a<strong>de</strong>cuada, se aplica <strong>la</strong><br />
metodología CRISP-DM. La misma permite realiz<strong>ar</strong> el trabajo <strong>en</strong> forma or<strong>de</strong>nada y<br />
consist<strong>en</strong>te pasando por cada una <strong>de</strong> sus fases:<br />
• Fase I: Compresión <strong>de</strong>l Negocio.<br />
• Fase II: Compr<strong>en</strong>sión <strong>de</strong> los Datos.<br />
• Fase III: Prep<strong>ar</strong>ación <strong>de</strong> los Datos.<br />
• Fase IV: Mo<strong>de</strong><strong>la</strong>do.<br />
• Fase V: Evaluación.<br />
• Fase VI: Implem<strong>en</strong>tación.<br />
Solución Patricio Gutiérrez Rüegg 47
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
4.2.1 Fase I: Compr<strong>en</strong>sión <strong>de</strong>l negocio<br />
4.2.1.1 Determin<strong>ar</strong> los objetivos <strong>de</strong>l negocio.<br />
La Dirección Nacional <strong>de</strong> Política Criminal (DNPC) fue creada con <strong>la</strong>s sigui<strong>en</strong>tes<br />
finalida<strong>de</strong>s:<br />
48<br />
• Realiz<strong>ar</strong> estudios e investigaciones estadísticas <strong>en</strong> el ámbito <strong>de</strong>l sistema p<strong>en</strong>al.<br />
• Des<strong>ar</strong>rol<strong>la</strong>r y ejercer los lineami<strong>en</strong>tos político-criminales llevados a<strong>de</strong><strong>la</strong>nte por<br />
el Ministerio <strong>de</strong> Justicia <strong>de</strong> <strong>la</strong> Nación.<br />
• Diseñ<strong>ar</strong> los programas específicos <strong>de</strong>stinados a actu<strong>ar</strong> sobre <strong>la</strong> problemática<br />
<strong>de</strong>lictiva, tanto <strong>en</strong> <strong>la</strong> faz prev<strong>en</strong>tiva <strong>com</strong>o punitiva, <strong>de</strong>terminando <strong>la</strong>s áreas<br />
priorit<strong>ar</strong>ias, así <strong>com</strong>o los medios idóneos p<strong>ar</strong>a <strong>la</strong> producción <strong>de</strong> <strong>la</strong>s<br />
transformaciones que se consi<strong>de</strong>re neces<strong>ar</strong>ias con re<strong>la</strong>ción al tema.<br />
• Formu<strong>la</strong>r y realiz<strong>ar</strong> los proyectos <strong>de</strong> investigación ci<strong>en</strong>tífica aplicada,<br />
directam<strong>en</strong>te vincu<strong>la</strong>dos con el <strong>de</strong>lito, sus consecu<strong>en</strong>cias y <strong>la</strong> reacción punitiva<br />
estatal.<br />
• Interv<strong>en</strong>ir <strong>en</strong> todos los proyectos legis<strong>la</strong>tivos vincu<strong>la</strong>dos con temas <strong>de</strong> su<br />
<strong>com</strong>pet<strong>en</strong>cia <strong>en</strong> el ámbito <strong>de</strong>l Ministerio <strong>de</strong> Justicia <strong>de</strong> <strong>la</strong> Nación.<br />
Mediante el cumplimi<strong>en</strong>to <strong>de</strong> los objetivos <strong>de</strong>l proyecto se espera concluir <strong>la</strong>s sigui<strong>en</strong>tes<br />
necesida<strong>de</strong>s:<br />
• I<strong>de</strong>ntific<strong>ar</strong> grupos <strong>de</strong> presos, <strong>de</strong> acuerdo a c<strong>ar</strong>acterísticas <strong>com</strong>unes.<br />
• Obt<strong>en</strong>er <strong>la</strong>s reg<strong>la</strong>s que ayudan a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r los distintos grupos formados.<br />
• Implem<strong>en</strong>t<strong>ar</strong> una herrami<strong>en</strong>ta que permita c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria<br />
cada cierto tiempo preestablecido y actualiz<strong>ar</strong> <strong>la</strong>s medidas <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>das <strong>en</strong> lo<br />
que concierne a política criminal prev<strong>en</strong>tiva.<br />
Los criterios <strong>de</strong> éxito <strong>de</strong>l proyecto están re<strong>la</strong>cionados <strong>en</strong> cumplir con estas necesida<strong>de</strong>s,<br />
<strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>en</strong>contr<strong>ar</strong> patrones <strong>de</strong> conducta y <strong>com</strong>portami<strong>en</strong>tos <strong>en</strong> los<br />
presos a través <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos. Se pret<strong>en</strong><strong>de</strong> <strong>en</strong>t<strong>en</strong><strong>de</strong>r los motivos que los llev<strong>ar</strong>on<br />
a <strong>de</strong>linquir p<strong>ar</strong>a proponer alternativas que permitan mejor<strong>ar</strong> <strong>la</strong> forma <strong>en</strong> que estos<br />
individuos son reinsertados <strong>en</strong> <strong>la</strong> sociedad.<br />
4.2.1.2 Evaluación <strong>de</strong> <strong>la</strong> Situación<br />
En los capítulos 2.4 “Información Criminal <strong>en</strong> Arg<strong>en</strong>tina” y 2.5 “Diagnóstico <strong>de</strong>l<br />
Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina”, se realiza una bu<strong>en</strong>a evaluación <strong>de</strong> <strong>la</strong> situación<br />
actual. Los requisitos, supuestos y restricciones se pres<strong>en</strong>tan a continuación.<br />
Patricio Gutiérrez Rüegg Solución
Requisitos<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Los diversos requisitos i<strong>de</strong>ntificables p<strong>ar</strong>a avanz<strong>ar</strong> con el proyecto son:<br />
• Definir el alcance <strong>de</strong>l proyecto.<br />
• Apr<strong>en</strong><strong>de</strong>r y <strong>en</strong>t<strong>en</strong><strong>de</strong>r <strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> minería <strong>de</strong> datos a utiliz<strong>ar</strong>.<br />
• Cont<strong>ar</strong> con <strong>la</strong> base <strong>de</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> <strong>la</strong>s primeras etapas p<strong>ar</strong>a po<strong>de</strong>r<br />
realiz<strong>ar</strong> corridas <strong>de</strong> prueba.<br />
• Valid<strong>ar</strong> los resultados obt<strong>en</strong>idos <strong>en</strong> cada una <strong>de</strong> <strong>la</strong>s pruebas con especialistas <strong>en</strong><br />
el tema (jueces, fiscales, abogados y sociólogos).<br />
• Reuniones periódicas con los especialistas <strong>de</strong> <strong>la</strong> Escue<strong>la</strong> <strong>de</strong> Postgrado <strong>de</strong><br />
Ing<strong>en</strong>iería <strong>de</strong> Softw<strong>ar</strong>e <strong>de</strong>l ITBA con el objetivo <strong>de</strong> analiz<strong>ar</strong> los datos y realiz<strong>ar</strong><br />
<strong>la</strong> técnica <strong>de</strong> minería <strong>de</strong> datos más conv<strong>en</strong>i<strong>en</strong>te.<br />
Supuestos<br />
Entre los supuestos se pue<strong>de</strong> nombr<strong>ar</strong> a:<br />
• Al utiliz<strong>ar</strong> una base <strong>de</strong> datos <strong>de</strong>l año 2004, se supone que el <strong>com</strong>portami<strong>en</strong>to <strong>de</strong><br />
esta pob<strong>la</strong>ción no ha cambiado significativam<strong>en</strong>te <strong>de</strong>s<strong>de</strong> <strong>en</strong>tonces.<br />
• Al trat<strong>ar</strong>se <strong>de</strong> un tema tan <strong>com</strong>plejo, <strong>com</strong>o lo es lleg<strong>ar</strong> a <strong>en</strong>t<strong>en</strong><strong>de</strong>r el motivo por<br />
el cual una persona <strong>com</strong>ete un <strong>de</strong>lito, al mom<strong>en</strong>to <strong>de</strong> analiz<strong>ar</strong>se los grupos se<br />
toman diversos supuestos a valid<strong>ar</strong> por especialistas. Entre ellos se pue<strong>de</strong>n<br />
nombr<strong>ar</strong> al supuesto <strong>de</strong> que muchos <strong>de</strong> los hombres ti<strong>en</strong><strong>en</strong> hijos aún cuando <strong>la</strong><br />
mayoría es soltera. Por otro <strong>la</strong>do, al no t<strong>en</strong>er información sobre <strong>la</strong> historia <strong>de</strong><br />
cada preso, se tuvo que suponer que <strong>en</strong> g<strong>en</strong>eral esta última no influye <strong>de</strong> manera<br />
fuerte <strong>en</strong> <strong>la</strong>s acciones <strong>de</strong> estos individuos.<br />
Restricciones<br />
En cuanto a <strong>la</strong>s restricciones, se consi<strong>de</strong>ran <strong>la</strong>s sigui<strong>en</strong>tes:<br />
• No se posee información <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido acerca <strong>de</strong> su historial famili<strong>ar</strong> y cultural<br />
que ayu<strong>de</strong> a c<strong>ar</strong>acteriz<strong>ar</strong>lo <strong>de</strong> una manera más <strong>com</strong>pleta <strong>en</strong> cuanto a patrones <strong>de</strong><br />
conducta y g<strong>en</strong>eración <strong>de</strong> reg<strong>la</strong>s.<br />
• Exist<strong>en</strong> <strong>en</strong> <strong>la</strong> base <strong>de</strong> datos campos inconsist<strong>en</strong>tes, con valores erróneos o vacíos<br />
que afectan al análisis <strong>de</strong> los resultados. Esto hace que se t<strong>en</strong>ga que prep<strong>ar</strong><strong>ar</strong> <strong>la</strong><br />
información previam<strong>en</strong>te llevando forzosam<strong>en</strong>te a <strong>la</strong> reducción <strong>de</strong> <strong>la</strong> muestra<br />
pob<strong>la</strong>cional (ver 4.2.3 Prep<strong>ar</strong>ación <strong>de</strong> los datos).<br />
Solución Patricio Gutiérrez Rüegg 49
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Expectativas<br />
50<br />
• Logr<strong>ar</strong> pres<strong>en</strong>t<strong>ar</strong> dicho proyecto fuera <strong>de</strong>l ámbito académico <strong>en</strong> el m<strong>ar</strong>co <strong>de</strong>l<br />
proyecto final <strong>de</strong> Ing<strong>en</strong>iería Industrial <strong>de</strong>l ITBA, con fines <strong>de</strong> prev<strong>en</strong>ción <strong>de</strong><br />
<strong>de</strong>litos.<br />
• Adquirir el conocimi<strong>en</strong>to y <strong>en</strong>t<strong>en</strong>dimi<strong>en</strong>to tanto <strong>de</strong> <strong>la</strong> técnica <strong>de</strong> minería <strong>de</strong> datos<br />
<strong>com</strong>o <strong>de</strong> <strong>la</strong>s herrami<strong>en</strong>tas informáticas utilizadas p<strong>ar</strong>a <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r el proyecto. Se<br />
espera po<strong>de</strong>r aplic<strong>ar</strong> dicho conocimi<strong>en</strong>to <strong>en</strong> otros campos y rubros a lo <strong>la</strong>rgo <strong>de</strong><br />
mi c<strong>ar</strong>rera profesional.<br />
• Ampli<strong>ar</strong> mi conocimi<strong>en</strong>to <strong>en</strong> cuestiones c<strong>la</strong>ves <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> política tanto<br />
criminal, <strong>com</strong>o judicial y <strong>de</strong> <strong>de</strong>rechos humanos.<br />
4.2.1.3 P<strong>la</strong>n <strong>de</strong> Proyecto<br />
Se <strong>de</strong>scribe el p<strong>la</strong>n p<strong>ar</strong>a llev<strong>ar</strong> a<strong>de</strong><strong>la</strong>nte el proyecto, según <strong>la</strong>s fases que p<strong>la</strong>ntea <strong>la</strong><br />
metodología CRISP-DM. El tiempo total estimado <strong>de</strong> realización es <strong>de</strong> 5 meses y<br />
correspon<strong>de</strong> a una persona trabajando “full time”.<br />
Fase I – Compr<strong>en</strong>sión <strong>de</strong>l negocio:<br />
1. Búsqueda y análisis <strong>de</strong> <strong>la</strong> información criminal disponible <strong>en</strong> Arg<strong>en</strong>tina<br />
2. Búsqueda, análisis y diagnóstico <strong>de</strong>l servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina.<br />
3. Estudi<strong>ar</strong> aplicaciones <strong>de</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones c<strong>ar</strong>ce<strong>la</strong>rias o con fines<br />
<strong>de</strong> prev<strong>en</strong>ción <strong>de</strong> <strong>de</strong>litos.<br />
4. Analiz<strong>ar</strong> técnicas y algoritmos <strong>de</strong> minería <strong>de</strong> datos.<br />
Tiempo estimado: 1 mes<br />
Fase II – Compr<strong>en</strong>sión <strong>de</strong> los datos:<br />
5. Adquirir los datos <strong>de</strong> <strong>la</strong> base SNEEP.<br />
6. Recolect<strong>ar</strong> los datos y estudi<strong>ar</strong> el vínculo <strong>en</strong>tre <strong>la</strong>s tab<strong>la</strong>s <strong>de</strong> <strong>la</strong> base <strong>de</strong> datos.<br />
7. Decodificación y exploración <strong>de</strong> los datos mediante gráficos <strong>de</strong> b<strong>ar</strong>ras y <strong>de</strong> torta.<br />
8. Verificación <strong>de</strong> <strong>la</strong> calidad <strong>de</strong> los datos.<br />
Tiempo estimado: 3 semanas<br />
Fase III – Prep<strong>ar</strong>ación <strong>de</strong> los datos:<br />
9. Prep<strong>ar</strong>ación <strong>de</strong>l dataset.<br />
10. Selección <strong>de</strong> atributos o campos, limpieza y construcción <strong>de</strong> los datos<br />
Tiempo estimado: 2 semanas<br />
Fase IV – Mo<strong>de</strong><strong>la</strong>do:<br />
11. Aplic<strong>ar</strong> <strong>la</strong>s técnicas y herrami<strong>en</strong>tas seleccionadas <strong>en</strong> <strong>la</strong> fase I.<br />
Tiempo estimado: 1 mes<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Fase V – Evaluación:<br />
12. Evalu<strong>ar</strong> el mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos obt<strong>en</strong>ido.<br />
13. Valid<strong>ar</strong> el mo<strong>de</strong>lo con especialistas <strong>de</strong>l tema.<br />
Tiempo estimado: 1 semana<br />
Fase VI –Implem<strong>en</strong>tación:<br />
14. G<strong>en</strong>er<strong>ar</strong> el informe final<br />
Tiempo estimado: 1 mes<br />
4.2.2 Fase II: Compr<strong>en</strong>sión <strong>de</strong> los datos<br />
Esta fase involucra <strong>la</strong>s t<strong>ar</strong>eas que hac<strong>en</strong> a <strong>la</strong> <strong>com</strong>presión <strong>de</strong> los datos, p<strong>ar</strong>a lo cual, los<br />
datos se <strong>de</strong>b<strong>en</strong> recolect<strong>ar</strong>, organiz<strong>ar</strong>, <strong>de</strong>scribir, verific<strong>ar</strong> y limpi<strong>ar</strong> antes <strong>de</strong> realiz<strong>ar</strong> el<br />
análisis <strong>de</strong> los mismos. Esto pue<strong>de</strong> consumir mucho tiempo y es crítico p<strong>ar</strong>a el proyecto<br />
<strong>de</strong> exploración <strong>de</strong> información.<br />
4.2.2.1 Recolección <strong>de</strong> los datos iniciales<br />
P<strong>ar</strong>a <strong>la</strong> e<strong>la</strong>boración <strong>de</strong>l proyecto se utiliza <strong>la</strong> base <strong>de</strong> datos <strong>de</strong> <strong>la</strong> totalidad <strong>de</strong> pob<strong>la</strong>ción<br />
c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina a fines <strong>de</strong>l año 2004. Dicha base <strong>de</strong> datos, conformada por más<br />
<strong>de</strong> 53,000 registros, fue provista p<strong>ar</strong>a el Ministerio <strong>de</strong> Justicia y Derechos Humanos <strong>de</strong><br />
<strong>la</strong> Nación Arg<strong>en</strong>tina bajo <strong>la</strong> realización y supervisión <strong>de</strong> <strong>la</strong> Dirección Nacional <strong>de</strong><br />
Política Criminal (DNPC). Los datos a utiliz<strong>ar</strong>se son los recolectados por el Sistema<br />
Nacional <strong>de</strong> Estadísticos sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP).<br />
La base <strong>de</strong> datos original se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> formato MS-Access y esta <strong>com</strong>puesta por <strong>la</strong>s<br />
sigui<strong>en</strong>tes tab<strong>la</strong>s:<br />
Tab<strong>la</strong> Principal:<br />
Tab<strong>la</strong>s Secund<strong>ar</strong>ias:<br />
• maeC<strong>en</strong>so [Tab<strong>la</strong> 4.1]: conti<strong>en</strong>e los datos codificados <strong>en</strong> forma<br />
numérica asociados al c<strong>en</strong>so p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>de</strong>l año 2004, <strong>de</strong>s<strong>de</strong> los<br />
datos concretos <strong>de</strong>l preso antes <strong>de</strong>l ingreso al establecimi<strong>en</strong>to<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io hasta su <strong>com</strong>portami<strong>en</strong>to <strong>de</strong>ntro <strong>de</strong>l mismo.<br />
• maeTabCodigos [Tab<strong>la</strong> 4.2]: diccion<strong>ar</strong>io que conti<strong>en</strong>e los<br />
atributos asociados a los códigos <strong>de</strong> <strong>la</strong> tab<strong>la</strong> principal.<br />
• tabEstablec [Tab<strong>la</strong> 4.3]: es <strong>la</strong> tab<strong>la</strong> que conti<strong>en</strong>e información<br />
re<strong>la</strong>cionada a los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios.<br />
• TabProv [Tab<strong>la</strong> 4.4]: re<strong>la</strong>cionada a <strong>la</strong> codificación <strong>de</strong> <strong>la</strong>s<br />
provincias.<br />
Solución Patricio Gutiérrez Rüegg 51
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
4.2.2.2 Descripción <strong>de</strong> los datos iniciales<br />
A continuación se muestra <strong>la</strong> estructura (Atributos/Descripción) <strong>de</strong> cada una <strong>de</strong> <strong>la</strong>s<br />
tab<strong>la</strong>s m<strong>en</strong>cionadas <strong>en</strong> el punto anterior.<br />
Campo Descripción Tipo <strong>de</strong> Dato<br />
idReco C<strong>la</strong>ve Principal <strong>de</strong> acceso a registros Autonumérico<br />
AniC<strong>en</strong>so Año <strong>de</strong> relevami<strong>en</strong>to <strong>de</strong>l c<strong>en</strong>so Numérico<br />
idProvincia código <strong>de</strong> id. <strong>de</strong> provincia Numérico<br />
idEstablec código <strong>de</strong> id. establecimi<strong>en</strong>to Numérico<br />
idInterno código <strong>de</strong> i<strong>de</strong>ntificación <strong>de</strong>l interno Texto<br />
Edad Edad Numérico<br />
Sexo Sexo Numérico<br />
Nacionalidad Nacionalidad Numérico<br />
estadoCivil Estado Civil Numérico<br />
nivelInstruc Nivel <strong>de</strong> Instrucción Numérico<br />
ulSitLaboral Ultima situación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />
capLaboalIngres<strong>ar</strong> Capacitación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />
ulLug<strong>ar</strong>Resid Ultimo lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia Numérico<br />
ulProvResid Ultima provincia <strong>de</strong> resi<strong>de</strong>ncia Numérico<br />
Jurisdiccion Jurisdicción Numérico<br />
sitLegal Situación legal Numérico<br />
fecDete Fecha <strong>de</strong> Det<strong>en</strong>ción Fecha/Hora<br />
fecCon<strong>de</strong> Fecha <strong>de</strong> Con<strong>de</strong>na Fecha/Hora<br />
estabDeProced Establecimi<strong>en</strong>to u orig<strong>en</strong> <strong>de</strong> proce<strong>de</strong>ncia Numérico<br />
idDeli1 Tipo <strong>de</strong> <strong>de</strong>lito por el cual ingresa al establecimi<strong>en</strong>to 1ra. m<strong>en</strong>ción Numérico<br />
idDeli2 2da. m<strong>en</strong>ción Numérico<br />
idDeli3 3ra. m<strong>en</strong>ción Numérico<br />
idDeli4 4ta. m<strong>en</strong>ción Numérico<br />
idDeli5 5ta. m<strong>en</strong>ción Numérico<br />
hsTrabRemu Cantidad <strong>de</strong> horas por trabajo remunerado Numérico<br />
p<strong>ar</strong>tiProgLabo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> formación o capacitación <strong>la</strong>boral Numérico<br />
p<strong>ar</strong>tiProgEdu P<strong>ar</strong>ticipación <strong>en</strong> algún programa educativo Numérico<br />
p<strong>ar</strong>tiActivDepo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> activida<strong>de</strong>s recreativas o <strong>de</strong>portivas Numérico<br />
recAsistMedUlAnio Indica si recibió asist<strong>en</strong>cia médica <strong>en</strong> el ultimo año Numérico<br />
recVisitasUlAnio Indica si recibió visitas <strong>en</strong> el ultimo año Numérico<br />
p<strong>ar</strong>tiAlterOr<strong>de</strong>n Indica si p<strong>ar</strong>ticipó <strong>de</strong> alteraciones <strong>de</strong>l or<strong>de</strong>n el último año Numérico<br />
tipInfracDisciplina Tipo <strong>de</strong> infracción si tuvo infracciones disciplin<strong>ar</strong>ias Numérico<br />
sancionAplicada Tipo <strong>de</strong> sanción disciplin<strong>ar</strong>ia aplicada Numérico<br />
califConducta Calificación <strong>de</strong> <strong>la</strong> conducta <strong>de</strong>l interno Numérico<br />
t<strong>en</strong>FugasEvas Int<strong>en</strong>tos <strong>de</strong> fugas o evasiones el último año Numérico<br />
t<strong>en</strong>Suicidio Int<strong>en</strong>tos <strong>de</strong> suicidios Numérico<br />
fueLesionado Indica si fue lesionado el ultimo año Numérico<br />
duracCon<strong>de</strong>na_A Duración <strong>en</strong> años <strong>de</strong> <strong>la</strong> con<strong>de</strong>na aplicada Numérico<br />
duracCon<strong>de</strong>na_M Duración <strong>en</strong> meses <strong>de</strong> <strong>la</strong> con<strong>de</strong>na aplicada Numérico<br />
tipCon<strong>de</strong>na Tipo <strong>de</strong> con<strong>de</strong>na: 1=Prisión, 2=Reclusión Numérico<br />
ti<strong>en</strong>eMedSegu Ti<strong>en</strong>e medidas <strong>de</strong> seguridad Numérico<br />
esReinci<strong>de</strong>nte Muestra el grado <strong>de</strong> reinci<strong>de</strong>ncia <strong>de</strong>l interno Numérico<br />
periProgresiv Ti<strong>en</strong>e período <strong>de</strong> progresividad Numérico<br />
tuvoSaliTransi Indica si tuvo salidas transitorias el ultimo año Numérico<br />
incRegSemiLib Está incorporado al régim<strong>en</strong> <strong>de</strong> semilibertad Numérico<br />
p<strong>ar</strong>tiProgPreLib Indica si p<strong>ar</strong>ticipa <strong>en</strong> algún programa <strong>de</strong> pre-libertad Numérico<br />
prisDiscontinua Indica si p<strong>ar</strong>ticipa <strong>en</strong> algún programa <strong>de</strong> prisión discontinua Numérico<br />
semiD<strong>en</strong>t<strong>en</strong>cion Indica si p<strong>ar</strong>ticipa <strong>en</strong> algún programa <strong>de</strong> semi-<strong>de</strong>t<strong>en</strong>ción Numérico<br />
tuvoReducP<strong>en</strong>a Muestra si se le aplic<strong>ar</strong>on reducciones <strong>de</strong> con<strong>de</strong>na el ultimo año Numérico<br />
mjTi<strong>en</strong>eHijos Posee hijos con el<strong>la</strong> <strong>en</strong> el establecimi<strong>en</strong>to (solo mujeres) Numérico<br />
Tab<strong>la</strong> 4.1. maeC<strong>en</strong>so.<br />
52<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Campo Descripción Tipo <strong>de</strong> Dato<br />
nomV<strong>ar</strong>i Cada uno <strong>de</strong> los atributos que ap<strong>ar</strong>ece <strong>en</strong> <strong>la</strong> tab<strong>la</strong> maeC<strong>en</strong>so Texto<br />
Item Posibilida<strong>de</strong>s (código numerico) que pue<strong>de</strong> tom<strong>ar</strong> cada una <strong>de</strong> <strong>la</strong>s nomV<strong>ar</strong>i Numérico<br />
Descri Descripcion <strong>de</strong>l Item Texto<br />
Tab<strong>la</strong> 4.2. maeTabCodigos.<br />
Campo Descripción Tipo <strong>de</strong> Dato<br />
idProv código <strong>de</strong> id. <strong>de</strong> provincia Numérico<br />
nroID código <strong>de</strong> id. establecimi<strong>en</strong>to Autonumérico<br />
Nombre Nombre <strong>de</strong>l Establecimi<strong>en</strong>to Texto<br />
Rep<strong>ar</strong>ti N/A Numérico<br />
tipEstab Tipo <strong>de</strong> Establecimi<strong>en</strong>to según modalidad Texto<br />
direccion Direccion Fisica <strong>de</strong>l Establecimi<strong>en</strong>to Texto<br />
cPostal Codigo Postal Texto<br />
Fonos Números <strong>de</strong> Telefono Texto<br />
Fax Números <strong>de</strong> FAX Texto<br />
email Direccion <strong>de</strong> E-mail Texto<br />
responsable Responsable <strong>de</strong>l Establecimi<strong>en</strong>to Texto<br />
capacidad Capacidad <strong>de</strong> alojami<strong>en</strong>to Numérico<br />
p<strong>la</strong>zCelIndiv Pob<strong>la</strong>cion ubicada <strong>en</strong> alojami<strong>en</strong>tos individuales Numérico<br />
p<strong>la</strong>zLocColec Pob<strong>la</strong>cion ubicada <strong>en</strong> alojami<strong>en</strong>tos colectivos Numérico<br />
Tab<strong>la</strong> 4.3. tabEstablec.<br />
Campo Descripción Tipo <strong>de</strong> Dato<br />
Codigo código <strong>de</strong> id. <strong>de</strong> provincia Numérico<br />
Descri Nombre <strong>de</strong> <strong>la</strong> Provincia Texto<br />
Tab<strong>la</strong> 4.4. TabProv.<br />
Las tab<strong>la</strong>s principales y secund<strong>ar</strong>ias se vincu<strong>la</strong>n <strong>en</strong>tre sí <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera:<br />
Figura 4.1. Vincu<strong>la</strong>ción <strong>en</strong>tre <strong>la</strong>s tab<strong>la</strong>s.<br />
Solución Patricio Gutiérrez Rüegg 53
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
4.2.2.2.1 Dataset seleccionado<br />
A priori, los campos o atributos que se elig<strong>en</strong> p<strong>ar</strong>a g<strong>en</strong>er<strong>ar</strong> el conjunto <strong>de</strong> datos (dataset)<br />
y efectu<strong>ar</strong> <strong>la</strong> minería <strong>de</strong> datos son los sigui<strong>en</strong>tes:<br />
54<br />
Campo Descripción Tipo <strong>de</strong> Dato<br />
Sexo Sexo Numérico<br />
edad Edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Numérico<br />
Nacionalidad Nacionalidad Numérico<br />
estadoCivil Estado Civil <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Numérico<br />
nivelInstruc Nivel <strong>de</strong> Instrucción Numérico<br />
ulSitLaboral Ultima situación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />
capLaboalIngres<strong>ar</strong> Capacitación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />
ulLug<strong>ar</strong>Resid Ultimo lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia (Urbano/Rural) Numérico<br />
ulProvResid Ultima provincia <strong>de</strong> resi<strong>de</strong>ncia Numérico<br />
sitLegal Situación legal Numérico<br />
idDeli1 Tipo <strong>de</strong> <strong>de</strong>lito por el cual ingresa al establecimi<strong>en</strong>to 1ra. m<strong>en</strong>ción Numérico<br />
idDeli2 2da. m<strong>en</strong>ción Numérico<br />
hsTrabRemu Cantidad <strong>de</strong> horas por trabajo remunerado Numérico<br />
p<strong>ar</strong>tiProgLabo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> formación o capacitación <strong>la</strong>boral Numérico<br />
p<strong>ar</strong>tiProgEdu P<strong>ar</strong>ticipación <strong>en</strong> algún programa educativo Numérico<br />
p<strong>ar</strong>tiActivDepo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> activida<strong>de</strong>s recreativas o <strong>de</strong>portivasNumérico<br />
esReinci<strong>de</strong>nte Muestra el grado <strong>de</strong> reinci<strong>de</strong>ncia <strong>de</strong>l interno Numérico<br />
Tab<strong>la</strong> 4.5. Dataset prelimin<strong>ar</strong> seleccionado.<br />
El pres<strong>en</strong>te dataset es prelimin<strong>ar</strong>. Consta <strong>de</strong> c<strong>ar</strong>acterísticas <strong>de</strong> los presos al mom<strong>en</strong>to <strong>de</strong><br />
ser <strong>de</strong>t<strong>en</strong>idos, durante el ingreso <strong>de</strong>l preso, y algunos campos que <strong>de</strong>scrib<strong>en</strong> el<br />
<strong>com</strong>portami<strong>en</strong>to <strong>de</strong> los mismos ya <strong>de</strong>ntro <strong>de</strong>l establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Los campos<br />
que pres<strong>en</strong>tan mayores inconsist<strong>en</strong>cias y problemas <strong>de</strong> calidad son los que proce<strong>de</strong>n <strong>de</strong><br />
<strong>la</strong> información obt<strong>en</strong>ida <strong>de</strong>l interior <strong>de</strong>l p<strong>en</strong>al, <strong>com</strong>o <strong>la</strong> conducta, infracciones,<br />
alteraciones <strong>de</strong>l or<strong>de</strong>n, etc. Debido a esto último, <strong>en</strong> principio, no serían utilizados p<strong>ar</strong>a<br />
realiz<strong>ar</strong> el estudio. Más a<strong>de</strong><strong>la</strong>nte, cuando se verifique <strong>la</strong> calidad <strong>de</strong> los datos, se<br />
profundiz<strong>ar</strong>á <strong>en</strong> el tema.<br />
4.2.2.2.2 Decodificación <strong>de</strong> los campos<br />
P<strong>ar</strong>a <strong>la</strong> <strong>de</strong>codificación <strong>de</strong> los valores <strong>de</strong> <strong>la</strong> tab<strong>la</strong> principal <strong>en</strong> formato numérico se<br />
utilizan consultas (Queries) programadas <strong>en</strong> l<strong>en</strong>guaje SQL mediante el softw<strong>ar</strong>e MS-<br />
Access, según <strong>la</strong>s re<strong>la</strong>ciones <strong>de</strong> <strong>la</strong>s distintas tab<strong>la</strong>s [Figura 4.1]. Cabe m<strong>en</strong>cion<strong>ar</strong>, que se<br />
trabaj<strong>ar</strong>á con atributos alfanuméricos.<br />
Los valores que pue<strong>de</strong>n tom<strong>ar</strong> cada uno <strong>de</strong> los atributos seleccionados a priori pue<strong>de</strong>n<br />
ser los sigui<strong>en</strong>tes:<br />
nomV<strong>ar</strong>i Item Descri<br />
Sexo 1 Masculino<br />
Sexo 2 Fem<strong>en</strong>ino<br />
Tab<strong>la</strong> 4.6. Sexo.<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
nomV<strong>ar</strong>i Item Descri<br />
Nacionalidad 1 Arg<strong>en</strong>tina<br />
Nacionalidad 2 Boliviana<br />
Nacionalidad 3 Brasileña<br />
Nacionalidad 4 Chil<strong>en</strong>a<br />
Nacionalidad 5 P<strong>ar</strong>aguaya<br />
Nacionalidad 6 Uruguaya<br />
Nacionalidad 7 Peruana<br />
Nacionalidad 8 Colombiana<br />
Nacionalidad 9 Ecuatoriana<br />
Nacionalidad 10 Españo<strong>la</strong><br />
Nacionalidad 11 Italiana<br />
Nacionalidad 12 Inglesa<br />
Nacionalidad 13 China<br />
Nacionalidad 14 Sudafricana<br />
Nacionalidad 15 Nigeriana<br />
Nacionalidad 16 Otras<br />
Tab<strong>la</strong> 4.7. Nacionalidad.<br />
nomV<strong>ar</strong>i Item Descri<br />
estadoCivil 1 Soltero<br />
estadoCivil 2 Casado<br />
estadoCivil 3 Viudo<br />
estadoCivil 4 Sep<strong>ar</strong>ado o divorciado<br />
estadoCivil 5 Sep<strong>ar</strong>ado <strong>de</strong> hecho<br />
estadoCivil 6 Concubino<br />
Tab<strong>la</strong> 4.8. Estado Civil.<br />
nomV<strong>ar</strong>i Item Descri<br />
nivelInstruc 1 Ninguno<br />
nivelInstruc 2 Prim<strong>ar</strong>io in<strong>com</strong>pleto<br />
nivelInstruc 3 Prim<strong>ar</strong>io <strong>com</strong>pleto<br />
nivelInstruc 4 Secund<strong>ar</strong>io in<strong>com</strong>pleto<br />
nivelInstruc 5 Secund<strong>ar</strong>io <strong>com</strong>pleto<br />
nivelInstruc 6 Terci<strong>ar</strong>io in<strong>com</strong>pleto<br />
nivelInstruc 7 Terci<strong>ar</strong>io <strong>com</strong>pleto<br />
nivelInstruc 8 Universit<strong>ar</strong>io in<strong>com</strong>pleto<br />
nivelInstruc 9 Universit<strong>ar</strong>io <strong>com</strong>pleto<br />
nivelInstruc 10 EGB 1 In<strong>com</strong>pleto<br />
nivelInstruc 11 EGB 1 Completo<br />
nivelInstruc 12 EGB 2 In<strong>com</strong>pleto<br />
nivelInstruc 13 EGB 2 Completo<br />
nivelInstruc 14 EGB 3 In<strong>com</strong>pleto<br />
nivelInstruc 15 EGB 3 Completo<br />
nivelInstruc 16 Polimodal In<strong>com</strong>pleto<br />
nivelInstruc 17 Polimodal Completo<br />
Tab<strong>la</strong> 4.9. Nivel <strong>de</strong> Instrucción.<br />
nomV<strong>ar</strong>i Item Descri<br />
ulSitLaboral 1 Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
ulSitLaboral 2 Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
ulSitLaboral 3 Desocupado<br />
Tab<strong>la</strong> 4.10. Última Situación Laboral.<br />
Solución Patricio Gutiérrez Rüegg 55
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
56<br />
nomV<strong>ar</strong>i Item Descri<br />
capLaboalIngres<strong>ar</strong> 1 Ti<strong>en</strong>e algún oficio<br />
capLaboalIngres<strong>ar</strong> 2 Ti<strong>en</strong>e alguna profesión<br />
capLaboalIngres<strong>ar</strong> 3 No ti<strong>en</strong>e ni oficio ni profesión<br />
Tab<strong>la</strong> 4.11. Capacitación Laboral al mom<strong>en</strong>to <strong>de</strong> ingreso.<br />
idProvincia Descri<br />
1 Bu<strong>en</strong>os Aires<br />
2 Catam<strong>ar</strong>ca<br />
3 Córdoba<br />
4 Corri<strong>en</strong>tes<br />
5 Chaco<br />
6 Chubut<br />
7 Entre Rios<br />
8 Formosa<br />
9 Jujuy<br />
10 La Pampa<br />
11 La Rioja<br />
12 M<strong>en</strong>doza<br />
13 Misiones<br />
14 Neuqu<strong>en</strong><br />
15 Rio Negro<br />
16 Salta<br />
17 San Juan<br />
18 San Luis<br />
19 Santa Cruz<br />
20 Santa Fe<br />
21 Santiago Del Estero<br />
22 Tierra Del Fuego<br />
23 Tucumán<br />
24 Ciudad De Bu<strong>en</strong>os Aires<br />
Tab<strong>la</strong> 4.12. Última Provincia <strong>de</strong> Resi<strong>de</strong>ncia.<br />
nomV<strong>ar</strong>i Item Descri<br />
sitLegal 1 Con<strong>de</strong>nado<br />
sitLegal 2 Procesado<br />
sitLegal 3 Contrav<strong>en</strong>tor<br />
sitLegal 4 Inimputable<br />
sitLegal 5 Otra situación<br />
Tab<strong>la</strong> 4.13. Situación Legal.<br />
nomV<strong>ar</strong>i Item Descri<br />
p<strong>ar</strong>tiProgEdu 1 Si - educación formal - EGB<br />
p<strong>ar</strong>tiProgEdu 2 Si - educación formal - POLIMODAL<br />
p<strong>ar</strong>tiProgEdu 3 Si - educación formal - TERCIARIA<br />
p<strong>ar</strong>tiProgEdu 4 Si - educación formal - UNIVERSITARIA<br />
p<strong>ar</strong>tiProgEdu 5 Si - educación no formal<br />
p<strong>ar</strong>tiProgEdu 6 No p<strong>ar</strong>ticipa <strong>de</strong> ningún programa educativo<br />
Tab<strong>la</strong> 4.14. P<strong>ar</strong>ticipa <strong>en</strong> Programas educativos<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
nomV<strong>ar</strong>i Item Descri<br />
idDeli1 1 Homicidios dolosos<br />
idDeli1 2 Homicidios dolosos (t<strong>en</strong>t.)<br />
idDeli1 3 Homicidios Culposos<br />
idDeli1 4 Lesiones Dolosas<br />
idDeli1 5 Lesiones Culposas<br />
idDeli1 6 Otros <strong>de</strong>litos contra <strong>la</strong>s personas<br />
idDeli1 7 Delitos contra el honor<br />
idDeli1 8 Vio<strong>la</strong>ciones<br />
idDeli1 9 Otros <strong>de</strong>litos contra <strong>la</strong> honestidad<br />
idDeli1 10 Am<strong>en</strong>azas<br />
idDeli1 11 Privación ilegítima <strong>de</strong> <strong>la</strong> libertad<br />
idDeli1 12 Del. contra <strong>la</strong> lib. <strong>com</strong>et. por func. público<br />
idDeli1 13 Otros <strong>de</strong>litos contra <strong>la</strong> libertad<br />
idDeli1 14 Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto<br />
idDeli1 15 Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo<br />
idDeli1 16 Otros <strong>de</strong>litos contra <strong>la</strong> propiedad<br />
idDeli1 17 Delitos contra <strong>la</strong> seguridad pública<br />
idDeli1 18 Delitos c/el or<strong>de</strong>n público<br />
idDeli1 19 Delitos contra <strong>la</strong> seguridad <strong>de</strong> <strong>la</strong> nación<br />
idDeli1 20 Delitos contra los po<strong>de</strong>res publicos<br />
idDeli1 21 Delitos c/ <strong>la</strong> administracion pública<br />
idDeli1 22 Delitos c/ <strong>la</strong> fe pública<br />
idDeli1 23 Delitos c/ el estado civil<br />
idDeli1 24 Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes)<br />
idDeli1 25 Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia<br />
idDeli1 26 Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres<br />
idDeli1 27 Delitos previstos <strong>en</strong> leyes especiales<br />
idDeli1 28 Contrav<strong>en</strong>ciones<br />
Tab<strong>la</strong> 4.15. Tipo <strong>de</strong> <strong>de</strong>lito <strong>com</strong>etido.<br />
nomV<strong>ar</strong>i Item Descri<br />
hsTrabRemu 1 Hasta 10 hs. Semanales<br />
hsTrabRemu 2 Hasta 20 hs. Semanales<br />
hsTrabRemu 3 Hasta 30 hs. Semanales<br />
hsTrabRemu 4 Hasta 40 hs. Semanales<br />
hsTrabRemu 5 No ti<strong>en</strong>e trabajo remunerado<br />
Tab<strong>la</strong> 4.16. Cantidad horas <strong>de</strong> trabajo remunerado<br />
nomV<strong>ar</strong>i Item Descri<br />
p<strong>ar</strong>tiProgLabo 1 Si<br />
p<strong>ar</strong>tiProgLabo 2 No<br />
Tab<strong>la</strong> 4.17. P<strong>ar</strong>ticipa programa Laboral<br />
nomV<strong>ar</strong>i Item Descri<br />
ulLug<strong>ar</strong>Resid 1 Rural<br />
ulLug<strong>ar</strong>Resid 2 Urbano<br />
Tab<strong>la</strong> 4.18. Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia (Urbano/Rural)<br />
Solución Patricio Gutiérrez Rüegg 57
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
4.2.2.3 Exploración <strong>de</strong> los datos<br />
Mediante el dataset prelimin<strong>ar</strong> seleccionado <strong>en</strong> el punto anterior, se lleva a cabo <strong>la</strong><br />
exploración <strong>de</strong> los datos p<strong>ar</strong>a famili<strong>ar</strong>iz<strong>ar</strong>se con los mismos, y al mismo tiempo po<strong>de</strong>r<br />
i<strong>de</strong>ntific<strong>ar</strong> problemas <strong>de</strong> calidad. Se <strong>com</strong>i<strong>en</strong>zan a <strong>de</strong>tect<strong>ar</strong> faltantes <strong>de</strong> información <strong>en</strong><br />
algunos campos que se pres<strong>en</strong>tan vacíos (“Sin datos”). En esta etapa no se realiza<br />
ningún tratami<strong>en</strong>to <strong>de</strong> los datos.<br />
[Sexo]: Se pue<strong>de</strong> observ<strong>ar</strong> <strong>la</strong> distribución <strong>de</strong>l sexo <strong>en</strong>tre los internos. Se nota<br />
c<strong>la</strong>ram<strong>en</strong>te que los <strong>de</strong>t<strong>en</strong>idos son su mayoría <strong>de</strong>l sexo masculino.<br />
58<br />
Sexo Presos<br />
Masculino 50,408<br />
Fem<strong>en</strong>ino 2,621<br />
Total 53,029<br />
Tab<strong>la</strong> 4.19. Sexo<br />
Distribución por Sexo<br />
5%<br />
Masculino<br />
Fem<strong>en</strong>ino<br />
95%<br />
Figura 4.2. Distribución por sexo.<br />
[Nacionalidad] / [Edad]: Se pue<strong>de</strong> observ<strong>ar</strong> que <strong>la</strong> nacionalidad predominante es <strong>la</strong><br />
Arg<strong>en</strong>tina. Luego le sigu<strong>en</strong> presos <strong>de</strong> distintos países limítrofes <strong>de</strong> <strong>la</strong> Nación.<br />
Nacionalidad Presos<br />
Arg<strong>en</strong>tina 50,329<br />
Boliviana 531<br />
P<strong>ar</strong>aguaya 424<br />
Uruguaya 396<br />
Chil<strong>en</strong>a 364<br />
Peruana 313<br />
Otras 132<br />
Brasileña 59<br />
Colombiana 43<br />
Italiana 25<br />
Sudafricana 24<br />
Españo<strong>la</strong> 23<br />
China 20<br />
Ecuatoriana 6<br />
Inglesa 6<br />
Nigeriana 3<br />
Sin Datos 331<br />
Total 53,029<br />
Tab<strong>la</strong> 4.20. Distribución <strong>de</strong> nacionalida<strong>de</strong>s.<br />
Rango Edad Presos<br />
M<strong>en</strong>or 18 520<br />
18-24 15,975<br />
25-34 21,044<br />
35-44 9,377<br />
45-54 4,146<br />
55-64 1,405<br />
65 y mas 398<br />
Sin Datos 164<br />
Total 53,029<br />
Tab<strong>la</strong> 4.21. Rango <strong>de</strong> eda<strong>de</strong>s<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
[Estado Civil]:<br />
La mayor cantidad <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos indicó que se <strong>en</strong>contraba soltero al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong><br />
<strong>de</strong>t<strong>en</strong>ción. Luego, <strong>en</strong> proporciones simi<strong>la</strong>res, le sigu<strong>en</strong> los casados y los concubinos.<br />
40,000<br />
35,000<br />
30,000<br />
25,000<br />
20,000<br />
15,000<br />
10,000<br />
5,000<br />
0<br />
37,199<br />
Estado Civil Presos<br />
Soltero 37,199<br />
Concubino 6,452<br />
Casado 6,441<br />
Sep<strong>ar</strong>ado <strong>de</strong> hecho 1,056<br />
Sep<strong>ar</strong>ado o divorciado 814<br />
Viudo 558<br />
Sin Datos 509<br />
Total 53,029<br />
6,452 6,441<br />
Tab<strong>la</strong> 4.22. Estado Civil.<br />
Estado Civil <strong>de</strong> los internos<br />
Soltero Concubino Casado Sep<strong>ar</strong>ado<br />
<strong>de</strong> hecho<br />
1,056 814 558 509<br />
Sep<strong>ar</strong>ado o<br />
divorciado<br />
Figura 4.3. Estado Civil <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
Viudo Sin Datos<br />
[Nivel <strong>de</strong> Instrucción]:<br />
Dicho campo refleja el nivel <strong>de</strong> educación <strong>de</strong> los internos. Prim<strong>ar</strong>io in<strong>com</strong>pleto y<br />
<strong>com</strong>pleto, secund<strong>ar</strong>io in<strong>com</strong>pleto y ningún tipo <strong>de</strong> educación repres<strong>en</strong>tan el 92% <strong>de</strong> los<br />
casos.<br />
Nivel <strong>de</strong> Instrucción Presos Terci<strong>ar</strong>io <strong>com</strong>pleto 146<br />
Prim<strong>ar</strong>io <strong>com</strong>pleto 27,451 EGB 3 Completo 136<br />
Prim<strong>ar</strong>io in<strong>com</strong>pleto 10,740 Universit<strong>ar</strong>io <strong>com</strong>pleto 110<br />
Secund<strong>ar</strong>io in<strong>com</strong>pleto 7,029 EGB 1 In<strong>com</strong>pleto 100<br />
Ninguno 3,328 Polimodal In<strong>com</strong>pleto 89<br />
Secund<strong>ar</strong>io <strong>com</strong>pleto 2,220 EGB 1 Completo 49<br />
EGB 3 In<strong>com</strong>pleto 286 EGB 2 Completo 46<br />
Universit<strong>ar</strong>io in<strong>com</strong>pleto 268 Polimodal Completo 15<br />
Terci<strong>ar</strong>io in<strong>com</strong>pleto 224 Sin Datos 627<br />
EGB 2 In<strong>com</strong>pleto 165 Total 53,029<br />
Tab<strong>la</strong> 4.23. Nivel <strong>de</strong> Instrucción <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
Solución Patricio Gutiérrez Rüegg 59
30,000<br />
25,000<br />
20,000<br />
15,000<br />
10,000<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
5,000<br />
0<br />
Prim<strong>ar</strong>io <strong>com</strong>pleto<br />
Prim<strong>ar</strong>io in<strong>com</strong>pleto<br />
60<br />
Secund<strong>ar</strong>io in<strong>com</strong>pleto<br />
Ninguno<br />
Secund<strong>ar</strong>io <strong>com</strong>pleto<br />
EGB 3 In<strong>com</strong>pleto<br />
Universit<strong>ar</strong>io in<strong>com</strong>pleto<br />
Nivel <strong>de</strong> Instrucción<br />
EGB 2 In<strong>com</strong>pleto<br />
Terci<strong>ar</strong>io in<strong>com</strong>pleto<br />
Terci<strong>ar</strong>io <strong>com</strong>pleto<br />
EGB 3 Completo<br />
EGB 1 In<strong>com</strong>pleto<br />
Universit<strong>ar</strong>io <strong>com</strong>pleto<br />
Polimodal In<strong>com</strong>pleto<br />
Figura 4.4. Nivel <strong>de</strong> Instrucción <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
EGB 1 Completo<br />
EGB 2 Completo<br />
Polimodal Completo<br />
Sin Datos<br />
[Última Situación Laboral]:<br />
Muestra el status <strong>la</strong>boral <strong>de</strong> los reclusos al mom<strong>en</strong>to <strong>de</strong> ingres<strong>ar</strong> al p<strong>en</strong>al. Se observa<br />
<strong>com</strong>o sólo el 19% <strong>de</strong> los mismos poseía un trabajo <strong>de</strong> tiempo <strong>com</strong>pleto al ser <strong>de</strong>t<strong>en</strong>ido.<br />
Este campo está muy re<strong>la</strong>cionado con el anterior, nivel <strong>de</strong> instrucción.<br />
Situacion Laboral Presos<br />
Desocupado 21,342<br />
Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial 20,831<br />
Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto 9,824<br />
Sin Datos 1,032<br />
Total 53,029<br />
19%<br />
Ultima Situación Laboral<br />
Tab<strong>la</strong> 4.24. Situación Laboral Figura 4.5. Situación Laboral <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
39%<br />
2%<br />
40%<br />
Desocupado<br />
Trabajador <strong>de</strong><br />
tiempo p<strong>ar</strong>cial<br />
Trabajador <strong>de</strong><br />
tiempo <strong>com</strong>pleto<br />
Sin Datos<br />
[Capacitación Laboral]:<br />
Refleja si los <strong>de</strong>t<strong>en</strong>idos poseían alguna profesión u oficio al mom<strong>en</strong>to <strong>de</strong> ingreso al<br />
p<strong>en</strong>al. Alre<strong>de</strong>dor <strong>de</strong> <strong>la</strong> mitad <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos no t<strong>en</strong>ía ningún oficio ni profesión.<br />
Patricio Gutiérrez Rüegg Solución
Situacion Laboral Presos<br />
No ti<strong>en</strong>e ni oficio ni profesión 25,202<br />
Ti<strong>en</strong>e algún oficio 20,290<br />
Ti<strong>en</strong>e alguna profesión 4,312<br />
Sin Datos 3,225<br />
Total 53,029<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Capacitación Laboral<br />
Tab<strong>la</strong> 4.25. Capacitación Laboral. Figura 4.6. Capacitación Laboral <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
[Tipo <strong>de</strong>l lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia]:<br />
Solución Patricio Gutiérrez Rüegg 61<br />
38%<br />
8%<br />
6%<br />
48%<br />
Último Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia<br />
No ti<strong>en</strong>e ni oficio ni<br />
profesión<br />
Ti<strong>en</strong>e algún oficio<br />
Ti<strong>en</strong>e alguna<br />
profesión<br />
Sin Datos<br />
Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia Presos<br />
Urbano<br />
Urbano<br />
Rural<br />
Sin Datos<br />
44,663<br />
5,623<br />
2,743<br />
84%<br />
Rural<br />
Sin Datos<br />
Total 53,029<br />
Tab<strong>la</strong> 4.26. Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia. Figura 4.7. Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
[Situación Legal]: El pres<strong>en</strong>te campo es <strong>de</strong> real importancia al mom<strong>en</strong>to <strong>de</strong> estudi<strong>ar</strong> a<br />
<strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina. La sep<strong>ar</strong>ación <strong>de</strong> procesados y con<strong>de</strong>nados es un<br />
principio elem<strong>en</strong>tal <strong>de</strong>l tratami<strong>en</strong>to c<strong>ar</strong>ce<strong>la</strong>rio. Hoy <strong>en</strong> día, solo el 40% <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos<br />
posee una con<strong>de</strong>na.<br />
Situación Legal Presos<br />
Procesado 31,043<br />
Procesado<br />
Con<strong>de</strong>nado<br />
Inimputable<br />
Otra situación<br />
Total<br />
21,054<br />
674<br />
258<br />
53,029<br />
59%<br />
Con<strong>de</strong>nado<br />
Inimputable<br />
Otra situación<br />
Tab<strong>la</strong> 4.27. Situación Legal. Figura 4.8. Situación legal <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />
11%<br />
40%<br />
5%<br />
1%<br />
Situación Legal<br />
0%
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
[Delito <strong>com</strong>etido]:<br />
Delito <strong>en</strong> primera m<strong>en</strong>ción por el cual <strong>la</strong> persona fue <strong>de</strong>t<strong>en</strong>ida según el código p<strong>en</strong>al.<br />
Los <strong>de</strong>litos <strong>de</strong> robo, homicidios, estupefaci<strong>en</strong>tes y vio<strong>la</strong>ciones conforman el 87% <strong>de</strong> los<br />
casos.<br />
62<br />
Delito Cometido Presos<br />
Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo 26,777 Delitos contra el honor 215<br />
Homicidios dolosos 6,635 Otros <strong>de</strong>litos contra <strong>la</strong> libertad 194<br />
Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes) 3,906 Delitos c/ <strong>la</strong> fe pública 193<br />
Vio<strong>la</strong>ciones 2,504 Delitos c/el or<strong>de</strong>n público 155<br />
Otros <strong>de</strong>litos contra <strong>la</strong>s personas 1,722 Lesiones Culposas 123<br />
Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto 1,453 Delitos previstos <strong>en</strong> leyes especiales 58<br />
Otros <strong>de</strong>litos contra <strong>la</strong> honestidad 1,452 Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia 24<br />
Otros <strong>de</strong>litos contra <strong>la</strong> propiedad 1,345 Contrav<strong>en</strong>ciones 21<br />
Delitos contra <strong>la</strong> seguridad pública 1,052 Delitos contra <strong>la</strong> seguridad <strong>de</strong> <strong>la</strong> nación 20<br />
Homicidios dolosos (t<strong>en</strong>t.) 819 Del. contra <strong>la</strong> lib. <strong>com</strong>et. por func. público 18<br />
Homicidios Culposos 675 Delitos contra los po<strong>de</strong>res publicos 15<br />
Privación ilegítima <strong>de</strong> <strong>la</strong> libertad 578 Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres 13<br />
Lesiones Dolosas 494 Delitos c/ el estado civil 9<br />
Delitos c/ <strong>la</strong> administracion pública 438 Sin Datos 1,861<br />
Am<strong>en</strong>azas 260 Total 53,029<br />
Tab<strong>la</strong> 4.28. Delitos Cometidos <strong>en</strong> primera m<strong>en</strong>ción<br />
Delitos<br />
Homicidios Culposos<br />
Homicidios dolosos (t<strong>en</strong>t.)<br />
Delitos contra <strong>la</strong> seguridad pública<br />
Otros <strong>de</strong>litos contra <strong>la</strong> propiedad<br />
Otros <strong>de</strong>litos contra <strong>la</strong> honestidad<br />
Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto<br />
Otros <strong>de</strong>litos contra <strong>la</strong>s personas<br />
Vio<strong>la</strong>ciones<br />
Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes)<br />
Homicidios dolosos<br />
Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo<br />
Delitos Cometidos <strong>en</strong> primera m<strong>en</strong>ción<br />
0 3000 6000 9000 12000 15000 18000 21000 24000 27000 30000<br />
Figura 4.9. Delitos Cometidos <strong>en</strong> primera m<strong>en</strong>ción<br />
Presos<br />
[Trabajo remunerado]:<br />
Repres<strong>en</strong>ta <strong>la</strong> proporción <strong>de</strong> internos que ti<strong>en</strong><strong>en</strong> un trabajo remunerado <strong>de</strong>ntro <strong>de</strong>l p<strong>en</strong>al.<br />
Vale <strong>de</strong>stac<strong>ar</strong> que p<strong>ar</strong>a t<strong>en</strong>er acceso a un trabajo remunerado es neces<strong>ar</strong>io que el<br />
<strong>de</strong>t<strong>en</strong>ido t<strong>en</strong>ga una con<strong>de</strong>na firme.<br />
Patricio Gutiérrez Rüegg Solución
Trabajo Remunerado Presos<br />
No ti<strong>en</strong>e trabajo remunerado 30,539<br />
Hasta 20 hs. Semanales 5,435<br />
Hasta 40 hs. Semanales 5,099<br />
Hasta 30 hs. Semanales 4,304<br />
Hasta 10 hs. Semanales 1,672<br />
Sin Datos 5,980<br />
Total 53,029<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Trabajo Remunerado<br />
Tab<strong>la</strong> 4.29. Trabajo Remunerado. Figura 4.10. Trabajo remunerado <strong>en</strong> los internos.<br />
Solución Patricio Gutiérrez Rüegg 63<br />
8%<br />
10%<br />
3%<br />
10%<br />
11%<br />
58%<br />
No ti<strong>en</strong>e trabajo<br />
remunerado<br />
Hasta 20 hs.<br />
Semanales<br />
Hasta 40 hs.<br />
Semanales<br />
Hasta 30 hs.<br />
Semanales<br />
Hasta 10 hs.<br />
Semanales<br />
Sin Datos<br />
[P<strong>ar</strong>ticipación Programa Capacitación Laboral]:<br />
El 70% <strong>de</strong> los reclusos no p<strong>ar</strong>ticipa <strong>de</strong> ningún programa <strong>de</strong> capacitación <strong>la</strong>boral. Esto<br />
último, sumado al nivel <strong>de</strong> instrucción y <strong>la</strong> capacitación <strong>la</strong>boral al ingreso, <strong>en</strong>trega un<br />
panorama no muy al<strong>en</strong>tador p<strong>ar</strong>a <strong>la</strong>s personas que pert<strong>en</strong>ec<strong>en</strong> a <strong>la</strong> sociedad c<strong>ar</strong>ce<strong>la</strong>ria.<br />
Programa Capacitación Laboral<br />
Programa capacitación <strong>la</strong>boral<br />
No p<strong>ar</strong>ticipa<br />
Si p<strong>ar</strong>ticipa<br />
Presos<br />
37,344<br />
8,442<br />
70%<br />
No p<strong>ar</strong>ticipa<br />
Si p<strong>ar</strong>ticipa<br />
Sin Datos 7,243<br />
Sin Datos<br />
Total 53,029<br />
Tab<strong>la</strong> 4.30. Capacitación Laboral. Figura 4.11. P<strong>ar</strong>ticipación <strong>en</strong> Capacitación Laboral.<br />
[P<strong>ar</strong>ticipación Programa Educativo]:<br />
Nuevam<strong>en</strong>te, tal <strong>com</strong>o ocurre <strong>en</strong> los programas <strong>la</strong>borales, se observa una muy baja<br />
p<strong>ar</strong>ticipación <strong>en</strong> programas educativos.<br />
16%<br />
14%
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
P<strong>ar</strong>ticipacion <strong>en</strong> programa educativo Presos<br />
No p<strong>ar</strong>ticipa <strong>de</strong> ningún programa educativo 29,514<br />
Si - educación formal - EGB 9,615<br />
Si - educación no formal 4,702<br />
Si - educación formal - POLIMODAL 3,511<br />
Si - educación formal - UNIVERSITARIA 312<br />
Si - educación formal - TERCIARIA 136<br />
Sin Datos 5,239<br />
Total 53,029<br />
Tab<strong>la</strong> 4.31. Programa Educativo. Figura 4.12. P<strong>ar</strong>ticipación <strong>en</strong> Programa Educativo.<br />
[Reinci<strong>de</strong>ncia]:<br />
Reinci<strong>de</strong>ncia Presos<br />
Prim<strong>ar</strong>io 34,264<br />
Reinci<strong>de</strong>nte (<strong>ar</strong>t. 50 CP) 6,669<br />
Reiterante 2,747<br />
Reinci<strong>de</strong>ncia múltiple (<strong>ar</strong>t. 52 CP) 389<br />
Sin Datos 8,960<br />
Total 53,029<br />
64<br />
40,000<br />
35,000<br />
30,000<br />
25,000<br />
20,000<br />
15,000<br />
10,000<br />
5,000<br />
34,264<br />
9%<br />
1%<br />
7%<br />
18%<br />
Programa Educativo<br />
10%<br />
Tab<strong>la</strong> 4.32. Reinci<strong>de</strong>ncia. Figura 4.13. Reinci<strong>de</strong>ncia.<br />
4.2.2.4 Verificación <strong>de</strong> Calidad <strong>de</strong> los Datos<br />
0<br />
55%<br />
Reinci<strong>de</strong>ncia <strong>en</strong> hechos <strong>de</strong>lictivos<br />
6,669<br />
Prim<strong>ar</strong>io Reinci<strong>de</strong>nte (<strong>ar</strong>t.<br />
50 CP)<br />
2,747<br />
No p<strong>ar</strong>ticipa <strong>de</strong><br />
ningún programa<br />
educativo<br />
Si - educación<br />
formal - EGB<br />
Si - educación no<br />
formal<br />
Si - educación<br />
formal -<br />
POLIMODAL<br />
Si - educación<br />
formal -<br />
UNIVERSITARIA<br />
Sin Datos<br />
Patricio Gutiérrez Rüegg Solución<br />
389<br />
Reiterante Reinci<strong>de</strong>ncia<br />
múltiple (<strong>ar</strong>t. 52<br />
CP)<br />
8,960<br />
Sin Datos<br />
Durante <strong>la</strong> exploración <strong>de</strong> los datos pudieron observ<strong>ar</strong> problemas <strong>en</strong> <strong>la</strong> calidad <strong>de</strong> los<br />
mismos, y a su vez, se <strong>en</strong>contr<strong>ar</strong>on v<strong>ar</strong>ios campos que pres<strong>en</strong>taban datos nulos o<br />
aus<strong>en</strong>tes.<br />
En primer lug<strong>ar</strong>, tal <strong>com</strong>o pue<strong>de</strong> observ<strong>ar</strong>se <strong>en</strong> los gráficos <strong>de</strong>l punto anterior, <strong>la</strong><br />
totalidad <strong>de</strong> los mismos pres<strong>en</strong>tan registros que ti<strong>en</strong><strong>en</strong> valor nulo <strong>en</strong> alguno <strong>de</strong> sus<br />
campos. La cantidad <strong>de</strong> veces que ap<strong>ar</strong>ec<strong>en</strong> estos campos vacíos v<strong>ar</strong>ía <strong>en</strong>tre los atributos<br />
<strong>de</strong> acuerdo al mom<strong>en</strong>to <strong>en</strong> que el dato haya sido c<strong>en</strong>sado: al ingreso <strong>de</strong>l p<strong>en</strong>al o una vez<br />
ya ingresado al mismo. Si<strong>en</strong>do estos últimos, los que pres<strong>en</strong>tan mayores problemas <strong>de</strong><br />
calidad y aus<strong>en</strong>cia <strong>de</strong> información.
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Com<strong>en</strong>zando por el campo edad, exist<strong>en</strong> 456 registros que conti<strong>en</strong><strong>en</strong> al número cero<br />
<strong>com</strong>o <strong>la</strong> posible edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido, algo que es realm<strong>en</strong>te imposible. Lo mismo ocurre<br />
con otros 10 casos <strong>de</strong> personas que pres<strong>en</strong>tan eda<strong>de</strong>s <strong>en</strong>tre los 2 y 13 años.<br />
En lo que respecta al estado civil <strong>de</strong> <strong>la</strong>s personas, <strong>de</strong> los 509 registros que pres<strong>en</strong>tan un<br />
nulo <strong>com</strong>o atributo <strong>de</strong>l campo, hay 166 que ti<strong>en</strong><strong>en</strong> un valor <strong>de</strong> estado civil = 0, pero que<br />
el mismo no es coher<strong>en</strong>te con <strong>la</strong> codificación <strong>de</strong>l c<strong>en</strong>so, tal <strong>com</strong>o lo muestra <strong>la</strong> tab<strong>la</strong> 4.8.<br />
Inconsist<strong>en</strong>cias simi<strong>la</strong>res <strong>en</strong> los datos ocurr<strong>en</strong> con los re<strong>la</strong>cionados a <strong>la</strong> nacionalidad,<br />
última situación <strong>la</strong>boral, capacitación <strong>la</strong>boral, lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia, última provincia <strong>de</strong><br />
resi<strong>de</strong>ncia y <strong>en</strong> m<strong>en</strong>or medida el nivel <strong>de</strong> instrucción, <strong>de</strong>lito <strong>com</strong>etido, horas <strong>de</strong> trabajo<br />
remunerado, p<strong>ar</strong>ticipación <strong>de</strong> programas <strong>la</strong>borales y educativos y reinci<strong>de</strong>ncia.<br />
Tanto <strong>la</strong> calidad <strong>de</strong> los datos, <strong>com</strong>o el faltante <strong>de</strong> los mismos, son cuestiones muy<br />
importantes a t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta previo a realiz<strong>ar</strong> <strong>la</strong> minería <strong>en</strong> los datos. Esto se analiz<strong>ar</strong>á<br />
<strong>en</strong> <strong>la</strong> Fase III Prep<strong>ar</strong>ación <strong>de</strong> los Datos.<br />
4.2.3 Fase III: Prep<strong>ar</strong>ación <strong>de</strong> los datos<br />
En esta fase se trabaj<strong>ar</strong>á sobre <strong>la</strong> prep<strong>ar</strong>ación <strong>de</strong>l dataset <strong>de</strong>finitivo, <strong>la</strong> selección y<br />
limpieza <strong>de</strong> los datos. Una vez hechas estas activida<strong>de</strong>s se proce<strong>de</strong> a construir los datos<br />
a los cuales les fueran neces<strong>ar</strong>ios algún tipo <strong>de</strong> modificación. Es <strong>de</strong>cir, es <strong>en</strong> esta etapa<br />
<strong>en</strong> don<strong>de</strong> se prep<strong>ar</strong>a todo lo re<strong>la</strong>tivo a <strong>la</strong> base <strong>de</strong> datos, p<strong>ar</strong>a po<strong>de</strong>r luego ingres<strong>ar</strong><strong>la</strong>s <strong>en</strong><br />
<strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.<br />
4.2.3.1 Prep<strong>ar</strong>ación <strong>de</strong>l Dataset<br />
La versión final <strong>de</strong>l dataset, el cual consta <strong>de</strong> 40,928 registros sobre presos masculinos,<br />
a utiliz<strong>ar</strong> p<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> minería <strong>de</strong> datos se pres<strong>en</strong>ta <strong>en</strong> <strong>la</strong> tab<strong>la</strong> 4.33.<br />
Campo Descripción Tipo <strong>de</strong> Dato<br />
Edad Edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Numérico<br />
Estado Civil Estado Civil <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Texto<br />
Nivel_Instr_Summ Nivel <strong>de</strong> Instrucción agrupado Texto<br />
Ultima Situacion Laboral Ultima situación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Texto<br />
Capacitacion Laboral Capacitación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Texto<br />
Ultima Resi<strong>de</strong>ncia Ultimo lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia (Urbano/Rural) Texto<br />
Delito Cometido Tipo <strong>de</strong> <strong>de</strong>lito Agrupado - 1ra. m<strong>en</strong>ción Texto<br />
Tab<strong>la</strong> 4.33. Dataset <strong>de</strong>finitivo.<br />
A los fines <strong>de</strong> obt<strong>en</strong>er mayor c<strong>la</strong>ridad <strong>en</strong> los resultados obt<strong>en</strong>idos una vez corridos los<br />
mo<strong>de</strong>los, se proce<strong>de</strong> a agrup<strong>ar</strong> <strong>la</strong>s v<strong>ar</strong>iables <strong>de</strong> los atributos nivel <strong>de</strong> instrucción y <strong>de</strong>lito<br />
<strong>com</strong>etido. Vale <strong>de</strong>stac<strong>ar</strong> que estos dos atributos pose<strong>en</strong> una gran cantidad <strong>de</strong> v<strong>ar</strong>iables,<br />
Solución Patricio Gutiérrez Rüegg 65
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
lo cual hace más difícil el análisis si no se lleva a cabo una agrupación <strong>de</strong> <strong>la</strong>s mismas.<br />
Dicho agrupami<strong>en</strong>to se pue<strong>de</strong> observ<strong>ar</strong> <strong>en</strong> el ap<strong>ar</strong>tado 4.2.3.4 <strong>de</strong> Construcción <strong>de</strong> los<br />
Datos.<br />
A su vez, p<strong>ar</strong>a obt<strong>en</strong>er los 40,928 registros, se tuvieron que agreg<strong>ar</strong> distintos filtros a los<br />
fines <strong>de</strong> obt<strong>en</strong>er un dataset que fuera lo más limpio posible. Se profundiza el tema <strong>en</strong> el<br />
ap<strong>ar</strong>tado 4.2.3.3 Limpieza <strong>de</strong> los Datos.<br />
4.2.3.2 Selección <strong>de</strong> los Datos<br />
Los campos que se consi<strong>de</strong>r<strong>ar</strong>án p<strong>ar</strong>a el pres<strong>en</strong>te estudio se elig<strong>en</strong> t<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta<br />
los sigui<strong>en</strong>tes factores:<br />
66<br />
• V<strong>ar</strong>iables que pue<strong>de</strong> tom<strong>ar</strong> cada uno <strong>de</strong> los campos o atributos.<br />
• Calidad <strong>de</strong> los datos.<br />
• Importancia <strong>de</strong>l atributo p<strong>ar</strong>a el estudio <strong>en</strong> cuestión <strong>en</strong> cuanto a los objetivos <strong>de</strong>l<br />
proyecto, información que <strong>en</strong>trega y significancia <strong>de</strong>l mismo.<br />
Los campos que se consi<strong>de</strong>ran p<strong>ar</strong>a el pres<strong>en</strong>te estudio son los sigui<strong>en</strong>tes:<br />
Sexo<br />
Campo alfanumérico que indica el sexo <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido. P<strong>ar</strong>a el análisis se ti<strong>en</strong><strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta<br />
solo a <strong>la</strong>s personas <strong>de</strong> sexo masculino por repres<strong>en</strong>t<strong>ar</strong> al 95% <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción p<strong>en</strong>al.<br />
Edad<br />
Campo numérico que indica <strong>la</strong> edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido. Este atributo toma valores <strong>de</strong>s<strong>de</strong> los<br />
10 años hasta los 89 años.<br />
Estado Civil<br />
Describe el estado civil <strong>en</strong> el que se <strong>en</strong>contraba el preso al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong> <strong>de</strong>t<strong>en</strong>ción.<br />
Los posibles estados son: Soltero, Casado, Concubino, Sep<strong>ar</strong>ado <strong>de</strong> hecho o Divorciado,<br />
Viudo.<br />
Nivel <strong>de</strong> Instrucción<br />
Atributo que <strong>de</strong>scribe el nivel <strong>de</strong> educación <strong>de</strong>l preso y situación <strong>de</strong> avance (<strong>com</strong>pleto o<br />
in<strong>com</strong>pleto). Se proce<strong>de</strong> agrup<strong>ar</strong> dicho campo p<strong>ar</strong>a llev<strong>ar</strong>lo al viejo esquema <strong>de</strong>l sistema<br />
educativo: Prim<strong>ar</strong>io/ Secund<strong>ar</strong>io/Terci<strong>ar</strong>io/Universit<strong>ar</strong>io (ver 4.2.3.4. Construcción <strong>de</strong><br />
los Datos).<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Capacitación Laboral<br />
Tal <strong>com</strong>o indica <strong>la</strong> pa<strong>la</strong>bra, indica el nivel <strong>de</strong> capacitación que <strong>la</strong> persona posee<br />
<strong>la</strong>boralm<strong>en</strong>te hab<strong>la</strong>ndo. Este atributo pue<strong>de</strong> tom<strong>ar</strong> <strong>la</strong>s sigui<strong>en</strong>tes v<strong>ar</strong>iables: ti<strong>en</strong>e oficio,<br />
ti<strong>en</strong>e profesión, no ti<strong>en</strong>e oficio ni profesión.<br />
Última Resi<strong>de</strong>ncia<br />
Repres<strong>en</strong>ta el tipo <strong>de</strong> resi<strong>de</strong>ncia <strong>en</strong> el cual vivía el <strong>de</strong>t<strong>en</strong>ido. Toma dos valores posibles:<br />
Urbana o Rural.<br />
Delito Cometido<br />
Describe el tipo <strong>de</strong> <strong>de</strong>lito <strong>com</strong>etido <strong>en</strong> primera m<strong>en</strong>ción por el <strong>de</strong>t<strong>en</strong>ido. Se agrupa a<br />
este campo según el código p<strong>en</strong>al <strong>en</strong> los sigui<strong>en</strong>tes tipos <strong>de</strong> <strong>de</strong>litos: Delitos contra <strong>la</strong><br />
Propiedad, Delitos contra <strong>la</strong>s Personas, Delitos contra <strong>la</strong> integridad sexual y el Honor,<br />
Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes), Contrav<strong>en</strong>ciones, Delitos c/ el estado civil,<br />
Delitos c/el Estado y <strong>la</strong> Comunidad, Delitos contra <strong>la</strong> libertad, Delitos previstos <strong>en</strong> leyes<br />
especiales, Infracción ley Nº 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres, Infracción ley Nº<br />
24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia, Otros <strong>de</strong>litos contra <strong>la</strong> honestidad. Debido a que los primeros 4<br />
<strong>de</strong>litos tipificados por el código p<strong>en</strong>al agrupan aproximadam<strong>en</strong>te al 90% <strong>de</strong> <strong>la</strong>s<br />
instancias, se proce<strong>de</strong> a acot<strong>ar</strong> el estudio a estos 4 <strong>de</strong>lito principales.<br />
A continuación se <strong>de</strong>tal<strong>la</strong>n los atributos no t<strong>en</strong>idos <strong>en</strong> cu<strong>en</strong>ta p<strong>ar</strong>a el análisis:<br />
Última provincia <strong>de</strong> resi<strong>de</strong>ncia<br />
Se omite <strong>la</strong> utilización <strong>de</strong> este atributo ya que se busca <strong>en</strong>contr<strong>ar</strong> un <strong>com</strong>portami<strong>en</strong>to<br />
g<strong>en</strong>eral, sin hacer foco <strong>en</strong> cuestiones p<strong>ar</strong>ticu<strong>la</strong>res por provincia. Más <strong>de</strong>l 50% <strong>de</strong> los<br />
casos correspon<strong>de</strong> a <strong>la</strong> Provincia <strong>de</strong> Bu<strong>en</strong>os Aires.<br />
Situación Legal<br />
Indica <strong>la</strong> situación legal <strong>en</strong> <strong>la</strong> cual se <strong>en</strong>cu<strong>en</strong>tra el <strong>de</strong>t<strong>en</strong>ido. Hay 4 situaciones posibles:<br />
Con<strong>de</strong>nado, Procesado, Inimputable u Otra Situación. En un principio se p<strong>en</strong>só <strong>en</strong> no<br />
omitir este campo, sin emb<strong>ar</strong>go se cree que es un dato irrelevante p<strong>ar</strong>a c<strong>ar</strong>acteriz<strong>ar</strong>, <strong>en</strong><br />
una primera aproximación con minería <strong>de</strong> datos, <strong>la</strong> conducta que habría llevado a que<br />
<strong>la</strong>s personas pert<strong>en</strong>eci<strong>en</strong>tes a esta pob<strong>la</strong>ción <strong>com</strong>etieran un <strong>de</strong>lito.<br />
Trabajo Remunerado<br />
Informa acerca <strong>de</strong> <strong>la</strong> cantidad <strong>de</strong> horas que cada <strong>de</strong>t<strong>en</strong>ido pasa trabajando <strong>de</strong> manera<br />
remunerada. Los valores que toma son: no ti<strong>en</strong>e trabajo remunerado, hasta 40 hs.<br />
semanales, hasta 30 hs. semanales, hasta 20 hs. semanales, hasta 10 hs. semanales y sin<br />
datos. Dado que se trata <strong>de</strong> un atributo asociado al <strong>com</strong>portami<strong>en</strong>to ya <strong>de</strong>ntro <strong>de</strong> <strong>la</strong><br />
cárcel y que el mismo pres<strong>en</strong>ta un 11% <strong>de</strong> nulos, se <strong>de</strong>ci<strong>de</strong> omitir dicho campo.<br />
Solución Patricio Gutiérrez Rüegg 67
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
P<strong>ar</strong>ticipación <strong>en</strong> programa <strong>de</strong> formación o capacitación <strong>la</strong>boral / P<strong>ar</strong>ticipación <strong>en</strong><br />
algún programa educativo / P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> activida<strong>de</strong>s<br />
recreativas o <strong>de</strong>portivas<br />
Hac<strong>en</strong> hincapié <strong>en</strong> <strong>la</strong> p<strong>ar</strong>ticipación <strong>de</strong> los internos <strong>en</strong> los distintos programas <strong>de</strong>l sistema<br />
p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Al igual que el atributo anterior, al ser información asociada a conductas<br />
<strong>de</strong>ntro <strong>de</strong>l establecimi<strong>en</strong>to, se <strong>de</strong>ci<strong>de</strong> no utiliz<strong>ar</strong> estos campos.<br />
4.2.3.3 Limpieza <strong>de</strong> los Datos<br />
Exist<strong>en</strong> registros que son excluidos <strong>de</strong>l análisis por <strong>en</strong>contr<strong>ar</strong>se alguna inconsist<strong>en</strong>cia,<br />
tal <strong>com</strong>o se especificó <strong>en</strong> el punto 4.2.2.4 <strong>de</strong> Verificación <strong>de</strong> Calidad <strong>de</strong> los Datos.<br />
En lo que respecta al campo Edad, se procedió a elimin<strong>ar</strong> los registros que t<strong>en</strong>ían <strong>com</strong>o<br />
valor 0, 2 o 13 años. En segundo lug<strong>ar</strong>, mediante una consulta <strong>en</strong> MS Access, se g<strong>en</strong>eró<br />
<strong>la</strong> condición <strong>de</strong> que <strong>la</strong> base <strong>de</strong> datos no pres<strong>en</strong>t<strong>ar</strong>a ningún valor nulo p<strong>ar</strong>a los atributos<br />
seleccionados <strong>en</strong> el dataset. A través <strong>de</strong> estas modificaciones, se obtuvo una base limpia<br />
<strong>de</strong> inconsist<strong>en</strong>cias y errores <strong>de</strong> 40,928 registros.<br />
4.2.3.4 Construcción e integración <strong>de</strong> los Datos<br />
En <strong>la</strong> pres<strong>en</strong>te etapa se proce<strong>de</strong> a <strong>la</strong> construcción <strong>de</strong> los datos que conforman el dataset<br />
<strong>de</strong>finitivo p<strong>ar</strong>a su posterior ingreso <strong>en</strong> <strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.<br />
Tal <strong>com</strong>o se <strong>com</strong><strong>en</strong>ta anteriorm<strong>en</strong>te, se realiza un agrupami<strong>en</strong>to <strong>de</strong> los distintos Delitos<br />
Cometidos t<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta <strong>la</strong> tipificación <strong>de</strong>l código p<strong>en</strong>al. Como pue<strong>de</strong> observ<strong>ar</strong>se<br />
<strong>en</strong> <strong>la</strong> tab<strong>la</strong> 4.34, los 28 <strong>de</strong>litos <strong>com</strong>etidos que figuran <strong>en</strong> <strong>la</strong> base <strong>de</strong> datos terminan<br />
agrupándose solo <strong>en</strong> 12. Se cree neces<strong>ar</strong>ia esta t<strong>ar</strong>ea a los fines <strong>de</strong> facilit<strong>ar</strong> <strong>la</strong><br />
<strong>com</strong>pr<strong>en</strong>sión <strong>de</strong> los resultados una vez realizadas <strong>la</strong>s corridas experim<strong>en</strong>tales.<br />
Otro <strong>de</strong> los campos <strong>en</strong> don<strong>de</strong> es neces<strong>ar</strong>ia su reconstrucción es el campo <strong>de</strong>l Nivel <strong>de</strong><br />
Instrucción. A p<strong>ar</strong>tir <strong>de</strong>l año 1996, <strong>la</strong> Escue<strong>la</strong> Prim<strong>ar</strong>ia y <strong>la</strong> Escue<strong>la</strong> Secund<strong>ar</strong>ia<br />
cambi<strong>ar</strong>on a un nuevo sistema educativo:<br />
68<br />
• La Educación G<strong>en</strong>eral Básica (EGB) <strong>de</strong> 9 años<br />
• La Educación Polimodal <strong>de</strong> 3 años.<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Delito Cometido Delito Cometido Unificado<br />
Contrav<strong>en</strong>ciones Contrav<strong>en</strong>ciones<br />
Delitos c/ el estado civil Delitos c/ el estado civil<br />
Del. contra <strong>la</strong> lib. <strong>com</strong>et. por func. público<br />
Delitos c/ <strong>la</strong> administracion pública<br />
Delitos c/ <strong>la</strong> fe pública<br />
Delitos c/el or<strong>de</strong>n público<br />
Delitos c/el Estado y <strong>la</strong> Comunidad<br />
Delitos contra <strong>la</strong> seguridad <strong>de</strong> <strong>la</strong> nación<br />
Delitos contra <strong>la</strong> seguridad pública<br />
Delitos contra los po<strong>de</strong>res publicos<br />
Delitos contra el honor<br />
Delitos contra <strong>la</strong> integridad sexual y el Honor<br />
Vio<strong>la</strong>ciones<br />
Am<strong>en</strong>azas<br />
Otros <strong>de</strong>litos contra <strong>la</strong> libertad<br />
Delitos contra <strong>la</strong> libertad<br />
Privación ilegítima <strong>de</strong> <strong>la</strong> libertad<br />
Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto<br />
Otros <strong>de</strong>litos contra <strong>la</strong> propiedad<br />
Delitos contra <strong>la</strong> propiedad<br />
Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo<br />
Homicidios Culposos<br />
Homicidios dolosos<br />
Homicidios dolosos (t<strong>en</strong>t.)<br />
Delitos contra <strong>la</strong>s personas<br />
Lesiones Culposas<br />
Lesiones Dolosas<br />
Otros <strong>de</strong>litos contra <strong>la</strong>s personas<br />
Delitos previstos <strong>en</strong> leyes especiales Delitos previstos <strong>en</strong> leyes especiales<br />
Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres<br />
Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes) Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes)<br />
Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia<br />
Otros <strong>de</strong>litos contra <strong>la</strong> honestidad Otros <strong>de</strong>litos contra <strong>la</strong> honestidad<br />
Sin Datos Sin Datos<br />
Tab<strong>la</strong> 4.34. Unificación <strong>de</strong> <strong>de</strong>litos según el Código P<strong>en</strong>al.<br />
A los fines <strong>de</strong>l estudio <strong>en</strong> cuestión se unific<strong>ar</strong>on los campos según el viejo sistema:<br />
NivelInstruc Nivel Instrucción Unificado<br />
Ninguno Ninguno<br />
Prim<strong>ar</strong>io Completo Prim<strong>ar</strong>io Completo<br />
Prim<strong>ar</strong>io In<strong>com</strong>pleto Prim<strong>ar</strong>io In<strong>com</strong>pleto<br />
Secund<strong>ar</strong>io Completo Secund<strong>ar</strong>io Completo<br />
Secund<strong>ar</strong>io In<strong>com</strong>pleto<br />
EGB 1 Completo<br />
EGB 1 In<strong>com</strong>pleto<br />
EGB 2 Completo<br />
EGB 2 In<strong>com</strong>pleto Secund<strong>ar</strong>io In<strong>com</strong>pleto<br />
EGB 3 Completo<br />
EGB 3 In<strong>com</strong>pleto<br />
Polimodal In<strong>com</strong>pleto<br />
Polimodal Completo<br />
Terci<strong>ar</strong>io <strong>com</strong>pleto Terci<strong>ar</strong>io <strong>com</strong>pleto<br />
Terci<strong>ar</strong>io In<strong>com</strong>pleto Terci<strong>ar</strong>io In<strong>com</strong>pleto<br />
Universit<strong>ar</strong>io In<strong>com</strong>pleto Universit<strong>ar</strong>io In<strong>com</strong>pleto<br />
Universit<strong>ar</strong>io Completo Universit<strong>ar</strong>io Completo<br />
Sin Datos Sin Datos<br />
Tab<strong>la</strong> 4.35. Unificación <strong>de</strong>l campo Nivel <strong>de</strong> Instrucción.<br />
Solución Patricio Gutiérrez Rüegg 69
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Una vez terminada <strong>la</strong> Fase III, <strong>en</strong> don<strong>de</strong> se prep<strong>ar</strong>ó el dataset <strong>de</strong>finitivo, se<br />
seleccion<strong>ar</strong>on, limpi<strong>ar</strong>on y se modific<strong>ar</strong>on los datos, se continúa con <strong>la</strong> Fase IV <strong>de</strong><br />
Mo<strong>de</strong><strong>la</strong>do.<br />
4.2.4 Fase IV: Mo<strong>de</strong><strong>la</strong>do<br />
Es <strong>en</strong> esta fase <strong>en</strong> don<strong>de</strong> se seleccionan y aplican <strong>la</strong>s técnicas <strong>de</strong> mo<strong>de</strong><strong>la</strong>do. Al mismo<br />
tiempo se <strong>de</strong>terminan los valores <strong>de</strong> los p<strong>ar</strong>ámetros y v<strong>ar</strong>iables <strong>de</strong> calibración.<br />
Previo a seleccion<strong>ar</strong> <strong>la</strong>s técnicas y algoritmos p<strong>ar</strong>a <strong>la</strong> explotación <strong>de</strong> <strong>la</strong> información, es<br />
neces<strong>ar</strong>io seleccion<strong>ar</strong> el softw<strong>ar</strong>e a utiliz<strong>ar</strong>. La herrami<strong>en</strong>ta informática que se utiliza<br />
p<strong>ar</strong>a llev<strong>ar</strong> a cabo <strong>la</strong> pres<strong>en</strong>te fase es el RapidMiner o más conocido <strong>com</strong>o Rapid-i. El<br />
programa seleccionado cu<strong>en</strong>ta con <strong>la</strong>s sigui<strong>en</strong>tes v<strong>en</strong>tajas:<br />
70<br />
• Distribución 100% libre.<br />
• Funciona sobre cualquier p<strong>la</strong>taforma y sistema operativo.<br />
• Los procesos <strong>de</strong> explotación <strong>de</strong> información son mo<strong>de</strong><strong>la</strong>dos <strong>en</strong> forma <strong>de</strong> árboles<br />
operadores, lo cual resulta fácil e intuitivo.<br />
• Los árboles operadores o sub-árboles pue<strong>de</strong>n ser gu<strong>ar</strong>dados <strong>en</strong> formas <strong>de</strong><br />
bloques p<strong>ar</strong>a su posterior utilización.<br />
• Posee más <strong>de</strong> 400 mo<strong>de</strong>los <strong>de</strong> apr<strong>en</strong>dizaje, evaluación, pre-procesami<strong>en</strong>to y<br />
post-procesami<strong>en</strong>to y operadores p<strong>ar</strong>a visualización.<br />
• Integra <strong>la</strong> librería <strong>de</strong>l programa WEKA.<br />
• La c<strong>ar</strong>acterística más importante es <strong>la</strong> capacidad <strong>de</strong> jer<strong>ar</strong>quiz<strong>ar</strong> ca<strong>de</strong>nas <strong>de</strong>l<br />
operador y <strong>de</strong> construir <strong>com</strong>plejos árboles <strong>de</strong> operadores.<br />
Sin emb<strong>ar</strong>go, <strong>com</strong>o todo softw<strong>ar</strong>e, pres<strong>en</strong>ta puntos flojos:<br />
• La interfaz grafica no es <strong>de</strong>l todo “amigable”.<br />
• Salidas gráficas limitadas. Solo realiza <strong>la</strong> gráfica <strong>de</strong> una serie <strong>de</strong> datos elegida al<br />
az<strong>ar</strong>, <strong>la</strong> cual está limitada a <strong>la</strong>s 1000 muestras.<br />
• No posee un “tutorial” fácil <strong>de</strong> naveg<strong>ar</strong> que permita apr<strong>en</strong><strong>de</strong>r el programa <strong>de</strong><br />
manera <strong>com</strong>pleta y rápida.<br />
• Salidas poco c<strong>la</strong>ras p<strong>ar</strong>a qui<strong>en</strong>es no acostumbran a aplic<strong>ar</strong> minería <strong>de</strong> datos.<br />
En el anexo 14 se explican los conceptos básicos <strong>de</strong>l programa y se incluy<strong>en</strong> ejemplos<br />
p<strong>ar</strong>a <strong>en</strong>t<strong>en</strong><strong>de</strong>r <strong>la</strong>s c<strong>ar</strong>acterísticas operativas <strong>de</strong> <strong>la</strong> herrami<strong>en</strong>ta.<br />
Patricio Gutiérrez Rüegg Solución
4.2.4.1 Selección <strong>de</strong> <strong>la</strong> técnica <strong>de</strong> mo<strong>de</strong><strong>la</strong>do<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
En esta etapa, se seleccion<strong>ar</strong>á algunas <strong>de</strong> <strong>la</strong>s técnicas y algoritmos <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>dos a lo<br />
<strong>la</strong>rgo <strong>de</strong>l capitulo 2.1.1, pert<strong>en</strong>eci<strong>en</strong>te al Estado <strong>de</strong> <strong>la</strong> Cuestión.<br />
Al est<strong>ar</strong> trabajando con una base <strong>de</strong> más <strong>de</strong> 40,000 registros, se hace neces<strong>ar</strong>io realiz<strong>ar</strong><br />
un agrupami<strong>en</strong>to o clustering <strong>de</strong> los datos p<strong>ar</strong>a que el <strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> <strong>la</strong> información<br />
oculta <strong>en</strong> ellos se torne lo m<strong>en</strong>os difícil posible. El algoritmo que se utiliz<strong>ar</strong>á es el K-<br />
Means, uno <strong>de</strong> los métodos más utilizados y el más popu<strong>la</strong>r <strong>de</strong> los métodos <strong>de</strong><br />
agrupami<strong>en</strong>to “por p<strong>ar</strong>tición”.<br />
El próximo paso es el <strong>de</strong> validación <strong>de</strong> los grupos o clusters con los especialistas <strong>en</strong><br />
temática criminal. Esta validación repres<strong>en</strong>ta una real importancia p<strong>ar</strong>a po<strong>de</strong>r seguir<br />
a<strong>de</strong><strong>la</strong>nte con <strong>la</strong> técnica <strong>de</strong> c<strong>la</strong>sificación.<br />
Previo a <strong>la</strong> c<strong>la</strong>sificación, es neces<strong>ar</strong>io preseleccion<strong>ar</strong> los atributos que serán utilizados<br />
posteriorm<strong>en</strong>te. P<strong>ar</strong>a <strong>la</strong> selección <strong>de</strong> atributos, tal <strong>com</strong>o se m<strong>en</strong>ciona <strong>en</strong> el “Estado <strong>de</strong> <strong>la</strong><br />
Cuestión”, exist<strong>en</strong> métodos basados <strong>en</strong> filtros y aquellos l<strong>la</strong>mados <strong>en</strong>volv<strong>en</strong>tes<br />
(wrappers). En el pres<strong>en</strong>te estudio, se utilizan ambos métodos <strong>de</strong> selección <strong>de</strong> atributos<br />
p<strong>ar</strong>a valid<strong>ar</strong> <strong>la</strong> significancia <strong>de</strong> los mismos<br />
Finalm<strong>en</strong>te, se aplican algoritmos <strong>de</strong> inducción (c<strong>la</strong>sificación) a cada cluster p<strong>ar</strong>a <strong>la</strong><br />
i<strong>de</strong>ntificación <strong>de</strong> reg<strong>la</strong>s <strong>de</strong> <strong>de</strong>cisión que ayu<strong>de</strong>n a explic<strong>ar</strong> <strong>la</strong> <strong>com</strong>posición <strong>de</strong> cada grupo<br />
formado. P<strong>ar</strong>a <strong>la</strong> c<strong>la</strong>sificación se utilizan los algoritmos C4.5 y CHAID.<br />
4.2.4.2 Construcción <strong>de</strong>l mo<strong>de</strong>lo y resultados experim<strong>en</strong>tales<br />
Se proce<strong>de</strong> a explic<strong>ar</strong> cada uno <strong>de</strong> los mo<strong>de</strong>los utilizados y sus resultados. A su vez, <strong>en</strong><br />
don<strong>de</strong> corresponda, se explican los p<strong>ar</strong>ámetros utilizados y configuraciones realizadas<br />
<strong>en</strong> el Rapid-i p<strong>ar</strong>a el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> <strong>la</strong> construcción <strong>de</strong>l mo<strong>de</strong>lo.<br />
4.2.4.2.1 Clustering<br />
A los fines <strong>de</strong> concret<strong>ar</strong> el agrupami<strong>en</strong>to <strong>de</strong> los datos, se utiliza el algoritmo K-Means<br />
p<strong>ar</strong>a obt<strong>en</strong>er 4 grupos <strong>de</strong> presos a través <strong>de</strong> sus c<strong>ar</strong>acterísticas más significativas.<br />
La configuración <strong>de</strong> dicho algoritmo <strong>de</strong> agrupami<strong>en</strong>to exige que se elija un número,<br />
<strong>de</strong>nominado semil<strong>la</strong> (seed), p<strong>ar</strong>a realiz<strong>ar</strong> una distribución aleatoria inicial a p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong><br />
cual el algoritmo <strong>com</strong>i<strong>en</strong>za <strong>la</strong>s sucesivas iteraciones. El número elegido p<strong>ar</strong>a llev<strong>ar</strong> a<br />
cabo el proceso es el que vi<strong>en</strong>e por <strong>de</strong>fecto <strong>en</strong> el programa (seed = 10). Al ser el<br />
K-Means un algoritmo que se basa <strong>en</strong> minimiz<strong>ar</strong> <strong>la</strong> suma <strong>de</strong>l error cuadrático, podría<br />
tom<strong>ar</strong>se a ese error <strong>com</strong>o punto <strong>de</strong> p<strong>ar</strong>tida p<strong>ar</strong>a <strong>la</strong> elección <strong>de</strong>l número óptimo <strong>de</strong> <strong>la</strong><br />
Solución Patricio Gutiérrez Rüegg 71
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
semil<strong>la</strong>. Cabe <strong>de</strong>stac<strong>ar</strong>, que el Rapid-i no cu<strong>en</strong>ta con alguna salida <strong>en</strong> <strong>la</strong> cual informe <strong>la</strong><br />
suma <strong>de</strong>l error cuadrático. Sin emb<strong>ar</strong>go, a modo <strong>de</strong> prueba, se utilizó otro programa <strong>de</strong><br />
minería <strong>de</strong> datos p<strong>ar</strong>a realiz<strong>ar</strong> corridas con difer<strong>en</strong>tes números <strong>de</strong> semil<strong>la</strong>, dando <strong>com</strong>o<br />
resultado al valor <strong>de</strong> semil<strong>la</strong>=10 <strong>com</strong>o <strong>la</strong> que minimizaba el error cuadrático.<br />
Una vez hecha <strong>la</strong> configuración y establecidos los p<strong>ar</strong>ámetros, se introduce el dataset<br />
<strong>de</strong>finido <strong>en</strong> el punto 4.2.3.1 al mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos p<strong>ar</strong>a realiz<strong>ar</strong> el clustering<br />
correspondi<strong>en</strong>te. A continuación se muestran los resultados obt<strong>en</strong>idos.<br />
4.2.4.2.2 Resultados <strong>de</strong>l Clustering<br />
El resultado obt<strong>en</strong>ido <strong>en</strong> Rapid-i una vez ejecutado K-Means con 4 clusters, se resume a<br />
continuación.<br />
72<br />
Tab<strong>la</strong> 4.35. Resultados <strong>de</strong>l proceso <strong>de</strong> Clustering.<br />
En primer lug<strong>ar</strong>, y antes <strong>de</strong> analiz<strong>ar</strong> cada cluster por sep<strong>ar</strong>ado, ocurre <strong>en</strong> g<strong>en</strong>eral que<br />
todos los clusters que se forman muestran un nivel <strong>de</strong> instrucción muy bajo: Prim<strong>ar</strong>io<br />
<strong>com</strong>pleto es el más frecu<strong>en</strong>te. Hay que t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta que los principales niveles <strong>de</strong><br />
instrucción <strong>en</strong> <strong>la</strong> base son los sigui<strong>en</strong>tes (muy bajos por cierto):<br />
Tab<strong>la</strong> 4.36. Distribución <strong>de</strong>l Nivel <strong>de</strong> Instrucción.<br />
Por lo tanto, es <strong>de</strong> esper<strong>ar</strong> que <strong>en</strong> todas <strong>la</strong>s corridas <strong>de</strong> clustering, cada uno <strong>de</strong> los<br />
grupos formados t<strong>en</strong>ga un nivel <strong>de</strong> instrucción muy bajo. Muy pocas veces ap<strong>ar</strong>ece<br />
<strong>com</strong>o repres<strong>en</strong>tativo <strong>de</strong> un cluster el nivel secund<strong>ar</strong>io in<strong>com</strong>pleto. Aún así <strong>en</strong>tre<br />
prim<strong>ar</strong>io <strong>com</strong>pleto y secund<strong>ar</strong>io in<strong>com</strong>pleto hay un mínimo paso.<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
4.2.4.2.2.1 Gráficos <strong>de</strong> B<strong>ar</strong>ras p<strong>ar</strong>a el análisis <strong>de</strong> clusters<br />
A través <strong>de</strong> los gráficos <strong>de</strong> b<strong>ar</strong>ras [Figura 4.14] se ayuda a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r <strong>com</strong>o se<br />
distribuy<strong>en</strong> <strong>la</strong>s v<strong>ar</strong>iables <strong>de</strong> los atributos <strong>en</strong>tre los distintos clusters y medir el nivel <strong>de</strong><br />
significancia <strong>de</strong> los mismos. Se espera que si todos los atributos fueran irrelevantes, se<br />
cumpliera <strong>la</strong> distribución <strong>en</strong> cada cluster <strong>de</strong> los atributos según <strong>la</strong> proporción 41%, 16%,<br />
36% y 7%.<br />
Si bi<strong>en</strong> <strong>en</strong> los atributos Nivel <strong>de</strong> Instrucción y Última Resi<strong>de</strong>ncia <strong>la</strong> distribución <strong>en</strong> los<br />
clusters es irrelevante, ya que se cumple <strong>la</strong> proporción 41% rojo (cluster 0) 16% gris<br />
(cluster 1) 36% turquesa (cluster 2) 7% azul (cluster 3), <strong>en</strong> los otros atributos se pue<strong>de</strong>n<br />
<strong>en</strong>contr<strong>ar</strong> interacciones significativas<br />
Figura 4.14. Gráfico <strong>de</strong> B<strong>ar</strong>ras. Distribución <strong>de</strong> <strong>la</strong>s v<strong>ar</strong>iables <strong>de</strong> los atributos <strong>en</strong> los clusters.<br />
Los atributos <strong>en</strong> don<strong>de</strong> se aprecia bu<strong>en</strong>a interacción <strong>en</strong>tre los clusters y <strong>la</strong>s v<strong>ar</strong>iables son<br />
los <strong>de</strong> <strong>de</strong>lito <strong>com</strong>etido, capacitación <strong>la</strong>boral y última situación <strong>la</strong>boral. Se profundiz<strong>ar</strong>á<br />
<strong>en</strong> estos atributos a continuación mediante <strong>la</strong> utilización <strong>de</strong> gráficos <strong>de</strong> dispersión.<br />
Solución Patricio Gutiérrez Rüegg 73
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
4.2.4.2.2.2 Gráficos <strong>de</strong> Dispersión p<strong>ar</strong>a el análisis <strong>de</strong> clusters<br />
En <strong>la</strong> figura 4.15 se observa que mi<strong>en</strong>tras que los <strong>de</strong>litos contra <strong>la</strong> propiedad están<br />
fuertem<strong>en</strong>te conc<strong>en</strong>trados <strong>en</strong> los clusters 0 (72%) y 2 (95%), el cluster 1 pres<strong>en</strong>ta una<br />
gran conc<strong>en</strong>tración <strong>de</strong> individuos que <strong>com</strong>etieron <strong>de</strong>lito contra <strong>la</strong>s personas (95%).<br />
Entre p<strong>ar</strong>éntesis figura <strong>la</strong> frecu<strong>en</strong>cia <strong>de</strong> ocurr<strong>en</strong>cia porc<strong>en</strong>tual <strong>de</strong> cada v<strong>ar</strong>iable <strong>de</strong> los<br />
atributos <strong>de</strong>ntro <strong>de</strong> cada cluster. Con respecto al cluster 3, los <strong>de</strong>litos se <strong>en</strong>cu<strong>en</strong>tran<br />
distribuidos más homogéneam<strong>en</strong>te, si<strong>en</strong>do los <strong>de</strong>litos contra <strong>la</strong> integridad sexual (23%),<br />
estupefaci<strong>en</strong>tes (35%) y personas (26%) los que predominan <strong>en</strong> el mismo. Por lo tanto,<br />
ya se pue<strong>de</strong> t<strong>en</strong>er una primera aproximación a los <strong>de</strong>litos que c<strong>ar</strong>acteriz<strong>ar</strong>ían a cada<br />
grupo.<br />
74<br />
Figura 4.15. Distribución <strong>de</strong> los clusters según Delito Cometido<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
En lo que respecta al atributo última situación <strong>la</strong>boral [Figura 4.16], se observa que los<br />
cluster 1 y cluster 2 están repres<strong>en</strong>tados <strong>en</strong> su mayoría por <strong>la</strong> situación <strong>de</strong> <strong>de</strong>socupado,<br />
con un 65% y 79% respectivam<strong>en</strong>te. Si bi<strong>en</strong> estos dos grupos <strong>la</strong> situación <strong>de</strong><br />
<strong>de</strong>socupado pres<strong>en</strong>ta una gran conc<strong>en</strong>tración, exist<strong>en</strong> instancias que pres<strong>en</strong>tan <strong>en</strong> una<br />
misma proporción <strong>la</strong> situación <strong>de</strong> trabajadores <strong>de</strong> tiempo p<strong>ar</strong>cial y <strong>com</strong>pleto.<br />
En cuanto a los clusters 0 y 3, están mayorm<strong>en</strong>te c<strong>ar</strong>acterizados por trabajadores <strong>de</strong><br />
tiempo p<strong>ar</strong>cial (72% y 65% respectivam<strong>en</strong>te) y <strong>en</strong> m<strong>en</strong>or proporción, <strong>de</strong> tiempo<br />
<strong>com</strong>pleto (23% y 27%).<br />
Figura 4.16. Distribución <strong>de</strong> los clusters según Última Situación Laboral<br />
Solución Patricio Gutiérrez Rüegg 75
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Con respecto a <strong>la</strong> capacitación <strong>la</strong>boral, el cluster 1 y el cluster 2 pres<strong>en</strong>tan una<br />
distribución simi<strong>la</strong>r [Figura 4.17], con una alta conc<strong>en</strong>tración <strong>en</strong> sin oficio ni profesión<br />
(77% y 89%), seguido por oficio y luego profesión. En contraposición, el cluster 0 está<br />
mayorm<strong>en</strong>te po<strong>la</strong>rizado hacia oficio (85%), con una baja pob<strong>la</strong>ción <strong>de</strong> individuos sin<br />
oficio ni profesión (9%) y profesión (6%). Finalm<strong>en</strong>te, <strong>com</strong>o se observa <strong>en</strong> <strong>la</strong> figura<br />
inferior, el cluster 3 se <strong>en</strong>cu<strong>en</strong>tra homogéneam<strong>en</strong>te distribuido p<strong>ar</strong>a este atributo.<br />
76<br />
Figura 4.17. Distribución <strong>de</strong> los clusters según Capacitación Laboral<br />
A continuación se analizan, también con gráficos <strong>de</strong> dispersión, <strong>la</strong>s interacciones <strong>en</strong>tre 2<br />
tipos <strong>de</strong> atributos y los clusters. Con este análisis se busca ir t<strong>en</strong>i<strong>en</strong>do una mejor<br />
interpretación <strong>de</strong> los grupos formados p<strong>ar</strong>a po<strong>de</strong>r luego d<strong>ar</strong> una c<strong>ar</strong>acterización más<br />
<strong>com</strong>pleta <strong>de</strong> los mismos.<br />
Sigui<strong>en</strong>do con <strong>la</strong> serie <strong>de</strong> colores <strong>de</strong> los gráficos anteriores (cluster 0= azul, cluster 1=<br />
rojo, cluster 2= ver<strong>de</strong>, cluster 3= turquesa), se observa una fuerte interacción <strong>en</strong>tre <strong>de</strong>lito<br />
contra <strong>la</strong> propiedad, sin oficio ni profesión y cluster 2 (ver<strong>de</strong>) [Figura 4.18]. Lo mismo<br />
ocurre con el cluster 0 (azul), <strong>de</strong>lito contra <strong>la</strong> propiedad, aunque <strong>en</strong> este caso ap<strong>ar</strong>ece<br />
oficio p<strong>ar</strong>a el atributo capacitación <strong>la</strong>boral. Por lo tanto, ya podríamos difer<strong>en</strong>ci<strong>ar</strong> a<br />
estos dos clusters según el nivel <strong>de</strong> capacitación <strong>la</strong>boral. Mi<strong>en</strong>tras que <strong>en</strong> ambos, los<br />
presos <strong>de</strong>linquieron contra <strong>la</strong> propiedad, <strong>en</strong> el cluster 2 no poseían un oficio ni una<br />
profesión al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong> <strong>de</strong>t<strong>en</strong>ción, mi<strong>en</strong>tras que <strong>en</strong> cluster 0 t<strong>en</strong>ían algún oficio.<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Otra interre<strong>la</strong>ción importante es <strong>la</strong> que se da <strong>en</strong>tre <strong>de</strong>lito contra <strong>la</strong>s personas, no ti<strong>en</strong>e<br />
oficio ni profesión y cluster 1 (rojo). Confirma esto último, que el cluster 1 est<strong>ar</strong>ía<br />
c<strong>ar</strong>acterizado por <strong>de</strong>lincu<strong>en</strong>tes que <strong>de</strong>linquieron contra <strong>la</strong>s personas. Existe, <strong>de</strong> todas<br />
formas, una pequeña interacción <strong>en</strong>tre cluster 0 (azul), <strong>de</strong>lito contra <strong>la</strong>s personas y<br />
oficio.<br />
Con respecto al cluster 3 (turquesa), se observa que <strong>la</strong> interacción <strong>de</strong> <strong>de</strong>lito <strong>de</strong><br />
estupefaci<strong>en</strong>tes y vio<strong>la</strong>ción sexual distribuido homogéneam<strong>en</strong>te <strong>en</strong> oficio y sin oficio ni<br />
profesión, y <strong>en</strong> una pequeña proporción <strong>en</strong> los que ti<strong>en</strong><strong>en</strong> alguna profesión.<br />
Figura 4.18. Interre<strong>la</strong>ción Delito Cometido- Capacitación Laboral-Clusters<br />
En <strong>la</strong> figura 4.19 se <strong>de</strong>staca <strong>la</strong> importante re<strong>la</strong>ción que hay <strong>en</strong>tre <strong>de</strong>lito contra <strong>la</strong><br />
propiedad, <strong>de</strong>socupado, y cluster 2 (ver<strong>de</strong>). El cluster 0 (azul) está interre<strong>la</strong>cionado <strong>en</strong><br />
mayor medida con trabajo <strong>de</strong> tiempo <strong>com</strong>pleto y <strong>de</strong> tiempo p<strong>ar</strong>cial.<br />
Se pue<strong>de</strong> observ<strong>ar</strong> interacción <strong>en</strong>tre <strong>de</strong>litos contra <strong>la</strong>s personas, <strong>de</strong>socupado y cluster 2<br />
(rojo). Aún así, también se observan algunas interre<strong>la</strong>ciones <strong>en</strong>tre este último cluster,<br />
personas, y trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial y <strong>de</strong> tiempo <strong>com</strong>pleto.<br />
Con respecto al cluster 3 (turquesa), se observa interacción <strong>de</strong> <strong>de</strong>lito <strong>de</strong> estupefaci<strong>en</strong>tes<br />
y vio<strong>la</strong>ción sexual distribuido mayorm<strong>en</strong>te <strong>en</strong> trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial y <strong>en</strong> m<strong>en</strong>or<br />
proporción trabajo <strong>de</strong> tiempo <strong>com</strong>pleto.<br />
Solución Patricio Gutiérrez Rüegg 77
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
78<br />
Figura 4.19. Interre<strong>la</strong>ción Delito Cometido- Última Situación Laboral-Clusters<br />
Es importante mostr<strong>ar</strong> mediante <strong>la</strong> gráfica <strong>de</strong> <strong>la</strong> figura 4.20, que <strong>la</strong> mayoría <strong>de</strong> los<br />
<strong>de</strong>litos son <strong>com</strong>etidos por personas con un nivel <strong>de</strong> instrucción bajo. Exist<strong>en</strong> muy pocos<br />
casos <strong>en</strong> los que los que hayan <strong>com</strong>etido <strong>de</strong>litos sean personas con niveles <strong>de</strong> educación<br />
superior al secund<strong>ar</strong>io <strong>com</strong>pleto.<br />
Figura 4.20. Interre<strong>la</strong>ción Delito Cometido- Nivel <strong>de</strong> Instrucción-Clusters<br />
Patricio Gutiérrez Rüegg Solución
4.2.4.2.2.3 Interpretación <strong>de</strong> los clusters<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
En base a <strong>la</strong> información que surge tanto <strong>de</strong>l análisis <strong>de</strong> los gráficos anteriores <strong>com</strong>o <strong>de</strong><br />
<strong>la</strong> investigación <strong>en</strong> el tema y consulta con especialistas, se da una primera interpretación<br />
<strong>de</strong> cada cluster formado.<br />
Es muy conv<strong>en</strong>i<strong>en</strong>te <strong>de</strong>stac<strong>ar</strong>, según lo hab<strong>la</strong>do con especialistas, que c<strong>la</strong>ram<strong>en</strong>te p<strong>ar</strong>a<br />
po<strong>de</strong>r realiz<strong>ar</strong> un análisis más profundo y exacto, habría que t<strong>en</strong>er acceso a <strong>la</strong> historia<br />
individual <strong>de</strong> cada uno, <strong>com</strong>o lo es conocer el orig<strong>en</strong> famili<strong>ar</strong> y cultural. Sin emb<strong>ar</strong>go,<br />
se cree que mediante el pres<strong>en</strong>te estudio se pue<strong>de</strong> d<strong>ar</strong> una muy bu<strong>en</strong>a aproximación.<br />
A continuación se pres<strong>en</strong>ta el análisis <strong>de</strong> cada uno <strong>de</strong> los clusters formados.<br />
Interpretación Cluster 0<br />
1600<br />
1400<br />
1200<br />
1000<br />
800<br />
600<br />
400<br />
200<br />
• Tamaño <strong>de</strong>l cluster: 16849 (41% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />
• Edad Promedio = 31 años.<br />
• Delito Cometido = Delitos contra <strong>la</strong> propiedad (90% <strong>de</strong> Robo y/o T<strong>en</strong>tativa <strong>de</strong><br />
robo).<br />
• Estado Civil = Soltero (73% <strong>de</strong>l cluster).<br />
• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (54%, 40% restante <strong>en</strong>tre ninguno y<br />
Sec. In<strong>com</strong>pleto).<br />
• Última Situación Laboral = Trabajo tiempo P<strong>ar</strong>cial (72% <strong>de</strong>l cluster, 23% <strong>de</strong><br />
tiempo <strong>com</strong>pleto).<br />
• Capacitación Laboral = Poseían algún oficio (85% <strong>de</strong>l cluster).<br />
• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (90% <strong>de</strong>l cluster).<br />
Promedio = 31<br />
Distribución <strong>de</strong> eda<strong>de</strong>s.<br />
Cluster 0<br />
0<br />
10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />
Figura 4.21. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 0.<br />
Solución Patricio Gutiérrez Rüegg 79
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Se observa un cluster <strong>de</strong> solteros <strong>en</strong> cual el promedio <strong>de</strong> edad es <strong>de</strong> 31 años [Figura<br />
4.21]. El nivel <strong>de</strong> instrucción que predomina es <strong>de</strong> prim<strong>ar</strong>io <strong>com</strong>pleto, aunque <strong>la</strong><br />
distribución <strong>de</strong>l nivel <strong>de</strong> instrucción <strong>de</strong>l resto <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>l cluster es muy pobre<br />
también. Son personas, <strong>en</strong> su mayoría, trabajadoras <strong>de</strong> tiempo p<strong>ar</strong>cial y que poseían<br />
algún oficio previo al ingreso al establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Aún así, <strong>de</strong>linquieron<br />
contra <strong>la</strong> propiedad, g<strong>en</strong>eralm<strong>en</strong>te <strong>de</strong>litos <strong>de</strong> robo y/o t<strong>en</strong>tativa <strong>de</strong> robo.<br />
P<strong>ar</strong>a que se <strong>com</strong>eta el <strong>de</strong>lito <strong>de</strong> robo concurr<strong>en</strong> difer<strong>en</strong>tes factores y múltiples<br />
circunstancias individuales. En este caso, lo más probable es que se tratándose <strong>de</strong><br />
personas que t<strong>en</strong>i<strong>en</strong>do algún trabajo p<strong>ar</strong>cial o también l<strong>la</strong>madas “changas” puedan<br />
junt<strong>ar</strong> algo <strong>de</strong> p<strong>la</strong>ta p<strong>ar</strong>a cubrir algunas <strong>de</strong> sus necesida<strong>de</strong>s básicas. El resto, lo obti<strong>en</strong><strong>en</strong><br />
robando. Aún si<strong>en</strong>do solteros <strong>en</strong> su mayoría, muchas veces ti<strong>en</strong><strong>en</strong> v<strong>ar</strong>ios hijos, lo que<br />
ac<strong>en</strong>túa <strong>la</strong> necesidad <strong>de</strong> salir a rob<strong>ar</strong>. Pero no se pue<strong>de</strong> <strong>de</strong>j<strong>ar</strong> <strong>de</strong> advertir, que no se <strong>de</strong>be<br />
únicam<strong>en</strong>te a una “necesidad m<strong>ar</strong>cada”, sino que el robo probablem<strong>en</strong>te se <strong>de</strong>ba a otros<br />
factores <strong>com</strong>o <strong>la</strong> exclusión <strong>de</strong>l trabajo formal, <strong>la</strong> exclusión social, <strong>de</strong> salud, <strong>de</strong><br />
educación, <strong>de</strong> vivi<strong>en</strong>da, <strong>de</strong> p<strong>ar</strong>ticipación social, sumado a haber crecido <strong>en</strong> medios<br />
hostiles <strong>en</strong> que los <strong>de</strong>litos <strong>de</strong> robo y viol<strong>en</strong>cia no les eran aj<strong>en</strong>o. Estos factores, muchas<br />
veces se traduc<strong>en</strong> <strong>en</strong> una vio<strong>la</strong>ción a <strong>la</strong> propiedad aj<strong>en</strong>a.<br />
A <strong>la</strong> edad promedio <strong>de</strong> 31 años, muchos <strong>de</strong> estos <strong>de</strong>t<strong>en</strong>idos son reinci<strong>de</strong>ntes. Heredan <strong>la</strong><br />
cultura <strong>de</strong>l robo, y no pue<strong>de</strong>n <strong>de</strong>spr<strong>en</strong><strong>de</strong>rse <strong>de</strong> el<strong>la</strong>, lo que los lleva a <strong>de</strong>linquir aún<br />
cuando ti<strong>en</strong><strong>en</strong> algún tipo <strong>de</strong> oficio y trabajo. A su vez, ocurre que trabajan g<strong>en</strong>eralm<strong>en</strong>te<br />
<strong>en</strong> negro, por lo cual estos trabajos <strong>de</strong> tiempo p<strong>ar</strong>cial pue<strong>de</strong>n lleg<strong>ar</strong> a ser muy inestables<br />
sufri<strong>en</strong>do <strong>de</strong>spidos prematuros e imprevistos.<br />
Posible solución al problema:<br />
Al ser g<strong>en</strong>te que ti<strong>en</strong>e una educación pobre, sin duda que habría que hacerse hincapié <strong>en</strong><br />
este s<strong>en</strong>tido. No es una c<strong>ar</strong>acterística importante <strong>en</strong> este grupo el <strong>de</strong>sempleo, ya que solo<br />
un 4% se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> el estado <strong>de</strong> <strong>de</strong>socupación total. Una forma <strong>de</strong> fom<strong>en</strong>t<strong>ar</strong> <strong>la</strong><br />
educación <strong>en</strong>tre familias <strong>de</strong> bajos recursos es mediante <strong>la</strong> implem<strong>en</strong>tación <strong>de</strong> un eficaz<br />
sistema <strong>de</strong> becas (ocurre <strong>en</strong> Brasil) que premie el esfuerzo y calificaciones y que<br />
permita que <strong>la</strong>s personas no <strong>de</strong>j<strong>en</strong> sus estudios secund<strong>ar</strong>ios p<strong>ar</strong>a salir a trabaj<strong>ar</strong>.<br />
Al mismo tiempo se los pue<strong>de</strong> instruir <strong>en</strong> algún otro oficio p<strong>ar</strong>a que t<strong>en</strong>gan distintas<br />
salidas y estén el mayor tiempo <strong>de</strong>l día ocupados. Es fundam<strong>en</strong>tal que se les <strong>de</strong> a este<br />
grupo <strong>de</strong> personas seguridad <strong>en</strong> sus trabajos, p<strong>ar</strong>a que no t<strong>en</strong>gan que recurrir al robo<br />
<strong>com</strong>o única salida al <strong>de</strong>sempleo.<br />
80<br />
Patricio Gutiérrez Rüegg Solución
Interpretación Cluster1<br />
500<br />
450<br />
400<br />
350<br />
300<br />
250<br />
200<br />
150<br />
100<br />
50<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
• Tamaño <strong>de</strong>l cluster: 6513 (16% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />
• Edad Promedio = 34 años.<br />
• Delito Cometido = Delitos contra <strong>la</strong>s Personas (86% <strong>de</strong>l cluster).<br />
Delitos contra <strong>la</strong>s Personas %<br />
Homicidios dolosos 63%<br />
Otros <strong>de</strong>litos contra <strong>la</strong>s personas 17%<br />
Homicidios dolosos (t<strong>en</strong>tativa.) 7%<br />
Homicidios Culposos 6%<br />
Lesiones Dolosas 4%<br />
Lesiones Culposas 1%<br />
Total 100%<br />
Tab<strong>la</strong> 4.37. Apertura <strong>de</strong> Delitos contra <strong>la</strong>s Personas<br />
• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (54%, 42% restante <strong>en</strong>tre ninguno y<br />
Sec. In<strong>com</strong>pleto).<br />
• Estado Civil = Soltero (76%).<br />
• Última Situación Laboral = Desocupado (65%).<br />
• Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión (77%).<br />
• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (85%).<br />
Promedio = 34<br />
Distribución <strong>de</strong> eda<strong>de</strong>s<br />
Pico = 38, Posible Outlier<br />
Cluster 1<br />
0<br />
10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />
Figura 4.22. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 1.<br />
Personas <strong>de</strong> mayor edad que <strong>la</strong> <strong>de</strong>l cluster 0 (promedio <strong>de</strong> 34 y pico <strong>de</strong> 38) [Figura<br />
4.22], con pobre formación educativa y solteros. Totalm<strong>en</strong>te <strong>de</strong>socupados y sin oficio<br />
ni profesión alguna.<br />
Se cree que <strong>la</strong> <strong>de</strong>sesperación <strong>de</strong>l no “hacer nada” (mayoría <strong>de</strong>socupados) sumado a<br />
“nada que pe<strong>de</strong>r” (mayoría solteros), conjuntam<strong>en</strong>te con los problemas que estos<br />
individuos pue<strong>de</strong>n pa<strong>de</strong>cer, los llevo a <strong>com</strong>eter algún <strong>de</strong>lito contra <strong>la</strong>s personas. En un<br />
Solución Patricio Gutiérrez Rüegg 81
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ámbito <strong>de</strong> viol<strong>en</strong>cia social <strong>com</strong>o el que se vive hoy <strong>en</strong> día, este tipo <strong>de</strong> personas pier<strong>de</strong><br />
el valor <strong>de</strong> <strong>la</strong> vida, y día tras día ti<strong>en</strong><strong>en</strong> m<strong>en</strong>os esperanzas <strong>de</strong> conseguir algún trabajo<br />
<strong>de</strong>bido a <strong>la</strong> edad y a <strong>la</strong> nu<strong>la</strong> formación profesional. Las drogas, el alcohol y el fácil<br />
acceso a <strong>la</strong>s <strong>ar</strong>mas, son actores principales <strong>en</strong> este tipo <strong>de</strong> grupo. Podría trat<strong>ar</strong>se,<br />
también, <strong>de</strong> homicidios <strong>en</strong> ocasión <strong>de</strong> robo.<br />
Hay una muy pequeña proporción <strong>de</strong> personas mayores a 33 años que se <strong>en</strong>cu<strong>en</strong>tra con<br />
un trabajo <strong>de</strong> tiempo <strong>com</strong>pleto/p<strong>ar</strong>cial y algún oficio o profesión. Aún así, <strong>de</strong>linqu<strong>en</strong><br />
contra <strong>la</strong>s personas. Sin lug<strong>ar</strong> a duda, que <strong>en</strong> estos <strong>de</strong>litos p<strong>en</strong>ales <strong>com</strong>o el homicidio y<br />
<strong>la</strong>s lesiones, siempre juega el factor psicológico <strong>de</strong>l agresor, y los altos niveles <strong>de</strong><br />
viol<strong>en</strong>cia que se percib<strong>en</strong> <strong>en</strong> <strong>la</strong>s escue<strong>la</strong>s, vía pública, ev<strong>en</strong>tos <strong>de</strong>portivos y <strong>de</strong>s<strong>de</strong> luego<br />
<strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia famili<strong>ar</strong>. O sea, <strong>la</strong> falta <strong>de</strong> trabajo no es siempre condición neces<strong>ar</strong>ia p<strong>ar</strong>a<br />
que una persona <strong>com</strong>eta un homicidio.<br />
En principio, al pres<strong>en</strong>te cluster se lo i<strong>de</strong>ntific<strong>ar</strong>ía con <strong>la</strong>s personas que <strong>com</strong>et<strong>en</strong> <strong>de</strong>litos<br />
contra <strong>la</strong>s personas <strong>de</strong> cualquier tipo (mayorm<strong>en</strong>te homicidios dolosos), asociados con<br />
<strong>la</strong> exclusión total a un régim<strong>en</strong> <strong>la</strong>boral.<br />
Posibles soluciones al problema:<br />
Programas <strong>de</strong> inclusión, reinserción y capacitación <strong>la</strong>boral p<strong>ar</strong>a g<strong>en</strong>te mayor. Es<br />
neces<strong>ar</strong>io que a este grupo <strong>de</strong> personas se les puedan brind<strong>ar</strong> una oportunidad <strong>de</strong> obt<strong>en</strong>er<br />
un trabajo digno.<br />
A su vez, habría que prest<strong>ar</strong>le más at<strong>en</strong>ción a los casos <strong>de</strong> viol<strong>en</strong>cia doméstica, <strong>la</strong>boral,<br />
<strong>de</strong> vecindad, etc. De esta forma, se quiere trat<strong>ar</strong> <strong>de</strong> advertir <strong>la</strong> viol<strong>en</strong>cia pres<strong>en</strong>te y<br />
ofrecer cont<strong>en</strong>ción y ayuda a los agresores antes que <strong>la</strong> viol<strong>en</strong>cia crezca hasta<br />
convertirse <strong>en</strong> homicidio.<br />
Interpretación Cluster 2<br />
82<br />
• Tamaño <strong>de</strong>l cluster: 14662 (36% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />
• Edad Promedio = 27 años.<br />
• Delito Cometido = Delitos contra <strong>la</strong> propiedad (92% <strong>de</strong> Robo y/o T<strong>en</strong>tativa <strong>de</strong><br />
robo).<br />
• Estado Civil = Soltero (80% <strong>de</strong>l cluster).<br />
• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (55%, 42% restante <strong>en</strong>tre ninguno y<br />
Sec. In<strong>com</strong>pleto).<br />
• Última Situación Laboral = Desocupado (79% <strong>de</strong>l cluster, 14% trabajo<br />
p<strong>ar</strong>cial).<br />
• Capacitación Laboral = No t<strong>en</strong>ía oficio ni profesión (89% <strong>de</strong>l cluster).<br />
Patricio Gutiérrez Rüegg Solución
1600<br />
1400<br />
1200<br />
1000<br />
800<br />
600<br />
400<br />
200<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (88% <strong>de</strong>l cluster).<br />
Promedio = 27<br />
Distribución <strong>de</strong> eda<strong>de</strong>s<br />
Cluster 2<br />
0<br />
10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />
Figura 4.23. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 2.<br />
Este cluster ti<strong>en</strong>e <strong>la</strong> letal <strong>com</strong>binación <strong>de</strong> agrup<strong>ar</strong> a personas jóv<strong>en</strong>es <strong>de</strong> <strong>en</strong>tre 20 y 30<br />
años, <strong>en</strong> su mayoría solteras (80%), con un nivel <strong>de</strong> instrucción bajísimo (sólo el 55%<br />
concluyó los estudios prim<strong>ar</strong>ios) junto a una muy alta taza <strong>de</strong> <strong>de</strong>sempleo (79%<br />
<strong>de</strong>socupado y 14 % trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial). Es <strong>de</strong>cir, se está hab<strong>la</strong>ndo <strong>de</strong> que un 93%<br />
<strong>de</strong> estas personas jóv<strong>en</strong>es no posee un trabajo formal <strong>de</strong> jornada <strong>com</strong>pleta. Esto último,<br />
sumado a <strong>la</strong> c<strong>ar</strong><strong>en</strong>cia <strong>de</strong> un oficio u profesión, coloca a esta pob<strong>la</strong>ción <strong>com</strong>o un gran<br />
riesgo: sin fu<strong>en</strong>te <strong>de</strong> ingresos y dificulta<strong>de</strong>s p<strong>ar</strong>a reinsert<strong>ar</strong>se <strong>la</strong>boralm<strong>en</strong>te no resulta<br />
extraño que el <strong>de</strong>lito que <strong>com</strong>et<strong>en</strong> es contra <strong>la</strong> propiedad.<br />
A su vez, <strong>la</strong> muy pequeña proporción <strong>de</strong> estos jóv<strong>en</strong>es individuos que ti<strong>en</strong><strong>en</strong> algún<br />
oficio o profesión, <strong>la</strong>m<strong>en</strong>tablem<strong>en</strong>te no poseía trabajo al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong> <strong>de</strong>t<strong>en</strong>ción, lo<br />
que podría ser <strong>la</strong> causante que los haya llevado a <strong>de</strong>linquir contra <strong>la</strong> propiedad.<br />
Este cluster est<strong>ar</strong>ía i<strong>de</strong>ntificado con el estado <strong>de</strong> se<strong>de</strong>nt<strong>ar</strong>ismo <strong>de</strong> los jóv<strong>en</strong>es que se<br />
<strong>en</strong>cu<strong>en</strong>tran ap<strong>ar</strong>tados <strong>de</strong>l <strong>com</strong>ún <strong>de</strong> <strong>la</strong> g<strong>en</strong>te, y no ti<strong>en</strong><strong>en</strong> acceso <strong>en</strong> primer lug<strong>ar</strong> a una<br />
educación formal que les ayu<strong>de</strong> a abrirles <strong>la</strong>s puertas <strong>de</strong>l ámbito <strong>la</strong>boral.<br />
Importante t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta que es uno <strong>de</strong> los clusters más gran<strong>de</strong>s junto con el cluster 0<br />
y más preocupantes aún por trat<strong>ar</strong>se <strong>de</strong> g<strong>en</strong>te jov<strong>en</strong>.<br />
Posible solución:<br />
Este grupo <strong>de</strong> g<strong>en</strong>te todavía esta a tiempo <strong>de</strong> cambi<strong>ar</strong> y t<strong>en</strong>er una vida digna fuera <strong>de</strong> <strong>la</strong>s<br />
drogas y cárceles. Efici<strong>en</strong>tes políticas <strong>de</strong> estado, <strong>com</strong>o programas int<strong>en</strong>sivos <strong>de</strong><br />
educación formal y capacitación <strong>la</strong>boral es una posible solución p<strong>ar</strong>a esta futura<br />
g<strong>en</strong>eración <strong>de</strong>l país.<br />
Solución Patricio Gutiérrez Rüegg 83
160<br />
140<br />
120<br />
100<br />
80<br />
60<br />
40<br />
20<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Interpretación Cluster 3<br />
84<br />
• Tamaño <strong>de</strong>l cluster: 2904 (7% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />
• Edad Promedio = 43 años<br />
• Delito Cometido = Estupefaci<strong>en</strong>tes + Integridad Sexual (60%)<br />
Delitos Cometidos Cluster 3 %<br />
Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes) 35%<br />
Delitos contra <strong>la</strong>s personas 26%<br />
Delitos contra <strong>la</strong> integridad sexual y el Honor 23%<br />
Delitos contra <strong>la</strong> propiedad 15%<br />
Total 100%<br />
Tab<strong>la</strong> 4.38. Delitos Cluster 3.<br />
• Estado Civil = Casados (72% <strong>de</strong>l cluster).<br />
• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (47%, 50% restante <strong>en</strong>tre ninguno y<br />
Sec. In<strong>com</strong>pleto, 3% con nivel alto <strong>de</strong> educación).<br />
• Última Situación Laboral = Trabajo Tiempo p<strong>ar</strong>cial (65% <strong>de</strong>l cluster, 27%<br />
trabajo tiempo <strong>com</strong>pleto).<br />
• Capacitación Laboral = No ti<strong>en</strong>e oficio ni Profesión (47% <strong>de</strong>l cluster).<br />
Capacitación Laboral %<br />
No ti<strong>en</strong>e ni oficio ni profesión 47%<br />
Ti<strong>en</strong>e algún oficio 34%<br />
Ti<strong>en</strong>e alguna profesión 20%<br />
Total 100%<br />
Tab<strong>la</strong> 4.39. Capacitación Laboral Cluster 3.<br />
• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (89% <strong>de</strong>l cluster).<br />
Promedio = 44<br />
Distribución <strong>de</strong> eda<strong>de</strong>s<br />
Cluster 3<br />
0<br />
10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />
Figura 4.24. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 3.<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Se trata <strong>de</strong>l cluster con m<strong>en</strong>or cantidad <strong>de</strong> instancias y al mismo tiempo el más difícil <strong>de</strong><br />
analiz<strong>ar</strong> <strong>de</strong>bido a sus distintas v<strong>ar</strong>iantes y reg<strong>la</strong>s.<br />
Sin duda, no son los <strong>de</strong>litos contra <strong>la</strong> propiedad los que m<strong>ar</strong>can a este cluster. Los<br />
<strong>de</strong>litos que predominan son el <strong>de</strong> vio<strong>la</strong>ción, tráfico <strong>de</strong> drogas y contra <strong>la</strong>s personas<br />
(totalizan el 85%).<br />
Está repres<strong>en</strong>tado por g<strong>en</strong>te <strong>de</strong> mayor edad que los anteriores, con una media <strong>de</strong> 43<br />
años, <strong>en</strong> don<strong>de</strong> <strong>la</strong> mayoría (73%) esta casada y nuevam<strong>en</strong>te el nivel <strong>de</strong> instrucción es<br />
muy bajo. Estos individuos poseían algún trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial (56%) y <strong>de</strong> tiempo<br />
<strong>com</strong>pleto (27%) y su capacitación <strong>la</strong>boral se <strong>en</strong>cu<strong>en</strong>tra dividida <strong>en</strong>tre <strong>la</strong>s 3 categorías.<br />
En este cluster se pue<strong>de</strong>n observ<strong>ar</strong> distintas c<strong>ar</strong>acterísticas <strong>en</strong>tre los <strong>de</strong>t<strong>en</strong>idos, si<strong>en</strong>do el<br />
nivel <strong>de</strong> capacitación <strong>la</strong>boral el punto <strong>de</strong> p<strong>ar</strong>tida <strong>en</strong> el árbol <strong>de</strong> <strong>de</strong>cisión.<br />
• Ti<strong>en</strong><strong>en</strong> oficio/profesión y trabajan p<strong>ar</strong>cialm<strong>en</strong>te o <strong>com</strong>pletam<strong>en</strong>te, mayores a<br />
33/38 años. Sin emb<strong>ar</strong>go <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong>s personas, vio<strong>la</strong>n y trafican drogas.<br />
G<strong>en</strong>eralm<strong>en</strong>te están casados o viv<strong>en</strong> <strong>en</strong> concubinato.<br />
• Los que no ti<strong>en</strong><strong>en</strong> oficio ni profesión, y <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong> integridad sexual y<br />
el honor y estupefaci<strong>en</strong>tes. En este caso, también g<strong>en</strong>eralm<strong>en</strong>te están casados.<br />
Como se <strong>com</strong><strong>en</strong>ta más <strong>ar</strong>riba, es difícil con esta información establecer algún patrón <strong>en</strong><br />
este cluster. Se <strong>de</strong>bería t<strong>en</strong>er acceso, por ejemplo, a más información re<strong>la</strong>cionada con<br />
los oríg<strong>en</strong>es <strong>de</strong> estas personas. Sin emb<strong>ar</strong>go, al realiz<strong>ar</strong> <strong>la</strong>s corridas <strong>de</strong> inducción, se<br />
<strong>en</strong>cu<strong>en</strong>tran reg<strong>la</strong>s interesantes.<br />
Se observa que los que <strong>com</strong>et<strong>en</strong> <strong>de</strong>litos contra <strong>la</strong> integridad sexual, <strong>en</strong> su amplia<br />
mayoría vio<strong>la</strong>ción, g<strong>en</strong>eralm<strong>en</strong>te son personas casadas, mayores a los 32 años y que<br />
poseían trabajo y oficio <strong>en</strong> muchos casos. Se trata <strong>de</strong> personas <strong>en</strong>fermas, muchas veces<br />
con <strong>de</strong>sór<strong>de</strong>nes psicológicos y físicos, con personalida<strong>de</strong>s psicópatas y perversas. Estos<br />
agresores ti<strong>en</strong><strong>en</strong> patrones <strong>de</strong> <strong>com</strong>portami<strong>en</strong>to y <strong>de</strong> personalidad difer<strong>en</strong>tes a cualquier<br />
otro autor <strong>de</strong> otros <strong>de</strong>litos. Es difícil, por lo tanto, logr<strong>ar</strong> prev<strong>en</strong>ir este tipo <strong>de</strong> <strong>de</strong>lito, ya<br />
que suele ser muy <strong>com</strong>plicado <strong>de</strong>tect<strong>ar</strong> a un pot<strong>en</strong>cial vio<strong>la</strong>dor.<br />
No se pue<strong>de</strong> <strong>de</strong>j<strong>ar</strong> <strong>de</strong> ac<strong>la</strong>r<strong>ar</strong> que <strong>la</strong> mayoría <strong>de</strong> los casos <strong>de</strong> abuso sexual,<br />
especialm<strong>en</strong>te los que ti<strong>en</strong><strong>en</strong> <strong>com</strong>o víctima a niños y niñas, ocurr<strong>en</strong> <strong>de</strong>ntro <strong>de</strong>l hog<strong>ar</strong>, y<br />
los victim<strong>ar</strong>ios suel<strong>en</strong> ser los padres, padrastros, abuelos o tíos. Hace falta <strong>de</strong>rrib<strong>ar</strong> el<br />
mito <strong>de</strong> que el peligro está afuera, ya que si bi<strong>en</strong> hay casos, por ejemplo, <strong>de</strong> m<strong>en</strong>ores<br />
vio<strong>la</strong>dos por <strong>de</strong>sconocidos que los sorpr<strong>en</strong><strong>de</strong>n <strong>en</strong> <strong>la</strong> vía pública, <strong>la</strong> mayoría <strong>de</strong> los<br />
casos son intrafamili<strong>ar</strong>es [La<strong>la</strong>urette, 2008].<br />
Solución Patricio Gutiérrez Rüegg 85
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
P<strong>ar</strong>a estos casos es neces<strong>ar</strong>io, que el tema <strong>de</strong> los abusos sexuales <strong>de</strong>je <strong>de</strong> ser un tema<br />
tabú, que los habitantes tomemos conci<strong>en</strong>cia <strong>de</strong> este f<strong>la</strong>gelo que existe <strong>en</strong> <strong>la</strong> sociedad y<br />
que <strong>en</strong> <strong>la</strong> mayoría <strong>de</strong> los casos se da <strong>de</strong>ntro <strong>de</strong> <strong>la</strong>s familias. Es neces<strong>ar</strong>io ac<strong>en</strong>tu<strong>ar</strong> <strong>la</strong><br />
prev<strong>en</strong>ción, y <strong>en</strong> el tratami<strong>en</strong>to <strong>de</strong> los agresores y víctimas.<br />
En cuanto a los que p<strong>ar</strong>ticipan <strong>en</strong> <strong>de</strong>litos <strong>de</strong> estupefaci<strong>en</strong>tes, que conforman el 35 % <strong>de</strong><br />
este cluster, nos <strong>en</strong>contramos con g<strong>en</strong>te que siempre ti<strong>en</strong>e algún tipo <strong>de</strong> trabajo y <strong>en</strong><br />
muchas ocasiones oficio o profesión. El <strong>de</strong>lito <strong>de</strong> los estupefaci<strong>en</strong>tes es difer<strong>en</strong>te a los<br />
<strong>de</strong>más <strong>de</strong>litos p<strong>en</strong>ales. Des<strong>de</strong> ya no es lo mismo un n<strong>ar</strong>cotraficante que un poseedor <strong>de</strong><br />
drogas p<strong>ar</strong>a consumo personal, por lo cual merecerán una diversa at<strong>en</strong>ción. En el último<br />
caso, el <strong>de</strong> consumo personal, muchas veces se trata <strong>de</strong> g<strong>en</strong>te que ti<strong>en</strong>e una adicción,<br />
que at<strong>en</strong>ta contra <strong>la</strong> posibilidad que ti<strong>en</strong>e un sujeto normal <strong>de</strong> <strong>com</strong>pr<strong>en</strong><strong>de</strong>r que está<br />
quebrantando <strong>la</strong> ley. Es por ello, que <strong>en</strong> algunos países, l<strong>en</strong>tam<strong>en</strong>te se está avanzando <strong>en</strong><br />
<strong>la</strong> <strong>de</strong>sp<strong>en</strong>alización <strong>de</strong> este <strong>de</strong>lito.<br />
4.2.4.2.3 Selección <strong>de</strong> Atributos<br />
Rapid-i cu<strong>en</strong>ta con una serie <strong>de</strong> métodos p<strong>ar</strong>a realiz<strong>ar</strong> una preselección <strong>de</strong> los atributos<br />
que serán utilizados posteriorm<strong>en</strong>te <strong>en</strong> los algoritmos <strong>de</strong> inducción o c<strong>la</strong>sificación. Tal<br />
<strong>com</strong>o se <strong>com</strong><strong>en</strong>tó al <strong>com</strong>i<strong>en</strong>zo <strong>de</strong>l pres<strong>en</strong>te ap<strong>ar</strong>tado, se utilizan métodos <strong>de</strong> filtros y<br />
<strong>en</strong>volv<strong>en</strong>tes (wrappers).<br />
4.2.4.2.3.1 Filtros<br />
Complem<strong>en</strong>tando lo dicho <strong>en</strong> el estado <strong>de</strong> <strong>la</strong> cuestión, se basan <strong>en</strong> <strong>la</strong> i<strong>de</strong>a <strong>de</strong> d<strong>ar</strong> una<br />
calidad <strong>de</strong> los atributos. Se suel<strong>en</strong> aplic<strong>ar</strong> haci<strong>en</strong>do un ranking <strong>de</strong> atributos.<br />
A continuación se muestran los métodos <strong>de</strong> filtros aplicados con sus respectivos<br />
resultados <strong>en</strong> forma <strong>de</strong> ranking <strong>de</strong> atributos.<br />
86<br />
GainRatioAttributeEval InfoGainAttributeEval<br />
Attribute Weight Attribute Weight<br />
Capacitacion Laboral 0.405 Capacitacion Laboral 0.540<br />
Delito Cometido 0.366 Delito Cometido 0.512<br />
Ultima Situacion Laboral 0.291 Ultima Situacion Laboral 0.432<br />
Estado Civil 0.105 Edad 0.168<br />
Edad 0.054 Estado Civil 0.139<br />
Nivel_Instr_Summ 0.007 Nivel_Instr_Summ 0.012<br />
Ultima Resi<strong>de</strong>ncia 0.004 Ultima Resi<strong>de</strong>ncia 0.002<br />
Tab<strong>la</strong> 4.40. Ranking <strong>de</strong> Atributos Tab<strong>la</strong> 4.41. Ranking <strong>de</strong> Atributos<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ReliefFAttributeEval<br />
ChiSqu<strong>ar</strong>edAttributeEval<br />
Attribute Weight Attribute Weight<br />
Delito Cometido 0.365 Delito Cometido 28429.192<br />
Capacitacion Laboral 0.352 Capacitacion Laboral 26250.296<br />
Ultima Situacion Laboral 0.309 Ultima Situacion Laboral 21184.971<br />
Estado Civil 0.070 Estado Civil 11536.309<br />
Edad 0.042 Edad 10607.634<br />
Ultima Resi<strong>de</strong>ncia -0.001 Nivel_Instr_Summ 748.152<br />
Nivel_Instr_Summ -0.005 Ultima Resi<strong>de</strong>ncia 135.467<br />
Tab<strong>la</strong> 4.42. Ranking <strong>de</strong> Atributos Tab<strong>la</strong> 4.43. Ranking <strong>de</strong> Atributos<br />
Se pue<strong>de</strong> ver que mediante los 4 métodos <strong>de</strong> selección <strong>de</strong> atributos se confirma lo dicho<br />
anteriorm<strong>en</strong>te sobre <strong>la</strong> poca relevancia <strong>en</strong> los clusters que ti<strong>en</strong><strong>en</strong> los atributos Última<br />
Resi<strong>de</strong>ncia y Nivel <strong>de</strong> Instrucción. Sin emb<strong>ar</strong>go, cada uno <strong>de</strong> los métodos sugirió que no<br />
se <strong>de</strong>sc<strong>ar</strong>t<strong>ar</strong>a a ninguno <strong>de</strong> ellos.<br />
4.2.4.2.3.2 Wrappers<br />
Este método seleccionan los atributos <strong>en</strong> función <strong>de</strong> <strong>la</strong> calidad <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong><br />
datos asociado a los atributos utilizados.<br />
Se utiliza el WrapperSubsetEval y <strong>com</strong>o c<strong>la</strong>sificador al algoritmo J48. El resultado <strong>de</strong>l<br />
mismo sugirió <strong>la</strong> exclusión <strong>de</strong>l atributo Nivel <strong>de</strong> Instrucción. Sin emb<strong>ar</strong>go, se cree<br />
conv<strong>en</strong>i<strong>en</strong>te continu<strong>ar</strong> con <strong>la</strong> c<strong>la</strong>sificación utilizando a dicho atributo <strong>de</strong>bido a que<br />
ninguno <strong>de</strong> los métodos por filtros lo <strong>de</strong>sc<strong>ar</strong>tó.<br />
4.2.4.2.4 C<strong>la</strong>sificación<br />
P<strong>ar</strong>a <strong>la</strong> c<strong>la</strong>sificación se utilizan los algoritmos C4.5 y CHAID. Se esperaba que cada<br />
algoritmo <strong>en</strong> p<strong>ar</strong>ticu<strong>la</strong>r <strong>ar</strong>roj<strong>ar</strong>a reg<strong>la</strong>s distintas. Sin emb<strong>ar</strong>go se obti<strong>en</strong><strong>en</strong> reg<strong>la</strong>s muy<br />
simi<strong>la</strong>res <strong>en</strong> los árboles <strong>de</strong> <strong>de</strong>cisión, por no <strong>de</strong>cir iguales, al realiz<strong>ar</strong> inducción sobre el<br />
atributo cluster obt<strong>en</strong>ido <strong>en</strong> el proceso <strong>de</strong> clustering. Esto <strong>de</strong>muestra <strong>la</strong> consist<strong>en</strong>cia <strong>de</strong><br />
los datos <strong>en</strong> ambos mo<strong>de</strong>los.<br />
4.2.4.2.4.1 C<strong>la</strong>sificación a través <strong>de</strong>l C4.5<br />
Se estableció un nivel <strong>de</strong> confianza p<strong>ar</strong>a <strong>la</strong> poda <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión <strong>de</strong>l 50% y se fijó<br />
<strong>en</strong> 2 el mínimo <strong>de</strong> instancias por hoja.<br />
El resultado obt<strong>en</strong>ido sobre un total <strong>de</strong> 40,928 registros agrupados <strong>en</strong> los 4 clusters es el<br />
sigui<strong>en</strong>te:<br />
Solución Patricio Gutiérrez Rüegg 87
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
88<br />
• Instancias c<strong>la</strong>sificadas correctam<strong>en</strong>te: 40,913 (99.96%).<br />
• Instancias c<strong>la</strong>sificadas incorrectam<strong>en</strong>te 15 (0.04%).<br />
El árbol resultante ti<strong>en</strong>e un tamaño <strong>de</strong> 392 elem<strong>en</strong>tos y 276 hojas y <strong>la</strong> matriz <strong>de</strong><br />
confusión obt<strong>en</strong>ida a través <strong>de</strong>l Rapid-i queda constituida <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera:<br />
true cluster3 true cluster0 true cluster2 true cluster1<br />
c<strong>la</strong>ss<br />
precision<br />
pred. cluster3 2,902 2 1 7 99.66%<br />
pred. cluster0 - 16,847 1 2 99.98%<br />
pred. cluster2 1 - 14,660 - 99.99%<br />
pred. cluster1 1 - - 6,504 99.98%<br />
c<strong>la</strong>ss recall 99.93% 99.99% 99.99% 99.86%<br />
Tab<strong>la</strong> 4.43. Matriz <strong>de</strong> confusión obt<strong>en</strong>ida a través <strong>de</strong>l algoritmo C4.5.<br />
Si <strong>la</strong> c<strong>la</strong>sificación hubiera sido perfecta se esper<strong>ar</strong>ía <strong>en</strong>contr<strong>ar</strong> únicam<strong>en</strong>te elem<strong>en</strong>tos <strong>en</strong><br />
<strong>la</strong> diagonal. En otras pa<strong>la</strong>bras, <strong>la</strong> matriz <strong>de</strong> confusión permite <strong>en</strong>t<strong>en</strong><strong>de</strong>r cual es el error<br />
que está <strong>com</strong>eti<strong>en</strong>do el algoritmo al int<strong>en</strong>t<strong>ar</strong> c<strong>la</strong>sific<strong>ar</strong> a todos los registros.<br />
Por otro <strong>la</strong>do se testea al mo<strong>de</strong>lo mediante un set <strong>de</strong> criterios <strong>de</strong> selección, a través <strong>de</strong>l<br />
l<strong>la</strong>mado Performance Vector. Los resultados <strong>de</strong>l mismo p<strong>ar</strong>a el algoritmo C4.5 se<br />
muestran a continuación:<br />
Criterio Valor<br />
accuracy: 99.96%<br />
c<strong>la</strong>ssification_error: 0.04%<br />
absolute_error: 0.001 +/- 0.017<br />
corre<strong>la</strong>tion: 0.998<br />
squ<strong>ar</strong>ed_corre<strong>la</strong>tion: 0.997<br />
Tab<strong>la</strong> 4.44. Performance Vector <strong>de</strong>l algoritmo C4.5.<br />
4.2.4.2.4.2 C<strong>la</strong>sificación a través <strong>de</strong>l CHAID<br />
Se corrió el algoritmo CHAID con un nivel <strong>de</strong> confianza máximo <strong>de</strong>l 50% p<strong>ar</strong>a realiz<strong>ar</strong><br />
<strong>la</strong> poda <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión y se estableció <strong>en</strong> 2 el mínimo tamaño <strong>de</strong> todas <strong>la</strong>s hojas.<br />
El resultado obt<strong>en</strong>ido sobre un total <strong>de</strong> 40,928 registros agrupados <strong>en</strong> los 4 clusters es el<br />
sigui<strong>en</strong>te:<br />
• Instancias c<strong>la</strong>sificadas correctam<strong>en</strong>te: 40,683 (99.4%).<br />
• Instancias c<strong>la</strong>sificadas incorrectam<strong>en</strong>te 245 (0.6%).<br />
La matriz <strong>de</strong> confusión obt<strong>en</strong>ida queda constituida <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera:<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
true cluster3 true cluster0 true cluster2 true cluster1<br />
c<strong>la</strong>ss<br />
precision<br />
pred. cluster3 2,750 3 1 49 98.11%<br />
pred. cluster0 27 16,832 24 - 99.70%<br />
pred. cluster2 39 14 14,637 - 99.64%<br />
pred. cluster1 88 - - 6,464 98.66%<br />
c<strong>la</strong>ss recall 94.70% 99.90% 99.83% 99.25%<br />
Tab<strong>la</strong> 4.45. Matriz <strong>de</strong> confusión obt<strong>en</strong>ida a través <strong>de</strong>l algoritmo CHAID.<br />
Los resultados <strong>de</strong>l Performance Vector p<strong>ar</strong>a el algoritmo CHAID se muestran a<br />
continuación:<br />
4.2.4.2.4.3 Árbol <strong>de</strong> <strong>de</strong>cisión<br />
Criterio Valor<br />
accuracy: 99.40%<br />
c<strong>la</strong>ssification_error: 0.60%<br />
absolute_error: 0.008 +/ -0.066<br />
corre<strong>la</strong>tion: 0.974<br />
squ<strong>ar</strong>ed_corre<strong>la</strong>tion: 0.949<br />
Tab<strong>la</strong> 4.46. Performance Vector <strong>de</strong>l algoritmo CHAID.<br />
Vale record<strong>ar</strong> que no son <strong>la</strong>s salidas gráficas uno <strong>de</strong> los puntos fuertes <strong>de</strong>l Rapid-i. Más<br />
allá <strong>de</strong> esta <strong>de</strong>sv<strong>en</strong>taja, se pue<strong>de</strong> observ<strong>ar</strong> que el árbol <strong>de</strong> <strong>de</strong>cisión obt<strong>en</strong>ido mediante el<br />
algoritmo CHAID es por <strong>de</strong>más frondoso, aún cuando una <strong>de</strong> <strong>la</strong>s c<strong>ar</strong>acterísticas <strong>de</strong>l<br />
dicho algoritmo es <strong>la</strong> <strong>de</strong> realiz<strong>ar</strong> <strong>la</strong> “poda” <strong>de</strong>l mismo.<br />
Figura 4.25. Estructura <strong>de</strong>l árbol <strong>com</strong>pleto obt<strong>en</strong>ido mediante el algoritmo CHAID.<br />
Solución Patricio Gutiérrez Rüegg 89
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
El nodo principal es el atributo Capacitación Laboral. Las ramas correspondi<strong>en</strong>tes a Sin<br />
oficio ni profesión y Profesión se dirig<strong>en</strong> al nodo referido al atributo Delito Cometido<br />
[Figura 4.26]. La rama correspondi<strong>en</strong>te a Oficio se dirige al atributo situación <strong>la</strong>boral.<br />
De esta manera se pue<strong>de</strong> seguir “ley<strong>en</strong>do” el árbol, p<strong>ar</strong>ti<strong>en</strong>do <strong>de</strong> cada uno <strong>de</strong> los nodos,<br />
pasando por <strong>la</strong>s ramas hasta lleg<strong>ar</strong> a <strong>la</strong>s hojas. El árbol que se pres<strong>en</strong>ta <strong>en</strong> <strong>la</strong> figura 4.26<br />
es un mo<strong>de</strong>lo resumido <strong>de</strong>l mismo. Debido al tamaño que exhibe, cada una <strong>de</strong> <strong>la</strong>s ramas<br />
se repres<strong>en</strong>ta por sep<strong>ar</strong>ado <strong>en</strong> los anexos 11, 12 y 13.<br />
90<br />
Figura 4.26. Árbol resumido obt<strong>en</strong>ido mediante el algoritmo CHAID.<br />
4.2.4.2.4.4 Reg<strong>la</strong>s <strong>de</strong> C<strong>la</strong>sificación<br />
La finalidad <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión <strong>de</strong>l pres<strong>en</strong>te estudio es <strong>la</strong> creación <strong>de</strong> reg<strong>la</strong>s <strong>de</strong><br />
c<strong>la</strong>sificación que ayu<strong>de</strong>n a explic<strong>ar</strong> y valid<strong>ar</strong> <strong>la</strong> <strong>com</strong>posición <strong>de</strong> cada cluster formado.<br />
Se <strong>de</strong>staca una vez más, <strong>la</strong> similitud <strong>en</strong>tre <strong>la</strong>s reg<strong>la</strong>s al utiliz<strong>ar</strong>se los algoritmos C4.5 y<br />
CHAID.<br />
Las reg<strong>la</strong>s extraídas <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión se divi<strong>de</strong>n según cada cluster p<strong>ar</strong>a t<strong>en</strong>er un<br />
panorama más s<strong>en</strong>cillo. Así, por lo tanto, se obti<strong>en</strong>e que el 20% <strong>de</strong> <strong>la</strong> totalidad <strong>de</strong> <strong>la</strong>s<br />
reg<strong>la</strong>s g<strong>en</strong>eradas por el árbol c<strong>la</strong>sifican a más <strong>de</strong>l 80% <strong>de</strong> <strong>la</strong>s instancias [Tab<strong>la</strong> 4.47].<br />
Patricio Gutiérrez Rüegg Solución
Clusters<br />
Total <strong>de</strong> Reg<strong>la</strong>s<br />
por cluster<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Reg<strong>la</strong>s<br />
Seleccionadas<br />
Solución Patricio Gutiérrez Rüegg 91<br />
%<br />
Instancias por<br />
Cluster<br />
Cluster 0 53 6 11% 16,849<br />
Cluster 1 51 6 12% 6,513<br />
Cluster 2 17 3 18% 14,662<br />
Cluster 3 57 18 32% 2,904<br />
Total 178 33 19% 40,928<br />
Tab<strong>la</strong> 4.47. Total <strong>de</strong> reg<strong>la</strong>s vs. Reg<strong>la</strong>s seleccionadas.<br />
Instancias por<br />
Reg<strong>la</strong><br />
13,657<br />
4,826<br />
12,606<br />
2,063<br />
33,152<br />
A continuación se <strong>de</strong>tal<strong>la</strong>n <strong>la</strong>s principales reg<strong>la</strong>s <strong>de</strong> c<strong>la</strong>sificación, <strong>en</strong> or<strong>de</strong>n <strong>de</strong>creci<strong>en</strong>te<br />
según cantidad <strong>de</strong> instancias que c<strong>la</strong>sifica correctam<strong>en</strong>te, p<strong>ar</strong>a cada uno <strong>de</strong> los clusters<br />
obt<strong>en</strong>idos.<br />
Reg<strong>la</strong>s Principales Cluster 0<br />
Reg<strong>la</strong> 1<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Estado Civil = Soltero<br />
Entonces Cluster 0 (7516)<br />
Reg<strong>la</strong> 2<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />
Entonces Cluster 0 (2615)<br />
Reg<strong>la</strong> 3<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Estado Civil = Concubino<br />
Entonces Cluster 0 (1314)<br />
Reg<strong>la</strong> 4<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Estado Civil = Casado<br />
Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />
Entonces Cluster 0 (696)<br />
Reg<strong>la</strong> 5<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Desocupado<br />
Y Edad >29<br />
Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />
Entonces Cluster 0 (695)<br />
%<br />
81%<br />
74%<br />
86%<br />
71%<br />
81%
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Reg<strong>la</strong> 6<br />
Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />
Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Edad 30<br />
Y Última Situación Laboral = Desocupado<br />
Y Estado Civil = Soltero<br />
Entonces Cluster 1 (290)<br />
Reg<strong>la</strong> 4<br />
Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Edad < 39<br />
Entonces Cluster 1 (268)<br />
Reg<strong>la</strong> 5<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Desocupado<br />
Y Edad >29<br />
Y Delito Cometido = Delitos contra <strong>la</strong>s Personas<br />
Entonces Cluster 1 (226)<br />
Reg<strong>la</strong> 6<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Delito Cometido = Delitos contra <strong>la</strong>s Personas<br />
92<br />
Patricio Gutiérrez Rüegg Solución
Y Edad >33<br />
Y Estado Civil = Soltero<br />
Entonces Cluster 1 (218)<br />
Reg<strong>la</strong>s Principales Cluster 2<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Reg<strong>la</strong> 1<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Desocupado<br />
Entonces Cluster 2 (9822)<br />
Reg<strong>la</strong> 2<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Edad
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
94<br />
Y Estado Civil = Casado<br />
Y Delito Cometido = Delitos contra <strong>la</strong>s personas<br />
Y Edad > 38<br />
Entonces Cluster 3 (200)<br />
Reg<strong>la</strong> 5<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Edad > 29<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (165)<br />
Reg<strong>la</strong> 6<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />
Y Edad > 33<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (137)<br />
Reg<strong>la</strong> 7<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />
Y Edad < 82<br />
Y Estado Civil = Casado<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Entonces Cluster 3 (131)<br />
Reg<strong>la</strong> 8<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Estado Civil = Casado<br />
Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />
Y Edad > 38<br />
Entonces Cluster 3 (119)<br />
Reg<strong>la</strong> 9<br />
Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />
Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />
Y Estado Civil = Concubino<br />
Y Edad > 37<br />
Entonces Cluster 3 (100)<br />
Reg<strong>la</strong> 10<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes)<br />
Y Edad < 30<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Entonces Cluster 3 (95)<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Reg<strong>la</strong> 11<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Delito Cometido = Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes)<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (90)<br />
Reg<strong>la</strong> 12<br />
Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />
Y Estado Civil = Casado<br />
Y Edad > 38<br />
Entonces Cluster 3 (73)<br />
Reg<strong>la</strong> 13<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />
Y Edad > 32<br />
Y Última Situación Laboral = Desocupado<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (72)<br />
Reg<strong>la</strong> 14<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Estado Civil = Concubino<br />
Y Edad > 38<br />
Entonces Cluster 3 (61)<br />
Reg<strong>la</strong> 15<br />
Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Edad > 38<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (60)<br />
Reg<strong>la</strong> 16<br />
Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Edad > 39<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (59)<br />
Reg<strong>la</strong> 17<br />
Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />
Solución Patricio Gutiérrez Rüegg 95
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
96<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />
Y Edad < 33<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (53)<br />
Reg<strong>la</strong> 18<br />
Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />
Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />
Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />
Y Edad > 36<br />
Y Estado Civil = Casado<br />
Entonces Cluster 3 (45)<br />
4.2.4.3 Evalu<strong>ar</strong> el mo<strong>de</strong>lo.<br />
A fines <strong>de</strong> evalu<strong>ar</strong> el mo<strong>de</strong>lo, se aplica una inducción directa sobre uno <strong>de</strong> los atributos<br />
p<strong>ar</strong>a <strong>la</strong> obt<strong>en</strong>ción <strong>de</strong> <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong> c<strong>la</strong>sificación. O sea, se omite el paso <strong>de</strong> clustering <strong>de</strong><br />
los datos.<br />
En este caso, se toma <strong>com</strong>o c<strong>la</strong>se al atributo Delito Cometido ya que junto con<br />
Capacitación Laboral son los campos más relevantes <strong>de</strong>l dataset. Esto último se pue<strong>de</strong><br />
verific<strong>ar</strong> <strong>en</strong> <strong>la</strong> sección <strong>de</strong> selección <strong>de</strong> atributos (capitulo 4.2.4.2.2).<br />
Como algoritmo c<strong>la</strong>sificador se utiliza al C4.5 obt<strong>en</strong>i<strong>en</strong>do los sigui<strong>en</strong>tes resultados:<br />
• Instancias c<strong>la</strong>sificadas correctam<strong>en</strong>te: 28,216 (68.94%).<br />
• Instancias c<strong>la</strong>sificadas incorrectam<strong>en</strong>te: 12,712 (31.06%).<br />
La matriz <strong>de</strong> confusión queda conformada <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te forma:<br />
pred. Infracción ley n° 23.737<br />
(estupefaci<strong>en</strong>tes)<br />
true Infracción ley<br />
N° 23.737<br />
(estupefaci<strong>en</strong>tes)<br />
true Delitos contra<br />
<strong>la</strong> propiedad<br />
true Delitos contra<br />
<strong>la</strong>s personas<br />
true Delitos contra<br />
<strong>la</strong> integridad<br />
sexual y el Honor<br />
c<strong>la</strong>ss<br />
precision<br />
358 110 91 65 57.37%<br />
pred. Delitos contra <strong>la</strong> propiedad 2,108 25,805 7,332 1,760 69.73%<br />
pred. Delitos contra <strong>la</strong>s<br />
personas<br />
pred. Delitos contra <strong>la</strong> integridad<br />
sexual y el Honor<br />
204 476 1,682 344 62.16%<br />
36 85 101 371 62.56%<br />
c<strong>la</strong>ss recall 13.23% 97.47% 18.27% 14.61%<br />
Tab<strong>la</strong> 4.48. Matriz <strong>de</strong> confusión obt<strong>en</strong>ida con el algoritmo C4.5 y c<strong>la</strong>se Delito Cometido.<br />
Tal <strong>com</strong>o se observa <strong>en</strong> <strong>la</strong> tab<strong>la</strong> 4.49, los valores correspondi<strong>en</strong>tes al vector <strong>de</strong><br />
performance son significativam<strong>en</strong>te peores que <strong>la</strong>s corridas anteriores:<br />
Patricio Gutiérrez Rüegg Solución
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Criterio Valor<br />
accuracy: 68.94%<br />
c<strong>la</strong>ssification_error: 31.06%<br />
absolute_error: 0.456 +/- 0.262<br />
corre<strong>la</strong>tion: 0.296<br />
squ<strong>ar</strong>ed_corre<strong>la</strong>tion: 0.088<br />
Tab<strong>la</strong> 4.49. Performance Vector <strong>de</strong>l algoritmo C4.5<br />
En <strong>com</strong>p<strong>ar</strong>ación a los dos primeros mo<strong>de</strong>los <strong>en</strong> don<strong>de</strong> ambos casos mostraban un po<strong>de</strong>r<br />
c<strong>la</strong>sificatorio superior al 99%, <strong>en</strong> este último solo se pudo c<strong>la</strong>sific<strong>ar</strong> <strong>en</strong> forma correcta<br />
solo al 68.94% <strong>de</strong> <strong>la</strong>s instancias.<br />
Esta disminución <strong>en</strong> <strong>la</strong> eficacia c<strong>la</strong>sificatoria no significa que pueda haber g<strong>en</strong>erado<br />
reg<strong>la</strong>s inconsist<strong>en</strong>tes o incorrectas. Pue<strong>de</strong> ocurrir, que <strong>de</strong>ntro <strong>de</strong> aquel<strong>la</strong>s instancias <strong>en</strong><br />
<strong>la</strong>s que no pudo c<strong>la</strong>sific<strong>ar</strong> correctam<strong>en</strong>te haya reg<strong>la</strong>s subyac<strong>en</strong>tes que result<strong>en</strong><br />
relevantes.<br />
4.2.5 Fase V: Evaluación<br />
La evaluación <strong>de</strong>s<strong>de</strong> todo punto <strong>de</strong> vista resulta ser muy positiva. Se <strong>com</strong><strong>en</strong>zó el<br />
proyecto <strong>de</strong>sconoci<strong>en</strong>do totalm<strong>en</strong>te al tema <strong>en</strong> cuestión y mediante <strong>la</strong>s técnicas <strong>de</strong><br />
minería <strong>de</strong> datos se pudo lleg<strong>ar</strong> a conclusiones y reflexiones interesantes, <strong>de</strong> acuerdo a<br />
<strong>la</strong> opinión vertida por los expertos <strong>de</strong>l dominio.<br />
Otro punto a favor es que <strong>la</strong> interpretación <strong>de</strong> los resultados obt<strong>en</strong>idos a través <strong>de</strong> los<br />
algoritmos utilizados, tanto p<strong>ar</strong>a el agrupami<strong>en</strong>to <strong>de</strong> los datos <strong>com</strong>o p<strong>ar</strong>a <strong>la</strong><br />
c<strong>la</strong>sificación, se <strong>en</strong>cu<strong>en</strong>tra alineada con <strong>la</strong> opinión <strong>de</strong> los especialistas <strong>en</strong> materia<br />
criminal, p<strong>en</strong>al, <strong>de</strong>l <strong>de</strong>recho y social. Todos los especialistas coinci<strong>de</strong>n <strong>en</strong> un punto<br />
c<strong>la</strong>ve:<br />
“P<strong>ar</strong>a logr<strong>ar</strong> un mejor <strong>en</strong>t<strong>en</strong>dimi<strong>en</strong>to <strong>de</strong> <strong>la</strong>s conductas y <strong>com</strong>portami<strong>en</strong>tos <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido,<br />
es sumam<strong>en</strong>te importante conocer <strong>la</strong> historia famili<strong>ar</strong> y cultural <strong>de</strong>l mismo”.<br />
Lam<strong>en</strong>tablem<strong>en</strong>te, hoy <strong>en</strong> día no se cu<strong>en</strong>ta con dicha información <strong>en</strong> el sistema SNEEP.<br />
Conclusiones <strong>de</strong> <strong>la</strong>s principales reg<strong>la</strong>s obt<strong>en</strong>idas a p<strong>ar</strong>tir <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión y<br />
conocimi<strong>en</strong>tos adquiridos:<br />
• La mayoría <strong>de</strong> <strong>la</strong>s personas presas se <strong>en</strong>cu<strong>en</strong>tran privadas <strong>de</strong> su libertad por<br />
haber <strong>com</strong>etido el <strong>de</strong>lito <strong>de</strong> robo o hurto.<br />
• Existe una distribución <strong>de</strong>l nivel <strong>de</strong> instrucción muy pobre <strong>en</strong>tre los <strong>de</strong>t<strong>en</strong>idos <strong>en</strong><br />
establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios.<br />
Solución Patricio Gutiérrez Rüegg 97
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
98<br />
• Aún cuando una persona posee un oficio o profesión y un trabajo <strong>de</strong> tiempo<br />
p<strong>ar</strong>cial/<strong>com</strong>pleto, <strong>com</strong>ete <strong>de</strong>litos contra <strong>la</strong> propiedad. Podría est<strong>ar</strong> re<strong>la</strong>cionado<br />
con <strong>la</strong> cultura <strong>de</strong>l robo que trae innata.<br />
• La mayoría <strong>de</strong> <strong>la</strong>s personas <strong>de</strong> más <strong>de</strong> 30 años que <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong> propiedad<br />
son reinci<strong>de</strong>ntes.<br />
• Los individuos que <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong>s personas son <strong>en</strong> su mayoría g<strong>en</strong>te que se<br />
<strong>en</strong>cu<strong>en</strong>tra <strong>de</strong>socupada e incapacitada <strong>la</strong>boralm<strong>en</strong>te.<br />
• El nivel <strong>de</strong> capacitación <strong>la</strong>boral esta fuertem<strong>en</strong>te re<strong>la</strong>cionada con el <strong>de</strong>lito <strong>de</strong><br />
robo y hurto <strong>en</strong> jóv<strong>en</strong>es m<strong>en</strong>ores a 29 años.<br />
• Un jov<strong>en</strong> <strong>de</strong> edad <strong>en</strong>tre 20 y 29 años, sin capacitación <strong>la</strong>boral ni trabajo <strong>de</strong><br />
tiempo <strong>com</strong>pleto, corre mucho riesgo <strong>de</strong> que sea puesto preso por <strong>de</strong>linquir<br />
contra <strong>la</strong> propiedad.<br />
• En g<strong>en</strong>eral, qui<strong>en</strong>es <strong>com</strong>et<strong>en</strong> <strong>de</strong>litos contra <strong>la</strong> integridad sexual y el honor<br />
(vio<strong>la</strong>ción), son personas casadas, mayor a 32 años, con trabajo <strong>de</strong> tiempo<br />
p<strong>ar</strong>cial o <strong>com</strong>pleto y que pose<strong>en</strong> un oficio o profesión.<br />
• Qui<strong>en</strong>es son procesados por infracción a ley Nº 23.737 (estupefaci<strong>en</strong>tes), son <strong>en</strong><br />
su mayoría personas con algún tipo <strong>de</strong> trabajo y capacitación <strong>la</strong>boral.<br />
Patricio Gutiérrez Rüegg Solución
5. CONCLUSIONES Y REFLEXIONES<br />
5.1 CONCLUSIONES DEL PROYECTO<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
El pres<strong>en</strong>te proyecto ha <strong>de</strong>mostrado <strong>la</strong> factibilidad y valor agregado al aplic<strong>ar</strong> sistemas<br />
intelig<strong>en</strong>tes <strong>de</strong> procesami<strong>en</strong>to <strong>de</strong> información, <strong>com</strong>o <strong>la</strong> minería <strong>de</strong> datos, a <strong>la</strong><br />
información criminal <strong>en</strong> Arg<strong>en</strong>tina. En p<strong>ar</strong>ticu<strong>la</strong>r, se <strong>de</strong>stacan los resultados obt<strong>en</strong>idos<br />
al utiliz<strong>ar</strong> métodos <strong>de</strong> explotación <strong>de</strong> información <strong>en</strong> pob<strong>la</strong>ciones c<strong>ar</strong>ce<strong>la</strong>rias con el fin<br />
<strong>de</strong> extraer conocimi<strong>en</strong>to <strong>de</strong> los datos.<br />
Queda <strong>de</strong>mostrado que <strong>la</strong> minería <strong>de</strong> datos es una herrami<strong>en</strong>ta muy pot<strong>en</strong>te que permite<br />
explor<strong>ar</strong> gran<strong>de</strong>s bases <strong>de</strong> datos <strong>de</strong> manera rápida y efici<strong>en</strong>te, sin necesidad <strong>de</strong> ser un<br />
experto <strong>en</strong> el tema a investig<strong>ar</strong>. En mi caso p<strong>ar</strong>ticu<strong>la</strong>r, sin <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to ni experi<strong>en</strong>cia<br />
alguna <strong>en</strong> <strong>la</strong>s técnicas utilizadas, sumado al <strong>de</strong>sconocimi<strong>en</strong>to <strong>de</strong>l tema <strong>en</strong>c<strong>ar</strong>ado, me<br />
permitió <strong>com</strong>pr<strong>en</strong><strong>de</strong>r cuales son los principales motivos que llevan a una persona a<br />
<strong>de</strong>linquir y así logr<strong>ar</strong> p<strong>en</strong>s<strong>ar</strong> alternativas p<strong>ar</strong>a <strong>la</strong> prev<strong>en</strong>ción <strong>de</strong> dichos hechos <strong>de</strong>lictivos.<br />
Lógicam<strong>en</strong>te, previo a <strong>la</strong> aplicación <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos, se tuvo que realiz<strong>ar</strong> una<br />
fuerte investigación sobre estadísticas vincu<strong>la</strong>das al crim<strong>en</strong>, al servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io y a<br />
los procesos p<strong>en</strong>ales <strong>en</strong> Arg<strong>en</strong>tina. Esto fue el punto <strong>de</strong> p<strong>ar</strong>tida <strong>de</strong>l proyecto, el cual<br />
basa su factibilidad <strong>en</strong> los sigui<strong>en</strong>tes puntos:<br />
• Existe muchísima información que no esta si<strong>en</strong>do aprovechada p<strong>ar</strong>a <strong>la</strong><br />
extracción <strong>de</strong> conocimi<strong>en</strong>to útil (patrones, <strong>com</strong>portami<strong>en</strong>tos, anomalías, etc.) <strong>en</strong><br />
toda su dim<strong>en</strong>sión.<br />
• Exist<strong>en</strong> programas <strong>de</strong> minería <strong>de</strong> datos <strong>de</strong> libre uso, re<strong>la</strong>tivam<strong>en</strong>te fáciles <strong>de</strong><br />
apr<strong>en</strong><strong>de</strong>r y utiliz<strong>ar</strong>.<br />
• No es neces<strong>ar</strong>io ser un experto ni <strong>en</strong> temas <strong>de</strong> sistemas intelig<strong>en</strong>tes ni <strong>en</strong> el tema<br />
a explor<strong>ar</strong>.<br />
• Sin emb<strong>ar</strong>go, es condición neces<strong>ar</strong>ia cont<strong>ar</strong> con <strong>la</strong> experi<strong>en</strong>cia <strong>de</strong> especialistas<br />
<strong>en</strong> <strong>la</strong> temática a analiz<strong>ar</strong> que vali<strong>de</strong>n <strong>la</strong>s conclusiones extraídas <strong>de</strong> los mo<strong>de</strong>los<br />
<strong>de</strong> minería <strong>de</strong> datos.<br />
Se <strong>de</strong>staca <strong>la</strong> p<strong>ar</strong>ticipación <strong>de</strong> especialistas (fiscal, juez y abogados) <strong>en</strong> el tema que<br />
permitieron ampli<strong>ar</strong> el conocimi<strong>en</strong>to sobre los <strong>de</strong>lincu<strong>en</strong>tes y sus <strong>com</strong>portami<strong>en</strong>tos. Sin<br />
<strong>la</strong> ayuda <strong>de</strong> estos, junto con sus opiniones y soporte, hubiera sido muy difícil, o hasta<br />
imposible, logr<strong>ar</strong> capt<strong>ar</strong> <strong>de</strong>talles p<strong>ar</strong>a los cuales un Ing<strong>en</strong>iero Industrial no está<br />
prep<strong>ar</strong>ado.<br />
Los resultados experim<strong>en</strong>tales logr<strong>ar</strong>on obt<strong>en</strong>er 4 grupos <strong>de</strong> presos con distintas<br />
c<strong>ar</strong>acterísticas y conductas permiti<strong>en</strong>do valid<strong>ar</strong> conocimi<strong>en</strong>tos preexist<strong>en</strong>tes, pero esta<br />
Conclusiones y Reflexiones Patricio Gutiérrez Rüegg 99
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
vez, con una justificación apoyado por los datos. A su vez, mediante <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong><br />
c<strong>la</strong>sificación, se logró c<strong>ar</strong>acteriz<strong>ar</strong> a los presos <strong>en</strong> base a sus atributos más relevantes. Es<br />
importante <strong>de</strong>stac<strong>ar</strong>, que a difer<strong>en</strong>cia <strong>de</strong> <strong>la</strong>s interpretaciones subjetivas <strong>en</strong> que pue<strong>de</strong>n<br />
incurrir <strong>la</strong>s personas, <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong> c<strong>la</strong>sificación son evi<strong>de</strong>nciadas con los registros<br />
almac<strong>en</strong>ados <strong>en</strong> <strong>la</strong> base <strong>de</strong> datos<br />
5.2 REFLEXIONES<br />
Des<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>la</strong> Ing<strong>en</strong>iería Industrial podría verse al sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />
<strong>com</strong>o una especie <strong>de</strong> proceso productivo. En este caso, el flujo <strong>en</strong>trante al sistema serían<br />
los presos que ingresan a los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios p<strong>ar</strong>a ser “reprocesados”,<br />
luego <strong>de</strong> que se les <strong>de</strong>tect<strong>ar</strong>a alguna fal<strong>la</strong> (haber <strong>com</strong>etido el <strong>de</strong>lito). C<strong>la</strong>ram<strong>en</strong>te, <strong>com</strong>o<br />
a todo “producto” que necesita ser reprocesado, es neces<strong>ar</strong>io que se cu<strong>en</strong>t<strong>en</strong> con <strong>la</strong>s<br />
herrami<strong>en</strong>tas a<strong>de</strong>cuadas p<strong>ar</strong>a llev<strong>ar</strong> a cabo dicha t<strong>ar</strong>ea, y que cada uno <strong>de</strong> los pasos se<br />
cump<strong>la</strong> a <strong>la</strong> perfección p<strong>ar</strong>a que no se vuelva a incurrir <strong>en</strong> el mismo error o fal<strong>la</strong>.<br />
Lam<strong>en</strong>tablem<strong>en</strong>te, aquí no estamos hab<strong>la</strong>ndo <strong>de</strong> bi<strong>en</strong>es materiales. Estamos fr<strong>en</strong>te a<br />
seres humanos, que por diversos motivos <strong>de</strong>linquieron y necesitan <strong>de</strong> ayuda <strong>de</strong>l Estado<br />
p<strong>ar</strong>a po<strong>de</strong>r readapt<strong>ar</strong>se y reubic<strong>ar</strong>se <strong>en</strong> una sociedad <strong>de</strong> <strong>la</strong> cual fueron ap<strong>ar</strong>tados. El<br />
sigui<strong>en</strong>te párrafo, sintetiza brevem<strong>en</strong>te lo que está ocurri<strong>en</strong>do hoy <strong>en</strong> día con <strong>la</strong>s<br />
personas que se <strong>en</strong>cu<strong>en</strong>tran privadas <strong>de</strong> su libertad y ayuda a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r p<strong>ar</strong>te <strong>de</strong> <strong>la</strong><br />
problemática exist<strong>en</strong>te:<br />
“Se hab<strong>la</strong> <strong>de</strong> readapt<strong>ar</strong> socialm<strong>en</strong>te a los con<strong>de</strong>nados, se <strong>de</strong>bate sobre <strong>la</strong> mejor forma<br />
que <strong>de</strong>b<strong>en</strong> asumir los l<strong>la</strong>mados patronatos <strong>de</strong>liberados, cuando previam<strong>en</strong>te se han<br />
<strong>de</strong>gradado <strong>en</strong> <strong>la</strong> cárcel <strong>de</strong> procesados a tantos y tantos seres que son los mismos que<br />
ahora se quier<strong>en</strong> readapt<strong>ar</strong>.¿Por que <strong>en</strong>tonces no <strong>com</strong><strong>en</strong>z<strong>ar</strong> por don<strong>de</strong> correspon<strong>de</strong>: no<br />
<strong>de</strong>spersonalizando moral, psíquica y físicam<strong>en</strong>te al <strong>en</strong>causado y, sobre todo, logrando<br />
que el hombre que ha caído no se contamine ante sus propios ojos, porque eso significa<br />
ll<strong>en</strong><strong>ar</strong>lo <strong>de</strong> res<strong>en</strong>timi<strong>en</strong>to, por una p<strong>ar</strong>te, y, por <strong>la</strong> otra, d<strong>ar</strong> razón a su rebelión?”<br />
[Neuman & Irurzun, 1994].<br />
Como se pudo observ<strong>ar</strong> a lo <strong>la</strong>rgo <strong>de</strong>l proyecto, <strong>la</strong> falta <strong>de</strong> instrucción <strong>en</strong> los <strong>de</strong>t<strong>en</strong>idos,<br />
tanto educativa <strong>com</strong>o <strong>la</strong>boral, es a<strong>la</strong>rmante. La educación <strong>de</strong>be ser integral y ll<strong>en</strong><strong>ar</strong> los 3<br />
ciclos, <strong>en</strong> el caso que correspondiere, p<strong>ar</strong>a <strong>ar</strong>m<strong>ar</strong> al hombre preso con un bagaje <strong>de</strong><br />
conocimi<strong>en</strong>tos que le permitan obt<strong>en</strong>er mejores posibilida<strong>de</strong>s cuando recobre su<br />
libertad. Hoy <strong>en</strong> día esto no se está cumpli<strong>en</strong>do, es muy bajo, por no <strong>de</strong>cir nulo, el<br />
volum<strong>en</strong> <strong>de</strong> presos que p<strong>ar</strong>ticipan <strong>en</strong> activida<strong>de</strong>s educativas y <strong>la</strong>borales. Pero no solo<br />
hay que prest<strong>ar</strong>le at<strong>en</strong>ción a <strong>la</strong> educación <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos, sino que también hay que<br />
hacer hincapié <strong>en</strong> aquel<strong>la</strong>s personas que no pose<strong>en</strong> instrucción y que <strong>en</strong> muchos casos,<br />
100<br />
Patricio Gutiérrez Rüegg Conclusiones y Reflexiones
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
junto con <strong>la</strong> falta <strong>de</strong> posibilida<strong>de</strong>s <strong>la</strong>borales, terminan incurri<strong>en</strong>do <strong>en</strong> algún <strong>de</strong>lito contra<br />
<strong>la</strong> propiedad.<br />
Es hora que <strong>la</strong> dirig<strong>en</strong>cia política modifique su postura fr<strong>en</strong>te a estos aspectos. La<br />
educación nunca fue un tema <strong>de</strong>terminante p<strong>ar</strong>a gan<strong>ar</strong> <strong>la</strong>s elecciones, ni <strong>en</strong> el c<strong>en</strong>tro, ni<br />
<strong>en</strong> el sur <strong>de</strong> América. Las escue<strong>la</strong>s r<strong>ar</strong>a vez son importantes <strong>en</strong> <strong>la</strong>s elecciones<br />
nacionales, provinciales o incluso <strong>en</strong> <strong>la</strong>s municipales.<br />
Otro importante punto a t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta es el costo que un preso ti<strong>en</strong>e p<strong>ar</strong>a <strong>la</strong> sociedad.<br />
No solo el Estado gasta mucho dinero por cada preso, sino que se está perdi<strong>en</strong>do <strong>la</strong><br />
oportunidad <strong>de</strong> utiliz<strong>ar</strong> a esas personas <strong>com</strong>o mano <strong>de</strong> obra productiva. Toda esa gran<br />
cantidad <strong>de</strong> dinero podría <strong>de</strong>stin<strong>ar</strong>se a p<strong>la</strong>nes <strong>de</strong> capacitación, becas p<strong>ar</strong>a estudio,<br />
programas sociales-educativos, y así, <strong>en</strong> un sin fin <strong>de</strong> aplicaciones. Si no se logra <strong>la</strong><br />
reinstrucción y capacitación <strong>de</strong> estos <strong>de</strong>lincu<strong>en</strong>tes, <strong>la</strong>s probabilida<strong>de</strong>s <strong>de</strong> que vuelvan a<br />
<strong>de</strong>linquir una vez que recobr<strong>en</strong> <strong>la</strong> libertad es muy alta. Así lo muestra el índice <strong>de</strong><br />
reinci<strong>de</strong>ncia, el cual hab<strong>la</strong> <strong>de</strong> que un 40% <strong>de</strong> los presos vuelve a reingres<strong>ar</strong> a los<br />
establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios al cabo <strong>de</strong> 6 años.<br />
Si lug<strong>ar</strong> a duda, <strong>la</strong> inseguridad pasó a ser un tema que preocupa <strong>en</strong> <strong>la</strong> actualidad a <strong>la</strong><br />
mayoría <strong>de</strong> <strong>la</strong>s personas. Hay que trat<strong>ar</strong> <strong>de</strong> afront<strong>ar</strong> el problema <strong>de</strong> una manera dual. No<br />
basta con <strong>la</strong> publicación <strong>de</strong> estadísticas sin tratami<strong>en</strong>to alguno, tampoco alcanz<strong>ar</strong>ía con<br />
resolver el “caos” p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io, sino que habría que <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r nuevas y mejores<br />
políticas criminales prev<strong>en</strong>tivas. Una ayuda <strong>en</strong> tal s<strong>en</strong>tido es mediante <strong>la</strong> creación <strong>de</strong><br />
sistemas <strong>de</strong> información <strong>de</strong> mayor calidad <strong>com</strong>o herrami<strong>en</strong>ta fundam<strong>en</strong>tal p<strong>ar</strong>a <strong>la</strong> toma<br />
<strong>de</strong> esas <strong>de</strong>cisiones. Cuanto más acertada sea <strong>la</strong> información recolectada, mejores serán<br />
<strong>la</strong>s <strong>de</strong>cisiones tomadas y habrá más probabilidad <strong>de</strong> reducir el <strong>de</strong>lito. Aún así, es<br />
neces<strong>ar</strong>io que esto sea a<strong>com</strong>pañado por políticas <strong>de</strong> estado efectivas y dura<strong>de</strong>ras <strong>en</strong> el<br />
tiempo.<br />
Es importante recalc<strong>ar</strong>, que no se trata <strong>de</strong> <strong>de</strong>f<strong>en</strong><strong>de</strong>r, mediante este proyecto y<br />
reflexiones, a <strong>la</strong>s personas que <strong>com</strong>etieron un <strong>de</strong>lito. Sino, más bi<strong>en</strong>, se trata d<strong>ar</strong>le una<br />
mirada <strong>de</strong>s<strong>de</strong> otro punto <strong>de</strong> vista. El punto <strong>de</strong> vista que pue<strong>de</strong> t<strong>en</strong>er un Ing<strong>en</strong>iero<br />
Industrial.<br />
Conclusiones y Reflexiones Patricio Gutiérrez Rüegg 101
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
102<br />
Patricio Gutiérrez Rüegg Conclusiones y Reflexiones
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
6. FUTURAS LÍNEAS DE INVESTIGACIÓN<br />
Se cree muy importante y <strong>de</strong> gran valor agregado continu<strong>ar</strong> con <strong>la</strong> aplicación <strong>de</strong> minería<br />
<strong>de</strong> datos <strong>com</strong>o técnica <strong>de</strong> soporte p<strong>ar</strong>a <strong>la</strong> toma <strong>de</strong> <strong>de</strong>cisiones <strong>en</strong> lo que respecta a<br />
políticas criminales y <strong>de</strong>l tipo social.<br />
Si bi<strong>en</strong> durante el pres<strong>en</strong>te proyecto se investigó el <strong>com</strong>portami<strong>en</strong>to <strong>de</strong> los imputados <strong>en</strong><br />
difer<strong>en</strong>tes <strong>de</strong>litos, se hizo especial foco <strong>en</strong> <strong>la</strong>s conductas y c<strong>ar</strong>acterísticas asociadas al<br />
preso previo al ingreso al establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Sería valioso po<strong>de</strong>r continu<strong>ar</strong><br />
investigando a los <strong>de</strong>t<strong>en</strong>idos, pero <strong>de</strong>s<strong>de</strong> <strong>la</strong> visión intramuros, analizando sus<br />
<strong>de</strong>s<strong>en</strong>volvimi<strong>en</strong>tos <strong>de</strong>ntro <strong>de</strong>l p<strong>en</strong>al o establecimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción. P<strong>ar</strong>a ello es<br />
neces<strong>ar</strong>io hacer uso <strong>de</strong> una gran cantidad <strong>de</strong> atributos que fueron <strong>de</strong>sc<strong>ar</strong>tados por<br />
pres<strong>en</strong>t<strong>ar</strong> valores o datos faltantes. Mejorando <strong>la</strong> metodología <strong>de</strong> recolección <strong>de</strong> los<br />
datos se logr<strong>ar</strong>ía t<strong>en</strong>er acceso a los valores faltantes, y <strong>de</strong> esta manera, se podrían<br />
evalu<strong>ar</strong> <strong>la</strong> totalidad <strong>de</strong> los registros pudi<strong>en</strong>do así obt<strong>en</strong>er nuevos grupos y reg<strong>la</strong>s <strong>de</strong><br />
c<strong>la</strong>sificación mediante <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos.<br />
Sigui<strong>en</strong>do con <strong>la</strong> información neces<strong>ar</strong>ia p<strong>ar</strong>a lleg<strong>ar</strong> a mejores conclusiones, sería muy<br />
valioso po<strong>de</strong>r lleg<strong>ar</strong> a t<strong>en</strong>er acceso a aquel<strong>la</strong> información famili<strong>ar</strong> relevante <strong>de</strong> los<br />
<strong>de</strong>t<strong>en</strong>idos. Existe una gran re<strong>la</strong>ción <strong>en</strong>tre <strong>la</strong>s acciones <strong>de</strong> <strong>la</strong> gran mayoría <strong>de</strong> los presos y<br />
sus pasados famili<strong>ar</strong>es y culturales.<br />
Finalm<strong>en</strong>te, se propone expandir el uso <strong>de</strong> esta técnica, aplicándo<strong>la</strong> <strong>en</strong> <strong>la</strong>s distintas<br />
bases <strong>de</strong> datos <strong>de</strong> los <strong>en</strong>tes g<strong>en</strong>eradores <strong>de</strong> información. Sería <strong>de</strong> gran utilidad a los fines<br />
<strong>de</strong> <strong>en</strong>contr<strong>ar</strong> re<strong>la</strong>ciones <strong>en</strong>tre distintos hechos, logr<strong>ar</strong> vincu<strong>la</strong>r <strong>la</strong> base <strong>de</strong>l SNEEP con <strong>la</strong><br />
información prov<strong>en</strong>i<strong>en</strong>te <strong>de</strong>l SNIC y su Sistema <strong>de</strong> Alerta Temprana (SAT). De esta<br />
manera, se logr<strong>ar</strong>ía t<strong>en</strong>er toda <strong>la</strong> información refer<strong>en</strong>te a un hecho <strong>de</strong>lictivo consolidada<br />
<strong>en</strong> un solo sistema <strong>de</strong> información.<br />
Futuras Líneas <strong>de</strong> Investigación Patricio Gutiérrez Rüegg 103
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
104<br />
Patricio Gutiérrez Rüegg Futuras Líneas <strong>de</strong> Investigación
7. APORTES REALIZADOS<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
El pres<strong>en</strong>te proyecto realizó su aporte <strong>en</strong> el WICC 2008-X Workshop <strong>de</strong> Investigadores<br />
<strong>en</strong> Ci<strong>en</strong>cias <strong>de</strong> <strong>la</strong> Computación, bajo <strong>la</strong> supervisión <strong>de</strong> los profesores M. Ing. Pao<strong>la</strong><br />
Britos y Dr. Ramón G<strong>ar</strong>cía M<strong>ar</strong>tínez. Dicho certam<strong>en</strong> es organizado por <strong>la</strong> Facultad <strong>de</strong><br />
Ing<strong>en</strong>iería <strong>de</strong> <strong>la</strong> Universidad Nacional <strong>de</strong> La Pampa, que se llev<strong>ar</strong>á a cabo los días 5 y 6<br />
<strong>de</strong> Mayo <strong>de</strong> 2008 <strong>en</strong> <strong>la</strong> ciudad <strong>de</strong> G<strong>en</strong>eral Pico, La Pampa.<br />
Aportes Realizados Patricio Gutiérrez Rüegg 105
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
106<br />
Patricio Gutiérrez Rüegg Aportes Realizados
8. REFERENCIAS<br />
Ale, J., 2005. Análisis <strong>de</strong> Clusters.<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Aleonada Mon, H., 2004. Una Sorda Batal<strong>la</strong> tras <strong>la</strong>s rejas.<br />
http://www.<strong>la</strong>nacion.<strong>com</strong>.<strong>ar</strong>/<strong>ar</strong>chivo/Nota.asp?nota_id=593630 .<br />
Di<strong>ar</strong>io La Nación. Bu<strong>en</strong>os Aires. Acceso Noviembre 2007.<br />
Beh<strong>ar</strong>, A.M. y Lucilli, P., 2003. Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os<br />
Aires. Terceras Jornadas <strong>de</strong> Jóv<strong>en</strong>es Investigadores. Instituto Gino Germani.<br />
http://www.iigg.fsoc.uba.<strong>ar</strong>/Jov<strong>en</strong>es_investigadores/3JornadasJov<strong>en</strong>es/Temp<strong>la</strong>te<br />
s/Eje%20Po<strong>de</strong>r%20y%20Dominacion/Beh<strong>ar</strong>%20-%20Po<strong>de</strong>r.pdf<br />
Acceso Diciembre 2007.<br />
Britos, P., Hossian, A., G<strong>ar</strong>cía-M<strong>ar</strong>tínez, R. y Sierra, E., 2005. Minería <strong>de</strong> Datos<br />
Basada <strong>en</strong> Sistemas Intelig<strong>en</strong>tes. Editorial Nueva Librería. Bu<strong>en</strong>os Aires. ISBN<br />
987-1104-30-8.<br />
C<strong>ar</strong>tag<strong>en</strong>ova, S. G., 2005. Detección Automática <strong>de</strong> Reg<strong>la</strong>s <strong>de</strong> Asociación. Trabajo<br />
Final <strong>de</strong> Especialidad <strong>en</strong> Ing<strong>en</strong>iería <strong>en</strong> sistemas Expertos, Instituto Tecnológico<br />
<strong>de</strong> Bu<strong>en</strong>os Aires (ITBA).<br />
C<strong>en</strong>tro <strong>de</strong> Estudios Legales y Sociales (CELS), 2005. Co<strong>la</strong>pso <strong>de</strong>l Sistema C<strong>ar</strong>ce<strong>la</strong>rio.<br />
Editorial Siglo Veintiuno Editores. Bu<strong>en</strong>os Aires. ISBN: 987-1220-35-9.<br />
Ch<strong>en</strong>, H., Chung, W., Xu, J., Wang, G., Qin, Y., Chau, M., 2004. Crime Data Mining:<br />
A G<strong>en</strong>eral Framework and Some Examples. IEEE Computer Society, vol. 37,<br />
no.4, pp. 50-56.<br />
Ch<strong>en</strong>, H. y Han J., 1996. Data Mining: An overview from database perspective. IEEE<br />
Transactions on Knowledge and Data Engineering.<br />
COPLINK, 2007. Artificial Intellig<strong>en</strong>ce Lab. Managem<strong>en</strong>t Information Systems.<br />
Universidad Arizona. http://ai.bpa.<strong>ar</strong>izona.edu . Acceso Noviembre 2007.<br />
Corcoran, J. J., Wilson I. D., W<strong>ar</strong>e J. A. 2003. Predicting <strong>de</strong> geo-temporal v<strong>ar</strong>iations of<br />
crime and disor<strong>de</strong>r. International Journal of Forecasting.<br />
CRISP-DM, 2007. CRISP 1.0 Process and User Gui<strong>de</strong>. Cross Industry Stand<strong>ar</strong>d<br />
Process for Data Mining. http://www.crisp-dm.org/CRISPWP-0800.pdf<br />
Acceso Enero 2008.<br />
D<strong>ar</strong>oqui, A., 2008. “Trabajo y educación son una especie <strong>de</strong> ficción <strong>de</strong>ntro <strong>de</strong> <strong>la</strong><br />
cárcel”. http://www.c<strong>la</strong>rin.<strong>com</strong>/suplem<strong>en</strong>tos/zona/2008/02/24/z-03615.htm<br />
Di<strong>ar</strong>io C<strong>la</strong>rín. Bu<strong>en</strong>os Aires. Acceso Enero 2008.<br />
Dirección Nacional <strong>de</strong> Política Criminal. http://wwwpolcrim.jus.gov.<strong>ar</strong>/. Acceso<br />
Octubre 2007.<br />
Refer<strong>en</strong>cias Patricio Gutiérrez Rüegg 107
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Fayyad, U. M. y Uthurusamy R., 2002. Evolving Data Mining into Solutions for<br />
Insights. ACM. Páginas 28-31.<br />
Fayyad, U.M., Piatetsky-Shapiro G., Smyth, P., Uthurusamy, R., 1996. Advances in<br />
Knowledge and data mining. Cambridge (Massachussets): AAAI/MIT Press.<br />
Frawley W., Piatetsky-Shapiro G., Matheus C. Knowledge Discovery in Databases: An<br />
Overview. AI Magazine: pp. 213-228. ISSN 0738-4602.<br />
Han, J. y Kamber, M., 2001. Data Mining: Concepts and techniques. Morgan<br />
Kauffmann Publishers. Edición 2001.<br />
H<strong>ar</strong>ris, S., 2005. Army Project illustrates promise, short<strong>com</strong>ings of data mining.<br />
National Journal.<br />
http://www.govexec.<strong>com</strong>/story_page_pf.cfm?<strong>ar</strong>ticleid=32944&printerfri<strong>en</strong>dlyve<br />
rs=1 .Acceso Octubre 2007.<br />
H<strong>ar</strong>tigan, J.A, 1975. Clustering Algorithms. New York 1975.<br />
Hernán<strong>de</strong>z Orallo, J., Ramírez Quintana, M.J., Ferri Ramírez, C., 2004. Introducción a<br />
<strong>la</strong> Minería <strong>de</strong> Datos. Editorial Pe<strong>ar</strong>son. ISBN 84-205-40919.<br />
Ig<strong>ar</strong>zábal <strong>de</strong> Nistal, M.A., 2003. El Mapa <strong>de</strong>l Delito p<strong>ar</strong>a <strong>la</strong> Ciudad Autónoma <strong>de</strong><br />
Bu<strong>en</strong>os Aires. C<strong>en</strong>tro <strong>de</strong> Información Metropolitana. Facultad <strong>de</strong> Arquitectura,<br />
Diseño y Urbanismo. UBA. República Arg<strong>en</strong>tina.<br />
http://www.cexeci.org/IX%20CONFIBSIG/Comunicaciones/turismo,%20estudi<br />
os%20sociales%20y%20geom<strong>ar</strong>keting/Ig<strong>ar</strong>zabal%20<strong>de</strong>%20Nistal,%20A.pdf<br />
Acceso Diciembre 2007.<br />
ICPS, International C<strong>en</strong>tre for Prison Studies (ICPS), 2007.<br />
http://www.umds.ac.uk/<strong>de</strong>psta/rel/icps/home.html . Acceso Noviembre 2007.<br />
Kant<strong>ar</strong>dzic, M., 2003. Data Mining: Concepts, Mo<strong>de</strong>ls, Methods, and Algorithms. John<br />
Wiley & Sons. ISBN 0471228524.<br />
Lance, P., 2007. Def<strong>en</strong>se Intellig<strong>en</strong>ce Analysis C<strong>en</strong>ter (DIAC).<br />
http://www.peter<strong>la</strong>nce.<strong>com</strong>/Peter%20Lance/3.21.00%20Link%20Ch<strong>ar</strong>t.html<br />
Acceso Diciembre 2007.<br />
La<strong>la</strong>urette, S., 2008. Creció 50% el abuso sexual <strong>de</strong> m<strong>en</strong>ores.<br />
http://www.<strong>la</strong>nacion.<strong>com</strong>.<strong>ar</strong>/<strong>ar</strong>chivo/nota.asp?nota_id=990034. Acceso M<strong>ar</strong>zo<br />
2008.<br />
Lopez Takeyas, B, 2005. Algoritmo C4.5. Instituto Tecnológico <strong>de</strong> Nuevo L<strong>ar</strong>edo.<br />
http://www.itnuevo<strong>la</strong>redo.edu.mx/takeyas/Apuntes/Intelig<strong>en</strong>cia%20Artificial/Ap<br />
untes/t<strong>ar</strong>eas_alumnos/C4.5/C4.5(2005-II-B).pdf . Acceso M<strong>ar</strong>zo 2008.<br />
McCue, C., 2005. Data Mining and Predictive Analytics: Battlespace Aw<strong>ar</strong><strong>en</strong>ess for the<br />
W<strong>ar</strong> of Terrorism. Def<strong>en</strong>se Intellig<strong>en</strong>ce Journal. Páginas 47-63.<br />
108<br />
Patricio Gutiérrez Rüegg Refer<strong>en</strong>cias
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Molina Felix, L. C.,2002. Data Mining: Torturando a los datos hasta que confies<strong>en</strong>.<br />
Universidad Abierta <strong>de</strong> Cataluña.<br />
http://www.uoc.edu/web/esp/<strong>ar</strong>t/uoc/molina1102/molina1102.html<br />
Acceso Diciembre 2007<br />
Molt<strong>en</strong>i, S., 2007. Detección <strong>de</strong> Patrones <strong>de</strong> Producción Educativa Basada <strong>en</strong> Minería<br />
<strong>de</strong> Datos. Tesis <strong>de</strong> Grado <strong>en</strong> Ing<strong>en</strong>iería Industrial. Instituto Tecnológico <strong>de</strong><br />
Bu<strong>en</strong>os Aires. http://www.itba.edu.<strong>ar</strong>/capis/webcapis/tesisgrado/molt<strong>en</strong>itesis<strong>de</strong>grado<strong>en</strong>ing<strong>en</strong>ieria.pdf<br />
Acceso Noviembre 2007.<br />
Moody, J. y D<strong>ar</strong>k<strong>en</strong>, C., 1989. Fast Le<strong>ar</strong>ning in networks of locally tuned processing<br />
units. Neural Computation. 1989.<br />
Morris, D. y Rosales, L., 2007. Po<strong>de</strong>r político, maestros y policías. Revista Noticias.<br />
13 <strong>de</strong> Octubre <strong>de</strong>l 2007. Páginas 74-80.<br />
Neuman E. y Irurzun V., 1994. La Sociedad C<strong>ar</strong>ce<strong>la</strong>ria. Editorial Despalma.<br />
Bu<strong>en</strong>os Aires 1994.<br />
Ochoa, M. A. 2004. Herrami<strong>en</strong>tas Intelig<strong>en</strong>tes p<strong>ar</strong>a <strong>la</strong> Explotación <strong>de</strong> Información.<br />
Trabajo Final <strong>de</strong> Especialidad <strong>en</strong> Ing<strong>en</strong>iería <strong>en</strong> sistemas Expertos, Instituto<br />
Tecnológico <strong>de</strong> Bu<strong>en</strong>os Aires (ITBA).<br />
Oficina <strong>de</strong>l Inspector G<strong>en</strong>eral <strong>de</strong>l Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong> Justicia <strong>de</strong> los EE.UU., 2006. Able<br />
Danger Investigation Report. http://www.milnet.<strong>com</strong>/<strong>ar</strong>chives/DOD-IG-Able-<br />
Danger.pdf . Acceso Diciembre 2007.<br />
O<strong>la</strong>eta, H., 2006. Estadísticas Criminales y Sistemas <strong>de</strong> Información. Instituto<br />
Latinoamericano <strong>de</strong> Seguridad y Democracia (Ilsed).<br />
http://www.ilsed.org/in<strong>de</strong>x.php?option=<strong>com</strong>_docman&task=doc_download&gid<br />
=121. Acceso Diciembre 2007.<br />
Perversi, I., 2007. Aplicación <strong>de</strong> Minería <strong>de</strong> Datos p<strong>ar</strong>a <strong>la</strong> Exploración y Detección <strong>de</strong><br />
Patrones Delictivos <strong>en</strong> Arg<strong>en</strong>tina. Tesis <strong>de</strong> Grado <strong>en</strong> Ing<strong>en</strong>iería Industrial.<br />
Instituto Tecnológico <strong>de</strong> Bu<strong>en</strong>os Aires.<br />
http://www.itba.edu.<strong>ar</strong>/capis/webcapis/tesisgrado/PERVERSItesis<strong>de</strong>grado<strong>en</strong>ing<strong>en</strong>ieria.pdf<br />
Acceso Noviembre 2007.<br />
Petrone, D., 2005. Cárceles Sanas y Limpias: hacia un nuevo régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io.<br />
Unidos por <strong>la</strong> Justicia. Bu<strong>en</strong>os Aires. ISBN: 987-21857-0-0.<br />
Prieto, C., 2005. La situación P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia <strong>en</strong> Arg<strong>en</strong>tina. Foro <strong>de</strong> Profesionales<br />
Latinoamericanos <strong>de</strong> Seguridad.<br />
http://www.foro<strong>de</strong>seguridad.<strong>com</strong>/<strong>ar</strong>tic/discipl/disc_4062.htm .Acceso Octubre<br />
2007.<br />
Quin<strong>la</strong>n, J., 1993. Programs for Machine Le<strong>ar</strong>ning. Morgan Kaufmann Publishers. .<br />
Edición 1993.<br />
Refer<strong>en</strong>cias Patricio Gutiérrez Rüegg 109
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Serv<strong>en</strong>te, M.; G<strong>ar</strong>cía-M<strong>ar</strong>tínez, R., 2002. Algoritmos TDIDT Aplicados a <strong>la</strong> Minería<br />
Intelig<strong>en</strong>te. http://www.fi.uba.<strong>ar</strong>/<strong>la</strong>boratorios/lsi/R-ITBA-26-datamining.pdf<br />
Acceso Enero 2008.<br />
Sozzo,M., 2000. Pintando a traves <strong>de</strong> numeros. Fu<strong>en</strong>tes Estadísticas <strong>de</strong> Conocimi<strong>en</strong>to y<br />
Gobierno Democrático <strong>de</strong> <strong>la</strong> Cuestión Criminal <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina. Instituto<br />
Latinoamericano <strong>de</strong> Seguridad y Democracia (Ilsed).<br />
http://www.ilsed.org/in<strong>de</strong>x.php?option=<strong>com</strong>_docman&task=doc_view&gid=159<br />
&Itemid=44 Acceso Diciembre 2007.<br />
The<strong>ar</strong>ling, K., 2007. An Overview of Data Mining Techniques.<br />
http://www.the<strong>ar</strong>ling.<strong>com</strong>/text/dmtechniques/dmtechniques.htm. Acceso<br />
Enero2008.<br />
Val<strong>en</strong>ga, F., Perversi, I., Fernán<strong>de</strong>z, E., Merlino, H., Rodríguez, D., Britos, P., G<strong>ar</strong>cía-<br />
M<strong>ar</strong>tínez, R, 2007. La Estadística Criminal y el Aporte <strong>de</strong> <strong>la</strong> Minería <strong>de</strong> Datos.<br />
En Kaminsky, G., Kosovsky,D., Kessler, G. El Delito <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina Postcrisis.<br />
Pág. 11-24. Editado por <strong>la</strong> Friedrich Ebert Stiftung<br />
Weiss, S. M. y Indurkhya, N., 1998. Predictive Data Mining. A practical Gui<strong>de</strong>.<br />
Morgan Kauffmann Publishers. San Francisco 1998.<br />
110<br />
Patricio Gutiérrez Rüegg Refer<strong>en</strong>cias
9. ANEXOS<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 1<br />
INSTRUMENTO DE RECOLECCIÓN DE DATOS DEL SNIC<br />
Figura 9.1. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNIC [DNPC, 2007].<br />
Anexo Patricio Gutiérrez Rüegg 111
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 2<br />
INSTRUMENTO DE RECOLECCIÓN DE DATOS PARA<br />
ESTABLECIMIENTOS DE EJECUCIÓN DE PENAS PRIVATIVAS DE<br />
LIBERTAD - SNEEP<br />
112<br />
Figura 9.2. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 2 - CONTINUACIÓN<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Figura 9.3. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />
Anexo Patricio Gutiérrez Rüegg 113
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 2- CONTINUACIÓN<br />
114<br />
Figura 9.4. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 2- CONTINUACIÓN<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Figura 9.5. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />
Anexo Patricio Gutiérrez Rüegg 115
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 3<br />
INSTRUMENTO SNEEP<br />
116<br />
Anexo<br />
Figura 9.6. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />
Patricio Gutiérrez Rüegg
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 3- CONTINUACIÓN<br />
CENSO PENITENCIARIO - CODIFICACIÓN DE VARIABLES<br />
(1) Nacionalidad<br />
1- Arg<strong>en</strong>tina<br />
2- Boliviana<br />
3- Brasileña<br />
4- Chil<strong>en</strong>a<br />
5- P<strong>ar</strong>aguaya<br />
6- Uruguaya<br />
7- Peruana<br />
8- Colombiana<br />
9- Ecuatoriana<br />
10- Españo<strong>la</strong><br />
11- Italiana<br />
12- Inglesa<br />
13- China<br />
14- Sudafricana<br />
15- Nigeriana<br />
16- Otras<br />
(2) Estado Civil<br />
1- Soltero<br />
2- Casado<br />
3- Viudo<br />
4- Sep<strong>ar</strong>ado o Divorciado<br />
5- Sep<strong>ar</strong>ado <strong>de</strong> Hecho<br />
6- Concubino<br />
(3) Nivel <strong>de</strong> Instrucción<br />
1- Ninguno<br />
2- Prim<strong>ar</strong>io In<strong>com</strong>pleto<br />
3- Prim<strong>ar</strong>io Completo<br />
4- Secund<strong>ar</strong>io In<strong>com</strong>pleto<br />
5- Secund<strong>ar</strong>io Completo<br />
6- Terci<strong>ar</strong>io In<strong>com</strong>pleto<br />
7- Terci<strong>ar</strong>io Completo<br />
8- Universit<strong>ar</strong>io<br />
In<strong>com</strong>pleto<br />
9- Universit<strong>ar</strong>io Completo<br />
10- EGB 1 In<strong>com</strong>pleto<br />
11- EGB 1 Completo<br />
12- EGB 2 In<strong>com</strong>pleto<br />
13- EGB 2 Completo<br />
14- EGB 3 In<strong>com</strong>pleto<br />
15- EGB 3 Completo<br />
16- Polimodal In<strong>com</strong>pleto<br />
17- Polimodal Completo<br />
(4) Situación <strong>la</strong>boral al<br />
mom<strong>en</strong>to <strong>de</strong>l ingreso<br />
1- Trabajador <strong>de</strong> tiempo<br />
<strong>com</strong>pleto<br />
2- Trabajador <strong>de</strong> tiempo<br />
p<strong>ar</strong>cial<br />
3- Desocupado<br />
(5) Capacitación Laboral<br />
al mom<strong>en</strong>to <strong>de</strong>l ingreso<br />
1- T<strong>en</strong>ía algún oficio<br />
2- T<strong>en</strong>ía alguna profesión<br />
3- No t<strong>en</strong>ía ni oficio, ni<br />
profesión<br />
(6) Lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia<br />
al mom<strong>en</strong>to <strong>de</strong>l ingreso<br />
1- Rural<br />
2- Urbano<br />
(7) Provincia <strong>de</strong><br />
resi<strong>de</strong>ncia al mom<strong>en</strong>to<br />
<strong>de</strong>l ingreso<br />
1- Bu<strong>en</strong>os Aires<br />
2- Catam<strong>ar</strong>ca<br />
3- Córdoba<br />
4- Corri<strong>en</strong>tes<br />
5- Chaco<br />
6- Chubut<br />
7- Entre Ríos<br />
8- Formosa<br />
9- Jujuy<br />
10- La Pampa<br />
11- La Rioja<br />
12- M<strong>en</strong>doza<br />
13- Misiones<br />
14- Neuquén<br />
15- Rio Negro<br />
16- Salta<br />
17- San Juan<br />
18- San Luis<br />
19- Santa Cruz<br />
20- Santa Fe<br />
21- Santiago <strong>de</strong>l Estero<br />
22- Tierra <strong>de</strong>l Fuego<br />
23- Tucumán<br />
24- Ciudad <strong>de</strong> Bu<strong>en</strong>os<br />
Aires<br />
(8) Jurisdicción Judicial<br />
1- Provincial - Bu<strong>en</strong>os<br />
Aires<br />
2- Provincial - Catam<strong>ar</strong>ca<br />
3- Provincial - Córdoba<br />
4- Provincial - Corri<strong>en</strong>tes<br />
5- Provincial – Chaco<br />
6- Provincial - Chubut<br />
7- Provincial - Entre Ríos<br />
8- Provincial – Formosa<br />
9- Provincial - Jujuy<br />
10- Provincial - La Pampa<br />
11- Provincial - La Rioja<br />
12- Provincial - M<strong>en</strong>doza<br />
13- Provincial - Misiones<br />
14- Provincial - Neuquén<br />
15- Provincial - Río Negro<br />
16- Provincial - Salta<br />
17- Provincial - San Juan<br />
18- Provincial - San Luís<br />
19- Provincial - Santa<br />
Cruz<br />
20- Provincial - Santa Fe<br />
21- Provincial - Santiago<br />
<strong>de</strong>l Estero<br />
22- Provincial - Tierra <strong>de</strong>l<br />
Fuego<br />
23- Provincial - Tucumán<br />
24- Nacional - Ciudad <strong>de</strong><br />
Bu<strong>en</strong>os Aires<br />
25- Fe<strong>de</strong>ral<br />
(9) Situación Legal<br />
1- Con<strong>de</strong>nado<br />
2- Procesado<br />
3- Contrav<strong>en</strong>tor<br />
4- Inimputable<br />
5- Otra<br />
(10) Establecimi<strong>en</strong>to <strong>de</strong><br />
Proce<strong>de</strong>ncia<br />
1- Ingreso Directo<br />
2- Derivación <strong>de</strong> otro<br />
Establecimi<strong>en</strong>to <strong>de</strong><br />
Ejecución P<strong>en</strong>al<br />
3- Derivación <strong>de</strong> una<br />
Institución Policial<br />
(alojados más <strong>de</strong> 4 días)<br />
4- Derivación <strong>de</strong> una<br />
Institución <strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong><br />
una fuerza <strong>de</strong> seguridad<br />
(Prefectura o<br />
G<strong>en</strong>d<strong>ar</strong>mería)<br />
(11) Tipo <strong>de</strong> <strong>de</strong>lito por el<br />
cual ingresó al<br />
Establecimi<strong>en</strong>to<br />
Anexo Patricio Gutiérrez Rüegg 117
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Delitos contra <strong>la</strong>s<br />
Personas<br />
1- Homicidios Dolosos<br />
2- Homicidios Dolosos<br />
(t<strong>en</strong>tativa)<br />
3- Homicidios Culposos<br />
4- Lesiones Dolosas<br />
5- Lesiones Culposas<br />
6- Otros Delitos contra <strong>la</strong>s<br />
personas<br />
7-Delitos contra el honor<br />
Delitos contra <strong>la</strong><br />
integridad sexual<br />
8- Vio<strong>la</strong>ciones<br />
9- Otros <strong>de</strong>litos contra <strong>la</strong><br />
honestidad<br />
Delitos contra <strong>la</strong> libertad<br />
10- Am<strong>en</strong>azas<br />
11- Privación ilegítima <strong>de</strong><br />
<strong>la</strong> libertad<br />
12- Delito contra <strong>la</strong><br />
libertad <strong>com</strong>etido por<br />
funcion<strong>ar</strong>io público<br />
13- Otros <strong>de</strong>litos contra <strong>la</strong><br />
libertad<br />
Delitos contra <strong>la</strong><br />
propiedad<br />
14- Hurto y/o t<strong>en</strong>tativa <strong>de</strong><br />
hurto<br />
15- Robo y/o t<strong>en</strong>tativa <strong>de</strong><br />
robo<br />
16- Otros <strong>de</strong>litos contra <strong>la</strong><br />
propiedad<br />
17- Delitos contra <strong>la</strong><br />
seguridad pública<br />
18- Delitos C/ el or<strong>de</strong>n<br />
público<br />
16- Otros <strong>de</strong>litos contra <strong>la</strong><br />
propiedad<br />
17- Delitos contra <strong>la</strong><br />
seguridad pública<br />
18- Delitos C/ el or<strong>de</strong>n<br />
público<br />
19- Delitos C/ <strong>la</strong><br />
seguridad <strong>de</strong> <strong>la</strong> nación<br />
20- Delitos C/ los po<strong>de</strong>res<br />
públicos<br />
21- Delitos C/ <strong>la</strong><br />
administración pública<br />
22- Delitos C/ <strong>la</strong> Fe.<br />
23- Delitos C/ el Estado<br />
Civil.<br />
24- Infracción Ley N°<br />
23.737 (Estupefaci<strong>en</strong>tes)<br />
118<br />
25- Infracción Ley N°<br />
24.769 P<strong>en</strong>al Tribut<strong>ar</strong>ia<br />
26- Infracción Ley N°<br />
13.944 Incumplimi<strong>en</strong>to <strong>de</strong><br />
<strong>de</strong>beres<br />
27- Delitos Previstos <strong>en</strong><br />
leyes especiales.<br />
28- Contrav<strong>en</strong>ciones 19-<br />
Delitos C/ <strong>la</strong> seguridad <strong>de</strong><br />
<strong>la</strong> nación<br />
(12) Trabajo<br />
Remunerado según<br />
cantidad <strong>de</strong> horas<br />
1- Hasta 10 hs. Semanales<br />
2- Hasta 20 hs. Semanales<br />
3- Hasta 30 hs. Semanales<br />
4- Hasta 40 hs. Semanales<br />
5- No ti<strong>en</strong>e trabajo<br />
remunerado<br />
(13) ¿El interno<br />
p<strong>ar</strong>ticipó regu<strong>la</strong>rm<strong>en</strong>te<br />
<strong>de</strong> algún programa <strong>de</strong><br />
Formación o<br />
Capacitación Laboral<br />
durante el último año?<br />
1- SI<br />
2- NO<br />
(14) ¿El interno<br />
p<strong>ar</strong>ticipó regu<strong>la</strong>rm<strong>en</strong>te<br />
<strong>de</strong> algún Programa<br />
Educativo durante el<br />
último año?<br />
1-SI- Educación Formal-<br />
EGB<br />
2-SI- Educación Formal-<br />
Polimodal<br />
3-SI- Educación Formal-<br />
Terci<strong>ar</strong>ia<br />
4-SI- Educación Formal -<br />
Universit<strong>ar</strong>ia<br />
5-SI- Educación NO<br />
Formal<br />
6- No p<strong>ar</strong>ticipa <strong>de</strong> ningún<br />
programa educativo<br />
(15) ¿El interno<br />
p<strong>ar</strong>ticipó regu<strong>la</strong>rm<strong>en</strong>te<br />
<strong>de</strong> Activida<strong>de</strong>s<br />
Recreativas y/o<br />
Deportivas<br />
durante el último año?<br />
1- SI<br />
2- NO<br />
(16) ¿El interno recibió<br />
Asist<strong>en</strong>cia Médica<br />
durante el último año?<br />
1- SI<br />
2- NO<br />
(17) ¿El interno recibió<br />
Visitas durante el último<br />
año?<br />
1- SI<br />
2- NO<br />
(18) ¿El interno<br />
p<strong>ar</strong>ticipó <strong>de</strong> alguna<br />
Alteración <strong>de</strong>l Or<strong>de</strong>n<br />
durante el último año?<br />
Indic<strong>ar</strong> tipo <strong>de</strong><br />
Alteración <strong>de</strong>l Or<strong>de</strong>n<br />
1- SI – Alteración <strong>de</strong>l<br />
or<strong>de</strong>n con Heridos o<br />
Muertos<br />
2- SI – Alteración <strong>de</strong>l<br />
or<strong>de</strong>n con Reh<strong>en</strong>es<br />
3- SI – Alteración <strong>de</strong>l<br />
or<strong>de</strong>n con Daños<br />
4- SI – Alteración <strong>de</strong>l<br />
or<strong>de</strong>n sin heridos, ni<br />
reh<strong>en</strong>es, ni daños.<br />
5- NO p<strong>ar</strong>ticipó <strong>de</strong><br />
ninguna alteración<br />
(19) Tipo <strong>de</strong> Infracción<br />
disciplin<strong>ar</strong>ia <strong>com</strong>etida<br />
por el interno durante el<br />
últ. Año<br />
1- Faltas graves<br />
2- Faltas medias<br />
3- Faltas leves<br />
4- NO <strong>com</strong>etió Infracción<br />
disciplin<strong>ar</strong>ia<br />
(20) Tipo <strong>de</strong> Sanciones<br />
Disciplin<strong>ar</strong>ias impuesta<br />
al interno<br />
1- Tras<strong>la</strong>do a otro<br />
establecimi<strong>en</strong>to <strong>de</strong><br />
régim<strong>en</strong> más severo<br />
2- Tras<strong>la</strong>do a otra sección<br />
<strong>de</strong> régim<strong>en</strong> más severo<br />
3- Perman<strong>en</strong>cia <strong>en</strong> su<br />
alojami<strong>en</strong>to individual o<br />
<strong>en</strong> celdas cuyas<br />
condiciones no agrav<strong>en</strong><br />
Patricio Gutiérrez Rüegg Anexo
ilegítimam<strong>en</strong>te <strong>la</strong><br />
<strong>de</strong>t<strong>en</strong>ción hasta 7 fines <strong>de</strong><br />
semana sucesivos o<br />
alternados<br />
4- Perman<strong>en</strong>cia <strong>en</strong> su<br />
alojami<strong>en</strong>to individual o<br />
<strong>en</strong> celdas cuyas<br />
condiciones no agrav<strong>en</strong><br />
ilegítimam<strong>en</strong>te <strong>la</strong><br />
<strong>de</strong>t<strong>en</strong>ción hasta 15 días<br />
ininterrumpidos<br />
5- Susp<strong>en</strong>sión o<br />
restricción total o p<strong>ar</strong>cial<br />
<strong>de</strong> los <strong>de</strong>rechos<br />
reg<strong>la</strong>m<strong>en</strong>t<strong>ar</strong>ios hasta 15<br />
días<br />
6- Exclusión <strong>de</strong> <strong>la</strong><br />
actividad <strong>com</strong>ún hasta 15<br />
días<br />
7- Exclusión <strong>de</strong> <strong>la</strong><br />
actividad recreativa o<br />
<strong>de</strong>portiva hasta 10 días<br />
8- Amonestación<br />
9- Otra sanción<br />
(22) ¿El interno tuvo<br />
int<strong>en</strong>tos <strong>de</strong> Fugas o<br />
Evasiones durante el<br />
último año?<br />
1- SI, t<strong>en</strong>tativa <strong>de</strong> Evasión<br />
2- SI, t<strong>en</strong>tativa <strong>de</strong> Fuga<br />
3- No<br />
(23) ¿El interno tuvo<br />
int<strong>en</strong>tos <strong>de</strong> Suicidio<br />
durante el último año?<br />
1- SI<br />
2- NO<br />
(24) ¿El interno fue<br />
lesionado <strong>en</strong> el<br />
establecimi<strong>en</strong>to <strong>en</strong> el<br />
último año? Motivos<br />
1- SI, por hechos <strong>de</strong><br />
viol<strong>en</strong>cia con otros<br />
internos<br />
2- SI, por hechos <strong>de</strong><br />
viol<strong>en</strong>cia con ag<strong>en</strong>tes <strong>de</strong>l<br />
establecimi<strong>en</strong>to<br />
3- SI, por otros motivos<br />
4- No fue lesionado<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
(25) ¿El interno está<br />
con<strong>de</strong>nado a Prisión o<br />
reclusión Perpetua?<br />
1- SI<br />
2- NO<br />
(26) ¿El interno ti<strong>en</strong>e<br />
Medida <strong>de</strong> Seguridad<br />
(<strong>ar</strong>t. 52 CP)?<br />
1- SI<br />
2- NO<br />
(27) Reinci<strong>de</strong>ncia<br />
1- Prim<strong>ar</strong>io<br />
2- Reiterante<br />
3- Reinci<strong>de</strong>nte (<strong>ar</strong>t. 50<br />
CP)<br />
4- Reinci<strong>de</strong>ncia múltiple<br />
(<strong>ar</strong>t. 52 CP)<br />
(28) Períodos <strong>de</strong> <strong>la</strong><br />
Progresividad <strong>de</strong>l<br />
Régim<strong>en</strong> P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />
<strong>en</strong> el último año.<br />
Artículo 12, Ley Nº<br />
24.660<br />
1- Período <strong>de</strong> observación<br />
2- Período <strong>de</strong> tratami<strong>en</strong>to<br />
3- Período <strong>de</strong> prueba<br />
4- Período <strong>de</strong> libertad<br />
condicional<br />
5- Se aplica otra<br />
c<strong>ar</strong>acterización<br />
6- No se aplica ninguna<br />
(29) ¿Ti<strong>en</strong>e o tuvo<br />
salidas transitorias <strong>en</strong> el<br />
último año? Art. 16 y 19,<br />
Ley Nº 24.660<br />
1- NO le fueron otorgadas<br />
2- SI goza <strong>de</strong> salidas<br />
transitorias<br />
3- Susp<strong>en</strong>didas durante el<br />
último año<br />
4- Revocadas durante el<br />
último año<br />
(30) ¿El Interno está<br />
incorporado al Régim<strong>en</strong><br />
<strong>de</strong> Semilibertad?<br />
Artículos 15, 19 y 23 Ley<br />
Nº 24.660<br />
1- NO está incorporado al<br />
régim<strong>en</strong> <strong>de</strong> Semilibertad<br />
2- SI está incorporado<br />
3- Susp<strong>en</strong>dido durante el<br />
último año<br />
4- Revocado durante el<br />
último año<br />
(31) ¿El Interno está<br />
incorporado a un<br />
Programa <strong>de</strong><br />
Prelibertad? Artículo 30,<br />
Ley Nº 24.660<br />
1- SI está incorporado<br />
2- No está incorporado<br />
(32) ¿El Interno cumple<br />
<strong>la</strong> p<strong>en</strong>a bajo <strong>la</strong><br />
modalidad <strong>de</strong> Prisión<br />
Discontinua?<br />
Artículos 36 y 49, Ley Nº<br />
24.660<br />
1- No está incorporado<br />
2- SI está incorporado<br />
3- Revocada durante el<br />
último año<br />
4- R<strong>en</strong>uncia <strong>de</strong>l interno<br />
durante el último año<br />
(33) ¿Al Interno se le<br />
otorgó <strong>la</strong> Semi<strong>de</strong>t<strong>en</strong>ción?<br />
Artículos 39 a 42, Ley Nº<br />
24.660<br />
1- No ti<strong>en</strong>e Semi<strong>de</strong>t<strong>en</strong>ción<br />
2- SI, Prisión Diurna<br />
3- SI, Prisión Nocturna<br />
4- Revocada durante el<br />
último año<br />
5- R<strong>en</strong>uncia <strong>de</strong>l interno<br />
durante el último año<br />
(34) ¿El interno tuvo<br />
reducción <strong>de</strong> p<strong>en</strong>a <strong>en</strong> el<br />
último año?<br />
1- SI – Hasta 6 meses<br />
2- SI – Hasta 1 año<br />
3- SI – Más <strong>de</strong> 1 año<br />
4- NO tuvo reducción <strong>de</strong><br />
p<strong>en</strong>a<br />
(35) P<strong>ar</strong>a Mujeres:<br />
¿Ti<strong>en</strong>e hijos alojados<br />
con el<strong>la</strong>? Artículo 195,<br />
Ley Nº 24.660<br />
1- SI<br />
2- NO<br />
Anexo Patricio Gutiérrez Rüegg 119
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 4<br />
POBLACIÓN DETENIDA EN COMISARIAS – AÑO 2005<br />
120<br />
PROVINCIA<br />
DETENIDOS<br />
CÁRCELES<br />
DETENIDOS<br />
COMISARIAS TOTAL<br />
SPF 9625 9,625<br />
BUENOS AIRES 24721 4,592 29,313<br />
CATAMARCA 356 107 463<br />
CÓRDOBA 5484 141 5,625<br />
CORRIENTES 700 267 967<br />
CHACO 961 96 1,057<br />
CHUBUT 933 - 933<br />
ENTRE RIOS 304 140 444<br />
FORMOSA 442 221 663<br />
JUJUY 186 67 253<br />
LA PAMPA 2464 - 2,464<br />
LA RIOJA 1074 20 1,094<br />
MENDOZA 595 No informó 595<br />
MISIONES 630 98 728<br />
NEUQUEN 1707 15 1,722<br />
RIO NEGRO 723 35 758<br />
SALTA 405 147 552<br />
SAN JUAN 116 54 170<br />
SAN LUIS 2217 No informó 2,217<br />
SANTA CRUZ 467 105 572<br />
SANTA FE 956 1,279 2,235<br />
SANTIAGO DEL ESTERO 115 45 160<br />
TIERRA DEL FUEGO 147 - 147<br />
TUCUMÁN 95 79 174<br />
GENDARMERIA (Junio 2005) 367 367<br />
PREFECTURA (Junio 2005) 59 59<br />
55,423<br />
7,934 63,357<br />
Tab<strong>la</strong> 9.1. Pob<strong>la</strong>ción <strong>de</strong>t<strong>en</strong>ida <strong>en</strong> Comis<strong>ar</strong>ías [DNPC, 2005].<br />
Relevami<strong>en</strong>to basado <strong>en</strong> datos proporcionados por el SPF y los servicios p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios<br />
o policías provinciales.<br />
Patricio Gutiérrez Rüegg Anexo
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 5<br />
EVOLUCIÓN POBLACIÓN PENITENCIARIA POR PROVINCIA – AÑO 2006<br />
Tab<strong>la</strong> 9.2. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia <strong>en</strong> Arg<strong>en</strong>tina [DNPC, 2006].<br />
Anexo Patricio Gutiérrez Rüegg 121
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 6<br />
POBLACIÓN CARCELARIA EN EL MUNDO<br />
122<br />
Pais y Año medición<br />
Pob<strong>la</strong>ción<br />
C<strong>ar</strong>ce<strong>la</strong>ria<br />
Tasa<br />
c/100.000<br />
Estados Unidos (Jun-2006) 2,245,189 750<br />
Rusia (Jul-2007) 889,598 628<br />
Cuba (Nov-2006) 60,000 531<br />
Bielorrusia (Ene-2006) 41,538 426<br />
Puerto Rico (Jul-2006) 14,239 356<br />
Kazakhstan (Ene-2007) 51,538 348<br />
Ucrania (Feb-2007) 160,046 345<br />
Sudafrica (May-2007) 159,961 335<br />
Emiratos Arabes Unidos (Ene-2004) 8,927 288<br />
Taiwan (Abr-2007) 64,279 281<br />
Chile (May-2007) 43,723 262<br />
Tai<strong>la</strong>ndia (Dic-2006) 161,844 249<br />
Brasil (Jun-2007) 419,551 219<br />
Israel (Dic-2004) 13,909 209<br />
Mexico (May-2007) 216,290 198<br />
Uruguay (Ago-2006) 6,947 193<br />
Ing<strong>la</strong>terra y Gales (Jul-2007) 80,229 148<br />
España (Jul-2007) 66,129 147<br />
Arg<strong>en</strong>tina (Dic-2006) 54,000 139<br />
Colombia (May-2007) 60,158 128<br />
Australia (Jun-2006) 25,790 125<br />
China (Dec-2005) 1,565,771 119<br />
Canadá (M<strong>ar</strong>-2005) 34,244 107<br />
P<strong>ar</strong>aguay (Jun-2006) 6,264 98<br />
Alemania (Nov-2006) 76,629 93<br />
Francia (Sep-2006) 52,009 85<br />
Suecia (Oct-2006) 7,175 79<br />
Suiza (Sep-2006) 5,888 79<br />
Italia (Dic-2006) 39,348 67<br />
Japón (Dic-2006) 77,932 61<br />
Tab<strong>la</strong> 9.3. Pob<strong>la</strong>ción P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia <strong>en</strong> Mundial [ICPS, 2007].<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 7<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
SERVICIO PENITENCIARIO FEDERAL: CÁRCELES Y ALCALDÍAS<br />
• Unidad 2 (cárcel <strong>de</strong> Devoto), Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Unidad 3, Instituto Correccional <strong>de</strong> Mujeres, Localidad <strong>de</strong> Ezeiza, Prov.<strong>de</strong> Bs.As.<br />
• Unidad 4, Colonia P<strong>en</strong>al <strong>de</strong> Santa Rosa, Provincia <strong>de</strong> La Pampa<br />
• Unidad 5, Colonia P<strong>en</strong>al Subprefecto Rocha, Provincia <strong>de</strong> Río Negro<br />
• Unidad 6, Instituto <strong>de</strong> Seguridad, Rawson, Chubut<br />
• Unidad 7, Prisión Regional <strong>de</strong>l Norte, Resist<strong>en</strong>cia, Chaco<br />
• Unidad 9, Prisión Regional <strong>de</strong>l Sur, Provincia <strong>de</strong> Neuquén<br />
• Unidad 10, Cárcel <strong>de</strong> Formosa<br />
• Unidad 11, Colonia P<strong>en</strong>al <strong>de</strong> Roque Sá<strong>en</strong>z Peña, Chaco<br />
• Unidad 12, Colonia P<strong>en</strong>al <strong>de</strong> Viedma, Río Negro<br />
• Unidad 13, Instituto Correccional <strong>de</strong> Mujeres Nuestra Sra. Del C<strong>ar</strong>m<strong>en</strong>, Santa Rosa,<br />
La Pampa<br />
• Unidad 14, cárcel <strong>de</strong> Esquel, Chubut<br />
• Unidad 15, cárcel <strong>de</strong> Río Gallegos, Santa Cruz<br />
• Unidad 17, Colonia P<strong>en</strong>al <strong>de</strong> Can<strong>de</strong><strong>la</strong>ria, Misiones<br />
• Unidad 19, Instituto Correccional Abierto <strong>de</strong> Ezeiza, Provincia <strong>de</strong> Bu<strong>en</strong>os Aires.<br />
• Unidad 20, Instituto Psiquiátrico <strong>de</strong> V<strong>ar</strong>ones, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Unidad 21, C<strong>en</strong>tro <strong>de</strong> Enfermeda<strong>de</strong>s Infectocontagiosas, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires.<br />
• Unidad 24 y 26, Complejo Fe<strong>de</strong>ral p<strong>ar</strong>a jóv<strong>en</strong>es adultos, M<strong>ar</strong>cos Paz, Prov.<strong>de</strong> Bs.As.<br />
• Unidad 25, Correccional Abierto <strong>de</strong> G<strong>en</strong>eral Pico, La Pampa<br />
• Unidad 27, Servicio Psiquiátrico C<strong>en</strong>tral <strong>de</strong> Mujeres, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Unidad 28, C<strong>en</strong>tro <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción Judicial, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Unidad 29, Alcaldía Fe<strong>de</strong>ral, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Unida 30, Instituto <strong>de</strong> Jóv<strong>en</strong>es Adultos, Dr. Julio Alfonsín<br />
• Unida 31, C<strong>en</strong>tro Fe<strong>de</strong>ral <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción <strong>de</strong> mujeres, Ezeiza, Provincia <strong>de</strong> Bs. As.<br />
• Unidad 32, C<strong>en</strong>tro <strong>de</strong> Det<strong>en</strong>ción Judicial <strong>de</strong> M<strong>en</strong>doza<br />
• Complejos P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios I y II, sitos <strong>en</strong> <strong>la</strong>s localida<strong>de</strong>s <strong>de</strong> Ezeiza y M<strong>ar</strong>cos Paz,<br />
respectivam<strong>en</strong>te. Las Unida<strong>de</strong>s 1 y 16 eran <strong>la</strong>s cárceles <strong>de</strong> Encausados <strong>de</strong> <strong>la</strong> Capital<br />
Fe<strong>de</strong>ral y <strong>la</strong> <strong>de</strong> Jóv<strong>en</strong>es Adultos, respectivam<strong>en</strong>te; <strong>la</strong> unidad 22 ya no funciona <strong>com</strong>o<br />
establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io y su espacio es el que hoy correspon<strong>de</strong> a <strong>la</strong> cárcel <strong>de</strong><br />
Contrav<strong>en</strong>tores <strong>de</strong> Bu<strong>en</strong>os Aires; <strong>la</strong> unidad 23 era una cárcel <strong>de</strong> jóv<strong>en</strong>es que funcionaba<br />
<strong>en</strong> el ámbito <strong>de</strong>l Establecimi<strong>en</strong>to <strong>de</strong> Devoto.<br />
• Alcaldía Correccional Juncal, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Alcaldía P<strong>en</strong>al Coronel Paiva, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Alcaldía P<strong>en</strong>al Inspector G<strong>en</strong>eral R. Pettinato, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Alcaldía Correccional Lavalle, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Unidad 18, Casa <strong>de</strong> Preegreso, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />
• Alcaldía Fe<strong>de</strong>ral <strong>de</strong> Lomas <strong>de</strong> Zamora, Provincia <strong>de</strong> Bu<strong>en</strong>os Aires;<br />
• Alcaldía Fe<strong>de</strong>ral <strong>de</strong> Salta;<br />
• Alcaldía Fe<strong>de</strong>ral <strong>de</strong> Jujuy;<br />
Anexo Patricio Gutiérrez Rüegg 123
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 8<br />
SOBREPOBLACIÓN SPF 2003<br />
124<br />
Tab<strong>la</strong> 9.4. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2003].<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 8 - CONTINUACIÓN<br />
SOBREPOBLACIÓN SPF 2004<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Tab<strong>la</strong> 9.5. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2004].<br />
Anexo Patricio Gutiérrez Rüegg 125
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 8- CONTINUACIÓN<br />
SOBREPOBLACIÓN SPF 2005<br />
126<br />
Tab<strong>la</strong> 9.6. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2005].<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 8 - CONTINUACIÓN<br />
SOBREPOBLACIÓN SPF 2006<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Tab<strong>la</strong> 9.5. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2006].<br />
Anexo Patricio Gutiérrez Rüegg 127
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 9<br />
SOBREPOBLACIÓN SERVICIO PENITENCIARIO BONAERENSE – AÑO<br />
2006<br />
PROVINCIA ESTABLECIMIENTO CAPACIDAD DETENIDOS SOBREPOBLACION<br />
UNIDAD 1 - LISANDRO OLMOS 1,740<br />
1,727<br />
UNIDAD 2 - SIERRA CHICA 1,550<br />
1,303<br />
UNIDAD 3 - SAN NICOLAS 400<br />
463<br />
UNIDAD 4 - BAHIA BLANCA 592<br />
468<br />
UNIDAD 5 - MERCEDES 717<br />
711<br />
UNIDAD 6 - DOLORES 327<br />
327<br />
UNIDAD 7 - AZUL 266<br />
302<br />
UNIDAD 8 - LOS HORNOS 157<br />
168<br />
UNIDAD 9 - LA PLATA 1,250<br />
1,217<br />
UNIDAD 10 - MELCHOR ROMERO 280<br />
284<br />
UNIDAD 11 - BARADERO 66<br />
56<br />
UNIDAD 12 - JOAQUIN GORINA 98<br />
20<br />
UNIDAD 13 - JUNIN 748<br />
557<br />
UNIDAD 14 - GENERAL ALVEAR 48<br />
23<br />
UNIDAD 15 - BATAN 1,386<br />
1,227<br />
UNIDAD 16 - JUNIN 140<br />
138<br />
UNIDAD 17 - URDAMPILLETA 450<br />
424<br />
UNIDAD 18 - JOAQUÍN GORINA 582<br />
267<br />
UNIDAD 19 - SAAVEDRA 650<br />
584<br />
UNIDAD 20 - TRENQUEN LAUQUEN 80<br />
57<br />
UNIDAD 21 - CAMPANA 750<br />
724<br />
UNIDAD 22 - HO.G.A.M. 52<br />
29<br />
BUENOS AIRES<br />
UNIDAD 23 - FLORENCIO VARELA<br />
UNIDAD 24 - FLORENCIO VARELA<br />
772<br />
750<br />
778<br />
751<br />
UNIDAD 25 - LISANDRO OLMOS 95<br />
238<br />
UNIDAD 26 - LISANDRO OLMOS 94<br />
109<br />
UNIDAD 27 - SIERRA CHICA 140<br />
128<br />
UNIDAD 28 - MAGDALENA 646<br />
572<br />
UNIDAD 30 - GENERAL ALVEAR 1,550<br />
1,528<br />
UNIDAD 31 - FLORENCIO VARELA 499<br />
487<br />
UNIDAD 32 - FLORENCIO VARELA 468<br />
438<br />
UNIDAD 33 - LOS HORNOS (MUJERES) 338<br />
245<br />
UNIDAD 34 - MELCHOR ROMERO 362<br />
354<br />
UNIDAD 35 - MAGDALENA 850<br />
760<br />
UNIDAD 36 - MAGDALENA 650<br />
548<br />
UNIDAD 37 - BARKER 650<br />
562<br />
UNIDAD 38 - SIERRA CHICA 650<br />
644<br />
UNIDAD 39 - ITUZAINGÓ 400<br />
375<br />
UNIDAD 41 - CAMPANA 300<br />
100<br />
UNIDAD 42 - FLORENCIO VARELA 102<br />
171<br />
UNIDAD 44 - MAR DEL PLATA 45<br />
96<br />
UNIDAD 45 - MELCHOR ROMERO 250<br />
178<br />
UNIDAD 50 - MAR DEL PLATA 96<br />
52<br />
UNIDAD 51 - MAGDALENA 32<br />
55<br />
UNIDAD 52 - AZUL 96<br />
61<br />
Difer<strong>en</strong>cias Registro Gral. <strong>de</strong> Internos <strong>de</strong>l S.P. <strong>de</strong> <strong>la</strong> Prov. <strong>de</strong> Bs As. 3,572<br />
22,164<br />
23,878<br />
Tab<strong>la</strong> 9.6. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Bonaer<strong>en</strong>se [DNPC, 2006].<br />
128<br />
-0.7%<br />
-15.9%<br />
15.8%<br />
-20.9%<br />
-0.8%<br />
0.0%<br />
13.5%<br />
7.0%<br />
-2.6%<br />
1.4%<br />
-15.2%<br />
-79.6%<br />
-25.5%<br />
-52.1%<br />
-11.5%<br />
-1.4%<br />
-5.8%<br />
-54.1%<br />
-10.2%<br />
-28.8%<br />
-3.5%<br />
-44.2%<br />
0.8%<br />
0.1%<br />
150.5%<br />
16.0%<br />
-8.6%<br />
-11.5%<br />
-1.4%<br />
-2.4%<br />
-6.4%<br />
-27.5%<br />
-2.2%<br />
-10.6%<br />
-15.7%<br />
-13.5%<br />
-0.9%<br />
-6.3%<br />
-66.7%<br />
67.6%<br />
113.3%<br />
-28.8%<br />
-45.8%<br />
71.9%<br />
-36.5%<br />
0.0%<br />
7.7%<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 10<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
APERTURA DEL PRESUPUESTO 2004 DEL SPF SEGÚN CONCEPTO<br />
Activida<strong>de</strong>s Comunes al Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />
Fe<strong>de</strong>ral (Programas 16,17 y 15)<br />
Seguridad y Rehabilitación <strong>de</strong>l interno<br />
Pagos a Retirados y P<strong>en</strong>sionados<br />
Cooperación Técnica y Financiera p<strong>ar</strong>a <strong>la</strong><br />
Laborterapia <strong>de</strong> Internos<br />
Formación y Capacitación<br />
Gastos <strong>de</strong> Personal $22,935,690<br />
Servicios no personales $12,290,829<br />
Bi<strong>en</strong>es <strong>de</strong> consumo $11,009,522<br />
Bi<strong>en</strong>es <strong>de</strong> uso $645,095<br />
Transfer<strong>en</strong>cias $14,246,000<br />
$61,127,136<br />
Gastos <strong>de</strong> Personal $128,772,059<br />
Servicios no personales $4,238,059<br />
Bi<strong>en</strong>es <strong>de</strong> consumo $18,095,960<br />
Bi<strong>en</strong>es <strong>de</strong> uso $420,905<br />
$151,526,983<br />
Gastos <strong>de</strong> Personal $1,107,277<br />
Servicios no personales $1,625<br />
Transfer<strong>en</strong>cias $124,737,300<br />
Gastos <strong>de</strong> Personal<br />
$125,846,202<br />
$ 686,190<br />
Servicios no personales $ 4,772,200<br />
Bi<strong>en</strong>es <strong>de</strong> consumo $ 1,414,000<br />
Bi<strong>en</strong>es <strong>de</strong> uso $ 798,000<br />
$ 7,670,390<br />
Gastos <strong>de</strong> Personal $10,389,974<br />
Servicios no personales $1,308<br />
Bi<strong>en</strong>es <strong>de</strong> consumo $998,971<br />
Transfer<strong>en</strong>cias $353,000<br />
$ 11,743,253<br />
Sub-Total $357,913,964<br />
(+) Obras P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias $14,460,295<br />
Figura 9.6. Presupuesto <strong>de</strong>stinado al SPF [Petrone, 2005].<br />
Total $372,374,259<br />
Anexo Patricio Gutiérrez Rüegg 129
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 11<br />
RAMA “OFICIO – TODOS LOS DELITOS” DEL ÁRBOL DE DECISIÓN<br />
130<br />
Figura 9.7. Rama “Oficio” <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión.<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 12 A<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LA PERSONAS”<br />
Figura 9.8. Rama “Sin Oficio ni Profesión – Delito contra <strong>la</strong>s Personas”.<br />
Anexo Patricio Gutiérrez Rüegg 131
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 12 B<br />
RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LA PROPIEDAD”<br />
132<br />
Figura 9.9. Rama “Sin Oficio ni Profesión – Delito contra <strong>la</strong> Propiedad”.<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 12 C<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LA INTEGRIDAD<br />
SEXUAL Y EL HONOR”<br />
Figura 9.10. Rama “Sin Oficio ni Profesión – Delito contra <strong>la</strong> Integridad Sexual y el Honor”.<br />
Anexo Patricio Gutiérrez Rüegg 133
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 12 D<br />
RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LEY Nº 23.737 DE<br />
ESTUPEFACIENTES”<br />
134<br />
Figura 9.11. Rama “Sin Oficio ni Profesión – Delito contra Estupefaci<strong>en</strong>tes”.<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 13 A<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
RAMA “PROFESIÓN – DELITO CONTRA LAS PERSONAS”<br />
Figura 9.12. Rama “Profesión– Delito contra <strong>la</strong>s Personas”.<br />
Anexo Patricio Gutiérrez Rüegg 135
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 13 B<br />
RAMA “PROFESIÓN – DELITO CONTRA LA PROPIEDAD”<br />
136<br />
Figura 9.13. Rama “Profesión – Delito contra <strong>la</strong> Propiedad”.<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 13 C<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
RAMA “PROFESIÓN – DELITO CONTRA LA INTEGRIDAD SEXUAL”<br />
Figura 9.14. Rama “Profesión – Delito contra <strong>la</strong> Integridad Sexual”.<br />
Anexo Patricio Gutiérrez Rüegg 137
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
ANEXO 13 D<br />
RAMA “PROFESIÓN – DELITO DE ESTUPEFACIENTES”<br />
138<br />
Figura 9.15. Rama “Profesión - Delito contra <strong>la</strong> ley Nº 23.737 <strong>de</strong> Estupefaci<strong>en</strong>tes”.<br />
Patricio Gutiérrez Rüegg Anexo
ANEXO 14<br />
INTRODUCCIÓN AL RAPIDMINER (YALE)<br />
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Figura 9.16. Pantal<strong>la</strong> <strong>de</strong> Bi<strong>en</strong>v<strong>en</strong>ida <strong>de</strong>l RapidMiner.<br />
Una vez elegida alguna <strong>de</strong> <strong>la</strong>s opciones <strong>de</strong> <strong>la</strong> pantal<strong>la</strong> <strong>de</strong> Bi<strong>en</strong>v<strong>en</strong>ida [Figura 9.16] <strong>com</strong>o<br />
lo pue<strong>de</strong> ser inici<strong>ar</strong> nuevos procesos, abrir exist<strong>en</strong>tes, utiliz<strong>ar</strong> asist<strong>en</strong>te <strong>de</strong> creación, etc.,<br />
se pasa a <strong>la</strong> sigui<strong>en</strong>te pantal<strong>la</strong> [Figura 9.17]:<br />
Figura 9.17. Pantal<strong>la</strong> Principal <strong>de</strong>l RapidMiner.<br />
Anexo Patricio Gutiérrez Rüegg 139
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Una vez <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> pantal<strong>la</strong> principal <strong>de</strong>l programa, se pue<strong>de</strong>n realiz<strong>ar</strong> <strong>la</strong>s sigui<strong>en</strong>tes<br />
acciones:<br />
140<br />
• Cre<strong>ar</strong> Operadores:<br />
o Usando el icono <strong>de</strong> nuevo operador.<br />
o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />
<strong>de</strong> Operadores sobre cualquier operador que lo permita, se pue<strong>de</strong> elegir<br />
un nuevo operador.<br />
• Reemp<strong>la</strong>z<strong>ar</strong> Operadores:<br />
o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />
<strong>de</strong> Operadores sobre cualquier operador que lo permita, se pue<strong>de</strong><br />
reemp<strong>la</strong>z<strong>ar</strong> un nuevo operador.<br />
• Insert<strong>ar</strong> Bloques <strong>de</strong> Operadores gu<strong>ar</strong>dados:<br />
o Usando el icono <strong>de</strong> bloque gu<strong>ar</strong>dado.<br />
o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />
<strong>de</strong> Operadores sobre cualquier operador que lo permita, se agrega un<br />
bloque <strong>de</strong> operadores.<br />
• Elimin<strong>ar</strong> Operadores:<br />
o Usando el icono <strong>de</strong> remoción <strong>de</strong> operadores.<br />
o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />
<strong>de</strong> Operadores sobre cualquier operador que lo permita, se elige remover<br />
operador.<br />
• Manejo <strong>de</strong> p<strong>ar</strong>ámetros:<br />
o A p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong> p<strong>ar</strong>ámetros se pue<strong>de</strong> pas<strong>ar</strong> <strong>de</strong> modo normal a<br />
modo experto con el icono correspondi<strong>en</strong>te:<br />
Se observa <strong>en</strong> <strong>la</strong> figura 9.18 <strong>com</strong>o se incorpora el dataset al mo<strong>de</strong>lo. Importante<br />
<strong>de</strong>stac<strong>ar</strong>, que el pres<strong>en</strong>te softw<strong>ar</strong>e ti<strong>en</strong>e <strong>la</strong> capacidad <strong>de</strong> permitir que el input operator<br />
acepte bases <strong>en</strong> distintos formatos. De <strong>la</strong> misma manera, <strong>en</strong> <strong>la</strong> figura 9.19, se muestra<br />
<strong>com</strong>o se van incorporando al mo<strong>de</strong>lo los distintos algoritmos <strong>de</strong> minería <strong>de</strong> datos. En el<br />
caso <strong>de</strong> <strong>la</strong> pres<strong>en</strong>te figura, se está agregando un algoritmo basado <strong>en</strong> árboles <strong>de</strong><br />
<strong>de</strong>cisión, que tal <strong>com</strong>o se explica anteriorm<strong>en</strong>te, es un método supervisado <strong>de</strong><br />
apr<strong>en</strong>dizaje.<br />
Patricio Gutiérrez Rüegg Anexo
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Figura 9.18. Agregado <strong>de</strong>l dataset al mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos.<br />
Figura 9.19. Agregado <strong>de</strong>l algoritmo <strong>de</strong> minería <strong>de</strong> datos.<br />
Una vez c<strong>ar</strong>gado el dataset, <strong>com</strong>o agregados los operadores <strong>de</strong> apr<strong>en</strong>dizaje neces<strong>ar</strong>ios<br />
p<strong>ar</strong>a el proceso, se re<strong>com</strong>i<strong>en</strong>da seguir los sigui<strong>en</strong>tes pasos:<br />
• Validación <strong>de</strong> <strong>la</strong> <strong>de</strong>finición <strong>de</strong> Proceso:<br />
o Una vez que se agreg<strong>ar</strong>on todos los operadores neces<strong>ar</strong>ios p<strong>ar</strong>a un<br />
proceso, es posible cheque<strong>ar</strong> si estos fueron jer<strong>ar</strong>quizados <strong>com</strong>o<br />
Anexo Patricio Gutiérrez Rüegg 141
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
142<br />
correspon<strong>de</strong> y si ti<strong>en</strong><strong>en</strong> sus <strong>en</strong>tradas (inputs) correctas y sus propieda<strong>de</strong>s<br />
bi<strong>en</strong> seteadas.<br />
o P<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> validación <strong>de</strong>l proceso se utiliza el sigui<strong>en</strong>te icono:<br />
o Los resultados se observan <strong>en</strong> el visor <strong>de</strong> m<strong>en</strong>sajes (pie <strong>de</strong> <strong>la</strong> pantal<strong>la</strong>) y<br />
<strong>en</strong> caso <strong>de</strong> que existiera algún tipo <strong>de</strong> error con <strong>la</strong> estructura y jer<strong>ar</strong>quía<br />
<strong>de</strong> los operadores y/o el proceso, ap<strong>ar</strong>ece un signo <strong>de</strong> exc<strong>la</strong>mación junto<br />
al operador.<br />
• Ejecución <strong>de</strong>l proceso:<br />
o Una vez validado el proceso, <strong>la</strong> ejecución consiste <strong>en</strong> hace click <strong>en</strong> el<br />
icono <strong>de</strong> ejecución:<br />
o Se pue<strong>de</strong> <strong>de</strong>t<strong>en</strong>er el proceso mediante el icono <strong>de</strong> stop:<br />
• Agregados <strong>de</strong> Puntos <strong>de</strong> Corte (BreakPoint):<br />
o Si nos ubicamos <strong>en</strong> alguno <strong>de</strong> los operadores <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l árbol <strong>de</strong><br />
operadores, usando el botón <strong>de</strong>recho <strong>de</strong>l mouse, se pue<strong>de</strong> elegir coloc<strong>ar</strong><br />
un Breakpoint p<strong>ar</strong>a que cuando <strong>la</strong> ejecución se inicie se pueda fr<strong>en</strong><strong>ar</strong> <strong>en</strong><br />
dicho punto y luego reanud<strong>ar</strong><strong>la</strong>.<br />
• Evaluación <strong>de</strong> Resultados:<br />
o Una vez terminada <strong>la</strong> ejecución, los resultados se pue<strong>de</strong>n observ<strong>ar</strong><br />
automáticam<strong>en</strong>te <strong>en</strong> pantal<strong>la</strong>, <strong>en</strong> lo que se <strong>de</strong>nomina Modo <strong>de</strong> Resultados<br />
(Result Mo<strong>de</strong>).<br />
o De <strong>la</strong> misma forma, se pue<strong>de</strong> volver a <strong>la</strong> pantal<strong>la</strong> <strong>de</strong> edición (Edit Mo<strong>de</strong>)<br />
con el sigui<strong>en</strong>te icono:<br />
o Des<strong>de</strong> <strong>la</strong> vista <strong>de</strong> resultados es posible, <strong>de</strong>p<strong>en</strong>di<strong>en</strong>do <strong>de</strong>l tipo <strong>de</strong><br />
resultados que <strong>ar</strong>roja el mo<strong>de</strong>lo, obt<strong>en</strong>er gráficos <strong>de</strong> distinto tipo.<br />
A modo <strong>de</strong> ejemplo, se muestra a continuación <strong>la</strong> figura 9.20, <strong>en</strong> don<strong>de</strong> se <strong>en</strong>cu<strong>en</strong>tra<br />
<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do un árbol <strong>de</strong> operadores a punto <strong>de</strong> ser ejecutado p<strong>ar</strong>a realiz<strong>ar</strong> el proceso <strong>de</strong><br />
c<strong>la</strong>sificación con su correspondi<strong>en</strong>te análisis <strong>de</strong> performance.<br />
Patricio Gutiérrez Rüegg Anexo
Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />
Figura 9.20. Ejemplo <strong>de</strong> árbol <strong>de</strong> operadores.<br />
Anexo Patricio Gutiérrez Rüegg 143