10.05.2013 Views

Caracterización de la Población Carcelaria en ... - Iidia.com.ar

Caracterización de la Población Carcelaria en ... - Iidia.com.ar

Caracterización de la Población Carcelaria en ... - Iidia.com.ar

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

TESIS DE GRADO<br />

INGENIERÍA INDUSTRIAL<br />

CARACTERIZACIÓN DE LA POBLACIÓN<br />

CARCELARIA EN ARGENTINA MEDIANTE LA<br />

APLICACIÓN DE MINERÍA DE DATOS PARA LA<br />

PREVENCIÓN DE HECHOS DELICTIVOS.<br />

AUTOR:<br />

PATRICIO GUTIÉRREZ RÜEGG<br />

DIRECTOR DE TESIS:<br />

M. ING. PAOLA BRITOS<br />

DR. RAMÓN GARCÍA-MARTÍNEZ<br />

2008


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.


RESUMEN<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Des<strong>de</strong> hace ya v<strong>ar</strong>ios años <strong>la</strong> inseguridad pasó a ser un tema recurr<strong>en</strong>te <strong>en</strong> <strong>la</strong> vida <strong>de</strong> los<br />

<strong>ar</strong>g<strong>en</strong>tinos. Reducir el índice <strong>de</strong> <strong>de</strong>litos es un tema que ti<strong>en</strong>e muy pres<strong>en</strong>te cada nuevo<br />

gobierno. La toma <strong>de</strong> <strong>de</strong>cisiones efici<strong>en</strong>tes y <strong>la</strong> implem<strong>en</strong>tación <strong>de</strong> medidas prev<strong>en</strong>tivas<br />

<strong>en</strong> lo que respecta a política criminal y social, es el primer paso que se <strong>de</strong>bería analiz<strong>ar</strong> a<br />

fin <strong>de</strong> logr<strong>ar</strong> reducir <strong>la</strong> cantidad <strong>de</strong> hechos <strong>de</strong>lictivos.<br />

El análisis <strong>de</strong> <strong>la</strong> información criminal que los difer<strong>en</strong>tes <strong>en</strong>tes <strong>de</strong>l Estado g<strong>en</strong>eran es un<br />

punto <strong>de</strong> vital importancia a los fines <strong>de</strong> prev<strong>en</strong>ción <strong>de</strong>l <strong>de</strong>lito. Se cree que no basta solo<br />

con analiz<strong>ar</strong> los registros sobre los distintos <strong>de</strong>litos <strong>com</strong>etidos <strong>en</strong> el pasado, sino que es<br />

neces<strong>ar</strong>io po<strong>de</strong>r llev<strong>ar</strong> a cabo estudios que involucr<strong>en</strong> a los autores materiales <strong>de</strong> dichos<br />

hechos. G<strong>en</strong>eralm<strong>en</strong>te se analizan estadísticas <strong>de</strong>scriptivas clásicas re<strong>la</strong>cionadas con los<br />

hechos propiam<strong>en</strong>te dichos, pero nunca se hace verda<strong>de</strong>ro foco <strong>en</strong> <strong>la</strong> persona que<br />

ejecuta dicho <strong>de</strong>lito, el <strong>de</strong>lincu<strong>en</strong>te. Se <strong>en</strong>ti<strong>en</strong><strong>de</strong> que es neces<strong>ar</strong>io un tratami<strong>en</strong>to más<br />

<strong>com</strong>plejo sobre <strong>la</strong> información criminal.<br />

El pres<strong>en</strong>te proyecto se p<strong>la</strong>ntea <strong>en</strong> el p<strong>la</strong>no <strong>de</strong> <strong>la</strong> información criminal, <strong>en</strong>focándose<br />

específicam<strong>en</strong>te <strong>en</strong> los datos <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina registrados por <strong>la</strong><br />

Dirección Nacional <strong>de</strong> Política Criminal <strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong>l Ministerio <strong>de</strong> Justicia y<br />

Derechos Humanos <strong>de</strong> <strong>la</strong> Nación Arg<strong>en</strong>tina.<br />

Se busca <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r y proponer un mo<strong>de</strong>lo metodológico basado <strong>en</strong> <strong>la</strong> minería <strong>de</strong> datos<br />

que ayu<strong>de</strong> a c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> sociedad c<strong>ar</strong>ce<strong>la</strong>ria a fines <strong>de</strong> obt<strong>en</strong>er patrones <strong>de</strong><br />

<strong>com</strong>portami<strong>en</strong>to y conducta <strong>de</strong> los <strong>de</strong>lincu<strong>en</strong>tes. Si se logr<strong>ar</strong>a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r los posibles<br />

motivos que llev<strong>ar</strong>on a <strong>de</strong>linquir a esta porción <strong>de</strong> <strong>la</strong> sociedad, se facilit<strong>ar</strong>ía <strong>la</strong><br />

g<strong>en</strong>eración <strong>de</strong> estrategias <strong>de</strong> prev<strong>en</strong>ción efectivas.<br />

A


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

B


ABSTRACT<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

For several ye<strong>ar</strong>s security has be<strong>en</strong> a recurr<strong>en</strong>t theme in the lives of Arg<strong>en</strong>tineans.<br />

Reducing the crime in<strong>de</strong>x is a very pressing premise for every new administration. To<br />

reduce the amount of criminal acts the first step should be to analyze the politics of<br />

effici<strong>en</strong>t <strong>de</strong>cision-making and the implem<strong>en</strong>tation of prev<strong>en</strong>tive measures reg<strong>ar</strong>ding<br />

criminal and social politics.<br />

The analysis of criminal data g<strong>en</strong>erated by differ<strong>en</strong>t fe<strong>de</strong>ral ag<strong>en</strong>cies is of vital<br />

importance for crime prev<strong>en</strong>tion. It is believed that it is not <strong>en</strong>ough to analyze the<br />

reports on differ<strong>en</strong>t crimes <strong>com</strong>mitted in the past, but it is also necess<strong>ar</strong>y to study the<br />

actual perpetrators of such acts. G<strong>en</strong>erally, studies focus on c<strong>la</strong>ssic <strong>de</strong>scriptive statistics<br />

re<strong>la</strong>ted to the ev<strong>en</strong>ts in question, but never truly focus on the person who <strong>com</strong>mitted the<br />

crime, the criminal. It is therefore un<strong>de</strong>rstood that a more <strong>com</strong>plex managem<strong>en</strong>t of<br />

criminal data is nee<strong>de</strong>d.<br />

The curr<strong>en</strong>t project is based on the criminal information focusing specifically on the<br />

data from the inc<strong>ar</strong>cerated popu<strong>la</strong>tion in Arg<strong>en</strong>tina registered by the Dirección Nacional<br />

<strong>de</strong> Política Criminal (National Dep<strong>ar</strong>tm<strong>en</strong>t of Criminal Law) <strong>de</strong>p<strong>en</strong>ding on the<br />

Ministerio <strong>de</strong> Justicia y Derechos Humanos <strong>de</strong> <strong>la</strong> Nación Arg<strong>en</strong>tina (The Arg<strong>en</strong>tinean<br />

National Ministry of Justice and Human Rights.)<br />

The objective is to <strong>de</strong>velop and propose a methodological mo<strong>de</strong>l based on data mining<br />

that helps ch<strong>ar</strong>acterize the inmate popu<strong>la</strong>tion thus obtaining behavioral and personality<br />

traits of criminals. If an un<strong>de</strong>rstanding can be achieved of the possible motives that<br />

drove this sector of our society to crime, th<strong>en</strong> <strong>de</strong>velopm<strong>en</strong>t of strategies for effective<br />

prev<strong>en</strong>tion would be facilitated.<br />

C


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

D


TABLA DE CONTENIDOS<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

1. INTRODUCCIÓN.....................................................................................................................1<br />

1.1 INTRODUCCIÓN AL PROBLEMA .................................................................................1<br />

1.2 MOTIVACIONES Y DESTINATARIOS ..........................................................................3<br />

1.3 COMPOSICIÓN DEL TRABAJO......................................................................................3<br />

2. ESTADO DE LA CUESTIÓN ..................................................................................................5<br />

2.1 INTRODUCCIÓN A LA MINERÍA DE DATOS..............................................................5<br />

2.1.1 Algoritmos <strong>de</strong> Minería <strong>de</strong> Datos..................................................................................6<br />

2.1.1.1 Algoritmos <strong>de</strong> Clustering o Agrupami<strong>en</strong>to...........................................................7<br />

2.1.1.1.1 SOM ..............................................................................................................7<br />

2.1.1.1.2 K-Means........................................................................................................9<br />

2.1.1.2 Algoritmos <strong>de</strong> C<strong>la</strong>sificación: Inducción .............................................................10<br />

2.1.1.2.1 ID3...............................................................................................................10<br />

2.1.1.2.2 C4.5 .............................................................................................................11<br />

2.1.1.2.3 CHAID ........................................................................................................12<br />

2.1.1.3 Selección <strong>de</strong> atributos.........................................................................................13<br />

2.2 CRIPS-DM: METODOLOGÍA DE PROYECTOS DE MINERÍA DE DATOS.............14<br />

2.2.1 Objetivos <strong>de</strong> cada fase <strong>en</strong> <strong>la</strong> metodología CRISP-DM. .............................................16<br />

2.3 MINERÍA DE DATOS APLICADA A LA INFORMACIÓN CRIMINAL ....................17<br />

2.3.1 Proyecto Able Danger................................................................................................18<br />

2.3.2 Proyecto COPLINK – Universidad <strong>de</strong> Arizona .........................................................19<br />

2.4 INFORMACIÓN CRIMINAL EN ARGENTINA ...........................................................23<br />

2.4.1 Dirección Nacional <strong>de</strong> Política Criminal ...................................................................23<br />

2.4.1.1 Fu<strong>en</strong>tes Oficiales <strong>de</strong> Información y Estudios <strong>de</strong> Victimización........................23<br />

2.4.1.1.1 Sistema Nacional <strong>de</strong> Información Criminal (SNIC) ...................................24<br />

2.4.1.1.2 Sistema Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ)...................................26<br />

2.4.1.1.3 Encuestas <strong>de</strong> Victimización.........................................................................27<br />

2.4.1.1.4 Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) ...28<br />

2.4.1.1.5 Sistema Unificado <strong>de</strong> Registros Criminales (SURC)..................................31<br />

2.4.1.1.6 Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires .........................33<br />

2.5 DIAGNÓSTICO DEL SERVICIO PENITENCIARIO EN ARGENTINA......................34<br />

2.5.1 Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción P<strong>en</strong>al <strong>en</strong> Arg<strong>en</strong>tina..........................................................34<br />

2.5.2 Situación a nivel internacional...................................................................................37<br />

2.5.3 Sobrepob<strong>la</strong>ción y hacinami<strong>en</strong>to <strong>en</strong> Arg<strong>en</strong>tina ...........................................................39<br />

2.5.3.1 Sobrepob<strong>la</strong>ción. Dim<strong>en</strong>sión <strong>de</strong>l problema..........................................................40<br />

2.5.4 Situación p<strong>en</strong>al <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos ................................................................................41<br />

2.5.5 Costo promedio <strong>de</strong> cada preso. ..................................................................................42<br />

2.5.6 Trabajo <strong>en</strong> <strong>la</strong>s cárceles ...............................................................................................43<br />

2.5.7 Reflexiones acerca <strong>de</strong>l diagnóstico <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io..................................43<br />

I


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

3. DESCRIPCIÓN DEL PROBLEMA ....................................................................................... 45<br />

II<br />

3.1. TRATAMIENTO DE LA INFORMACIÓN................................................................... 45<br />

3.2. EL PROBLEMA ESPECÍFICO ...................................................................................... 45<br />

4. SOLUCIÓN............................................................................................................................. 47<br />

4.1 PROPUESTA DE SOLUCIÓN ........................................................................................ 47<br />

4.2 APLICACIÓN DE CRISP-DM ........................................................................................ 47<br />

4.2.1 Fase I: Compr<strong>en</strong>sión <strong>de</strong>l negocio .............................................................................. 48<br />

4.2.1.1 Determin<strong>ar</strong> los objetivos <strong>de</strong>l negocio................................................................ 48<br />

4.2.1.2 Evaluación <strong>de</strong> <strong>la</strong> Situación ................................................................................ 48<br />

4.2.1.3 P<strong>la</strong>n <strong>de</strong> Proyecto................................................................................................. 50<br />

4.2.2 Fase II: Compr<strong>en</strong>sión <strong>de</strong> los datos............................................................................. 51<br />

4.2.2.1 Recolección <strong>de</strong> los datos iniciales...................................................................... 51<br />

4.2.2.2 Descripción <strong>de</strong> los datos iniciales ...................................................................... 52<br />

4.2.2.2.1 Dataset seleccionado .................................................................................. 54<br />

4.2.2.3 Exploración <strong>de</strong> los datos .................................................................................... 58<br />

4.2.2.4 Verificación <strong>de</strong> Calidad <strong>de</strong> los Datos................................................................. 64<br />

4.2.3 Fase III: Prep<strong>ar</strong>ación <strong>de</strong> los datos.............................................................................. 65<br />

4.2.3.1 Prep<strong>ar</strong>ación <strong>de</strong>l Dataset...................................................................................... 65<br />

4.2.3.2 Selección <strong>de</strong> los Datos ...................................................................................... 66<br />

4.2.3.3 Limpieza <strong>de</strong> los Datos....................................................................................... 68<br />

4.2.3.4 Construcción e integración <strong>de</strong> los Datos ........................................................... 68<br />

4.2.4 Fase IV: Mo<strong>de</strong><strong>la</strong>do .................................................................................................... 70<br />

4.2.4.1 Selección <strong>de</strong> <strong>la</strong> técnica <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.................................................................. 71<br />

4.2.4.2 Construcción <strong>de</strong>l mo<strong>de</strong>lo y resultados experim<strong>en</strong>tales ...................................... 71<br />

4.2.4.2.1 Clustering.................................................................................................... 71<br />

4.2.4.2.2 Resultados <strong>de</strong>l Clustering ........................................................................... 72<br />

4.2.4.2.3 Selección <strong>de</strong> Atributos................................................................................ 86<br />

4.2.4.2.4 C<strong>la</strong>sificación ............................................................................................... 87<br />

4.2.4.3 Evalu<strong>ar</strong> el mo<strong>de</strong>lo. ............................................................................................. 96<br />

4.2.5 Fase V: Evaluación.................................................................................................... 97<br />

5. CONCLUSIONES Y REFLEXIONES................................................................................... 99<br />

5.1 CONCLUSIONES DEL PROYECTO ............................................................................. 99<br />

5.2 REFLEXIONES.............................................................................................................. 100<br />

6. FUTURAS LÍNEAS DE INVESTIGACIÓN ....................................................................... 103<br />

7. APORTES REALIZADOS................................................................................................... 105<br />

8. REFERENCIAS.................................................................................................................... 107<br />

9. ANEXOS............................................................................................................................... 111


1. INTRODUCCIÓN<br />

1.1 INTRODUCCIÓN AL PROBLEMA<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

La situación <strong>de</strong>l régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina es un tema que ti<strong>en</strong>e preocupado a<br />

los últimos gobiernos <strong>de</strong>s<strong>de</strong> hace ya v<strong>ar</strong>ios años. Los increm<strong>en</strong>tos <strong>en</strong> <strong>la</strong> pob<strong>la</strong>ción<br />

c<strong>ar</strong>ce<strong>la</strong>ria hac<strong>en</strong> suponer que <strong>la</strong>s tasas <strong>de</strong> <strong>de</strong>litos <strong>de</strong>berían haber bajado, sin emb<strong>ar</strong>go<br />

ocurrió lo contr<strong>ar</strong>io. Des<strong>de</strong> el año 1990 al 2006 el total <strong>de</strong> hechos <strong>de</strong>lictuosos creció <strong>de</strong><br />

560.240 a 1.224.293, lo que repres<strong>en</strong>ta un aum<strong>en</strong>to <strong>de</strong> aproximadam<strong>en</strong>te 119%. A su<br />

vez, <strong>la</strong> pob<strong>la</strong>ción alojada <strong>en</strong> cárceles fe<strong>de</strong>rales creció un 110% <strong>en</strong> el mismo período<br />

[Dirección Nacional <strong>de</strong> Política Criminal, 2006]. Aún más, según un estudio e<strong>la</strong>borado<br />

<strong>en</strong> el Ministerio <strong>de</strong> Justicia, se prevé que el número <strong>de</strong> presos <strong>en</strong> cárceles fe<strong>de</strong>rales<br />

seguirá creci<strong>en</strong>do <strong>en</strong> el futuro llegando a unos 22.000 p<strong>ar</strong>a el año 2025. Esto <strong>de</strong>muestra<br />

que el número <strong>de</strong> personas presas crece a un ritmo mucho mayor que <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>l<br />

país, <strong>la</strong> cual creció solo un 20% <strong>de</strong>s<strong>de</strong> el año 1990 al 2006 [INDEC, 2007].<br />

En lo que refiere al régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina, <strong>la</strong>s estadísticas muestran<br />

números realm<strong>en</strong>te preocupantes <strong>en</strong> todos los aspectos a t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta cuando se<br />

hab<strong>la</strong> <strong>de</strong> cárceles <strong>en</strong> Latinoamérica, p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te <strong>en</strong> Arg<strong>en</strong>tina. La sobrepob<strong>la</strong>ción, el<br />

hacinami<strong>en</strong>to, <strong>la</strong> promiscuidad, el avance <strong>de</strong>l sida, <strong>la</strong> viol<strong>en</strong>cia, son algunos <strong>de</strong> los<br />

temas que se pres<strong>en</strong>tan cuando se hab<strong>la</strong> <strong>de</strong> socieda<strong>de</strong>s c<strong>ar</strong>ce<strong>la</strong>rias <strong>en</strong> Arg<strong>en</strong>tina. Por lo<br />

tanto, se cree que sin una política criminal efici<strong>en</strong>te y rep<strong>ar</strong>adora, será imposible baj<strong>ar</strong><br />

<strong>en</strong> el mediano p<strong>la</strong>zo el alto índice <strong>de</strong> <strong>de</strong>litos exist<strong>en</strong>te. En el capitulo 2.5 se realiza un<br />

diagnóstico sobre el sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> nuestro país, <strong>en</strong> don<strong>de</strong> se pue<strong>de</strong>n observ<strong>ar</strong><br />

<strong>la</strong>s cuestiones p<strong>la</strong>nteadas y sus indicadores.<br />

Debido a estos increm<strong>en</strong>tos y cuestiones a<strong>la</strong>rmantes se cree <strong>de</strong> suma importancia y<br />

relevancia realiz<strong>ar</strong> un estudio que involucre a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina <strong>com</strong>o<br />

punto insos<strong>la</strong>yable <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> política criminal.<br />

La problemática p<strong>la</strong>nteada lleva a <strong>la</strong> necesidad <strong>de</strong> cont<strong>ar</strong> con herrami<strong>en</strong>tas que permitan<br />

<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r un diagnóstico válido sobre el estado actual <strong>de</strong> <strong>la</strong> cuestión c<strong>ar</strong>ce<strong>la</strong>ria, ya que<br />

es <strong>de</strong> vital importancia a los fines <strong>de</strong> aplic<strong>ar</strong> una política eficaz <strong>en</strong> <strong>la</strong> materia. El Sistema<br />

Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) es un aporte <strong>en</strong> tal<br />

s<strong>en</strong>tido. Este sistema <strong>de</strong> información fue implem<strong>en</strong>tado <strong>en</strong> el año 2002 por <strong>la</strong> Dirección<br />

Nacional <strong>de</strong> Política Criminal con el fin <strong>de</strong> cont<strong>ar</strong> con información periódica y uniforme<br />

acerca <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción p<strong>en</strong>al privada <strong>de</strong> libertad <strong>en</strong> <strong>la</strong> República Arg<strong>en</strong>tina. Si bi<strong>en</strong><br />

surg<strong>en</strong> ciertos límites metodológicos, y hasta i<strong>de</strong>ológicos, al result<strong>ar</strong> <strong>la</strong> fu<strong>en</strong>te prim<strong>ar</strong>ia<br />

<strong>de</strong> información los propios organismos <strong>de</strong> ejecución <strong>de</strong> <strong>la</strong> p<strong>en</strong>a, se cree que se trata <strong>de</strong><br />

una bu<strong>en</strong>a mirada sobre <strong>la</strong> cuestión que ti<strong>en</strong>e una <strong>en</strong>orme relevancia [Dirección<br />

Nacional <strong>de</strong> Política Criminal, 2005].<br />

Introducción Patricio Gutiérrez Rüegg 1


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Sin emb<strong>ar</strong>go, se cree que con el solo cont<strong>ar</strong> con estadísticas vincu<strong>la</strong>das a los registros<br />

criminales o, <strong>en</strong> el caso <strong>de</strong>l SNEEP, <strong>de</strong> los criminales propiam<strong>en</strong>te dichos, no es<br />

sufici<strong>en</strong>te p<strong>ar</strong>a po<strong>de</strong>r tom<strong>ar</strong> <strong>de</strong>cisiones <strong>com</strong>pletas y correctas <strong>en</strong> lo que a política<br />

criminal respecta. Tradicionalm<strong>en</strong>te se han hecho análisis <strong>en</strong> intervalos <strong>de</strong> tiempos<br />

acotados sobre alocación <strong>de</strong> recursos p<strong>ar</strong>a <strong>la</strong> prev<strong>en</strong>ción <strong>de</strong> <strong>de</strong>litos basándose <strong>en</strong><br />

resultados obt<strong>en</strong>idos <strong>de</strong> herrami<strong>en</strong>tas estadísticas clásicas. El problema es que estos no<br />

reflejan <strong>la</strong> distribución real <strong>de</strong> <strong>la</strong> actividad criminal, volviéndose no tan útiles p<strong>ar</strong>a el<br />

<strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> medidas prev<strong>en</strong>tivas con el fin <strong>de</strong> evit<strong>ar</strong> hechos <strong>de</strong>lictivos [Corcoran et al,<br />

2004].<br />

Es neces<strong>ar</strong>io un tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información estadística más <strong>com</strong>plejo, aún más<br />

cuando se trabajan con base <strong>de</strong> datos <strong>de</strong> más <strong>de</strong> 50,000 registros, <strong>com</strong>o es el caso <strong>de</strong> <strong>la</strong><br />

pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina. El objetivo prim<strong>ar</strong>io <strong>de</strong> estas bases <strong>de</strong> datos es, <strong>com</strong>o<br />

su nombre indica, almac<strong>en</strong><strong>ar</strong> gran<strong>de</strong>s cantida<strong>de</strong>s <strong>de</strong> datos organizados sigui<strong>en</strong>do un<br />

<strong>de</strong>terminado esquema o mo<strong>de</strong>lo <strong>de</strong> datos que facilite su almac<strong>en</strong>ami<strong>en</strong>to, recuperación y<br />

modificación, pero no así su posterior uso o análisis. En muchos casos los registros<br />

almac<strong>en</strong>ados son <strong>de</strong>masiados gran<strong>de</strong>s y <strong>com</strong>plejos <strong>com</strong>o p<strong>ar</strong>a analiz<strong>ar</strong> [Kant<strong>ar</strong>dzic,<br />

2003].<br />

Una posible herrami<strong>en</strong>ta a utiliz<strong>ar</strong> p<strong>ar</strong>a trat<strong>ar</strong> los gran<strong>de</strong>s volúm<strong>en</strong>es <strong>de</strong> información<br />

almac<strong>en</strong>ados <strong>en</strong> dichas bases <strong>de</strong> datos es <strong>la</strong> técnica <strong>de</strong> Minería <strong>de</strong> Datos. El termino<br />

Minería <strong>de</strong> Datos (Data Mining) pue<strong>de</strong> ser <strong>de</strong>finido <strong>com</strong>o <strong>la</strong> manera no trivial <strong>de</strong><br />

extracción <strong>de</strong> información no implícita, previam<strong>en</strong>te <strong>de</strong>sconocida y pot<strong>en</strong>cialm<strong>en</strong>te útil,<br />

<strong>de</strong> una base <strong>de</strong> datos [Frawley, et al, 1992]. Minería <strong>de</strong> datos repres<strong>en</strong>ta <strong>la</strong> posibilidad<br />

<strong>de</strong> busc<strong>ar</strong> exhaustivam<strong>en</strong>te <strong>de</strong>ntro <strong>de</strong> un gran volum<strong>en</strong> <strong>de</strong> datos, información y<br />

conocimi<strong>en</strong>to que pue<strong>de</strong>n result<strong>ar</strong> <strong>de</strong> mucho valor. Es consi<strong>de</strong>rada uno <strong>de</strong> los puntos<br />

más importantes <strong>de</strong> los sistemas expertos <strong>de</strong> base <strong>de</strong> datos, y uno <strong>de</strong> los <strong>de</strong>s<strong>ar</strong>rollos más<br />

prometedores <strong>en</strong> <strong>la</strong> industria <strong>de</strong>l manejo <strong>de</strong> <strong>la</strong> información [C<strong>ar</strong>tag<strong>en</strong>ova, 2005].<br />

En el m<strong>ar</strong>co internacional el uso <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos aplicado a <strong>la</strong> intelig<strong>en</strong>cia<br />

criminal ha t<strong>en</strong>ido un gran crecimi<strong>en</strong>to <strong>en</strong> los últimos años <strong>en</strong> EEUU [Ch<strong>en</strong> et al, 2004].<br />

A modo <strong>de</strong> ejemplo, ha sido m<strong>en</strong>cionado <strong>com</strong>o el método mediante el cual<br />

supuestam<strong>en</strong>te <strong>la</strong>s fuerzas <strong>ar</strong>madas estadouni<strong>de</strong>nses habrían i<strong>de</strong>ntificado al lí<strong>de</strong>r <strong>de</strong> los<br />

ataques <strong>de</strong>l 11 <strong>de</strong> Septiembre <strong>de</strong> 2001, Mohamed Atta, junto a otros 3 terroristas <strong>com</strong>o<br />

posibles miembros <strong>de</strong> una célu<strong>la</strong> <strong>de</strong> Al Qaeda operando <strong>en</strong> ese país más <strong>de</strong> un año<br />

previo a los ataques.<br />

En este contexto, el objetivo principal <strong>de</strong> este trabajo es estudi<strong>ar</strong> <strong>la</strong> factibilidad y valor<br />

agregado <strong>de</strong> aplic<strong>ar</strong> técnicas <strong>de</strong> minería <strong>de</strong> datos p<strong>ar</strong>a c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción<br />

ubicada <strong>en</strong> <strong>la</strong>s cárceles <strong>ar</strong>g<strong>en</strong>tinas, obt<strong>en</strong>i<strong>en</strong>do patrones <strong>de</strong> <strong>com</strong>portami<strong>en</strong>tos y<br />

conductas, a fines <strong>de</strong> po<strong>de</strong>r extraer conclusiones p<strong>ar</strong>a <strong>la</strong> prev<strong>en</strong>ción <strong>de</strong> <strong>de</strong>litos.<br />

2<br />

Patricio Gutiérrez Rüegg Introducción


1.2 MOTIVACIONES Y DESTINATARIOS<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Luego <strong>de</strong> leer proyectos <strong>de</strong> colegas re<strong>la</strong>cionados con <strong>la</strong> minería <strong>de</strong> datos e información<br />

criminal [Perversi, 2007; Val<strong>en</strong>ga, 2007], me p<strong>ar</strong>eció muy interesante po<strong>de</strong>r seguir<br />

dicha línea <strong>de</strong> investigación pero haci<strong>en</strong>do foco no <strong>en</strong> los <strong>de</strong>litos propiam<strong>en</strong>te dichos<br />

sino precisam<strong>en</strong>te <strong>en</strong> <strong>la</strong>s personas que <strong>com</strong>et<strong>en</strong> dichos hechos <strong>de</strong>lictuosos. Se espera<br />

que mediante el pres<strong>en</strong>te trabajo se pueda contribuir p<strong>ar</strong>a llev<strong>ar</strong> a cabo t<strong>ar</strong>eas y<br />

activida<strong>de</strong>s <strong>en</strong> materia <strong>de</strong> política criminal, que logr<strong>en</strong> disminuir hechos <strong>de</strong>lictivos a<br />

través <strong>la</strong> pres<strong>en</strong>tación, <strong>de</strong>scripción y aplicación <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos <strong>com</strong>o herrami<strong>en</strong>ta<br />

que ayuda al análisis y tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información criminal.<br />

Es importante <strong>de</strong>stac<strong>ar</strong>, que no se <strong>en</strong>contr<strong>ar</strong>on registros sobre trabajos o proyectos <strong>en</strong><br />

don<strong>de</strong> se aplic<strong>ar</strong>an herrami<strong>en</strong>tas <strong>com</strong>o <strong>la</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones c<strong>ar</strong>ce<strong>la</strong>rias, lo<br />

cual repres<strong>en</strong>ta una motivación extra.<br />

El pres<strong>en</strong>te informe se <strong>en</strong>cu<strong>en</strong>tra dirigido a aquel<strong>la</strong>s personas involucradas <strong>en</strong> <strong>la</strong><br />

creación <strong>de</strong> política criminal <strong>com</strong>o a los interesados <strong>en</strong> conocer <strong>la</strong> utilidad <strong>de</strong> esta<br />

técnica p<strong>ar</strong>a <strong>la</strong> mo<strong>de</strong>rnización <strong>de</strong> <strong>la</strong>s prácticas <strong>de</strong> información criminal <strong>en</strong> Arg<strong>en</strong>tina.<br />

1.3 COMPOSICIÓN DEL TRABAJO<br />

El pres<strong>en</strong>te trabajo se <strong>en</strong>cu<strong>en</strong>tra estructurado <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera.<br />

Capitulo 1: Introducción.<br />

Se da una breve <strong>de</strong>scripción a <strong>la</strong>s razones que llev<strong>ar</strong>on a <strong>la</strong> realización <strong>de</strong>l proyecto<br />

final. A su vez se nombran <strong>la</strong>s motivaciones, <strong>de</strong>stinat<strong>ar</strong>ios y <strong>com</strong>o se organiza el<br />

trabajo.<br />

Capitulo 2: Estado <strong>de</strong> <strong>la</strong> cuestión.<br />

Comi<strong>en</strong>za con una introducción a <strong>la</strong> minería <strong>de</strong> datos (MD) y <strong>la</strong> metodología elegida<br />

p<strong>ar</strong>a llev<strong>ar</strong> a cabo el proyecto <strong>de</strong> MD. Continúa con aplicaciones <strong>de</strong> <strong>la</strong> MD <strong>en</strong><br />

información criminal, tanto a nivel nacional <strong>com</strong>o internacional. Luego sigue con <strong>la</strong><br />

<strong>de</strong>scripción <strong>de</strong> <strong>la</strong> información criminal exist<strong>en</strong>te <strong>en</strong> Arg<strong>en</strong>tina. Finalm<strong>en</strong>te, se da un<br />

diagnóstico <strong>de</strong> <strong>la</strong> situación c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina, mostrando todos los problemas<br />

exist<strong>en</strong>tes <strong>en</strong> dicho régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io.<br />

Capitulo 3: Descripción <strong>de</strong>l problema.<br />

Pres<strong>en</strong>ta al problema que se quiere resolver y los principales motivos <strong>de</strong> su elección.<br />

Introducción Patricio Gutiérrez Rüegg 3


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Capitulo 4: Solución<br />

En el pres<strong>en</strong>te capitulo se propone una solución al problema p<strong>la</strong>nteado <strong>en</strong> el capitulo 3.<br />

Se <strong>de</strong>ci<strong>de</strong> aplic<strong>ar</strong> <strong>la</strong> metodología CRISP-DM al trabajo, pasando por todas sus fases.<br />

Capitulo 5: Conclusiones y Reflexiones.<br />

Se pres<strong>en</strong>tan <strong>la</strong>s principales conclusiones <strong>de</strong>l proyecto. Se escrib<strong>en</strong> reflexiones sobre el<br />

tema investigado y el conocimi<strong>en</strong>to adquirido.<br />

Capitulo 6: Futuras líneas <strong>de</strong> investigación.<br />

El pres<strong>en</strong>te capítulo contemp<strong>la</strong> el abordaje <strong>de</strong> <strong>la</strong>s futuras líneas <strong>de</strong> investigación<br />

re<strong>la</strong>cionadas al proyecto <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do.<br />

Capitulo 7: Aportes realizados.<br />

Se m<strong>en</strong>cionan los aportes realizados por el proyecto realizado.<br />

Capitulo 8: Refer<strong>en</strong>cias.<br />

Bibliografía utilizada p<strong>ar</strong>a <strong>la</strong> e<strong>la</strong>boración <strong>de</strong> <strong>la</strong> tesis.<br />

Capitulo 9: Anexos.<br />

4<br />

Patricio Gutiérrez Rüegg Introducción


2. ESTADO DE LA CUESTIÓN<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

2.1 INTRODUCCIÓN A LA MINERÍA DE DATOS<br />

El termino minería <strong>de</strong> datos es una etapa <strong>de</strong>ntro <strong>de</strong> un proceso mayor l<strong>la</strong>mado<br />

Extracción <strong>de</strong> Conocimi<strong>en</strong>to <strong>en</strong> Bases <strong>de</strong> Datos (Knowledge Discovery in Databases o<br />

KDD) [Figura 2.1], aunque ambos términos se usan <strong>de</strong> manera indistinta. Lo que <strong>en</strong><br />

verdad hace <strong>la</strong> minería <strong>de</strong> datos es reunir <strong>la</strong>s v<strong>en</strong>tajas <strong>de</strong> v<strong>ar</strong>ias áreas <strong>com</strong>o <strong>la</strong><br />

estadística, <strong>la</strong> intelig<strong>en</strong>cia <strong>ar</strong>tificial, <strong>la</strong> <strong>com</strong>putación gráfica, <strong>la</strong>s bases <strong>de</strong> datos y el<br />

procesami<strong>en</strong>to masivo, principalm<strong>en</strong>te usando <strong>com</strong>o materia prima <strong>la</strong>s bases <strong>de</strong> datos.<br />

Una <strong>de</strong>finición tradicional [Fayyad et al, 1996] podría ser <strong>la</strong> sigui<strong>en</strong>te: “Un proceso no<br />

trivial <strong>de</strong> i<strong>de</strong>ntificación válida, novedosa, pot<strong>en</strong>cialm<strong>en</strong>te útil y <strong>en</strong>t<strong>en</strong>dible, <strong>de</strong> patrones<br />

<strong>com</strong>pr<strong>en</strong>sibles que se <strong>en</strong>cu<strong>en</strong>tran ocultos <strong>en</strong> los datos”<br />

Figura 2.1. Proceso <strong>de</strong> Knowledge Discovery in Databases.<br />

El creci<strong>en</strong>te volum<strong>en</strong> <strong>de</strong> datos <strong>en</strong> todas <strong>la</strong>s áreas <strong>de</strong> aplicación humana <strong>de</strong>manda nuevas<br />

y po<strong>de</strong>rosas técnicas <strong>de</strong> transformación <strong>de</strong> los datos <strong>en</strong> conocimi<strong>en</strong>to útil. Se pue<strong>de</strong><br />

<strong>de</strong>cir que <strong>la</strong> minería <strong>de</strong> datos es un avance <strong>en</strong> dicha cuestión. Busca g<strong>en</strong>er<strong>ar</strong> información<br />

simi<strong>la</strong>r a <strong>la</strong> que podría producir un experto humano, que a<strong>de</strong>más satisfaga el Principio<br />

<strong>de</strong> Compr<strong>en</strong>sibilidad (utiliz<strong>ar</strong> l<strong>en</strong>guaje a<strong>de</strong>cuado a <strong>la</strong> temática <strong>de</strong>l trabajo) [Britos et al,<br />

2005].<br />

El objetivo <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos es <strong>de</strong>scubrir <strong>com</strong>portami<strong>en</strong>tos interesantes <strong>com</strong>o lo<br />

son patrones, asociaciones, cambios, anomalías y estructuras significativas a p<strong>ar</strong>tir <strong>de</strong><br />

gran<strong>de</strong>s cantida<strong>de</strong>s <strong>de</strong> datos almac<strong>en</strong>ados <strong>en</strong> bases <strong>de</strong> datos, data w<strong>ar</strong>ehouses o<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 5


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

cualquier otro medio <strong>de</strong> almac<strong>en</strong>ami<strong>en</strong>to <strong>de</strong> información [Britos et Al, 2005].<br />

La minería <strong>de</strong> datos produce, mediante diversas técnicas y algoritmos, cinco tipos <strong>de</strong><br />

información:<br />

6<br />

• Clustering o agrupami<strong>en</strong>to<br />

• Inducciones o c<strong>la</strong>sificaciones<br />

• Asociaciones<br />

• Secu<strong>en</strong>cias<br />

• Pronósticos<br />

2.1.1 Algoritmos <strong>de</strong> Minería <strong>de</strong> Datos<br />

Se <strong>de</strong>fine algoritmo <strong>de</strong> minería <strong>de</strong> datos [The<strong>ar</strong>ling, 2007] al mecanismo utilizado p<strong>ar</strong>a<br />

<strong>la</strong> creación <strong>de</strong> mo<strong>de</strong>los. P<strong>ar</strong>a cre<strong>ar</strong> un mo<strong>de</strong>lo, un algoritmo analiza primero un conjunto<br />

<strong>de</strong> datos, buscando patrones y t<strong>en</strong><strong>de</strong>ncias específicos. Después, el algoritmo utiliza los<br />

resultados <strong>de</strong> este análisis p<strong>ar</strong>a <strong>de</strong>finir los p<strong>ar</strong>ámetros <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos.<br />

Los algoritmos <strong>de</strong> minería <strong>de</strong> datos [Weiss & Indurkhya, 1998] se c<strong>la</strong>sifican <strong>en</strong> dos<br />

gran<strong>de</strong>s categorías:<br />

• Supervisados (o predictivos): Predic<strong>en</strong> el valor <strong>de</strong> un atributo (etiqueta) <strong>de</strong> un<br />

conjunto <strong>de</strong> datos, conocidos otros atributos (atributos <strong>de</strong>scriptivos). A p<strong>ar</strong>tir <strong>de</strong><br />

datos cuya etiqueta se conoce se induce una re<strong>la</strong>ción <strong>en</strong>tre dicha etiqueta y otra<br />

serie <strong>de</strong> atributos. Esas re<strong>la</strong>ciones sirv<strong>en</strong> p<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> predicción <strong>en</strong> datos<br />

cuya etiqueta es <strong>de</strong>sconocida. Se <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong> <strong>en</strong> dos fases: Entr<strong>en</strong>ami<strong>en</strong>to y<br />

prueba.<br />

• No Supervisados (o <strong>de</strong> <strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> conocimi<strong>en</strong>to): Cuando una aplicación<br />

no es lo sufici<strong>en</strong>tem<strong>en</strong>te madura no ti<strong>en</strong>e el pot<strong>en</strong>cial neces<strong>ar</strong>io p<strong>ar</strong>a una<br />

solución predictiva. En ese caso hay que utiliz<strong>ar</strong> métodos no supervisados o <strong>de</strong><br />

<strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> conocimi<strong>en</strong>to, los cuales <strong>de</strong>scubr<strong>en</strong> <strong>com</strong>portami<strong>en</strong>tos,<br />

patrones y t<strong>en</strong><strong>de</strong>ncias <strong>en</strong> los datos actuales (no utilizan información histórica). El<br />

<strong>de</strong>scubrimi<strong>en</strong>to sirve p<strong>ar</strong>a llev<strong>ar</strong> a cabo acciones y obt<strong>en</strong>er un b<strong>en</strong>eficio <strong>de</strong> el<strong>la</strong>s.<br />

En <strong>la</strong> tab<strong>la</strong> 2.1 se pue<strong>de</strong>n observ<strong>ar</strong> algunas <strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos <strong>de</strong> ambas<br />

categorías, supervisados y no supervisados.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Supervisados No Supervisados<br />

Arboles <strong>de</strong> Decisión Detección <strong>de</strong> <strong>de</strong>svíos<br />

Inducción Neuronal Segm<strong>en</strong>tación<br />

Regresión Agrupami<strong>en</strong>to ("clustering")<br />

Series Temporales Reg<strong>la</strong>s <strong>de</strong> Asociación<br />

Patrones Secu<strong>en</strong>ciales<br />

Tab<strong>la</strong> 2.1. C<strong>la</strong>sificación <strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos.<br />

2.1.1.1 Algoritmos <strong>de</strong> Clustering o Agrupami<strong>en</strong>to<br />

El clustering consiste <strong>en</strong> agrup<strong>ar</strong> un conjunto <strong>de</strong> datos sin t<strong>en</strong>er c<strong>la</strong>ses pre<strong>de</strong>finidas,<br />

basándose <strong>en</strong> <strong>la</strong> similitud <strong>de</strong> los valores <strong>de</strong> los atributos <strong>de</strong> los distintos datos. Este tipo<br />

<strong>de</strong> algoritmo, tal <strong>com</strong>o lo muestra <strong>la</strong> tab<strong>la</strong> 2.1, se realiza <strong>en</strong> forma no supervisada, ya<br />

que no se sab<strong>en</strong> <strong>de</strong> antemano <strong>la</strong>s c<strong>la</strong>ses <strong>de</strong>l conjunto <strong>de</strong> datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to. El<br />

clustering i<strong>de</strong>ntifica regiones <strong>de</strong>nsam<strong>en</strong>te pob<strong>la</strong>das, <strong>de</strong> acuerdo a alguna medida <strong>de</strong><br />

distancia, <strong>en</strong> un gran conjunto <strong>de</strong> datos multidim<strong>en</strong>sional [Ch<strong>en</strong> & Han, 1996]. Se basa<br />

<strong>en</strong> maximiz<strong>ar</strong> <strong>la</strong> similitud <strong>de</strong> <strong>la</strong>s instancias <strong>en</strong> cada cluster y minimiz<strong>ar</strong> <strong>la</strong> similitud <strong>en</strong>tre<br />

clusters [Han & Kamber, 2001].<br />

El análisis <strong>de</strong> clusters [C<strong>ar</strong>tag<strong>en</strong>ova, 2005] es utilizado <strong>en</strong> numerosas aplicaciones tales<br />

<strong>com</strong>o reconocimi<strong>en</strong>to <strong>de</strong> patrones, análisis <strong>de</strong> datos, procesami<strong>en</strong>to <strong>de</strong> imág<strong>en</strong>es e<br />

investigaciones <strong>de</strong> mercado. Como función <strong>de</strong> <strong>la</strong> MD, el análisis <strong>de</strong> clusters pue<strong>de</strong> ser<br />

utilizado <strong>com</strong>o una herrami<strong>en</strong>ta in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>te p<strong>ar</strong>a obt<strong>en</strong>er una visión <strong>de</strong> <strong>la</strong> distribución<br />

<strong>de</strong> los datos, p<strong>ar</strong>a observ<strong>ar</strong> <strong>la</strong>s c<strong>ar</strong>acterísticas <strong>de</strong> cada cluster y <strong>en</strong>foc<strong>ar</strong> un análisis más<br />

exhaustivo hacia un grupo o cluster <strong>de</strong>terminado. Alternativam<strong>en</strong>te, pue<strong>de</strong> servir <strong>com</strong>o<br />

un paso <strong>de</strong>l preprocesami<strong>en</strong>to <strong>de</strong> los datos p<strong>ar</strong>a otros algoritmos, <strong>com</strong>o por ejemplo, el<br />

<strong>de</strong> c<strong>la</strong>sificaciones <strong>en</strong> el cual se trabaj<strong>ar</strong>ía luego sobre los clusters originados.<br />

El clustering <strong>de</strong> datos esta <strong>en</strong> continuo <strong>de</strong>s<strong>ar</strong>rollo, y <strong>de</strong>bido a los gran<strong>de</strong>s volúm<strong>en</strong>es <strong>de</strong><br />

datos almac<strong>en</strong>ados <strong>en</strong> <strong>la</strong>s bases <strong>de</strong> datos, el análisis <strong>de</strong> clusters se ha vuelto muy<br />

importante <strong>en</strong> los estudios <strong>de</strong> MD.<br />

2.1.1.1.1 SOM<br />

Una <strong>de</strong> <strong>la</strong>s técnicas más utilizadas p<strong>ar</strong>a realiz<strong>ar</strong> clustering es <strong>la</strong> <strong>de</strong> SOM (Self<br />

Organizing Maps). Este mo<strong>de</strong>lo no supervisado <strong>de</strong> red neuronal fue creado por Teuvo<br />

Kohon<strong>en</strong> <strong>en</strong> 1982, basándose <strong>en</strong> el funcionami<strong>en</strong>to <strong>de</strong> <strong>la</strong>s neuronas biológicas. Vale<br />

record<strong>ar</strong>, que <strong>la</strong>s re<strong>de</strong>s neuronales son mo<strong>de</strong>los que int<strong>en</strong>tan reproducir el<br />

<strong>com</strong>portami<strong>en</strong>to <strong>de</strong>l cerebro. Del mismo modo que aquél, realiza una simplificación,<br />

averiguando cuales son los elem<strong>en</strong>tos relevantes <strong>de</strong>l sistema. El objetivo <strong>de</strong> Kohon<strong>en</strong><br />

era <strong>de</strong>mostr<strong>ar</strong> que un estímulo externo por sí solo, suponi<strong>en</strong>do una estructura propia y<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 7


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

una <strong>de</strong>scripción funcional <strong>de</strong>l <strong>com</strong>portami<strong>en</strong>to <strong>de</strong> <strong>la</strong> red, era sufici<strong>en</strong>te p<strong>ar</strong>a forz<strong>ar</strong> <strong>la</strong><br />

formación <strong>de</strong> los mapas.<br />

El mo<strong>de</strong>lo ti<strong>en</strong>e dos v<strong>ar</strong>iantes, LVQ (Le<strong>ar</strong>ning Vector Quantization) y TPM (Topology<br />

Preserving Map) o SOM (Self Organizing Map). Ambas se basan <strong>en</strong> el principio <strong>de</strong><br />

formación <strong>de</strong> mapas topológicos p<strong>ar</strong>a establecer c<strong>ar</strong>acterísticas <strong>com</strong>unes <strong>en</strong>tre <strong>la</strong>s<br />

informaciones (vectores) <strong>de</strong> <strong>en</strong>trada a <strong>la</strong> red, aunque difier<strong>en</strong> <strong>en</strong> <strong>la</strong>s dim<strong>en</strong>siones <strong>de</strong><br />

éstos, si<strong>en</strong>do <strong>de</strong> una so<strong>la</strong> dim<strong>en</strong>sión <strong>en</strong> el caso <strong>de</strong> LVQ y bidim<strong>en</strong>sional e incluso<br />

tridim<strong>en</strong>sional <strong>en</strong> <strong>la</strong> red SOM o TPM.<br />

El mo<strong>de</strong>lo pres<strong>en</strong>ta dos capas con N neuronas <strong>de</strong> <strong>en</strong>trada y M <strong>de</strong> salida [Figura 2.2].<br />

Cada una <strong>de</strong> <strong>la</strong>s N neuronas <strong>de</strong> <strong>en</strong>trada se conecta a <strong>la</strong>s M <strong>de</strong> salida a través <strong>de</strong><br />

conexiones hacia <strong>de</strong><strong>la</strong>nte (feedforw<strong>ar</strong>d). Entre <strong>la</strong>s neuronas <strong>de</strong> <strong>la</strong> capa <strong>de</strong> salida, exist<strong>en</strong><br />

conexiones <strong>la</strong>terales <strong>de</strong> inhibición (peso negativo) implícitas, a pes<strong>ar</strong> <strong>de</strong> no est<strong>ar</strong><br />

conectadas, cada una <strong>de</strong> estas neuronas va a t<strong>en</strong>er cierta influ<strong>en</strong>cia sobre sus vecinas. El<br />

valor que se asigne a los pesos <strong>de</strong> <strong>la</strong>s conexiones feedforw<strong>ar</strong>d <strong>en</strong>tre <strong>la</strong>s capas <strong>de</strong> <strong>en</strong>trada<br />

y salida (Wij) durante el proceso <strong>de</strong> apr<strong>en</strong>dizaje <strong>de</strong> <strong>la</strong> red va a <strong>de</strong>p<strong>en</strong><strong>de</strong>r precisam<strong>en</strong>te <strong>de</strong><br />

esta interacción <strong>la</strong>teral. La influ<strong>en</strong>cia que cada neurona ejerce sobre <strong>la</strong>s <strong>de</strong>más es<br />

función <strong>de</strong> <strong>la</strong> distancia <strong>en</strong>tre el<strong>la</strong>s, si<strong>en</strong>do muy pequeñas cuando están muy alejadas.<br />

8<br />

Figura 2.2. Estructura <strong>de</strong> una red <strong>de</strong> Kohon<strong>en</strong>.<br />

Los puntos que están cerca unos <strong>de</strong> los otros <strong>en</strong> el espacio original <strong>de</strong> <strong>en</strong>trada son<br />

“mapeados” a neuronas cercanas <strong>en</strong> SOM. Las neuronas usualm<strong>en</strong>te forman un mapa<br />

bidim<strong>en</strong>sional, por lo que el mapeo transforma un problema <strong>de</strong> muchas dim<strong>en</strong>siones <strong>en</strong><br />

el espacio, a un p<strong>la</strong>no.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


2.1.1.1.2 K-Means<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Otro <strong>de</strong> los algoritmos más utilizados cuando se hab<strong>la</strong> <strong>de</strong> clustering es el K-Medias o<br />

K-Means. Se trata <strong>de</strong> un método <strong>de</strong> agrupami<strong>en</strong>to por vecindad <strong>en</strong> el que se p<strong>ar</strong>te <strong>de</strong> un<br />

número <strong>de</strong>terminado <strong>de</strong> prototipos y <strong>de</strong> un conjunto <strong>de</strong> ejemplos a agrup<strong>ar</strong> sin etiquet<strong>ar</strong>.<br />

Es el método más popu<strong>la</strong>r <strong>de</strong> los métodos <strong>de</strong> agrupami<strong>en</strong>to “por p<strong>ar</strong>tición”.<br />

La i<strong>de</strong>a <strong>de</strong> K-Means es situ<strong>ar</strong> a los prototipos o c<strong>en</strong>tros <strong>en</strong> el espacio, <strong>de</strong> forma que los<br />

datos pert<strong>en</strong>eci<strong>en</strong>tes al mismo prototipo t<strong>en</strong>gan c<strong>ar</strong>acterísticas simi<strong>la</strong>res [Moody &<br />

Drak<strong>en</strong>, 1989]. Todo ejemplo nuevo, una vez que los prototipos han sido correctam<strong>en</strong>te<br />

situados, es <strong>com</strong>p<strong>ar</strong>ado con estos y asociado a aquel que sea el más próximo, <strong>en</strong> los<br />

términos <strong>de</strong> una distancia previam<strong>en</strong>te elegida. Normalm<strong>en</strong>te, se utiliza <strong>la</strong> distancia<br />

euclidiana.<br />

La etapa <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to <strong>de</strong>l método pue<strong>de</strong> ser l<strong>en</strong>ta <strong>de</strong>p<strong>en</strong>di<strong>en</strong>do <strong>de</strong>l número <strong>de</strong><br />

puntos a c<strong>la</strong>sific<strong>ar</strong> y <strong>de</strong> <strong>la</strong> dim<strong>en</strong>sión <strong>de</strong>l problema. Una vez superada esta fase, <strong>la</strong><br />

c<strong>la</strong>sificación <strong>de</strong> nuevos datos se torna rápida, <strong>de</strong>bido a que <strong>la</strong> <strong>com</strong>p<strong>ar</strong>ación <strong>de</strong> distancias<br />

es solo con los prototipos.<br />

El objetivo que se busca mediante el algoritmo K-Means es minimiz<strong>ar</strong> <strong>la</strong> v<strong>ar</strong>ianza total<br />

intra-grupo o <strong>la</strong> función <strong>de</strong> error cuadrático [Figura 2.3]:<br />

K<br />

∑∑<br />

V = χ − μ<br />

i= 0 j∈Si<br />

Figura 2.3. Error cuadrático K-Means<br />

Don<strong>de</strong> exist<strong>en</strong> K grupos Si i=1,2,…, k y μi es el punto medio o c<strong>en</strong>troi<strong>de</strong> <strong>de</strong> todos los<br />

puntos Xj Si.<br />

K-Means <strong>com</strong>i<strong>en</strong>za p<strong>ar</strong>ticionando los datos <strong>en</strong> k subconjuntos no vacíos, aleatoriam<strong>en</strong>te<br />

o usando alguna heurística. Luego calcu<strong>la</strong> el c<strong>en</strong>troi<strong>de</strong> <strong>de</strong> cada p<strong>ar</strong>tición <strong>com</strong>o el punto<br />

medio <strong>de</strong>l cluster y asigna cada dato al cluster cuyo c<strong>en</strong>troi<strong>de</strong> sea el más próximo.<br />

Luego los c<strong>en</strong>troi<strong>de</strong>s son recalcu<strong>la</strong>dos p<strong>ar</strong>a los grupos nuevos y el algoritmo se repite<br />

hasta <strong>la</strong> converg<strong>en</strong>cia, <strong>la</strong> cual es obt<strong>en</strong>ida cuando no haya más datos que cambi<strong>en</strong> <strong>de</strong><br />

grupo <strong>de</strong> una iteración a otra.<br />

P<strong>ar</strong>a calcu<strong>la</strong>r el c<strong>en</strong>troi<strong>de</strong> más cercano a cada punto se <strong>de</strong>be utiliz<strong>ar</strong> una función <strong>de</strong><br />

distancia. P<strong>ar</strong>a datos reales se suele utiliz<strong>ar</strong> <strong>la</strong> distancia euclidiana. P<strong>ar</strong>a datos<br />

categóricos se <strong>de</strong>be establecer una función específica <strong>de</strong> distancia p<strong>ar</strong>a ese conjunto <strong>de</strong><br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 9<br />

j<br />

i<br />

2


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

datos. Algunas <strong>de</strong> <strong>la</strong>s opciones son utiliz<strong>ar</strong> una matriz <strong>de</strong> distancias pre<strong>de</strong>finidas o una<br />

función heurística.<br />

Dado k, el algoritmo K-Means se implem<strong>en</strong>ta <strong>en</strong> los sigui<strong>en</strong>tes 4 pasos [Ale, 2005]:<br />

10<br />

1. P<strong>ar</strong>ticion<strong>ar</strong> los objetos <strong>en</strong> k subconjuntos no vacíos.<br />

2. Comput<strong>ar</strong> los c<strong>en</strong>troi<strong>de</strong>s <strong>de</strong> los clusters <strong>de</strong> <strong>la</strong> p<strong>ar</strong>tición corri<strong>en</strong>te. El c<strong>en</strong>troi<strong>de</strong> es<br />

el c<strong>en</strong>tro (punto medio) <strong>de</strong>l cluster.<br />

3. Asign<strong>ar</strong> cada objeto al cluster cuyo c<strong>en</strong>troi<strong>de</strong> sea más cercano.<br />

4. Volver al paso 2, y p<strong>ar</strong><strong>ar</strong> cuando no existan más reasignaciones.<br />

2.1.1.2 Algoritmos <strong>de</strong> C<strong>la</strong>sificación: Inducción<br />

Los algoritmos <strong>de</strong> c<strong>la</strong>sificación se utilizan p<strong>ar</strong>a c<strong>la</strong>sific<strong>ar</strong> un conjunto <strong>de</strong> datos basado<br />

<strong>en</strong> los valores <strong>de</strong> sus atributos [Serv<strong>en</strong>te & G<strong>ar</strong>cía-M<strong>ar</strong>tínez, 2002].<br />

Este proceso <strong>en</strong>cu<strong>en</strong>tra <strong>la</strong>s propieda<strong>de</strong>s <strong>com</strong>unes <strong>en</strong>tre un conjunto <strong>de</strong> objetos y los<br />

c<strong>la</strong>sifica <strong>en</strong> difer<strong>en</strong>tes c<strong>la</strong>ses <strong>de</strong> acuerdo al mo<strong>de</strong>lo utilizado. P<strong>ar</strong>a construir el mismo se<br />

utiliza un conjunto <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to, <strong>en</strong> que cada instancia consiste <strong>en</strong> un conjunto <strong>de</strong><br />

atributos y el valor <strong>de</strong> <strong>la</strong> c<strong>la</strong>se a <strong>la</strong> cual pert<strong>en</strong>ece. El objetivo <strong>de</strong> <strong>la</strong> c<strong>la</strong>sificación es<br />

analiz<strong>ar</strong> los datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to y, mediante un método supervisado, <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r una<br />

<strong>de</strong>scripción o un mo<strong>de</strong>lo p<strong>ar</strong>a cada c<strong>la</strong>se utilizando <strong>la</strong>s c<strong>ar</strong>acterísticas disponibles <strong>en</strong> los<br />

datos. Esta <strong>de</strong>scripción o mo<strong>de</strong>lo es utilizado p<strong>ar</strong>a c<strong>la</strong>sific<strong>ar</strong> otras instancias, cuya c<strong>la</strong>se<br />

es <strong>de</strong>sconocida. El método se conoce <strong>com</strong>o supervisado <strong>de</strong>bido a que, p<strong>ar</strong>a el conjunto<br />

<strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to, se conoce <strong>la</strong> c<strong>la</strong>se a <strong>la</strong> cual pert<strong>en</strong>ece cada instancia y se lo indica al<br />

mo<strong>de</strong>lo si <strong>la</strong> c<strong>la</strong>sificación que realiza es correcta [Ch<strong>en</strong> et al,1996].<br />

Los algoritmos más utilizados p<strong>ar</strong>a <strong>la</strong> c<strong>la</strong>sificación son los algoritmos <strong>de</strong> inducción.<br />

Aún cuando exist<strong>en</strong> v<strong>ar</strong>ios <strong>en</strong>foques p<strong>ar</strong>a los algoritmos <strong>de</strong> inducción, se trabaj<strong>ar</strong>á con<br />

aquellos que g<strong>en</strong>eran árboles <strong>de</strong> <strong>de</strong>cisión conocida <strong>com</strong>o <strong>la</strong> familia TDIT (Top Down<br />

Induction Trees). Cada hoja <strong>de</strong>l árbol posee un nombre <strong>de</strong> c<strong>la</strong>se, cada nodo interior<br />

especifica una evaluación <strong>en</strong> un atributo y cada rama repres<strong>en</strong>ta un resultado <strong>de</strong> esa<br />

evaluación. La calidad <strong>de</strong> un árbol <strong>de</strong>p<strong>en</strong><strong>de</strong> <strong>de</strong> <strong>la</strong> precisión <strong>de</strong> <strong>la</strong> c<strong>la</strong>sificación y <strong>de</strong>l<br />

tamaño <strong>de</strong>l árbol. En p<strong>ar</strong>ticu<strong>la</strong>r se h<strong>ar</strong>á hincapié <strong>en</strong> los algoritmos ID3, C4.5 y CHAID.<br />

2.1.1.2.1 ID3<br />

El ID3 (Iterative Dichotomiser 3) <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do <strong>en</strong> los años och<strong>en</strong>ta por Ross Quin<strong>la</strong>n, es<br />

un sistema <strong>de</strong> apr<strong>en</strong>dizaje supervisado que construye árboles <strong>de</strong> <strong>de</strong>cisión a p<strong>ar</strong>tir <strong>de</strong> un<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

conjunto <strong>de</strong> ejemplos [Serv<strong>en</strong>te & G<strong>ar</strong>cía M<strong>ar</strong>tínez, 2002]. Estos ejemplos están<br />

constituidos por un conjunto <strong>de</strong> atributos y un c<strong>la</strong>sificador o c<strong>la</strong>se. Los dominios <strong>de</strong> los<br />

atributos y <strong>de</strong> <strong>la</strong>s c<strong>la</strong>ses <strong>de</strong>b<strong>en</strong> ser discretos. A<strong>de</strong>más, <strong>la</strong>s c<strong>la</strong>ses <strong>de</strong>b<strong>en</strong> ser disjuntas. Las<br />

primeras versiones <strong>de</strong>l ID3 g<strong>en</strong>eraban <strong>de</strong>scripciones únicam<strong>en</strong>te p<strong>ar</strong>a dos c<strong>la</strong>ses, <strong>com</strong>o<br />

ser positiva y negativa. En <strong>la</strong>s versiones posteriores, se eliminó esta restricción, pero se<br />

mantuvo <strong>la</strong> restricción <strong>de</strong> <strong>la</strong>s c<strong>la</strong>ses disjuntas.<br />

El ID3 g<strong>en</strong>era <strong>de</strong>scripciones que c<strong>la</strong>sifican a cada uno <strong>de</strong> los ejemplos <strong>de</strong>l conjunto <strong>de</strong><br />

<strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to. El nivel <strong>de</strong> precisión <strong>en</strong> <strong>la</strong> c<strong>la</strong>sificación g<strong>en</strong>eralm<strong>en</strong>te es alto. Sin<br />

emb<strong>ar</strong>go, el sistema ti<strong>en</strong>e algunas <strong>de</strong>sv<strong>en</strong>tajas. Los atributos y c<strong>la</strong>ses <strong>de</strong>b<strong>en</strong> ser discretos<br />

y no pue<strong>de</strong>n ser continuos. A<strong>de</strong>más, aún cuando se cu<strong>en</strong>ta con conocimi<strong>en</strong>tos <strong>de</strong><br />

dominio o conocimi<strong>en</strong>tos previos, el sistema no hace uso <strong>de</strong> ellos. A veces, lo árboles<br />

son <strong>de</strong>masiado frondosos, lo cual conlleva una difícil interpretación. En esos casos<br />

pue<strong>de</strong>n ser transformados <strong>en</strong> reg<strong>la</strong>s <strong>de</strong> <strong>de</strong>cisión p<strong>ar</strong>a hacerlos más <strong>com</strong>pr<strong>en</strong>sibles.<br />

Hay v<strong>ar</strong>ias razones p<strong>ar</strong>a pod<strong>ar</strong> los árboles g<strong>en</strong>erados por los métodos <strong>de</strong> TDIDT: <strong>la</strong><br />

sobreg<strong>en</strong>eralización, evaluación <strong>de</strong> atributos poco importantes o significativos, y el gran<br />

tamaño <strong>de</strong>l árbol. Si el árbol es <strong>de</strong>masiado gran<strong>de</strong>, se dificulta <strong>la</strong> interpretación, con lo<br />

cual hubiera sido lo mismo utiliz<strong>ar</strong> un método <strong>de</strong> caja negra.<br />

Exist<strong>en</strong> dos <strong>en</strong>foques p<strong>ar</strong>a pod<strong>ar</strong> árboles [Ochoa, 2004]:<br />

• Pre-poda (pre-prunning): <strong>de</strong>ti<strong>en</strong>e el crecimi<strong>en</strong>to <strong>de</strong>l árbol cuando <strong>la</strong> ganancia <strong>de</strong><br />

información producida al dividir un conjunto no supera un umbral <strong>de</strong>terminado<br />

• Post-poda (post-prunning): se aplica sobre algunas ramas una vez que se ha<br />

terminado.<br />

2.1.1.2.2 C4.5<br />

El C4.5 [Quin<strong>la</strong>n, 1993] es una ext<strong>en</strong>sión <strong>de</strong>l ID3 que acaba con muchas <strong>de</strong> sus<br />

limitaciones. Por ejemplo, permite trabaj<strong>ar</strong> con valores continuos p<strong>ar</strong>a los atributos,<br />

sep<strong>ar</strong>ando los posibles resultados <strong>en</strong> dos ramas: una p<strong>ar</strong>a aquellos AN. A<strong>de</strong>más, los árboles son m<strong>en</strong>os frondosos porque cada hoja no cubre una c<strong>la</strong>se <strong>en</strong><br />

p<strong>ar</strong>ticu<strong>la</strong>r sino una distribución <strong>de</strong> c<strong>la</strong>ses, lo cual los hace m<strong>en</strong>os profundos y frondosos.<br />

El C4.5 g<strong>en</strong>era un árbol <strong>de</strong> <strong>de</strong>cisión a p<strong>ar</strong>tir <strong>de</strong> los datos mediante p<strong>ar</strong>ticiones realizadas<br />

recursivam<strong>en</strong>te, según <strong>la</strong> estrategia <strong>de</strong> profundidad-primero (<strong>de</strong>pth-first) [Serv<strong>en</strong>te &<br />

G<strong>ar</strong>cía M<strong>ar</strong>tínez, 2002]. Antes <strong>de</strong> cada p<strong>ar</strong>tición <strong>de</strong> datos, el algoritmo consi<strong>de</strong>ra todas<br />

<strong>la</strong>s pruebas posibles que pue<strong>de</strong>n dividir el conjunto <strong>de</strong> datos y selecciona <strong>la</strong> prueba que<br />

resulta <strong>en</strong> <strong>la</strong> mayor ganancia <strong>de</strong> información o <strong>en</strong> <strong>la</strong> mayor proporción <strong>de</strong> ganancia <strong>de</strong><br />

información. P<strong>ar</strong>a cada atributo discreto, se consi<strong>de</strong>ra una prueba con n resultados,<br />

si<strong>en</strong>do n el número <strong>de</strong> valores posibles que pue<strong>de</strong> tom<strong>ar</strong> el atributo. P<strong>ar</strong>a cada atributo<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 11


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

continuo, se realiza una prueba bin<strong>ar</strong>ia sobre cada uno <strong>de</strong> los valores que toma el<br />

atributo <strong>en</strong> los datos.<br />

Son numerosas <strong>la</strong>s mejoras que pres<strong>en</strong>ta C4.5 <strong>en</strong> re<strong>la</strong>ción a ID3 [Lopez Takeyas, 2005]:<br />

• Evit<strong>ar</strong> sobreajuste <strong>de</strong> los datos.<br />

• Determin<strong>ar</strong> que tan profundo <strong>de</strong>be crecer el árbol <strong>de</strong> <strong>de</strong>cisión.<br />

• Reducir errores <strong>en</strong> <strong>la</strong> poda.<br />

• Condicion<strong>ar</strong> <strong>la</strong> Post-Poda.<br />

• Manej<strong>ar</strong> atributos continuos.<br />

• Escoger un rango <strong>de</strong> medida apropiado.<br />

• Manej<strong>ar</strong> datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to con valores faltantes.<br />

• Manej<strong>ar</strong> <strong>de</strong> atributos con difer<strong>en</strong>tes valores.<br />

• Mejor<strong>ar</strong> <strong>la</strong> efici<strong>en</strong>cia <strong>com</strong>putacional.<br />

2.1.1.2.3 CHAID<br />

CHAID fue diseñada a p<strong>ar</strong>tir <strong>de</strong> una técnica conocida <strong>com</strong>o Detección Automática <strong>de</strong><br />

Interacciones (AID: Automatic Interaction Detection). De aquí obtuvo su nombre,<br />

Detección Automática <strong>de</strong> Interacciones con Prueba 2 , CHAID (Chi Squ<strong>ar</strong>ed Automatic<br />

Interaction Detection) [H<strong>ar</strong>tigan, 1975]. Es tanto una técnica <strong>de</strong> explotación <strong>de</strong> datos<br />

<strong>com</strong>o un mo<strong>de</strong>lo estadístico. Forma p<strong>ar</strong>te, al igual que el ID3 y C4.5, <strong>de</strong> los mo<strong>de</strong>los<br />

l<strong>la</strong>mados árboles <strong>de</strong> <strong>de</strong>cisión y se utiliza p<strong>ar</strong>a realiz<strong>ar</strong> c<strong>la</strong>sificaciones y pronósticos. La<br />

finalidad <strong>de</strong> <strong>la</strong> predicción es pronostic<strong>ar</strong> el objetivo o resultado según una futura serie <strong>de</strong><br />

criterios o v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes.<br />

El mo<strong>de</strong>lo utiliza el algoritmo CHAID p<strong>ar</strong>a dividir <strong>en</strong> grupos los registros que pres<strong>en</strong>t<strong>en</strong><br />

<strong>la</strong> misma probabilidad <strong>de</strong> resultado, basándose <strong>en</strong> los valores <strong>de</strong> <strong>la</strong>s v<strong>ar</strong>iables<br />

in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes. El algoritmo p<strong>ar</strong>te <strong>de</strong> un nodo raíz y se va bifurcando <strong>en</strong> nodos<br />

<strong>de</strong>sc<strong>en</strong>di<strong>en</strong>tes hasta lleg<strong>ar</strong> a los nodos hoja, don<strong>de</strong> finaliza <strong>la</strong> ramificación. El mismo se<br />

sirve <strong>de</strong> <strong>la</strong> Prueba <strong>de</strong> <strong>la</strong> 2 (chi squ<strong>ar</strong>ed test) p<strong>ar</strong>a <strong>de</strong>termin<strong>ar</strong> si se <strong>de</strong>be continu<strong>ar</strong> con <strong>la</strong><br />

ramificación y, <strong>en</strong> caso afirmativo, qué v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes us<strong>ar</strong>. Esta prueba se<br />

lleva a cabo mediante <strong>la</strong> tabu<strong>la</strong>ción cruzada <strong>en</strong>tre el resultado y cada una <strong>de</strong> <strong>la</strong>s<br />

v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes. El resultado es un “valor-p”. Este valor repres<strong>en</strong>ta <strong>la</strong><br />

probabilidad <strong>de</strong> que <strong>la</strong> hipótesis nu<strong>la</strong> sea correcta. Luego, los “valores-p” p<strong>ar</strong>a cada<br />

tabu<strong>la</strong>ción cruzada <strong>de</strong> todas <strong>la</strong>s v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes se c<strong>la</strong>sifican, y si el mejor (el<br />

valor más pequeño) se <strong>en</strong>cu<strong>en</strong>tra bajo un umbral <strong>de</strong>terminado, se realiza una<br />

ramificación <strong>de</strong>l nodo raíz <strong>en</strong> esa ubicación.<br />

Las valoraciones y ramificaciones se prolongan hasta construir un árbol. Cuanto más se<br />

a<strong>la</strong>rgu<strong>en</strong> <strong>la</strong>s ramas, m<strong>en</strong>os v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes habrá disponibles ya que el<br />

12<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

a<strong>la</strong>rgami<strong>en</strong>to se lleva a cabo precisam<strong>en</strong>te con <strong>la</strong>s v<strong>ar</strong>iables. La bifurcación llega a su<br />

fin cuando el mejor “valor-p” ya no se <strong>en</strong>cu<strong>en</strong>tra bajo dicho umbral <strong>de</strong>terminado. Los<br />

nodos hoja <strong>de</strong>l árbol son aquellos que no han sufrido ramificaciones.<br />

Entre los puntos fuertes <strong>de</strong>l CHAID figura <strong>la</strong> construcción s<strong>en</strong>cil<strong>la</strong> <strong>de</strong>l mo<strong>de</strong>lo, que<br />

permite manej<strong>ar</strong> v<strong>ar</strong>iables in<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes tanto categóricas <strong>com</strong>o continuas. CHAID<br />

requiere gran<strong>de</strong>s masas <strong>de</strong> datos p<strong>ar</strong>a asegur<strong>ar</strong>se <strong>de</strong> que <strong>la</strong> cantidad <strong>de</strong> observaciones <strong>de</strong><br />

los nodos hoja es significativa.<br />

2.1.1.3 Selección <strong>de</strong> atributos<br />

Exist<strong>en</strong> v<strong>ar</strong>ias razones p<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> selección <strong>de</strong> atributos [Hernán<strong>de</strong>z Orallo et al,<br />

2004].<br />

• Reducir el tamaño <strong>de</strong> los datos eliminando los irrelevantes o redundantes.<br />

• Elimin<strong>ar</strong> atributos que conti<strong>en</strong><strong>en</strong> numerosos datos erróneos o faltantes.<br />

• Mejor<strong>ar</strong> <strong>la</strong> calidad <strong>de</strong>l mo<strong>de</strong>lo c<strong>en</strong>trándose <strong>en</strong> atributos relevante.<br />

• Expres<strong>ar</strong> el mo<strong>de</strong>lo resultante <strong>en</strong> función <strong>de</strong> m<strong>en</strong>os v<strong>ar</strong>iables mejorando <strong>la</strong><br />

<strong>com</strong>pr<strong>en</strong>sión.<br />

• Reducir <strong>la</strong> dim<strong>en</strong>sionalidad a fin <strong>de</strong> repres<strong>en</strong>t<strong>ar</strong> los datos visualm<strong>en</strong>te.<br />

El problema <strong>de</strong> hacer uso <strong>de</strong> todos los atributos disponibles consiste <strong>en</strong> que <strong>la</strong> mayoría<br />

<strong>de</strong> <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos pue<strong>de</strong>n actu<strong>ar</strong> incorrectam<strong>en</strong>te <strong>en</strong>tre tantos campos<br />

<strong>en</strong> un espacio que al t<strong>en</strong>er alta dim<strong>en</strong>sionalidad resulta est<strong>ar</strong> más <strong>de</strong>sierto (cuando hay<br />

irrelevantes, redundantes o con valores erróneos). Se busca obt<strong>en</strong>er mo<strong>de</strong>los que se<br />

ajust<strong>en</strong> a p<strong>ar</strong>ticu<strong>la</strong>rida<strong>de</strong>s <strong>de</strong> los datos <strong>de</strong> <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to y no <strong>de</strong> los datos <strong>en</strong> g<strong>en</strong>eral.<br />

Exist<strong>en</strong> dos reg<strong>la</strong>s g<strong>en</strong>erales p<strong>ar</strong>a elimin<strong>ar</strong> atributos, <strong>en</strong> especial los nominales:<br />

• Eliminación <strong>de</strong> c<strong>la</strong>ves candidatas: <strong>la</strong> reg<strong>la</strong> es elimin<strong>ar</strong> cualquier atributo que<br />

pueda ser c<strong>la</strong>ve prim<strong>ar</strong>ia <strong>de</strong> <strong>la</strong> tab<strong>la</strong> (sea candidata o p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> c<strong>la</strong>ve candidata,<br />

p<strong>ar</strong>cial o totalm<strong>en</strong>te). Estos campos agregan un <strong>de</strong>talle al dominio <strong>de</strong> datos que<br />

pue<strong>de</strong> ser especialm<strong>en</strong>te problemático p<strong>ar</strong>a t<strong>ar</strong>eas <strong>de</strong> c<strong>la</strong>sificación o regresión.<br />

• Eliminación <strong>de</strong> atributos <strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes: cuando exist<strong>en</strong> <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias<br />

funcionales <strong>en</strong>tre atributos se int<strong>en</strong>ta normaliz<strong>ar</strong> <strong>en</strong> v<strong>ar</strong>ias tab<strong>la</strong>s. Dado que los<br />

datos a min<strong>ar</strong> pue<strong>de</strong>n prov<strong>en</strong>ir <strong>de</strong> una “vista minable” (tab<strong>la</strong> lógica con todos los<br />

atributos relevantes) que los ha <strong>de</strong>snormalizado, se <strong>de</strong>be evalu<strong>ar</strong> si realm<strong>en</strong>te se<br />

necesitan todos los atributos, ya que muchos pue<strong>de</strong>n ser redundantes. No<br />

elimin<strong>ar</strong> los atributos <strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes pue<strong>de</strong> perjudic<strong>ar</strong> <strong>la</strong> g<strong>en</strong>eración <strong>de</strong> reg<strong>la</strong>s <strong>de</strong><br />

asociación y <strong>la</strong>s <strong>de</strong> agrupami<strong>en</strong>to.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 13


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Por otra p<strong>ar</strong>te, se utilizan dos métodos p<strong>ar</strong>a seleccion<strong>ar</strong> atributos:<br />

14<br />

• Métodos <strong>de</strong> filtro: se filtran los atributos irrelevantes antes <strong>de</strong> cualquier proceso<br />

<strong>de</strong> minería <strong>de</strong> datos. Las técnicas son fundam<strong>en</strong>talm<strong>en</strong>te estadísticas (medidas<br />

<strong>de</strong> información, distancia, <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias o inconsist<strong>en</strong>cias). El criterio p<strong>ar</strong>a<br />

establecer el subconjunto óptimo <strong>de</strong> atributos se basa <strong>en</strong> medidas <strong>de</strong> calidad<br />

previa que se calcu<strong>la</strong>n a p<strong>ar</strong>tir <strong>de</strong> los datos.<br />

• Métodos <strong>en</strong>volv<strong>en</strong>tes (Wrappers): <strong>la</strong> selección óptima <strong>de</strong> atributos se evalúa<br />

respecto a <strong>la</strong> calidad <strong>de</strong> un mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos o estadístico extraído a<br />

p<strong>ar</strong>tir <strong>de</strong> los datos (utilizando algún método <strong>de</strong> validación). Este tipo <strong>de</strong> técnicas<br />

requier<strong>en</strong> más tiempo que <strong>la</strong>s otras ya que p<strong>ar</strong>a evalu<strong>ar</strong> hay que <strong>en</strong>tr<strong>en</strong><strong>ar</strong> un<br />

mo<strong>de</strong>lo.<br />

2.2 CRIPS-DM: METODOLOGÍA DE PROYECTOS DE MINERÍA DE DATOS<br />

CRISP-DM (Cross Industry Stand<strong>ar</strong>d Process for Data Mining) es una metodología<br />

creada <strong>en</strong> el año 1996, diseñada p<strong>ar</strong>a <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r proyectos <strong>de</strong> minería <strong>de</strong> datos.<br />

La misma consiste <strong>en</strong> una serie <strong>de</strong> activida<strong>de</strong>s o t<strong>ar</strong>eas <strong>de</strong>scriptas <strong>en</strong> cuatro niveles <strong>de</strong><br />

abstracción (<strong>de</strong>s<strong>de</strong> lo g<strong>en</strong>eral a lo específico): fases, t<strong>ar</strong>eas g<strong>en</strong>éricas, t<strong>ar</strong>eas específicas<br />

e instancias <strong>de</strong>l proceso [Figura 2.4].<br />

Figura 2.4. Los 4 niveles <strong>de</strong>l CRISP-DM. [CRIPS-DM, 2007]<br />

En el nivel superior el proceso <strong>de</strong> minería <strong>de</strong> datos esta organizado <strong>en</strong> fases; cada fase<br />

consiste <strong>en</strong> un número <strong>de</strong> t<strong>ar</strong>eas g<strong>en</strong>éricas <strong>de</strong> segundo nivel. A este segundo nivel <strong>de</strong> lo<br />

l<strong>la</strong>ma g<strong>en</strong>érico porque se pret<strong>en</strong><strong>de</strong> que sea lo sufici<strong>en</strong>tem<strong>en</strong>te g<strong>en</strong>eral p<strong>ar</strong>a cubrir todas<br />

<strong>la</strong>s posibles situaciones <strong>de</strong>l proceso <strong>de</strong> minería <strong>de</strong> datos. A su vez, se espera que sea<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

estable p<strong>ar</strong>a que el mo<strong>de</strong>lo sea válido p<strong>ar</strong>a nuevos técnicas <strong>de</strong> mo<strong>de</strong><strong>la</strong>do aún no<br />

<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>das.<br />

El tercer nivel (t<strong>ar</strong>es específicas) es el lug<strong>ar</strong> p<strong>ar</strong>a <strong>de</strong>scribir <strong>com</strong>o <strong>la</strong>s acciones g<strong>en</strong>éricas<br />

<strong>de</strong>b<strong>en</strong> ser llevadas a cabo <strong>en</strong> ciertas situaciones especificas. Por ejemplo, si <strong>en</strong> el<br />

segundo nivel se ti<strong>en</strong>e <strong>la</strong> t<strong>ar</strong>ea g<strong>en</strong>eral “limpieza <strong>de</strong> datos”, <strong>en</strong> el tercer nivel se <strong>de</strong>tal<strong>la</strong>n<br />

<strong>la</strong>s t<strong>ar</strong>eas que ti<strong>en</strong><strong>en</strong> que <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>rse p<strong>ar</strong>a un caso especifico, <strong>com</strong>o pue<strong>de</strong> serlo <strong>la</strong><br />

“limpieza <strong>de</strong> datos numéricos”, o “limpieza <strong>de</strong> datos categóricos”.<br />

La <strong>de</strong>scripción <strong>de</strong> fases y t<strong>ar</strong>eas, <strong>com</strong>o pasos discretos llevados a cabos <strong>en</strong> un or<strong>de</strong>n<br />

específico, repres<strong>en</strong>tan una secu<strong>en</strong>cia i<strong>de</strong>alizada <strong>de</strong> ev<strong>en</strong>tos. En <strong>la</strong> practica, muchas <strong>de</strong><br />

<strong>la</strong>s t<strong>ar</strong>eas pue<strong>de</strong>n llev<strong>ar</strong>se a<strong>de</strong><strong>la</strong>nte <strong>en</strong> distinto or<strong>de</strong>n y será neces<strong>ar</strong>io volver atrás v<strong>ar</strong>ias<br />

veces p<strong>ar</strong>a repetir ciertas acciones.<br />

El cu<strong>ar</strong>to nivel, instancias <strong>de</strong> proceso, es un registro <strong>de</strong> <strong>la</strong>s acciones, <strong>de</strong>cisiones y<br />

resultados <strong>de</strong> un proyecto <strong>de</strong> minería <strong>de</strong> datos específico. Esta organizado <strong>de</strong> acuerdo a<br />

<strong>la</strong>s t<strong>ar</strong>eas <strong>de</strong>finidas <strong>en</strong> los niveles superiores, pero repres<strong>en</strong>tan lo que suce<strong>de</strong> <strong>en</strong><br />

instancias p<strong>ar</strong>ticu<strong>la</strong>res durante el proceso <strong>de</strong> minería <strong>de</strong> datos.<br />

El ciclo <strong>de</strong> vida <strong>de</strong>l proyecto <strong>de</strong> minería <strong>de</strong> datos, según CRIPS-DM, consta <strong>de</strong> 6 fases<br />

[Figura 2.5]. Es importante ac<strong>la</strong>r<strong>ar</strong> que <strong>la</strong> secu<strong>en</strong>cia <strong>de</strong> <strong>la</strong>s fases no es rígida, por lo que<br />

cuando sea requerido los proyectistas <strong>de</strong>berán moverse <strong>en</strong>tre el<strong>la</strong>s.<br />

Figura 2.5:.CRISP-DM. Ciclo <strong>de</strong> vida <strong>de</strong>l proyecto. [CRISP-DM, 2007]<br />

Dep<strong>en</strong>di<strong>en</strong>do <strong>de</strong>l resultado <strong>de</strong> cada fase, se llev<strong>ar</strong>a a cabo <strong>la</strong> sigui<strong>en</strong>te fase<br />

correspondi<strong>en</strong>te. En <strong>la</strong> figura 2.5, <strong>la</strong>s flechas repres<strong>en</strong>tan <strong>la</strong>s más importantes y<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 15


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

frecu<strong>en</strong>tes <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias <strong>en</strong>tre fases. La circunfer<strong>en</strong>cia exterior simboliza <strong>la</strong> naturaleza<br />

cíclica <strong>de</strong> los proyectos propiam<strong>en</strong>te dichos.<br />

2.2.1 Objetivos <strong>de</strong> cada fase <strong>en</strong> <strong>la</strong> metodología CRISP-DM.<br />

Cada una <strong>de</strong> <strong>la</strong>s fases <strong>de</strong> <strong>la</strong> pres<strong>en</strong>te metodología apunta a una serie <strong>de</strong> objetivos<br />

principales.<br />

Fase I - Compr<strong>en</strong>sión <strong>de</strong>l negocio<br />

16<br />

Esta primera fase se focaliza <strong>en</strong> <strong>en</strong>t<strong>en</strong><strong>de</strong>r los objetivos <strong>de</strong>l negocio y los<br />

requerimi<strong>en</strong>tos <strong>de</strong>s<strong>de</strong> <strong>la</strong> perspectiva <strong>de</strong>l negocio, p<strong>ar</strong>a incluir estos<br />

conocimi<strong>en</strong>tos <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> <strong>de</strong>finición <strong>de</strong>l problema <strong>de</strong> Exploración <strong>de</strong><br />

información y el diseño <strong>de</strong>l p<strong>la</strong>n prelimin<strong>ar</strong> p<strong>ar</strong>a logr<strong>ar</strong> los objetivos.<br />

Fase II - Compr<strong>en</strong>sión <strong>de</strong> los datos<br />

La fase <strong>de</strong> <strong>com</strong>pr<strong>en</strong>sión <strong>de</strong> los datos <strong>com</strong>i<strong>en</strong>za con <strong>la</strong> recolección inicial <strong>de</strong> datos<br />

y prosigue con activida<strong>de</strong>s que apuntan a <strong>la</strong> famili<strong>ar</strong>ización <strong>de</strong> los datos,<br />

i<strong>de</strong>ntific<strong>ar</strong> problemas <strong>de</strong> calidad y <strong>de</strong>tect<strong>ar</strong> re<strong>la</strong>ciones interesantes <strong>en</strong>tre los<br />

mismos que permitan g<strong>en</strong>er<strong>ar</strong> hipótesis sobre información oculta.<br />

Fase III - Prep<strong>ar</strong>ación <strong>de</strong> los datos<br />

Esta fase contemp<strong>la</strong> un conjunto <strong>de</strong> activida<strong>de</strong>s <strong>de</strong>stinadas a <strong>la</strong> construcción <strong>de</strong>l<br />

dataset a p<strong>ar</strong>tir <strong>de</strong> los datos iniciales. Esta fase implica múltiples t<strong>ar</strong>eas que<br />

pue<strong>de</strong>n <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>rse al mismo tiempo sin un or<strong>de</strong>n estricto. Estas t<strong>ar</strong>eas incluy<strong>en</strong><br />

<strong>la</strong> selección, limpieza y transformación <strong>de</strong> tab<strong>la</strong>s, registros y atributos p<strong>ar</strong>a po<strong>de</strong>r<br />

ingres<strong>ar</strong><strong>la</strong>s <strong>en</strong> <strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.<br />

Fase IV - Mo<strong>de</strong><strong>la</strong>do<br />

En esta fase se seleccion<strong>ar</strong>án y aplic<strong>ar</strong>án v<strong>ar</strong>ias técnicas <strong>de</strong> mo<strong>de</strong><strong>la</strong>do, <strong>com</strong>o así<br />

también, opcionalm<strong>en</strong>te, se podrán <strong>de</strong>termin<strong>ar</strong> los valores <strong>de</strong> los p<strong>ar</strong>ámetros y<br />

v<strong>ar</strong>iables <strong>de</strong> calibración. P<strong>ar</strong>a esta t<strong>ar</strong>ea g<strong>en</strong>eralm<strong>en</strong>te se pue<strong>de</strong> cont<strong>ar</strong> con más<br />

<strong>de</strong> una técnica que realice <strong>la</strong> misma función. Algunas técnicas pue<strong>de</strong>n t<strong>en</strong>er<br />

requerimi<strong>en</strong>tos específicos <strong>en</strong> cuanto a <strong>la</strong> conformación <strong>de</strong> los datos, lo cual<br />

pue<strong>de</strong> hacer que se <strong>de</strong>ba volver a <strong>la</strong> fase <strong>de</strong> prep<strong>ar</strong>ación <strong>de</strong> los datos p<strong>ar</strong>a realiz<strong>ar</strong><br />

algún ajuste.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Fase V - Evaluación<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

En esta fase se verifica que los resultados obt<strong>en</strong>idos <strong>en</strong> <strong>la</strong> fase <strong>de</strong> mo<strong>de</strong><strong>la</strong>do sean<br />

<strong>de</strong> alta calidad <strong>de</strong>s<strong>de</strong> <strong>la</strong> perspectiva <strong>de</strong>l análisis <strong>de</strong> datos. Antes <strong>de</strong> realiz<strong>ar</strong> <strong>la</strong><br />

implem<strong>en</strong>tación <strong>de</strong>l mo<strong>de</strong>lo, es importante evalu<strong>ar</strong> que los resultados <strong>de</strong>l<br />

mo<strong>de</strong><strong>la</strong>do y revis<strong>ar</strong> los pasos realizados p<strong>ar</strong>a <strong>la</strong> construcción <strong>de</strong>l mo<strong>de</strong>lo y<br />

verific<strong>ar</strong> que estos sean apropiados <strong>en</strong> función <strong>de</strong> los objetivos <strong>de</strong>l negocio.<br />

Fase VI - Implem<strong>en</strong>tación<br />

El final <strong>de</strong>l proyecto, g<strong>en</strong>eralm<strong>en</strong>te, no se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> <strong>la</strong> creación <strong>de</strong>l mo<strong>de</strong>lo.<br />

En <strong>la</strong> mayoría <strong>de</strong> los casos el analista <strong>de</strong> datos <strong>de</strong>be g<strong>en</strong>er<strong>ar</strong> un informe final<br />

p<strong>ar</strong>a ser pres<strong>en</strong>tado al cli<strong>en</strong>te o <strong>en</strong> caso <strong>de</strong> que el propio cli<strong>en</strong>te <strong>de</strong>see realiz<strong>ar</strong> el<br />

informe final se <strong>de</strong>berá transferir a éste el conocimi<strong>en</strong>to p<strong>ar</strong>a que pueda hacer<br />

una correcta interpretación <strong>de</strong> los datos.<br />

2.3 MINERÍA DE DATOS APLICADA A LA INFORMACIÓN CRIMINAL<br />

A p<strong>ar</strong>tir <strong>de</strong> los ataques terroristas <strong>de</strong>l 11 <strong>de</strong> Septiembre <strong>de</strong> 2001 a <strong>la</strong>s torres geme<strong>la</strong>s <strong>en</strong><br />

<strong>la</strong> ciudad <strong>de</strong> Nueva York, EE.UU., <strong>la</strong> cantidad <strong>de</strong> información recolectada, reunida y<br />

<strong>com</strong>pi<strong>la</strong>da por <strong>la</strong>s ag<strong>en</strong>cias locales, estatales y fe<strong>de</strong>rales (CIA, FBI, etc.) <strong>de</strong> dicho país<br />

fue increm<strong>en</strong>tándose significativam<strong>en</strong>te, buscando <strong>de</strong> esta forma logr<strong>ar</strong> prev<strong>en</strong>ir futuros<br />

ataques. El manejo y capacidad <strong>de</strong> análisis <strong>de</strong> dicha información, mediante <strong>la</strong> creación<br />

<strong>de</strong> diversas herrami<strong>en</strong>tas, técnicas y sistemas, tampoco se ha quedado atrás [McCue,<br />

2005].<br />

Las mismas herrami<strong>en</strong>tas y técnicas que son usadas p<strong>ar</strong>a <strong>de</strong>termin<strong>ar</strong> riesgo crediticio,<br />

<strong>de</strong>scubrir frau<strong>de</strong>s e i<strong>de</strong>ntific<strong>ar</strong> hábitos <strong>de</strong> consumos <strong>en</strong> <strong>la</strong>s personas, <strong>en</strong>tre otros usos,<br />

pue<strong>de</strong>n ser utilizadas p<strong>ar</strong>a <strong>la</strong> lucha contra <strong>la</strong> <strong>de</strong>lincu<strong>en</strong>cia, terrorismo y <strong>la</strong> protección <strong>de</strong><br />

<strong>la</strong> seguridad interior.<br />

La minería <strong>de</strong> datos es muy aplicable <strong>en</strong> <strong>la</strong> información criminal, ya que se trata <strong>de</strong> una<br />

herrami<strong>en</strong>ta muy pot<strong>en</strong>te que le permite a los investigadores <strong>de</strong>l crim<strong>en</strong> que pose<strong>en</strong><br />

poco <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to <strong>com</strong>o analistas <strong>de</strong> datos explor<strong>ar</strong> gran<strong>de</strong>s bases <strong>de</strong> datos <strong>de</strong> manera<br />

rápida y efici<strong>en</strong>te [Fayyad & Uthurusamy, 2002]. Al ser <strong>la</strong>s modalida<strong>de</strong>s criminales<br />

cada vez más <strong>com</strong>plejas y dinámicas, se cree que es sumam<strong>en</strong>te útil <strong>la</strong> utilización <strong>de</strong><br />

herrami<strong>en</strong>tas específicas p<strong>ar</strong>a po<strong>de</strong>r t<strong>en</strong>er un mejor tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información<br />

criminal. El uso <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos aplicado a <strong>la</strong> intelig<strong>en</strong>cia criminal ha t<strong>en</strong>ido un<br />

gran crecimi<strong>en</strong>to <strong>en</strong> los últimos años <strong>en</strong> EE.UU. [Ch<strong>en</strong> et al., 2004].<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 17


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Finalm<strong>en</strong>te, con respecto a <strong>la</strong> aplicación <strong>de</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias, no se ha <strong>en</strong>contrado estudio alguno tanto <strong>en</strong> Arg<strong>en</strong>tina <strong>com</strong>o a nivel<br />

internacional. Por lo tanto, se cree que esta es una muy bu<strong>en</strong>a oportunidad p<strong>ar</strong>a aplic<strong>ar</strong><br />

minería <strong>de</strong> datos <strong>en</strong> información re<strong>la</strong>tiva a <strong>la</strong>s cárceles <strong>de</strong> <strong>la</strong> <strong>ar</strong>g<strong>en</strong>tina<br />

A continuación se <strong>de</strong>scrib<strong>en</strong> diversos proyectos <strong>de</strong> aplicación <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos <strong>en</strong><br />

información criminal.<br />

2.3.1 Proyecto Able Danger<br />

En el año 1999, los Comandos <strong>de</strong> Operaciones Especiales <strong>de</strong> EE.UU., buscaban <strong>la</strong><br />

forma <strong>de</strong> acrec<strong>en</strong>t<strong>ar</strong> <strong>la</strong> lucha contra el terrorismo luego <strong>de</strong> los ataques que sufrieron sus<br />

embajadas <strong>en</strong> K<strong>en</strong>ya y Tanzania por p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> red Al Qaeda.<br />

Able Danger [H<strong>ar</strong>ris, 2005] fue el nombre <strong>en</strong> código <strong>de</strong>l proyecto <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do por una<br />

<strong>de</strong> <strong>la</strong>s ag<strong>en</strong>cias <strong>de</strong> intelig<strong>en</strong>cia <strong>de</strong> los EE.UU., <strong>la</strong> IDC (Information Dominance C<strong>en</strong>ter).<br />

Mediante el mismo, supuestam<strong>en</strong>te se habrían i<strong>de</strong>ntificado al lí<strong>de</strong>r <strong>de</strong> los ataques <strong>de</strong>l 11<br />

<strong>de</strong> Septiembre <strong>de</strong> 2001, Mohamed Atta, junto a otros 3 terroristas <strong>com</strong>o posibles<br />

miembros <strong>de</strong> una célu<strong>la</strong> <strong>de</strong> Al Qaeda operando <strong>en</strong> ese país más <strong>de</strong> un año previo a los<br />

ataques.<br />

El proyecto, basado <strong>en</strong> <strong>la</strong> minería <strong>de</strong> datos, cont<strong>en</strong>ía un gran volum<strong>en</strong> <strong>de</strong> información<br />

(2.5 terabytes), lo cual repres<strong>en</strong>taba aproximadam<strong>en</strong>te al 12% <strong>de</strong> todas <strong>la</strong>s páginas<br />

impresas gu<strong>ar</strong>dadas <strong>en</strong> <strong>la</strong>s bibliotecas <strong>de</strong>l Congreso Norteamericano.<br />

El resultado <strong>de</strong>l Able Danger trajo a <strong>la</strong> luz diagramas y mapas que mostraban nombres<br />

<strong>de</strong> sospechosos, los re<strong>la</strong>cionaban e interconectaban. Entre estos se <strong>en</strong>contraba Mohamed<br />

Atta, que lo vincu<strong>la</strong>ba con un terrorista aún <strong>de</strong>t<strong>en</strong>ido <strong>en</strong> una prisión fe<strong>de</strong>ral, qui<strong>en</strong> a su<br />

vez había t<strong>en</strong>ido p<strong>ar</strong>ticipación <strong>en</strong> los ataques al World Tra<strong>de</strong> C<strong>en</strong>ter <strong>en</strong> el año 1993. Los<br />

resultados fueron obt<strong>en</strong>idos sobre <strong>la</strong> base <strong>de</strong> búsquedas int<strong>en</strong>sas <strong>de</strong> <strong>de</strong>c<strong>en</strong>as <strong>de</strong> miles <strong>de</strong><br />

páginas Web que cont<strong>en</strong>ían <strong>la</strong>s pa<strong>la</strong>bras c<strong>la</strong>ve <strong>com</strong>o por ejemplo “Al Qaeda” o “Bin<br />

La<strong>de</strong>n”. Luego, una herrami<strong>en</strong>ta <strong>de</strong> visualización <strong>de</strong> datos, creaba un mapa<br />

tridim<strong>en</strong>sional mostrando cuales pa<strong>la</strong>bras ap<strong>ar</strong>ecían más frecu<strong>en</strong>tem<strong>en</strong>te y <strong>com</strong>o se<br />

re<strong>la</strong>cionaban. Nombres, ubicaciones, capacida<strong>de</strong>s y hasta <strong>la</strong>s fu<strong>en</strong>tes <strong>de</strong> financiami<strong>en</strong>to<br />

<strong>de</strong> <strong>la</strong> red fue alguna <strong>de</strong> <strong>la</strong> información <strong>de</strong>tectada.<br />

En <strong>la</strong> figura 2.6 se pue<strong>de</strong> observ<strong>ar</strong> un ejemplo <strong>de</strong> los resultados obt<strong>en</strong>idos mediante <strong>la</strong><br />

Minería <strong>de</strong> Datos llevada a cabo durante el proyecto Able Danger.<br />

18<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Figura 2.6. Mapas <strong>de</strong> re<strong>la</strong>ciones <strong>de</strong>l Able Danger [Lance, 2007].<br />

Sin emb<strong>ar</strong>go, cuando se creía t<strong>en</strong>er <strong>la</strong> herrami<strong>en</strong>ta que permitiría <strong>en</strong>contr<strong>ar</strong> a los<br />

terroristas antes <strong>de</strong> que estos ejecut<strong>en</strong> sus actos, al mismo tiempo se estaba fr<strong>en</strong>te a una<br />

importante línea legal. La metodología básica <strong>de</strong> búsqueda sugería que todos los<br />

ciudadanos <strong>de</strong> los EE.UU. podrían ap<strong>ar</strong>ecer <strong>en</strong> el<strong>la</strong>. Esta fue una <strong>de</strong> <strong>la</strong>s principales<br />

causas por <strong>la</strong>s cuales <strong>la</strong> IDC fue obligada a <strong>de</strong>struir cualquier información recolectada<br />

sobre ciudadanos estadouni<strong>de</strong>nses <strong>de</strong>ntro <strong>de</strong> los 90 días. Así fue, <strong>com</strong>o <strong>en</strong> <strong>la</strong> primavera<br />

<strong>de</strong>l año 2000, el proyecto quedó relegado y ningún rastro <strong>de</strong>l mismo pudo ser rescatado.<br />

Nunca <strong>la</strong> CIA ni el FBI pudo t<strong>en</strong>er <strong>en</strong> sus oficinas toda <strong>la</strong> información recolectada y<br />

procesada.<br />

P<strong>ar</strong>a más información acerca <strong>de</strong> este proyecto remitirse al “Able Danger Investigation<br />

Report” [Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong> Def<strong>en</strong>sa EE.UU., 2006], <strong>en</strong> don<strong>de</strong> se <strong>en</strong>cu<strong>en</strong>tran publicados<br />

todos los cuadros <strong>de</strong> re<strong>la</strong>ciones realizados.<br />

2.3.2 Proyecto COPLINK – Universidad <strong>de</strong> Arizona<br />

Este producto, creado <strong>en</strong> 1997 por el Laboratorio <strong>de</strong> Intelig<strong>en</strong>cia Artificial <strong>de</strong> <strong>la</strong><br />

Universidad <strong>de</strong> Arizona (Tucson, EE.UU.), se <strong>la</strong>nza con el objetivo <strong>de</strong> proveer soporte<br />

al análisis y toma <strong>de</strong> <strong>de</strong>cisiones p<strong>ar</strong>a <strong>la</strong> i<strong>de</strong>ntificación <strong>de</strong> <strong>com</strong>portami<strong>en</strong>tos criminales,<br />

re<strong>la</strong>ciones y patrones, ayudando a resolver crím<strong>en</strong>es <strong>de</strong> distinta índole y <strong>de</strong>tección <strong>de</strong><br />

pot<strong>en</strong>ciales ataques terroristas [Artificial Intellig<strong>en</strong>ce Lab, 2007].<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 19


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Este interesante <strong>de</strong>s<strong>ar</strong>rollo posee diversas aplicaciones, permiti<strong>en</strong>do trabaj<strong>ar</strong> con datos<br />

prov<strong>en</strong>i<strong>en</strong>tes <strong>de</strong> diversas fu<strong>en</strong>tes y analizando <strong>la</strong> información a través <strong>de</strong> una red segura<br />

y “amigable”.<br />

Entre <strong>la</strong>s aplicaciones más interesantes <strong>de</strong>l COPLINK se pue<strong>de</strong>n nombr<strong>ar</strong> a <strong>la</strong>s<br />

sigui<strong>en</strong>tes:<br />

20<br />

• Seguridad Fronteriza (COPLINK Bor<strong>de</strong>rSafe)<br />

Este proyecto busca logr<strong>ar</strong> que <strong>la</strong>s distintas ag<strong>en</strong>cias g<strong>en</strong>eradores <strong>de</strong> información<br />

p<strong>ar</strong>ticip<strong>en</strong> <strong>en</strong> una p<strong>la</strong>taforma piloto p<strong>ar</strong>a <strong>la</strong> investigación y análisis <strong>de</strong> información<br />

cruzada prov<strong>en</strong>i<strong>en</strong>te <strong>de</strong> distintas jurisdicciones. Registros <strong>de</strong>l Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong> Policía<br />

<strong>de</strong> Tucson, Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong>l condado <strong>de</strong> Pima y Patrul<strong>la</strong>s fronterizas han sido<br />

integrados a esta p<strong>la</strong>taforma p<strong>ar</strong>a extraer conclusiones acerca <strong>de</strong> <strong>la</strong> actividad <strong>de</strong> re<strong>de</strong>s <strong>de</strong><br />

traficantes <strong>de</strong> drogas <strong>com</strong>o también <strong>de</strong> “cruzadores” <strong>de</strong> fronteras (bor<strong>de</strong>r crossing<br />

vehicles).<br />

Figura 2.7. Red criminal obt<strong>en</strong>ida con el COPLINK Bo<strong>ar</strong><strong>de</strong>rSafe.<br />

La figura 2.7 es un típico ejemplo <strong>de</strong> actividad <strong>de</strong> una red criminal, integrando los<br />

registros <strong>de</strong> distintas ag<strong>en</strong>cias. En este caso, <strong>la</strong> red es usada p<strong>ar</strong>a i<strong>de</strong>ntific<strong>ar</strong> vehículos<br />

asociados al sospechoso <strong>de</strong> un homicidio.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

• Análisis <strong>de</strong> Re<strong>de</strong>s Criminales (COPLINK Criminal Network Analysis)<br />

Es una herrami<strong>en</strong>ta que pret<strong>en</strong><strong>de</strong> facilit<strong>ar</strong> <strong>la</strong> investigación <strong>de</strong> crím<strong>en</strong>es <strong>com</strong>o terrorismo,<br />

tráfico <strong>de</strong> drogas y crím<strong>en</strong>es <strong>com</strong>etidos por bandas autoorganizadas. Se busca<br />

<strong>de</strong>termin<strong>ar</strong> el <strong>com</strong>portami<strong>en</strong>tos <strong>de</strong> bandas, li<strong>de</strong>res y ver <strong>com</strong>o se re<strong>la</strong>cionan y operan<br />

<strong>en</strong>tre sí p<strong>ar</strong>a llev<strong>ar</strong> a cabo v<strong>ar</strong>ios tipos <strong>de</strong> activida<strong>de</strong>s ilegales [Ch<strong>en</strong> et al., 2004].<br />

Se utilizan técnicas <strong>de</strong> Concept Space p<strong>ar</strong>a cre<strong>ar</strong> una red <strong>de</strong> pot<strong>en</strong>ciales sospechosos. El<br />

vínculo <strong>en</strong>tre dos sospechosos está dado por <strong>la</strong> cantidad <strong>de</strong> veces <strong>en</strong> que ambos fueron<br />

i<strong>de</strong>ntificados <strong>en</strong> el mismo inci<strong>de</strong>nte. Se divi<strong>de</strong>n <strong>en</strong> subgrupos mediante el clustering<br />

jerárquico y block mo<strong>de</strong>ling p<strong>ar</strong>a <strong>de</strong>tect<strong>ar</strong> patrones <strong>de</strong> interacción <strong>en</strong>tre los subgrupos.<br />

También se calcu<strong>la</strong>n distancias c<strong>en</strong>trales (grados, intersecciones y cercanías) p<strong>ar</strong>a<br />

<strong>de</strong>tect<strong>ar</strong> a los miembros c<strong>la</strong>ve <strong>de</strong> cada subgrupo, <strong>com</strong>o lo son los lí<strong>de</strong>res.<br />

Figura 2.8. Red criminal obt<strong>en</strong>ida con el COPLINK Criminal Network Analysis.<br />

La figura 2.8 muestra a los nodos repres<strong>en</strong>tados por los criminales con sus respectivos<br />

nombres. Las líneas conectores repres<strong>en</strong>tan re<strong>la</strong>ciones <strong>en</strong>tre los criminales.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 21


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Se pue<strong>de</strong> hacer foco <strong>en</strong> <strong>la</strong>s re<strong>de</strong>s individuales aum<strong>en</strong>tando el porc<strong>en</strong>taje <strong>de</strong> abstracción<br />

(level of abastraction %) obt<strong>en</strong>iéndose <strong>la</strong> figura 2.9. En el<strong>la</strong> se pue<strong>de</strong>n observ<strong>ar</strong> círculos<br />

que repres<strong>en</strong>tan grupos. El tamaño <strong>de</strong> los círculos es proporcional al número <strong>de</strong><br />

miembros <strong>de</strong> los distintos grupos. Cada grupo esta etiquetado con el nombre <strong>de</strong>l lí<strong>de</strong>r<br />

<strong>de</strong>l grupo.<br />

22<br />

Figura 2.9. El lí<strong>de</strong>r, su grupo y red. COPLINK Criminal Network Analysis.<br />

Exist<strong>en</strong> otras aplicaciones <strong>de</strong>ntro <strong>de</strong>l COPLINK <strong>com</strong>o <strong>la</strong> Extracción <strong>de</strong> Entida<strong>de</strong>s<br />

automáticam<strong>en</strong>te <strong>de</strong>s<strong>de</strong> los reportes policiales y <strong>la</strong> Detección <strong>de</strong> I<strong>de</strong>ntida<strong>de</strong>s Múltiples<br />

<strong>en</strong> gran<strong>de</strong>s bases <strong>de</strong> datos.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

2.4 INFORMACIÓN CRIMINAL EN ARGENTINA<br />

A continuación se pres<strong>en</strong>ta, a modo <strong>de</strong> refer<strong>en</strong>cia, una <strong>de</strong>scripción <strong>de</strong>l estado actual <strong>de</strong><br />

<strong>la</strong> información criminal <strong>en</strong> Arg<strong>en</strong>tina.<br />

2.4.1 Dirección Nacional <strong>de</strong> Política Criminal<br />

A p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong> sanción <strong>de</strong> <strong>la</strong> Ley 25.266 se le otorgó a <strong>la</strong> Dirección Nacional <strong>de</strong> Política<br />

Criminal (DNPC), creada <strong>en</strong> el año 1991 y <strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong>l Ministerio <strong>de</strong> Justicia y<br />

Derechos Humanos, <strong>la</strong> potestad no sólo <strong>de</strong> diseñ<strong>ar</strong> y producir <strong>la</strong>s estadísticas <strong>de</strong><br />

criminalidad, sino también <strong>la</strong>s estadísticas sobre el sistema p<strong>en</strong>al <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina. En<br />

este s<strong>en</strong>tido, esta nueva legis<strong>la</strong>ción procura un principio <strong>de</strong> organización p<strong>ar</strong>a <strong>la</strong><br />

producción <strong>de</strong> <strong>la</strong>s fu<strong>en</strong>tes estadísticas <strong>de</strong> conocimi<strong>en</strong>to sobre <strong>la</strong> cuestión criminal y abre<br />

una oportunidad p<strong>ar</strong>a g<strong>en</strong>er<strong>ar</strong> fuertes avances <strong>en</strong> <strong>la</strong> materia.<br />

El análisis <strong>de</strong> <strong>la</strong>s estadísticas sobre criminalidad pue<strong>de</strong> ser dividido <strong>en</strong> dos gran<strong>de</strong>s<br />

áreas: <strong>la</strong>s estadísticas oficiales, que toman <strong>com</strong>o fu<strong>en</strong>te el registro <strong>de</strong> ag<strong>en</strong>cias estatales<br />

(Policía, Po<strong>de</strong>r Judicial, P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias) y los estudios <strong>de</strong> victimización, que se basan <strong>en</strong><br />

<strong>en</strong>cuestas pob<strong>la</strong>cionales.<br />

La DNPC cu<strong>en</strong>ta con cinco sistemas <strong>de</strong> información que se utilizan <strong>com</strong>o fu<strong>en</strong>te p<strong>ar</strong>a <strong>la</strong><br />

g<strong>en</strong>eración <strong>de</strong> estadísticas oficiales:<br />

• Sistema Nacional <strong>de</strong> Información Criminal (SNIC).<br />

• Sistema <strong>de</strong> Alerta Temprano (SAT).<br />

• Sistema Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ).<br />

• Encuestas <strong>de</strong> Victimización.<br />

• Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP).<br />

2.4.1.1 Fu<strong>en</strong>tes Oficiales <strong>de</strong> Información y Estudios <strong>de</strong> Victimización.<br />

Las fu<strong>en</strong>tes oficiales <strong>de</strong> información criminal p<strong>en</strong>al son, <strong>com</strong>o se dijo anteriorm<strong>en</strong>te, los<br />

sistemas Policial, Judicial y al final <strong>de</strong> <strong>la</strong> “ca<strong>de</strong>na”, el P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io.<br />

Los <strong>de</strong>litos ingresan, <strong>en</strong> forma <strong>de</strong> <strong>de</strong>nuncias, a través <strong>de</strong>l Sistema Policial. Luego pasan<br />

por el Sistema Judicial, <strong>en</strong> don<strong>de</strong> se observa cuantitativam<strong>en</strong>te <strong>la</strong> imag<strong>en</strong> <strong>de</strong> un embudo,<br />

cuya boca es <strong>la</strong> institución policial, y se va angostando a medida <strong>en</strong> que se van<br />

atravesando <strong>la</strong>s diversas etapas <strong>de</strong>l proceso p<strong>en</strong>al. En esta instancia no se pres<strong>en</strong>ta<br />

ningún tipo <strong>de</strong> información sobre <strong>la</strong>s victimas <strong>de</strong> los <strong>de</strong>litos, a difer<strong>en</strong>cia <strong>de</strong> <strong>la</strong>s<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 23


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

estadísticas policiales. Sobre los pot<strong>en</strong>ciales of<strong>en</strong>sores, sólo se pres<strong>en</strong>ta <strong>la</strong> información<br />

referida a si se <strong>en</strong>cu<strong>en</strong>tran <strong>de</strong>t<strong>en</strong>idos o no durante <strong>en</strong> el proceso p<strong>en</strong>al. Finalm<strong>en</strong>te se<br />

ti<strong>en</strong>e al Sistema <strong>de</strong> Información P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia, don<strong>de</strong> <strong>la</strong> calidad <strong>de</strong> dicha información es<br />

<strong>la</strong> que provi<strong>en</strong>e <strong>de</strong>l sistema judicial [Figura 2.10].<br />

24<br />

Figura 2.10. Flujo <strong>de</strong> información criminal. [DNPC, 2007]<br />

Tal <strong>com</strong>o el título <strong>de</strong>l proyecto lo indica, se trabaj<strong>ar</strong>á con <strong>la</strong> información prov<strong>en</strong>i<strong>en</strong>te<br />

<strong>de</strong>l sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io únicam<strong>en</strong>te, <strong>de</strong>jando <strong>de</strong> <strong>la</strong>do <strong>la</strong> información prov<strong>en</strong>i<strong>en</strong>te <strong>de</strong>l<br />

SNIC (Sistema Nacional <strong>de</strong> Información Criminal) <strong>com</strong>o también <strong>de</strong>l SNEJ (Sistema<br />

Nacional <strong>de</strong> Estadísticas Judiciales). Se cree conv<strong>en</strong>i<strong>en</strong>te, igualm<strong>en</strong>te, <strong>de</strong>scribir<br />

brevem<strong>en</strong>te a estos dos últimos sistemas <strong>en</strong> c<strong>ar</strong>ácter informativo <strong>com</strong>o así también los<br />

métodos no oficiales <strong>de</strong> información <strong>de</strong>nominados estudios <strong>de</strong> victimización.<br />

2.4.1.1.1 Sistema Nacional <strong>de</strong> Información Criminal (SNIC)<br />

En el año 1999 <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal implem<strong>en</strong>tó el Sistema<br />

Nacional <strong>de</strong> Información Criminal <strong>com</strong>o p<strong>ar</strong>te <strong>de</strong> un programa <strong>de</strong> recolección,<br />

producción y análisis <strong>de</strong> informaciones estadísticas sobre el <strong>de</strong>lito <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina<br />

pret<strong>en</strong>di<strong>en</strong>do asumir <strong>la</strong> <strong>com</strong>pleja t<strong>ar</strong>ea <strong>de</strong> medir el <strong>de</strong>lito. Este sistema recopi<strong>la</strong> <strong>la</strong><br />

información registrada por <strong>la</strong>s fuerzas <strong>de</strong> seguridad (policías provinciales, policía<br />

fe<strong>de</strong>ral, g<strong>en</strong>d<strong>ar</strong>mería y prefectura naval) sobre <strong>la</strong> cantidad <strong>de</strong> sum<strong>ar</strong>ios iniciados<br />

m<strong>en</strong>sualm<strong>en</strong>te por hechos <strong>de</strong>lictuosos.<br />

Las policías y fuerzas <strong>de</strong> seguridad <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina pue<strong>de</strong>n tom<strong>ar</strong> conocimi<strong>en</strong>to <strong>de</strong> <strong>la</strong><br />

realización <strong>de</strong> una conducta que presuntam<strong>en</strong>te coinci<strong>de</strong> con <strong>la</strong> tipificada <strong>com</strong>o <strong>de</strong>lito<br />

por p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> ley p<strong>en</strong>al por dos mecanismos:<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

• Como consecu<strong>en</strong>cia <strong>de</strong> <strong>la</strong> actividad <strong>de</strong> prev<strong>en</strong>ción <strong>de</strong>l <strong>de</strong>lito (<strong>la</strong> vigi<strong>la</strong>ncia <strong>en</strong> sus<br />

diversas formas).<br />

• Como consecu<strong>en</strong>cia <strong>de</strong> <strong>la</strong> <strong>de</strong>nuncia realizada por un ciudadano que da lug<strong>ar</strong> a <strong>la</strong><br />

actividad <strong>de</strong> investigación <strong>de</strong>l <strong>de</strong>lito.<br />

El segundo mecanismo es cuantitativam<strong>en</strong>te más importante que el primero.<br />

En suma, los reportes que se realizan utilizando <strong>com</strong>o fu<strong>en</strong>te los hechos presuntam<strong>en</strong>te<br />

<strong>de</strong>lictuosos registrados por <strong>la</strong>s policías y <strong>de</strong>más fuerzas <strong>de</strong> seguridad, no incluy<strong>en</strong> los<br />

<strong>de</strong>litos no <strong>de</strong>nunciados ni los que ingresan directam<strong>en</strong>te por algún tribunal judicial<br />

(Juzgado, Fiscalía, Cám<strong>ar</strong>a). Esto quiere <strong>de</strong>cir, que existe una amplia gama <strong>de</strong> <strong>de</strong>litos<br />

que, al no ser <strong>de</strong>nunciados por sus víctimas ni captados por <strong>la</strong> policía, no ingresan al<br />

circuito judicial y, por lo tanto, no son registrados <strong>en</strong> <strong>la</strong> estadística oficial. Estos<br />

hechos ab<strong>ar</strong>can principalm<strong>en</strong>te a gran p<strong>ar</strong>te <strong>de</strong> robos, hurtos, lesiones y <strong>de</strong>litos sexuales,<br />

que por difer<strong>en</strong>tes razones no son <strong>de</strong>nunciados (porque <strong>la</strong> víctima no quiere per<strong>de</strong>r el<br />

tiempo, no cree que se pueda ac<strong>la</strong>r<strong>ar</strong> el hecho, etc.). Asimismo también hay una elevada<br />

cantidad <strong>de</strong> <strong>de</strong>litos que son muy difíciles <strong>de</strong> capt<strong>ar</strong> por el sistema <strong>de</strong> justicia por<br />

<strong>de</strong>fici<strong>en</strong>cias propias <strong>de</strong> los organismos <strong>de</strong> control (<strong>com</strong>o el caso <strong>de</strong> los <strong>de</strong>nominados<br />

“<strong>de</strong>litos <strong>com</strong>plejos”). Por tal motivo <strong>la</strong>s v<strong>ar</strong>iaciones que se produc<strong>en</strong> <strong>en</strong> <strong>la</strong>s cifras que<br />

reflejan estos reportes se limitan a <strong>la</strong>s v<strong>ar</strong>iaciones <strong>de</strong>tectadas por los propios organismos<br />

que <strong>la</strong> registran sin que esto, neces<strong>ar</strong>iam<strong>en</strong>te, implique un cambio real <strong>en</strong> <strong>la</strong> ocurr<strong>en</strong>cia<br />

<strong>de</strong> <strong>de</strong>litos (Cifras Negras <strong>de</strong>l Delito).<br />

Los registros m<strong>en</strong>suales se realizan <strong>en</strong> base a una p<strong>la</strong>nil<strong>la</strong> diseñada a tal fin, que <strong>la</strong>s<br />

policías y fuerzas <strong>de</strong> seguridad <strong>en</strong>vían a <strong>la</strong> DNPC [Anexo 1]. La tipificación <strong>de</strong> los<br />

hechos presuntam<strong>en</strong>te <strong>de</strong>lictuosos <strong>en</strong> esta p<strong>la</strong>nil<strong>la</strong>, continuando con una tradición <strong>de</strong><br />

relevami<strong>en</strong>to llevado a cabo por el Registro Nacional <strong>de</strong> Reinci<strong>de</strong>ncia y Estadística<br />

(antiguo consolidador <strong>de</strong> estadísticas a nivel Nacional), se <strong>en</strong>cu<strong>en</strong>tra fuertem<strong>en</strong>te<br />

asociada a <strong>la</strong>s figuras y tipos p<strong>en</strong>ales <strong>de</strong>scritos <strong>en</strong> el Código P<strong>en</strong>al. Los datos<br />

disponibles han sido agrupados sigui<strong>en</strong>do <strong>en</strong> p<strong>ar</strong>te <strong>la</strong> tipificación <strong>de</strong>l Código P<strong>en</strong>al (<strong>la</strong><br />

excepción ha sido los Delitos contra el Estado y <strong>la</strong> Comunidad) <strong>de</strong> modo tal que puedan<br />

a simple vista i<strong>de</strong>ntific<strong>ar</strong>se grupos según los bi<strong>en</strong>es jurídicos afectados:<br />

1 er Grupo - Delitos contra <strong>la</strong>s personas:<br />

Todos aquellos tipos <strong>de</strong> <strong>de</strong>litos que con un grado mayor o m<strong>en</strong>or <strong>de</strong> viol<strong>en</strong>cia afectan <strong>la</strong><br />

vida <strong>de</strong> <strong>la</strong>s personas.<br />

2 do Grupo - Delitos contra <strong>la</strong> honestidad y el honor:<br />

Las <strong>de</strong>nuncias por vio<strong>la</strong>ción han sido individualizadas p<strong>ar</strong>a po<strong>de</strong>r d<strong>ar</strong> cu<strong>en</strong>ta <strong>de</strong> este<br />

dato <strong>de</strong> manera <strong>de</strong>sagregada.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 25


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

3 er Grupo - Delitos contra <strong>la</strong> propiedad:<br />

Reúne todos aquellos hechos que afectan este bi<strong>en</strong> jurídico, se trate <strong>de</strong> robos, hurtos<br />

(incluy<strong>en</strong>do <strong>la</strong>s t<strong>en</strong>tativas <strong>en</strong> ambos casos) así <strong>com</strong>o todos los otros <strong>de</strong>litos que han sido<br />

agrupados <strong>en</strong> el Código P<strong>en</strong>al bajo este ítem.<br />

4 to Grupo - Delitos contra el Estado y <strong>la</strong> Comunidad:<br />

Incluye todos aquellos <strong>de</strong>litos que afectan al Estado <strong>en</strong> mayor o m<strong>en</strong>or medida.<br />

Otros Grupos:<br />

Los otros grupos son Delitos contra <strong>la</strong> libertad, Delitos contra el estado civil, Delitos<br />

previstos <strong>en</strong> leyes especiales, con <strong>la</strong> excepción <strong>de</strong> <strong>la</strong> ley 23.737 <strong>de</strong> Estupefaci<strong>en</strong>tes que,<br />

por trat<strong>ar</strong>se <strong>de</strong> aquél<strong>la</strong> que <strong>de</strong>ntro <strong>de</strong> <strong>la</strong>s leyes especiales conc<strong>en</strong>tra <strong>la</strong> mayor frecu<strong>en</strong>cia<br />

<strong>de</strong> hechos, ha sido consi<strong>de</strong>rada ap<strong>ar</strong>te (<strong>en</strong> el interior <strong>de</strong>l país sólo están informados los<br />

casos <strong>en</strong> los que p<strong>ar</strong>ticip<strong>ar</strong>on <strong>la</strong>s policías provinciales, restando los datos <strong>de</strong> <strong>la</strong>s<br />

<strong>de</strong>legaciones <strong>en</strong> el interior <strong>de</strong> <strong>la</strong> Policía Fe<strong>de</strong>ral Arg<strong>en</strong>tina).<br />

Adicional al SNIC, existe el Sistema <strong>de</strong> Alerta Temprana (SAT). Este se nutre <strong>de</strong> cuatro<br />

p<strong>la</strong>nil<strong>la</strong>s <strong>com</strong>plem<strong>en</strong>t<strong>ar</strong>ias a <strong>la</strong> <strong>de</strong>l SNIC que relevan información <strong>de</strong>tal<strong>la</strong>da sobre cuatro<br />

aspectos <strong>en</strong> p<strong>ar</strong>ticu<strong>la</strong>r:<br />

• homicidios dolosos.<br />

• homicidios culposos <strong>en</strong> acci<strong>de</strong>ntes <strong>de</strong> tránsito.<br />

• Suicidios.<br />

• <strong>de</strong>litos contra <strong>la</strong> propiedad.<br />

En los primeros tres casos se releva información puntual <strong>de</strong> cada hecho, mi<strong>en</strong>tras que el<br />

último consta <strong>de</strong> sum<strong>ar</strong>izaciones p<strong>ar</strong>ciales según distintas v<strong>ar</strong>iables [G<strong>ar</strong>cía M<strong>ar</strong>tínez et<br />

al, 2007].<br />

2.4.1.1.2 Sistema Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ)<br />

Las estadísticas judiciales sobre <strong>la</strong> criminalidad son el conjunto <strong>de</strong> <strong>la</strong>s informaciones<br />

cuantificadas sobre los <strong>com</strong>portami<strong>en</strong>tos efectivam<strong>en</strong>te producidos <strong>en</strong> <strong>la</strong> vida social,<br />

presuntam<strong>en</strong>te <strong>de</strong>lictuosos, que nac<strong>en</strong> <strong>de</strong> <strong>la</strong> actividad <strong>de</strong> <strong>de</strong>finición y registro por p<strong>ar</strong>te<br />

<strong>de</strong> <strong>la</strong>s instituciones judiciales p<strong>en</strong>ales, <strong>en</strong> el m<strong>ar</strong>co <strong>de</strong>l <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> los procesos p<strong>en</strong>ales<br />

[Sozzo, 2000]. En <strong>la</strong> Arg<strong>en</strong>tina, existe una administración fe<strong>de</strong>ral <strong>de</strong> justicia p<strong>en</strong>al con<br />

jurisdicción sobre todo el territorio nacional y <strong>com</strong>pet<strong>en</strong>cia sobre <strong>de</strong>terminados tipos <strong>de</strong><br />

<strong>de</strong>litos, una administración “nacional” <strong>de</strong> justicia p<strong>en</strong>al cuya jurisdicción es <strong>la</strong> Ciudad<br />

26<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

<strong>de</strong> Bu<strong>en</strong>os Aires y veinticuatro provinciales administraciones <strong>de</strong> justicia p<strong>en</strong>al. Esto<br />

hace que cada una <strong>de</strong> dichas instituciones estatales produzca su propia información<br />

sobre los <strong>com</strong>portami<strong>en</strong>tos presuntam<strong>en</strong>te <strong>de</strong>lictuosos procesados.<br />

Existe, <strong>en</strong>tonces, una pulverización <strong>de</strong> esta fu<strong>en</strong>te estadística <strong>de</strong> conocimi<strong>en</strong>to sobre <strong>la</strong><br />

cuestión criminal <strong>en</strong> torno a, por un <strong>la</strong>do, el po<strong>de</strong>r judicial fe<strong>de</strong>ral y por el otro, los<br />

diversos po<strong>de</strong>res judiciales provinciales. Esto se traduce <strong>en</strong> una diversidad <strong>de</strong> criterios<br />

p<strong>ar</strong>a <strong>la</strong> recolección y producción <strong>de</strong> información estadística <strong>en</strong> manos <strong>de</strong> oficinas<br />

administrativas <strong>de</strong> los diversos po<strong>de</strong>res judiciales, <strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes <strong>de</strong> <strong>la</strong>s distintas cortes<br />

supremas o tribunales supremos [Sozzo, 2000].<br />

Por otro <strong>la</strong>do, a difer<strong>en</strong>cia <strong>de</strong> lo que suce<strong>de</strong> con <strong>la</strong>s estadísticas policiales, aún no se ha<br />

avanzado <strong>de</strong>masiado <strong>en</strong> <strong>la</strong> creación <strong>de</strong> un sistema c<strong>en</strong>tralizado <strong>de</strong> estadísticas judiciales<br />

p<strong>ar</strong>a todo el país. Actualm<strong>en</strong>te <strong>en</strong> <strong>la</strong> DNPC se esta e<strong>la</strong>borando un diseño p<strong>ar</strong>a <strong>la</strong><br />

creación y funcionami<strong>en</strong>to <strong>de</strong> un Sistema Nacional <strong>de</strong> Estadísticas Judiciales<br />

automatizado [Sozzo, 2000].<br />

2.4.1.1.3 Encuestas <strong>de</strong> Victimización<br />

A fin <strong>de</strong> evalu<strong>ar</strong> <strong>en</strong> forma más certera el impacto que ti<strong>en</strong><strong>en</strong> los datos que registra <strong>la</strong><br />

policía (SNIC), es importante el aporte que han brindado los estudios <strong>de</strong> victimización,<br />

especialm<strong>en</strong>te a los fines <strong>de</strong> percibir el nivel <strong>de</strong> <strong>de</strong>nuncias <strong>de</strong> los <strong>de</strong>litos. Si bi<strong>en</strong> estos<br />

estudios ti<strong>en</strong><strong>en</strong> objetivos y metodologías distintas a <strong>la</strong>s estadísticas policiales, pue<strong>de</strong>n<br />

ser <strong>de</strong> suma utilidad p<strong>ar</strong>a <strong>com</strong>plem<strong>en</strong>t<strong>ar</strong> los resultados obt<strong>en</strong>idos por estas últimas.<br />

Las <strong>en</strong>cuestas <strong>de</strong> victimización nos permit<strong>en</strong> observ<strong>ar</strong> que es muy alta <strong>la</strong> cantidad <strong>de</strong><br />

<strong>de</strong>litos que no capta el sistema <strong>de</strong> justicia y, por <strong>en</strong><strong>de</strong>, el valor <strong>de</strong> <strong>la</strong> estadística oficial se<br />

<strong>en</strong>cu<strong>en</strong>tra condicionado. Estas limitaciones no implican que <strong>la</strong>s estadísticas policiales<br />

no sean <strong>de</strong> gran valor sino más bi<strong>en</strong> que su interpretación <strong>de</strong>be realiz<strong>ar</strong>se t<strong>en</strong>i<strong>en</strong>do <strong>en</strong><br />

cu<strong>en</strong>ta los condicionami<strong>en</strong>tos aludidos. En otras pa<strong>la</strong>bras, <strong>la</strong> información que surge <strong>de</strong><br />

<strong>la</strong>s estadísticas oficiales pres<strong>en</strong>tan fuertes limitaciones que <strong>de</strong>b<strong>en</strong> ser t<strong>en</strong>idas <strong>en</strong> cu<strong>en</strong>ta<br />

p<strong>ar</strong>a no tergivers<strong>ar</strong> su interpretación, pero esto no le resta importancia ni utilidad.<br />

Estos estudios ti<strong>en</strong><strong>en</strong> muchos b<strong>en</strong>eficios, <strong>en</strong>tre los que se <strong>de</strong>staca que, <strong>en</strong> muchos casos,<br />

son más repres<strong>en</strong>tativas que <strong>la</strong>s estadísticas oficiales ya que incluy<strong>en</strong> aquellos <strong>de</strong>litos<br />

que no ingres<strong>ar</strong>on al sistema <strong>de</strong> justicia. En efecto, una <strong>de</strong> <strong>la</strong>s cuestiones que abordan<br />

<strong>la</strong>s <strong>en</strong>cuestas <strong>de</strong> victimización son <strong>la</strong> cantidad <strong>de</strong> <strong>de</strong>litos que <strong>la</strong> g<strong>en</strong>te dijo haber sufrido<br />

<strong>en</strong> el período <strong>de</strong> estudio y su nivel <strong>de</strong> <strong>de</strong>nuncia. Es <strong>de</strong>cir que, sobre <strong>la</strong> base <strong>de</strong> estos<br />

estudios, se pue<strong>de</strong> conocer cual es el porc<strong>en</strong>taje <strong>de</strong> <strong>de</strong>litos que realm<strong>en</strong>te son<br />

<strong>de</strong>nunciados (el <strong>de</strong>nominado f<strong>en</strong>óm<strong>en</strong>o <strong>de</strong> <strong>la</strong> “cifras negras <strong>de</strong>l <strong>de</strong>lito”). Por otro <strong>la</strong>do,<br />

otra <strong>de</strong> <strong>la</strong>s c<strong>ar</strong>acterísticas <strong>de</strong>stacadas <strong>de</strong> <strong>la</strong>s <strong>en</strong>cuestas es que permit<strong>en</strong> acce<strong>de</strong>r al<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 27


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

conocimi<strong>en</strong>to <strong>de</strong>l “problema criminal” <strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>la</strong>s propias víctimas y<br />

no <strong>de</strong> <strong>la</strong>s ag<strong>en</strong>cias estatales.<br />

De todas maneras, los estudios <strong>de</strong> victimización también ti<strong>en</strong><strong>en</strong> sus limitaciones, <strong>en</strong><br />

especial <strong>en</strong> cuanto a su alcance, tanto territorial <strong>com</strong>o a <strong>la</strong>s cuestiones que ab<strong>ar</strong>ca. En<br />

ese s<strong>en</strong>tido, <strong>la</strong>s <strong>en</strong>cuestas se realizan básicam<strong>en</strong>te <strong>en</strong> gran<strong>de</strong>s c<strong>en</strong>tros urbanos y los<br />

<strong>de</strong>litos que más óptimam<strong>en</strong>te capta son los <strong>de</strong>litos contra <strong>la</strong> propiedad (<strong>en</strong> especial<br />

robos y hurtos). En re<strong>la</strong>ción a otros <strong>de</strong>litos (homicidios, <strong>de</strong>litos sexuales, viol<strong>en</strong>cia<br />

famili<strong>ar</strong>, <strong>de</strong>litos <strong>com</strong>plejos), no resulta un instrum<strong>en</strong>to muy efectivo ya que son<br />

conductas difíciles <strong>de</strong> abord<strong>ar</strong> <strong>en</strong> <strong>en</strong>trevistas <strong>de</strong> estas c<strong>ar</strong>acterísticas [O<strong>la</strong>eta, 2006].<br />

2.4.1.1.4 Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP)<br />

El Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) es un aporte<br />

vital p<strong>ar</strong>a el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> un diagnóstico válido sobre el estado actual <strong>de</strong> <strong>la</strong> cuestión<br />

c<strong>ar</strong>ce<strong>la</strong>ria a fines <strong>de</strong> aplic<strong>ar</strong> una política criminal eficaz.<br />

El Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP) fue<br />

implem<strong>en</strong>tado <strong>en</strong> el año 2002 por <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal con el fin<br />

<strong>de</strong> cont<strong>ar</strong> con información periódica y uniforme acerca <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción p<strong>en</strong>al privada <strong>de</strong><br />

libertad <strong>en</strong> <strong>la</strong> República Arg<strong>en</strong>tina.<br />

En nuestro país exist<strong>en</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias a nivel fe<strong>de</strong>ral, el Servicio<br />

P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral, con unida<strong>de</strong>s ubicadas <strong>en</strong> todo el país, y a nivel provincial,<br />

veintitrés provincias pose<strong>en</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias propias organizadas<br />

g<strong>en</strong>eralm<strong>en</strong>te bajo <strong>la</strong> forma <strong>de</strong> un servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io provincial o esquema análogo.<br />

Es <strong>de</strong>cir, que se trata <strong>de</strong> una pluralidad <strong>de</strong> instituciones ubicadas bajos <strong>com</strong>pet<strong>en</strong>cias<br />

jurídicas y políticas difer<strong>en</strong>tes [DNPC, 2003]. A<strong>de</strong>más, <strong>en</strong> nuestro país se ha constatado<br />

<strong>en</strong> los últimos años una creci<strong>en</strong>te cantidad <strong>de</strong> casos <strong>de</strong> personas privadas <strong>de</strong> libertad<br />

alojadas <strong>en</strong> lug<strong>ar</strong>es no aptos a tal fin tal, <strong>com</strong>o <strong>com</strong>is<strong>ar</strong>ías u otros <strong>de</strong>stacam<strong>en</strong>tos<br />

policiales. Esta <strong>com</strong>pleja organización dificultó el diseño <strong>de</strong> un sistema válido <strong>de</strong><br />

recopi<strong>la</strong>ción periódica <strong>de</strong> datos <strong>com</strong>p<strong>ar</strong>ables p<strong>ar</strong>a todo el país, que tuviera <strong>la</strong>s mismas<br />

unida<strong>de</strong>s <strong>de</strong> análisis y cu<strong>en</strong>te con el rigor ci<strong>en</strong>tífico neces<strong>ar</strong>io.<br />

En el campo <strong>de</strong> <strong>la</strong>s estadísticas sobre el sistema p<strong>en</strong>al, <strong>com</strong>o se observó <strong>en</strong> el punto<br />

2.2.1.1, el SNEEP ab<strong>ar</strong>ca uno <strong>de</strong> los tres ejes básicos <strong>de</strong> información, el correspondi<strong>en</strong>te<br />

a <strong>la</strong> ag<strong>en</strong>cia p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia; mi<strong>en</strong>tras que <strong>la</strong>s otras dos ag<strong>en</strong>cias, policial y judicial, son<br />

abordadas por el Sistema Nacional <strong>de</strong> Información Criminal (SNIC) y el Sistema<br />

Nacional <strong>de</strong> Estadísticas Judiciales (SNEJ), respectivam<strong>en</strong>te [Figura 2.1]. En tal s<strong>en</strong>tido,<br />

los resultados que nac<strong>en</strong> <strong>de</strong> <strong>la</strong> aplicación <strong>de</strong> estos sistemas <strong>de</strong> información permit<strong>en</strong><br />

28<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

trabaj<strong>ar</strong> <strong>en</strong> un diagnóstico acerca <strong>de</strong> <strong>la</strong> criminalidad <strong>de</strong>s<strong>de</strong> <strong>la</strong> p<strong>ar</strong>ticu<strong>la</strong>r mirada <strong>de</strong> <strong>la</strong>s<br />

ag<strong>en</strong>cias productoras <strong>de</strong> datos. Se cree que el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong>l SNEEP permite afront<strong>ar</strong> <strong>de</strong><br />

modo sust<strong>en</strong>table el diseño <strong>de</strong> políticas <strong>en</strong> materia p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia tanto a nivel fe<strong>de</strong>ral<br />

<strong>com</strong>o provincial.<br />

2.4.1.1.4.1 Metodología <strong>de</strong>l Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong><br />

P<strong>en</strong>a<br />

El SNEEP ti<strong>en</strong>e <strong>com</strong>o <strong>de</strong>stinat<strong>ar</strong>ios a todas <strong>la</strong>s unida<strong>de</strong>s <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción p<strong>en</strong>al <strong>de</strong> país,<br />

<strong>de</strong>p<strong>en</strong>di<strong>en</strong>tes <strong>de</strong>l sistema fe<strong>de</strong>ral y provincial. Es <strong>de</strong>cir no se incluye <strong>en</strong> esta etapa a <strong>la</strong>s<br />

personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías y a los niños y jóv<strong>en</strong>es privados <strong>de</strong> libertad que no se<br />

<strong>en</strong>cu<strong>en</strong>tran <strong>en</strong> una unidad <strong>de</strong> ejecución p<strong>en</strong>al. Cabe ac<strong>la</strong>r<strong>ar</strong> que si bi<strong>en</strong> <strong>la</strong>s <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias<br />

policiales no <strong>de</strong>b<strong>en</strong> consi<strong>de</strong>r<strong>ar</strong>se p<strong>la</strong>zas c<strong>ar</strong>ce<strong>la</strong>rias, <strong>en</strong> tanto no reún<strong>en</strong> <strong>la</strong>s condiciones<br />

requeridas p<strong>ar</strong>a los lug<strong>ar</strong>es <strong>de</strong> cumplimi<strong>en</strong>to <strong>de</strong> p<strong>en</strong>a y/o prisión prev<strong>en</strong>tiva [CELS,<br />

2005] constituy<strong>en</strong> una realidad insos<strong>la</strong>yable a <strong>la</strong> hora <strong>de</strong> analiz<strong>ar</strong> <strong>la</strong> situación <strong>de</strong>l sistema<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> nuestro país.<br />

El relevami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información se realiza <strong>en</strong> forma anual a través <strong>de</strong> dos<br />

cuestion<strong>ar</strong>ios que se <strong>com</strong>pletan <strong>en</strong> cada unidad <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción. El diseño <strong>de</strong> los<br />

instrum<strong>en</strong>tos <strong>de</strong> recolección <strong>de</strong> datos se llevó a cabo t<strong>en</strong>i<strong>en</strong>do <strong>com</strong>o refer<strong>en</strong>cia <strong>la</strong> ley<br />

24.660.<br />

El primero <strong>de</strong> los instrum<strong>en</strong>tos consiste <strong>en</strong> una serie <strong>de</strong> cuadros básicos con información<br />

agrupada, tomando <strong>com</strong>o unidad <strong>de</strong> análisis al establecimi<strong>en</strong>to, <strong>en</strong> base a <strong>la</strong>s personas<br />

alojadas <strong>en</strong> el establecimi<strong>en</strong>to <strong>en</strong> cuestión durante el último año. Los datos requeridos<br />

son los sigui<strong>en</strong>tes [Anexo 2]:<br />

• Cantidad total <strong>de</strong> <strong>de</strong>t<strong>en</strong>idos<br />

• Situación legal<br />

• Egresos<br />

• Cantidad <strong>de</strong> visitas<br />

• Cantidad <strong>de</strong> alteraciones al or<strong>de</strong>n<br />

• Cantidad <strong>de</strong> suicidios<br />

• Cantidad <strong>de</strong> fallecidos<br />

• Cantidad <strong>de</strong> fugas<br />

• Cantidad <strong>de</strong> evasiones<br />

El segundo instrum<strong>en</strong>to consiste <strong>en</strong> un c<strong>en</strong>so sobre el total <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>t<strong>en</strong>ida al<br />

día 31 <strong>de</strong> diciembre <strong>de</strong> cada año <strong>en</strong> el establecimi<strong>en</strong>to. Aquí <strong>la</strong> unidad <strong>de</strong> análisis son<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 29


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

<strong>la</strong>s personas <strong>de</strong>t<strong>en</strong>idas a esa fecha. En el anexo 3 se pres<strong>en</strong>ta <strong>la</strong> información que se<br />

recava sobre cada interno mediante el c<strong>en</strong>so <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción.<br />

Cabe <strong>de</strong>stac<strong>ar</strong> que <strong>la</strong> p<strong>la</strong>nil<strong>la</strong> se ll<strong>en</strong>a mediante una codificación <strong>de</strong> <strong>la</strong>s v<strong>ar</strong>iables, por lo<br />

que es importante ac<strong>la</strong>r<strong>ar</strong> que el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> <strong>la</strong>s estadísticas criminales <strong>en</strong> <strong>la</strong>s unida<strong>de</strong>s<br />

<strong>de</strong> <strong>de</strong>t<strong>en</strong>ción ti<strong>en</strong>e sus limitaciones.<br />

La falta <strong>de</strong> recursos y <strong>de</strong> personal capacitado, conjuntam<strong>en</strong>te con una poca tradición <strong>en</strong><br />

el manejo y producción <strong>de</strong> información por p<strong>ar</strong>te <strong>de</strong> <strong>la</strong>s instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias,<br />

<strong>com</strong>plica <strong>la</strong> t<strong>ar</strong>ea <strong>de</strong> recolección <strong>de</strong> datos. Esta <strong>de</strong>fici<strong>en</strong>cia trae <strong>com</strong>o consecu<strong>en</strong>cia <strong>la</strong><br />

falta <strong>de</strong> datos o <strong>la</strong> exist<strong>en</strong>cia <strong>de</strong> ciertas inconsist<strong>en</strong>cias <strong>en</strong> <strong>la</strong> información remitida <strong>en</strong><br />

algunos casos p<strong>ar</strong>ticu<strong>la</strong>res. En este s<strong>en</strong>tido, <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal<br />

t<strong>en</strong>drá que reforz<strong>ar</strong> los esfuerzos <strong>en</strong> lo refer<strong>en</strong>te a <strong>la</strong>s t<strong>ar</strong>eas <strong>de</strong> capacitación <strong>de</strong>l personal<br />

y cada organismo provincial y fe<strong>de</strong>ral <strong>com</strong>pet<strong>en</strong>te <strong>en</strong> esta materia t<strong>en</strong>drá que apoy<strong>ar</strong> el<br />

esfuerzo que realizan los <strong>en</strong>c<strong>ar</strong>gados <strong>de</strong> confeccion<strong>ar</strong> <strong>la</strong>s estadísticas <strong>en</strong> cada instituto.<br />

La información remitida pres<strong>en</strong>ta limitaciones propias <strong>de</strong> <strong>la</strong> fu<strong>en</strong>te <strong>de</strong> orig<strong>en</strong>. Se trata <strong>de</strong><br />

un relevami<strong>en</strong>to <strong>en</strong> el que <strong>la</strong> visión <strong>de</strong> los servicios p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios o policías locales<br />

acerca <strong>de</strong> <strong>la</strong>s personas <strong>de</strong>t<strong>en</strong>idas resulta fundam<strong>en</strong>tal. En tal s<strong>en</strong>tido, <strong>la</strong> principal fu<strong>en</strong>te<br />

<strong>de</strong> información es el legajo <strong>de</strong> cada interno por lo que exist<strong>en</strong> datos que no pue<strong>de</strong>n ser<br />

profundizados y otros que se <strong>en</strong>cu<strong>en</strong>tran sesgados por <strong>la</strong> propia fu<strong>en</strong>te. De todas<br />

maneras, se cree que t<strong>en</strong>er pres<strong>en</strong>te <strong>la</strong>s limitaciones referidas no le resta importancia al<br />

c<strong>en</strong>so <strong>en</strong> tanto se interprete con <strong>la</strong>s <strong>de</strong>bidas precauciones metodológicas y teóricas<br />

[Dirección Nacional <strong>de</strong> Política Criminal, 2005].<br />

Finalm<strong>en</strong>te, <strong>la</strong> oficina c<strong>en</strong>tral <strong>de</strong> cada servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io, o policía local, es <strong>la</strong><br />

<strong>en</strong>c<strong>ar</strong>gada <strong>de</strong> recopi<strong>la</strong>r <strong>la</strong>s p<strong>la</strong>nil<strong>la</strong>s <strong>de</strong> todos sus establecimi<strong>en</strong>tos y remitir<strong>la</strong>s a <strong>la</strong><br />

Dirección Nacional <strong>de</strong> Política Criminal <strong>en</strong> don<strong>de</strong> se vuelcan los datos <strong>en</strong> una base <strong>de</strong><br />

datos diseñada p<strong>ar</strong>a tal fin. Con los principales resultados obt<strong>en</strong>idos <strong>de</strong>l análisis <strong>de</strong> <strong>la</strong><br />

información se realizan informes que son remitidos a <strong>la</strong>s autorida<strong>de</strong>s nacionales y<br />

provinciales <strong>com</strong>pet<strong>en</strong>tes y se publican <strong>en</strong> <strong>la</strong> página Web <strong>de</strong>l Ministerio <strong>de</strong> Justicia y<br />

Derechos Humanos.<br />

Como se <strong>com</strong><strong>en</strong>ta <strong>en</strong> el punto 2.4.1.1 el trabajo se bas<strong>ar</strong>á <strong>en</strong> <strong>la</strong> c<strong>ar</strong>acterización <strong>de</strong> <strong>la</strong><br />

pob<strong>la</strong>ción ubicada <strong>en</strong> los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios <strong>de</strong> <strong>la</strong> Arg<strong>en</strong>tina. Los datos a<br />

utiliz<strong>ar</strong> se analiz<strong>ar</strong>án <strong>en</strong> <strong>la</strong> sección 4.2.2.Compresión <strong>de</strong> los Datos.<br />

30<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

2.4.1.1.5 Sistema Unificado <strong>de</strong> Registros Criminales (SURC)<br />

En el año 2003 se crea el SURC a c<strong>ar</strong>go <strong>de</strong>l Ministerio <strong>de</strong> Justicia, Seguridad y<br />

Derechos Humanos, con el fin <strong>de</strong> integr<strong>ar</strong> y unific<strong>ar</strong> <strong>en</strong> una so<strong>la</strong> base <strong>de</strong> datos el manejo<br />

<strong>de</strong> información criminal y logr<strong>ar</strong> servir al Mapa <strong>de</strong>l Delito. Era sumam<strong>en</strong>te neces<strong>ar</strong>io<br />

p<strong>ar</strong>a ese <strong>en</strong>tonces logr<strong>ar</strong> interconect<strong>ar</strong> <strong>la</strong>s bases <strong>de</strong> datos criminales <strong>de</strong> <strong>la</strong>s fuerzas<br />

policiales, <strong>de</strong> seguridad y fiscalías <strong>de</strong>l país, mediante una red que permitiría realiz<strong>ar</strong> una<br />

consulta on line a un banco <strong>de</strong> datos alim<strong>en</strong>tado <strong>en</strong> tiempo real. El Mapa <strong>de</strong>l Delito iba a<br />

est<strong>ar</strong> disponible <strong>en</strong> Internet p<strong>ar</strong>a que pudiera ser consultado por todos los ciudadanos.<br />

La iniciativa <strong>de</strong> <strong>la</strong> Secret<strong>ar</strong>ía <strong>de</strong> Seguridad Interior pret<strong>en</strong>día, <strong>en</strong> una primera etapa,<br />

interconect<strong>ar</strong> <strong>la</strong> Capital Fe<strong>de</strong>ral; <strong>en</strong> <strong>la</strong> segunda, <strong>la</strong>s fiscalías <strong>de</strong> <strong>la</strong> zona norte <strong>de</strong>l<br />

conurbano; luego, ext<strong>en</strong><strong>de</strong>r <strong>la</strong> experi<strong>en</strong>cia al primer y segundo cordón <strong>de</strong>l conurbano y<br />

al resto <strong>de</strong>l país. Y <strong>la</strong> última etapa <strong>de</strong>l proyecto consistía <strong>en</strong> interconect<strong>ar</strong> el banco <strong>de</strong><br />

datos con diversas bases <strong>de</strong>l MERCOSUR p<strong>ar</strong>a <strong>la</strong> persecución <strong>de</strong> <strong>de</strong>litos<br />

transnacionales <strong>com</strong>o el terrorismo, el n<strong>ar</strong>cotráfico y el robo y contrabando <strong>de</strong> vehículos<br />

importados.<br />

Los objetivos <strong>de</strong> mejora <strong>de</strong>l SURC consistían <strong>en</strong> [Val<strong>en</strong>ga, 2007]:<br />

• Interconect<strong>ar</strong> y sincroniz<strong>ar</strong> los sistemas judiciales, <strong>de</strong>l Ministerio Público, <strong>la</strong>s<br />

policías y Fuerzas <strong>de</strong> Seguridad p<strong>ar</strong>a llev<strong>ar</strong> a cabo investigaciones a nivel b<strong>ar</strong>rial<br />

y urbano.<br />

• Fortalecer el esfuerzo nacional <strong>de</strong> Policía, el Sistema <strong>de</strong> Seguridad Interior, <strong>la</strong><br />

Intelig<strong>en</strong>cia Criminal con su vincu<strong>la</strong>ción al Sistema P<strong>en</strong>al, y <strong>de</strong> todos ellos, con<br />

los países <strong>de</strong>l MERCOSUR.<br />

• Hacer uso <strong>de</strong> mapas <strong>de</strong>l <strong>de</strong>lito basados <strong>en</strong> Sistemas <strong>de</strong> Información Geográfica<br />

(SIG) <strong>com</strong>o herrami<strong>en</strong>ta p<strong>ar</strong>a automatiz<strong>ar</strong> t<strong>ar</strong>eas <strong>de</strong> recopi<strong>la</strong>ción <strong>de</strong> datos, el<br />

acceso y análisis <strong>de</strong> los mismos <strong>en</strong> tiempo real.<br />

• Agiliz<strong>ar</strong> los procedimi<strong>en</strong>tos, facilitando el acceso a <strong>la</strong> información por p<strong>ar</strong>te <strong>de</strong><br />

todos los actores involucrados <strong>en</strong> el sistema.<br />

• Estand<strong>ar</strong>iz<strong>ar</strong> <strong>la</strong> información sobre <strong>de</strong>litos y su uso p<strong>ar</strong>a <strong>la</strong>s estrategias <strong>de</strong><br />

investigación.<br />

• Sistematiz<strong>ar</strong> los procesos administrativos <strong>de</strong> los expedi<strong>en</strong>tes y <strong>de</strong> recopi<strong>la</strong>ción <strong>de</strong><br />

información sobre hechos criminales <strong>en</strong> una fiscalía.<br />

• Sistematiz<strong>ar</strong> <strong>la</strong> re<strong>la</strong>ción <strong>en</strong>tre los hechos, los imputados (individuales, grupos o<br />

bandas <strong>de</strong>lictivas), con los <strong>de</strong>nunciantes o victimas.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 31


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

El sistema permitiría, a p<strong>ar</strong>tir <strong>de</strong> los resultados proporcionados por <strong>la</strong>s búsquedas <strong>de</strong><br />

hechos con c<strong>ar</strong>acterísticas simi<strong>la</strong>res, individualiz<strong>ar</strong> y responsabiliz<strong>ar</strong> a personas<br />

imputadas por otros hechos <strong>en</strong> <strong>la</strong>s que pudier<strong>en</strong> haber p<strong>ar</strong>ticipado.<br />

La base <strong>de</strong> datos <strong>de</strong>l SURC almac<strong>en</strong>aba todo tipo <strong>de</strong> información diversa re<strong>la</strong>cionada a<br />

hechos <strong>de</strong>lictivos [Perversi ,2007; Val<strong>en</strong>ga, 2007]:<br />

32<br />

• Registro <strong>de</strong> Hechos: c<strong>ar</strong>acterísticas principales <strong>de</strong>l hecho (lug<strong>ar</strong>, <strong>de</strong>lito<br />

<strong>de</strong>nunciado, <strong>com</strong>is<strong>ar</strong>ía intervini<strong>en</strong>te).<br />

• Registro <strong>de</strong> <strong>de</strong>nunciantes: toda aquel<strong>la</strong> información que permite i<strong>de</strong>ntific<strong>ar</strong> a <strong>la</strong><br />

víctima o <strong>de</strong>nunciante.<br />

• Registro <strong>de</strong> autores i<strong>de</strong>ntificados: i<strong>de</strong>ntidad, c<strong>ar</strong>acterísticas, historial criminal<br />

e imág<strong>en</strong>es <strong>de</strong> los autores. Aquí se p<strong>la</strong>nificaba gu<strong>ar</strong>d<strong>ar</strong> lo neces<strong>ar</strong>io p<strong>ar</strong>a <strong>la</strong><br />

i<strong>de</strong>ntificación <strong>de</strong>l autor, <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>ndo el primer banco <strong>de</strong> imág<strong>en</strong>es <strong>de</strong> Autores<br />

Individualizados.<br />

• Registro <strong>de</strong> autos No i<strong>de</strong>ntificados: <strong>de</strong>scripción fisonómica <strong>de</strong> los NN tal<br />

<strong>com</strong>o <strong>la</strong> contextura física, edad aproximada, estatura aproximada, tonada, señas<br />

p<strong>ar</strong>ticu<strong>la</strong>res, tipo <strong>de</strong> rostro, color <strong>de</strong>l pelo, frases o <strong>com</strong><strong>en</strong>t<strong>ar</strong>ios.<br />

• Registro <strong>de</strong> Elem<strong>en</strong>tos Sustraídos: dispone <strong>de</strong> <strong>la</strong> información <strong>de</strong> aquellos<br />

elem<strong>en</strong>tos que fueron sustraídos <strong>en</strong> el hecho <strong>de</strong>lictivo.<br />

• Registro <strong>de</strong> autos robados: registra toda <strong>la</strong> información re<strong>la</strong>tiva a vehículos<br />

robados, <strong>com</strong>o el número <strong>de</strong> pat<strong>en</strong>te, motor, chasis, color, señas p<strong>ar</strong>ticu<strong>la</strong>res <strong>de</strong>l<br />

automotor, m<strong>ar</strong>ca, mo<strong>de</strong>lo, etc.<br />

• Registro <strong>de</strong> <strong>ar</strong>mas secuestradas: registros neces<strong>ar</strong>ios p<strong>ar</strong>a i<strong>de</strong>ntific<strong>ar</strong> <strong>ar</strong>mas<br />

vincu<strong>la</strong>ndo esta base <strong>de</strong> datos con otros sistemas.<br />

• Registro <strong>de</strong> evi<strong>de</strong>ncias: <strong>de</strong>scripción <strong>de</strong> todo aquello consi<strong>de</strong>rado huel<strong>la</strong> o pista<br />

<strong>en</strong> <strong>la</strong> esc<strong>en</strong>a <strong>de</strong>l crim<strong>en</strong>.<br />

• Mapas <strong>de</strong>l <strong>de</strong>lito: aportando <strong>la</strong> información <strong>de</strong>s<strong>de</strong> <strong>la</strong> perspectiva geográfica<br />

permiti<strong>en</strong>do g<strong>en</strong>er<strong>ar</strong> Mapas <strong>de</strong>l Delito. Estos mapas permitirán utiliz<strong>ar</strong> y<br />

administr<strong>ar</strong> más efici<strong>en</strong>tem<strong>en</strong>te los recursos <strong>de</strong> <strong>la</strong>s fuerzas policiales y <strong>la</strong>s<br />

fiscalías <strong>en</strong> <strong>la</strong> lucha contra el <strong>de</strong>lito<br />

Este proyecto, tal <strong>com</strong>o se dijo anteriorm<strong>en</strong>te, <strong>com</strong>pr<strong>en</strong>día v<strong>ar</strong>ias etapas progresivas. Sin<br />

emb<strong>ar</strong>go, con <strong>la</strong> salida <strong>en</strong> el año 2004 <strong>de</strong>l <strong>en</strong>tonces Ministro <strong>de</strong> Justicia, Seguridad y<br />

Derechos Humanos, Gustavo Béliz, el proyecto se conge<strong>la</strong>, sin conocimi<strong>en</strong>to alguno <strong>de</strong>l<br />

p<strong>ar</strong>a<strong>de</strong>ro actual <strong>de</strong>l mismo.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

2.4.1.1.6 Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires<br />

El Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires (CABA) [Beh<strong>ar</strong> & Lucilli,<br />

2003] surge a p<strong>ar</strong>tir <strong>de</strong> un conv<strong>en</strong>io <strong>en</strong>tre el C<strong>en</strong>tro <strong>de</strong> Información Metropolitana <strong>de</strong> <strong>la</strong><br />

Facultad <strong>de</strong> Arquitectura, Diseño y Urbanismo <strong>de</strong> <strong>la</strong> UBA y el Ministerio Público Fiscal<br />

<strong>de</strong> <strong>la</strong> Nación. Este proyecto nace con el objetivo <strong>de</strong> g<strong>en</strong>er<strong>ar</strong> un procedimi<strong>en</strong>to<br />

metodológico p<strong>ar</strong>a <strong>la</strong> <strong>de</strong>tección espacial <strong>de</strong> los <strong>de</strong>litos buscando reducir el increm<strong>en</strong>to<br />

<strong>de</strong> los mismos que se v<strong>en</strong>ia dando <strong>en</strong> <strong>la</strong> CABA <strong>en</strong> el año 2003.<br />

La fu<strong>en</strong>te sobre <strong>la</strong> cual se fundam<strong>en</strong>ta el Mapa <strong>de</strong>l <strong>de</strong>lito es una base única <strong>de</strong> hechos<br />

<strong>de</strong>lictivos g<strong>en</strong>erada por el Ministerio Público Fiscal <strong>de</strong> <strong>la</strong> Nación (MPF). Dicha base<br />

consta <strong>de</strong> más <strong>de</strong> 200,000 registros anuales, alim<strong>en</strong>tada <strong>en</strong> forma perman<strong>en</strong>te y<br />

sistemática. Cada registro conti<strong>en</strong>e <strong>la</strong> información acerca <strong>de</strong>l lug<strong>ar</strong> geográfico <strong>en</strong> que se<br />

produjo el hecho, fecha, tipo <strong>de</strong> <strong>de</strong>lito tipificado por el Código P<strong>en</strong>al, <strong>com</strong>is<strong>ar</strong>ías y<br />

fiscalías intervini<strong>en</strong>tes, número <strong>de</strong> actuación, cantidad <strong>de</strong> victimas, etc.<br />

Por otro <strong>la</strong>do se cu<strong>en</strong>ta con el Sistema <strong>de</strong> Información Territorial <strong>de</strong>l Área<br />

Metropolitana <strong>de</strong> Bu<strong>en</strong>os Aires (SIT/AMBA), g<strong>en</strong>erada <strong>en</strong> el C<strong>en</strong>tro <strong>de</strong> Información<br />

Metropolitana (CIM) a p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong> tecnología <strong>de</strong> Sistemas <strong>de</strong> Información Geográfica<br />

(SIG). Esta tecnología sirve <strong>de</strong> apoyo al Sistema <strong>de</strong> Información Territorial <strong>de</strong>l AMBA.<br />

La unión <strong>de</strong> estos dos <strong>com</strong>pon<strong>en</strong>tes, <strong>la</strong> base alfanumérica <strong>de</strong> <strong>de</strong>litos (MPF) y <strong>la</strong> base<br />

c<strong>ar</strong>tográfica digital (CIM), permit<strong>en</strong> g<strong>en</strong>er<strong>ar</strong> difer<strong>en</strong>tes salidas gráficas p<strong>ar</strong>a visualiz<strong>ar</strong> <strong>la</strong><br />

problemática <strong>de</strong>lictiva, <strong>de</strong>scubrir <strong>la</strong>s áreas <strong>de</strong> conc<strong>en</strong>tración, sus t<strong>en</strong><strong>de</strong>ncias, su<br />

estacionalidad y po<strong>de</strong>r vincu<strong>la</strong>r<strong>la</strong>s con <strong>la</strong>s v<strong>ar</strong>iables territoriales (urbanísticas,<br />

socioeconómicas, calidad <strong>de</strong> vida).<br />

El concepto <strong>en</strong> el que se basan los Mapas <strong>de</strong>l <strong>de</strong>lito es el <strong>de</strong> “áreas cali<strong>en</strong>tes”. Estas<br />

últimas son conc<strong>en</strong>traciones <strong>de</strong> inci<strong>de</strong>ntes <strong>de</strong>ntro <strong>de</strong> un área geográfica limitada que<br />

ap<strong>ar</strong>ece <strong>en</strong> un <strong>la</strong>pso <strong>de</strong> tiempo.<br />

En <strong>la</strong> figura 2.11 se muestran <strong>la</strong>s distintas pantal<strong>la</strong>s <strong>de</strong> <strong>la</strong> base c<strong>ar</strong>tográfica digital CIM.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 33


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

34<br />

Figura 2.11. Mapa <strong>de</strong> los Delitos contra <strong>la</strong> Propiedad [Beh<strong>ar</strong> & Lucilli, 2003].<br />

2.5 DIAGNÓSTICO DEL SERVICIO PENITENCIARIO EN ARGENTINA<br />

Esta p<strong>ar</strong>te <strong>de</strong>l estudio ti<strong>en</strong>e por objetivo analiz<strong>ar</strong> brevem<strong>en</strong>te el funcionami<strong>en</strong>to actual<br />

<strong>de</strong>l servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> su conjunto, <strong>de</strong>tal<strong>la</strong>ndo indicadores y aspectos c<strong>la</strong>ves que<br />

se <strong>de</strong>b<strong>en</strong> t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta a <strong>la</strong> hora <strong>de</strong> c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina.<br />

2.5.1 Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción P<strong>en</strong>al <strong>en</strong> Arg<strong>en</strong>tina<br />

La situación p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia repres<strong>en</strong>ta <strong>de</strong>s<strong>de</strong> hace ya v<strong>ar</strong>ios años un tema <strong>de</strong> especial<br />

preocupación <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina. El crecimi<strong>en</strong>to <strong>en</strong> <strong>la</strong>s tasas <strong>de</strong> <strong>de</strong>litos registrado a lo <strong>la</strong>rgo<br />

<strong>de</strong> <strong>la</strong> década <strong>de</strong>l nov<strong>en</strong>ta fue a<strong>com</strong>pañado por un fuerte aum<strong>en</strong>to <strong>en</strong> <strong>la</strong> pob<strong>la</strong>ción privada<br />

<strong>de</strong> libertad. Entre los años 1997 y 2006 dicha pob<strong>la</strong>ción aum<strong>en</strong>tó alre<strong>de</strong>dor <strong>de</strong>l 83%,<br />

afectado profundam<strong>en</strong>te por <strong>la</strong> crisis político social vivida <strong>en</strong>tre los años 2001 y 2002.<br />

Como se pue<strong>de</strong> observ<strong>ar</strong> <strong>en</strong> <strong>la</strong> figura 2.12, <strong>la</strong> cantidad <strong>de</strong> presos <strong>en</strong> el año 2005 llegaba<br />

a un pico 55.423 personas, con un índice <strong>de</strong> reclusos cada 100.000 habitantes. Estos<br />

increm<strong>en</strong>tos han insta<strong>la</strong>do el tema <strong>com</strong>o uno <strong>de</strong> los puntos inevitables <strong>de</strong> estudio <strong>de</strong>ntro<br />

<strong>de</strong> <strong>la</strong> política criminal [Dirección Nacional <strong>de</strong> Política Criminal, 2005].<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Presos<br />

60,000<br />

50,000<br />

40,000<br />

30,000<br />

20,000<br />

10,000<br />

0<br />

29,690 30,145<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

31,683<br />

83 84 87<br />

37,885<br />

103<br />

41,007<br />

110<br />

46,288<br />

51,998<br />

54,472 55,423<br />

54,000<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 35<br />

123<br />

137<br />

142 144<br />

C/ 100.000 Hab.<br />

1997 1998 1999 2000 2001 2002 2003 2004 2005 2006<br />

Año<br />

Figura 2.12. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina. [DNPC, 2006]<br />

Vale <strong>de</strong>stac<strong>ar</strong>, que <strong>la</strong> estadística oficial sobre pob<strong>la</strong>ción p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia (SNEEP) <strong>com</strong><strong>en</strong>zó<br />

<strong>en</strong> el año 2002. De los años anteriores no se cu<strong>en</strong>ta con datos <strong>de</strong> algunas provincias.<br />

Por otro <strong>la</strong>do, <strong>en</strong> nuestro país exist<strong>en</strong> dos tipos <strong>de</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias según<br />

<strong>com</strong>o estén organizadas y bajo que <strong>com</strong>pet<strong>en</strong>cias jurídicas se <strong>en</strong>cu<strong>en</strong>tran. Las primeras<br />

a nivel fe<strong>de</strong>ral, Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral, que pose<strong>en</strong> unida<strong>de</strong>s ubicadas <strong>en</strong> v<strong>ar</strong>ias<br />

provincias <strong>de</strong>l país. El segundo tipo es a nivel provincial, y son veintitrés provincias que<br />

pose<strong>en</strong> instituciones p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias propias, organizadas g<strong>en</strong>eralm<strong>en</strong>te bajo <strong>la</strong> forma <strong>de</strong><br />

un servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io provincial. A estos dos tipos <strong>de</strong> instituciones habría que<br />

sum<strong>ar</strong>le <strong>la</strong>s <strong>com</strong>is<strong>ar</strong>ías u otros <strong>de</strong>stacam<strong>en</strong>tos policiales, ya que <strong>en</strong> los últimos años se<br />

ha constatado que hay una gran cantidad <strong>de</strong> casos <strong>de</strong> personas privadas <strong>de</strong> libertad<br />

alojadas <strong>en</strong> este tipo <strong>de</strong> establecimi<strong>en</strong>to no aptos p<strong>ar</strong>a tal fin. P<strong>ar</strong>a fines <strong>de</strong>l 2005 existía<br />

alre<strong>de</strong>dor <strong>de</strong> 8000 personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías alre<strong>de</strong>dor <strong>de</strong> todo el país [Anexo 4].<br />

Se ti<strong>en</strong>e, por lo tanto, una gran cantidad <strong>de</strong> instituciones ubicadas bajos <strong>com</strong>pet<strong>en</strong>cias<br />

jurídicas y políticas difer<strong>en</strong>tes.<br />

A nivel fe<strong>de</strong>ral, <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral (SPF) fue creci<strong>en</strong>do<br />

sost<strong>en</strong>idam<strong>en</strong>te a través <strong>de</strong> los años (promedio <strong>de</strong>l 8% anual) [Figura 2.13], hasta lleg<strong>ar</strong><br />

a fines <strong>de</strong> 2006 con un crecimi<strong>en</strong>to acumu<strong>la</strong>do <strong>de</strong>l casi 300% <strong>de</strong>s<strong>de</strong> el año 1984.<br />

Nuevam<strong>en</strong>te, es <strong>de</strong>stacable el crecimi<strong>en</strong>to que se dio <strong>en</strong>tre los años 2001 (10%) y 2002<br />

(12%).<br />

139<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

0


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

36<br />

Año<br />

2006<br />

2004<br />

2002<br />

2000<br />

1998<br />

1996<br />

1994<br />

1992<br />

1990<br />

1988<br />

1986<br />

1984<br />

3,185<br />

2,838<br />

2,662<br />

2,355<br />

5,467<br />

5,339<br />

5,067<br />

4,965<br />

4,473<br />

4,108<br />

3,830<br />

7,146<br />

6,767<br />

6,385<br />

6,177<br />

6,112<br />

6,243<br />

7,872<br />

9,380<br />

9,625<br />

9,738<br />

9,246<br />

8,795<br />

0 1,000 2,000 3,000 4,000 5,000 6,000 7,000 8,000 9,000 10,000 11,000<br />

Presos<br />

Figura 2.13. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>de</strong>l SPF. [DNPC, 2006]<br />

Un estudio realizado por el Ministerio <strong>de</strong> Justicia <strong>en</strong> base a técnicas estadísticas,<br />

proyecta que el número <strong>de</strong> <strong>de</strong>t<strong>en</strong>idos <strong>en</strong> establecimi<strong>en</strong>tos fe<strong>de</strong>rales lleg<strong>ar</strong>á a 15.000 <strong>en</strong><br />

el 2015, y se increm<strong>en</strong>t<strong>ar</strong>ía a unos 22.000 p<strong>ar</strong>a el año 2025 [Prieto, 2005].<br />

A nivel provincial se cu<strong>en</strong>ta con información que indica que <strong>en</strong> <strong>la</strong> Provincia <strong>de</strong> Bu<strong>en</strong>os<br />

Aires, <strong>de</strong>s<strong>de</strong> el año 1996 hasta el 2005, <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria creció un 136% [Figura<br />

2.14], mi<strong>en</strong>tras que <strong>la</strong> pob<strong>la</strong>ción g<strong>en</strong>eral lo hizo <strong>en</strong> un 10%.En el Anexo 5 se pue<strong>de</strong><br />

observ<strong>ar</strong> <strong>la</strong> evolución <strong>de</strong> esta pob<strong>la</strong>ción p<strong>en</strong>al <strong>en</strong> cada una <strong>de</strong> <strong>la</strong>s provincias. Este<br />

increm<strong>en</strong>to se produjo tanto <strong>en</strong> los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios <strong>com</strong>o <strong>en</strong> <strong>la</strong>s<br />

<strong>com</strong>is<strong>ar</strong>ías bonaer<strong>en</strong>ses, si<strong>en</strong>do estos últimos, lug<strong>ar</strong>es no aptos p<strong>ar</strong>a el cumplimi<strong>en</strong>to <strong>de</strong><br />

p<strong>en</strong>as.<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


Presos<br />

35,000<br />

30,000<br />

25,000<br />

20,000<br />

15,000<br />

10,000<br />

5,000<br />

0<br />

12,409<br />

9,898<br />

13,873<br />

11,719<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Total Procesados Con<strong>de</strong>nados Otros<br />

15,548<br />

13,471<br />

16,297<br />

14,513<br />

20,760<br />

17,933<br />

23,103<br />

20,131<br />

26,438<br />

23,038<br />

28,206<br />

24,091<br />

30,025<br />

25,213<br />

2,202 1,818 1,494 1,290 1,766 2,273 2,636 3,023 3,429<br />

309 336 583 494<br />

1,061 699 764 1,092 1,383<br />

29,313<br />

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005<br />

Año<br />

Figura 2.14. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Bonaer<strong>en</strong>se<br />

Como se pue<strong>de</strong> observ<strong>ar</strong> <strong>en</strong> <strong>la</strong> figura 2.14, a principio <strong>de</strong> esta década <strong>la</strong>s cárceles y<br />

<strong>com</strong>is<strong>ar</strong>ías bonaer<strong>en</strong>ses alojaban 20.760 presos (16.567 <strong>en</strong> unida<strong>de</strong>s y 5748 <strong>en</strong><br />

<strong>com</strong>is<strong>ar</strong>ías), y <strong>la</strong> tasa <strong>de</strong> <strong>en</strong>c<strong>ar</strong>ce<strong>la</strong>mi<strong>en</strong>to era <strong>de</strong> 148 cada ci<strong>en</strong> mil habitantes<br />

bonaer<strong>en</strong>ses. Mi<strong>en</strong>tras que cinco años <strong>de</strong>spués, lo <strong>de</strong>t<strong>en</strong>idos lleg<strong>ar</strong>on a 29.313, con una<br />

tasa <strong>de</strong> <strong>en</strong>c<strong>ar</strong>ce<strong>la</strong>dos <strong>de</strong> aproximadam<strong>en</strong>te 200 cada ci<strong>en</strong> mil habitantes. Se observa, por<br />

lo tanto, que <strong>la</strong>s cárceles bonaer<strong>en</strong>ses alojan c<strong>la</strong>ram<strong>en</strong>te a más <strong>de</strong>l 50% <strong>de</strong> <strong>la</strong>s personas<br />

<strong>de</strong>t<strong>en</strong>idas <strong>de</strong>l país.<br />

En lo que respecta a <strong>la</strong> proporción procesados/con<strong>de</strong>nados, se analiz<strong>ar</strong>á el tema cuando<br />

se hable acerca <strong>de</strong> <strong>la</strong> situación p<strong>en</strong>al <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos <strong>en</strong> el ap<strong>ar</strong>tado 2.5.4.<br />

2.5.2 Situación a nivel internacional<br />

Durante el año 2002 existían <strong>en</strong> Arg<strong>en</strong>tina 123 internos <strong>en</strong> cárceles por cada 100,000<br />

habitantes, increm<strong>en</strong>tándose esta cifra <strong>en</strong> el año 2006 a 139 [Figura 2.15]. Si se tomase<br />

<strong>en</strong> cu<strong>en</strong>ta a <strong>la</strong>s personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías o <strong>de</strong>stacam<strong>en</strong>tos policiales, <strong>la</strong> tasa se<br />

increm<strong>en</strong>t<strong>ar</strong>ía a 159. Esta tasa es muy simi<strong>la</strong>r a países europeos <strong>com</strong>o España (147) y el<br />

Reino Unido (148), aunque m<strong>en</strong>or a <strong>la</strong> <strong>de</strong> países sudamericanos <strong>com</strong>o Uruguay (193),<br />

Brasil (219) y Chile (262). En cuanto a los países que pres<strong>en</strong>tan mayor cantidad <strong>de</strong><br />

presos por cada 100.000 habitantes, se ti<strong>en</strong>e a Estados unidos, con una pob<strong>la</strong>ción <strong>de</strong><br />

aproximadam<strong>en</strong>te 2.300.000 internos (tasa = 750 presos c/ 100.000 hab.) y a Rusia con<br />

628 reclusos por 100.000 habitantes. Se pue<strong>de</strong> <strong>en</strong>contr<strong>ar</strong> más <strong>de</strong>talles respecto a <strong>la</strong><br />

pob<strong>la</strong>ción p<strong>en</strong>al mundial <strong>en</strong> el anexo 6.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 37


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Presos<br />

800<br />

700<br />

600<br />

500<br />

400<br />

300<br />

200<br />

100<br />

38<br />

0<br />

EE.UU<br />

750<br />

628<br />

Rusia<br />

531<br />

Cuba<br />

356<br />

335<br />

288 281<br />

262<br />

219 209 198 193<br />

148 147 139 128 125 119 107 98 93 85 79 79 67 61<br />

Puerto Rico<br />

Sudafrica<br />

EAU<br />

Taiwan<br />

Chile<br />

Brasil<br />

Israel<br />

Mexico<br />

Uruguay<br />

Reino Unido<br />

Figura 2.15. Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> el mundo. [ICPS, 2007]<br />

La alta tasa <strong>de</strong> presos que registra Estados Unidos [Figura 2.15] se pue<strong>de</strong> explic<strong>ar</strong> <strong>de</strong> <strong>la</strong><br />

sigui<strong>en</strong>te manera. Las políticas <strong>de</strong> los 70 y 80 estuvieron impulsadas por el miedo al<br />

<strong>de</strong>lito y por el hecho <strong>de</strong> que éste figuraba <strong>com</strong>o tema <strong>de</strong> importancia c<strong>en</strong>tral <strong>en</strong> todas <strong>la</strong>s<br />

<strong>en</strong>cuestas nacionales [Morris & Rosales, 2007]. Hoy <strong>en</strong> día, m<strong>en</strong>os <strong>de</strong>l cinco por ci<strong>en</strong>to<br />

<strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción norteamericana consi<strong>de</strong>ra al crim<strong>en</strong> <strong>com</strong>o el mayor problema que<br />

<strong>en</strong>fr<strong>en</strong>ta Estados Unidos. La explicación es muy simple. Estados Unidos duplicó <strong>la</strong><br />

pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria. De casi un millón <strong>de</strong> presos que había a <strong>com</strong>i<strong>en</strong>zos <strong>de</strong> los 80, hoy<br />

pas<strong>ar</strong>on a ser dos millones. Con el doble <strong>de</strong> <strong>de</strong>lincu<strong>en</strong>tes <strong>en</strong> prisión, el crim<strong>en</strong> se redujo<br />

a <strong>la</strong> mitad. En el año 1971, el número <strong>de</strong> presos era aún mucho m<strong>en</strong>or, 200.000<br />

personas.<br />

C<strong>la</strong>ro que p<strong>ar</strong>a logr<strong>ar</strong> <strong>la</strong> reducción <strong>de</strong> hechos <strong>de</strong>lictuosos <strong>en</strong> EE.UU., se impusieron<br />

s<strong>en</strong>t<strong>en</strong>cias obligatorias a los criminales reinci<strong>de</strong>ntes. Aquellos que <strong>com</strong>etieran tres<br />

<strong>de</strong>litos fueron automáticam<strong>en</strong>te s<strong>en</strong>t<strong>en</strong>ciados a prisión perpetua sin ninguna posibilidad<br />

<strong>de</strong> exc<strong>ar</strong>ce<strong>la</strong>ción. A su vez, el <strong>en</strong>tonces presi<strong>de</strong>nte Bill Clinton aprobó p<strong>ar</strong>tidas masivas<br />

<strong>de</strong> dinero p<strong>ar</strong>a <strong>la</strong> construcción <strong>de</strong> prisiones, lo cual permitió remedi<strong>ar</strong> <strong>la</strong> superpob<strong>la</strong>ción<br />

y evito <strong>la</strong> liberación <strong>de</strong> criminales <strong>de</strong>bido a <strong>la</strong> saturación <strong>de</strong> <strong>la</strong>s cárceles. Otras <strong>de</strong> <strong>la</strong>s<br />

medidas tomadas fue <strong>la</strong> imposición <strong>de</strong> tácticas policiales novedosas. Se <strong>en</strong>fatizó el<br />

<strong>ar</strong>resto por <strong>de</strong>litos ap<strong>ar</strong><strong>en</strong>tem<strong>en</strong>te m<strong>en</strong>os graves que <strong>en</strong> ocasiones reve<strong>la</strong>ron evi<strong>de</strong>ncias<br />

<strong>de</strong> crím<strong>en</strong>es más serios. Finalm<strong>en</strong>te, se prosiguió a realiz<strong>ar</strong> un mayor seguimi<strong>en</strong>to y<br />

control <strong>de</strong> los <strong>de</strong>lincu<strong>en</strong>tes <strong>en</strong> libertad condicional, invirti<strong>en</strong>do bu<strong>en</strong>a p<strong>ar</strong>te <strong>de</strong>l tiempo<br />

<strong>en</strong> busc<strong>ar</strong> y apreh<strong>en</strong><strong>de</strong>r a aquellos que no acudían a <strong>la</strong>s pres<strong>en</strong>taciones judiciales<br />

obligatorias.<br />

España<br />

Arg<strong>en</strong>tina<br />

Colombia<br />

Australia<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión<br />

China<br />

Canadá<br />

P<strong>ar</strong>aguay<br />

Alemania<br />

Francia<br />

Suecia<br />

Suiza<br />

Italia<br />

Japón<br />

País


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Latinoamérica protagoniza, <strong>en</strong> este tema, una nueva p<strong>ar</strong>adoja: a pes<strong>ar</strong> <strong>de</strong> que <strong>la</strong>s tasas <strong>de</strong><br />

criminalidad son más altas, <strong>la</strong>s cárceles ti<strong>en</strong><strong>en</strong> m<strong>en</strong>os cantidad <strong>de</strong> reclusos que <strong>en</strong> los<br />

Estados Unidos.<br />

2.5.3 Sobrepob<strong>la</strong>ción y hacinami<strong>en</strong>to <strong>en</strong> Arg<strong>en</strong>tina<br />

Las condiciones <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción tanto <strong>en</strong> el ámbito fe<strong>de</strong>ral <strong>com</strong>o <strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os<br />

Aires, continúan si<strong>en</strong>do preocupantes. El <strong>en</strong>cierro <strong>en</strong> condiciones <strong>de</strong> hacinami<strong>en</strong>to y<br />

sobrepob<strong>la</strong>ción pone <strong>en</strong> serio riesgo <strong>la</strong> vida y <strong>la</strong> salud <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos, y constituye, sin<br />

lug<strong>ar</strong> a dudas, el sometimi<strong>en</strong>to a un trato cruel, inhumano y <strong>de</strong>gradante. La situación es<br />

p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te grave <strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os Aires, don<strong>de</strong> el trato inhumano <strong>de</strong> los<br />

<strong>de</strong>t<strong>en</strong>idos así <strong>com</strong>o su sometimi<strong>en</strong>to a torturas es el resultado <strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia sistemática<br />

y estructural que organiza <strong>la</strong> vida intramuros, in<strong>com</strong>patible con un or<strong>de</strong>nami<strong>en</strong>to<br />

<strong>de</strong>mocrático <strong>de</strong> <strong>la</strong> sociedad.<br />

El problema <strong>de</strong> <strong>la</strong> sobrepob<strong>la</strong>ción <strong>en</strong> <strong>la</strong>s unida<strong>de</strong>s p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias se <strong>en</strong>cu<strong>en</strong>tra<br />

estrecham<strong>en</strong>te vincu<strong>la</strong>do al f<strong>en</strong>óm<strong>en</strong>o <strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia al interior <strong>de</strong> <strong>la</strong>s cárceles. Si bi<strong>en</strong><br />

estos f<strong>en</strong>óm<strong>en</strong>os, el <strong>de</strong> <strong>la</strong> sobrepob<strong>la</strong>ción y el <strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia, no son únicam<strong>en</strong>te<br />

c<strong>ar</strong>acterísticos <strong>de</strong> <strong>la</strong>s cárceles <strong>en</strong> América Latina, sí es cierto que <strong>en</strong> nuestro contin<strong>en</strong>te<br />

<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>n niveles p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te altos. Situación que <strong>en</strong> el caso <strong>de</strong> <strong>la</strong> Arg<strong>en</strong>tina se<br />

pres<strong>en</strong>ta tanto a nivel fe<strong>de</strong>ral <strong>com</strong>o provincial [DNPC, 2005]. Es innegable que el<br />

hacinami<strong>en</strong>to g<strong>en</strong>era un constante increm<strong>en</strong>to <strong>de</strong> <strong>la</strong> t<strong>en</strong>sión <strong>en</strong>tre los internos, que<br />

<strong>de</strong>riva <strong>en</strong> problemas <strong>de</strong> conviv<strong>en</strong>cia <strong>en</strong> un espacio insufici<strong>en</strong>te e ina<strong>de</strong>cuado p<strong>ar</strong>a el<br />

<strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> <strong>la</strong> persona. Fom<strong>en</strong>ta, a<strong>de</strong>más, <strong>la</strong> propagación <strong>de</strong> <strong>en</strong>fermeda<strong>de</strong>s <strong>de</strong> todo<br />

tipo, producto <strong>de</strong> <strong>la</strong> falta <strong>de</strong> higi<strong>en</strong>e <strong>de</strong> los establecimi<strong>en</strong>tos y <strong>de</strong> a<strong>de</strong>cuada at<strong>en</strong>ción<br />

médica [CELS, 2005].<br />

La promiscuidad que se experim<strong>en</strong>ta <strong>en</strong> el interior <strong>de</strong> los establecimi<strong>en</strong>tos hace suponer<br />

que los internos se expon<strong>en</strong> a una alta probabilidad <strong>de</strong> contraer <strong>en</strong>fermeda<strong>de</strong>s<br />

infectocontagiosas, p<strong>ar</strong>ticu<strong>la</strong>rm<strong>en</strong>te SIDA. No se pue<strong>de</strong> saber con exactitud el número<br />

<strong>de</strong> infectados puesto que <strong>la</strong> realización <strong>de</strong>l correspondi<strong>en</strong>te análisis <strong>de</strong>be cont<strong>ar</strong> con <strong>la</strong><br />

autorización <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido, negada <strong>en</strong> <strong>la</strong> mayoría <strong>de</strong> los casos. P<strong>ar</strong>a el año 2001, se ha<br />

<strong>de</strong>tectado <strong>la</strong> afección <strong>de</strong>l 7% <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria, superando casi <strong>en</strong> doce veces a<br />

<strong>la</strong> tasa estadouni<strong>de</strong>nse (0,6%) y superior al porc<strong>en</strong>taje <strong>de</strong> personas adultas infectadas <strong>en</strong><br />

toda América Latina (<strong>en</strong>tre 0.5% y 1%) [Petrone, 2005]<br />

En cuanto a los regím<strong>en</strong>es <strong>de</strong> ejecución <strong>de</strong> p<strong>en</strong>as, el exceso <strong>de</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria<br />

imposibilita <strong>la</strong> asignación <strong>de</strong> t<strong>ar</strong>eas <strong>la</strong>borales a todos los internos y p<strong>ar</strong>ticipación <strong>en</strong><br />

activida<strong>de</strong>s educativas y recreativas, obstaculizando su reinserción <strong>la</strong>boral. Los presos<br />

no pue<strong>de</strong>n trabaj<strong>ar</strong> y gan<strong>ar</strong>se su dinero porque “<strong>la</strong>s p<strong>la</strong>zas <strong>de</strong> trabajo no alcanzan”<br />

[Alconada Mon, 2004].<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 39


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

2.5.3.1 Sobrepob<strong>la</strong>ción. Dim<strong>en</strong>sión <strong>de</strong>l problema<br />

El Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral administra 29 cárceles (contando los <strong>com</strong>plejos<br />

fe<strong>de</strong>rales), y 10 alcaldías <strong>en</strong> 11 provincias <strong>de</strong> <strong>la</strong> República Arg<strong>en</strong>tina [Anexo 7]. El<br />

índice <strong>de</strong> sobrepob<strong>la</strong>ción ha ido disminuy<strong>en</strong>do a través <strong>de</strong> los años, pasando <strong>de</strong> un<br />

3,3% <strong>en</strong> 2004 a t<strong>en</strong>er capacidad ociosa <strong>en</strong> 2006 <strong>de</strong>bido a <strong>la</strong> reducción <strong>en</strong> <strong>la</strong> pob<strong>la</strong>ción<br />

p<strong>en</strong>al pert<strong>en</strong>eci<strong>en</strong>te al SPF. Sin emb<strong>ar</strong>go hay que t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta que existían <strong>en</strong> el año<br />

2004 v<strong>ar</strong>ias <strong>de</strong> <strong>la</strong>s unida<strong>de</strong>s que alojaban una cantidad superior a <strong>la</strong> permitida, tales<br />

<strong>com</strong>o <strong>la</strong> unidad 3 (50% <strong>de</strong> sobrepob<strong>la</strong>ción), unidad 20 (82%), unidad 2 (14%), unidad<br />

13 (16%), <strong>en</strong>tre otras. P<strong>ar</strong>a el año 2006, había unos pocos alojami<strong>en</strong>tos con mayores<br />

p<strong>la</strong>zas ocupadas <strong>de</strong> <strong>la</strong>s disponibles, <strong>en</strong>tre el<strong>la</strong>s <strong>la</strong> unidad 13 que aum<strong>en</strong>to su tasa (25%<br />

<strong>de</strong> sobrepob<strong>la</strong>ción), unidad 17 (8.5%) y unidad 2 que pudo reducir el ratio <strong>en</strong> 10 puntos<br />

aproximadam<strong>en</strong>te (4.2%) En el anexo 8 se pue<strong>de</strong>n observ<strong>ar</strong> los distintos porc<strong>en</strong>tajes <strong>de</strong><br />

sobrepob<strong>la</strong>ción <strong>de</strong> los últimos 4 años c<strong>en</strong>sados p<strong>ar</strong>a cada provincia e instituto <strong>de</strong>l<br />

Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral.<br />

C<strong>la</strong>ro que <strong>la</strong> situación <strong>de</strong>l SPF es casi ejemp<strong>la</strong>r si se <strong>la</strong> <strong>com</strong>p<strong>ar</strong>a con lo que pasa <strong>en</strong> el<br />

resto <strong>de</strong> <strong>la</strong>s provincias. Por lo tanto resulta elem<strong>en</strong>tal analiz<strong>ar</strong> por sep<strong>ar</strong>ado <strong>la</strong> situación<br />

<strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os Aires y el resto <strong>de</strong> <strong>la</strong>s provincias.<br />

A fines <strong>de</strong>l 2006, <strong>la</strong>s cárceles <strong>de</strong> Bu<strong>en</strong>os Aires alojaban a 23.878 internos, casi el 50%<br />

<strong>de</strong>l total <strong>de</strong>l país, que era <strong>de</strong> 54.000 [Anexo 5]. T<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta que <strong>la</strong> capacidad<br />

disponible a esa fecha era <strong>de</strong> 22.164 p<strong>la</strong>zas, <strong>la</strong> sobrepob<strong>la</strong>ción llegaba al 7,7% [Anexo<br />

9]. Estos números aum<strong>en</strong>tan si se ti<strong>en</strong><strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta <strong>la</strong>s personas ubicadas <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías<br />

<strong>de</strong> <strong>la</strong> provincia. P<strong>ar</strong>a fines <strong>de</strong> 2005, había unas 4592 personas alojadas alre<strong>de</strong>dor <strong>de</strong> <strong>la</strong>s<br />

340 <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias <strong>de</strong> <strong>la</strong> policía <strong>de</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os Aires. Si bi<strong>en</strong> significaba una<br />

mejoría con respecto a fines <strong>de</strong> 2002 cuando <strong>la</strong>s <strong>com</strong>is<strong>ar</strong>ías <strong>de</strong> <strong>la</strong> provincia tuvieron su<br />

pico <strong>de</strong> pob<strong>la</strong>ción (7.507 personas), son cifras que m<strong>ar</strong>can c<strong>la</strong>ram<strong>en</strong>te el problema <strong>de</strong> <strong>la</strong><br />

sobrepob<strong>la</strong>ción y el hacinami<strong>en</strong>to <strong>en</strong> el sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io bonaer<strong>en</strong>se [Ministerio<br />

Seguridad Prov. Bs.As., 2004]. Fr<strong>en</strong>te a esta situación es preciso <strong>de</strong>stac<strong>ar</strong> nuevam<strong>en</strong>te<br />

que <strong>la</strong>s <strong>de</strong>p<strong>en</strong><strong>de</strong>ncias policiales no <strong>de</strong>b<strong>en</strong> consi<strong>de</strong>r<strong>ar</strong>se p<strong>la</strong>zas c<strong>ar</strong>ce<strong>la</strong>rias, <strong>en</strong> tanto no<br />

reún<strong>en</strong> <strong>la</strong>s condiciones requeridas p<strong>ar</strong>a los lug<strong>ar</strong>es <strong>de</strong> cumplimi<strong>en</strong>to <strong>de</strong> p<strong>en</strong>a y/o prisión<br />

prev<strong>en</strong>tiva. La pres<strong>en</strong>cia <strong>de</strong> personas <strong>de</strong>t<strong>en</strong>idas <strong>en</strong> estos espacios es c<strong>la</strong>ram<strong>en</strong>te ilegal.<br />

Ni <strong>la</strong>s <strong>com</strong>is<strong>ar</strong>ías se <strong>en</strong>cu<strong>en</strong>tran <strong>en</strong> condiciones edilicias <strong>de</strong> mant<strong>en</strong>er <strong>en</strong> el<strong>la</strong>s por un<br />

tiempo prolongado a personas <strong>de</strong>t<strong>en</strong>idas, ni el personal policial está capacitado p<strong>ar</strong>a<br />

hacer fr<strong>en</strong>te a esta situación [CELS, 2005].<br />

En lo que refiere al resto <strong>de</strong> <strong>la</strong>s provincias, <strong>la</strong> situación se vuelve aún peor que <strong>en</strong><br />

Bu<strong>en</strong>os Aires. Analizando los números informados por <strong>la</strong>s provincias acerca <strong>de</strong><br />

capacida<strong>de</strong>s y <strong>de</strong>t<strong>en</strong>idos, se observa que a fines <strong>de</strong>l 2006 <strong>la</strong> sobrepob<strong>la</strong>ción llegaba al<br />

11.36%. Se pue<strong>de</strong> ver que aproximadam<strong>en</strong>te 50 <strong>de</strong> los 121 establecimi<strong>en</strong>tos<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios distribuidos por todas <strong>la</strong>s provincias se <strong>en</strong>cu<strong>en</strong>tran sobresaturados.<br />

40<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


2.5.4 Situación p<strong>en</strong>al <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

En su gran mayoría, qui<strong>en</strong>es <strong>de</strong>b<strong>en</strong> soport<strong>ar</strong> esta situación <strong>de</strong> <strong>en</strong>cierro <strong>en</strong> condiciones<br />

inhumanas e ilegítimas resultan ser personas <strong>de</strong>t<strong>en</strong>idas solo prev<strong>en</strong>tivam<strong>en</strong>te. Es <strong>de</strong>cir,<br />

que se <strong>en</strong>cu<strong>en</strong>tran a <strong>la</strong> espera <strong>de</strong> una resolución judicial que <strong>de</strong>termine si resultan o no<br />

culpables <strong>de</strong> los <strong>de</strong>litos que se les imputan. A su vez, <strong>la</strong> situación se torna más grave si<br />

se rep<strong>ar</strong>a <strong>en</strong> el tiempo <strong>en</strong> que se prolongan los procesos p<strong>en</strong>ales y, por <strong>en</strong><strong>de</strong>, también <strong>la</strong><br />

prisión prev<strong>en</strong>tiva. Este tema es <strong>de</strong> suma importancia, ya que existe todo un régim<strong>en</strong> <strong>de</strong><br />

progresividad (etapas <strong>de</strong> observación, tratami<strong>en</strong>to y prueba) <strong>en</strong> <strong>la</strong> ejecución <strong>de</strong> <strong>la</strong> p<strong>en</strong>a<br />

que es aplicable solo a los con<strong>de</strong>nados.<br />

Según el c<strong>en</strong>so sobre pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ías <strong>de</strong>l 2004, el 60% <strong>de</strong> los<br />

<strong>de</strong>t<strong>en</strong>idos se <strong>en</strong>contraba procesado, mi<strong>en</strong>tras que solo el 40% había recibido con<strong>de</strong>na.<br />

La situación es peor si se ti<strong>en</strong>e <strong>en</strong> cu<strong>en</strong>ta que los números <strong>en</strong> <strong>la</strong> provincia <strong>de</strong> Bu<strong>en</strong>os<br />

Aires hab<strong>la</strong>n <strong>de</strong> solo un 20% <strong>de</strong> con<strong>de</strong>nados y un 80% <strong>de</strong> procesados. Si se consi<strong>de</strong>ran a<br />

los <strong>de</strong>t<strong>en</strong>idos <strong>en</strong> <strong>com</strong>is<strong>ar</strong>ías bonaer<strong>en</strong>ses, <strong>la</strong> proporción aum<strong>en</strong>ta a casi el 84% <strong>de</strong><br />

procesados, contra solo un 10% <strong>de</strong> con<strong>de</strong>nados y un 6% <strong>de</strong> inimputables y m<strong>en</strong>ores, tal<br />

<strong>com</strong>o se observó anteriorm<strong>en</strong>te <strong>en</strong> <strong>la</strong> figura 2.14. Finalm<strong>en</strong>te, <strong>en</strong> lo que respecta al SPF,<br />

se ti<strong>en</strong>e <strong>la</strong> misma proporción <strong>en</strong>tre con<strong>de</strong>nados y procesados.<br />

El porc<strong>en</strong>taje <strong>de</strong> personas procesadas <strong>en</strong> prisión prev<strong>en</strong>tiva <strong>en</strong> <strong>la</strong> Provincia <strong>de</strong> Bu<strong>en</strong>os<br />

Aires sólo es superado <strong>en</strong> América <strong>de</strong>l Sur por el <strong>de</strong> P<strong>ar</strong>aguay (92,7%), <strong>en</strong>contrándose<br />

muy por <strong>en</strong>cima <strong>de</strong> los porc<strong>en</strong>tajes <strong>de</strong> Uruguay (77,2%), Ecuador (68,3%) y Perú<br />

(63,2%) [Petrone, 2005].<br />

La situación p<strong>ar</strong>ece no haber cambiado tanto p<strong>ar</strong>a el año 2006, <strong>com</strong>o se pue<strong>de</strong> observ<strong>ar</strong><br />

<strong>en</strong> <strong>la</strong> sigui<strong>en</strong>te figura, ya que <strong>la</strong>s estadísticas oficiales hab<strong>la</strong>n <strong>de</strong> un 57% <strong>de</strong> procesados,<br />

41% <strong>de</strong> con<strong>de</strong>nados y un 2% inimputables o m<strong>en</strong>ores [DNPC, 2006].<br />

Porc<strong>en</strong>taje Procesados Con<strong>de</strong>nados Otros<br />

100%<br />

90%<br />

80%<br />

70%<br />

60%<br />

50%<br />

40%<br />

30%<br />

20%<br />

10%<br />

0%<br />

2002 2003 2004 2005 2006<br />

Figura 2.16. Proporción Procesados/Con<strong>de</strong>nados a nivel Nacional. [DNPC, 2006]<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 41<br />

Año


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

La sep<strong>ar</strong>ación <strong>de</strong> procesados y con<strong>de</strong>nados es un principio elem<strong>en</strong>tal <strong>de</strong>l tratami<strong>en</strong>to<br />

c<strong>ar</strong>ce<strong>la</strong>rio. Los procesados se <strong>en</strong>cu<strong>en</strong>tran <strong>en</strong> <strong>la</strong> p<strong>ar</strong>ticu<strong>la</strong>r situación <strong>de</strong> incertidumbre que<br />

<strong>de</strong>riva <strong>de</strong>l hecho <strong>de</strong> que el proceso que los ti<strong>en</strong>e <strong>de</strong>t<strong>en</strong>idos no ha sido <strong>de</strong>finido aún,<br />

<strong>de</strong>sconoc<strong>en</strong> cuanto tiempo <strong>de</strong>berá seguir <strong>en</strong> esa condición, cual será <strong>la</strong> resolución final<br />

y, por cierto, hasta tanto se lo con<strong>de</strong>ne, manti<strong>en</strong><strong>en</strong> su condición <strong>de</strong> inoc<strong>en</strong>tes. Por tales<br />

circunstancias, <strong>la</strong> inclusión <strong>de</strong> procesados <strong>en</strong> p<strong>la</strong>nes <strong>de</strong> trabajo y educación int<strong>en</strong>sos<br />

resulta por <strong>de</strong>más conflictiva [Petrone, 2005].<br />

2.5.5 Costo promedio <strong>de</strong> cada preso.<br />

Cada preso alojado <strong>en</strong> alguno <strong>de</strong> los establecimi<strong>en</strong>tos <strong>de</strong>l SPF le cuesta al Estado<br />

alre<strong>de</strong>dor <strong>de</strong> $ 4,285. Este número resulta por si elocu<strong>en</strong>te, pero lo es aún más si se<br />

consi<strong>de</strong>ra que, lejos <strong>de</strong> redund<strong>ar</strong> <strong>en</strong> un servicio ejemp<strong>la</strong>r, el hacinami<strong>en</strong>to, <strong>la</strong><br />

superpob<strong>la</strong>ción y <strong>la</strong> promiscuidad conviv<strong>en</strong> a di<strong>ar</strong>io <strong>de</strong>ntro <strong>de</strong>l servicio, tal <strong>com</strong>o se<br />

<strong>de</strong>scribió <strong>en</strong> los puntos anteriores. El cálculo está hecho sobre <strong>la</strong> base <strong>de</strong>l presupuesto<br />

oficial <strong>de</strong>l año 2006, dividi<strong>en</strong>do lo <strong>de</strong>stinado al SPF y <strong>la</strong> cantidad <strong>de</strong> <strong>de</strong>t<strong>en</strong>idos <strong>en</strong><br />

establecimi<strong>en</strong>tos fe<strong>de</strong>rales a fin <strong>de</strong> dicho año.<br />

Lo curioso es que si se ti<strong>en</strong>e <strong>en</strong> cu<strong>en</strong>ta el presupuesto <strong>de</strong>l año 2004, alre<strong>de</strong>dor <strong>de</strong>l 80%<br />

<strong>de</strong>l presupuesto <strong>de</strong>l SPF estaba afectado p<strong>ar</strong>a gastos <strong>de</strong> personal y pago a retirados y<br />

p<strong>en</strong>sionados. Como se observa <strong>en</strong> el anexo 10, unos 288 millones <strong>de</strong> pesos eran<br />

<strong>de</strong>stinados a gastos <strong>de</strong> personal, sobre un total <strong>de</strong> 372 millos <strong>de</strong>stinados <strong>en</strong>tre otras<br />

cosas p<strong>ar</strong>a <strong>la</strong> seguridad, manut<strong>en</strong>ción y rehabilitación <strong>de</strong> los internos p<strong>ar</strong>a logr<strong>ar</strong> una<br />

a<strong>de</strong>cuada reinserción posterior <strong>en</strong> <strong>la</strong> sociedad. P<strong>ar</strong>a dicho año el SPF t<strong>en</strong>ía más <strong>de</strong> 8100<br />

ag<strong>en</strong>tes, lo que establece una re<strong>la</strong>ción p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io-<strong>de</strong>t<strong>en</strong>ido cercana al 1 a 1. La<br />

re<strong>la</strong>ción baja a 1 a 0,4 si se ti<strong>en</strong><strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta los que realizan servicio <strong>en</strong> <strong>la</strong>s unida<strong>de</strong>s<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias. Esto último evi<strong>de</strong>ncia que gran p<strong>ar</strong>te <strong>de</strong> <strong>la</strong> dotación se <strong>de</strong>dica a t<strong>ar</strong>eas<br />

administrativas fuera <strong>de</strong> <strong>la</strong>s cárceles [Petrone, 2005].<br />

En <strong>la</strong> tab<strong>la</strong> 2.2 se pue<strong>de</strong> observ<strong>ar</strong> <strong>la</strong> evolución <strong>de</strong>l presupuesto <strong>de</strong>stinado al SPF <strong>de</strong>s<strong>de</strong> el<br />

año 2001 al 2006, y <strong>la</strong> cantidad promedio por <strong>de</strong>t<strong>en</strong>ido <strong>en</strong> el mismo período.<br />

Activida<strong>de</strong>s Comunes al Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />

Fe<strong>de</strong>ral (Programas 16,17 y 15)<br />

$46,587,807 $26,150,299 $24,890,053 $61,127,136<br />

Seguridad y Rehabilitacion <strong>de</strong>l interno $96,937,642 $122,693,913 $116,632,790 $151,527,695<br />

Pagos a Retirados y P<strong>en</strong>sionados<br />

Cooperacion Tecnica y Financiera p<strong>ar</strong>a <strong>la</strong><br />

Laborterapia <strong>de</strong> Internos<br />

$89,424,056<br />

$7,660,004<br />

$95,518,206<br />

$5,894,010<br />

$100,135,408<br />

$6,255,851<br />

$125,856,449<br />

$7,670,190<br />

Sin Datos Sin Datos<br />

Formacion y Capacitacion $6,277,455 $8,195,581 $8,669,590 $11,743,253<br />

Obras P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias $39,292,439 $39,283,890 $30,076,587 $14,460,295<br />

Presupuesto Total +Obras P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias $286,179,403 $297,735,899 $286,660,279 $372,385,018 $432,281,000 $482,356,000<br />

Cantidad Det<strong>en</strong>idos 7,872 8,795 9,246 9,738 9,625 9,380<br />

Presupuesto M<strong>en</strong>sual por Det<strong>en</strong>ido $3,030 $2,821 $2,584 $3,187 $3,743 $4,285<br />

42<br />

PRESUPUESTO SPF 2001 2002 2003 2004 2005<br />

Tab<strong>la</strong> 2.2. Evolución <strong>de</strong>l presupuesto SPF. [Petrone, 2005]<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión<br />

2006


2.5.6 Trabajo <strong>en</strong> <strong>la</strong>s cárceles<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Las estadísticas reve<strong>la</strong>n que solo un 31% <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos posee algún trabajo <strong>de</strong>ntro <strong>de</strong><br />

<strong>la</strong> cárcel. De este 31% <strong>de</strong> mano <strong>de</strong> obra ocupada, solo un 9% ti<strong>en</strong>e un trabajo<br />

re<strong>la</strong>cionado con activida<strong>de</strong>s productivas. Haci<strong>en</strong>do foco <strong>en</strong> <strong>la</strong> situación legal, es <strong>de</strong><br />

esper<strong>ar</strong> que el porc<strong>en</strong>taje <strong>de</strong> no con<strong>de</strong>nados que trabaja sea m<strong>en</strong>or que el <strong>de</strong> los<br />

con<strong>de</strong>nados. Tal <strong>com</strong>o se dijo <strong>en</strong> el punto 2.5.4, <strong>la</strong> situación <strong>de</strong> los no con<strong>de</strong>nados<br />

asociados a un régim<strong>en</strong> <strong>la</strong>boral resulta por <strong>de</strong>más conflictiva.<br />

Situacion Legal<br />

Trabajo Remunerado<br />

Si No<br />

Trabajo Productivo<br />

Si No<br />

Con<strong>de</strong>nados 35% 65% 8% 92%<br />

No con<strong>de</strong>nados 28% 72% 10% 90%<br />

Figura 2.17. Distribución <strong>de</strong> trabajadores según Situación Legal.<br />

Más allá <strong>de</strong>l 9% <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria que trabaja <strong>en</strong> activida<strong>de</strong>s productivas,<br />

prácticam<strong>en</strong>te el trabajo <strong>en</strong> <strong>la</strong>s cárceles no existe. En rigor <strong>de</strong> verdad, no esta<br />

sucedi<strong>en</strong>do el mito <strong>de</strong> finales <strong>de</strong>l siglo XIX que <strong>de</strong>cía que todo el mundo iba a est<strong>ar</strong><br />

trabajando <strong>en</strong> <strong>la</strong>s cárceles y <strong>de</strong>spués iba a volver al mercado, recuperado y más dócil<br />

[D<strong>ar</strong>oqui, 2008].<br />

2.5.7 Reflexiones acerca <strong>de</strong>l diagnóstico <strong>de</strong>l Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />

Es importante ac<strong>la</strong>r<strong>ar</strong>, que mediante el diagnóstico <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do anteriorm<strong>en</strong>te se busca<br />

que el lector pueda, <strong>en</strong> alguna medida, introducirse <strong>en</strong> esta sociedad tan p<strong>ar</strong>ticu<strong>la</strong>r <strong>com</strong>o<br />

lo es <strong>la</strong> c<strong>ar</strong>ce<strong>la</strong>ria. Se cree que p<strong>ar</strong>a <strong>en</strong>t<strong>en</strong><strong>de</strong>r <strong>la</strong> problemática lo más a fondo posible, es<br />

sumam<strong>en</strong>te importante d<strong>ar</strong> a conocer estos indicadores.<br />

Estado <strong>de</strong> <strong>la</strong> Cuestión Patricio Gutiérrez Rüegg 43


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

44<br />

Patricio Gutiérrez Rüegg Estado <strong>de</strong> <strong>la</strong> Cuestión


3. DESCRIPCIÓN DEL PROBLEMA<br />

3.1. TRATAMIENTO DE LA INFORMACIÓN<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

En <strong>la</strong> actualidad, <strong>la</strong> Dirección Nacional <strong>de</strong> Política Criminal (DNPC) <strong>de</strong>l Ministerio <strong>de</strong><br />

Justicia y Derechos Humanos <strong>de</strong> <strong>la</strong> Nación (MJDHN) solo publica <strong>la</strong>s estadísticas<br />

prov<strong>en</strong>i<strong>en</strong>tes <strong>de</strong>l Sistema Nacional <strong>de</strong> Estadísticas sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a sin<br />

tratami<strong>en</strong>to alguno <strong>de</strong> <strong>la</strong>s mismas. A través <strong>de</strong> un análisis estadístico básico, <strong>en</strong> el cuál<br />

lo que se hace es mostr<strong>ar</strong> <strong>la</strong>s frecu<strong>en</strong>cias <strong>de</strong> ocurr<strong>en</strong>cia <strong>de</strong> cada aspecto analizado, se<br />

esta <strong>de</strong>saprovechando toda <strong>la</strong> información que proporcionan los datos.<br />

En tiempos <strong>en</strong> los que los volúm<strong>en</strong>es <strong>de</strong> información son muy gran<strong>de</strong>s, se hace<br />

neces<strong>ar</strong>io un tratami<strong>en</strong>to <strong>de</strong> <strong>la</strong> información más <strong>com</strong>plejo, esperando <strong>en</strong>contr<strong>ar</strong><br />

re<strong>la</strong>ciones subyac<strong>en</strong>tes y <strong>com</strong>portami<strong>en</strong>tos <strong>en</strong> los datos que no pue<strong>de</strong>n i<strong>de</strong>ntific<strong>ar</strong>se<br />

mediante un tratami<strong>en</strong>to estadístico clásico. Las técnicas estadísticas clásicas se c<strong>en</strong>tran<br />

g<strong>en</strong>eralm<strong>en</strong>te <strong>en</strong> técnicas confirmatorias, mi<strong>en</strong>tras que <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos<br />

son g<strong>en</strong>eralm<strong>en</strong>te exploratorias, pudi<strong>en</strong>do valid<strong>ar</strong> <strong>com</strong>portami<strong>en</strong>tos ya conocidos <strong>com</strong>o<br />

también p<strong>la</strong>nte<strong>ar</strong> nuevas hipótesis.<br />

3.2. EL PROBLEMA ESPECÍFICO<br />

Mi<strong>en</strong>tras que <strong>la</strong> cantidad <strong>de</strong> presos <strong>en</strong> establecimi<strong>en</strong>tos <strong>en</strong> <strong>la</strong> República Arg<strong>en</strong>tina<br />

continúa <strong>en</strong> asc<strong>en</strong>so continuo, lo mismo ocurre con <strong>la</strong>s tasas <strong>de</strong> <strong>de</strong>litos registradas año<br />

tras año. Estamos fr<strong>en</strong>te a una situación <strong>en</strong> <strong>la</strong> cual los <strong>de</strong>lincu<strong>en</strong>tes <strong>en</strong>tran a <strong>la</strong>s<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias p<strong>ar</strong>a <strong>la</strong> readaptación y resocialización, y sin emb<strong>ar</strong>go cuando <strong>la</strong> mayoría<br />

<strong>de</strong> ellos cumpl<strong>en</strong> sus p<strong>en</strong>as y <strong>de</strong>jan <strong>la</strong>s cárceles, vuelv<strong>en</strong> a busc<strong>ar</strong> al <strong>de</strong>lito <strong>com</strong>o medio<br />

<strong>de</strong> subsist<strong>en</strong>cia. Existe <strong>de</strong>ntro <strong>de</strong> estos establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios diversos factores<br />

<strong>com</strong>o el ocio, <strong>la</strong> viol<strong>en</strong>cia, el hacinami<strong>en</strong>to, <strong>la</strong> promiscuidad, <strong>la</strong> soledad, que hac<strong>en</strong> que<br />

los <strong>de</strong>t<strong>en</strong>idos sean <strong>de</strong>spersonalizados moral, psíquica y físicam<strong>en</strong>te.<br />

Por lo tanto se pue<strong>de</strong>n <strong>de</strong>stac<strong>ar</strong> dos fr<strong>en</strong>tes a atac<strong>ar</strong>. En primer lug<strong>ar</strong>, si se quiere<br />

readapt<strong>ar</strong> al <strong>de</strong>t<strong>en</strong>ido a una sociedad <strong>de</strong> <strong>la</strong> cual ya no forma p<strong>ar</strong>te, es fundam<strong>en</strong>tal que se<br />

llegue a cumplir con los fines que se buscan mediante <strong>la</strong> aplicación <strong>de</strong> <strong>la</strong> sanción:<br />

prev<strong>en</strong>ción, retribución, readaptación, resocialización y futura ubicación social <strong>de</strong> aquél.<br />

De esta manera, esper<strong>ar</strong>íamos que el preso pueda volver a integr<strong>ar</strong>se <strong>de</strong> manera<br />

<strong>de</strong>finitiva a <strong>la</strong> sociedad <strong>de</strong> <strong>la</strong> cual fue sep<strong>ar</strong>ado, sin necesidad m<strong>ar</strong>cada <strong>de</strong> volver a<br />

<strong>de</strong>linquir. En segundo lug<strong>ar</strong>, se ti<strong>en</strong>e que trabaj<strong>ar</strong> int<strong>en</strong>sivam<strong>en</strong>te <strong>en</strong> <strong>la</strong> prev<strong>en</strong>ción, es<br />

<strong>de</strong>cir, evit<strong>ar</strong> que nuevas personas <strong>com</strong>etan algún tipo <strong>de</strong> <strong>de</strong>lito y se conviertan <strong>en</strong> los<br />

futuros presos. Si no se logr<strong>ar</strong>a esto último se est<strong>ar</strong>ía fr<strong>en</strong>te a un “loop” interminable.<br />

Descripción <strong>de</strong>l Problema Patricio Gutiérrez Rüegg 45


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Por lo tanto, uno <strong>de</strong> los principales objetivos que se pret<strong>en</strong><strong>de</strong> alcanz<strong>ar</strong> mediante el<br />

pres<strong>en</strong>te proyecto es el sigui<strong>en</strong>te:<br />

Analiz<strong>ar</strong> <strong>la</strong> factibilidad y valor agregado <strong>de</strong> aplic<strong>ar</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones<br />

c<strong>ar</strong>ce<strong>la</strong>rias logrando <strong>en</strong>t<strong>en</strong><strong>de</strong>r mejor los motivos que pudieron haber motivado a esta<br />

fracción <strong>de</strong> <strong>la</strong> sociedad a <strong>de</strong>linquir y extraer conclusiones que sirvan <strong>de</strong> apoyo p<strong>ar</strong>a <strong>la</strong><br />

creación <strong>de</strong> políticas criminales rep<strong>ar</strong>adoras intramuros y prev<strong>en</strong>tivas fuera <strong>de</strong> <strong>la</strong>s<br />

cárceles.<br />

46<br />

Patricio Gutiérrez Rüegg Descripción <strong>de</strong>l Problema


4. SOLUCIÓN<br />

4.1 PROPUESTA DE SOLUCIÓN<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Una vez p<strong>la</strong>nteados tanto el estado <strong>de</strong> <strong>la</strong> cuestión, <strong>com</strong>o el problema que se requiere<br />

resolver, se continúa con <strong>la</strong> propuesta <strong>de</strong> solución al problema.<br />

A los fines <strong>de</strong> c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria y <strong>en</strong>contr<strong>ar</strong> conductas y patrones <strong>de</strong><br />

<strong>com</strong>portami<strong>en</strong>to <strong>en</strong> los reclusos, se <strong>de</strong>ci<strong>de</strong> <strong>en</strong>c<strong>ar</strong><strong>ar</strong> <strong>la</strong> problemática <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te<br />

manera:<br />

1. Proceso <strong>de</strong> clustering o agrupami<strong>en</strong>to utilizando los atributos más significativos <strong>de</strong><br />

los presos.<br />

2. Análisis <strong>de</strong> los clusters obt<strong>en</strong>idos. Validación con especialistas <strong>en</strong> temática criminal.<br />

3. Aplicación <strong>de</strong> algoritmos <strong>de</strong> inducción a cada cluster p<strong>ar</strong>a <strong>la</strong> i<strong>de</strong>ntificación <strong>de</strong> reg<strong>la</strong>s<br />

<strong>de</strong> <strong>de</strong>cisión que ayu<strong>de</strong>n a explic<strong>ar</strong> <strong>la</strong> <strong>com</strong>posición <strong>de</strong> cada grupo.<br />

De esta forma, mediante <strong>la</strong> utilización <strong>de</strong> algoritmos <strong>de</strong> agrupami<strong>en</strong>to y <strong>de</strong> c<strong>la</strong>sificación,<br />

se esperan obt<strong>en</strong>er <strong>com</strong>portami<strong>en</strong>tos <strong>com</strong>unes <strong>en</strong>tre los presos explorando los datos<br />

almac<strong>en</strong>ados <strong>en</strong> el sistema SNEEP. Se busca g<strong>en</strong>er<strong>ar</strong> grupos y reg<strong>la</strong>s relevantes que<br />

ayu<strong>de</strong>n a <strong>la</strong> toma <strong>de</strong> <strong>de</strong>cisiones <strong>de</strong> <strong>la</strong> DNPC.<br />

Se cree conv<strong>en</strong>i<strong>en</strong>te seguir una metodología <strong>de</strong> trabajo <strong>en</strong> minería <strong>de</strong> datos. Se utiliz<strong>ar</strong>á<br />

<strong>com</strong>o m<strong>ar</strong>co <strong>de</strong> trabajo a <strong>la</strong> CRISP-DM, explicada <strong>en</strong> el capítulo 2 “Estado <strong>de</strong> <strong>la</strong><br />

Cuestión” y <strong>com</strong>o herrami<strong>en</strong>ta informática al Rapid-i, un sólido programa <strong>de</strong> minería<br />

<strong>de</strong> datos libre uso (“freew<strong>ar</strong>e”) que posee gran cantidad <strong>de</strong> algoritmos.<br />

4.2 APLICACIÓN DE CRISP-DM<br />

P<strong>ar</strong>a po<strong>de</strong>r <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r el problema p<strong>la</strong>nteado <strong>de</strong> una forma a<strong>de</strong>cuada, se aplica <strong>la</strong><br />

metodología CRISP-DM. La misma permite realiz<strong>ar</strong> el trabajo <strong>en</strong> forma or<strong>de</strong>nada y<br />

consist<strong>en</strong>te pasando por cada una <strong>de</strong> sus fases:<br />

• Fase I: Compresión <strong>de</strong>l Negocio.<br />

• Fase II: Compr<strong>en</strong>sión <strong>de</strong> los Datos.<br />

• Fase III: Prep<strong>ar</strong>ación <strong>de</strong> los Datos.<br />

• Fase IV: Mo<strong>de</strong><strong>la</strong>do.<br />

• Fase V: Evaluación.<br />

• Fase VI: Implem<strong>en</strong>tación.<br />

Solución Patricio Gutiérrez Rüegg 47


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

4.2.1 Fase I: Compr<strong>en</strong>sión <strong>de</strong>l negocio<br />

4.2.1.1 Determin<strong>ar</strong> los objetivos <strong>de</strong>l negocio.<br />

La Dirección Nacional <strong>de</strong> Política Criminal (DNPC) fue creada con <strong>la</strong>s sigui<strong>en</strong>tes<br />

finalida<strong>de</strong>s:<br />

48<br />

• Realiz<strong>ar</strong> estudios e investigaciones estadísticas <strong>en</strong> el ámbito <strong>de</strong>l sistema p<strong>en</strong>al.<br />

• Des<strong>ar</strong>rol<strong>la</strong>r y ejercer los lineami<strong>en</strong>tos político-criminales llevados a<strong>de</strong><strong>la</strong>nte por<br />

el Ministerio <strong>de</strong> Justicia <strong>de</strong> <strong>la</strong> Nación.<br />

• Diseñ<strong>ar</strong> los programas específicos <strong>de</strong>stinados a actu<strong>ar</strong> sobre <strong>la</strong> problemática<br />

<strong>de</strong>lictiva, tanto <strong>en</strong> <strong>la</strong> faz prev<strong>en</strong>tiva <strong>com</strong>o punitiva, <strong>de</strong>terminando <strong>la</strong>s áreas<br />

priorit<strong>ar</strong>ias, así <strong>com</strong>o los medios idóneos p<strong>ar</strong>a <strong>la</strong> producción <strong>de</strong> <strong>la</strong>s<br />

transformaciones que se consi<strong>de</strong>re neces<strong>ar</strong>ias con re<strong>la</strong>ción al tema.<br />

• Formu<strong>la</strong>r y realiz<strong>ar</strong> los proyectos <strong>de</strong> investigación ci<strong>en</strong>tífica aplicada,<br />

directam<strong>en</strong>te vincu<strong>la</strong>dos con el <strong>de</strong>lito, sus consecu<strong>en</strong>cias y <strong>la</strong> reacción punitiva<br />

estatal.<br />

• Interv<strong>en</strong>ir <strong>en</strong> todos los proyectos legis<strong>la</strong>tivos vincu<strong>la</strong>dos con temas <strong>de</strong> su<br />

<strong>com</strong>pet<strong>en</strong>cia <strong>en</strong> el ámbito <strong>de</strong>l Ministerio <strong>de</strong> Justicia <strong>de</strong> <strong>la</strong> Nación.<br />

Mediante el cumplimi<strong>en</strong>to <strong>de</strong> los objetivos <strong>de</strong>l proyecto se espera concluir <strong>la</strong>s sigui<strong>en</strong>tes<br />

necesida<strong>de</strong>s:<br />

• I<strong>de</strong>ntific<strong>ar</strong> grupos <strong>de</strong> presos, <strong>de</strong> acuerdo a c<strong>ar</strong>acterísticas <strong>com</strong>unes.<br />

• Obt<strong>en</strong>er <strong>la</strong>s reg<strong>la</strong>s que ayudan a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r los distintos grupos formados.<br />

• Implem<strong>en</strong>t<strong>ar</strong> una herrami<strong>en</strong>ta que permita c<strong>ar</strong>acteriz<strong>ar</strong> a <strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria<br />

cada cierto tiempo preestablecido y actualiz<strong>ar</strong> <strong>la</strong>s medidas <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>das <strong>en</strong> lo<br />

que concierne a política criminal prev<strong>en</strong>tiva.<br />

Los criterios <strong>de</strong> éxito <strong>de</strong>l proyecto están re<strong>la</strong>cionados <strong>en</strong> cumplir con estas necesida<strong>de</strong>s,<br />

<strong>de</strong>s<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>en</strong>contr<strong>ar</strong> patrones <strong>de</strong> conducta y <strong>com</strong>portami<strong>en</strong>tos <strong>en</strong> los<br />

presos a través <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos. Se pret<strong>en</strong><strong>de</strong> <strong>en</strong>t<strong>en</strong><strong>de</strong>r los motivos que los llev<strong>ar</strong>on<br />

a <strong>de</strong>linquir p<strong>ar</strong>a proponer alternativas que permitan mejor<strong>ar</strong> <strong>la</strong> forma <strong>en</strong> que estos<br />

individuos son reinsertados <strong>en</strong> <strong>la</strong> sociedad.<br />

4.2.1.2 Evaluación <strong>de</strong> <strong>la</strong> Situación<br />

En los capítulos 2.4 “Información Criminal <strong>en</strong> Arg<strong>en</strong>tina” y 2.5 “Diagnóstico <strong>de</strong>l<br />

Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina”, se realiza una bu<strong>en</strong>a evaluación <strong>de</strong> <strong>la</strong> situación<br />

actual. Los requisitos, supuestos y restricciones se pres<strong>en</strong>tan a continuación.<br />

Patricio Gutiérrez Rüegg Solución


Requisitos<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Los diversos requisitos i<strong>de</strong>ntificables p<strong>ar</strong>a avanz<strong>ar</strong> con el proyecto son:<br />

• Definir el alcance <strong>de</strong>l proyecto.<br />

• Apr<strong>en</strong><strong>de</strong>r y <strong>en</strong>t<strong>en</strong><strong>de</strong>r <strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> minería <strong>de</strong> datos a utiliz<strong>ar</strong>.<br />

• Cont<strong>ar</strong> con <strong>la</strong> base <strong>de</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> <strong>la</strong>s primeras etapas p<strong>ar</strong>a po<strong>de</strong>r<br />

realiz<strong>ar</strong> corridas <strong>de</strong> prueba.<br />

• Valid<strong>ar</strong> los resultados obt<strong>en</strong>idos <strong>en</strong> cada una <strong>de</strong> <strong>la</strong>s pruebas con especialistas <strong>en</strong><br />

el tema (jueces, fiscales, abogados y sociólogos).<br />

• Reuniones periódicas con los especialistas <strong>de</strong> <strong>la</strong> Escue<strong>la</strong> <strong>de</strong> Postgrado <strong>de</strong><br />

Ing<strong>en</strong>iería <strong>de</strong> Softw<strong>ar</strong>e <strong>de</strong>l ITBA con el objetivo <strong>de</strong> analiz<strong>ar</strong> los datos y realiz<strong>ar</strong><br />

<strong>la</strong> técnica <strong>de</strong> minería <strong>de</strong> datos más conv<strong>en</strong>i<strong>en</strong>te.<br />

Supuestos<br />

Entre los supuestos se pue<strong>de</strong> nombr<strong>ar</strong> a:<br />

• Al utiliz<strong>ar</strong> una base <strong>de</strong> datos <strong>de</strong>l año 2004, se supone que el <strong>com</strong>portami<strong>en</strong>to <strong>de</strong><br />

esta pob<strong>la</strong>ción no ha cambiado significativam<strong>en</strong>te <strong>de</strong>s<strong>de</strong> <strong>en</strong>tonces.<br />

• Al trat<strong>ar</strong>se <strong>de</strong> un tema tan <strong>com</strong>plejo, <strong>com</strong>o lo es lleg<strong>ar</strong> a <strong>en</strong>t<strong>en</strong><strong>de</strong>r el motivo por<br />

el cual una persona <strong>com</strong>ete un <strong>de</strong>lito, al mom<strong>en</strong>to <strong>de</strong> analiz<strong>ar</strong>se los grupos se<br />

toman diversos supuestos a valid<strong>ar</strong> por especialistas. Entre ellos se pue<strong>de</strong>n<br />

nombr<strong>ar</strong> al supuesto <strong>de</strong> que muchos <strong>de</strong> los hombres ti<strong>en</strong><strong>en</strong> hijos aún cuando <strong>la</strong><br />

mayoría es soltera. Por otro <strong>la</strong>do, al no t<strong>en</strong>er información sobre <strong>la</strong> historia <strong>de</strong><br />

cada preso, se tuvo que suponer que <strong>en</strong> g<strong>en</strong>eral esta última no influye <strong>de</strong> manera<br />

fuerte <strong>en</strong> <strong>la</strong>s acciones <strong>de</strong> estos individuos.<br />

Restricciones<br />

En cuanto a <strong>la</strong>s restricciones, se consi<strong>de</strong>ran <strong>la</strong>s sigui<strong>en</strong>tes:<br />

• No se posee información <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido acerca <strong>de</strong> su historial famili<strong>ar</strong> y cultural<br />

que ayu<strong>de</strong> a c<strong>ar</strong>acteriz<strong>ar</strong>lo <strong>de</strong> una manera más <strong>com</strong>pleta <strong>en</strong> cuanto a patrones <strong>de</strong><br />

conducta y g<strong>en</strong>eración <strong>de</strong> reg<strong>la</strong>s.<br />

• Exist<strong>en</strong> <strong>en</strong> <strong>la</strong> base <strong>de</strong> datos campos inconsist<strong>en</strong>tes, con valores erróneos o vacíos<br />

que afectan al análisis <strong>de</strong> los resultados. Esto hace que se t<strong>en</strong>ga que prep<strong>ar</strong><strong>ar</strong> <strong>la</strong><br />

información previam<strong>en</strong>te llevando forzosam<strong>en</strong>te a <strong>la</strong> reducción <strong>de</strong> <strong>la</strong> muestra<br />

pob<strong>la</strong>cional (ver 4.2.3 Prep<strong>ar</strong>ación <strong>de</strong> los datos).<br />

Solución Patricio Gutiérrez Rüegg 49


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Expectativas<br />

50<br />

• Logr<strong>ar</strong> pres<strong>en</strong>t<strong>ar</strong> dicho proyecto fuera <strong>de</strong>l ámbito académico <strong>en</strong> el m<strong>ar</strong>co <strong>de</strong>l<br />

proyecto final <strong>de</strong> Ing<strong>en</strong>iería Industrial <strong>de</strong>l ITBA, con fines <strong>de</strong> prev<strong>en</strong>ción <strong>de</strong><br />

<strong>de</strong>litos.<br />

• Adquirir el conocimi<strong>en</strong>to y <strong>en</strong>t<strong>en</strong>dimi<strong>en</strong>to tanto <strong>de</strong> <strong>la</strong> técnica <strong>de</strong> minería <strong>de</strong> datos<br />

<strong>com</strong>o <strong>de</strong> <strong>la</strong>s herrami<strong>en</strong>tas informáticas utilizadas p<strong>ar</strong>a <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r el proyecto. Se<br />

espera po<strong>de</strong>r aplic<strong>ar</strong> dicho conocimi<strong>en</strong>to <strong>en</strong> otros campos y rubros a lo <strong>la</strong>rgo <strong>de</strong><br />

mi c<strong>ar</strong>rera profesional.<br />

• Ampli<strong>ar</strong> mi conocimi<strong>en</strong>to <strong>en</strong> cuestiones c<strong>la</strong>ves <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> política tanto<br />

criminal, <strong>com</strong>o judicial y <strong>de</strong> <strong>de</strong>rechos humanos.<br />

4.2.1.3 P<strong>la</strong>n <strong>de</strong> Proyecto<br />

Se <strong>de</strong>scribe el p<strong>la</strong>n p<strong>ar</strong>a llev<strong>ar</strong> a<strong>de</strong><strong>la</strong>nte el proyecto, según <strong>la</strong>s fases que p<strong>la</strong>ntea <strong>la</strong><br />

metodología CRISP-DM. El tiempo total estimado <strong>de</strong> realización es <strong>de</strong> 5 meses y<br />

correspon<strong>de</strong> a una persona trabajando “full time”.<br />

Fase I – Compr<strong>en</strong>sión <strong>de</strong>l negocio:<br />

1. Búsqueda y análisis <strong>de</strong> <strong>la</strong> información criminal disponible <strong>en</strong> Arg<strong>en</strong>tina<br />

2. Búsqueda, análisis y diagnóstico <strong>de</strong>l servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>en</strong> Arg<strong>en</strong>tina.<br />

3. Estudi<strong>ar</strong> aplicaciones <strong>de</strong> minería <strong>de</strong> datos <strong>en</strong> pob<strong>la</strong>ciones c<strong>ar</strong>ce<strong>la</strong>rias o con fines<br />

<strong>de</strong> prev<strong>en</strong>ción <strong>de</strong> <strong>de</strong>litos.<br />

4. Analiz<strong>ar</strong> técnicas y algoritmos <strong>de</strong> minería <strong>de</strong> datos.<br />

Tiempo estimado: 1 mes<br />

Fase II – Compr<strong>en</strong>sión <strong>de</strong> los datos:<br />

5. Adquirir los datos <strong>de</strong> <strong>la</strong> base SNEEP.<br />

6. Recolect<strong>ar</strong> los datos y estudi<strong>ar</strong> el vínculo <strong>en</strong>tre <strong>la</strong>s tab<strong>la</strong>s <strong>de</strong> <strong>la</strong> base <strong>de</strong> datos.<br />

7. Decodificación y exploración <strong>de</strong> los datos mediante gráficos <strong>de</strong> b<strong>ar</strong>ras y <strong>de</strong> torta.<br />

8. Verificación <strong>de</strong> <strong>la</strong> calidad <strong>de</strong> los datos.<br />

Tiempo estimado: 3 semanas<br />

Fase III – Prep<strong>ar</strong>ación <strong>de</strong> los datos:<br />

9. Prep<strong>ar</strong>ación <strong>de</strong>l dataset.<br />

10. Selección <strong>de</strong> atributos o campos, limpieza y construcción <strong>de</strong> los datos<br />

Tiempo estimado: 2 semanas<br />

Fase IV – Mo<strong>de</strong><strong>la</strong>do:<br />

11. Aplic<strong>ar</strong> <strong>la</strong>s técnicas y herrami<strong>en</strong>tas seleccionadas <strong>en</strong> <strong>la</strong> fase I.<br />

Tiempo estimado: 1 mes<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Fase V – Evaluación:<br />

12. Evalu<strong>ar</strong> el mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos obt<strong>en</strong>ido.<br />

13. Valid<strong>ar</strong> el mo<strong>de</strong>lo con especialistas <strong>de</strong>l tema.<br />

Tiempo estimado: 1 semana<br />

Fase VI –Implem<strong>en</strong>tación:<br />

14. G<strong>en</strong>er<strong>ar</strong> el informe final<br />

Tiempo estimado: 1 mes<br />

4.2.2 Fase II: Compr<strong>en</strong>sión <strong>de</strong> los datos<br />

Esta fase involucra <strong>la</strong>s t<strong>ar</strong>eas que hac<strong>en</strong> a <strong>la</strong> <strong>com</strong>presión <strong>de</strong> los datos, p<strong>ar</strong>a lo cual, los<br />

datos se <strong>de</strong>b<strong>en</strong> recolect<strong>ar</strong>, organiz<strong>ar</strong>, <strong>de</strong>scribir, verific<strong>ar</strong> y limpi<strong>ar</strong> antes <strong>de</strong> realiz<strong>ar</strong> el<br />

análisis <strong>de</strong> los mismos. Esto pue<strong>de</strong> consumir mucho tiempo y es crítico p<strong>ar</strong>a el proyecto<br />

<strong>de</strong> exploración <strong>de</strong> información.<br />

4.2.2.1 Recolección <strong>de</strong> los datos iniciales<br />

P<strong>ar</strong>a <strong>la</strong> e<strong>la</strong>boración <strong>de</strong>l proyecto se utiliza <strong>la</strong> base <strong>de</strong> datos <strong>de</strong> <strong>la</strong> totalidad <strong>de</strong> pob<strong>la</strong>ción<br />

c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina a fines <strong>de</strong>l año 2004. Dicha base <strong>de</strong> datos, conformada por más<br />

<strong>de</strong> 53,000 registros, fue provista p<strong>ar</strong>a el Ministerio <strong>de</strong> Justicia y Derechos Humanos <strong>de</strong><br />

<strong>la</strong> Nación Arg<strong>en</strong>tina bajo <strong>la</strong> realización y supervisión <strong>de</strong> <strong>la</strong> Dirección Nacional <strong>de</strong><br />

Política Criminal (DNPC). Los datos a utiliz<strong>ar</strong>se son los recolectados por el Sistema<br />

Nacional <strong>de</strong> Estadísticos sobre Ejecución <strong>de</strong> <strong>la</strong> P<strong>en</strong>a (SNEEP).<br />

La base <strong>de</strong> datos original se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> formato MS-Access y esta <strong>com</strong>puesta por <strong>la</strong>s<br />

sigui<strong>en</strong>tes tab<strong>la</strong>s:<br />

Tab<strong>la</strong> Principal:<br />

Tab<strong>la</strong>s Secund<strong>ar</strong>ias:<br />

• maeC<strong>en</strong>so [Tab<strong>la</strong> 4.1]: conti<strong>en</strong>e los datos codificados <strong>en</strong> forma<br />

numérica asociados al c<strong>en</strong>so p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io <strong>de</strong>l año 2004, <strong>de</strong>s<strong>de</strong> los<br />

datos concretos <strong>de</strong>l preso antes <strong>de</strong>l ingreso al establecimi<strong>en</strong>to<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io hasta su <strong>com</strong>portami<strong>en</strong>to <strong>de</strong>ntro <strong>de</strong>l mismo.<br />

• maeTabCodigos [Tab<strong>la</strong> 4.2]: diccion<strong>ar</strong>io que conti<strong>en</strong>e los<br />

atributos asociados a los códigos <strong>de</strong> <strong>la</strong> tab<strong>la</strong> principal.<br />

• tabEstablec [Tab<strong>la</strong> 4.3]: es <strong>la</strong> tab<strong>la</strong> que conti<strong>en</strong>e información<br />

re<strong>la</strong>cionada a los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios.<br />

• TabProv [Tab<strong>la</strong> 4.4]: re<strong>la</strong>cionada a <strong>la</strong> codificación <strong>de</strong> <strong>la</strong>s<br />

provincias.<br />

Solución Patricio Gutiérrez Rüegg 51


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

4.2.2.2 Descripción <strong>de</strong> los datos iniciales<br />

A continuación se muestra <strong>la</strong> estructura (Atributos/Descripción) <strong>de</strong> cada una <strong>de</strong> <strong>la</strong>s<br />

tab<strong>la</strong>s m<strong>en</strong>cionadas <strong>en</strong> el punto anterior.<br />

Campo Descripción Tipo <strong>de</strong> Dato<br />

idReco C<strong>la</strong>ve Principal <strong>de</strong> acceso a registros Autonumérico<br />

AniC<strong>en</strong>so Año <strong>de</strong> relevami<strong>en</strong>to <strong>de</strong>l c<strong>en</strong>so Numérico<br />

idProvincia código <strong>de</strong> id. <strong>de</strong> provincia Numérico<br />

idEstablec código <strong>de</strong> id. establecimi<strong>en</strong>to Numérico<br />

idInterno código <strong>de</strong> i<strong>de</strong>ntificación <strong>de</strong>l interno Texto<br />

Edad Edad Numérico<br />

Sexo Sexo Numérico<br />

Nacionalidad Nacionalidad Numérico<br />

estadoCivil Estado Civil Numérico<br />

nivelInstruc Nivel <strong>de</strong> Instrucción Numérico<br />

ulSitLaboral Ultima situación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />

capLaboalIngres<strong>ar</strong> Capacitación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />

ulLug<strong>ar</strong>Resid Ultimo lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia Numérico<br />

ulProvResid Ultima provincia <strong>de</strong> resi<strong>de</strong>ncia Numérico<br />

Jurisdiccion Jurisdicción Numérico<br />

sitLegal Situación legal Numérico<br />

fecDete Fecha <strong>de</strong> Det<strong>en</strong>ción Fecha/Hora<br />

fecCon<strong>de</strong> Fecha <strong>de</strong> Con<strong>de</strong>na Fecha/Hora<br />

estabDeProced Establecimi<strong>en</strong>to u orig<strong>en</strong> <strong>de</strong> proce<strong>de</strong>ncia Numérico<br />

idDeli1 Tipo <strong>de</strong> <strong>de</strong>lito por el cual ingresa al establecimi<strong>en</strong>to 1ra. m<strong>en</strong>ción Numérico<br />

idDeli2 2da. m<strong>en</strong>ción Numérico<br />

idDeli3 3ra. m<strong>en</strong>ción Numérico<br />

idDeli4 4ta. m<strong>en</strong>ción Numérico<br />

idDeli5 5ta. m<strong>en</strong>ción Numérico<br />

hsTrabRemu Cantidad <strong>de</strong> horas por trabajo remunerado Numérico<br />

p<strong>ar</strong>tiProgLabo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> formación o capacitación <strong>la</strong>boral Numérico<br />

p<strong>ar</strong>tiProgEdu P<strong>ar</strong>ticipación <strong>en</strong> algún programa educativo Numérico<br />

p<strong>ar</strong>tiActivDepo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> activida<strong>de</strong>s recreativas o <strong>de</strong>portivas Numérico<br />

recAsistMedUlAnio Indica si recibió asist<strong>en</strong>cia médica <strong>en</strong> el ultimo año Numérico<br />

recVisitasUlAnio Indica si recibió visitas <strong>en</strong> el ultimo año Numérico<br />

p<strong>ar</strong>tiAlterOr<strong>de</strong>n Indica si p<strong>ar</strong>ticipó <strong>de</strong> alteraciones <strong>de</strong>l or<strong>de</strong>n el último año Numérico<br />

tipInfracDisciplina Tipo <strong>de</strong> infracción si tuvo infracciones disciplin<strong>ar</strong>ias Numérico<br />

sancionAplicada Tipo <strong>de</strong> sanción disciplin<strong>ar</strong>ia aplicada Numérico<br />

califConducta Calificación <strong>de</strong> <strong>la</strong> conducta <strong>de</strong>l interno Numérico<br />

t<strong>en</strong>FugasEvas Int<strong>en</strong>tos <strong>de</strong> fugas o evasiones el último año Numérico<br />

t<strong>en</strong>Suicidio Int<strong>en</strong>tos <strong>de</strong> suicidios Numérico<br />

fueLesionado Indica si fue lesionado el ultimo año Numérico<br />

duracCon<strong>de</strong>na_A Duración <strong>en</strong> años <strong>de</strong> <strong>la</strong> con<strong>de</strong>na aplicada Numérico<br />

duracCon<strong>de</strong>na_M Duración <strong>en</strong> meses <strong>de</strong> <strong>la</strong> con<strong>de</strong>na aplicada Numérico<br />

tipCon<strong>de</strong>na Tipo <strong>de</strong> con<strong>de</strong>na: 1=Prisión, 2=Reclusión Numérico<br />

ti<strong>en</strong>eMedSegu Ti<strong>en</strong>e medidas <strong>de</strong> seguridad Numérico<br />

esReinci<strong>de</strong>nte Muestra el grado <strong>de</strong> reinci<strong>de</strong>ncia <strong>de</strong>l interno Numérico<br />

periProgresiv Ti<strong>en</strong>e período <strong>de</strong> progresividad Numérico<br />

tuvoSaliTransi Indica si tuvo salidas transitorias el ultimo año Numérico<br />

incRegSemiLib Está incorporado al régim<strong>en</strong> <strong>de</strong> semilibertad Numérico<br />

p<strong>ar</strong>tiProgPreLib Indica si p<strong>ar</strong>ticipa <strong>en</strong> algún programa <strong>de</strong> pre-libertad Numérico<br />

prisDiscontinua Indica si p<strong>ar</strong>ticipa <strong>en</strong> algún programa <strong>de</strong> prisión discontinua Numérico<br />

semiD<strong>en</strong>t<strong>en</strong>cion Indica si p<strong>ar</strong>ticipa <strong>en</strong> algún programa <strong>de</strong> semi-<strong>de</strong>t<strong>en</strong>ción Numérico<br />

tuvoReducP<strong>en</strong>a Muestra si se le aplic<strong>ar</strong>on reducciones <strong>de</strong> con<strong>de</strong>na el ultimo año Numérico<br />

mjTi<strong>en</strong>eHijos Posee hijos con el<strong>la</strong> <strong>en</strong> el establecimi<strong>en</strong>to (solo mujeres) Numérico<br />

Tab<strong>la</strong> 4.1. maeC<strong>en</strong>so.<br />

52<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Campo Descripción Tipo <strong>de</strong> Dato<br />

nomV<strong>ar</strong>i Cada uno <strong>de</strong> los atributos que ap<strong>ar</strong>ece <strong>en</strong> <strong>la</strong> tab<strong>la</strong> maeC<strong>en</strong>so Texto<br />

Item Posibilida<strong>de</strong>s (código numerico) que pue<strong>de</strong> tom<strong>ar</strong> cada una <strong>de</strong> <strong>la</strong>s nomV<strong>ar</strong>i Numérico<br />

Descri Descripcion <strong>de</strong>l Item Texto<br />

Tab<strong>la</strong> 4.2. maeTabCodigos.<br />

Campo Descripción Tipo <strong>de</strong> Dato<br />

idProv código <strong>de</strong> id. <strong>de</strong> provincia Numérico<br />

nroID código <strong>de</strong> id. establecimi<strong>en</strong>to Autonumérico<br />

Nombre Nombre <strong>de</strong>l Establecimi<strong>en</strong>to Texto<br />

Rep<strong>ar</strong>ti N/A Numérico<br />

tipEstab Tipo <strong>de</strong> Establecimi<strong>en</strong>to según modalidad Texto<br />

direccion Direccion Fisica <strong>de</strong>l Establecimi<strong>en</strong>to Texto<br />

cPostal Codigo Postal Texto<br />

Fonos Números <strong>de</strong> Telefono Texto<br />

Fax Números <strong>de</strong> FAX Texto<br />

email Direccion <strong>de</strong> E-mail Texto<br />

responsable Responsable <strong>de</strong>l Establecimi<strong>en</strong>to Texto<br />

capacidad Capacidad <strong>de</strong> alojami<strong>en</strong>to Numérico<br />

p<strong>la</strong>zCelIndiv Pob<strong>la</strong>cion ubicada <strong>en</strong> alojami<strong>en</strong>tos individuales Numérico<br />

p<strong>la</strong>zLocColec Pob<strong>la</strong>cion ubicada <strong>en</strong> alojami<strong>en</strong>tos colectivos Numérico<br />

Tab<strong>la</strong> 4.3. tabEstablec.<br />

Campo Descripción Tipo <strong>de</strong> Dato<br />

Codigo código <strong>de</strong> id. <strong>de</strong> provincia Numérico<br />

Descri Nombre <strong>de</strong> <strong>la</strong> Provincia Texto<br />

Tab<strong>la</strong> 4.4. TabProv.<br />

Las tab<strong>la</strong>s principales y secund<strong>ar</strong>ias se vincu<strong>la</strong>n <strong>en</strong>tre sí <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera:<br />

Figura 4.1. Vincu<strong>la</strong>ción <strong>en</strong>tre <strong>la</strong>s tab<strong>la</strong>s.<br />

Solución Patricio Gutiérrez Rüegg 53


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

4.2.2.2.1 Dataset seleccionado<br />

A priori, los campos o atributos que se elig<strong>en</strong> p<strong>ar</strong>a g<strong>en</strong>er<strong>ar</strong> el conjunto <strong>de</strong> datos (dataset)<br />

y efectu<strong>ar</strong> <strong>la</strong> minería <strong>de</strong> datos son los sigui<strong>en</strong>tes:<br />

54<br />

Campo Descripción Tipo <strong>de</strong> Dato<br />

Sexo Sexo Numérico<br />

edad Edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Numérico<br />

Nacionalidad Nacionalidad Numérico<br />

estadoCivil Estado Civil <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Numérico<br />

nivelInstruc Nivel <strong>de</strong> Instrucción Numérico<br />

ulSitLaboral Ultima situación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />

capLaboalIngres<strong>ar</strong> Capacitación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Numérico<br />

ulLug<strong>ar</strong>Resid Ultimo lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia (Urbano/Rural) Numérico<br />

ulProvResid Ultima provincia <strong>de</strong> resi<strong>de</strong>ncia Numérico<br />

sitLegal Situación legal Numérico<br />

idDeli1 Tipo <strong>de</strong> <strong>de</strong>lito por el cual ingresa al establecimi<strong>en</strong>to 1ra. m<strong>en</strong>ción Numérico<br />

idDeli2 2da. m<strong>en</strong>ción Numérico<br />

hsTrabRemu Cantidad <strong>de</strong> horas por trabajo remunerado Numérico<br />

p<strong>ar</strong>tiProgLabo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> formación o capacitación <strong>la</strong>boral Numérico<br />

p<strong>ar</strong>tiProgEdu P<strong>ar</strong>ticipación <strong>en</strong> algún programa educativo Numérico<br />

p<strong>ar</strong>tiActivDepo P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> activida<strong>de</strong>s recreativas o <strong>de</strong>portivasNumérico<br />

esReinci<strong>de</strong>nte Muestra el grado <strong>de</strong> reinci<strong>de</strong>ncia <strong>de</strong>l interno Numérico<br />

Tab<strong>la</strong> 4.5. Dataset prelimin<strong>ar</strong> seleccionado.<br />

El pres<strong>en</strong>te dataset es prelimin<strong>ar</strong>. Consta <strong>de</strong> c<strong>ar</strong>acterísticas <strong>de</strong> los presos al mom<strong>en</strong>to <strong>de</strong><br />

ser <strong>de</strong>t<strong>en</strong>idos, durante el ingreso <strong>de</strong>l preso, y algunos campos que <strong>de</strong>scrib<strong>en</strong> el<br />

<strong>com</strong>portami<strong>en</strong>to <strong>de</strong> los mismos ya <strong>de</strong>ntro <strong>de</strong>l establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Los campos<br />

que pres<strong>en</strong>tan mayores inconsist<strong>en</strong>cias y problemas <strong>de</strong> calidad son los que proce<strong>de</strong>n <strong>de</strong><br />

<strong>la</strong> información obt<strong>en</strong>ida <strong>de</strong>l interior <strong>de</strong>l p<strong>en</strong>al, <strong>com</strong>o <strong>la</strong> conducta, infracciones,<br />

alteraciones <strong>de</strong>l or<strong>de</strong>n, etc. Debido a esto último, <strong>en</strong> principio, no serían utilizados p<strong>ar</strong>a<br />

realiz<strong>ar</strong> el estudio. Más a<strong>de</strong><strong>la</strong>nte, cuando se verifique <strong>la</strong> calidad <strong>de</strong> los datos, se<br />

profundiz<strong>ar</strong>á <strong>en</strong> el tema.<br />

4.2.2.2.2 Decodificación <strong>de</strong> los campos<br />

P<strong>ar</strong>a <strong>la</strong> <strong>de</strong>codificación <strong>de</strong> los valores <strong>de</strong> <strong>la</strong> tab<strong>la</strong> principal <strong>en</strong> formato numérico se<br />

utilizan consultas (Queries) programadas <strong>en</strong> l<strong>en</strong>guaje SQL mediante el softw<strong>ar</strong>e MS-<br />

Access, según <strong>la</strong>s re<strong>la</strong>ciones <strong>de</strong> <strong>la</strong>s distintas tab<strong>la</strong>s [Figura 4.1]. Cabe m<strong>en</strong>cion<strong>ar</strong>, que se<br />

trabaj<strong>ar</strong>á con atributos alfanuméricos.<br />

Los valores que pue<strong>de</strong>n tom<strong>ar</strong> cada uno <strong>de</strong> los atributos seleccionados a priori pue<strong>de</strong>n<br />

ser los sigui<strong>en</strong>tes:<br />

nomV<strong>ar</strong>i Item Descri<br />

Sexo 1 Masculino<br />

Sexo 2 Fem<strong>en</strong>ino<br />

Tab<strong>la</strong> 4.6. Sexo.<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

nomV<strong>ar</strong>i Item Descri<br />

Nacionalidad 1 Arg<strong>en</strong>tina<br />

Nacionalidad 2 Boliviana<br />

Nacionalidad 3 Brasileña<br />

Nacionalidad 4 Chil<strong>en</strong>a<br />

Nacionalidad 5 P<strong>ar</strong>aguaya<br />

Nacionalidad 6 Uruguaya<br />

Nacionalidad 7 Peruana<br />

Nacionalidad 8 Colombiana<br />

Nacionalidad 9 Ecuatoriana<br />

Nacionalidad 10 Españo<strong>la</strong><br />

Nacionalidad 11 Italiana<br />

Nacionalidad 12 Inglesa<br />

Nacionalidad 13 China<br />

Nacionalidad 14 Sudafricana<br />

Nacionalidad 15 Nigeriana<br />

Nacionalidad 16 Otras<br />

Tab<strong>la</strong> 4.7. Nacionalidad.<br />

nomV<strong>ar</strong>i Item Descri<br />

estadoCivil 1 Soltero<br />

estadoCivil 2 Casado<br />

estadoCivil 3 Viudo<br />

estadoCivil 4 Sep<strong>ar</strong>ado o divorciado<br />

estadoCivil 5 Sep<strong>ar</strong>ado <strong>de</strong> hecho<br />

estadoCivil 6 Concubino<br />

Tab<strong>la</strong> 4.8. Estado Civil.<br />

nomV<strong>ar</strong>i Item Descri<br />

nivelInstruc 1 Ninguno<br />

nivelInstruc 2 Prim<strong>ar</strong>io in<strong>com</strong>pleto<br />

nivelInstruc 3 Prim<strong>ar</strong>io <strong>com</strong>pleto<br />

nivelInstruc 4 Secund<strong>ar</strong>io in<strong>com</strong>pleto<br />

nivelInstruc 5 Secund<strong>ar</strong>io <strong>com</strong>pleto<br />

nivelInstruc 6 Terci<strong>ar</strong>io in<strong>com</strong>pleto<br />

nivelInstruc 7 Terci<strong>ar</strong>io <strong>com</strong>pleto<br />

nivelInstruc 8 Universit<strong>ar</strong>io in<strong>com</strong>pleto<br />

nivelInstruc 9 Universit<strong>ar</strong>io <strong>com</strong>pleto<br />

nivelInstruc 10 EGB 1 In<strong>com</strong>pleto<br />

nivelInstruc 11 EGB 1 Completo<br />

nivelInstruc 12 EGB 2 In<strong>com</strong>pleto<br />

nivelInstruc 13 EGB 2 Completo<br />

nivelInstruc 14 EGB 3 In<strong>com</strong>pleto<br />

nivelInstruc 15 EGB 3 Completo<br />

nivelInstruc 16 Polimodal In<strong>com</strong>pleto<br />

nivelInstruc 17 Polimodal Completo<br />

Tab<strong>la</strong> 4.9. Nivel <strong>de</strong> Instrucción.<br />

nomV<strong>ar</strong>i Item Descri<br />

ulSitLaboral 1 Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

ulSitLaboral 2 Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

ulSitLaboral 3 Desocupado<br />

Tab<strong>la</strong> 4.10. Última Situación Laboral.<br />

Solución Patricio Gutiérrez Rüegg 55


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

56<br />

nomV<strong>ar</strong>i Item Descri<br />

capLaboalIngres<strong>ar</strong> 1 Ti<strong>en</strong>e algún oficio<br />

capLaboalIngres<strong>ar</strong> 2 Ti<strong>en</strong>e alguna profesión<br />

capLaboalIngres<strong>ar</strong> 3 No ti<strong>en</strong>e ni oficio ni profesión<br />

Tab<strong>la</strong> 4.11. Capacitación Laboral al mom<strong>en</strong>to <strong>de</strong> ingreso.<br />

idProvincia Descri<br />

1 Bu<strong>en</strong>os Aires<br />

2 Catam<strong>ar</strong>ca<br />

3 Córdoba<br />

4 Corri<strong>en</strong>tes<br />

5 Chaco<br />

6 Chubut<br />

7 Entre Rios<br />

8 Formosa<br />

9 Jujuy<br />

10 La Pampa<br />

11 La Rioja<br />

12 M<strong>en</strong>doza<br />

13 Misiones<br />

14 Neuqu<strong>en</strong><br />

15 Rio Negro<br />

16 Salta<br />

17 San Juan<br />

18 San Luis<br />

19 Santa Cruz<br />

20 Santa Fe<br />

21 Santiago Del Estero<br />

22 Tierra Del Fuego<br />

23 Tucumán<br />

24 Ciudad De Bu<strong>en</strong>os Aires<br />

Tab<strong>la</strong> 4.12. Última Provincia <strong>de</strong> Resi<strong>de</strong>ncia.<br />

nomV<strong>ar</strong>i Item Descri<br />

sitLegal 1 Con<strong>de</strong>nado<br />

sitLegal 2 Procesado<br />

sitLegal 3 Contrav<strong>en</strong>tor<br />

sitLegal 4 Inimputable<br />

sitLegal 5 Otra situación<br />

Tab<strong>la</strong> 4.13. Situación Legal.<br />

nomV<strong>ar</strong>i Item Descri<br />

p<strong>ar</strong>tiProgEdu 1 Si - educación formal - EGB<br />

p<strong>ar</strong>tiProgEdu 2 Si - educación formal - POLIMODAL<br />

p<strong>ar</strong>tiProgEdu 3 Si - educación formal - TERCIARIA<br />

p<strong>ar</strong>tiProgEdu 4 Si - educación formal - UNIVERSITARIA<br />

p<strong>ar</strong>tiProgEdu 5 Si - educación no formal<br />

p<strong>ar</strong>tiProgEdu 6 No p<strong>ar</strong>ticipa <strong>de</strong> ningún programa educativo<br />

Tab<strong>la</strong> 4.14. P<strong>ar</strong>ticipa <strong>en</strong> Programas educativos<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

nomV<strong>ar</strong>i Item Descri<br />

idDeli1 1 Homicidios dolosos<br />

idDeli1 2 Homicidios dolosos (t<strong>en</strong>t.)<br />

idDeli1 3 Homicidios Culposos<br />

idDeli1 4 Lesiones Dolosas<br />

idDeli1 5 Lesiones Culposas<br />

idDeli1 6 Otros <strong>de</strong>litos contra <strong>la</strong>s personas<br />

idDeli1 7 Delitos contra el honor<br />

idDeli1 8 Vio<strong>la</strong>ciones<br />

idDeli1 9 Otros <strong>de</strong>litos contra <strong>la</strong> honestidad<br />

idDeli1 10 Am<strong>en</strong>azas<br />

idDeli1 11 Privación ilegítima <strong>de</strong> <strong>la</strong> libertad<br />

idDeli1 12 Del. contra <strong>la</strong> lib. <strong>com</strong>et. por func. público<br />

idDeli1 13 Otros <strong>de</strong>litos contra <strong>la</strong> libertad<br />

idDeli1 14 Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto<br />

idDeli1 15 Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo<br />

idDeli1 16 Otros <strong>de</strong>litos contra <strong>la</strong> propiedad<br />

idDeli1 17 Delitos contra <strong>la</strong> seguridad pública<br />

idDeli1 18 Delitos c/el or<strong>de</strong>n público<br />

idDeli1 19 Delitos contra <strong>la</strong> seguridad <strong>de</strong> <strong>la</strong> nación<br />

idDeli1 20 Delitos contra los po<strong>de</strong>res publicos<br />

idDeli1 21 Delitos c/ <strong>la</strong> administracion pública<br />

idDeli1 22 Delitos c/ <strong>la</strong> fe pública<br />

idDeli1 23 Delitos c/ el estado civil<br />

idDeli1 24 Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes)<br />

idDeli1 25 Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia<br />

idDeli1 26 Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres<br />

idDeli1 27 Delitos previstos <strong>en</strong> leyes especiales<br />

idDeli1 28 Contrav<strong>en</strong>ciones<br />

Tab<strong>la</strong> 4.15. Tipo <strong>de</strong> <strong>de</strong>lito <strong>com</strong>etido.<br />

nomV<strong>ar</strong>i Item Descri<br />

hsTrabRemu 1 Hasta 10 hs. Semanales<br />

hsTrabRemu 2 Hasta 20 hs. Semanales<br />

hsTrabRemu 3 Hasta 30 hs. Semanales<br />

hsTrabRemu 4 Hasta 40 hs. Semanales<br />

hsTrabRemu 5 No ti<strong>en</strong>e trabajo remunerado<br />

Tab<strong>la</strong> 4.16. Cantidad horas <strong>de</strong> trabajo remunerado<br />

nomV<strong>ar</strong>i Item Descri<br />

p<strong>ar</strong>tiProgLabo 1 Si<br />

p<strong>ar</strong>tiProgLabo 2 No<br />

Tab<strong>la</strong> 4.17. P<strong>ar</strong>ticipa programa Laboral<br />

nomV<strong>ar</strong>i Item Descri<br />

ulLug<strong>ar</strong>Resid 1 Rural<br />

ulLug<strong>ar</strong>Resid 2 Urbano<br />

Tab<strong>la</strong> 4.18. Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia (Urbano/Rural)<br />

Solución Patricio Gutiérrez Rüegg 57


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

4.2.2.3 Exploración <strong>de</strong> los datos<br />

Mediante el dataset prelimin<strong>ar</strong> seleccionado <strong>en</strong> el punto anterior, se lleva a cabo <strong>la</strong><br />

exploración <strong>de</strong> los datos p<strong>ar</strong>a famili<strong>ar</strong>iz<strong>ar</strong>se con los mismos, y al mismo tiempo po<strong>de</strong>r<br />

i<strong>de</strong>ntific<strong>ar</strong> problemas <strong>de</strong> calidad. Se <strong>com</strong>i<strong>en</strong>zan a <strong>de</strong>tect<strong>ar</strong> faltantes <strong>de</strong> información <strong>en</strong><br />

algunos campos que se pres<strong>en</strong>tan vacíos (“Sin datos”). En esta etapa no se realiza<br />

ningún tratami<strong>en</strong>to <strong>de</strong> los datos.<br />

[Sexo]: Se pue<strong>de</strong> observ<strong>ar</strong> <strong>la</strong> distribución <strong>de</strong>l sexo <strong>en</strong>tre los internos. Se nota<br />

c<strong>la</strong>ram<strong>en</strong>te que los <strong>de</strong>t<strong>en</strong>idos son su mayoría <strong>de</strong>l sexo masculino.<br />

58<br />

Sexo Presos<br />

Masculino 50,408<br />

Fem<strong>en</strong>ino 2,621<br />

Total 53,029<br />

Tab<strong>la</strong> 4.19. Sexo<br />

Distribución por Sexo<br />

5%<br />

Masculino<br />

Fem<strong>en</strong>ino<br />

95%<br />

Figura 4.2. Distribución por sexo.<br />

[Nacionalidad] / [Edad]: Se pue<strong>de</strong> observ<strong>ar</strong> que <strong>la</strong> nacionalidad predominante es <strong>la</strong><br />

Arg<strong>en</strong>tina. Luego le sigu<strong>en</strong> presos <strong>de</strong> distintos países limítrofes <strong>de</strong> <strong>la</strong> Nación.<br />

Nacionalidad Presos<br />

Arg<strong>en</strong>tina 50,329<br />

Boliviana 531<br />

P<strong>ar</strong>aguaya 424<br />

Uruguaya 396<br />

Chil<strong>en</strong>a 364<br />

Peruana 313<br />

Otras 132<br />

Brasileña 59<br />

Colombiana 43<br />

Italiana 25<br />

Sudafricana 24<br />

Españo<strong>la</strong> 23<br />

China 20<br />

Ecuatoriana 6<br />

Inglesa 6<br />

Nigeriana 3<br />

Sin Datos 331<br />

Total 53,029<br />

Tab<strong>la</strong> 4.20. Distribución <strong>de</strong> nacionalida<strong>de</strong>s.<br />

Rango Edad Presos<br />

M<strong>en</strong>or 18 520<br />

18-24 15,975<br />

25-34 21,044<br />

35-44 9,377<br />

45-54 4,146<br />

55-64 1,405<br />

65 y mas 398<br />

Sin Datos 164<br />

Total 53,029<br />

Tab<strong>la</strong> 4.21. Rango <strong>de</strong> eda<strong>de</strong>s<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

[Estado Civil]:<br />

La mayor cantidad <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos indicó que se <strong>en</strong>contraba soltero al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong><br />

<strong>de</strong>t<strong>en</strong>ción. Luego, <strong>en</strong> proporciones simi<strong>la</strong>res, le sigu<strong>en</strong> los casados y los concubinos.<br />

40,000<br />

35,000<br />

30,000<br />

25,000<br />

20,000<br />

15,000<br />

10,000<br />

5,000<br />

0<br />

37,199<br />

Estado Civil Presos<br />

Soltero 37,199<br />

Concubino 6,452<br />

Casado 6,441<br />

Sep<strong>ar</strong>ado <strong>de</strong> hecho 1,056<br />

Sep<strong>ar</strong>ado o divorciado 814<br />

Viudo 558<br />

Sin Datos 509<br />

Total 53,029<br />

6,452 6,441<br />

Tab<strong>la</strong> 4.22. Estado Civil.<br />

Estado Civil <strong>de</strong> los internos<br />

Soltero Concubino Casado Sep<strong>ar</strong>ado<br />

<strong>de</strong> hecho<br />

1,056 814 558 509<br />

Sep<strong>ar</strong>ado o<br />

divorciado<br />

Figura 4.3. Estado Civil <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

Viudo Sin Datos<br />

[Nivel <strong>de</strong> Instrucción]:<br />

Dicho campo refleja el nivel <strong>de</strong> educación <strong>de</strong> los internos. Prim<strong>ar</strong>io in<strong>com</strong>pleto y<br />

<strong>com</strong>pleto, secund<strong>ar</strong>io in<strong>com</strong>pleto y ningún tipo <strong>de</strong> educación repres<strong>en</strong>tan el 92% <strong>de</strong> los<br />

casos.<br />

Nivel <strong>de</strong> Instrucción Presos Terci<strong>ar</strong>io <strong>com</strong>pleto 146<br />

Prim<strong>ar</strong>io <strong>com</strong>pleto 27,451 EGB 3 Completo 136<br />

Prim<strong>ar</strong>io in<strong>com</strong>pleto 10,740 Universit<strong>ar</strong>io <strong>com</strong>pleto 110<br />

Secund<strong>ar</strong>io in<strong>com</strong>pleto 7,029 EGB 1 In<strong>com</strong>pleto 100<br />

Ninguno 3,328 Polimodal In<strong>com</strong>pleto 89<br />

Secund<strong>ar</strong>io <strong>com</strong>pleto 2,220 EGB 1 Completo 49<br />

EGB 3 In<strong>com</strong>pleto 286 EGB 2 Completo 46<br />

Universit<strong>ar</strong>io in<strong>com</strong>pleto 268 Polimodal Completo 15<br />

Terci<strong>ar</strong>io in<strong>com</strong>pleto 224 Sin Datos 627<br />

EGB 2 In<strong>com</strong>pleto 165 Total 53,029<br />

Tab<strong>la</strong> 4.23. Nivel <strong>de</strong> Instrucción <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

Solución Patricio Gutiérrez Rüegg 59


30,000<br />

25,000<br />

20,000<br />

15,000<br />

10,000<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

5,000<br />

0<br />

Prim<strong>ar</strong>io <strong>com</strong>pleto<br />

Prim<strong>ar</strong>io in<strong>com</strong>pleto<br />

60<br />

Secund<strong>ar</strong>io in<strong>com</strong>pleto<br />

Ninguno<br />

Secund<strong>ar</strong>io <strong>com</strong>pleto<br />

EGB 3 In<strong>com</strong>pleto<br />

Universit<strong>ar</strong>io in<strong>com</strong>pleto<br />

Nivel <strong>de</strong> Instrucción<br />

EGB 2 In<strong>com</strong>pleto<br />

Terci<strong>ar</strong>io in<strong>com</strong>pleto<br />

Terci<strong>ar</strong>io <strong>com</strong>pleto<br />

EGB 3 Completo<br />

EGB 1 In<strong>com</strong>pleto<br />

Universit<strong>ar</strong>io <strong>com</strong>pleto<br />

Polimodal In<strong>com</strong>pleto<br />

Figura 4.4. Nivel <strong>de</strong> Instrucción <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

EGB 1 Completo<br />

EGB 2 Completo<br />

Polimodal Completo<br />

Sin Datos<br />

[Última Situación Laboral]:<br />

Muestra el status <strong>la</strong>boral <strong>de</strong> los reclusos al mom<strong>en</strong>to <strong>de</strong> ingres<strong>ar</strong> al p<strong>en</strong>al. Se observa<br />

<strong>com</strong>o sólo el 19% <strong>de</strong> los mismos poseía un trabajo <strong>de</strong> tiempo <strong>com</strong>pleto al ser <strong>de</strong>t<strong>en</strong>ido.<br />

Este campo está muy re<strong>la</strong>cionado con el anterior, nivel <strong>de</strong> instrucción.<br />

Situacion Laboral Presos<br />

Desocupado 21,342<br />

Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial 20,831<br />

Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto 9,824<br />

Sin Datos 1,032<br />

Total 53,029<br />

19%<br />

Ultima Situación Laboral<br />

Tab<strong>la</strong> 4.24. Situación Laboral Figura 4.5. Situación Laboral <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

39%<br />

2%<br />

40%<br />

Desocupado<br />

Trabajador <strong>de</strong><br />

tiempo p<strong>ar</strong>cial<br />

Trabajador <strong>de</strong><br />

tiempo <strong>com</strong>pleto<br />

Sin Datos<br />

[Capacitación Laboral]:<br />

Refleja si los <strong>de</strong>t<strong>en</strong>idos poseían alguna profesión u oficio al mom<strong>en</strong>to <strong>de</strong> ingreso al<br />

p<strong>en</strong>al. Alre<strong>de</strong>dor <strong>de</strong> <strong>la</strong> mitad <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos no t<strong>en</strong>ía ningún oficio ni profesión.<br />

Patricio Gutiérrez Rüegg Solución


Situacion Laboral Presos<br />

No ti<strong>en</strong>e ni oficio ni profesión 25,202<br />

Ti<strong>en</strong>e algún oficio 20,290<br />

Ti<strong>en</strong>e alguna profesión 4,312<br />

Sin Datos 3,225<br />

Total 53,029<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Capacitación Laboral<br />

Tab<strong>la</strong> 4.25. Capacitación Laboral. Figura 4.6. Capacitación Laboral <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

[Tipo <strong>de</strong>l lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia]:<br />

Solución Patricio Gutiérrez Rüegg 61<br />

38%<br />

8%<br />

6%<br />

48%<br />

Último Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia<br />

No ti<strong>en</strong>e ni oficio ni<br />

profesión<br />

Ti<strong>en</strong>e algún oficio<br />

Ti<strong>en</strong>e alguna<br />

profesión<br />

Sin Datos<br />

Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia Presos<br />

Urbano<br />

Urbano<br />

Rural<br />

Sin Datos<br />

44,663<br />

5,623<br />

2,743<br />

84%<br />

Rural<br />

Sin Datos<br />

Total 53,029<br />

Tab<strong>la</strong> 4.26. Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia. Figura 4.7. Lug<strong>ar</strong> <strong>de</strong> Resi<strong>de</strong>ncia <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

[Situación Legal]: El pres<strong>en</strong>te campo es <strong>de</strong> real importancia al mom<strong>en</strong>to <strong>de</strong> estudi<strong>ar</strong> a<br />

<strong>la</strong> pob<strong>la</strong>ción c<strong>ar</strong>ce<strong>la</strong>ria <strong>en</strong> Arg<strong>en</strong>tina. La sep<strong>ar</strong>ación <strong>de</strong> procesados y con<strong>de</strong>nados es un<br />

principio elem<strong>en</strong>tal <strong>de</strong>l tratami<strong>en</strong>to c<strong>ar</strong>ce<strong>la</strong>rio. Hoy <strong>en</strong> día, solo el 40% <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos<br />

posee una con<strong>de</strong>na.<br />

Situación Legal Presos<br />

Procesado 31,043<br />

Procesado<br />

Con<strong>de</strong>nado<br />

Inimputable<br />

Otra situación<br />

Total<br />

21,054<br />

674<br />

258<br />

53,029<br />

59%<br />

Con<strong>de</strong>nado<br />

Inimputable<br />

Otra situación<br />

Tab<strong>la</strong> 4.27. Situación Legal. Figura 4.8. Situación legal <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos.<br />

11%<br />

40%<br />

5%<br />

1%<br />

Situación Legal<br />

0%


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

[Delito <strong>com</strong>etido]:<br />

Delito <strong>en</strong> primera m<strong>en</strong>ción por el cual <strong>la</strong> persona fue <strong>de</strong>t<strong>en</strong>ida según el código p<strong>en</strong>al.<br />

Los <strong>de</strong>litos <strong>de</strong> robo, homicidios, estupefaci<strong>en</strong>tes y vio<strong>la</strong>ciones conforman el 87% <strong>de</strong> los<br />

casos.<br />

62<br />

Delito Cometido Presos<br />

Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo 26,777 Delitos contra el honor 215<br />

Homicidios dolosos 6,635 Otros <strong>de</strong>litos contra <strong>la</strong> libertad 194<br />

Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes) 3,906 Delitos c/ <strong>la</strong> fe pública 193<br />

Vio<strong>la</strong>ciones 2,504 Delitos c/el or<strong>de</strong>n público 155<br />

Otros <strong>de</strong>litos contra <strong>la</strong>s personas 1,722 Lesiones Culposas 123<br />

Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto 1,453 Delitos previstos <strong>en</strong> leyes especiales 58<br />

Otros <strong>de</strong>litos contra <strong>la</strong> honestidad 1,452 Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia 24<br />

Otros <strong>de</strong>litos contra <strong>la</strong> propiedad 1,345 Contrav<strong>en</strong>ciones 21<br />

Delitos contra <strong>la</strong> seguridad pública 1,052 Delitos contra <strong>la</strong> seguridad <strong>de</strong> <strong>la</strong> nación 20<br />

Homicidios dolosos (t<strong>en</strong>t.) 819 Del. contra <strong>la</strong> lib. <strong>com</strong>et. por func. público 18<br />

Homicidios Culposos 675 Delitos contra los po<strong>de</strong>res publicos 15<br />

Privación ilegítima <strong>de</strong> <strong>la</strong> libertad 578 Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres 13<br />

Lesiones Dolosas 494 Delitos c/ el estado civil 9<br />

Delitos c/ <strong>la</strong> administracion pública 438 Sin Datos 1,861<br />

Am<strong>en</strong>azas 260 Total 53,029<br />

Tab<strong>la</strong> 4.28. Delitos Cometidos <strong>en</strong> primera m<strong>en</strong>ción<br />

Delitos<br />

Homicidios Culposos<br />

Homicidios dolosos (t<strong>en</strong>t.)<br />

Delitos contra <strong>la</strong> seguridad pública<br />

Otros <strong>de</strong>litos contra <strong>la</strong> propiedad<br />

Otros <strong>de</strong>litos contra <strong>la</strong> honestidad<br />

Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto<br />

Otros <strong>de</strong>litos contra <strong>la</strong>s personas<br />

Vio<strong>la</strong>ciones<br />

Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes)<br />

Homicidios dolosos<br />

Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo<br />

Delitos Cometidos <strong>en</strong> primera m<strong>en</strong>ción<br />

0 3000 6000 9000 12000 15000 18000 21000 24000 27000 30000<br />

Figura 4.9. Delitos Cometidos <strong>en</strong> primera m<strong>en</strong>ción<br />

Presos<br />

[Trabajo remunerado]:<br />

Repres<strong>en</strong>ta <strong>la</strong> proporción <strong>de</strong> internos que ti<strong>en</strong><strong>en</strong> un trabajo remunerado <strong>de</strong>ntro <strong>de</strong>l p<strong>en</strong>al.<br />

Vale <strong>de</strong>stac<strong>ar</strong> que p<strong>ar</strong>a t<strong>en</strong>er acceso a un trabajo remunerado es neces<strong>ar</strong>io que el<br />

<strong>de</strong>t<strong>en</strong>ido t<strong>en</strong>ga una con<strong>de</strong>na firme.<br />

Patricio Gutiérrez Rüegg Solución


Trabajo Remunerado Presos<br />

No ti<strong>en</strong>e trabajo remunerado 30,539<br />

Hasta 20 hs. Semanales 5,435<br />

Hasta 40 hs. Semanales 5,099<br />

Hasta 30 hs. Semanales 4,304<br />

Hasta 10 hs. Semanales 1,672<br />

Sin Datos 5,980<br />

Total 53,029<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Trabajo Remunerado<br />

Tab<strong>la</strong> 4.29. Trabajo Remunerado. Figura 4.10. Trabajo remunerado <strong>en</strong> los internos.<br />

Solución Patricio Gutiérrez Rüegg 63<br />

8%<br />

10%<br />

3%<br />

10%<br />

11%<br />

58%<br />

No ti<strong>en</strong>e trabajo<br />

remunerado<br />

Hasta 20 hs.<br />

Semanales<br />

Hasta 40 hs.<br />

Semanales<br />

Hasta 30 hs.<br />

Semanales<br />

Hasta 10 hs.<br />

Semanales<br />

Sin Datos<br />

[P<strong>ar</strong>ticipación Programa Capacitación Laboral]:<br />

El 70% <strong>de</strong> los reclusos no p<strong>ar</strong>ticipa <strong>de</strong> ningún programa <strong>de</strong> capacitación <strong>la</strong>boral. Esto<br />

último, sumado al nivel <strong>de</strong> instrucción y <strong>la</strong> capacitación <strong>la</strong>boral al ingreso, <strong>en</strong>trega un<br />

panorama no muy al<strong>en</strong>tador p<strong>ar</strong>a <strong>la</strong>s personas que pert<strong>en</strong>ec<strong>en</strong> a <strong>la</strong> sociedad c<strong>ar</strong>ce<strong>la</strong>ria.<br />

Programa Capacitación Laboral<br />

Programa capacitación <strong>la</strong>boral<br />

No p<strong>ar</strong>ticipa<br />

Si p<strong>ar</strong>ticipa<br />

Presos<br />

37,344<br />

8,442<br />

70%<br />

No p<strong>ar</strong>ticipa<br />

Si p<strong>ar</strong>ticipa<br />

Sin Datos 7,243<br />

Sin Datos<br />

Total 53,029<br />

Tab<strong>la</strong> 4.30. Capacitación Laboral. Figura 4.11. P<strong>ar</strong>ticipación <strong>en</strong> Capacitación Laboral.<br />

[P<strong>ar</strong>ticipación Programa Educativo]:<br />

Nuevam<strong>en</strong>te, tal <strong>com</strong>o ocurre <strong>en</strong> los programas <strong>la</strong>borales, se observa una muy baja<br />

p<strong>ar</strong>ticipación <strong>en</strong> programas educativos.<br />

16%<br />

14%


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

P<strong>ar</strong>ticipacion <strong>en</strong> programa educativo Presos<br />

No p<strong>ar</strong>ticipa <strong>de</strong> ningún programa educativo 29,514<br />

Si - educación formal - EGB 9,615<br />

Si - educación no formal 4,702<br />

Si - educación formal - POLIMODAL 3,511<br />

Si - educación formal - UNIVERSITARIA 312<br />

Si - educación formal - TERCIARIA 136<br />

Sin Datos 5,239<br />

Total 53,029<br />

Tab<strong>la</strong> 4.31. Programa Educativo. Figura 4.12. P<strong>ar</strong>ticipación <strong>en</strong> Programa Educativo.<br />

[Reinci<strong>de</strong>ncia]:<br />

Reinci<strong>de</strong>ncia Presos<br />

Prim<strong>ar</strong>io 34,264<br />

Reinci<strong>de</strong>nte (<strong>ar</strong>t. 50 CP) 6,669<br />

Reiterante 2,747<br />

Reinci<strong>de</strong>ncia múltiple (<strong>ar</strong>t. 52 CP) 389<br />

Sin Datos 8,960<br />

Total 53,029<br />

64<br />

40,000<br />

35,000<br />

30,000<br />

25,000<br />

20,000<br />

15,000<br />

10,000<br />

5,000<br />

34,264<br />

9%<br />

1%<br />

7%<br />

18%<br />

Programa Educativo<br />

10%<br />

Tab<strong>la</strong> 4.32. Reinci<strong>de</strong>ncia. Figura 4.13. Reinci<strong>de</strong>ncia.<br />

4.2.2.4 Verificación <strong>de</strong> Calidad <strong>de</strong> los Datos<br />

0<br />

55%<br />

Reinci<strong>de</strong>ncia <strong>en</strong> hechos <strong>de</strong>lictivos<br />

6,669<br />

Prim<strong>ar</strong>io Reinci<strong>de</strong>nte (<strong>ar</strong>t.<br />

50 CP)<br />

2,747<br />

No p<strong>ar</strong>ticipa <strong>de</strong><br />

ningún programa<br />

educativo<br />

Si - educación<br />

formal - EGB<br />

Si - educación no<br />

formal<br />

Si - educación<br />

formal -<br />

POLIMODAL<br />

Si - educación<br />

formal -<br />

UNIVERSITARIA<br />

Sin Datos<br />

Patricio Gutiérrez Rüegg Solución<br />

389<br />

Reiterante Reinci<strong>de</strong>ncia<br />

múltiple (<strong>ar</strong>t. 52<br />

CP)<br />

8,960<br />

Sin Datos<br />

Durante <strong>la</strong> exploración <strong>de</strong> los datos pudieron observ<strong>ar</strong> problemas <strong>en</strong> <strong>la</strong> calidad <strong>de</strong> los<br />

mismos, y a su vez, se <strong>en</strong>contr<strong>ar</strong>on v<strong>ar</strong>ios campos que pres<strong>en</strong>taban datos nulos o<br />

aus<strong>en</strong>tes.<br />

En primer lug<strong>ar</strong>, tal <strong>com</strong>o pue<strong>de</strong> observ<strong>ar</strong>se <strong>en</strong> los gráficos <strong>de</strong>l punto anterior, <strong>la</strong><br />

totalidad <strong>de</strong> los mismos pres<strong>en</strong>tan registros que ti<strong>en</strong><strong>en</strong> valor nulo <strong>en</strong> alguno <strong>de</strong> sus<br />

campos. La cantidad <strong>de</strong> veces que ap<strong>ar</strong>ec<strong>en</strong> estos campos vacíos v<strong>ar</strong>ía <strong>en</strong>tre los atributos<br />

<strong>de</strong> acuerdo al mom<strong>en</strong>to <strong>en</strong> que el dato haya sido c<strong>en</strong>sado: al ingreso <strong>de</strong>l p<strong>en</strong>al o una vez<br />

ya ingresado al mismo. Si<strong>en</strong>do estos últimos, los que pres<strong>en</strong>tan mayores problemas <strong>de</strong><br />

calidad y aus<strong>en</strong>cia <strong>de</strong> información.


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Com<strong>en</strong>zando por el campo edad, exist<strong>en</strong> 456 registros que conti<strong>en</strong><strong>en</strong> al número cero<br />

<strong>com</strong>o <strong>la</strong> posible edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido, algo que es realm<strong>en</strong>te imposible. Lo mismo ocurre<br />

con otros 10 casos <strong>de</strong> personas que pres<strong>en</strong>tan eda<strong>de</strong>s <strong>en</strong>tre los 2 y 13 años.<br />

En lo que respecta al estado civil <strong>de</strong> <strong>la</strong>s personas, <strong>de</strong> los 509 registros que pres<strong>en</strong>tan un<br />

nulo <strong>com</strong>o atributo <strong>de</strong>l campo, hay 166 que ti<strong>en</strong><strong>en</strong> un valor <strong>de</strong> estado civil = 0, pero que<br />

el mismo no es coher<strong>en</strong>te con <strong>la</strong> codificación <strong>de</strong>l c<strong>en</strong>so, tal <strong>com</strong>o lo muestra <strong>la</strong> tab<strong>la</strong> 4.8.<br />

Inconsist<strong>en</strong>cias simi<strong>la</strong>res <strong>en</strong> los datos ocurr<strong>en</strong> con los re<strong>la</strong>cionados a <strong>la</strong> nacionalidad,<br />

última situación <strong>la</strong>boral, capacitación <strong>la</strong>boral, lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia, última provincia <strong>de</strong><br />

resi<strong>de</strong>ncia y <strong>en</strong> m<strong>en</strong>or medida el nivel <strong>de</strong> instrucción, <strong>de</strong>lito <strong>com</strong>etido, horas <strong>de</strong> trabajo<br />

remunerado, p<strong>ar</strong>ticipación <strong>de</strong> programas <strong>la</strong>borales y educativos y reinci<strong>de</strong>ncia.<br />

Tanto <strong>la</strong> calidad <strong>de</strong> los datos, <strong>com</strong>o el faltante <strong>de</strong> los mismos, son cuestiones muy<br />

importantes a t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta previo a realiz<strong>ar</strong> <strong>la</strong> minería <strong>en</strong> los datos. Esto se analiz<strong>ar</strong>á<br />

<strong>en</strong> <strong>la</strong> Fase III Prep<strong>ar</strong>ación <strong>de</strong> los Datos.<br />

4.2.3 Fase III: Prep<strong>ar</strong>ación <strong>de</strong> los datos<br />

En esta fase se trabaj<strong>ar</strong>á sobre <strong>la</strong> prep<strong>ar</strong>ación <strong>de</strong>l dataset <strong>de</strong>finitivo, <strong>la</strong> selección y<br />

limpieza <strong>de</strong> los datos. Una vez hechas estas activida<strong>de</strong>s se proce<strong>de</strong> a construir los datos<br />

a los cuales les fueran neces<strong>ar</strong>ios algún tipo <strong>de</strong> modificación. Es <strong>de</strong>cir, es <strong>en</strong> esta etapa<br />

<strong>en</strong> don<strong>de</strong> se prep<strong>ar</strong>a todo lo re<strong>la</strong>tivo a <strong>la</strong> base <strong>de</strong> datos, p<strong>ar</strong>a po<strong>de</strong>r luego ingres<strong>ar</strong><strong>la</strong>s <strong>en</strong><br />

<strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.<br />

4.2.3.1 Prep<strong>ar</strong>ación <strong>de</strong>l Dataset<br />

La versión final <strong>de</strong>l dataset, el cual consta <strong>de</strong> 40,928 registros sobre presos masculinos,<br />

a utiliz<strong>ar</strong> p<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> minería <strong>de</strong> datos se pres<strong>en</strong>ta <strong>en</strong> <strong>la</strong> tab<strong>la</strong> 4.33.<br />

Campo Descripción Tipo <strong>de</strong> Dato<br />

Edad Edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Numérico<br />

Estado Civil Estado Civil <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido Texto<br />

Nivel_Instr_Summ Nivel <strong>de</strong> Instrucción agrupado Texto<br />

Ultima Situacion Laboral Ultima situación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Texto<br />

Capacitacion Laboral Capacitación <strong>la</strong>boral al mom<strong>en</strong>to <strong>de</strong>l ingreso Texto<br />

Ultima Resi<strong>de</strong>ncia Ultimo lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia (Urbano/Rural) Texto<br />

Delito Cometido Tipo <strong>de</strong> <strong>de</strong>lito Agrupado - 1ra. m<strong>en</strong>ción Texto<br />

Tab<strong>la</strong> 4.33. Dataset <strong>de</strong>finitivo.<br />

A los fines <strong>de</strong> obt<strong>en</strong>er mayor c<strong>la</strong>ridad <strong>en</strong> los resultados obt<strong>en</strong>idos una vez corridos los<br />

mo<strong>de</strong>los, se proce<strong>de</strong> a agrup<strong>ar</strong> <strong>la</strong>s v<strong>ar</strong>iables <strong>de</strong> los atributos nivel <strong>de</strong> instrucción y <strong>de</strong>lito<br />

<strong>com</strong>etido. Vale <strong>de</strong>stac<strong>ar</strong> que estos dos atributos pose<strong>en</strong> una gran cantidad <strong>de</strong> v<strong>ar</strong>iables,<br />

Solución Patricio Gutiérrez Rüegg 65


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

lo cual hace más difícil el análisis si no se lleva a cabo una agrupación <strong>de</strong> <strong>la</strong>s mismas.<br />

Dicho agrupami<strong>en</strong>to se pue<strong>de</strong> observ<strong>ar</strong> <strong>en</strong> el ap<strong>ar</strong>tado 4.2.3.4 <strong>de</strong> Construcción <strong>de</strong> los<br />

Datos.<br />

A su vez, p<strong>ar</strong>a obt<strong>en</strong>er los 40,928 registros, se tuvieron que agreg<strong>ar</strong> distintos filtros a los<br />

fines <strong>de</strong> obt<strong>en</strong>er un dataset que fuera lo más limpio posible. Se profundiza el tema <strong>en</strong> el<br />

ap<strong>ar</strong>tado 4.2.3.3 Limpieza <strong>de</strong> los Datos.<br />

4.2.3.2 Selección <strong>de</strong> los Datos<br />

Los campos que se consi<strong>de</strong>r<strong>ar</strong>án p<strong>ar</strong>a el pres<strong>en</strong>te estudio se elig<strong>en</strong> t<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta<br />

los sigui<strong>en</strong>tes factores:<br />

66<br />

• V<strong>ar</strong>iables que pue<strong>de</strong> tom<strong>ar</strong> cada uno <strong>de</strong> los campos o atributos.<br />

• Calidad <strong>de</strong> los datos.<br />

• Importancia <strong>de</strong>l atributo p<strong>ar</strong>a el estudio <strong>en</strong> cuestión <strong>en</strong> cuanto a los objetivos <strong>de</strong>l<br />

proyecto, información que <strong>en</strong>trega y significancia <strong>de</strong>l mismo.<br />

Los campos que se consi<strong>de</strong>ran p<strong>ar</strong>a el pres<strong>en</strong>te estudio son los sigui<strong>en</strong>tes:<br />

Sexo<br />

Campo alfanumérico que indica el sexo <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido. P<strong>ar</strong>a el análisis se ti<strong>en</strong><strong>en</strong> <strong>en</strong> cu<strong>en</strong>ta<br />

solo a <strong>la</strong>s personas <strong>de</strong> sexo masculino por repres<strong>en</strong>t<strong>ar</strong> al 95% <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción p<strong>en</strong>al.<br />

Edad<br />

Campo numérico que indica <strong>la</strong> edad <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido. Este atributo toma valores <strong>de</strong>s<strong>de</strong> los<br />

10 años hasta los 89 años.<br />

Estado Civil<br />

Describe el estado civil <strong>en</strong> el que se <strong>en</strong>contraba el preso al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong> <strong>de</strong>t<strong>en</strong>ción.<br />

Los posibles estados son: Soltero, Casado, Concubino, Sep<strong>ar</strong>ado <strong>de</strong> hecho o Divorciado,<br />

Viudo.<br />

Nivel <strong>de</strong> Instrucción<br />

Atributo que <strong>de</strong>scribe el nivel <strong>de</strong> educación <strong>de</strong>l preso y situación <strong>de</strong> avance (<strong>com</strong>pleto o<br />

in<strong>com</strong>pleto). Se proce<strong>de</strong> agrup<strong>ar</strong> dicho campo p<strong>ar</strong>a llev<strong>ar</strong>lo al viejo esquema <strong>de</strong>l sistema<br />

educativo: Prim<strong>ar</strong>io/ Secund<strong>ar</strong>io/Terci<strong>ar</strong>io/Universit<strong>ar</strong>io (ver 4.2.3.4. Construcción <strong>de</strong><br />

los Datos).<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Capacitación Laboral<br />

Tal <strong>com</strong>o indica <strong>la</strong> pa<strong>la</strong>bra, indica el nivel <strong>de</strong> capacitación que <strong>la</strong> persona posee<br />

<strong>la</strong>boralm<strong>en</strong>te hab<strong>la</strong>ndo. Este atributo pue<strong>de</strong> tom<strong>ar</strong> <strong>la</strong>s sigui<strong>en</strong>tes v<strong>ar</strong>iables: ti<strong>en</strong>e oficio,<br />

ti<strong>en</strong>e profesión, no ti<strong>en</strong>e oficio ni profesión.<br />

Última Resi<strong>de</strong>ncia<br />

Repres<strong>en</strong>ta el tipo <strong>de</strong> resi<strong>de</strong>ncia <strong>en</strong> el cual vivía el <strong>de</strong>t<strong>en</strong>ido. Toma dos valores posibles:<br />

Urbana o Rural.<br />

Delito Cometido<br />

Describe el tipo <strong>de</strong> <strong>de</strong>lito <strong>com</strong>etido <strong>en</strong> primera m<strong>en</strong>ción por el <strong>de</strong>t<strong>en</strong>ido. Se agrupa a<br />

este campo según el código p<strong>en</strong>al <strong>en</strong> los sigui<strong>en</strong>tes tipos <strong>de</strong> <strong>de</strong>litos: Delitos contra <strong>la</strong><br />

Propiedad, Delitos contra <strong>la</strong>s Personas, Delitos contra <strong>la</strong> integridad sexual y el Honor,<br />

Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes), Contrav<strong>en</strong>ciones, Delitos c/ el estado civil,<br />

Delitos c/el Estado y <strong>la</strong> Comunidad, Delitos contra <strong>la</strong> libertad, Delitos previstos <strong>en</strong> leyes<br />

especiales, Infracción ley Nº 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres, Infracción ley Nº<br />

24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia, Otros <strong>de</strong>litos contra <strong>la</strong> honestidad. Debido a que los primeros 4<br />

<strong>de</strong>litos tipificados por el código p<strong>en</strong>al agrupan aproximadam<strong>en</strong>te al 90% <strong>de</strong> <strong>la</strong>s<br />

instancias, se proce<strong>de</strong> a acot<strong>ar</strong> el estudio a estos 4 <strong>de</strong>lito principales.<br />

A continuación se <strong>de</strong>tal<strong>la</strong>n los atributos no t<strong>en</strong>idos <strong>en</strong> cu<strong>en</strong>ta p<strong>ar</strong>a el análisis:<br />

Última provincia <strong>de</strong> resi<strong>de</strong>ncia<br />

Se omite <strong>la</strong> utilización <strong>de</strong> este atributo ya que se busca <strong>en</strong>contr<strong>ar</strong> un <strong>com</strong>portami<strong>en</strong>to<br />

g<strong>en</strong>eral, sin hacer foco <strong>en</strong> cuestiones p<strong>ar</strong>ticu<strong>la</strong>res por provincia. Más <strong>de</strong>l 50% <strong>de</strong> los<br />

casos correspon<strong>de</strong> a <strong>la</strong> Provincia <strong>de</strong> Bu<strong>en</strong>os Aires.<br />

Situación Legal<br />

Indica <strong>la</strong> situación legal <strong>en</strong> <strong>la</strong> cual se <strong>en</strong>cu<strong>en</strong>tra el <strong>de</strong>t<strong>en</strong>ido. Hay 4 situaciones posibles:<br />

Con<strong>de</strong>nado, Procesado, Inimputable u Otra Situación. En un principio se p<strong>en</strong>só <strong>en</strong> no<br />

omitir este campo, sin emb<strong>ar</strong>go se cree que es un dato irrelevante p<strong>ar</strong>a c<strong>ar</strong>acteriz<strong>ar</strong>, <strong>en</strong><br />

una primera aproximación con minería <strong>de</strong> datos, <strong>la</strong> conducta que habría llevado a que<br />

<strong>la</strong>s personas pert<strong>en</strong>eci<strong>en</strong>tes a esta pob<strong>la</strong>ción <strong>com</strong>etieran un <strong>de</strong>lito.<br />

Trabajo Remunerado<br />

Informa acerca <strong>de</strong> <strong>la</strong> cantidad <strong>de</strong> horas que cada <strong>de</strong>t<strong>en</strong>ido pasa trabajando <strong>de</strong> manera<br />

remunerada. Los valores que toma son: no ti<strong>en</strong>e trabajo remunerado, hasta 40 hs.<br />

semanales, hasta 30 hs. semanales, hasta 20 hs. semanales, hasta 10 hs. semanales y sin<br />

datos. Dado que se trata <strong>de</strong> un atributo asociado al <strong>com</strong>portami<strong>en</strong>to ya <strong>de</strong>ntro <strong>de</strong> <strong>la</strong><br />

cárcel y que el mismo pres<strong>en</strong>ta un 11% <strong>de</strong> nulos, se <strong>de</strong>ci<strong>de</strong> omitir dicho campo.<br />

Solución Patricio Gutiérrez Rüegg 67


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

P<strong>ar</strong>ticipación <strong>en</strong> programa <strong>de</strong> formación o capacitación <strong>la</strong>boral / P<strong>ar</strong>ticipación <strong>en</strong><br />

algún programa educativo / P<strong>ar</strong>ticipación <strong>en</strong> algún programa <strong>de</strong> activida<strong>de</strong>s<br />

recreativas o <strong>de</strong>portivas<br />

Hac<strong>en</strong> hincapié <strong>en</strong> <strong>la</strong> p<strong>ar</strong>ticipación <strong>de</strong> los internos <strong>en</strong> los distintos programas <strong>de</strong>l sistema<br />

p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Al igual que el atributo anterior, al ser información asociada a conductas<br />

<strong>de</strong>ntro <strong>de</strong>l establecimi<strong>en</strong>to, se <strong>de</strong>ci<strong>de</strong> no utiliz<strong>ar</strong> estos campos.<br />

4.2.3.3 Limpieza <strong>de</strong> los Datos<br />

Exist<strong>en</strong> registros que son excluidos <strong>de</strong>l análisis por <strong>en</strong>contr<strong>ar</strong>se alguna inconsist<strong>en</strong>cia,<br />

tal <strong>com</strong>o se especificó <strong>en</strong> el punto 4.2.2.4 <strong>de</strong> Verificación <strong>de</strong> Calidad <strong>de</strong> los Datos.<br />

En lo que respecta al campo Edad, se procedió a elimin<strong>ar</strong> los registros que t<strong>en</strong>ían <strong>com</strong>o<br />

valor 0, 2 o 13 años. En segundo lug<strong>ar</strong>, mediante una consulta <strong>en</strong> MS Access, se g<strong>en</strong>eró<br />

<strong>la</strong> condición <strong>de</strong> que <strong>la</strong> base <strong>de</strong> datos no pres<strong>en</strong>t<strong>ar</strong>a ningún valor nulo p<strong>ar</strong>a los atributos<br />

seleccionados <strong>en</strong> el dataset. A través <strong>de</strong> estas modificaciones, se obtuvo una base limpia<br />

<strong>de</strong> inconsist<strong>en</strong>cias y errores <strong>de</strong> 40,928 registros.<br />

4.2.3.4 Construcción e integración <strong>de</strong> los Datos<br />

En <strong>la</strong> pres<strong>en</strong>te etapa se proce<strong>de</strong> a <strong>la</strong> construcción <strong>de</strong> los datos que conforman el dataset<br />

<strong>de</strong>finitivo p<strong>ar</strong>a su posterior ingreso <strong>en</strong> <strong>la</strong> herrami<strong>en</strong>ta <strong>de</strong> mo<strong>de</strong><strong>la</strong>do.<br />

Tal <strong>com</strong>o se <strong>com</strong><strong>en</strong>ta anteriorm<strong>en</strong>te, se realiza un agrupami<strong>en</strong>to <strong>de</strong> los distintos Delitos<br />

Cometidos t<strong>en</strong>i<strong>en</strong>do <strong>en</strong> cu<strong>en</strong>ta <strong>la</strong> tipificación <strong>de</strong>l código p<strong>en</strong>al. Como pue<strong>de</strong> observ<strong>ar</strong>se<br />

<strong>en</strong> <strong>la</strong> tab<strong>la</strong> 4.34, los 28 <strong>de</strong>litos <strong>com</strong>etidos que figuran <strong>en</strong> <strong>la</strong> base <strong>de</strong> datos terminan<br />

agrupándose solo <strong>en</strong> 12. Se cree neces<strong>ar</strong>ia esta t<strong>ar</strong>ea a los fines <strong>de</strong> facilit<strong>ar</strong> <strong>la</strong><br />

<strong>com</strong>pr<strong>en</strong>sión <strong>de</strong> los resultados una vez realizadas <strong>la</strong>s corridas experim<strong>en</strong>tales.<br />

Otro <strong>de</strong> los campos <strong>en</strong> don<strong>de</strong> es neces<strong>ar</strong>ia su reconstrucción es el campo <strong>de</strong>l Nivel <strong>de</strong><br />

Instrucción. A p<strong>ar</strong>tir <strong>de</strong>l año 1996, <strong>la</strong> Escue<strong>la</strong> Prim<strong>ar</strong>ia y <strong>la</strong> Escue<strong>la</strong> Secund<strong>ar</strong>ia<br />

cambi<strong>ar</strong>on a un nuevo sistema educativo:<br />

68<br />

• La Educación G<strong>en</strong>eral Básica (EGB) <strong>de</strong> 9 años<br />

• La Educación Polimodal <strong>de</strong> 3 años.<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Delito Cometido Delito Cometido Unificado<br />

Contrav<strong>en</strong>ciones Contrav<strong>en</strong>ciones<br />

Delitos c/ el estado civil Delitos c/ el estado civil<br />

Del. contra <strong>la</strong> lib. <strong>com</strong>et. por func. público<br />

Delitos c/ <strong>la</strong> administracion pública<br />

Delitos c/ <strong>la</strong> fe pública<br />

Delitos c/el or<strong>de</strong>n público<br />

Delitos c/el Estado y <strong>la</strong> Comunidad<br />

Delitos contra <strong>la</strong> seguridad <strong>de</strong> <strong>la</strong> nación<br />

Delitos contra <strong>la</strong> seguridad pública<br />

Delitos contra los po<strong>de</strong>res publicos<br />

Delitos contra el honor<br />

Delitos contra <strong>la</strong> integridad sexual y el Honor<br />

Vio<strong>la</strong>ciones<br />

Am<strong>en</strong>azas<br />

Otros <strong>de</strong>litos contra <strong>la</strong> libertad<br />

Delitos contra <strong>la</strong> libertad<br />

Privación ilegítima <strong>de</strong> <strong>la</strong> libertad<br />

Hurto y/o t<strong>en</strong>tativa <strong>de</strong> hurto<br />

Otros <strong>de</strong>litos contra <strong>la</strong> propiedad<br />

Delitos contra <strong>la</strong> propiedad<br />

Robo y/o t<strong>en</strong>tativa <strong>de</strong> robo<br />

Homicidios Culposos<br />

Homicidios dolosos<br />

Homicidios dolosos (t<strong>en</strong>t.)<br />

Delitos contra <strong>la</strong>s personas<br />

Lesiones Culposas<br />

Lesiones Dolosas<br />

Otros <strong>de</strong>litos contra <strong>la</strong>s personas<br />

Delitos previstos <strong>en</strong> leyes especiales Delitos previstos <strong>en</strong> leyes especiales<br />

Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres Infraccion ley n° 13.944 incumplimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>beres<br />

Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes) Infracción ley n° 23.737 (estupefaci<strong>en</strong>tes)<br />

Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia Infraccion ley n° 24.769 p<strong>en</strong>al tribut<strong>ar</strong>ia<br />

Otros <strong>de</strong>litos contra <strong>la</strong> honestidad Otros <strong>de</strong>litos contra <strong>la</strong> honestidad<br />

Sin Datos Sin Datos<br />

Tab<strong>la</strong> 4.34. Unificación <strong>de</strong> <strong>de</strong>litos según el Código P<strong>en</strong>al.<br />

A los fines <strong>de</strong>l estudio <strong>en</strong> cuestión se unific<strong>ar</strong>on los campos según el viejo sistema:<br />

NivelInstruc Nivel Instrucción Unificado<br />

Ninguno Ninguno<br />

Prim<strong>ar</strong>io Completo Prim<strong>ar</strong>io Completo<br />

Prim<strong>ar</strong>io In<strong>com</strong>pleto Prim<strong>ar</strong>io In<strong>com</strong>pleto<br />

Secund<strong>ar</strong>io Completo Secund<strong>ar</strong>io Completo<br />

Secund<strong>ar</strong>io In<strong>com</strong>pleto<br />

EGB 1 Completo<br />

EGB 1 In<strong>com</strong>pleto<br />

EGB 2 Completo<br />

EGB 2 In<strong>com</strong>pleto Secund<strong>ar</strong>io In<strong>com</strong>pleto<br />

EGB 3 Completo<br />

EGB 3 In<strong>com</strong>pleto<br />

Polimodal In<strong>com</strong>pleto<br />

Polimodal Completo<br />

Terci<strong>ar</strong>io <strong>com</strong>pleto Terci<strong>ar</strong>io <strong>com</strong>pleto<br />

Terci<strong>ar</strong>io In<strong>com</strong>pleto Terci<strong>ar</strong>io In<strong>com</strong>pleto<br />

Universit<strong>ar</strong>io In<strong>com</strong>pleto Universit<strong>ar</strong>io In<strong>com</strong>pleto<br />

Universit<strong>ar</strong>io Completo Universit<strong>ar</strong>io Completo<br />

Sin Datos Sin Datos<br />

Tab<strong>la</strong> 4.35. Unificación <strong>de</strong>l campo Nivel <strong>de</strong> Instrucción.<br />

Solución Patricio Gutiérrez Rüegg 69


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Una vez terminada <strong>la</strong> Fase III, <strong>en</strong> don<strong>de</strong> se prep<strong>ar</strong>ó el dataset <strong>de</strong>finitivo, se<br />

seleccion<strong>ar</strong>on, limpi<strong>ar</strong>on y se modific<strong>ar</strong>on los datos, se continúa con <strong>la</strong> Fase IV <strong>de</strong><br />

Mo<strong>de</strong><strong>la</strong>do.<br />

4.2.4 Fase IV: Mo<strong>de</strong><strong>la</strong>do<br />

Es <strong>en</strong> esta fase <strong>en</strong> don<strong>de</strong> se seleccionan y aplican <strong>la</strong>s técnicas <strong>de</strong> mo<strong>de</strong><strong>la</strong>do. Al mismo<br />

tiempo se <strong>de</strong>terminan los valores <strong>de</strong> los p<strong>ar</strong>ámetros y v<strong>ar</strong>iables <strong>de</strong> calibración.<br />

Previo a seleccion<strong>ar</strong> <strong>la</strong>s técnicas y algoritmos p<strong>ar</strong>a <strong>la</strong> explotación <strong>de</strong> <strong>la</strong> información, es<br />

neces<strong>ar</strong>io seleccion<strong>ar</strong> el softw<strong>ar</strong>e a utiliz<strong>ar</strong>. La herrami<strong>en</strong>ta informática que se utiliza<br />

p<strong>ar</strong>a llev<strong>ar</strong> a cabo <strong>la</strong> pres<strong>en</strong>te fase es el RapidMiner o más conocido <strong>com</strong>o Rapid-i. El<br />

programa seleccionado cu<strong>en</strong>ta con <strong>la</strong>s sigui<strong>en</strong>tes v<strong>en</strong>tajas:<br />

70<br />

• Distribución 100% libre.<br />

• Funciona sobre cualquier p<strong>la</strong>taforma y sistema operativo.<br />

• Los procesos <strong>de</strong> explotación <strong>de</strong> información son mo<strong>de</strong><strong>la</strong>dos <strong>en</strong> forma <strong>de</strong> árboles<br />

operadores, lo cual resulta fácil e intuitivo.<br />

• Los árboles operadores o sub-árboles pue<strong>de</strong>n ser gu<strong>ar</strong>dados <strong>en</strong> formas <strong>de</strong><br />

bloques p<strong>ar</strong>a su posterior utilización.<br />

• Posee más <strong>de</strong> 400 mo<strong>de</strong>los <strong>de</strong> apr<strong>en</strong>dizaje, evaluación, pre-procesami<strong>en</strong>to y<br />

post-procesami<strong>en</strong>to y operadores p<strong>ar</strong>a visualización.<br />

• Integra <strong>la</strong> librería <strong>de</strong>l programa WEKA.<br />

• La c<strong>ar</strong>acterística más importante es <strong>la</strong> capacidad <strong>de</strong> jer<strong>ar</strong>quiz<strong>ar</strong> ca<strong>de</strong>nas <strong>de</strong>l<br />

operador y <strong>de</strong> construir <strong>com</strong>plejos árboles <strong>de</strong> operadores.<br />

Sin emb<strong>ar</strong>go, <strong>com</strong>o todo softw<strong>ar</strong>e, pres<strong>en</strong>ta puntos flojos:<br />

• La interfaz grafica no es <strong>de</strong>l todo “amigable”.<br />

• Salidas gráficas limitadas. Solo realiza <strong>la</strong> gráfica <strong>de</strong> una serie <strong>de</strong> datos elegida al<br />

az<strong>ar</strong>, <strong>la</strong> cual está limitada a <strong>la</strong>s 1000 muestras.<br />

• No posee un “tutorial” fácil <strong>de</strong> naveg<strong>ar</strong> que permita apr<strong>en</strong><strong>de</strong>r el programa <strong>de</strong><br />

manera <strong>com</strong>pleta y rápida.<br />

• Salidas poco c<strong>la</strong>ras p<strong>ar</strong>a qui<strong>en</strong>es no acostumbran a aplic<strong>ar</strong> minería <strong>de</strong> datos.<br />

En el anexo 14 se explican los conceptos básicos <strong>de</strong>l programa y se incluy<strong>en</strong> ejemplos<br />

p<strong>ar</strong>a <strong>en</strong>t<strong>en</strong><strong>de</strong>r <strong>la</strong>s c<strong>ar</strong>acterísticas operativas <strong>de</strong> <strong>la</strong> herrami<strong>en</strong>ta.<br />

Patricio Gutiérrez Rüegg Solución


4.2.4.1 Selección <strong>de</strong> <strong>la</strong> técnica <strong>de</strong> mo<strong>de</strong><strong>la</strong>do<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

En esta etapa, se seleccion<strong>ar</strong>á algunas <strong>de</strong> <strong>la</strong>s técnicas y algoritmos <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>dos a lo<br />

<strong>la</strong>rgo <strong>de</strong>l capitulo 2.1.1, pert<strong>en</strong>eci<strong>en</strong>te al Estado <strong>de</strong> <strong>la</strong> Cuestión.<br />

Al est<strong>ar</strong> trabajando con una base <strong>de</strong> más <strong>de</strong> 40,000 registros, se hace neces<strong>ar</strong>io realiz<strong>ar</strong><br />

un agrupami<strong>en</strong>to o clustering <strong>de</strong> los datos p<strong>ar</strong>a que el <strong>de</strong>scubrimi<strong>en</strong>to <strong>de</strong> <strong>la</strong> información<br />

oculta <strong>en</strong> ellos se torne lo m<strong>en</strong>os difícil posible. El algoritmo que se utiliz<strong>ar</strong>á es el K-<br />

Means, uno <strong>de</strong> los métodos más utilizados y el más popu<strong>la</strong>r <strong>de</strong> los métodos <strong>de</strong><br />

agrupami<strong>en</strong>to “por p<strong>ar</strong>tición”.<br />

El próximo paso es el <strong>de</strong> validación <strong>de</strong> los grupos o clusters con los especialistas <strong>en</strong><br />

temática criminal. Esta validación repres<strong>en</strong>ta una real importancia p<strong>ar</strong>a po<strong>de</strong>r seguir<br />

a<strong>de</strong><strong>la</strong>nte con <strong>la</strong> técnica <strong>de</strong> c<strong>la</strong>sificación.<br />

Previo a <strong>la</strong> c<strong>la</strong>sificación, es neces<strong>ar</strong>io preseleccion<strong>ar</strong> los atributos que serán utilizados<br />

posteriorm<strong>en</strong>te. P<strong>ar</strong>a <strong>la</strong> selección <strong>de</strong> atributos, tal <strong>com</strong>o se m<strong>en</strong>ciona <strong>en</strong> el “Estado <strong>de</strong> <strong>la</strong><br />

Cuestión”, exist<strong>en</strong> métodos basados <strong>en</strong> filtros y aquellos l<strong>la</strong>mados <strong>en</strong>volv<strong>en</strong>tes<br />

(wrappers). En el pres<strong>en</strong>te estudio, se utilizan ambos métodos <strong>de</strong> selección <strong>de</strong> atributos<br />

p<strong>ar</strong>a valid<strong>ar</strong> <strong>la</strong> significancia <strong>de</strong> los mismos<br />

Finalm<strong>en</strong>te, se aplican algoritmos <strong>de</strong> inducción (c<strong>la</strong>sificación) a cada cluster p<strong>ar</strong>a <strong>la</strong><br />

i<strong>de</strong>ntificación <strong>de</strong> reg<strong>la</strong>s <strong>de</strong> <strong>de</strong>cisión que ayu<strong>de</strong>n a explic<strong>ar</strong> <strong>la</strong> <strong>com</strong>posición <strong>de</strong> cada grupo<br />

formado. P<strong>ar</strong>a <strong>la</strong> c<strong>la</strong>sificación se utilizan los algoritmos C4.5 y CHAID.<br />

4.2.4.2 Construcción <strong>de</strong>l mo<strong>de</strong>lo y resultados experim<strong>en</strong>tales<br />

Se proce<strong>de</strong> a explic<strong>ar</strong> cada uno <strong>de</strong> los mo<strong>de</strong>los utilizados y sus resultados. A su vez, <strong>en</strong><br />

don<strong>de</strong> corresponda, se explican los p<strong>ar</strong>ámetros utilizados y configuraciones realizadas<br />

<strong>en</strong> el Rapid-i p<strong>ar</strong>a el <strong>de</strong>s<strong>ar</strong>rollo <strong>de</strong> <strong>la</strong> construcción <strong>de</strong>l mo<strong>de</strong>lo.<br />

4.2.4.2.1 Clustering<br />

A los fines <strong>de</strong> concret<strong>ar</strong> el agrupami<strong>en</strong>to <strong>de</strong> los datos, se utiliza el algoritmo K-Means<br />

p<strong>ar</strong>a obt<strong>en</strong>er 4 grupos <strong>de</strong> presos a través <strong>de</strong> sus c<strong>ar</strong>acterísticas más significativas.<br />

La configuración <strong>de</strong> dicho algoritmo <strong>de</strong> agrupami<strong>en</strong>to exige que se elija un número,<br />

<strong>de</strong>nominado semil<strong>la</strong> (seed), p<strong>ar</strong>a realiz<strong>ar</strong> una distribución aleatoria inicial a p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong><br />

cual el algoritmo <strong>com</strong>i<strong>en</strong>za <strong>la</strong>s sucesivas iteraciones. El número elegido p<strong>ar</strong>a llev<strong>ar</strong> a<br />

cabo el proceso es el que vi<strong>en</strong>e por <strong>de</strong>fecto <strong>en</strong> el programa (seed = 10). Al ser el<br />

K-Means un algoritmo que se basa <strong>en</strong> minimiz<strong>ar</strong> <strong>la</strong> suma <strong>de</strong>l error cuadrático, podría<br />

tom<strong>ar</strong>se a ese error <strong>com</strong>o punto <strong>de</strong> p<strong>ar</strong>tida p<strong>ar</strong>a <strong>la</strong> elección <strong>de</strong>l número óptimo <strong>de</strong> <strong>la</strong><br />

Solución Patricio Gutiérrez Rüegg 71


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

semil<strong>la</strong>. Cabe <strong>de</strong>stac<strong>ar</strong>, que el Rapid-i no cu<strong>en</strong>ta con alguna salida <strong>en</strong> <strong>la</strong> cual informe <strong>la</strong><br />

suma <strong>de</strong>l error cuadrático. Sin emb<strong>ar</strong>go, a modo <strong>de</strong> prueba, se utilizó otro programa <strong>de</strong><br />

minería <strong>de</strong> datos p<strong>ar</strong>a realiz<strong>ar</strong> corridas con difer<strong>en</strong>tes números <strong>de</strong> semil<strong>la</strong>, dando <strong>com</strong>o<br />

resultado al valor <strong>de</strong> semil<strong>la</strong>=10 <strong>com</strong>o <strong>la</strong> que minimizaba el error cuadrático.<br />

Una vez hecha <strong>la</strong> configuración y establecidos los p<strong>ar</strong>ámetros, se introduce el dataset<br />

<strong>de</strong>finido <strong>en</strong> el punto 4.2.3.1 al mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos p<strong>ar</strong>a realiz<strong>ar</strong> el clustering<br />

correspondi<strong>en</strong>te. A continuación se muestran los resultados obt<strong>en</strong>idos.<br />

4.2.4.2.2 Resultados <strong>de</strong>l Clustering<br />

El resultado obt<strong>en</strong>ido <strong>en</strong> Rapid-i una vez ejecutado K-Means con 4 clusters, se resume a<br />

continuación.<br />

72<br />

Tab<strong>la</strong> 4.35. Resultados <strong>de</strong>l proceso <strong>de</strong> Clustering.<br />

En primer lug<strong>ar</strong>, y antes <strong>de</strong> analiz<strong>ar</strong> cada cluster por sep<strong>ar</strong>ado, ocurre <strong>en</strong> g<strong>en</strong>eral que<br />

todos los clusters que se forman muestran un nivel <strong>de</strong> instrucción muy bajo: Prim<strong>ar</strong>io<br />

<strong>com</strong>pleto es el más frecu<strong>en</strong>te. Hay que t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta que los principales niveles <strong>de</strong><br />

instrucción <strong>en</strong> <strong>la</strong> base son los sigui<strong>en</strong>tes (muy bajos por cierto):<br />

Tab<strong>la</strong> 4.36. Distribución <strong>de</strong>l Nivel <strong>de</strong> Instrucción.<br />

Por lo tanto, es <strong>de</strong> esper<strong>ar</strong> que <strong>en</strong> todas <strong>la</strong>s corridas <strong>de</strong> clustering, cada uno <strong>de</strong> los<br />

grupos formados t<strong>en</strong>ga un nivel <strong>de</strong> instrucción muy bajo. Muy pocas veces ap<strong>ar</strong>ece<br />

<strong>com</strong>o repres<strong>en</strong>tativo <strong>de</strong> un cluster el nivel secund<strong>ar</strong>io in<strong>com</strong>pleto. Aún así <strong>en</strong>tre<br />

prim<strong>ar</strong>io <strong>com</strong>pleto y secund<strong>ar</strong>io in<strong>com</strong>pleto hay un mínimo paso.<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

4.2.4.2.2.1 Gráficos <strong>de</strong> B<strong>ar</strong>ras p<strong>ar</strong>a el análisis <strong>de</strong> clusters<br />

A través <strong>de</strong> los gráficos <strong>de</strong> b<strong>ar</strong>ras [Figura 4.14] se ayuda a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r <strong>com</strong>o se<br />

distribuy<strong>en</strong> <strong>la</strong>s v<strong>ar</strong>iables <strong>de</strong> los atributos <strong>en</strong>tre los distintos clusters y medir el nivel <strong>de</strong><br />

significancia <strong>de</strong> los mismos. Se espera que si todos los atributos fueran irrelevantes, se<br />

cumpliera <strong>la</strong> distribución <strong>en</strong> cada cluster <strong>de</strong> los atributos según <strong>la</strong> proporción 41%, 16%,<br />

36% y 7%.<br />

Si bi<strong>en</strong> <strong>en</strong> los atributos Nivel <strong>de</strong> Instrucción y Última Resi<strong>de</strong>ncia <strong>la</strong> distribución <strong>en</strong> los<br />

clusters es irrelevante, ya que se cumple <strong>la</strong> proporción 41% rojo (cluster 0) 16% gris<br />

(cluster 1) 36% turquesa (cluster 2) 7% azul (cluster 3), <strong>en</strong> los otros atributos se pue<strong>de</strong>n<br />

<strong>en</strong>contr<strong>ar</strong> interacciones significativas<br />

Figura 4.14. Gráfico <strong>de</strong> B<strong>ar</strong>ras. Distribución <strong>de</strong> <strong>la</strong>s v<strong>ar</strong>iables <strong>de</strong> los atributos <strong>en</strong> los clusters.<br />

Los atributos <strong>en</strong> don<strong>de</strong> se aprecia bu<strong>en</strong>a interacción <strong>en</strong>tre los clusters y <strong>la</strong>s v<strong>ar</strong>iables son<br />

los <strong>de</strong> <strong>de</strong>lito <strong>com</strong>etido, capacitación <strong>la</strong>boral y última situación <strong>la</strong>boral. Se profundiz<strong>ar</strong>á<br />

<strong>en</strong> estos atributos a continuación mediante <strong>la</strong> utilización <strong>de</strong> gráficos <strong>de</strong> dispersión.<br />

Solución Patricio Gutiérrez Rüegg 73


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

4.2.4.2.2.2 Gráficos <strong>de</strong> Dispersión p<strong>ar</strong>a el análisis <strong>de</strong> clusters<br />

En <strong>la</strong> figura 4.15 se observa que mi<strong>en</strong>tras que los <strong>de</strong>litos contra <strong>la</strong> propiedad están<br />

fuertem<strong>en</strong>te conc<strong>en</strong>trados <strong>en</strong> los clusters 0 (72%) y 2 (95%), el cluster 1 pres<strong>en</strong>ta una<br />

gran conc<strong>en</strong>tración <strong>de</strong> individuos que <strong>com</strong>etieron <strong>de</strong>lito contra <strong>la</strong>s personas (95%).<br />

Entre p<strong>ar</strong>éntesis figura <strong>la</strong> frecu<strong>en</strong>cia <strong>de</strong> ocurr<strong>en</strong>cia porc<strong>en</strong>tual <strong>de</strong> cada v<strong>ar</strong>iable <strong>de</strong> los<br />

atributos <strong>de</strong>ntro <strong>de</strong> cada cluster. Con respecto al cluster 3, los <strong>de</strong>litos se <strong>en</strong>cu<strong>en</strong>tran<br />

distribuidos más homogéneam<strong>en</strong>te, si<strong>en</strong>do los <strong>de</strong>litos contra <strong>la</strong> integridad sexual (23%),<br />

estupefaci<strong>en</strong>tes (35%) y personas (26%) los que predominan <strong>en</strong> el mismo. Por lo tanto,<br />

ya se pue<strong>de</strong> t<strong>en</strong>er una primera aproximación a los <strong>de</strong>litos que c<strong>ar</strong>acteriz<strong>ar</strong>ían a cada<br />

grupo.<br />

74<br />

Figura 4.15. Distribución <strong>de</strong> los clusters según Delito Cometido<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

En lo que respecta al atributo última situación <strong>la</strong>boral [Figura 4.16], se observa que los<br />

cluster 1 y cluster 2 están repres<strong>en</strong>tados <strong>en</strong> su mayoría por <strong>la</strong> situación <strong>de</strong> <strong>de</strong>socupado,<br />

con un 65% y 79% respectivam<strong>en</strong>te. Si bi<strong>en</strong> estos dos grupos <strong>la</strong> situación <strong>de</strong><br />

<strong>de</strong>socupado pres<strong>en</strong>ta una gran conc<strong>en</strong>tración, exist<strong>en</strong> instancias que pres<strong>en</strong>tan <strong>en</strong> una<br />

misma proporción <strong>la</strong> situación <strong>de</strong> trabajadores <strong>de</strong> tiempo p<strong>ar</strong>cial y <strong>com</strong>pleto.<br />

En cuanto a los clusters 0 y 3, están mayorm<strong>en</strong>te c<strong>ar</strong>acterizados por trabajadores <strong>de</strong><br />

tiempo p<strong>ar</strong>cial (72% y 65% respectivam<strong>en</strong>te) y <strong>en</strong> m<strong>en</strong>or proporción, <strong>de</strong> tiempo<br />

<strong>com</strong>pleto (23% y 27%).<br />

Figura 4.16. Distribución <strong>de</strong> los clusters según Última Situación Laboral<br />

Solución Patricio Gutiérrez Rüegg 75


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Con respecto a <strong>la</strong> capacitación <strong>la</strong>boral, el cluster 1 y el cluster 2 pres<strong>en</strong>tan una<br />

distribución simi<strong>la</strong>r [Figura 4.17], con una alta conc<strong>en</strong>tración <strong>en</strong> sin oficio ni profesión<br />

(77% y 89%), seguido por oficio y luego profesión. En contraposición, el cluster 0 está<br />

mayorm<strong>en</strong>te po<strong>la</strong>rizado hacia oficio (85%), con una baja pob<strong>la</strong>ción <strong>de</strong> individuos sin<br />

oficio ni profesión (9%) y profesión (6%). Finalm<strong>en</strong>te, <strong>com</strong>o se observa <strong>en</strong> <strong>la</strong> figura<br />

inferior, el cluster 3 se <strong>en</strong>cu<strong>en</strong>tra homogéneam<strong>en</strong>te distribuido p<strong>ar</strong>a este atributo.<br />

76<br />

Figura 4.17. Distribución <strong>de</strong> los clusters según Capacitación Laboral<br />

A continuación se analizan, también con gráficos <strong>de</strong> dispersión, <strong>la</strong>s interacciones <strong>en</strong>tre 2<br />

tipos <strong>de</strong> atributos y los clusters. Con este análisis se busca ir t<strong>en</strong>i<strong>en</strong>do una mejor<br />

interpretación <strong>de</strong> los grupos formados p<strong>ar</strong>a po<strong>de</strong>r luego d<strong>ar</strong> una c<strong>ar</strong>acterización más<br />

<strong>com</strong>pleta <strong>de</strong> los mismos.<br />

Sigui<strong>en</strong>do con <strong>la</strong> serie <strong>de</strong> colores <strong>de</strong> los gráficos anteriores (cluster 0= azul, cluster 1=<br />

rojo, cluster 2= ver<strong>de</strong>, cluster 3= turquesa), se observa una fuerte interacción <strong>en</strong>tre <strong>de</strong>lito<br />

contra <strong>la</strong> propiedad, sin oficio ni profesión y cluster 2 (ver<strong>de</strong>) [Figura 4.18]. Lo mismo<br />

ocurre con el cluster 0 (azul), <strong>de</strong>lito contra <strong>la</strong> propiedad, aunque <strong>en</strong> este caso ap<strong>ar</strong>ece<br />

oficio p<strong>ar</strong>a el atributo capacitación <strong>la</strong>boral. Por lo tanto, ya podríamos difer<strong>en</strong>ci<strong>ar</strong> a<br />

estos dos clusters según el nivel <strong>de</strong> capacitación <strong>la</strong>boral. Mi<strong>en</strong>tras que <strong>en</strong> ambos, los<br />

presos <strong>de</strong>linquieron contra <strong>la</strong> propiedad, <strong>en</strong> el cluster 2 no poseían un oficio ni una<br />

profesión al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong> <strong>de</strong>t<strong>en</strong>ción, mi<strong>en</strong>tras que <strong>en</strong> cluster 0 t<strong>en</strong>ían algún oficio.<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Otra interre<strong>la</strong>ción importante es <strong>la</strong> que se da <strong>en</strong>tre <strong>de</strong>lito contra <strong>la</strong>s personas, no ti<strong>en</strong>e<br />

oficio ni profesión y cluster 1 (rojo). Confirma esto último, que el cluster 1 est<strong>ar</strong>ía<br />

c<strong>ar</strong>acterizado por <strong>de</strong>lincu<strong>en</strong>tes que <strong>de</strong>linquieron contra <strong>la</strong>s personas. Existe, <strong>de</strong> todas<br />

formas, una pequeña interacción <strong>en</strong>tre cluster 0 (azul), <strong>de</strong>lito contra <strong>la</strong>s personas y<br />

oficio.<br />

Con respecto al cluster 3 (turquesa), se observa que <strong>la</strong> interacción <strong>de</strong> <strong>de</strong>lito <strong>de</strong><br />

estupefaci<strong>en</strong>tes y vio<strong>la</strong>ción sexual distribuido homogéneam<strong>en</strong>te <strong>en</strong> oficio y sin oficio ni<br />

profesión, y <strong>en</strong> una pequeña proporción <strong>en</strong> los que ti<strong>en</strong><strong>en</strong> alguna profesión.<br />

Figura 4.18. Interre<strong>la</strong>ción Delito Cometido- Capacitación Laboral-Clusters<br />

En <strong>la</strong> figura 4.19 se <strong>de</strong>staca <strong>la</strong> importante re<strong>la</strong>ción que hay <strong>en</strong>tre <strong>de</strong>lito contra <strong>la</strong><br />

propiedad, <strong>de</strong>socupado, y cluster 2 (ver<strong>de</strong>). El cluster 0 (azul) está interre<strong>la</strong>cionado <strong>en</strong><br />

mayor medida con trabajo <strong>de</strong> tiempo <strong>com</strong>pleto y <strong>de</strong> tiempo p<strong>ar</strong>cial.<br />

Se pue<strong>de</strong> observ<strong>ar</strong> interacción <strong>en</strong>tre <strong>de</strong>litos contra <strong>la</strong>s personas, <strong>de</strong>socupado y cluster 2<br />

(rojo). Aún así, también se observan algunas interre<strong>la</strong>ciones <strong>en</strong>tre este último cluster,<br />

personas, y trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial y <strong>de</strong> tiempo <strong>com</strong>pleto.<br />

Con respecto al cluster 3 (turquesa), se observa interacción <strong>de</strong> <strong>de</strong>lito <strong>de</strong> estupefaci<strong>en</strong>tes<br />

y vio<strong>la</strong>ción sexual distribuido mayorm<strong>en</strong>te <strong>en</strong> trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial y <strong>en</strong> m<strong>en</strong>or<br />

proporción trabajo <strong>de</strong> tiempo <strong>com</strong>pleto.<br />

Solución Patricio Gutiérrez Rüegg 77


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

78<br />

Figura 4.19. Interre<strong>la</strong>ción Delito Cometido- Última Situación Laboral-Clusters<br />

Es importante mostr<strong>ar</strong> mediante <strong>la</strong> gráfica <strong>de</strong> <strong>la</strong> figura 4.20, que <strong>la</strong> mayoría <strong>de</strong> los<br />

<strong>de</strong>litos son <strong>com</strong>etidos por personas con un nivel <strong>de</strong> instrucción bajo. Exist<strong>en</strong> muy pocos<br />

casos <strong>en</strong> los que los que hayan <strong>com</strong>etido <strong>de</strong>litos sean personas con niveles <strong>de</strong> educación<br />

superior al secund<strong>ar</strong>io <strong>com</strong>pleto.<br />

Figura 4.20. Interre<strong>la</strong>ción Delito Cometido- Nivel <strong>de</strong> Instrucción-Clusters<br />

Patricio Gutiérrez Rüegg Solución


4.2.4.2.2.3 Interpretación <strong>de</strong> los clusters<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

En base a <strong>la</strong> información que surge tanto <strong>de</strong>l análisis <strong>de</strong> los gráficos anteriores <strong>com</strong>o <strong>de</strong><br />

<strong>la</strong> investigación <strong>en</strong> el tema y consulta con especialistas, se da una primera interpretación<br />

<strong>de</strong> cada cluster formado.<br />

Es muy conv<strong>en</strong>i<strong>en</strong>te <strong>de</strong>stac<strong>ar</strong>, según lo hab<strong>la</strong>do con especialistas, que c<strong>la</strong>ram<strong>en</strong>te p<strong>ar</strong>a<br />

po<strong>de</strong>r realiz<strong>ar</strong> un análisis más profundo y exacto, habría que t<strong>en</strong>er acceso a <strong>la</strong> historia<br />

individual <strong>de</strong> cada uno, <strong>com</strong>o lo es conocer el orig<strong>en</strong> famili<strong>ar</strong> y cultural. Sin emb<strong>ar</strong>go,<br />

se cree que mediante el pres<strong>en</strong>te estudio se pue<strong>de</strong> d<strong>ar</strong> una muy bu<strong>en</strong>a aproximación.<br />

A continuación se pres<strong>en</strong>ta el análisis <strong>de</strong> cada uno <strong>de</strong> los clusters formados.<br />

Interpretación Cluster 0<br />

1600<br />

1400<br />

1200<br />

1000<br />

800<br />

600<br />

400<br />

200<br />

• Tamaño <strong>de</strong>l cluster: 16849 (41% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />

• Edad Promedio = 31 años.<br />

• Delito Cometido = Delitos contra <strong>la</strong> propiedad (90% <strong>de</strong> Robo y/o T<strong>en</strong>tativa <strong>de</strong><br />

robo).<br />

• Estado Civil = Soltero (73% <strong>de</strong>l cluster).<br />

• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (54%, 40% restante <strong>en</strong>tre ninguno y<br />

Sec. In<strong>com</strong>pleto).<br />

• Última Situación Laboral = Trabajo tiempo P<strong>ar</strong>cial (72% <strong>de</strong>l cluster, 23% <strong>de</strong><br />

tiempo <strong>com</strong>pleto).<br />

• Capacitación Laboral = Poseían algún oficio (85% <strong>de</strong>l cluster).<br />

• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (90% <strong>de</strong>l cluster).<br />

Promedio = 31<br />

Distribución <strong>de</strong> eda<strong>de</strong>s.<br />

Cluster 0<br />

0<br />

10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />

Figura 4.21. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 0.<br />

Solución Patricio Gutiérrez Rüegg 79


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Se observa un cluster <strong>de</strong> solteros <strong>en</strong> cual el promedio <strong>de</strong> edad es <strong>de</strong> 31 años [Figura<br />

4.21]. El nivel <strong>de</strong> instrucción que predomina es <strong>de</strong> prim<strong>ar</strong>io <strong>com</strong>pleto, aunque <strong>la</strong><br />

distribución <strong>de</strong>l nivel <strong>de</strong> instrucción <strong>de</strong>l resto <strong>de</strong> <strong>la</strong> pob<strong>la</strong>ción <strong>de</strong>l cluster es muy pobre<br />

también. Son personas, <strong>en</strong> su mayoría, trabajadoras <strong>de</strong> tiempo p<strong>ar</strong>cial y que poseían<br />

algún oficio previo al ingreso al establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Aún así, <strong>de</strong>linquieron<br />

contra <strong>la</strong> propiedad, g<strong>en</strong>eralm<strong>en</strong>te <strong>de</strong>litos <strong>de</strong> robo y/o t<strong>en</strong>tativa <strong>de</strong> robo.<br />

P<strong>ar</strong>a que se <strong>com</strong>eta el <strong>de</strong>lito <strong>de</strong> robo concurr<strong>en</strong> difer<strong>en</strong>tes factores y múltiples<br />

circunstancias individuales. En este caso, lo más probable es que se tratándose <strong>de</strong><br />

personas que t<strong>en</strong>i<strong>en</strong>do algún trabajo p<strong>ar</strong>cial o también l<strong>la</strong>madas “changas” puedan<br />

junt<strong>ar</strong> algo <strong>de</strong> p<strong>la</strong>ta p<strong>ar</strong>a cubrir algunas <strong>de</strong> sus necesida<strong>de</strong>s básicas. El resto, lo obti<strong>en</strong><strong>en</strong><br />

robando. Aún si<strong>en</strong>do solteros <strong>en</strong> su mayoría, muchas veces ti<strong>en</strong><strong>en</strong> v<strong>ar</strong>ios hijos, lo que<br />

ac<strong>en</strong>túa <strong>la</strong> necesidad <strong>de</strong> salir a rob<strong>ar</strong>. Pero no se pue<strong>de</strong> <strong>de</strong>j<strong>ar</strong> <strong>de</strong> advertir, que no se <strong>de</strong>be<br />

únicam<strong>en</strong>te a una “necesidad m<strong>ar</strong>cada”, sino que el robo probablem<strong>en</strong>te se <strong>de</strong>ba a otros<br />

factores <strong>com</strong>o <strong>la</strong> exclusión <strong>de</strong>l trabajo formal, <strong>la</strong> exclusión social, <strong>de</strong> salud, <strong>de</strong><br />

educación, <strong>de</strong> vivi<strong>en</strong>da, <strong>de</strong> p<strong>ar</strong>ticipación social, sumado a haber crecido <strong>en</strong> medios<br />

hostiles <strong>en</strong> que los <strong>de</strong>litos <strong>de</strong> robo y viol<strong>en</strong>cia no les eran aj<strong>en</strong>o. Estos factores, muchas<br />

veces se traduc<strong>en</strong> <strong>en</strong> una vio<strong>la</strong>ción a <strong>la</strong> propiedad aj<strong>en</strong>a.<br />

A <strong>la</strong> edad promedio <strong>de</strong> 31 años, muchos <strong>de</strong> estos <strong>de</strong>t<strong>en</strong>idos son reinci<strong>de</strong>ntes. Heredan <strong>la</strong><br />

cultura <strong>de</strong>l robo, y no pue<strong>de</strong>n <strong>de</strong>spr<strong>en</strong><strong>de</strong>rse <strong>de</strong> el<strong>la</strong>, lo que los lleva a <strong>de</strong>linquir aún<br />

cuando ti<strong>en</strong><strong>en</strong> algún tipo <strong>de</strong> oficio y trabajo. A su vez, ocurre que trabajan g<strong>en</strong>eralm<strong>en</strong>te<br />

<strong>en</strong> negro, por lo cual estos trabajos <strong>de</strong> tiempo p<strong>ar</strong>cial pue<strong>de</strong>n lleg<strong>ar</strong> a ser muy inestables<br />

sufri<strong>en</strong>do <strong>de</strong>spidos prematuros e imprevistos.<br />

Posible solución al problema:<br />

Al ser g<strong>en</strong>te que ti<strong>en</strong>e una educación pobre, sin duda que habría que hacerse hincapié <strong>en</strong><br />

este s<strong>en</strong>tido. No es una c<strong>ar</strong>acterística importante <strong>en</strong> este grupo el <strong>de</strong>sempleo, ya que solo<br />

un 4% se <strong>en</strong>cu<strong>en</strong>tra <strong>en</strong> el estado <strong>de</strong> <strong>de</strong>socupación total. Una forma <strong>de</strong> fom<strong>en</strong>t<strong>ar</strong> <strong>la</strong><br />

educación <strong>en</strong>tre familias <strong>de</strong> bajos recursos es mediante <strong>la</strong> implem<strong>en</strong>tación <strong>de</strong> un eficaz<br />

sistema <strong>de</strong> becas (ocurre <strong>en</strong> Brasil) que premie el esfuerzo y calificaciones y que<br />

permita que <strong>la</strong>s personas no <strong>de</strong>j<strong>en</strong> sus estudios secund<strong>ar</strong>ios p<strong>ar</strong>a salir a trabaj<strong>ar</strong>.<br />

Al mismo tiempo se los pue<strong>de</strong> instruir <strong>en</strong> algún otro oficio p<strong>ar</strong>a que t<strong>en</strong>gan distintas<br />

salidas y estén el mayor tiempo <strong>de</strong>l día ocupados. Es fundam<strong>en</strong>tal que se les <strong>de</strong> a este<br />

grupo <strong>de</strong> personas seguridad <strong>en</strong> sus trabajos, p<strong>ar</strong>a que no t<strong>en</strong>gan que recurrir al robo<br />

<strong>com</strong>o única salida al <strong>de</strong>sempleo.<br />

80<br />

Patricio Gutiérrez Rüegg Solución


Interpretación Cluster1<br />

500<br />

450<br />

400<br />

350<br />

300<br />

250<br />

200<br />

150<br />

100<br />

50<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

• Tamaño <strong>de</strong>l cluster: 6513 (16% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />

• Edad Promedio = 34 años.<br />

• Delito Cometido = Delitos contra <strong>la</strong>s Personas (86% <strong>de</strong>l cluster).<br />

Delitos contra <strong>la</strong>s Personas %<br />

Homicidios dolosos 63%<br />

Otros <strong>de</strong>litos contra <strong>la</strong>s personas 17%<br />

Homicidios dolosos (t<strong>en</strong>tativa.) 7%<br />

Homicidios Culposos 6%<br />

Lesiones Dolosas 4%<br />

Lesiones Culposas 1%<br />

Total 100%<br />

Tab<strong>la</strong> 4.37. Apertura <strong>de</strong> Delitos contra <strong>la</strong>s Personas<br />

• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (54%, 42% restante <strong>en</strong>tre ninguno y<br />

Sec. In<strong>com</strong>pleto).<br />

• Estado Civil = Soltero (76%).<br />

• Última Situación Laboral = Desocupado (65%).<br />

• Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión (77%).<br />

• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (85%).<br />

Promedio = 34<br />

Distribución <strong>de</strong> eda<strong>de</strong>s<br />

Pico = 38, Posible Outlier<br />

Cluster 1<br />

0<br />

10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />

Figura 4.22. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 1.<br />

Personas <strong>de</strong> mayor edad que <strong>la</strong> <strong>de</strong>l cluster 0 (promedio <strong>de</strong> 34 y pico <strong>de</strong> 38) [Figura<br />

4.22], con pobre formación educativa y solteros. Totalm<strong>en</strong>te <strong>de</strong>socupados y sin oficio<br />

ni profesión alguna.<br />

Se cree que <strong>la</strong> <strong>de</strong>sesperación <strong>de</strong>l no “hacer nada” (mayoría <strong>de</strong>socupados) sumado a<br />

“nada que pe<strong>de</strong>r” (mayoría solteros), conjuntam<strong>en</strong>te con los problemas que estos<br />

individuos pue<strong>de</strong>n pa<strong>de</strong>cer, los llevo a <strong>com</strong>eter algún <strong>de</strong>lito contra <strong>la</strong>s personas. En un<br />

Solución Patricio Gutiérrez Rüegg 81


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ámbito <strong>de</strong> viol<strong>en</strong>cia social <strong>com</strong>o el que se vive hoy <strong>en</strong> día, este tipo <strong>de</strong> personas pier<strong>de</strong><br />

el valor <strong>de</strong> <strong>la</strong> vida, y día tras día ti<strong>en</strong><strong>en</strong> m<strong>en</strong>os esperanzas <strong>de</strong> conseguir algún trabajo<br />

<strong>de</strong>bido a <strong>la</strong> edad y a <strong>la</strong> nu<strong>la</strong> formación profesional. Las drogas, el alcohol y el fácil<br />

acceso a <strong>la</strong>s <strong>ar</strong>mas, son actores principales <strong>en</strong> este tipo <strong>de</strong> grupo. Podría trat<strong>ar</strong>se,<br />

también, <strong>de</strong> homicidios <strong>en</strong> ocasión <strong>de</strong> robo.<br />

Hay una muy pequeña proporción <strong>de</strong> personas mayores a 33 años que se <strong>en</strong>cu<strong>en</strong>tra con<br />

un trabajo <strong>de</strong> tiempo <strong>com</strong>pleto/p<strong>ar</strong>cial y algún oficio o profesión. Aún así, <strong>de</strong>linqu<strong>en</strong><br />

contra <strong>la</strong>s personas. Sin lug<strong>ar</strong> a duda, que <strong>en</strong> estos <strong>de</strong>litos p<strong>en</strong>ales <strong>com</strong>o el homicidio y<br />

<strong>la</strong>s lesiones, siempre juega el factor psicológico <strong>de</strong>l agresor, y los altos niveles <strong>de</strong><br />

viol<strong>en</strong>cia que se percib<strong>en</strong> <strong>en</strong> <strong>la</strong>s escue<strong>la</strong>s, vía pública, ev<strong>en</strong>tos <strong>de</strong>portivos y <strong>de</strong>s<strong>de</strong> luego<br />

<strong>de</strong> <strong>la</strong> viol<strong>en</strong>cia famili<strong>ar</strong>. O sea, <strong>la</strong> falta <strong>de</strong> trabajo no es siempre condición neces<strong>ar</strong>ia p<strong>ar</strong>a<br />

que una persona <strong>com</strong>eta un homicidio.<br />

En principio, al pres<strong>en</strong>te cluster se lo i<strong>de</strong>ntific<strong>ar</strong>ía con <strong>la</strong>s personas que <strong>com</strong>et<strong>en</strong> <strong>de</strong>litos<br />

contra <strong>la</strong>s personas <strong>de</strong> cualquier tipo (mayorm<strong>en</strong>te homicidios dolosos), asociados con<br />

<strong>la</strong> exclusión total a un régim<strong>en</strong> <strong>la</strong>boral.<br />

Posibles soluciones al problema:<br />

Programas <strong>de</strong> inclusión, reinserción y capacitación <strong>la</strong>boral p<strong>ar</strong>a g<strong>en</strong>te mayor. Es<br />

neces<strong>ar</strong>io que a este grupo <strong>de</strong> personas se les puedan brind<strong>ar</strong> una oportunidad <strong>de</strong> obt<strong>en</strong>er<br />

un trabajo digno.<br />

A su vez, habría que prest<strong>ar</strong>le más at<strong>en</strong>ción a los casos <strong>de</strong> viol<strong>en</strong>cia doméstica, <strong>la</strong>boral,<br />

<strong>de</strong> vecindad, etc. De esta forma, se quiere trat<strong>ar</strong> <strong>de</strong> advertir <strong>la</strong> viol<strong>en</strong>cia pres<strong>en</strong>te y<br />

ofrecer cont<strong>en</strong>ción y ayuda a los agresores antes que <strong>la</strong> viol<strong>en</strong>cia crezca hasta<br />

convertirse <strong>en</strong> homicidio.<br />

Interpretación Cluster 2<br />

82<br />

• Tamaño <strong>de</strong>l cluster: 14662 (36% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />

• Edad Promedio = 27 años.<br />

• Delito Cometido = Delitos contra <strong>la</strong> propiedad (92% <strong>de</strong> Robo y/o T<strong>en</strong>tativa <strong>de</strong><br />

robo).<br />

• Estado Civil = Soltero (80% <strong>de</strong>l cluster).<br />

• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (55%, 42% restante <strong>en</strong>tre ninguno y<br />

Sec. In<strong>com</strong>pleto).<br />

• Última Situación Laboral = Desocupado (79% <strong>de</strong>l cluster, 14% trabajo<br />

p<strong>ar</strong>cial).<br />

• Capacitación Laboral = No t<strong>en</strong>ía oficio ni profesión (89% <strong>de</strong>l cluster).<br />

Patricio Gutiérrez Rüegg Solución


1600<br />

1400<br />

1200<br />

1000<br />

800<br />

600<br />

400<br />

200<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (88% <strong>de</strong>l cluster).<br />

Promedio = 27<br />

Distribución <strong>de</strong> eda<strong>de</strong>s<br />

Cluster 2<br />

0<br />

10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />

Figura 4.23. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 2.<br />

Este cluster ti<strong>en</strong>e <strong>la</strong> letal <strong>com</strong>binación <strong>de</strong> agrup<strong>ar</strong> a personas jóv<strong>en</strong>es <strong>de</strong> <strong>en</strong>tre 20 y 30<br />

años, <strong>en</strong> su mayoría solteras (80%), con un nivel <strong>de</strong> instrucción bajísimo (sólo el 55%<br />

concluyó los estudios prim<strong>ar</strong>ios) junto a una muy alta taza <strong>de</strong> <strong>de</strong>sempleo (79%<br />

<strong>de</strong>socupado y 14 % trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial). Es <strong>de</strong>cir, se está hab<strong>la</strong>ndo <strong>de</strong> que un 93%<br />

<strong>de</strong> estas personas jóv<strong>en</strong>es no posee un trabajo formal <strong>de</strong> jornada <strong>com</strong>pleta. Esto último,<br />

sumado a <strong>la</strong> c<strong>ar</strong><strong>en</strong>cia <strong>de</strong> un oficio u profesión, coloca a esta pob<strong>la</strong>ción <strong>com</strong>o un gran<br />

riesgo: sin fu<strong>en</strong>te <strong>de</strong> ingresos y dificulta<strong>de</strong>s p<strong>ar</strong>a reinsert<strong>ar</strong>se <strong>la</strong>boralm<strong>en</strong>te no resulta<br />

extraño que el <strong>de</strong>lito que <strong>com</strong>et<strong>en</strong> es contra <strong>la</strong> propiedad.<br />

A su vez, <strong>la</strong> muy pequeña proporción <strong>de</strong> estos jóv<strong>en</strong>es individuos que ti<strong>en</strong><strong>en</strong> algún<br />

oficio o profesión, <strong>la</strong>m<strong>en</strong>tablem<strong>en</strong>te no poseía trabajo al mom<strong>en</strong>to <strong>de</strong> <strong>la</strong> <strong>de</strong>t<strong>en</strong>ción, lo<br />

que podría ser <strong>la</strong> causante que los haya llevado a <strong>de</strong>linquir contra <strong>la</strong> propiedad.<br />

Este cluster est<strong>ar</strong>ía i<strong>de</strong>ntificado con el estado <strong>de</strong> se<strong>de</strong>nt<strong>ar</strong>ismo <strong>de</strong> los jóv<strong>en</strong>es que se<br />

<strong>en</strong>cu<strong>en</strong>tran ap<strong>ar</strong>tados <strong>de</strong>l <strong>com</strong>ún <strong>de</strong> <strong>la</strong> g<strong>en</strong>te, y no ti<strong>en</strong><strong>en</strong> acceso <strong>en</strong> primer lug<strong>ar</strong> a una<br />

educación formal que les ayu<strong>de</strong> a abrirles <strong>la</strong>s puertas <strong>de</strong>l ámbito <strong>la</strong>boral.<br />

Importante t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta que es uno <strong>de</strong> los clusters más gran<strong>de</strong>s junto con el cluster 0<br />

y más preocupantes aún por trat<strong>ar</strong>se <strong>de</strong> g<strong>en</strong>te jov<strong>en</strong>.<br />

Posible solución:<br />

Este grupo <strong>de</strong> g<strong>en</strong>te todavía esta a tiempo <strong>de</strong> cambi<strong>ar</strong> y t<strong>en</strong>er una vida digna fuera <strong>de</strong> <strong>la</strong>s<br />

drogas y cárceles. Efici<strong>en</strong>tes políticas <strong>de</strong> estado, <strong>com</strong>o programas int<strong>en</strong>sivos <strong>de</strong><br />

educación formal y capacitación <strong>la</strong>boral es una posible solución p<strong>ar</strong>a esta futura<br />

g<strong>en</strong>eración <strong>de</strong>l país.<br />

Solución Patricio Gutiérrez Rüegg 83


160<br />

140<br />

120<br />

100<br />

80<br />

60<br />

40<br />

20<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Interpretación Cluster 3<br />

84<br />

• Tamaño <strong>de</strong>l cluster: 2904 (7% <strong>de</strong>l total <strong>de</strong> <strong>la</strong> muestra).<br />

• Edad Promedio = 43 años<br />

• Delito Cometido = Estupefaci<strong>en</strong>tes + Integridad Sexual (60%)<br />

Delitos Cometidos Cluster 3 %<br />

Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes) 35%<br />

Delitos contra <strong>la</strong>s personas 26%<br />

Delitos contra <strong>la</strong> integridad sexual y el Honor 23%<br />

Delitos contra <strong>la</strong> propiedad 15%<br />

Total 100%<br />

Tab<strong>la</strong> 4.38. Delitos Cluster 3.<br />

• Estado Civil = Casados (72% <strong>de</strong>l cluster).<br />

• Nivel <strong>de</strong> Instrucción = Prim<strong>ar</strong>io Completo (47%, 50% restante <strong>en</strong>tre ninguno y<br />

Sec. In<strong>com</strong>pleto, 3% con nivel alto <strong>de</strong> educación).<br />

• Última Situación Laboral = Trabajo Tiempo p<strong>ar</strong>cial (65% <strong>de</strong>l cluster, 27%<br />

trabajo tiempo <strong>com</strong>pleto).<br />

• Capacitación Laboral = No ti<strong>en</strong>e oficio ni Profesión (47% <strong>de</strong>l cluster).<br />

Capacitación Laboral %<br />

No ti<strong>en</strong>e ni oficio ni profesión 47%<br />

Ti<strong>en</strong>e algún oficio 34%<br />

Ti<strong>en</strong>e alguna profesión 20%<br />

Total 100%<br />

Tab<strong>la</strong> 4.39. Capacitación Laboral Cluster 3.<br />

• Último lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia = Urbana (89% <strong>de</strong>l cluster).<br />

Promedio = 44<br />

Distribución <strong>de</strong> eda<strong>de</strong>s<br />

Cluster 3<br />

0<br />

10 16 20 24 28 32 36 40 44 48 52 56 60 64 68 72 76 80 84<br />

Figura 4.24. Distribución <strong>de</strong> eda<strong>de</strong>s Cluster 3.<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Se trata <strong>de</strong>l cluster con m<strong>en</strong>or cantidad <strong>de</strong> instancias y al mismo tiempo el más difícil <strong>de</strong><br />

analiz<strong>ar</strong> <strong>de</strong>bido a sus distintas v<strong>ar</strong>iantes y reg<strong>la</strong>s.<br />

Sin duda, no son los <strong>de</strong>litos contra <strong>la</strong> propiedad los que m<strong>ar</strong>can a este cluster. Los<br />

<strong>de</strong>litos que predominan son el <strong>de</strong> vio<strong>la</strong>ción, tráfico <strong>de</strong> drogas y contra <strong>la</strong>s personas<br />

(totalizan el 85%).<br />

Está repres<strong>en</strong>tado por g<strong>en</strong>te <strong>de</strong> mayor edad que los anteriores, con una media <strong>de</strong> 43<br />

años, <strong>en</strong> don<strong>de</strong> <strong>la</strong> mayoría (73%) esta casada y nuevam<strong>en</strong>te el nivel <strong>de</strong> instrucción es<br />

muy bajo. Estos individuos poseían algún trabajo <strong>de</strong> tiempo p<strong>ar</strong>cial (56%) y <strong>de</strong> tiempo<br />

<strong>com</strong>pleto (27%) y su capacitación <strong>la</strong>boral se <strong>en</strong>cu<strong>en</strong>tra dividida <strong>en</strong>tre <strong>la</strong>s 3 categorías.<br />

En este cluster se pue<strong>de</strong>n observ<strong>ar</strong> distintas c<strong>ar</strong>acterísticas <strong>en</strong>tre los <strong>de</strong>t<strong>en</strong>idos, si<strong>en</strong>do el<br />

nivel <strong>de</strong> capacitación <strong>la</strong>boral el punto <strong>de</strong> p<strong>ar</strong>tida <strong>en</strong> el árbol <strong>de</strong> <strong>de</strong>cisión.<br />

• Ti<strong>en</strong><strong>en</strong> oficio/profesión y trabajan p<strong>ar</strong>cialm<strong>en</strong>te o <strong>com</strong>pletam<strong>en</strong>te, mayores a<br />

33/38 años. Sin emb<strong>ar</strong>go <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong>s personas, vio<strong>la</strong>n y trafican drogas.<br />

G<strong>en</strong>eralm<strong>en</strong>te están casados o viv<strong>en</strong> <strong>en</strong> concubinato.<br />

• Los que no ti<strong>en</strong><strong>en</strong> oficio ni profesión, y <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong> integridad sexual y<br />

el honor y estupefaci<strong>en</strong>tes. En este caso, también g<strong>en</strong>eralm<strong>en</strong>te están casados.<br />

Como se <strong>com</strong><strong>en</strong>ta más <strong>ar</strong>riba, es difícil con esta información establecer algún patrón <strong>en</strong><br />

este cluster. Se <strong>de</strong>bería t<strong>en</strong>er acceso, por ejemplo, a más información re<strong>la</strong>cionada con<br />

los oríg<strong>en</strong>es <strong>de</strong> estas personas. Sin emb<strong>ar</strong>go, al realiz<strong>ar</strong> <strong>la</strong>s corridas <strong>de</strong> inducción, se<br />

<strong>en</strong>cu<strong>en</strong>tran reg<strong>la</strong>s interesantes.<br />

Se observa que los que <strong>com</strong>et<strong>en</strong> <strong>de</strong>litos contra <strong>la</strong> integridad sexual, <strong>en</strong> su amplia<br />

mayoría vio<strong>la</strong>ción, g<strong>en</strong>eralm<strong>en</strong>te son personas casadas, mayores a los 32 años y que<br />

poseían trabajo y oficio <strong>en</strong> muchos casos. Se trata <strong>de</strong> personas <strong>en</strong>fermas, muchas veces<br />

con <strong>de</strong>sór<strong>de</strong>nes psicológicos y físicos, con personalida<strong>de</strong>s psicópatas y perversas. Estos<br />

agresores ti<strong>en</strong><strong>en</strong> patrones <strong>de</strong> <strong>com</strong>portami<strong>en</strong>to y <strong>de</strong> personalidad difer<strong>en</strong>tes a cualquier<br />

otro autor <strong>de</strong> otros <strong>de</strong>litos. Es difícil, por lo tanto, logr<strong>ar</strong> prev<strong>en</strong>ir este tipo <strong>de</strong> <strong>de</strong>lito, ya<br />

que suele ser muy <strong>com</strong>plicado <strong>de</strong>tect<strong>ar</strong> a un pot<strong>en</strong>cial vio<strong>la</strong>dor.<br />

No se pue<strong>de</strong> <strong>de</strong>j<strong>ar</strong> <strong>de</strong> ac<strong>la</strong>r<strong>ar</strong> que <strong>la</strong> mayoría <strong>de</strong> los casos <strong>de</strong> abuso sexual,<br />

especialm<strong>en</strong>te los que ti<strong>en</strong><strong>en</strong> <strong>com</strong>o víctima a niños y niñas, ocurr<strong>en</strong> <strong>de</strong>ntro <strong>de</strong>l hog<strong>ar</strong>, y<br />

los victim<strong>ar</strong>ios suel<strong>en</strong> ser los padres, padrastros, abuelos o tíos. Hace falta <strong>de</strong>rrib<strong>ar</strong> el<br />

mito <strong>de</strong> que el peligro está afuera, ya que si bi<strong>en</strong> hay casos, por ejemplo, <strong>de</strong> m<strong>en</strong>ores<br />

vio<strong>la</strong>dos por <strong>de</strong>sconocidos que los sorpr<strong>en</strong><strong>de</strong>n <strong>en</strong> <strong>la</strong> vía pública, <strong>la</strong> mayoría <strong>de</strong> los<br />

casos son intrafamili<strong>ar</strong>es [La<strong>la</strong>urette, 2008].<br />

Solución Patricio Gutiérrez Rüegg 85


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

P<strong>ar</strong>a estos casos es neces<strong>ar</strong>io, que el tema <strong>de</strong> los abusos sexuales <strong>de</strong>je <strong>de</strong> ser un tema<br />

tabú, que los habitantes tomemos conci<strong>en</strong>cia <strong>de</strong> este f<strong>la</strong>gelo que existe <strong>en</strong> <strong>la</strong> sociedad y<br />

que <strong>en</strong> <strong>la</strong> mayoría <strong>de</strong> los casos se da <strong>de</strong>ntro <strong>de</strong> <strong>la</strong>s familias. Es neces<strong>ar</strong>io ac<strong>en</strong>tu<strong>ar</strong> <strong>la</strong><br />

prev<strong>en</strong>ción, y <strong>en</strong> el tratami<strong>en</strong>to <strong>de</strong> los agresores y víctimas.<br />

En cuanto a los que p<strong>ar</strong>ticipan <strong>en</strong> <strong>de</strong>litos <strong>de</strong> estupefaci<strong>en</strong>tes, que conforman el 35 % <strong>de</strong><br />

este cluster, nos <strong>en</strong>contramos con g<strong>en</strong>te que siempre ti<strong>en</strong>e algún tipo <strong>de</strong> trabajo y <strong>en</strong><br />

muchas ocasiones oficio o profesión. El <strong>de</strong>lito <strong>de</strong> los estupefaci<strong>en</strong>tes es difer<strong>en</strong>te a los<br />

<strong>de</strong>más <strong>de</strong>litos p<strong>en</strong>ales. Des<strong>de</strong> ya no es lo mismo un n<strong>ar</strong>cotraficante que un poseedor <strong>de</strong><br />

drogas p<strong>ar</strong>a consumo personal, por lo cual merecerán una diversa at<strong>en</strong>ción. En el último<br />

caso, el <strong>de</strong> consumo personal, muchas veces se trata <strong>de</strong> g<strong>en</strong>te que ti<strong>en</strong>e una adicción,<br />

que at<strong>en</strong>ta contra <strong>la</strong> posibilidad que ti<strong>en</strong>e un sujeto normal <strong>de</strong> <strong>com</strong>pr<strong>en</strong><strong>de</strong>r que está<br />

quebrantando <strong>la</strong> ley. Es por ello, que <strong>en</strong> algunos países, l<strong>en</strong>tam<strong>en</strong>te se está avanzando <strong>en</strong><br />

<strong>la</strong> <strong>de</strong>sp<strong>en</strong>alización <strong>de</strong> este <strong>de</strong>lito.<br />

4.2.4.2.3 Selección <strong>de</strong> Atributos<br />

Rapid-i cu<strong>en</strong>ta con una serie <strong>de</strong> métodos p<strong>ar</strong>a realiz<strong>ar</strong> una preselección <strong>de</strong> los atributos<br />

que serán utilizados posteriorm<strong>en</strong>te <strong>en</strong> los algoritmos <strong>de</strong> inducción o c<strong>la</strong>sificación. Tal<br />

<strong>com</strong>o se <strong>com</strong><strong>en</strong>tó al <strong>com</strong>i<strong>en</strong>zo <strong>de</strong>l pres<strong>en</strong>te ap<strong>ar</strong>tado, se utilizan métodos <strong>de</strong> filtros y<br />

<strong>en</strong>volv<strong>en</strong>tes (wrappers).<br />

4.2.4.2.3.1 Filtros<br />

Complem<strong>en</strong>tando lo dicho <strong>en</strong> el estado <strong>de</strong> <strong>la</strong> cuestión, se basan <strong>en</strong> <strong>la</strong> i<strong>de</strong>a <strong>de</strong> d<strong>ar</strong> una<br />

calidad <strong>de</strong> los atributos. Se suel<strong>en</strong> aplic<strong>ar</strong> haci<strong>en</strong>do un ranking <strong>de</strong> atributos.<br />

A continuación se muestran los métodos <strong>de</strong> filtros aplicados con sus respectivos<br />

resultados <strong>en</strong> forma <strong>de</strong> ranking <strong>de</strong> atributos.<br />

86<br />

GainRatioAttributeEval InfoGainAttributeEval<br />

Attribute Weight Attribute Weight<br />

Capacitacion Laboral 0.405 Capacitacion Laboral 0.540<br />

Delito Cometido 0.366 Delito Cometido 0.512<br />

Ultima Situacion Laboral 0.291 Ultima Situacion Laboral 0.432<br />

Estado Civil 0.105 Edad 0.168<br />

Edad 0.054 Estado Civil 0.139<br />

Nivel_Instr_Summ 0.007 Nivel_Instr_Summ 0.012<br />

Ultima Resi<strong>de</strong>ncia 0.004 Ultima Resi<strong>de</strong>ncia 0.002<br />

Tab<strong>la</strong> 4.40. Ranking <strong>de</strong> Atributos Tab<strong>la</strong> 4.41. Ranking <strong>de</strong> Atributos<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ReliefFAttributeEval<br />

ChiSqu<strong>ar</strong>edAttributeEval<br />

Attribute Weight Attribute Weight<br />

Delito Cometido 0.365 Delito Cometido 28429.192<br />

Capacitacion Laboral 0.352 Capacitacion Laboral 26250.296<br />

Ultima Situacion Laboral 0.309 Ultima Situacion Laboral 21184.971<br />

Estado Civil 0.070 Estado Civil 11536.309<br />

Edad 0.042 Edad 10607.634<br />

Ultima Resi<strong>de</strong>ncia -0.001 Nivel_Instr_Summ 748.152<br />

Nivel_Instr_Summ -0.005 Ultima Resi<strong>de</strong>ncia 135.467<br />

Tab<strong>la</strong> 4.42. Ranking <strong>de</strong> Atributos Tab<strong>la</strong> 4.43. Ranking <strong>de</strong> Atributos<br />

Se pue<strong>de</strong> ver que mediante los 4 métodos <strong>de</strong> selección <strong>de</strong> atributos se confirma lo dicho<br />

anteriorm<strong>en</strong>te sobre <strong>la</strong> poca relevancia <strong>en</strong> los clusters que ti<strong>en</strong><strong>en</strong> los atributos Última<br />

Resi<strong>de</strong>ncia y Nivel <strong>de</strong> Instrucción. Sin emb<strong>ar</strong>go, cada uno <strong>de</strong> los métodos sugirió que no<br />

se <strong>de</strong>sc<strong>ar</strong>t<strong>ar</strong>a a ninguno <strong>de</strong> ellos.<br />

4.2.4.2.3.2 Wrappers<br />

Este método seleccionan los atributos <strong>en</strong> función <strong>de</strong> <strong>la</strong> calidad <strong>de</strong>l mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong><br />

datos asociado a los atributos utilizados.<br />

Se utiliza el WrapperSubsetEval y <strong>com</strong>o c<strong>la</strong>sificador al algoritmo J48. El resultado <strong>de</strong>l<br />

mismo sugirió <strong>la</strong> exclusión <strong>de</strong>l atributo Nivel <strong>de</strong> Instrucción. Sin emb<strong>ar</strong>go, se cree<br />

conv<strong>en</strong>i<strong>en</strong>te continu<strong>ar</strong> con <strong>la</strong> c<strong>la</strong>sificación utilizando a dicho atributo <strong>de</strong>bido a que<br />

ninguno <strong>de</strong> los métodos por filtros lo <strong>de</strong>sc<strong>ar</strong>tó.<br />

4.2.4.2.4 C<strong>la</strong>sificación<br />

P<strong>ar</strong>a <strong>la</strong> c<strong>la</strong>sificación se utilizan los algoritmos C4.5 y CHAID. Se esperaba que cada<br />

algoritmo <strong>en</strong> p<strong>ar</strong>ticu<strong>la</strong>r <strong>ar</strong>roj<strong>ar</strong>a reg<strong>la</strong>s distintas. Sin emb<strong>ar</strong>go se obti<strong>en</strong><strong>en</strong> reg<strong>la</strong>s muy<br />

simi<strong>la</strong>res <strong>en</strong> los árboles <strong>de</strong> <strong>de</strong>cisión, por no <strong>de</strong>cir iguales, al realiz<strong>ar</strong> inducción sobre el<br />

atributo cluster obt<strong>en</strong>ido <strong>en</strong> el proceso <strong>de</strong> clustering. Esto <strong>de</strong>muestra <strong>la</strong> consist<strong>en</strong>cia <strong>de</strong><br />

los datos <strong>en</strong> ambos mo<strong>de</strong>los.<br />

4.2.4.2.4.1 C<strong>la</strong>sificación a través <strong>de</strong>l C4.5<br />

Se estableció un nivel <strong>de</strong> confianza p<strong>ar</strong>a <strong>la</strong> poda <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión <strong>de</strong>l 50% y se fijó<br />

<strong>en</strong> 2 el mínimo <strong>de</strong> instancias por hoja.<br />

El resultado obt<strong>en</strong>ido sobre un total <strong>de</strong> 40,928 registros agrupados <strong>en</strong> los 4 clusters es el<br />

sigui<strong>en</strong>te:<br />

Solución Patricio Gutiérrez Rüegg 87


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

88<br />

• Instancias c<strong>la</strong>sificadas correctam<strong>en</strong>te: 40,913 (99.96%).<br />

• Instancias c<strong>la</strong>sificadas incorrectam<strong>en</strong>te 15 (0.04%).<br />

El árbol resultante ti<strong>en</strong>e un tamaño <strong>de</strong> 392 elem<strong>en</strong>tos y 276 hojas y <strong>la</strong> matriz <strong>de</strong><br />

confusión obt<strong>en</strong>ida a través <strong>de</strong>l Rapid-i queda constituida <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera:<br />

true cluster3 true cluster0 true cluster2 true cluster1<br />

c<strong>la</strong>ss<br />

precision<br />

pred. cluster3 2,902 2 1 7 99.66%<br />

pred. cluster0 - 16,847 1 2 99.98%<br />

pred. cluster2 1 - 14,660 - 99.99%<br />

pred. cluster1 1 - - 6,504 99.98%<br />

c<strong>la</strong>ss recall 99.93% 99.99% 99.99% 99.86%<br />

Tab<strong>la</strong> 4.43. Matriz <strong>de</strong> confusión obt<strong>en</strong>ida a través <strong>de</strong>l algoritmo C4.5.<br />

Si <strong>la</strong> c<strong>la</strong>sificación hubiera sido perfecta se esper<strong>ar</strong>ía <strong>en</strong>contr<strong>ar</strong> únicam<strong>en</strong>te elem<strong>en</strong>tos <strong>en</strong><br />

<strong>la</strong> diagonal. En otras pa<strong>la</strong>bras, <strong>la</strong> matriz <strong>de</strong> confusión permite <strong>en</strong>t<strong>en</strong><strong>de</strong>r cual es el error<br />

que está <strong>com</strong>eti<strong>en</strong>do el algoritmo al int<strong>en</strong>t<strong>ar</strong> c<strong>la</strong>sific<strong>ar</strong> a todos los registros.<br />

Por otro <strong>la</strong>do se testea al mo<strong>de</strong>lo mediante un set <strong>de</strong> criterios <strong>de</strong> selección, a través <strong>de</strong>l<br />

l<strong>la</strong>mado Performance Vector. Los resultados <strong>de</strong>l mismo p<strong>ar</strong>a el algoritmo C4.5 se<br />

muestran a continuación:<br />

Criterio Valor<br />

accuracy: 99.96%<br />

c<strong>la</strong>ssification_error: 0.04%<br />

absolute_error: 0.001 +/- 0.017<br />

corre<strong>la</strong>tion: 0.998<br />

squ<strong>ar</strong>ed_corre<strong>la</strong>tion: 0.997<br />

Tab<strong>la</strong> 4.44. Performance Vector <strong>de</strong>l algoritmo C4.5.<br />

4.2.4.2.4.2 C<strong>la</strong>sificación a través <strong>de</strong>l CHAID<br />

Se corrió el algoritmo CHAID con un nivel <strong>de</strong> confianza máximo <strong>de</strong>l 50% p<strong>ar</strong>a realiz<strong>ar</strong><br />

<strong>la</strong> poda <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión y se estableció <strong>en</strong> 2 el mínimo tamaño <strong>de</strong> todas <strong>la</strong>s hojas.<br />

El resultado obt<strong>en</strong>ido sobre un total <strong>de</strong> 40,928 registros agrupados <strong>en</strong> los 4 clusters es el<br />

sigui<strong>en</strong>te:<br />

• Instancias c<strong>la</strong>sificadas correctam<strong>en</strong>te: 40,683 (99.4%).<br />

• Instancias c<strong>la</strong>sificadas incorrectam<strong>en</strong>te 245 (0.6%).<br />

La matriz <strong>de</strong> confusión obt<strong>en</strong>ida queda constituida <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te manera:<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

true cluster3 true cluster0 true cluster2 true cluster1<br />

c<strong>la</strong>ss<br />

precision<br />

pred. cluster3 2,750 3 1 49 98.11%<br />

pred. cluster0 27 16,832 24 - 99.70%<br />

pred. cluster2 39 14 14,637 - 99.64%<br />

pred. cluster1 88 - - 6,464 98.66%<br />

c<strong>la</strong>ss recall 94.70% 99.90% 99.83% 99.25%<br />

Tab<strong>la</strong> 4.45. Matriz <strong>de</strong> confusión obt<strong>en</strong>ida a través <strong>de</strong>l algoritmo CHAID.<br />

Los resultados <strong>de</strong>l Performance Vector p<strong>ar</strong>a el algoritmo CHAID se muestran a<br />

continuación:<br />

4.2.4.2.4.3 Árbol <strong>de</strong> <strong>de</strong>cisión<br />

Criterio Valor<br />

accuracy: 99.40%<br />

c<strong>la</strong>ssification_error: 0.60%<br />

absolute_error: 0.008 +/ -0.066<br />

corre<strong>la</strong>tion: 0.974<br />

squ<strong>ar</strong>ed_corre<strong>la</strong>tion: 0.949<br />

Tab<strong>la</strong> 4.46. Performance Vector <strong>de</strong>l algoritmo CHAID.<br />

Vale record<strong>ar</strong> que no son <strong>la</strong>s salidas gráficas uno <strong>de</strong> los puntos fuertes <strong>de</strong>l Rapid-i. Más<br />

allá <strong>de</strong> esta <strong>de</strong>sv<strong>en</strong>taja, se pue<strong>de</strong> observ<strong>ar</strong> que el árbol <strong>de</strong> <strong>de</strong>cisión obt<strong>en</strong>ido mediante el<br />

algoritmo CHAID es por <strong>de</strong>más frondoso, aún cuando una <strong>de</strong> <strong>la</strong>s c<strong>ar</strong>acterísticas <strong>de</strong>l<br />

dicho algoritmo es <strong>la</strong> <strong>de</strong> realiz<strong>ar</strong> <strong>la</strong> “poda” <strong>de</strong>l mismo.<br />

Figura 4.25. Estructura <strong>de</strong>l árbol <strong>com</strong>pleto obt<strong>en</strong>ido mediante el algoritmo CHAID.<br />

Solución Patricio Gutiérrez Rüegg 89


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

El nodo principal es el atributo Capacitación Laboral. Las ramas correspondi<strong>en</strong>tes a Sin<br />

oficio ni profesión y Profesión se dirig<strong>en</strong> al nodo referido al atributo Delito Cometido<br />

[Figura 4.26]. La rama correspondi<strong>en</strong>te a Oficio se dirige al atributo situación <strong>la</strong>boral.<br />

De esta manera se pue<strong>de</strong> seguir “ley<strong>en</strong>do” el árbol, p<strong>ar</strong>ti<strong>en</strong>do <strong>de</strong> cada uno <strong>de</strong> los nodos,<br />

pasando por <strong>la</strong>s ramas hasta lleg<strong>ar</strong> a <strong>la</strong>s hojas. El árbol que se pres<strong>en</strong>ta <strong>en</strong> <strong>la</strong> figura 4.26<br />

es un mo<strong>de</strong>lo resumido <strong>de</strong>l mismo. Debido al tamaño que exhibe, cada una <strong>de</strong> <strong>la</strong>s ramas<br />

se repres<strong>en</strong>ta por sep<strong>ar</strong>ado <strong>en</strong> los anexos 11, 12 y 13.<br />

90<br />

Figura 4.26. Árbol resumido obt<strong>en</strong>ido mediante el algoritmo CHAID.<br />

4.2.4.2.4.4 Reg<strong>la</strong>s <strong>de</strong> C<strong>la</strong>sificación<br />

La finalidad <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión <strong>de</strong>l pres<strong>en</strong>te estudio es <strong>la</strong> creación <strong>de</strong> reg<strong>la</strong>s <strong>de</strong><br />

c<strong>la</strong>sificación que ayu<strong>de</strong>n a explic<strong>ar</strong> y valid<strong>ar</strong> <strong>la</strong> <strong>com</strong>posición <strong>de</strong> cada cluster formado.<br />

Se <strong>de</strong>staca una vez más, <strong>la</strong> similitud <strong>en</strong>tre <strong>la</strong>s reg<strong>la</strong>s al utiliz<strong>ar</strong>se los algoritmos C4.5 y<br />

CHAID.<br />

Las reg<strong>la</strong>s extraídas <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión se divi<strong>de</strong>n según cada cluster p<strong>ar</strong>a t<strong>en</strong>er un<br />

panorama más s<strong>en</strong>cillo. Así, por lo tanto, se obti<strong>en</strong>e que el 20% <strong>de</strong> <strong>la</strong> totalidad <strong>de</strong> <strong>la</strong>s<br />

reg<strong>la</strong>s g<strong>en</strong>eradas por el árbol c<strong>la</strong>sifican a más <strong>de</strong>l 80% <strong>de</strong> <strong>la</strong>s instancias [Tab<strong>la</strong> 4.47].<br />

Patricio Gutiérrez Rüegg Solución


Clusters<br />

Total <strong>de</strong> Reg<strong>la</strong>s<br />

por cluster<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Reg<strong>la</strong>s<br />

Seleccionadas<br />

Solución Patricio Gutiérrez Rüegg 91<br />

%<br />

Instancias por<br />

Cluster<br />

Cluster 0 53 6 11% 16,849<br />

Cluster 1 51 6 12% 6,513<br />

Cluster 2 17 3 18% 14,662<br />

Cluster 3 57 18 32% 2,904<br />

Total 178 33 19% 40,928<br />

Tab<strong>la</strong> 4.47. Total <strong>de</strong> reg<strong>la</strong>s vs. Reg<strong>la</strong>s seleccionadas.<br />

Instancias por<br />

Reg<strong>la</strong><br />

13,657<br />

4,826<br />

12,606<br />

2,063<br />

33,152<br />

A continuación se <strong>de</strong>tal<strong>la</strong>n <strong>la</strong>s principales reg<strong>la</strong>s <strong>de</strong> c<strong>la</strong>sificación, <strong>en</strong> or<strong>de</strong>n <strong>de</strong>creci<strong>en</strong>te<br />

según cantidad <strong>de</strong> instancias que c<strong>la</strong>sifica correctam<strong>en</strong>te, p<strong>ar</strong>a cada uno <strong>de</strong> los clusters<br />

obt<strong>en</strong>idos.<br />

Reg<strong>la</strong>s Principales Cluster 0<br />

Reg<strong>la</strong> 1<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Estado Civil = Soltero<br />

Entonces Cluster 0 (7516)<br />

Reg<strong>la</strong> 2<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />

Entonces Cluster 0 (2615)<br />

Reg<strong>la</strong> 3<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Estado Civil = Concubino<br />

Entonces Cluster 0 (1314)<br />

Reg<strong>la</strong> 4<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Estado Civil = Casado<br />

Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />

Entonces Cluster 0 (696)<br />

Reg<strong>la</strong> 5<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Desocupado<br />

Y Edad >29<br />

Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />

Entonces Cluster 0 (695)<br />

%<br />

81%<br />

74%<br />

86%<br />

71%<br />

81%


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Reg<strong>la</strong> 6<br />

Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />

Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Edad 30<br />

Y Última Situación Laboral = Desocupado<br />

Y Estado Civil = Soltero<br />

Entonces Cluster 1 (290)<br />

Reg<strong>la</strong> 4<br />

Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Edad < 39<br />

Entonces Cluster 1 (268)<br />

Reg<strong>la</strong> 5<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Desocupado<br />

Y Edad >29<br />

Y Delito Cometido = Delitos contra <strong>la</strong>s Personas<br />

Entonces Cluster 1 (226)<br />

Reg<strong>la</strong> 6<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Delito Cometido = Delitos contra <strong>la</strong>s Personas<br />

92<br />

Patricio Gutiérrez Rüegg Solución


Y Edad >33<br />

Y Estado Civil = Soltero<br />

Entonces Cluster 1 (218)<br />

Reg<strong>la</strong>s Principales Cluster 2<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Reg<strong>la</strong> 1<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Desocupado<br />

Entonces Cluster 2 (9822)<br />

Reg<strong>la</strong> 2<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delitos contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Edad


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

94<br />

Y Estado Civil = Casado<br />

Y Delito Cometido = Delitos contra <strong>la</strong>s personas<br />

Y Edad > 38<br />

Entonces Cluster 3 (200)<br />

Reg<strong>la</strong> 5<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Edad > 29<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (165)<br />

Reg<strong>la</strong> 6<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />

Y Edad > 33<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (137)<br />

Reg<strong>la</strong> 7<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />

Y Edad < 82<br />

Y Estado Civil = Casado<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Entonces Cluster 3 (131)<br />

Reg<strong>la</strong> 8<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Estado Civil = Casado<br />

Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />

Y Edad > 38<br />

Entonces Cluster 3 (119)<br />

Reg<strong>la</strong> 9<br />

Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />

Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />

Y Estado Civil = Concubino<br />

Y Edad > 37<br />

Entonces Cluster 3 (100)<br />

Reg<strong>la</strong> 10<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes)<br />

Y Edad < 30<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Entonces Cluster 3 (95)<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Reg<strong>la</strong> 11<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Delito Cometido = Infracción ley Nº 23.737 (estupefaci<strong>en</strong>tes)<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (90)<br />

Reg<strong>la</strong> 12<br />

Si Capacitación Laboral = Ti<strong>en</strong>e algún oficio<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />

Y Estado Civil = Casado<br />

Y Edad > 38<br />

Entonces Cluster 3 (73)<br />

Reg<strong>la</strong> 13<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delitos contra <strong>la</strong> integridad sexual y el Honor<br />

Y Edad > 32<br />

Y Última Situación Laboral = Desocupado<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (72)<br />

Reg<strong>la</strong> 14<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Estado Civil = Concubino<br />

Y Edad > 38<br />

Entonces Cluster 3 (61)<br />

Reg<strong>la</strong> 15<br />

Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Edad > 38<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (60)<br />

Reg<strong>la</strong> 16<br />

Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Edad > 39<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (59)<br />

Reg<strong>la</strong> 17<br />

Si Capacitación Laboral = Ti<strong>en</strong>e alguna profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong>s personas<br />

Solución Patricio Gutiérrez Rüegg 95


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

96<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo p<strong>ar</strong>cial<br />

Y Edad < 33<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (53)<br />

Reg<strong>la</strong> 18<br />

Si Capacitación Laboral = No ti<strong>en</strong>e ni oficio ni profesión<br />

Y Delito Cometido = Delito contra <strong>la</strong> propiedad<br />

Y Última Situación Laboral = Trabajador <strong>de</strong> tiempo <strong>com</strong>pleto<br />

Y Edad > 36<br />

Y Estado Civil = Casado<br />

Entonces Cluster 3 (45)<br />

4.2.4.3 Evalu<strong>ar</strong> el mo<strong>de</strong>lo.<br />

A fines <strong>de</strong> evalu<strong>ar</strong> el mo<strong>de</strong>lo, se aplica una inducción directa sobre uno <strong>de</strong> los atributos<br />

p<strong>ar</strong>a <strong>la</strong> obt<strong>en</strong>ción <strong>de</strong> <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong> c<strong>la</strong>sificación. O sea, se omite el paso <strong>de</strong> clustering <strong>de</strong><br />

los datos.<br />

En este caso, se toma <strong>com</strong>o c<strong>la</strong>se al atributo Delito Cometido ya que junto con<br />

Capacitación Laboral son los campos más relevantes <strong>de</strong>l dataset. Esto último se pue<strong>de</strong><br />

verific<strong>ar</strong> <strong>en</strong> <strong>la</strong> sección <strong>de</strong> selección <strong>de</strong> atributos (capitulo 4.2.4.2.2).<br />

Como algoritmo c<strong>la</strong>sificador se utiliza al C4.5 obt<strong>en</strong>i<strong>en</strong>do los sigui<strong>en</strong>tes resultados:<br />

• Instancias c<strong>la</strong>sificadas correctam<strong>en</strong>te: 28,216 (68.94%).<br />

• Instancias c<strong>la</strong>sificadas incorrectam<strong>en</strong>te: 12,712 (31.06%).<br />

La matriz <strong>de</strong> confusión queda conformada <strong>de</strong> <strong>la</strong> sigui<strong>en</strong>te forma:<br />

pred. Infracción ley n° 23.737<br />

(estupefaci<strong>en</strong>tes)<br />

true Infracción ley<br />

N° 23.737<br />

(estupefaci<strong>en</strong>tes)<br />

true Delitos contra<br />

<strong>la</strong> propiedad<br />

true Delitos contra<br />

<strong>la</strong>s personas<br />

true Delitos contra<br />

<strong>la</strong> integridad<br />

sexual y el Honor<br />

c<strong>la</strong>ss<br />

precision<br />

358 110 91 65 57.37%<br />

pred. Delitos contra <strong>la</strong> propiedad 2,108 25,805 7,332 1,760 69.73%<br />

pred. Delitos contra <strong>la</strong>s<br />

personas<br />

pred. Delitos contra <strong>la</strong> integridad<br />

sexual y el Honor<br />

204 476 1,682 344 62.16%<br />

36 85 101 371 62.56%<br />

c<strong>la</strong>ss recall 13.23% 97.47% 18.27% 14.61%<br />

Tab<strong>la</strong> 4.48. Matriz <strong>de</strong> confusión obt<strong>en</strong>ida con el algoritmo C4.5 y c<strong>la</strong>se Delito Cometido.<br />

Tal <strong>com</strong>o se observa <strong>en</strong> <strong>la</strong> tab<strong>la</strong> 4.49, los valores correspondi<strong>en</strong>tes al vector <strong>de</strong><br />

performance son significativam<strong>en</strong>te peores que <strong>la</strong>s corridas anteriores:<br />

Patricio Gutiérrez Rüegg Solución


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Criterio Valor<br />

accuracy: 68.94%<br />

c<strong>la</strong>ssification_error: 31.06%<br />

absolute_error: 0.456 +/- 0.262<br />

corre<strong>la</strong>tion: 0.296<br />

squ<strong>ar</strong>ed_corre<strong>la</strong>tion: 0.088<br />

Tab<strong>la</strong> 4.49. Performance Vector <strong>de</strong>l algoritmo C4.5<br />

En <strong>com</strong>p<strong>ar</strong>ación a los dos primeros mo<strong>de</strong>los <strong>en</strong> don<strong>de</strong> ambos casos mostraban un po<strong>de</strong>r<br />

c<strong>la</strong>sificatorio superior al 99%, <strong>en</strong> este último solo se pudo c<strong>la</strong>sific<strong>ar</strong> <strong>en</strong> forma correcta<br />

solo al 68.94% <strong>de</strong> <strong>la</strong>s instancias.<br />

Esta disminución <strong>en</strong> <strong>la</strong> eficacia c<strong>la</strong>sificatoria no significa que pueda haber g<strong>en</strong>erado<br />

reg<strong>la</strong>s inconsist<strong>en</strong>tes o incorrectas. Pue<strong>de</strong> ocurrir, que <strong>de</strong>ntro <strong>de</strong> aquel<strong>la</strong>s instancias <strong>en</strong><br />

<strong>la</strong>s que no pudo c<strong>la</strong>sific<strong>ar</strong> correctam<strong>en</strong>te haya reg<strong>la</strong>s subyac<strong>en</strong>tes que result<strong>en</strong><br />

relevantes.<br />

4.2.5 Fase V: Evaluación<br />

La evaluación <strong>de</strong>s<strong>de</strong> todo punto <strong>de</strong> vista resulta ser muy positiva. Se <strong>com</strong><strong>en</strong>zó el<br />

proyecto <strong>de</strong>sconoci<strong>en</strong>do totalm<strong>en</strong>te al tema <strong>en</strong> cuestión y mediante <strong>la</strong>s técnicas <strong>de</strong><br />

minería <strong>de</strong> datos se pudo lleg<strong>ar</strong> a conclusiones y reflexiones interesantes, <strong>de</strong> acuerdo a<br />

<strong>la</strong> opinión vertida por los expertos <strong>de</strong>l dominio.<br />

Otro punto a favor es que <strong>la</strong> interpretación <strong>de</strong> los resultados obt<strong>en</strong>idos a través <strong>de</strong> los<br />

algoritmos utilizados, tanto p<strong>ar</strong>a el agrupami<strong>en</strong>to <strong>de</strong> los datos <strong>com</strong>o p<strong>ar</strong>a <strong>la</strong><br />

c<strong>la</strong>sificación, se <strong>en</strong>cu<strong>en</strong>tra alineada con <strong>la</strong> opinión <strong>de</strong> los especialistas <strong>en</strong> materia<br />

criminal, p<strong>en</strong>al, <strong>de</strong>l <strong>de</strong>recho y social. Todos los especialistas coinci<strong>de</strong>n <strong>en</strong> un punto<br />

c<strong>la</strong>ve:<br />

“P<strong>ar</strong>a logr<strong>ar</strong> un mejor <strong>en</strong>t<strong>en</strong>dimi<strong>en</strong>to <strong>de</strong> <strong>la</strong>s conductas y <strong>com</strong>portami<strong>en</strong>tos <strong>de</strong>l <strong>de</strong>t<strong>en</strong>ido,<br />

es sumam<strong>en</strong>te importante conocer <strong>la</strong> historia famili<strong>ar</strong> y cultural <strong>de</strong>l mismo”.<br />

Lam<strong>en</strong>tablem<strong>en</strong>te, hoy <strong>en</strong> día no se cu<strong>en</strong>ta con dicha información <strong>en</strong> el sistema SNEEP.<br />

Conclusiones <strong>de</strong> <strong>la</strong>s principales reg<strong>la</strong>s obt<strong>en</strong>idas a p<strong>ar</strong>tir <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión y<br />

conocimi<strong>en</strong>tos adquiridos:<br />

• La mayoría <strong>de</strong> <strong>la</strong>s personas presas se <strong>en</strong>cu<strong>en</strong>tran privadas <strong>de</strong> su libertad por<br />

haber <strong>com</strong>etido el <strong>de</strong>lito <strong>de</strong> robo o hurto.<br />

• Existe una distribución <strong>de</strong>l nivel <strong>de</strong> instrucción muy pobre <strong>en</strong>tre los <strong>de</strong>t<strong>en</strong>idos <strong>en</strong><br />

establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios.<br />

Solución Patricio Gutiérrez Rüegg 97


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

98<br />

• Aún cuando una persona posee un oficio o profesión y un trabajo <strong>de</strong> tiempo<br />

p<strong>ar</strong>cial/<strong>com</strong>pleto, <strong>com</strong>ete <strong>de</strong>litos contra <strong>la</strong> propiedad. Podría est<strong>ar</strong> re<strong>la</strong>cionado<br />

con <strong>la</strong> cultura <strong>de</strong>l robo que trae innata.<br />

• La mayoría <strong>de</strong> <strong>la</strong>s personas <strong>de</strong> más <strong>de</strong> 30 años que <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong> propiedad<br />

son reinci<strong>de</strong>ntes.<br />

• Los individuos que <strong>de</strong>linqu<strong>en</strong> contra <strong>la</strong>s personas son <strong>en</strong> su mayoría g<strong>en</strong>te que se<br />

<strong>en</strong>cu<strong>en</strong>tra <strong>de</strong>socupada e incapacitada <strong>la</strong>boralm<strong>en</strong>te.<br />

• El nivel <strong>de</strong> capacitación <strong>la</strong>boral esta fuertem<strong>en</strong>te re<strong>la</strong>cionada con el <strong>de</strong>lito <strong>de</strong><br />

robo y hurto <strong>en</strong> jóv<strong>en</strong>es m<strong>en</strong>ores a 29 años.<br />

• Un jov<strong>en</strong> <strong>de</strong> edad <strong>en</strong>tre 20 y 29 años, sin capacitación <strong>la</strong>boral ni trabajo <strong>de</strong><br />

tiempo <strong>com</strong>pleto, corre mucho riesgo <strong>de</strong> que sea puesto preso por <strong>de</strong>linquir<br />

contra <strong>la</strong> propiedad.<br />

• En g<strong>en</strong>eral, qui<strong>en</strong>es <strong>com</strong>et<strong>en</strong> <strong>de</strong>litos contra <strong>la</strong> integridad sexual y el honor<br />

(vio<strong>la</strong>ción), son personas casadas, mayor a 32 años, con trabajo <strong>de</strong> tiempo<br />

p<strong>ar</strong>cial o <strong>com</strong>pleto y que pose<strong>en</strong> un oficio o profesión.<br />

• Qui<strong>en</strong>es son procesados por infracción a ley Nº 23.737 (estupefaci<strong>en</strong>tes), son <strong>en</strong><br />

su mayoría personas con algún tipo <strong>de</strong> trabajo y capacitación <strong>la</strong>boral.<br />

Patricio Gutiérrez Rüegg Solución


5. CONCLUSIONES Y REFLEXIONES<br />

5.1 CONCLUSIONES DEL PROYECTO<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

El pres<strong>en</strong>te proyecto ha <strong>de</strong>mostrado <strong>la</strong> factibilidad y valor agregado al aplic<strong>ar</strong> sistemas<br />

intelig<strong>en</strong>tes <strong>de</strong> procesami<strong>en</strong>to <strong>de</strong> información, <strong>com</strong>o <strong>la</strong> minería <strong>de</strong> datos, a <strong>la</strong><br />

información criminal <strong>en</strong> Arg<strong>en</strong>tina. En p<strong>ar</strong>ticu<strong>la</strong>r, se <strong>de</strong>stacan los resultados obt<strong>en</strong>idos<br />

al utiliz<strong>ar</strong> métodos <strong>de</strong> explotación <strong>de</strong> información <strong>en</strong> pob<strong>la</strong>ciones c<strong>ar</strong>ce<strong>la</strong>rias con el fin<br />

<strong>de</strong> extraer conocimi<strong>en</strong>to <strong>de</strong> los datos.<br />

Queda <strong>de</strong>mostrado que <strong>la</strong> minería <strong>de</strong> datos es una herrami<strong>en</strong>ta muy pot<strong>en</strong>te que permite<br />

explor<strong>ar</strong> gran<strong>de</strong>s bases <strong>de</strong> datos <strong>de</strong> manera rápida y efici<strong>en</strong>te, sin necesidad <strong>de</strong> ser un<br />

experto <strong>en</strong> el tema a investig<strong>ar</strong>. En mi caso p<strong>ar</strong>ticu<strong>la</strong>r, sin <strong>en</strong>tr<strong>en</strong>ami<strong>en</strong>to ni experi<strong>en</strong>cia<br />

alguna <strong>en</strong> <strong>la</strong>s técnicas utilizadas, sumado al <strong>de</strong>sconocimi<strong>en</strong>to <strong>de</strong>l tema <strong>en</strong>c<strong>ar</strong>ado, me<br />

permitió <strong>com</strong>pr<strong>en</strong><strong>de</strong>r cuales son los principales motivos que llevan a una persona a<br />

<strong>de</strong>linquir y así logr<strong>ar</strong> p<strong>en</strong>s<strong>ar</strong> alternativas p<strong>ar</strong>a <strong>la</strong> prev<strong>en</strong>ción <strong>de</strong> dichos hechos <strong>de</strong>lictivos.<br />

Lógicam<strong>en</strong>te, previo a <strong>la</strong> aplicación <strong>de</strong> <strong>la</strong> minería <strong>de</strong> datos, se tuvo que realiz<strong>ar</strong> una<br />

fuerte investigación sobre estadísticas vincu<strong>la</strong>das al crim<strong>en</strong>, al servicio p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io y a<br />

los procesos p<strong>en</strong>ales <strong>en</strong> Arg<strong>en</strong>tina. Esto fue el punto <strong>de</strong> p<strong>ar</strong>tida <strong>de</strong>l proyecto, el cual<br />

basa su factibilidad <strong>en</strong> los sigui<strong>en</strong>tes puntos:<br />

• Existe muchísima información que no esta si<strong>en</strong>do aprovechada p<strong>ar</strong>a <strong>la</strong><br />

extracción <strong>de</strong> conocimi<strong>en</strong>to útil (patrones, <strong>com</strong>portami<strong>en</strong>tos, anomalías, etc.) <strong>en</strong><br />

toda su dim<strong>en</strong>sión.<br />

• Exist<strong>en</strong> programas <strong>de</strong> minería <strong>de</strong> datos <strong>de</strong> libre uso, re<strong>la</strong>tivam<strong>en</strong>te fáciles <strong>de</strong><br />

apr<strong>en</strong><strong>de</strong>r y utiliz<strong>ar</strong>.<br />

• No es neces<strong>ar</strong>io ser un experto ni <strong>en</strong> temas <strong>de</strong> sistemas intelig<strong>en</strong>tes ni <strong>en</strong> el tema<br />

a explor<strong>ar</strong>.<br />

• Sin emb<strong>ar</strong>go, es condición neces<strong>ar</strong>ia cont<strong>ar</strong> con <strong>la</strong> experi<strong>en</strong>cia <strong>de</strong> especialistas<br />

<strong>en</strong> <strong>la</strong> temática a analiz<strong>ar</strong> que vali<strong>de</strong>n <strong>la</strong>s conclusiones extraídas <strong>de</strong> los mo<strong>de</strong>los<br />

<strong>de</strong> minería <strong>de</strong> datos.<br />

Se <strong>de</strong>staca <strong>la</strong> p<strong>ar</strong>ticipación <strong>de</strong> especialistas (fiscal, juez y abogados) <strong>en</strong> el tema que<br />

permitieron ampli<strong>ar</strong> el conocimi<strong>en</strong>to sobre los <strong>de</strong>lincu<strong>en</strong>tes y sus <strong>com</strong>portami<strong>en</strong>tos. Sin<br />

<strong>la</strong> ayuda <strong>de</strong> estos, junto con sus opiniones y soporte, hubiera sido muy difícil, o hasta<br />

imposible, logr<strong>ar</strong> capt<strong>ar</strong> <strong>de</strong>talles p<strong>ar</strong>a los cuales un Ing<strong>en</strong>iero Industrial no está<br />

prep<strong>ar</strong>ado.<br />

Los resultados experim<strong>en</strong>tales logr<strong>ar</strong>on obt<strong>en</strong>er 4 grupos <strong>de</strong> presos con distintas<br />

c<strong>ar</strong>acterísticas y conductas permiti<strong>en</strong>do valid<strong>ar</strong> conocimi<strong>en</strong>tos preexist<strong>en</strong>tes, pero esta<br />

Conclusiones y Reflexiones Patricio Gutiérrez Rüegg 99


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

vez, con una justificación apoyado por los datos. A su vez, mediante <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong><br />

c<strong>la</strong>sificación, se logró c<strong>ar</strong>acteriz<strong>ar</strong> a los presos <strong>en</strong> base a sus atributos más relevantes. Es<br />

importante <strong>de</strong>stac<strong>ar</strong>, que a difer<strong>en</strong>cia <strong>de</strong> <strong>la</strong>s interpretaciones subjetivas <strong>en</strong> que pue<strong>de</strong>n<br />

incurrir <strong>la</strong>s personas, <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong> c<strong>la</strong>sificación son evi<strong>de</strong>nciadas con los registros<br />

almac<strong>en</strong>ados <strong>en</strong> <strong>la</strong> base <strong>de</strong> datos<br />

5.2 REFLEXIONES<br />

Des<strong>de</strong> el punto <strong>de</strong> vista <strong>de</strong> <strong>la</strong> Ing<strong>en</strong>iería Industrial podría verse al sistema p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />

<strong>com</strong>o una especie <strong>de</strong> proceso productivo. En este caso, el flujo <strong>en</strong>trante al sistema serían<br />

los presos que ingresan a los establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios p<strong>ar</strong>a ser “reprocesados”,<br />

luego <strong>de</strong> que se les <strong>de</strong>tect<strong>ar</strong>a alguna fal<strong>la</strong> (haber <strong>com</strong>etido el <strong>de</strong>lito). C<strong>la</strong>ram<strong>en</strong>te, <strong>com</strong>o<br />

a todo “producto” que necesita ser reprocesado, es neces<strong>ar</strong>io que se cu<strong>en</strong>t<strong>en</strong> con <strong>la</strong>s<br />

herrami<strong>en</strong>tas a<strong>de</strong>cuadas p<strong>ar</strong>a llev<strong>ar</strong> a cabo dicha t<strong>ar</strong>ea, y que cada uno <strong>de</strong> los pasos se<br />

cump<strong>la</strong> a <strong>la</strong> perfección p<strong>ar</strong>a que no se vuelva a incurrir <strong>en</strong> el mismo error o fal<strong>la</strong>.<br />

Lam<strong>en</strong>tablem<strong>en</strong>te, aquí no estamos hab<strong>la</strong>ndo <strong>de</strong> bi<strong>en</strong>es materiales. Estamos fr<strong>en</strong>te a<br />

seres humanos, que por diversos motivos <strong>de</strong>linquieron y necesitan <strong>de</strong> ayuda <strong>de</strong>l Estado<br />

p<strong>ar</strong>a po<strong>de</strong>r readapt<strong>ar</strong>se y reubic<strong>ar</strong>se <strong>en</strong> una sociedad <strong>de</strong> <strong>la</strong> cual fueron ap<strong>ar</strong>tados. El<br />

sigui<strong>en</strong>te párrafo, sintetiza brevem<strong>en</strong>te lo que está ocurri<strong>en</strong>do hoy <strong>en</strong> día con <strong>la</strong>s<br />

personas que se <strong>en</strong>cu<strong>en</strong>tran privadas <strong>de</strong> su libertad y ayuda a <strong>com</strong>pr<strong>en</strong><strong>de</strong>r p<strong>ar</strong>te <strong>de</strong> <strong>la</strong><br />

problemática exist<strong>en</strong>te:<br />

“Se hab<strong>la</strong> <strong>de</strong> readapt<strong>ar</strong> socialm<strong>en</strong>te a los con<strong>de</strong>nados, se <strong>de</strong>bate sobre <strong>la</strong> mejor forma<br />

que <strong>de</strong>b<strong>en</strong> asumir los l<strong>la</strong>mados patronatos <strong>de</strong>liberados, cuando previam<strong>en</strong>te se han<br />

<strong>de</strong>gradado <strong>en</strong> <strong>la</strong> cárcel <strong>de</strong> procesados a tantos y tantos seres que son los mismos que<br />

ahora se quier<strong>en</strong> readapt<strong>ar</strong>.¿Por que <strong>en</strong>tonces no <strong>com</strong><strong>en</strong>z<strong>ar</strong> por don<strong>de</strong> correspon<strong>de</strong>: no<br />

<strong>de</strong>spersonalizando moral, psíquica y físicam<strong>en</strong>te al <strong>en</strong>causado y, sobre todo, logrando<br />

que el hombre que ha caído no se contamine ante sus propios ojos, porque eso significa<br />

ll<strong>en</strong><strong>ar</strong>lo <strong>de</strong> res<strong>en</strong>timi<strong>en</strong>to, por una p<strong>ar</strong>te, y, por <strong>la</strong> otra, d<strong>ar</strong> razón a su rebelión?”<br />

[Neuman & Irurzun, 1994].<br />

Como se pudo observ<strong>ar</strong> a lo <strong>la</strong>rgo <strong>de</strong>l proyecto, <strong>la</strong> falta <strong>de</strong> instrucción <strong>en</strong> los <strong>de</strong>t<strong>en</strong>idos,<br />

tanto educativa <strong>com</strong>o <strong>la</strong>boral, es a<strong>la</strong>rmante. La educación <strong>de</strong>be ser integral y ll<strong>en</strong><strong>ar</strong> los 3<br />

ciclos, <strong>en</strong> el caso que correspondiere, p<strong>ar</strong>a <strong>ar</strong>m<strong>ar</strong> al hombre preso con un bagaje <strong>de</strong><br />

conocimi<strong>en</strong>tos que le permitan obt<strong>en</strong>er mejores posibilida<strong>de</strong>s cuando recobre su<br />

libertad. Hoy <strong>en</strong> día esto no se está cumpli<strong>en</strong>do, es muy bajo, por no <strong>de</strong>cir nulo, el<br />

volum<strong>en</strong> <strong>de</strong> presos que p<strong>ar</strong>ticipan <strong>en</strong> activida<strong>de</strong>s educativas y <strong>la</strong>borales. Pero no solo<br />

hay que prest<strong>ar</strong>le at<strong>en</strong>ción a <strong>la</strong> educación <strong>de</strong> los <strong>de</strong>t<strong>en</strong>idos, sino que también hay que<br />

hacer hincapié <strong>en</strong> aquel<strong>la</strong>s personas que no pose<strong>en</strong> instrucción y que <strong>en</strong> muchos casos,<br />

100<br />

Patricio Gutiérrez Rüegg Conclusiones y Reflexiones


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

junto con <strong>la</strong> falta <strong>de</strong> posibilida<strong>de</strong>s <strong>la</strong>borales, terminan incurri<strong>en</strong>do <strong>en</strong> algún <strong>de</strong>lito contra<br />

<strong>la</strong> propiedad.<br />

Es hora que <strong>la</strong> dirig<strong>en</strong>cia política modifique su postura fr<strong>en</strong>te a estos aspectos. La<br />

educación nunca fue un tema <strong>de</strong>terminante p<strong>ar</strong>a gan<strong>ar</strong> <strong>la</strong>s elecciones, ni <strong>en</strong> el c<strong>en</strong>tro, ni<br />

<strong>en</strong> el sur <strong>de</strong> América. Las escue<strong>la</strong>s r<strong>ar</strong>a vez son importantes <strong>en</strong> <strong>la</strong>s elecciones<br />

nacionales, provinciales o incluso <strong>en</strong> <strong>la</strong>s municipales.<br />

Otro importante punto a t<strong>en</strong>er <strong>en</strong> cu<strong>en</strong>ta es el costo que un preso ti<strong>en</strong>e p<strong>ar</strong>a <strong>la</strong> sociedad.<br />

No solo el Estado gasta mucho dinero por cada preso, sino que se está perdi<strong>en</strong>do <strong>la</strong><br />

oportunidad <strong>de</strong> utiliz<strong>ar</strong> a esas personas <strong>com</strong>o mano <strong>de</strong> obra productiva. Toda esa gran<br />

cantidad <strong>de</strong> dinero podría <strong>de</strong>stin<strong>ar</strong>se a p<strong>la</strong>nes <strong>de</strong> capacitación, becas p<strong>ar</strong>a estudio,<br />

programas sociales-educativos, y así, <strong>en</strong> un sin fin <strong>de</strong> aplicaciones. Si no se logra <strong>la</strong><br />

reinstrucción y capacitación <strong>de</strong> estos <strong>de</strong>lincu<strong>en</strong>tes, <strong>la</strong>s probabilida<strong>de</strong>s <strong>de</strong> que vuelvan a<br />

<strong>de</strong>linquir una vez que recobr<strong>en</strong> <strong>la</strong> libertad es muy alta. Así lo muestra el índice <strong>de</strong><br />

reinci<strong>de</strong>ncia, el cual hab<strong>la</strong> <strong>de</strong> que un 40% <strong>de</strong> los presos vuelve a reingres<strong>ar</strong> a los<br />

establecimi<strong>en</strong>tos p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios al cabo <strong>de</strong> 6 años.<br />

Si lug<strong>ar</strong> a duda, <strong>la</strong> inseguridad pasó a ser un tema que preocupa <strong>en</strong> <strong>la</strong> actualidad a <strong>la</strong><br />

mayoría <strong>de</strong> <strong>la</strong>s personas. Hay que trat<strong>ar</strong> <strong>de</strong> afront<strong>ar</strong> el problema <strong>de</strong> una manera dual. No<br />

basta con <strong>la</strong> publicación <strong>de</strong> estadísticas sin tratami<strong>en</strong>to alguno, tampoco alcanz<strong>ar</strong>ía con<br />

resolver el “caos” p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io, sino que habría que <strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>r nuevas y mejores<br />

políticas criminales prev<strong>en</strong>tivas. Una ayuda <strong>en</strong> tal s<strong>en</strong>tido es mediante <strong>la</strong> creación <strong>de</strong><br />

sistemas <strong>de</strong> información <strong>de</strong> mayor calidad <strong>com</strong>o herrami<strong>en</strong>ta fundam<strong>en</strong>tal p<strong>ar</strong>a <strong>la</strong> toma<br />

<strong>de</strong> esas <strong>de</strong>cisiones. Cuanto más acertada sea <strong>la</strong> información recolectada, mejores serán<br />

<strong>la</strong>s <strong>de</strong>cisiones tomadas y habrá más probabilidad <strong>de</strong> reducir el <strong>de</strong>lito. Aún así, es<br />

neces<strong>ar</strong>io que esto sea a<strong>com</strong>pañado por políticas <strong>de</strong> estado efectivas y dura<strong>de</strong>ras <strong>en</strong> el<br />

tiempo.<br />

Es importante recalc<strong>ar</strong>, que no se trata <strong>de</strong> <strong>de</strong>f<strong>en</strong><strong>de</strong>r, mediante este proyecto y<br />

reflexiones, a <strong>la</strong>s personas que <strong>com</strong>etieron un <strong>de</strong>lito. Sino, más bi<strong>en</strong>, se trata d<strong>ar</strong>le una<br />

mirada <strong>de</strong>s<strong>de</strong> otro punto <strong>de</strong> vista. El punto <strong>de</strong> vista que pue<strong>de</strong> t<strong>en</strong>er un Ing<strong>en</strong>iero<br />

Industrial.<br />

Conclusiones y Reflexiones Patricio Gutiérrez Rüegg 101


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

102<br />

Patricio Gutiérrez Rüegg Conclusiones y Reflexiones


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

6. FUTURAS LÍNEAS DE INVESTIGACIÓN<br />

Se cree muy importante y <strong>de</strong> gran valor agregado continu<strong>ar</strong> con <strong>la</strong> aplicación <strong>de</strong> minería<br />

<strong>de</strong> datos <strong>com</strong>o técnica <strong>de</strong> soporte p<strong>ar</strong>a <strong>la</strong> toma <strong>de</strong> <strong>de</strong>cisiones <strong>en</strong> lo que respecta a<br />

políticas criminales y <strong>de</strong>l tipo social.<br />

Si bi<strong>en</strong> durante el pres<strong>en</strong>te proyecto se investigó el <strong>com</strong>portami<strong>en</strong>to <strong>de</strong> los imputados <strong>en</strong><br />

difer<strong>en</strong>tes <strong>de</strong>litos, se hizo especial foco <strong>en</strong> <strong>la</strong>s conductas y c<strong>ar</strong>acterísticas asociadas al<br />

preso previo al ingreso al establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io. Sería valioso po<strong>de</strong>r continu<strong>ar</strong><br />

investigando a los <strong>de</strong>t<strong>en</strong>idos, pero <strong>de</strong>s<strong>de</strong> <strong>la</strong> visión intramuros, analizando sus<br />

<strong>de</strong>s<strong>en</strong>volvimi<strong>en</strong>tos <strong>de</strong>ntro <strong>de</strong>l p<strong>en</strong>al o establecimi<strong>en</strong>to <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción. P<strong>ar</strong>a ello es<br />

neces<strong>ar</strong>io hacer uso <strong>de</strong> una gran cantidad <strong>de</strong> atributos que fueron <strong>de</strong>sc<strong>ar</strong>tados por<br />

pres<strong>en</strong>t<strong>ar</strong> valores o datos faltantes. Mejorando <strong>la</strong> metodología <strong>de</strong> recolección <strong>de</strong> los<br />

datos se logr<strong>ar</strong>ía t<strong>en</strong>er acceso a los valores faltantes, y <strong>de</strong> esta manera, se podrían<br />

evalu<strong>ar</strong> <strong>la</strong> totalidad <strong>de</strong> los registros pudi<strong>en</strong>do así obt<strong>en</strong>er nuevos grupos y reg<strong>la</strong>s <strong>de</strong><br />

c<strong>la</strong>sificación mediante <strong>la</strong>s técnicas <strong>de</strong> minería <strong>de</strong> datos.<br />

Sigui<strong>en</strong>do con <strong>la</strong> información neces<strong>ar</strong>ia p<strong>ar</strong>a lleg<strong>ar</strong> a mejores conclusiones, sería muy<br />

valioso po<strong>de</strong>r lleg<strong>ar</strong> a t<strong>en</strong>er acceso a aquel<strong>la</strong> información famili<strong>ar</strong> relevante <strong>de</strong> los<br />

<strong>de</strong>t<strong>en</strong>idos. Existe una gran re<strong>la</strong>ción <strong>en</strong>tre <strong>la</strong>s acciones <strong>de</strong> <strong>la</strong> gran mayoría <strong>de</strong> los presos y<br />

sus pasados famili<strong>ar</strong>es y culturales.<br />

Finalm<strong>en</strong>te, se propone expandir el uso <strong>de</strong> esta técnica, aplicándo<strong>la</strong> <strong>en</strong> <strong>la</strong>s distintas<br />

bases <strong>de</strong> datos <strong>de</strong> los <strong>en</strong>tes g<strong>en</strong>eradores <strong>de</strong> información. Sería <strong>de</strong> gran utilidad a los fines<br />

<strong>de</strong> <strong>en</strong>contr<strong>ar</strong> re<strong>la</strong>ciones <strong>en</strong>tre distintos hechos, logr<strong>ar</strong> vincu<strong>la</strong>r <strong>la</strong> base <strong>de</strong>l SNEEP con <strong>la</strong><br />

información prov<strong>en</strong>i<strong>en</strong>te <strong>de</strong>l SNIC y su Sistema <strong>de</strong> Alerta Temprana (SAT). De esta<br />

manera, se logr<strong>ar</strong>ía t<strong>en</strong>er toda <strong>la</strong> información refer<strong>en</strong>te a un hecho <strong>de</strong>lictivo consolidada<br />

<strong>en</strong> un solo sistema <strong>de</strong> información.<br />

Futuras Líneas <strong>de</strong> Investigación Patricio Gutiérrez Rüegg 103


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

104<br />

Patricio Gutiérrez Rüegg Futuras Líneas <strong>de</strong> Investigación


7. APORTES REALIZADOS<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

El pres<strong>en</strong>te proyecto realizó su aporte <strong>en</strong> el WICC 2008-X Workshop <strong>de</strong> Investigadores<br />

<strong>en</strong> Ci<strong>en</strong>cias <strong>de</strong> <strong>la</strong> Computación, bajo <strong>la</strong> supervisión <strong>de</strong> los profesores M. Ing. Pao<strong>la</strong><br />

Britos y Dr. Ramón G<strong>ar</strong>cía M<strong>ar</strong>tínez. Dicho certam<strong>en</strong> es organizado por <strong>la</strong> Facultad <strong>de</strong><br />

Ing<strong>en</strong>iería <strong>de</strong> <strong>la</strong> Universidad Nacional <strong>de</strong> La Pampa, que se llev<strong>ar</strong>á a cabo los días 5 y 6<br />

<strong>de</strong> Mayo <strong>de</strong> 2008 <strong>en</strong> <strong>la</strong> ciudad <strong>de</strong> G<strong>en</strong>eral Pico, La Pampa.<br />

Aportes Realizados Patricio Gutiérrez Rüegg 105


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

106<br />

Patricio Gutiérrez Rüegg Aportes Realizados


8. REFERENCIAS<br />

Ale, J., 2005. Análisis <strong>de</strong> Clusters.<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Aleonada Mon, H., 2004. Una Sorda Batal<strong>la</strong> tras <strong>la</strong>s rejas.<br />

http://www.<strong>la</strong>nacion.<strong>com</strong>.<strong>ar</strong>/<strong>ar</strong>chivo/Nota.asp?nota_id=593630 .<br />

Di<strong>ar</strong>io La Nación. Bu<strong>en</strong>os Aires. Acceso Noviembre 2007.<br />

Beh<strong>ar</strong>, A.M. y Lucilli, P., 2003. Mapa <strong>de</strong>l <strong>de</strong>lito <strong>de</strong> <strong>la</strong> Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os<br />

Aires. Terceras Jornadas <strong>de</strong> Jóv<strong>en</strong>es Investigadores. Instituto Gino Germani.<br />

http://www.iigg.fsoc.uba.<strong>ar</strong>/Jov<strong>en</strong>es_investigadores/3JornadasJov<strong>en</strong>es/Temp<strong>la</strong>te<br />

s/Eje%20Po<strong>de</strong>r%20y%20Dominacion/Beh<strong>ar</strong>%20-%20Po<strong>de</strong>r.pdf<br />

Acceso Diciembre 2007.<br />

Britos, P., Hossian, A., G<strong>ar</strong>cía-M<strong>ar</strong>tínez, R. y Sierra, E., 2005. Minería <strong>de</strong> Datos<br />

Basada <strong>en</strong> Sistemas Intelig<strong>en</strong>tes. Editorial Nueva Librería. Bu<strong>en</strong>os Aires. ISBN<br />

987-1104-30-8.<br />

C<strong>ar</strong>tag<strong>en</strong>ova, S. G., 2005. Detección Automática <strong>de</strong> Reg<strong>la</strong>s <strong>de</strong> Asociación. Trabajo<br />

Final <strong>de</strong> Especialidad <strong>en</strong> Ing<strong>en</strong>iería <strong>en</strong> sistemas Expertos, Instituto Tecnológico<br />

<strong>de</strong> Bu<strong>en</strong>os Aires (ITBA).<br />

C<strong>en</strong>tro <strong>de</strong> Estudios Legales y Sociales (CELS), 2005. Co<strong>la</strong>pso <strong>de</strong>l Sistema C<strong>ar</strong>ce<strong>la</strong>rio.<br />

Editorial Siglo Veintiuno Editores. Bu<strong>en</strong>os Aires. ISBN: 987-1220-35-9.<br />

Ch<strong>en</strong>, H., Chung, W., Xu, J., Wang, G., Qin, Y., Chau, M., 2004. Crime Data Mining:<br />

A G<strong>en</strong>eral Framework and Some Examples. IEEE Computer Society, vol. 37,<br />

no.4, pp. 50-56.<br />

Ch<strong>en</strong>, H. y Han J., 1996. Data Mining: An overview from database perspective. IEEE<br />

Transactions on Knowledge and Data Engineering.<br />

COPLINK, 2007. Artificial Intellig<strong>en</strong>ce Lab. Managem<strong>en</strong>t Information Systems.<br />

Universidad Arizona. http://ai.bpa.<strong>ar</strong>izona.edu . Acceso Noviembre 2007.<br />

Corcoran, J. J., Wilson I. D., W<strong>ar</strong>e J. A. 2003. Predicting <strong>de</strong> geo-temporal v<strong>ar</strong>iations of<br />

crime and disor<strong>de</strong>r. International Journal of Forecasting.<br />

CRISP-DM, 2007. CRISP 1.0 Process and User Gui<strong>de</strong>. Cross Industry Stand<strong>ar</strong>d<br />

Process for Data Mining. http://www.crisp-dm.org/CRISPWP-0800.pdf<br />

Acceso Enero 2008.<br />

D<strong>ar</strong>oqui, A., 2008. “Trabajo y educación son una especie <strong>de</strong> ficción <strong>de</strong>ntro <strong>de</strong> <strong>la</strong><br />

cárcel”. http://www.c<strong>la</strong>rin.<strong>com</strong>/suplem<strong>en</strong>tos/zona/2008/02/24/z-03615.htm<br />

Di<strong>ar</strong>io C<strong>la</strong>rín. Bu<strong>en</strong>os Aires. Acceso Enero 2008.<br />

Dirección Nacional <strong>de</strong> Política Criminal. http://wwwpolcrim.jus.gov.<strong>ar</strong>/. Acceso<br />

Octubre 2007.<br />

Refer<strong>en</strong>cias Patricio Gutiérrez Rüegg 107


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Fayyad, U. M. y Uthurusamy R., 2002. Evolving Data Mining into Solutions for<br />

Insights. ACM. Páginas 28-31.<br />

Fayyad, U.M., Piatetsky-Shapiro G., Smyth, P., Uthurusamy, R., 1996. Advances in<br />

Knowledge and data mining. Cambridge (Massachussets): AAAI/MIT Press.<br />

Frawley W., Piatetsky-Shapiro G., Matheus C. Knowledge Discovery in Databases: An<br />

Overview. AI Magazine: pp. 213-228. ISSN 0738-4602.<br />

Han, J. y Kamber, M., 2001. Data Mining: Concepts and techniques. Morgan<br />

Kauffmann Publishers. Edición 2001.<br />

H<strong>ar</strong>ris, S., 2005. Army Project illustrates promise, short<strong>com</strong>ings of data mining.<br />

National Journal.<br />

http://www.govexec.<strong>com</strong>/story_page_pf.cfm?<strong>ar</strong>ticleid=32944&printerfri<strong>en</strong>dlyve<br />

rs=1 .Acceso Octubre 2007.<br />

H<strong>ar</strong>tigan, J.A, 1975. Clustering Algorithms. New York 1975.<br />

Hernán<strong>de</strong>z Orallo, J., Ramírez Quintana, M.J., Ferri Ramírez, C., 2004. Introducción a<br />

<strong>la</strong> Minería <strong>de</strong> Datos. Editorial Pe<strong>ar</strong>son. ISBN 84-205-40919.<br />

Ig<strong>ar</strong>zábal <strong>de</strong> Nistal, M.A., 2003. El Mapa <strong>de</strong>l Delito p<strong>ar</strong>a <strong>la</strong> Ciudad Autónoma <strong>de</strong><br />

Bu<strong>en</strong>os Aires. C<strong>en</strong>tro <strong>de</strong> Información Metropolitana. Facultad <strong>de</strong> Arquitectura,<br />

Diseño y Urbanismo. UBA. República Arg<strong>en</strong>tina.<br />

http://www.cexeci.org/IX%20CONFIBSIG/Comunicaciones/turismo,%20estudi<br />

os%20sociales%20y%20geom<strong>ar</strong>keting/Ig<strong>ar</strong>zabal%20<strong>de</strong>%20Nistal,%20A.pdf<br />

Acceso Diciembre 2007.<br />

ICPS, International C<strong>en</strong>tre for Prison Studies (ICPS), 2007.<br />

http://www.umds.ac.uk/<strong>de</strong>psta/rel/icps/home.html . Acceso Noviembre 2007.<br />

Kant<strong>ar</strong>dzic, M., 2003. Data Mining: Concepts, Mo<strong>de</strong>ls, Methods, and Algorithms. John<br />

Wiley & Sons. ISBN 0471228524.<br />

Lance, P., 2007. Def<strong>en</strong>se Intellig<strong>en</strong>ce Analysis C<strong>en</strong>ter (DIAC).<br />

http://www.peter<strong>la</strong>nce.<strong>com</strong>/Peter%20Lance/3.21.00%20Link%20Ch<strong>ar</strong>t.html<br />

Acceso Diciembre 2007.<br />

La<strong>la</strong>urette, S., 2008. Creció 50% el abuso sexual <strong>de</strong> m<strong>en</strong>ores.<br />

http://www.<strong>la</strong>nacion.<strong>com</strong>.<strong>ar</strong>/<strong>ar</strong>chivo/nota.asp?nota_id=990034. Acceso M<strong>ar</strong>zo<br />

2008.<br />

Lopez Takeyas, B, 2005. Algoritmo C4.5. Instituto Tecnológico <strong>de</strong> Nuevo L<strong>ar</strong>edo.<br />

http://www.itnuevo<strong>la</strong>redo.edu.mx/takeyas/Apuntes/Intelig<strong>en</strong>cia%20Artificial/Ap<br />

untes/t<strong>ar</strong>eas_alumnos/C4.5/C4.5(2005-II-B).pdf . Acceso M<strong>ar</strong>zo 2008.<br />

McCue, C., 2005. Data Mining and Predictive Analytics: Battlespace Aw<strong>ar</strong><strong>en</strong>ess for the<br />

W<strong>ar</strong> of Terrorism. Def<strong>en</strong>se Intellig<strong>en</strong>ce Journal. Páginas 47-63.<br />

108<br />

Patricio Gutiérrez Rüegg Refer<strong>en</strong>cias


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Molina Felix, L. C.,2002. Data Mining: Torturando a los datos hasta que confies<strong>en</strong>.<br />

Universidad Abierta <strong>de</strong> Cataluña.<br />

http://www.uoc.edu/web/esp/<strong>ar</strong>t/uoc/molina1102/molina1102.html<br />

Acceso Diciembre 2007<br />

Molt<strong>en</strong>i, S., 2007. Detección <strong>de</strong> Patrones <strong>de</strong> Producción Educativa Basada <strong>en</strong> Minería<br />

<strong>de</strong> Datos. Tesis <strong>de</strong> Grado <strong>en</strong> Ing<strong>en</strong>iería Industrial. Instituto Tecnológico <strong>de</strong><br />

Bu<strong>en</strong>os Aires. http://www.itba.edu.<strong>ar</strong>/capis/webcapis/tesisgrado/molt<strong>en</strong>itesis<strong>de</strong>grado<strong>en</strong>ing<strong>en</strong>ieria.pdf<br />

Acceso Noviembre 2007.<br />

Moody, J. y D<strong>ar</strong>k<strong>en</strong>, C., 1989. Fast Le<strong>ar</strong>ning in networks of locally tuned processing<br />

units. Neural Computation. 1989.<br />

Morris, D. y Rosales, L., 2007. Po<strong>de</strong>r político, maestros y policías. Revista Noticias.<br />

13 <strong>de</strong> Octubre <strong>de</strong>l 2007. Páginas 74-80.<br />

Neuman E. y Irurzun V., 1994. La Sociedad C<strong>ar</strong>ce<strong>la</strong>ria. Editorial Despalma.<br />

Bu<strong>en</strong>os Aires 1994.<br />

Ochoa, M. A. 2004. Herrami<strong>en</strong>tas Intelig<strong>en</strong>tes p<strong>ar</strong>a <strong>la</strong> Explotación <strong>de</strong> Información.<br />

Trabajo Final <strong>de</strong> Especialidad <strong>en</strong> Ing<strong>en</strong>iería <strong>en</strong> sistemas Expertos, Instituto<br />

Tecnológico <strong>de</strong> Bu<strong>en</strong>os Aires (ITBA).<br />

Oficina <strong>de</strong>l Inspector G<strong>en</strong>eral <strong>de</strong>l Dep<strong>ar</strong>tam<strong>en</strong>to <strong>de</strong> Justicia <strong>de</strong> los EE.UU., 2006. Able<br />

Danger Investigation Report. http://www.milnet.<strong>com</strong>/<strong>ar</strong>chives/DOD-IG-Able-<br />

Danger.pdf . Acceso Diciembre 2007.<br />

O<strong>la</strong>eta, H., 2006. Estadísticas Criminales y Sistemas <strong>de</strong> Información. Instituto<br />

Latinoamericano <strong>de</strong> Seguridad y Democracia (Ilsed).<br />

http://www.ilsed.org/in<strong>de</strong>x.php?option=<strong>com</strong>_docman&task=doc_download&gid<br />

=121. Acceso Diciembre 2007.<br />

Perversi, I., 2007. Aplicación <strong>de</strong> Minería <strong>de</strong> Datos p<strong>ar</strong>a <strong>la</strong> Exploración y Detección <strong>de</strong><br />

Patrones Delictivos <strong>en</strong> Arg<strong>en</strong>tina. Tesis <strong>de</strong> Grado <strong>en</strong> Ing<strong>en</strong>iería Industrial.<br />

Instituto Tecnológico <strong>de</strong> Bu<strong>en</strong>os Aires.<br />

http://www.itba.edu.<strong>ar</strong>/capis/webcapis/tesisgrado/PERVERSItesis<strong>de</strong>grado<strong>en</strong>ing<strong>en</strong>ieria.pdf<br />

Acceso Noviembre 2007.<br />

Petrone, D., 2005. Cárceles Sanas y Limpias: hacia un nuevo régim<strong>en</strong> p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io.<br />

Unidos por <strong>la</strong> Justicia. Bu<strong>en</strong>os Aires. ISBN: 987-21857-0-0.<br />

Prieto, C., 2005. La situación P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia <strong>en</strong> Arg<strong>en</strong>tina. Foro <strong>de</strong> Profesionales<br />

Latinoamericanos <strong>de</strong> Seguridad.<br />

http://www.foro<strong>de</strong>seguridad.<strong>com</strong>/<strong>ar</strong>tic/discipl/disc_4062.htm .Acceso Octubre<br />

2007.<br />

Quin<strong>la</strong>n, J., 1993. Programs for Machine Le<strong>ar</strong>ning. Morgan Kaufmann Publishers. .<br />

Edición 1993.<br />

Refer<strong>en</strong>cias Patricio Gutiérrez Rüegg 109


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Serv<strong>en</strong>te, M.; G<strong>ar</strong>cía-M<strong>ar</strong>tínez, R., 2002. Algoritmos TDIDT Aplicados a <strong>la</strong> Minería<br />

Intelig<strong>en</strong>te. http://www.fi.uba.<strong>ar</strong>/<strong>la</strong>boratorios/lsi/R-ITBA-26-datamining.pdf<br />

Acceso Enero 2008.<br />

Sozzo,M., 2000. Pintando a traves <strong>de</strong> numeros. Fu<strong>en</strong>tes Estadísticas <strong>de</strong> Conocimi<strong>en</strong>to y<br />

Gobierno Democrático <strong>de</strong> <strong>la</strong> Cuestión Criminal <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina. Instituto<br />

Latinoamericano <strong>de</strong> Seguridad y Democracia (Ilsed).<br />

http://www.ilsed.org/in<strong>de</strong>x.php?option=<strong>com</strong>_docman&task=doc_view&gid=159<br />

&Itemid=44 Acceso Diciembre 2007.<br />

The<strong>ar</strong>ling, K., 2007. An Overview of Data Mining Techniques.<br />

http://www.the<strong>ar</strong>ling.<strong>com</strong>/text/dmtechniques/dmtechniques.htm. Acceso<br />

Enero2008.<br />

Val<strong>en</strong>ga, F., Perversi, I., Fernán<strong>de</strong>z, E., Merlino, H., Rodríguez, D., Britos, P., G<strong>ar</strong>cía-<br />

M<strong>ar</strong>tínez, R, 2007. La Estadística Criminal y el Aporte <strong>de</strong> <strong>la</strong> Minería <strong>de</strong> Datos.<br />

En Kaminsky, G., Kosovsky,D., Kessler, G. El Delito <strong>en</strong> <strong>la</strong> Arg<strong>en</strong>tina Postcrisis.<br />

Pág. 11-24. Editado por <strong>la</strong> Friedrich Ebert Stiftung<br />

Weiss, S. M. y Indurkhya, N., 1998. Predictive Data Mining. A practical Gui<strong>de</strong>.<br />

Morgan Kauffmann Publishers. San Francisco 1998.<br />

110<br />

Patricio Gutiérrez Rüegg Refer<strong>en</strong>cias


9. ANEXOS<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 1<br />

INSTRUMENTO DE RECOLECCIÓN DE DATOS DEL SNIC<br />

Figura 9.1. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNIC [DNPC, 2007].<br />

Anexo Patricio Gutiérrez Rüegg 111


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 2<br />

INSTRUMENTO DE RECOLECCIÓN DE DATOS PARA<br />

ESTABLECIMIENTOS DE EJECUCIÓN DE PENAS PRIVATIVAS DE<br />

LIBERTAD - SNEEP<br />

112<br />

Figura 9.2. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 2 - CONTINUACIÓN<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Figura 9.3. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />

Anexo Patricio Gutiérrez Rüegg 113


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 2- CONTINUACIÓN<br />

114<br />

Figura 9.4. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 2- CONTINUACIÓN<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Figura 9.5. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />

Anexo Patricio Gutiérrez Rüegg 115


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 3<br />

INSTRUMENTO SNEEP<br />

116<br />

Anexo<br />

Figura 9.6. Instrum<strong>en</strong>to <strong>de</strong> recolección <strong>de</strong> datos <strong>de</strong>l SNEEP [DNPC, 2007].<br />

Patricio Gutiérrez Rüegg


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 3- CONTINUACIÓN<br />

CENSO PENITENCIARIO - CODIFICACIÓN DE VARIABLES<br />

(1) Nacionalidad<br />

1- Arg<strong>en</strong>tina<br />

2- Boliviana<br />

3- Brasileña<br />

4- Chil<strong>en</strong>a<br />

5- P<strong>ar</strong>aguaya<br />

6- Uruguaya<br />

7- Peruana<br />

8- Colombiana<br />

9- Ecuatoriana<br />

10- Españo<strong>la</strong><br />

11- Italiana<br />

12- Inglesa<br />

13- China<br />

14- Sudafricana<br />

15- Nigeriana<br />

16- Otras<br />

(2) Estado Civil<br />

1- Soltero<br />

2- Casado<br />

3- Viudo<br />

4- Sep<strong>ar</strong>ado o Divorciado<br />

5- Sep<strong>ar</strong>ado <strong>de</strong> Hecho<br />

6- Concubino<br />

(3) Nivel <strong>de</strong> Instrucción<br />

1- Ninguno<br />

2- Prim<strong>ar</strong>io In<strong>com</strong>pleto<br />

3- Prim<strong>ar</strong>io Completo<br />

4- Secund<strong>ar</strong>io In<strong>com</strong>pleto<br />

5- Secund<strong>ar</strong>io Completo<br />

6- Terci<strong>ar</strong>io In<strong>com</strong>pleto<br />

7- Terci<strong>ar</strong>io Completo<br />

8- Universit<strong>ar</strong>io<br />

In<strong>com</strong>pleto<br />

9- Universit<strong>ar</strong>io Completo<br />

10- EGB 1 In<strong>com</strong>pleto<br />

11- EGB 1 Completo<br />

12- EGB 2 In<strong>com</strong>pleto<br />

13- EGB 2 Completo<br />

14- EGB 3 In<strong>com</strong>pleto<br />

15- EGB 3 Completo<br />

16- Polimodal In<strong>com</strong>pleto<br />

17- Polimodal Completo<br />

(4) Situación <strong>la</strong>boral al<br />

mom<strong>en</strong>to <strong>de</strong>l ingreso<br />

1- Trabajador <strong>de</strong> tiempo<br />

<strong>com</strong>pleto<br />

2- Trabajador <strong>de</strong> tiempo<br />

p<strong>ar</strong>cial<br />

3- Desocupado<br />

(5) Capacitación Laboral<br />

al mom<strong>en</strong>to <strong>de</strong>l ingreso<br />

1- T<strong>en</strong>ía algún oficio<br />

2- T<strong>en</strong>ía alguna profesión<br />

3- No t<strong>en</strong>ía ni oficio, ni<br />

profesión<br />

(6) Lug<strong>ar</strong> <strong>de</strong> resi<strong>de</strong>ncia<br />

al mom<strong>en</strong>to <strong>de</strong>l ingreso<br />

1- Rural<br />

2- Urbano<br />

(7) Provincia <strong>de</strong><br />

resi<strong>de</strong>ncia al mom<strong>en</strong>to<br />

<strong>de</strong>l ingreso<br />

1- Bu<strong>en</strong>os Aires<br />

2- Catam<strong>ar</strong>ca<br />

3- Córdoba<br />

4- Corri<strong>en</strong>tes<br />

5- Chaco<br />

6- Chubut<br />

7- Entre Ríos<br />

8- Formosa<br />

9- Jujuy<br />

10- La Pampa<br />

11- La Rioja<br />

12- M<strong>en</strong>doza<br />

13- Misiones<br />

14- Neuquén<br />

15- Rio Negro<br />

16- Salta<br />

17- San Juan<br />

18- San Luis<br />

19- Santa Cruz<br />

20- Santa Fe<br />

21- Santiago <strong>de</strong>l Estero<br />

22- Tierra <strong>de</strong>l Fuego<br />

23- Tucumán<br />

24- Ciudad <strong>de</strong> Bu<strong>en</strong>os<br />

Aires<br />

(8) Jurisdicción Judicial<br />

1- Provincial - Bu<strong>en</strong>os<br />

Aires<br />

2- Provincial - Catam<strong>ar</strong>ca<br />

3- Provincial - Córdoba<br />

4- Provincial - Corri<strong>en</strong>tes<br />

5- Provincial – Chaco<br />

6- Provincial - Chubut<br />

7- Provincial - Entre Ríos<br />

8- Provincial – Formosa<br />

9- Provincial - Jujuy<br />

10- Provincial - La Pampa<br />

11- Provincial - La Rioja<br />

12- Provincial - M<strong>en</strong>doza<br />

13- Provincial - Misiones<br />

14- Provincial - Neuquén<br />

15- Provincial - Río Negro<br />

16- Provincial - Salta<br />

17- Provincial - San Juan<br />

18- Provincial - San Luís<br />

19- Provincial - Santa<br />

Cruz<br />

20- Provincial - Santa Fe<br />

21- Provincial - Santiago<br />

<strong>de</strong>l Estero<br />

22- Provincial - Tierra <strong>de</strong>l<br />

Fuego<br />

23- Provincial - Tucumán<br />

24- Nacional - Ciudad <strong>de</strong><br />

Bu<strong>en</strong>os Aires<br />

25- Fe<strong>de</strong>ral<br />

(9) Situación Legal<br />

1- Con<strong>de</strong>nado<br />

2- Procesado<br />

3- Contrav<strong>en</strong>tor<br />

4- Inimputable<br />

5- Otra<br />

(10) Establecimi<strong>en</strong>to <strong>de</strong><br />

Proce<strong>de</strong>ncia<br />

1- Ingreso Directo<br />

2- Derivación <strong>de</strong> otro<br />

Establecimi<strong>en</strong>to <strong>de</strong><br />

Ejecución P<strong>en</strong>al<br />

3- Derivación <strong>de</strong> una<br />

Institución Policial<br />

(alojados más <strong>de</strong> 4 días)<br />

4- Derivación <strong>de</strong> una<br />

Institución <strong>de</strong>p<strong>en</strong>di<strong>en</strong>te <strong>de</strong><br />

una fuerza <strong>de</strong> seguridad<br />

(Prefectura o<br />

G<strong>en</strong>d<strong>ar</strong>mería)<br />

(11) Tipo <strong>de</strong> <strong>de</strong>lito por el<br />

cual ingresó al<br />

Establecimi<strong>en</strong>to<br />

Anexo Patricio Gutiérrez Rüegg 117


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Delitos contra <strong>la</strong>s<br />

Personas<br />

1- Homicidios Dolosos<br />

2- Homicidios Dolosos<br />

(t<strong>en</strong>tativa)<br />

3- Homicidios Culposos<br />

4- Lesiones Dolosas<br />

5- Lesiones Culposas<br />

6- Otros Delitos contra <strong>la</strong>s<br />

personas<br />

7-Delitos contra el honor<br />

Delitos contra <strong>la</strong><br />

integridad sexual<br />

8- Vio<strong>la</strong>ciones<br />

9- Otros <strong>de</strong>litos contra <strong>la</strong><br />

honestidad<br />

Delitos contra <strong>la</strong> libertad<br />

10- Am<strong>en</strong>azas<br />

11- Privación ilegítima <strong>de</strong><br />

<strong>la</strong> libertad<br />

12- Delito contra <strong>la</strong><br />

libertad <strong>com</strong>etido por<br />

funcion<strong>ar</strong>io público<br />

13- Otros <strong>de</strong>litos contra <strong>la</strong><br />

libertad<br />

Delitos contra <strong>la</strong><br />

propiedad<br />

14- Hurto y/o t<strong>en</strong>tativa <strong>de</strong><br />

hurto<br />

15- Robo y/o t<strong>en</strong>tativa <strong>de</strong><br />

robo<br />

16- Otros <strong>de</strong>litos contra <strong>la</strong><br />

propiedad<br />

17- Delitos contra <strong>la</strong><br />

seguridad pública<br />

18- Delitos C/ el or<strong>de</strong>n<br />

público<br />

16- Otros <strong>de</strong>litos contra <strong>la</strong><br />

propiedad<br />

17- Delitos contra <strong>la</strong><br />

seguridad pública<br />

18- Delitos C/ el or<strong>de</strong>n<br />

público<br />

19- Delitos C/ <strong>la</strong><br />

seguridad <strong>de</strong> <strong>la</strong> nación<br />

20- Delitos C/ los po<strong>de</strong>res<br />

públicos<br />

21- Delitos C/ <strong>la</strong><br />

administración pública<br />

22- Delitos C/ <strong>la</strong> Fe.<br />

23- Delitos C/ el Estado<br />

Civil.<br />

24- Infracción Ley N°<br />

23.737 (Estupefaci<strong>en</strong>tes)<br />

118<br />

25- Infracción Ley N°<br />

24.769 P<strong>en</strong>al Tribut<strong>ar</strong>ia<br />

26- Infracción Ley N°<br />

13.944 Incumplimi<strong>en</strong>to <strong>de</strong><br />

<strong>de</strong>beres<br />

27- Delitos Previstos <strong>en</strong><br />

leyes especiales.<br />

28- Contrav<strong>en</strong>ciones 19-<br />

Delitos C/ <strong>la</strong> seguridad <strong>de</strong><br />

<strong>la</strong> nación<br />

(12) Trabajo<br />

Remunerado según<br />

cantidad <strong>de</strong> horas<br />

1- Hasta 10 hs. Semanales<br />

2- Hasta 20 hs. Semanales<br />

3- Hasta 30 hs. Semanales<br />

4- Hasta 40 hs. Semanales<br />

5- No ti<strong>en</strong>e trabajo<br />

remunerado<br />

(13) ¿El interno<br />

p<strong>ar</strong>ticipó regu<strong>la</strong>rm<strong>en</strong>te<br />

<strong>de</strong> algún programa <strong>de</strong><br />

Formación o<br />

Capacitación Laboral<br />

durante el último año?<br />

1- SI<br />

2- NO<br />

(14) ¿El interno<br />

p<strong>ar</strong>ticipó regu<strong>la</strong>rm<strong>en</strong>te<br />

<strong>de</strong> algún Programa<br />

Educativo durante el<br />

último año?<br />

1-SI- Educación Formal-<br />

EGB<br />

2-SI- Educación Formal-<br />

Polimodal<br />

3-SI- Educación Formal-<br />

Terci<strong>ar</strong>ia<br />

4-SI- Educación Formal -<br />

Universit<strong>ar</strong>ia<br />

5-SI- Educación NO<br />

Formal<br />

6- No p<strong>ar</strong>ticipa <strong>de</strong> ningún<br />

programa educativo<br />

(15) ¿El interno<br />

p<strong>ar</strong>ticipó regu<strong>la</strong>rm<strong>en</strong>te<br />

<strong>de</strong> Activida<strong>de</strong>s<br />

Recreativas y/o<br />

Deportivas<br />

durante el último año?<br />

1- SI<br />

2- NO<br />

(16) ¿El interno recibió<br />

Asist<strong>en</strong>cia Médica<br />

durante el último año?<br />

1- SI<br />

2- NO<br />

(17) ¿El interno recibió<br />

Visitas durante el último<br />

año?<br />

1- SI<br />

2- NO<br />

(18) ¿El interno<br />

p<strong>ar</strong>ticipó <strong>de</strong> alguna<br />

Alteración <strong>de</strong>l Or<strong>de</strong>n<br />

durante el último año?<br />

Indic<strong>ar</strong> tipo <strong>de</strong><br />

Alteración <strong>de</strong>l Or<strong>de</strong>n<br />

1- SI – Alteración <strong>de</strong>l<br />

or<strong>de</strong>n con Heridos o<br />

Muertos<br />

2- SI – Alteración <strong>de</strong>l<br />

or<strong>de</strong>n con Reh<strong>en</strong>es<br />

3- SI – Alteración <strong>de</strong>l<br />

or<strong>de</strong>n con Daños<br />

4- SI – Alteración <strong>de</strong>l<br />

or<strong>de</strong>n sin heridos, ni<br />

reh<strong>en</strong>es, ni daños.<br />

5- NO p<strong>ar</strong>ticipó <strong>de</strong><br />

ninguna alteración<br />

(19) Tipo <strong>de</strong> Infracción<br />

disciplin<strong>ar</strong>ia <strong>com</strong>etida<br />

por el interno durante el<br />

últ. Año<br />

1- Faltas graves<br />

2- Faltas medias<br />

3- Faltas leves<br />

4- NO <strong>com</strong>etió Infracción<br />

disciplin<strong>ar</strong>ia<br />

(20) Tipo <strong>de</strong> Sanciones<br />

Disciplin<strong>ar</strong>ias impuesta<br />

al interno<br />

1- Tras<strong>la</strong>do a otro<br />

establecimi<strong>en</strong>to <strong>de</strong><br />

régim<strong>en</strong> más severo<br />

2- Tras<strong>la</strong>do a otra sección<br />

<strong>de</strong> régim<strong>en</strong> más severo<br />

3- Perman<strong>en</strong>cia <strong>en</strong> su<br />

alojami<strong>en</strong>to individual o<br />

<strong>en</strong> celdas cuyas<br />

condiciones no agrav<strong>en</strong><br />

Patricio Gutiérrez Rüegg Anexo


ilegítimam<strong>en</strong>te <strong>la</strong><br />

<strong>de</strong>t<strong>en</strong>ción hasta 7 fines <strong>de</strong><br />

semana sucesivos o<br />

alternados<br />

4- Perman<strong>en</strong>cia <strong>en</strong> su<br />

alojami<strong>en</strong>to individual o<br />

<strong>en</strong> celdas cuyas<br />

condiciones no agrav<strong>en</strong><br />

ilegítimam<strong>en</strong>te <strong>la</strong><br />

<strong>de</strong>t<strong>en</strong>ción hasta 15 días<br />

ininterrumpidos<br />

5- Susp<strong>en</strong>sión o<br />

restricción total o p<strong>ar</strong>cial<br />

<strong>de</strong> los <strong>de</strong>rechos<br />

reg<strong>la</strong>m<strong>en</strong>t<strong>ar</strong>ios hasta 15<br />

días<br />

6- Exclusión <strong>de</strong> <strong>la</strong><br />

actividad <strong>com</strong>ún hasta 15<br />

días<br />

7- Exclusión <strong>de</strong> <strong>la</strong><br />

actividad recreativa o<br />

<strong>de</strong>portiva hasta 10 días<br />

8- Amonestación<br />

9- Otra sanción<br />

(22) ¿El interno tuvo<br />

int<strong>en</strong>tos <strong>de</strong> Fugas o<br />

Evasiones durante el<br />

último año?<br />

1- SI, t<strong>en</strong>tativa <strong>de</strong> Evasión<br />

2- SI, t<strong>en</strong>tativa <strong>de</strong> Fuga<br />

3- No<br />

(23) ¿El interno tuvo<br />

int<strong>en</strong>tos <strong>de</strong> Suicidio<br />

durante el último año?<br />

1- SI<br />

2- NO<br />

(24) ¿El interno fue<br />

lesionado <strong>en</strong> el<br />

establecimi<strong>en</strong>to <strong>en</strong> el<br />

último año? Motivos<br />

1- SI, por hechos <strong>de</strong><br />

viol<strong>en</strong>cia con otros<br />

internos<br />

2- SI, por hechos <strong>de</strong><br />

viol<strong>en</strong>cia con ag<strong>en</strong>tes <strong>de</strong>l<br />

establecimi<strong>en</strong>to<br />

3- SI, por otros motivos<br />

4- No fue lesionado<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

(25) ¿El interno está<br />

con<strong>de</strong>nado a Prisión o<br />

reclusión Perpetua?<br />

1- SI<br />

2- NO<br />

(26) ¿El interno ti<strong>en</strong>e<br />

Medida <strong>de</strong> Seguridad<br />

(<strong>ar</strong>t. 52 CP)?<br />

1- SI<br />

2- NO<br />

(27) Reinci<strong>de</strong>ncia<br />

1- Prim<strong>ar</strong>io<br />

2- Reiterante<br />

3- Reinci<strong>de</strong>nte (<strong>ar</strong>t. 50<br />

CP)<br />

4- Reinci<strong>de</strong>ncia múltiple<br />

(<strong>ar</strong>t. 52 CP)<br />

(28) Períodos <strong>de</strong> <strong>la</strong><br />

Progresividad <strong>de</strong>l<br />

Régim<strong>en</strong> P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />

<strong>en</strong> el último año.<br />

Artículo 12, Ley Nº<br />

24.660<br />

1- Período <strong>de</strong> observación<br />

2- Período <strong>de</strong> tratami<strong>en</strong>to<br />

3- Período <strong>de</strong> prueba<br />

4- Período <strong>de</strong> libertad<br />

condicional<br />

5- Se aplica otra<br />

c<strong>ar</strong>acterización<br />

6- No se aplica ninguna<br />

(29) ¿Ti<strong>en</strong>e o tuvo<br />

salidas transitorias <strong>en</strong> el<br />

último año? Art. 16 y 19,<br />

Ley Nº 24.660<br />

1- NO le fueron otorgadas<br />

2- SI goza <strong>de</strong> salidas<br />

transitorias<br />

3- Susp<strong>en</strong>didas durante el<br />

último año<br />

4- Revocadas durante el<br />

último año<br />

(30) ¿El Interno está<br />

incorporado al Régim<strong>en</strong><br />

<strong>de</strong> Semilibertad?<br />

Artículos 15, 19 y 23 Ley<br />

Nº 24.660<br />

1- NO está incorporado al<br />

régim<strong>en</strong> <strong>de</strong> Semilibertad<br />

2- SI está incorporado<br />

3- Susp<strong>en</strong>dido durante el<br />

último año<br />

4- Revocado durante el<br />

último año<br />

(31) ¿El Interno está<br />

incorporado a un<br />

Programa <strong>de</strong><br />

Prelibertad? Artículo 30,<br />

Ley Nº 24.660<br />

1- SI está incorporado<br />

2- No está incorporado<br />

(32) ¿El Interno cumple<br />

<strong>la</strong> p<strong>en</strong>a bajo <strong>la</strong><br />

modalidad <strong>de</strong> Prisión<br />

Discontinua?<br />

Artículos 36 y 49, Ley Nº<br />

24.660<br />

1- No está incorporado<br />

2- SI está incorporado<br />

3- Revocada durante el<br />

último año<br />

4- R<strong>en</strong>uncia <strong>de</strong>l interno<br />

durante el último año<br />

(33) ¿Al Interno se le<br />

otorgó <strong>la</strong> Semi<strong>de</strong>t<strong>en</strong>ción?<br />

Artículos 39 a 42, Ley Nº<br />

24.660<br />

1- No ti<strong>en</strong>e Semi<strong>de</strong>t<strong>en</strong>ción<br />

2- SI, Prisión Diurna<br />

3- SI, Prisión Nocturna<br />

4- Revocada durante el<br />

último año<br />

5- R<strong>en</strong>uncia <strong>de</strong>l interno<br />

durante el último año<br />

(34) ¿El interno tuvo<br />

reducción <strong>de</strong> p<strong>en</strong>a <strong>en</strong> el<br />

último año?<br />

1- SI – Hasta 6 meses<br />

2- SI – Hasta 1 año<br />

3- SI – Más <strong>de</strong> 1 año<br />

4- NO tuvo reducción <strong>de</strong><br />

p<strong>en</strong>a<br />

(35) P<strong>ar</strong>a Mujeres:<br />

¿Ti<strong>en</strong>e hijos alojados<br />

con el<strong>la</strong>? Artículo 195,<br />

Ley Nº 24.660<br />

1- SI<br />

2- NO<br />

Anexo Patricio Gutiérrez Rüegg 119


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 4<br />

POBLACIÓN DETENIDA EN COMISARIAS – AÑO 2005<br />

120<br />

PROVINCIA<br />

DETENIDOS<br />

CÁRCELES<br />

DETENIDOS<br />

COMISARIAS TOTAL<br />

SPF 9625 9,625<br />

BUENOS AIRES 24721 4,592 29,313<br />

CATAMARCA 356 107 463<br />

CÓRDOBA 5484 141 5,625<br />

CORRIENTES 700 267 967<br />

CHACO 961 96 1,057<br />

CHUBUT 933 - 933<br />

ENTRE RIOS 304 140 444<br />

FORMOSA 442 221 663<br />

JUJUY 186 67 253<br />

LA PAMPA 2464 - 2,464<br />

LA RIOJA 1074 20 1,094<br />

MENDOZA 595 No informó 595<br />

MISIONES 630 98 728<br />

NEUQUEN 1707 15 1,722<br />

RIO NEGRO 723 35 758<br />

SALTA 405 147 552<br />

SAN JUAN 116 54 170<br />

SAN LUIS 2217 No informó 2,217<br />

SANTA CRUZ 467 105 572<br />

SANTA FE 956 1,279 2,235<br />

SANTIAGO DEL ESTERO 115 45 160<br />

TIERRA DEL FUEGO 147 - 147<br />

TUCUMÁN 95 79 174<br />

GENDARMERIA (Junio 2005) 367 367<br />

PREFECTURA (Junio 2005) 59 59<br />

55,423<br />

7,934 63,357<br />

Tab<strong>la</strong> 9.1. Pob<strong>la</strong>ción <strong>de</strong>t<strong>en</strong>ida <strong>en</strong> Comis<strong>ar</strong>ías [DNPC, 2005].<br />

Relevami<strong>en</strong>to basado <strong>en</strong> datos proporcionados por el SPF y los servicios p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios<br />

o policías provinciales.<br />

Patricio Gutiérrez Rüegg Anexo


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 5<br />

EVOLUCIÓN POBLACIÓN PENITENCIARIA POR PROVINCIA – AÑO 2006<br />

Tab<strong>la</strong> 9.2. Evolución <strong>de</strong> <strong>la</strong> Pob<strong>la</strong>ción P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia <strong>en</strong> Arg<strong>en</strong>tina [DNPC, 2006].<br />

Anexo Patricio Gutiérrez Rüegg 121


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 6<br />

POBLACIÓN CARCELARIA EN EL MUNDO<br />

122<br />

Pais y Año medición<br />

Pob<strong>la</strong>ción<br />

C<strong>ar</strong>ce<strong>la</strong>ria<br />

Tasa<br />

c/100.000<br />

Estados Unidos (Jun-2006) 2,245,189 750<br />

Rusia (Jul-2007) 889,598 628<br />

Cuba (Nov-2006) 60,000 531<br />

Bielorrusia (Ene-2006) 41,538 426<br />

Puerto Rico (Jul-2006) 14,239 356<br />

Kazakhstan (Ene-2007) 51,538 348<br />

Ucrania (Feb-2007) 160,046 345<br />

Sudafrica (May-2007) 159,961 335<br />

Emiratos Arabes Unidos (Ene-2004) 8,927 288<br />

Taiwan (Abr-2007) 64,279 281<br />

Chile (May-2007) 43,723 262<br />

Tai<strong>la</strong>ndia (Dic-2006) 161,844 249<br />

Brasil (Jun-2007) 419,551 219<br />

Israel (Dic-2004) 13,909 209<br />

Mexico (May-2007) 216,290 198<br />

Uruguay (Ago-2006) 6,947 193<br />

Ing<strong>la</strong>terra y Gales (Jul-2007) 80,229 148<br />

España (Jul-2007) 66,129 147<br />

Arg<strong>en</strong>tina (Dic-2006) 54,000 139<br />

Colombia (May-2007) 60,158 128<br />

Australia (Jun-2006) 25,790 125<br />

China (Dec-2005) 1,565,771 119<br />

Canadá (M<strong>ar</strong>-2005) 34,244 107<br />

P<strong>ar</strong>aguay (Jun-2006) 6,264 98<br />

Alemania (Nov-2006) 76,629 93<br />

Francia (Sep-2006) 52,009 85<br />

Suecia (Oct-2006) 7,175 79<br />

Suiza (Sep-2006) 5,888 79<br />

Italia (Dic-2006) 39,348 67<br />

Japón (Dic-2006) 77,932 61<br />

Tab<strong>la</strong> 9.3. Pob<strong>la</strong>ción P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ia <strong>en</strong> Mundial [ICPS, 2007].<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 7<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

SERVICIO PENITENCIARIO FEDERAL: CÁRCELES Y ALCALDÍAS<br />

• Unidad 2 (cárcel <strong>de</strong> Devoto), Ciudad Autónoma <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Unidad 3, Instituto Correccional <strong>de</strong> Mujeres, Localidad <strong>de</strong> Ezeiza, Prov.<strong>de</strong> Bs.As.<br />

• Unidad 4, Colonia P<strong>en</strong>al <strong>de</strong> Santa Rosa, Provincia <strong>de</strong> La Pampa<br />

• Unidad 5, Colonia P<strong>en</strong>al Subprefecto Rocha, Provincia <strong>de</strong> Río Negro<br />

• Unidad 6, Instituto <strong>de</strong> Seguridad, Rawson, Chubut<br />

• Unidad 7, Prisión Regional <strong>de</strong>l Norte, Resist<strong>en</strong>cia, Chaco<br />

• Unidad 9, Prisión Regional <strong>de</strong>l Sur, Provincia <strong>de</strong> Neuquén<br />

• Unidad 10, Cárcel <strong>de</strong> Formosa<br />

• Unidad 11, Colonia P<strong>en</strong>al <strong>de</strong> Roque Sá<strong>en</strong>z Peña, Chaco<br />

• Unidad 12, Colonia P<strong>en</strong>al <strong>de</strong> Viedma, Río Negro<br />

• Unidad 13, Instituto Correccional <strong>de</strong> Mujeres Nuestra Sra. Del C<strong>ar</strong>m<strong>en</strong>, Santa Rosa,<br />

La Pampa<br />

• Unidad 14, cárcel <strong>de</strong> Esquel, Chubut<br />

• Unidad 15, cárcel <strong>de</strong> Río Gallegos, Santa Cruz<br />

• Unidad 17, Colonia P<strong>en</strong>al <strong>de</strong> Can<strong>de</strong><strong>la</strong>ria, Misiones<br />

• Unidad 19, Instituto Correccional Abierto <strong>de</strong> Ezeiza, Provincia <strong>de</strong> Bu<strong>en</strong>os Aires.<br />

• Unidad 20, Instituto Psiquiátrico <strong>de</strong> V<strong>ar</strong>ones, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Unidad 21, C<strong>en</strong>tro <strong>de</strong> Enfermeda<strong>de</strong>s Infectocontagiosas, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires.<br />

• Unidad 24 y 26, Complejo Fe<strong>de</strong>ral p<strong>ar</strong>a jóv<strong>en</strong>es adultos, M<strong>ar</strong>cos Paz, Prov.<strong>de</strong> Bs.As.<br />

• Unidad 25, Correccional Abierto <strong>de</strong> G<strong>en</strong>eral Pico, La Pampa<br />

• Unidad 27, Servicio Psiquiátrico C<strong>en</strong>tral <strong>de</strong> Mujeres, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Unidad 28, C<strong>en</strong>tro <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción Judicial, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Unidad 29, Alcaldía Fe<strong>de</strong>ral, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Unida 30, Instituto <strong>de</strong> Jóv<strong>en</strong>es Adultos, Dr. Julio Alfonsín<br />

• Unida 31, C<strong>en</strong>tro Fe<strong>de</strong>ral <strong>de</strong> <strong>de</strong>t<strong>en</strong>ción <strong>de</strong> mujeres, Ezeiza, Provincia <strong>de</strong> Bs. As.<br />

• Unidad 32, C<strong>en</strong>tro <strong>de</strong> Det<strong>en</strong>ción Judicial <strong>de</strong> M<strong>en</strong>doza<br />

• Complejos P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ios I y II, sitos <strong>en</strong> <strong>la</strong>s localida<strong>de</strong>s <strong>de</strong> Ezeiza y M<strong>ar</strong>cos Paz,<br />

respectivam<strong>en</strong>te. Las Unida<strong>de</strong>s 1 y 16 eran <strong>la</strong>s cárceles <strong>de</strong> Encausados <strong>de</strong> <strong>la</strong> Capital<br />

Fe<strong>de</strong>ral y <strong>la</strong> <strong>de</strong> Jóv<strong>en</strong>es Adultos, respectivam<strong>en</strong>te; <strong>la</strong> unidad 22 ya no funciona <strong>com</strong>o<br />

establecimi<strong>en</strong>to p<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io y su espacio es el que hoy correspon<strong>de</strong> a <strong>la</strong> cárcel <strong>de</strong><br />

Contrav<strong>en</strong>tores <strong>de</strong> Bu<strong>en</strong>os Aires; <strong>la</strong> unidad 23 era una cárcel <strong>de</strong> jóv<strong>en</strong>es que funcionaba<br />

<strong>en</strong> el ámbito <strong>de</strong>l Establecimi<strong>en</strong>to <strong>de</strong> Devoto.<br />

• Alcaldía Correccional Juncal, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Alcaldía P<strong>en</strong>al Coronel Paiva, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Alcaldía P<strong>en</strong>al Inspector G<strong>en</strong>eral R. Pettinato, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Alcaldía Correccional Lavalle, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Unidad 18, Casa <strong>de</strong> Preegreso, Ciudad <strong>de</strong> Bu<strong>en</strong>os Aires<br />

• Alcaldía Fe<strong>de</strong>ral <strong>de</strong> Lomas <strong>de</strong> Zamora, Provincia <strong>de</strong> Bu<strong>en</strong>os Aires;<br />

• Alcaldía Fe<strong>de</strong>ral <strong>de</strong> Salta;<br />

• Alcaldía Fe<strong>de</strong>ral <strong>de</strong> Jujuy;<br />

Anexo Patricio Gutiérrez Rüegg 123


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 8<br />

SOBREPOBLACIÓN SPF 2003<br />

124<br />

Tab<strong>la</strong> 9.4. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2003].<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 8 - CONTINUACIÓN<br />

SOBREPOBLACIÓN SPF 2004<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Tab<strong>la</strong> 9.5. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2004].<br />

Anexo Patricio Gutiérrez Rüegg 125


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 8- CONTINUACIÓN<br />

SOBREPOBLACIÓN SPF 2005<br />

126<br />

Tab<strong>la</strong> 9.6. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2005].<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 8 - CONTINUACIÓN<br />

SOBREPOBLACIÓN SPF 2006<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Tab<strong>la</strong> 9.5. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Fe<strong>de</strong>ral [DNPC, 2006].<br />

Anexo Patricio Gutiérrez Rüegg 127


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 9<br />

SOBREPOBLACIÓN SERVICIO PENITENCIARIO BONAERENSE – AÑO<br />

2006<br />

PROVINCIA ESTABLECIMIENTO CAPACIDAD DETENIDOS SOBREPOBLACION<br />

UNIDAD 1 - LISANDRO OLMOS 1,740<br />

1,727<br />

UNIDAD 2 - SIERRA CHICA 1,550<br />

1,303<br />

UNIDAD 3 - SAN NICOLAS 400<br />

463<br />

UNIDAD 4 - BAHIA BLANCA 592<br />

468<br />

UNIDAD 5 - MERCEDES 717<br />

711<br />

UNIDAD 6 - DOLORES 327<br />

327<br />

UNIDAD 7 - AZUL 266<br />

302<br />

UNIDAD 8 - LOS HORNOS 157<br />

168<br />

UNIDAD 9 - LA PLATA 1,250<br />

1,217<br />

UNIDAD 10 - MELCHOR ROMERO 280<br />

284<br />

UNIDAD 11 - BARADERO 66<br />

56<br />

UNIDAD 12 - JOAQUIN GORINA 98<br />

20<br />

UNIDAD 13 - JUNIN 748<br />

557<br />

UNIDAD 14 - GENERAL ALVEAR 48<br />

23<br />

UNIDAD 15 - BATAN 1,386<br />

1,227<br />

UNIDAD 16 - JUNIN 140<br />

138<br />

UNIDAD 17 - URDAMPILLETA 450<br />

424<br />

UNIDAD 18 - JOAQUÍN GORINA 582<br />

267<br />

UNIDAD 19 - SAAVEDRA 650<br />

584<br />

UNIDAD 20 - TRENQUEN LAUQUEN 80<br />

57<br />

UNIDAD 21 - CAMPANA 750<br />

724<br />

UNIDAD 22 - HO.G.A.M. 52<br />

29<br />

BUENOS AIRES<br />

UNIDAD 23 - FLORENCIO VARELA<br />

UNIDAD 24 - FLORENCIO VARELA<br />

772<br />

750<br />

778<br />

751<br />

UNIDAD 25 - LISANDRO OLMOS 95<br />

238<br />

UNIDAD 26 - LISANDRO OLMOS 94<br />

109<br />

UNIDAD 27 - SIERRA CHICA 140<br />

128<br />

UNIDAD 28 - MAGDALENA 646<br />

572<br />

UNIDAD 30 - GENERAL ALVEAR 1,550<br />

1,528<br />

UNIDAD 31 - FLORENCIO VARELA 499<br />

487<br />

UNIDAD 32 - FLORENCIO VARELA 468<br />

438<br />

UNIDAD 33 - LOS HORNOS (MUJERES) 338<br />

245<br />

UNIDAD 34 - MELCHOR ROMERO 362<br />

354<br />

UNIDAD 35 - MAGDALENA 850<br />

760<br />

UNIDAD 36 - MAGDALENA 650<br />

548<br />

UNIDAD 37 - BARKER 650<br />

562<br />

UNIDAD 38 - SIERRA CHICA 650<br />

644<br />

UNIDAD 39 - ITUZAINGÓ 400<br />

375<br />

UNIDAD 41 - CAMPANA 300<br />

100<br />

UNIDAD 42 - FLORENCIO VARELA 102<br />

171<br />

UNIDAD 44 - MAR DEL PLATA 45<br />

96<br />

UNIDAD 45 - MELCHOR ROMERO 250<br />

178<br />

UNIDAD 50 - MAR DEL PLATA 96<br />

52<br />

UNIDAD 51 - MAGDALENA 32<br />

55<br />

UNIDAD 52 - AZUL 96<br />

61<br />

Difer<strong>en</strong>cias Registro Gral. <strong>de</strong> Internos <strong>de</strong>l S.P. <strong>de</strong> <strong>la</strong> Prov. <strong>de</strong> Bs As. 3,572<br />

22,164<br />

23,878<br />

Tab<strong>la</strong> 9.6. Sobrepob<strong>la</strong>ción Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io Bonaer<strong>en</strong>se [DNPC, 2006].<br />

128<br />

-0.7%<br />

-15.9%<br />

15.8%<br />

-20.9%<br />

-0.8%<br />

0.0%<br />

13.5%<br />

7.0%<br />

-2.6%<br />

1.4%<br />

-15.2%<br />

-79.6%<br />

-25.5%<br />

-52.1%<br />

-11.5%<br />

-1.4%<br />

-5.8%<br />

-54.1%<br />

-10.2%<br />

-28.8%<br />

-3.5%<br />

-44.2%<br />

0.8%<br />

0.1%<br />

150.5%<br />

16.0%<br />

-8.6%<br />

-11.5%<br />

-1.4%<br />

-2.4%<br />

-6.4%<br />

-27.5%<br />

-2.2%<br />

-10.6%<br />

-15.7%<br />

-13.5%<br />

-0.9%<br />

-6.3%<br />

-66.7%<br />

67.6%<br />

113.3%<br />

-28.8%<br />

-45.8%<br />

71.9%<br />

-36.5%<br />

0.0%<br />

7.7%<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 10<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

APERTURA DEL PRESUPUESTO 2004 DEL SPF SEGÚN CONCEPTO<br />

Activida<strong>de</strong>s Comunes al Servicio P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>io<br />

Fe<strong>de</strong>ral (Programas 16,17 y 15)<br />

Seguridad y Rehabilitación <strong>de</strong>l interno<br />

Pagos a Retirados y P<strong>en</strong>sionados<br />

Cooperación Técnica y Financiera p<strong>ar</strong>a <strong>la</strong><br />

Laborterapia <strong>de</strong> Internos<br />

Formación y Capacitación<br />

Gastos <strong>de</strong> Personal $22,935,690<br />

Servicios no personales $12,290,829<br />

Bi<strong>en</strong>es <strong>de</strong> consumo $11,009,522<br />

Bi<strong>en</strong>es <strong>de</strong> uso $645,095<br />

Transfer<strong>en</strong>cias $14,246,000<br />

$61,127,136<br />

Gastos <strong>de</strong> Personal $128,772,059<br />

Servicios no personales $4,238,059<br />

Bi<strong>en</strong>es <strong>de</strong> consumo $18,095,960<br />

Bi<strong>en</strong>es <strong>de</strong> uso $420,905<br />

$151,526,983<br />

Gastos <strong>de</strong> Personal $1,107,277<br />

Servicios no personales $1,625<br />

Transfer<strong>en</strong>cias $124,737,300<br />

Gastos <strong>de</strong> Personal<br />

$125,846,202<br />

$ 686,190<br />

Servicios no personales $ 4,772,200<br />

Bi<strong>en</strong>es <strong>de</strong> consumo $ 1,414,000<br />

Bi<strong>en</strong>es <strong>de</strong> uso $ 798,000<br />

$ 7,670,390<br />

Gastos <strong>de</strong> Personal $10,389,974<br />

Servicios no personales $1,308<br />

Bi<strong>en</strong>es <strong>de</strong> consumo $998,971<br />

Transfer<strong>en</strong>cias $353,000<br />

$ 11,743,253<br />

Sub-Total $357,913,964<br />

(+) Obras P<strong>en</strong>it<strong>en</strong>ci<strong>ar</strong>ias $14,460,295<br />

Figura 9.6. Presupuesto <strong>de</strong>stinado al SPF [Petrone, 2005].<br />

Total $372,374,259<br />

Anexo Patricio Gutiérrez Rüegg 129


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 11<br />

RAMA “OFICIO – TODOS LOS DELITOS” DEL ÁRBOL DE DECISIÓN<br />

130<br />

Figura 9.7. Rama “Oficio” <strong>de</strong>l árbol <strong>de</strong> <strong>de</strong>cisión.<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 12 A<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LA PERSONAS”<br />

Figura 9.8. Rama “Sin Oficio ni Profesión – Delito contra <strong>la</strong>s Personas”.<br />

Anexo Patricio Gutiérrez Rüegg 131


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 12 B<br />

RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LA PROPIEDAD”<br />

132<br />

Figura 9.9. Rama “Sin Oficio ni Profesión – Delito contra <strong>la</strong> Propiedad”.<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 12 C<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LA INTEGRIDAD<br />

SEXUAL Y EL HONOR”<br />

Figura 9.10. Rama “Sin Oficio ni Profesión – Delito contra <strong>la</strong> Integridad Sexual y el Honor”.<br />

Anexo Patricio Gutiérrez Rüegg 133


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 12 D<br />

RAMA “SIN OFICIO NI PROFESIÓN – DELITO CONTRA LEY Nº 23.737 DE<br />

ESTUPEFACIENTES”<br />

134<br />

Figura 9.11. Rama “Sin Oficio ni Profesión – Delito contra Estupefaci<strong>en</strong>tes”.<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 13 A<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

RAMA “PROFESIÓN – DELITO CONTRA LAS PERSONAS”<br />

Figura 9.12. Rama “Profesión– Delito contra <strong>la</strong>s Personas”.<br />

Anexo Patricio Gutiérrez Rüegg 135


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 13 B<br />

RAMA “PROFESIÓN – DELITO CONTRA LA PROPIEDAD”<br />

136<br />

Figura 9.13. Rama “Profesión – Delito contra <strong>la</strong> Propiedad”.<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 13 C<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

RAMA “PROFESIÓN – DELITO CONTRA LA INTEGRIDAD SEXUAL”<br />

Figura 9.14. Rama “Profesión – Delito contra <strong>la</strong> Integridad Sexual”.<br />

Anexo Patricio Gutiérrez Rüegg 137


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

ANEXO 13 D<br />

RAMA “PROFESIÓN – DELITO DE ESTUPEFACIENTES”<br />

138<br />

Figura 9.15. Rama “Profesión - Delito contra <strong>la</strong> ley Nº 23.737 <strong>de</strong> Estupefaci<strong>en</strong>tes”.<br />

Patricio Gutiérrez Rüegg Anexo


ANEXO 14<br />

INTRODUCCIÓN AL RAPIDMINER (YALE)<br />

Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Figura 9.16. Pantal<strong>la</strong> <strong>de</strong> Bi<strong>en</strong>v<strong>en</strong>ida <strong>de</strong>l RapidMiner.<br />

Una vez elegida alguna <strong>de</strong> <strong>la</strong>s opciones <strong>de</strong> <strong>la</strong> pantal<strong>la</strong> <strong>de</strong> Bi<strong>en</strong>v<strong>en</strong>ida [Figura 9.16] <strong>com</strong>o<br />

lo pue<strong>de</strong> ser inici<strong>ar</strong> nuevos procesos, abrir exist<strong>en</strong>tes, utiliz<strong>ar</strong> asist<strong>en</strong>te <strong>de</strong> creación, etc.,<br />

se pasa a <strong>la</strong> sigui<strong>en</strong>te pantal<strong>la</strong> [Figura 9.17]:<br />

Figura 9.17. Pantal<strong>la</strong> Principal <strong>de</strong>l RapidMiner.<br />

Anexo Patricio Gutiérrez Rüegg 139


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Una vez <strong>de</strong>ntro <strong>de</strong> <strong>la</strong> pantal<strong>la</strong> principal <strong>de</strong>l programa, se pue<strong>de</strong>n realiz<strong>ar</strong> <strong>la</strong>s sigui<strong>en</strong>tes<br />

acciones:<br />

140<br />

• Cre<strong>ar</strong> Operadores:<br />

o Usando el icono <strong>de</strong> nuevo operador.<br />

o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />

<strong>de</strong> Operadores sobre cualquier operador que lo permita, se pue<strong>de</strong> elegir<br />

un nuevo operador.<br />

• Reemp<strong>la</strong>z<strong>ar</strong> Operadores:<br />

o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />

<strong>de</strong> Operadores sobre cualquier operador que lo permita, se pue<strong>de</strong><br />

reemp<strong>la</strong>z<strong>ar</strong> un nuevo operador.<br />

• Insert<strong>ar</strong> Bloques <strong>de</strong> Operadores gu<strong>ar</strong>dados:<br />

o Usando el icono <strong>de</strong> bloque gu<strong>ar</strong>dado.<br />

o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />

<strong>de</strong> Operadores sobre cualquier operador que lo permita, se agrega un<br />

bloque <strong>de</strong> operadores.<br />

• Elimin<strong>ar</strong> Operadores:<br />

o Usando el icono <strong>de</strong> remoción <strong>de</strong> operadores.<br />

o Usando el botón <strong>de</strong>recho <strong>de</strong>l mouse ubicándose <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l Árbol<br />

<strong>de</strong> Operadores sobre cualquier operador que lo permita, se elige remover<br />

operador.<br />

• Manejo <strong>de</strong> p<strong>ar</strong>ámetros:<br />

o A p<strong>ar</strong>tir <strong>de</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong> p<strong>ar</strong>ámetros se pue<strong>de</strong> pas<strong>ar</strong> <strong>de</strong> modo normal a<br />

modo experto con el icono correspondi<strong>en</strong>te:<br />

Se observa <strong>en</strong> <strong>la</strong> figura 9.18 <strong>com</strong>o se incorpora el dataset al mo<strong>de</strong>lo. Importante<br />

<strong>de</strong>stac<strong>ar</strong>, que el pres<strong>en</strong>te softw<strong>ar</strong>e ti<strong>en</strong>e <strong>la</strong> capacidad <strong>de</strong> permitir que el input operator<br />

acepte bases <strong>en</strong> distintos formatos. De <strong>la</strong> misma manera, <strong>en</strong> <strong>la</strong> figura 9.19, se muestra<br />

<strong>com</strong>o se van incorporando al mo<strong>de</strong>lo los distintos algoritmos <strong>de</strong> minería <strong>de</strong> datos. En el<br />

caso <strong>de</strong> <strong>la</strong> pres<strong>en</strong>te figura, se está agregando un algoritmo basado <strong>en</strong> árboles <strong>de</strong><br />

<strong>de</strong>cisión, que tal <strong>com</strong>o se explica anteriorm<strong>en</strong>te, es un método supervisado <strong>de</strong><br />

apr<strong>en</strong>dizaje.<br />

Patricio Gutiérrez Rüegg Anexo


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Figura 9.18. Agregado <strong>de</strong>l dataset al mo<strong>de</strong>lo <strong>de</strong> minería <strong>de</strong> datos.<br />

Figura 9.19. Agregado <strong>de</strong>l algoritmo <strong>de</strong> minería <strong>de</strong> datos.<br />

Una vez c<strong>ar</strong>gado el dataset, <strong>com</strong>o agregados los operadores <strong>de</strong> apr<strong>en</strong>dizaje neces<strong>ar</strong>ios<br />

p<strong>ar</strong>a el proceso, se re<strong>com</strong>i<strong>en</strong>da seguir los sigui<strong>en</strong>tes pasos:<br />

• Validación <strong>de</strong> <strong>la</strong> <strong>de</strong>finición <strong>de</strong> Proceso:<br />

o Una vez que se agreg<strong>ar</strong>on todos los operadores neces<strong>ar</strong>ios p<strong>ar</strong>a un<br />

proceso, es posible cheque<strong>ar</strong> si estos fueron jer<strong>ar</strong>quizados <strong>com</strong>o<br />

Anexo Patricio Gutiérrez Rüegg 141


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

142<br />

correspon<strong>de</strong> y si ti<strong>en</strong><strong>en</strong> sus <strong>en</strong>tradas (inputs) correctas y sus propieda<strong>de</strong>s<br />

bi<strong>en</strong> seteadas.<br />

o P<strong>ar</strong>a realiz<strong>ar</strong> <strong>la</strong> validación <strong>de</strong>l proceso se utiliza el sigui<strong>en</strong>te icono:<br />

o Los resultados se observan <strong>en</strong> el visor <strong>de</strong> m<strong>en</strong>sajes (pie <strong>de</strong> <strong>la</strong> pantal<strong>la</strong>) y<br />

<strong>en</strong> caso <strong>de</strong> que existiera algún tipo <strong>de</strong> error con <strong>la</strong> estructura y jer<strong>ar</strong>quía<br />

<strong>de</strong> los operadores y/o el proceso, ap<strong>ar</strong>ece un signo <strong>de</strong> exc<strong>la</strong>mación junto<br />

al operador.<br />

• Ejecución <strong>de</strong>l proceso:<br />

o Una vez validado el proceso, <strong>la</strong> ejecución consiste <strong>en</strong> hace click <strong>en</strong> el<br />

icono <strong>de</strong> ejecución:<br />

o Se pue<strong>de</strong> <strong>de</strong>t<strong>en</strong>er el proceso mediante el icono <strong>de</strong> stop:<br />

• Agregados <strong>de</strong> Puntos <strong>de</strong> Corte (BreakPoint):<br />

o Si nos ubicamos <strong>en</strong> alguno <strong>de</strong> los operadores <strong>en</strong> <strong>la</strong> l<strong>en</strong>güeta <strong>de</strong>l árbol <strong>de</strong><br />

operadores, usando el botón <strong>de</strong>recho <strong>de</strong>l mouse, se pue<strong>de</strong> elegir coloc<strong>ar</strong><br />

un Breakpoint p<strong>ar</strong>a que cuando <strong>la</strong> ejecución se inicie se pueda fr<strong>en</strong><strong>ar</strong> <strong>en</strong><br />

dicho punto y luego reanud<strong>ar</strong><strong>la</strong>.<br />

• Evaluación <strong>de</strong> Resultados:<br />

o Una vez terminada <strong>la</strong> ejecución, los resultados se pue<strong>de</strong>n observ<strong>ar</strong><br />

automáticam<strong>en</strong>te <strong>en</strong> pantal<strong>la</strong>, <strong>en</strong> lo que se <strong>de</strong>nomina Modo <strong>de</strong> Resultados<br />

(Result Mo<strong>de</strong>).<br />

o De <strong>la</strong> misma forma, se pue<strong>de</strong> volver a <strong>la</strong> pantal<strong>la</strong> <strong>de</strong> edición (Edit Mo<strong>de</strong>)<br />

con el sigui<strong>en</strong>te icono:<br />

o Des<strong>de</strong> <strong>la</strong> vista <strong>de</strong> resultados es posible, <strong>de</strong>p<strong>en</strong>di<strong>en</strong>do <strong>de</strong>l tipo <strong>de</strong><br />

resultados que <strong>ar</strong>roja el mo<strong>de</strong>lo, obt<strong>en</strong>er gráficos <strong>de</strong> distinto tipo.<br />

A modo <strong>de</strong> ejemplo, se muestra a continuación <strong>la</strong> figura 9.20, <strong>en</strong> don<strong>de</strong> se <strong>en</strong>cu<strong>en</strong>tra<br />

<strong>de</strong>s<strong>ar</strong>rol<strong>la</strong>do un árbol <strong>de</strong> operadores a punto <strong>de</strong> ser ejecutado p<strong>ar</strong>a realiz<strong>ar</strong> el proceso <strong>de</strong><br />

c<strong>la</strong>sificación con su correspondi<strong>en</strong>te análisis <strong>de</strong> performance.<br />

Patricio Gutiérrez Rüegg Anexo


Minería <strong>de</strong> Datos aplicada <strong>en</strong> Pob<strong>la</strong>ción C<strong>ar</strong>ce<strong>la</strong>ria Arg<strong>en</strong>tina.<br />

Figura 9.20. Ejemplo <strong>de</strong> árbol <strong>de</strong> operadores.<br />

Anexo Patricio Gutiérrez Rüegg 143

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!