13.07.2015 Views

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

144 APÉNDICE A. DESCRIPCIÓN DE LOS CONJUNTOS DE DATOS UTILIZADOSA.1.6.HeartHeartRepositorio UCI(Robert Detrano - Cleveland Clinic Foundation)Datos: 270 Atributos: 13 (10 cuantitativos, 3 categóricos)Clases: 2 Distribución: 150 (ausencia) y 120 (presencia)Tipo: Real Ausentes: NoDescripción: Consiste en la identificación de ausencia o presencia de enfermedadcoronaria en pacientes a partir de: edad, sexo, tipo de dolor de pecho,pruebas médicas, etc.Observaciones: Esta base de datos fue creada en el proyecto Statlog [Michie et al.,1994] a partir de la base de datos Heart-Cleveland. La base de datosoriginal contenía 75 atributos y 5 grados de enfermedad coronaria quefueron simplificados a 13 atributos y dos clases (ausencia o presenciade enfermedad). Asimismo, se eliminaron una serie de instancias portener valores ausentes y otras causas. En el proyecto Statlog esta basede datos se utilizo con una matriz de coste que penalizaba clasificarun paciente como sano estando enfermo.A.1.7.Horse ColicHorse ColicRepositorio UCI(Mary McLeish y Matt Cecile - University of Guelph)Datos: 368 Atributos: 21 (7 cuantitativos, 14 categóricos)Clases: 2 Distribución: 232 (Sí) y 136 (No)Tipo: Real Ausentes: Sí (30 % de los valores)Descripción: A partir del estado de los caballos (pulse, temperatura de distintaspartes del cuerpo, frecuencia respiratoria, etc) determinar si la lesionera retrospectivamente para operar o noObservaciones: Existes 5 posibles campos sobre los que clasificar. Cuando se utilizaeste conjunto se eliminan los 4 campos con clases que no se usenademás de un identificador de hospital y otra variable más con todossus valores ausentes. Se trata de un problema complicado en parte porla gran cantidad de valores ausente.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!