clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior clasificaci´on mediante conjuntos - Escuela Politécnica Superior

13.07.2015 Views

140 CAPÍTULO 6. CONCLUSIONES Y TRABAJO FUTUROEn cuanto a desarrollos futuros, dentro de los métodos basados en árboles IGP, seríainteresante analizar su comportamiento en un rango mayor de problemas de clasificación,así como analizar la diversidad de los clasificadores que obtiene y compararla con la obtenidapor bagging y boosting.De más interés sería el análisis de la diversidad de los clasificadores generados con elmétodo class-switching, ya que se debería ver una relación bastante directa entre el porcentajede ejemplos modificados y las nubes obtenidas en los diagramas kappa-error. Asimismo,puede ser muy interesante la combinación del análisis de diversidad con una modificacióndel algoritmo de alteración de etiquetas de clase (como el presentado en [Kuncheva yKountchev, 2002]) para que generara clasificadores con distintas medidas de diversidad yno estrictamente independientes como los que produce el método propuesto.Por otro lado, los métodos de ordenación propuestos se pueden aplicar a una gran variedadde conjuntos y problemas. La extensión más inmediata del trabajo presentado seríaaplicarlo a otros conjuntos compuestos por otro tipo de clasificadores como por ejemploa conjuntos de redes neuronales. Asimismo estos métodos con pequeñas adaptaciones sepodrían aplicar a regresión. La regla de reducción de error adaptada a regresión podríabuscar el regresor que más reduzca el error cuadrático medio. La medida de complementariedadpuede seleccionar el regresor que reduzca el error cuadrático medio del mayornúmero de ejemplos.Por otro lado, y espoleados por la observación de que las heurísticas propuestas noson útiles para ordenar conjuntos formados por clasificadores que tienen una capacidadexpresiva elevada, habría que analizar más en profundidad cómo varía la capacidad degeneralización de los subconjuntos obtenidos por ordenación y poda con la capacidad derepresentación del clasificador individual. Por ejemplo variando la tasa de poda de los árbolesgenerados en el conjunto pasando de árboles no podados a árboles con una sola pregunta(Decision Stump), o modificando el número de neuronas en la capa oculta de una red neuronal.Estudios preliminares han mostrado que la ordenación y poda de class-switching,bagging con árboles sin podar o con redes neuronales con muchos nodos en la capa ocultano mejoran significativamente la capacidad de generalización de los conjuntos.Finalmente es necesario profundizar en el análisis de la dependencia de las curvas deerror de generalización con el número de clasificadores para los conjuntos ordenados (y sinordenar). Esto permitiría dar una estimación más precisa de la posición del mínimo.

Apéndice ADescripción de los conjuntos de datosutilizadosA.1.1.AudioAudiology-standarizedRepositorio UCI(Professor Jergen at Baylor College of Medicine)Datos: 226 Atributos: 69 categóricos de los cuales 60 binariosClases: 24 Distribución: 1 (x5), 2 (x7), 3, 4 (x3), 6, 8, 9, 20, 22 (x2), 48y 57Tipo: Real Ausentes: Sí (317 valores: 2 %)Descripción:Observaciones:Identificación de afecciones del oído.Conjunto con muchas clases con muy pocos ejemplos: 16 clasescon menos de 5 ejemplos y 5 clases con un solo dato. Esto haceque sea prácticamente imposible de predecir correctamente (siemprehabrá clases que o aparecen en entrenamiento o en test pero no en losdos).141

Apéndice ADescripción de los <strong>conjuntos</strong> de datosutilizadosA.1.1.AudioAudiology-standarizedRepositorio UCI(Professor Jergen at Baylor College of Medicine)Datos: 226 Atributos: 69 categóricos de los cuales 60 binariosClases: 24 Distribución: 1 (x5), 2 (x7), 3, 4 (x3), 6, 8, 9, 20, 22 (x2), 48y 57Tipo: Real Ausentes: Sí (317 valores: 2 %)Descripción:Observaciones:Identificación de afecciones del oído.Conjunto con muchas clases con muy pocos ejemplos: 16 clasescon menos de 5 ejemplos y 5 clases con un solo dato. Esto haceque sea prácticamente imposible de predecir correctamente (siemprehabrá clases que o aparecen en entrenamiento o en test pero no en losdos).141

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!