13.07.2015 Views

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

124 CAPÍTULO 5. ORDEN DE AGREGACIÓN Y PODA EN BAGGINGCuadro 5.6: Conjuntos de datos usados en los experimentosProblema Entrenamiento Test Atributos ClasesAudio 140 86 69 24Australian 500 190 14 2Breast W. 500 199 9 2Diabetes 468 300 8 2German 600 400 20 2Heart 170 100 13 2Horse-Colic 244 124 21 2Ionosphere 234 117 34 2Labor 37 20 16 2New-thyroid 140 75 5 3Segment 210 2100 19 7Sonar 138 70 60 2Tic-tac-toe 600 358 9 2Twonorm 300 5000 20 2Vehicle 564 282 18 4Vowel 600 390 10 11Waveform 300 5000 21 3Wine 100 78 13 34. Evaluación de los <strong>conjuntos</strong> ordenados en el conjunto de test usando 10 %, 20 %y 40 % de los clasificadores (esto es, podas del 90 %, 80 % y 60 %) del conjuntooriginal.Estos resultados se presentan gráficamente en las figuras 5.10–5.14 en las que se muestrael error medio de entrenamiento y test en función del número de clasificadores paratodos los problemas estudiados. Las distintas curvas corresponden a distintos ordenes deagregación: la línea continua roja corresponde al orden inicial de bagging, que es aleatorio.Las líneas discontinuas (y con distinto color) corresponden a ordenaciones realizadas con:reducción de error (verde), complementariedad (azul oscuro), minimización de distanciade margen con p = 0.075 (rosa), ordenación por ángulos (azul claro) y ordenación basadaen boosting (negro). Estas figuras ilustran la dependencia del error de clasificación conrespecto al número de clasificadores. Tal como se esperaba, en los <strong>conjuntos</strong> ordenadosaleatoriamente el error disminuye generalmente de forma monótona a medida que se incrementael número de clasificadores, hasta que alcanza asintóticamente un valor constante deerror. Por el contrario, los <strong>conjuntos</strong> ordenados presentan curvas para los errores de test conun mínimo para un número intermedio de clasificadores. Además, para todos sub<strong>conjuntos</strong>,exceptuando los más pequeños, el error de generalización de las curvas ordenadas está por

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!