clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

82 CAPÍTULO 4. ALTERACIÓN DE ETIQUETAS DE CLASEdel número total de ejemplos excepto para los conjuntos sintéticos y para el conjunto ImageSegmentation. En este último se han usado las particiones definidas en su documentación.Para más detalles sobre los distintos conjuntos ver apéndice A.Para cada conjunto se han llevado a cabo 100 ejecuciones. Cada ejecución incluye lossiguientes pasos:1. Generación de una partición estratificada de los datos de entrada en entrenamientoy test para los conjuntos reales y un muestreo aleatorio para los conjuntos sintéticos(ver cuadro 4.1 para ver los tamaños utilizados).2. Construcción de un árbol C4.5, y conjuntos de 1000 árboles usando: classswitchingy flipping (con los siguientes valores de ˆp: 1/5, 2/5, 3/5 y 4/5), boostingy bagging.3. Cálculo del error de los clasificadores en el conjunto de test para obtener una estimacióndel error de generalización.En total estos experimentos han involucrado 100 ejecuciones por cada una de las 15 basesde datos. En cada base de datos se han aplicado 10 configuraciones de conjuntos de clasificadoresdiferentes. Cada conjunto generado está compuesto por 1000 árboles. Esto haceque se hayan generado un total de 15 millones de árboles de decisión para este experimento.El cuadro 4.2 presenta los resultados para el promedio del error de test obtenido porC4.5 y los distintos conjuntos de clasificadores usando 1000 árboles. El menor error alcanzadopara cada problema se ha marcado en negrita y el segundo mejor se ha subrayado.La desviación estándar se muestra solamente para C4.5. Excepto en algunos casos (marcadosen cursiva en el cuadro), las desviaciones estándar de los conjuntos son menoresque las mostradas para el árbol C4.5. En resumen podemos decir que: el conjunto classswitchingobtiene 10 mejores resultados en 9 conjuntos (2 con ˆp = 4/5, 6 con ˆp = 3/5y dos con ˆp = 2/5); flipping obtiene el mejor resultado en 4 problemas (2 × ˆp = 3/5 y2× ˆp = 2/5); boosting devuelve el mejor resultado en los conjuntos sintéticos Threenorm yTwonorm y en el Tic-tac-toe y bagging es el mejor en dos conjuntos considerados difícilescomo son: Pima Indian Diabetes y Heart.En el cuadro 4.3 se muestra un cuadro resumen del funcionamiento global de los algoritmosanalizados. Esto se muestra como registros victorias/empates/derrotas, donde el(primer / segundo / tercer) número mostrado en cada celda corresponde al número de conjuntosen los que el algoritmo mostrado en la columna de la izquierda (gana / empata /pierde) con respecto al algoritmo mostrado en la primera fila. Para cada columna, se ha resaltadoel registro con mayor número de (victorias − derrotas), siempre que sea positivo.En este cuadro podemos ver que el único algoritmo que es mejor que todos los demás esclass-switching junto con ˆp = 3/5. Además, class-switching con ˆp = 3/5 y ˆp = 2/5 sonlas dos únicas configuraciones que mejoran los resultados de boosting.
Cuadro 4.2: Error medio de test (en %) usando C4.5, y 1000 clasificadores para: class-switching, flipping, boosting ybagging. El mejor resultado para cada problema se ha resaltado en negrita. El segundo mejor se ha subrayado. Promedioscon una desviación estándar mayor que la mostrada para C4.5 se muestran en cursivaC4.5 class-switching (ˆp =) flipping (ˆp =) boosting bagging4/5 3/5 2/5 1/5 4/5 3/5 2/5 1/5Australian 14.3±2.2 14.8 13.0 13.0 13.5 20.8 13.6 13.0 13.5 13.4 13.3Breast W. 5.4±1.4 3.0 3.1 3.1 3.6 34.4 7.1 3.8 3.8 3.2 3.9Diabetes 27.0±2.6 25.7 25.6 25.4 25.8 34.9 29.2 26.2 25.7 26.1 24.6German 28.9±2.2 26.7 25.0 25.1 26.8 30.0 29.9 26.7 26.3 25.5 25.7Heart 23.6±3.5 22.4 21.2 21.7 22.8 29.0 22.1 21.8 23.0 19.5 19.1Horse-colic 15.9±2.9 15.8 16.1 16.0 15.8 36.7 18.4 15.3 15.6 17.1 16.0Ionosphere 10.9±2.8 8.1 6.9 6.2 6.3 35.9 18.7 7.0 6.3 6.4 7.5New-thyroid 8.4±3.1 3.9 4.0 4.2 5.1 30.2 30.3 10.8 4.5 5.7 6.1Segment 10.3±1.4 7.6 5.5 5.7 7.0 7.5 5.5 5.7 7.1 6.5 8.1Threenorm 31.7±1.2 18.7 17.7 18.2 19.9 18.7 17.7 18.2 20.0 15.7 19.1Tic-tac-toe 17.3±2.3 6.7 3.4 3.9 6.3 34.8 19.1 6.5 6.2 1.2 8.9Twonorm 21.6±0.7 4.6 3.8 4.0 5.5 4.6 3.8 4.0 5.6 3.7 6.6Vowel 26.5±2.4 4.9 4.7 6.1 8.4 5.0 4.7 6.0 8.4 7.5 13.2Waveform 29.0±1.3 19.2 16.9 17.3 19.3 22.5 17.5 17.6 19.4 17.4 19.4Wine 9.2±4.0 2.6 1.2 1.8 3.1 7.7 1.5 1.5 3.0 4.1 6.44.4. EXPERIMENTOS EN CONJUNTOS UCI 83
Page 1:
Universidad Autónoma de MadridEscu
Page 5 and 6:
AgradecimientosAgradezco muy sincer
Page 7 and 8:
Índice generalAgradecimientosV1. I
Page 9:
A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13:
4.5. Número medio de clasificadore
Page 14 and 15:
3.5. Pseudocódigo de comités IGP
Page 17 and 18:
Capítulo 1IntroducciónUn clasific
Page 19 and 20:
3aparecen en el problema concreto d
Page 21 and 22:
5donde se realizan, etc [Dorronsoro
Page 23 and 24:
7algoritmo genera un árbol de deci
Page 25 and 26:
de construcción de conjuntos de cl
Page 27 and 28:
Capítulo 2Clasificación2.1. Clasi
Page 29 and 30:
2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32:
2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
2.3. CONJUNTOS DE CLASIFICADORES 25
Page 43 and 44:
Page 45 and 46:
Page 47 and 48: 2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 55 and 56: 2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 57 and 58: 2.6. BOOSTING 41ni de los ejemplos
Page 59 and 60: 2.6. BOOSTING 43la decisión del co
Page 61 and 62: 2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64: 2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65: Parte INuevos conjuntos de clasific
Page 68 and 69: 52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 88 and 89: 72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 100 and 101: Cuadro 4.3: Resumen de registros vi
Page 111 and 112: Capítulo 5Orden de agregación y p
Page 113 and 114: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118: 5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119 and 120: 5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 121 and 122: 5.4. ALGORITMOS DE ORDENACIÓN 105M
Page 123 and 124: 5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126: 5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128: 5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130: 5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132: 5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133 and 134: 5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 135 and 136: 5.5. RESULTADOS EXPERIMENTALES 119L
Page 137 and 138: 5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140: 5.5. RESULTADOS EXPERIMENTALES 123p
Page 147 and 148: Cuadro 5.7: Media del error de entr
Page 149 and 150:
Cuadro 5.9: Prueba-t para comparar
Page 151 and 152:
5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154:
Capítulo 6Conclusiones y trabajo f
Page 155 and 156:
139primeros elementos de acuerdo co
Page 157 and 158:
Apéndice ADescripción de los conj
Page 159 and 160:
143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162:
145A.1.8.IonosphereIonosphereReposi
Page 163 and 164:
147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166:
149A.1.16.VehicleVehicle silhouette
Page 167 and 168:
151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170:
Bibliografía[Aha et al., 1991] Dav
Page 171 and 172:
BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174:
BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176:
BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178:
BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

Create successful ePaper yourself

Delete template?

Save as template?