clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

118 CAPÍTULO 5. ORDEN DE AGREGACIÓN Y PODA EN BAGGINGpara el conjunto Waveform y en 72 ocasiones se consiguió aumentar el tamaño delsubconjunto.El error de generalización para ambas ejecuciones de AG y para la ordenación porreducción de error son muy similares. El algoritmo de reducción de error obtienesubconjuntos con menor error de generalización que AG cuando se utiliza el 20 %de clasificadores en lugar del número de clasificadores que tienen menor error enentrenamiento (ver sección 5.8).Todas estas observaciones apoyan las conclusiones obtenidas de los experimentos realizadosusando búsqueda exhaustiva y nos permiten decir que las heurísticas codiciosaspropuestas (i) tienen buena capacidad de optimización —todas las heurísticas excepto ordenaciónpor ángulos se pueden considerar como un mismo algoritmo de optimizaciónque minimiza/maximiza distintas funciones—, dado que el algoritmo de ordenación obtienesubconjuntos con un error menor en entrenamiento y usando una fracción del tiemponecesario para ejecutar AG y (ii) los subconjuntos seleccionados por las heurísticas codiciosastienen buena capacidad de generalización, al menos para el algoritmo reducciónde error que obtiene un resultado mejor que AG en el conjunto de test en los problemasde clasificación estudiados cuando se usa el 20 % de clasificadores. Además, una ventajaadicional derivada del uso de heurísticas de ordenación es que se obtiene una secuencia desoluciones en vez de una solución única pudiendo ajustarse a potenciales límites de tamañoo velocidad de clasificación de forma directa.En todo caso, estas conclusiones hay que tomarlas con cautela ya que la eficacia delos AG puede ser muy distinta si se usan diferentes representaciones de los individuos ovalores de los parámetros utilizados en la optimización.5.5. Resultados experimentales5.5.1. Efecto del número de clasificadores del conjunto de partida enla ordenaciónSe ha realizado un experimento para evaluar cómo el número inicial de clasificadoresen el conjunto de bagging original afecta al funcionamiento de los conjuntos ordenados.Para este experimento se han generado conjuntos de clasificadores compuestos por 1000clasificadores individuales que han sido ordenados teniendo en cuenta sólo los primeros 11,25, 51, 75, 101, 151, 201, 251, 501, 751 y 1000 árboles respectivamente. Se han realizado100 ejecuciones usando los mismos tamaños de particiones definidos en el cuadro 5.6. Sehan usado los problemas Pima Indian Diabetes y Waveform y se han aplicado las heurísticasde ordenación de: reducción de error, minimización de distancias de margen y ordenaciónbasada en boosting.
5.5. RESULTADOS EXPERIMENTALES 119Los resultados se pueden ver en las figuras 5.8 y 5.9 para Pima Indian Diabetes yWaveform respectivamente. Estas figuras muestran por columnas los resultados medios deentrenamiento (primera columna) y test (segunda columna) y por filas los resultados usandolos algoritmos: reducción de error (primera fila), minimización de distancias de margen(segunda fila) y ordenación basada en boosting (tercera fila). En la última fila se muestra laevolución de los errores mínimos obtenidos por cada heurística de ordenación. Los puntosse han unido con rectas que sirven como guías visuales para trazar más fácilmente la evoluciónde los errores mínimos en función del tamaño del conjunto de partida: el mínimo de laordenación que ha usado 11 clasificadores se ha unido con el que ordena 25 elementos, quea su vez se ha enlazado con el de 51, etc. Por ello se observa que cuando una ordenaciónalcanza un mínimo que necesita menos clasificadores que el mínimo de otra ordenaciónque parte de un número menor de clasificadores, la línea retrocede .Las figuras 5.8 y 5.9 muestran que en entrenamiento, inicialmente, las ordenacionespresentan una tendencia de bajada muy similar. A medida que aumenta el número de clasificadoreslas curvas se van separando: las correspondientes a conjuntos con un númerototal menor generalmente comienzan a ascender antes que las correspondientes a conjuntosiniciales mayores. Las curvas apenas se cruzan unas con otras sino que se van envolviendo.Esto es razonable (sobre todo para el método reducción de error) teniendo en cuenta que seestá usando un conjunto de clasificadores incremental (todos los clasificadores de la ordenaciónque usa, por ejemplo, 251 están en la de 501, 751 y 1000) y que se minimiza unafunción basándose en una medida sobre los datos de entrenemiento.Las curvas de error de test no son tan homogéneas como las correspondientes a error deentrenamiento (sobre todo en el conjunto Pima Indian Diabetes). Las curvas muestran unabajada inicial muy parecida. Tras este descenso las curvas se separan progresivamente. Laseparación de las distintas curvas con respecto a la línea de bajada principal es distinta paraordenación por reducción de error y ordenación basada en boosting que para minimizaciónde distancias de margen. Las dos primeras heurísticas tienen un comportamiento similaral observado en entrenamiento: primero se separan por arriba aquellas curvas correspondientesa conjuntos con un número inicial menor de clasificadores. Para la heurística dereducción de distancias de margen las curvas se invierten: en las fases iniciales están porencima las curvas correspondientes a conjuntos con un número inicial mayor de elementos.Aun así el punto mínimo alcanzado tiende a ser inferior para las curvas correspondientes aconjuntos de clasificadores con más elementos.Estos resultados muestran cómo los mínimos en el conjunto de entrenamiento aparecenpara un número mucho más pequeño que en test. Como caso extremo está el algoritmode minimización de distancias de margen para 1000 árboles en el conjunto Pima IndianDiabetes. En este problema el mínimo en entrenamiento está en 5 árboles mientras que entest está por encima de 170.Los mínimos alcanzados se muestran en las gráficas inferiores de las figuras 5.8 y 5.9.
Page 1:
Universidad Autónoma de MadridEscu
Page 5 and 6:
AgradecimientosAgradezco muy sincer
Page 7 and 8:
Índice generalAgradecimientosV1. I
Page 9:
A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13:
4.5. Número medio de clasificadore
Page 14 and 15:
3.5. Pseudocódigo de comités IGP
Page 17 and 18:
Capítulo 1IntroducciónUn clasific
Page 19 and 20:
3aparecen en el problema concreto d
Page 21 and 22:
5donde se realizan, etc [Dorronsoro
Page 23 and 24:
7algoritmo genera un árbol de deci
Page 25 and 26:
de construcción de conjuntos de cl
Page 27 and 28:
Capítulo 2Clasificación2.1. Clasi
Page 29 and 30:
2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32:
2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
2.3. CONJUNTOS DE CLASIFICADORES 25
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 57 and 58:
2.6. BOOSTING 41ni de los ejemplos
Page 59 and 60:
2.6. BOOSTING 43la decisión del co
Page 61 and 62:
2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64:
2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65:
Parte INuevos conjuntos de clasific
Page 68 and 69:
52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 70 and 71:
Page 72 and 73:
Page 74 and 75:
Page 76 and 77:
Page 78 and 79:
Page 80 and 81:
Page 82 and 83:
Page 84 and 85: 68 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 86 and 87: 70 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 88 and 89: 72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 100 and 101: Cuadro 4.3: Resumen de registros vi
Page 111 and 112: Capítulo 5Orden de agregación y p
Page 113 and 114: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118: 5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119 and 120: 5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 121 and 122: 5.4. ALGORITMOS DE ORDENACIÓN 105M
Page 123 and 124: 5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126: 5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128: 5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130: 5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132: 5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133: 5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 137 and 138: 5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140: 5.5. RESULTADOS EXPERIMENTALES 123p
Page 147 and 148: Cuadro 5.7: Media del error de entr
Page 149 and 150: Cuadro 5.9: Prueba-t para comparar
Page 151 and 152: 5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154: Capítulo 6Conclusiones y trabajo f
Page 155 and 156: 139primeros elementos de acuerdo co
Page 157 and 158: Apéndice ADescripción de los conj
Page 159 and 160: 143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162: 145A.1.8.IonosphereIonosphereReposi
Page 163 and 164: 147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166: 149A.1.16.VehicleVehicle silhouette
Page 167 and 168: 151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170: Bibliografía[Aha et al., 1991] Dav
Page 171 and 172: BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174: BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176: BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178: BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?