clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

68 CAPÍTULO 3. CONJUNTOS DE ÁRBOLES IGPCART necesita construir árboles auxiliares para la poda (validación cruzada con 10 árboles).Además los árboles IGP sólo usan la mitad de los datos tanto para generar como parapodar el árbol.3.4. ConclusionesEs este capítulo se han presentado y analizado tres nuevos métodos para la construcciónde conjuntos de clasificadores: conjunto IGP, boosting IGP y Comités IGP. Todos ellosestán basados en el algoritmo de generación de árboles de decisión de crecimiento y podaiterativos (IGP) [Gelfand et al., 1991].Se ha observado que el conjunto IGP genera de forma natural un conjunto de clasificadoresdiversos sin necesidad de añadir aleatoriedad espuria en el conjunto de datos oen el procedimiento de aprendizaje. Los experimentos realizados en problemas estándarde la colección UCI muestran cómo los conjuntos de clasificadores generados asignandode manera aleatoria los ejemplos de entrenamiento a cada uno de los dos subconjuntosutilizados en el algoritmo IGP obtienen mejoras de clasificación respecto a conjuntos declasificadores generados con bagging utilizando CART como algoritmo base. Esto indicaque el conjunto IGP obtiene clasificadores suficientemente diversos a pesar de que todos seconstruyen usando los mismos ejemplos de entrenamiento.Además, se puede observar que cuando se incrementa el tamaño del conjunto de entrenamientose incrementa la mejora dada por el conjunto IGP con respecto a bagging CARTen el conjunto sintético Waveform. Esta mejora parece tener su explicación en el incrementode la diferencia de tamaño de los árboles generados. El algoritmo IGP ha obtenido en laspruebas realizadas árboles más grandes en promedio que CART. Las diferencias de errorobservadas varían en paralelo con las diferencias de tamaño en los árboles generados porlos algoritmos. Estas diferencias tanto en el tamaño de los árboles generados como en elerror se incrementan a medida que aumenta el número de ejemplos de entrenamiento.La variante de boosting con árboles IGP propuesta obtiene, en la mayoría de los problemasanalizados, un error menor que los algoritmos tipo bagging, pero presenta equivalenteso peores resultados que boosting basado en CART. Una posible explicación es que la modificaciónde los pesos dentro de los dos grupos de datos no consigue en la misma medidaque boosting que cada ejecución se centre más en los datos mal clasificados por los clasificadoresbase previamente generados.Asimismo, se ha mostrado que los Comités IGP obtienen resultados excelentes en losproblemas explorados. En la mayoría de problemas analizados, los errores de clasificaciónson equivalentes a boosting CART y, además, no presenta los problemas de generalizaciónque tiene boosting en algunos conjuntos con ruido. Parece que los comités de árbolesIGP consiguen el comportamiento robusto de bagging para no aumentar el error del algoritmobase y, al mismo tiempo, mantienen la eficacia de boosting para reducir el error en
3.4. CONCLUSIONES 69conjuntos no ruidosos.También hay que resaltar que los métodos presentados son más eficientes desde unpunto de vista computacional que los conjuntos de clasificación basados en CART. EnCART se necesita construir árboles auxiliares para obtener los parámetros de poda porvalidación cruzada (normalmente de 10 árboles) mientras que en el algoritmo IGP sólose genera un árbol por cada miembro del conjunto. Además, los pasos de crecimiento ypoda son sólo sobre la mitad de los datos, lo que conduce a una considerable reducción deltiempo de proceso. Además el algoritmo IGP converge tras pocas iteraciones (normalmente2 ó 3 iteraciones y no más de 4) en los conjuntos estudiados.Finalmente, hemos observado que el algoritmo IGP obtiene resultados equivalentes oligeramente peores que CART cuando se ejecuta individualmente. Esto contradice las conclusionesdadas en [Gelfand et al., 1991]. Puede ser debido a diferencias en la implementaciónde los algoritmos y a que los resultados experimentales expuestos en dicho artículono son muy extensos: sólo se muestran los errores para 5 ejecuciones de IGP y CART enel problema Waveform utilizando 300 ejemplos de entrenamiento.
Page 1:
Universidad Autónoma de MadridEscu
Page 5 and 6:
AgradecimientosAgradezco muy sincer
Page 7 and 8:
Índice generalAgradecimientosV1. I
Page 9:
A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13:
4.5. Número medio de clasificadore
Page 14 and 15:
3.5. Pseudocódigo de comités IGP
Page 17 and 18:
Capítulo 1IntroducciónUn clasific
Page 19 and 20:
3aparecen en el problema concreto d
Page 21 and 22:
5donde se realizan, etc [Dorronsoro
Page 23 and 24:
7algoritmo genera un árbol de deci
Page 25 and 26:
de construcción de conjuntos de cl
Page 27 and 28:
Capítulo 2Clasificación2.1. Clasi
Page 29 and 30:
2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32:
2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 33 and 34: 2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 41 and 42: 2.3. CONJUNTOS DE CLASIFICADORES 25
Page 47 and 48: 2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 55 and 56: 2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 57 and 58: 2.6. BOOSTING 41ni de los ejemplos
Page 59 and 60: 2.6. BOOSTING 43la decisión del co
Page 61 and 62: 2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64: 2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65: Parte INuevos conjuntos de clasific
Page 68 and 69: 52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 88 and 89: 72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 100 and 101: Cuadro 4.3: Resumen de registros vi
Page 111 and 112: Capítulo 5Orden de agregación y p
Page 113 and 114: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118: 5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119 and 120: 5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 121 and 122: 5.4. ALGORITMOS DE ORDENACIÓN 105M
Page 123 and 124: 5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126: 5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128: 5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130: 5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132: 5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133 and 134: 5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 135 and 136:
5.5. RESULTADOS EXPERIMENTALES 119L
Page 137 and 138:
5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140:
5.5. RESULTADOS EXPERIMENTALES 123p
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Cuadro 5.7: Media del error de entr
Page 149 and 150:
Cuadro 5.9: Prueba-t para comparar
Page 151 and 152:
5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154:
Capítulo 6Conclusiones y trabajo f
Page 155 and 156:
139primeros elementos de acuerdo co
Page 157 and 158:
Apéndice ADescripción de los conj
Page 159 and 160:
143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162:
145A.1.8.IonosphereIonosphereReposi
Page 163 and 164:
147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166:
149A.1.16.VehicleVehicle silhouette
Page 167 and 168:
151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170:
Bibliografía[Aha et al., 1991] Dav
Page 171 and 172:
BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174:
BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176:
BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178:
BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

Create successful ePaper yourself

Delete template?

Save as template?