clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

40 CAPÍTULO 2. CLASIFICACIÓNaumentan el error del clasificador base.En otro estudio [Grandvalet, 2004] (aplicado a regresión solamente) se muestra cómobagging realiza una nivelación (equalization) de la influencia de los ejemplos reduciendo laimportancia de los puntos de palanca (leverage points), aquéllos que tienen gran influenciaen los regresores. Esto explica por qué bagging es más robusto frente a puntos anómalos(outliers) en contraste con otros algoritmos. Sin embargo en este estudio muestran cómobagging puede ser perjudicial cuando los puntos de palanca no son anómalos sino beneficiosospara la estimación.Como ya hemos mencionado, bagging descarta en media un 36.8 % de los datos de entrenamientopara construir cada clasificador base. A este conjunto se le denomina conjuntoout-of-bag. Los conjuntos out-of-bag pueden ser utilizados para hacer buenas estimacionesdel error de generalización del conjunto [Breiman, 1996c]. La estimación out-of-bag delerror de generalización consiste en utilizar para cada ejemplo sólo las predicciones de losclasificadores que no han visto ese ejemplo. De esta forma el error sobre cada ejemplo secalcula agregando sólo las predicciones de estos clasificadores. Para calcular la estimacióndel error de generalización del conjunto se promedian estos errores sobre todos los datosde entrenamiento. Este método tiene la ventaja de ser muy eficiente computacionalmentecon respecto a otros métodos utilizados para calcular el error de generalización, como validacióncruzada, que deben generar clasificadores adicionales. Otro método eficiente paracalcular el error de generalización aplicado a conjuntos bagging para regresión de describeen [Wolpert y Macready, 1999].Double-bagging es una variante de bagging que aprovecha el conjunto out-of-bag decada muestreo bootstrap para construir un discriminante lineal [Hothorn y Lausen, 2003].Posteriormente, construye a partir de la muestra bootstrap el clasificador base usando losatributos originales del problema junto con las variables obtenidas por el discriminante linealque ha usado el conjunto out-of-bag. El conjunto de clasificadores resultante obtieneresultados equivalentes a un discriminante lineal cuando las clases son separables linealmentey equivalentes a bagging en caso contrario.Es interesante hacer notar que en bagging el número total de veces que ha aparecidocada ejemplo en entrenamiento sumado sobre todos los muestreos bootstrap no es constante,aunque tiende a equilibrarse al aumentar el número de clasificadores. Sin embargo,en una ejecución típica de bagging con 100 clasificadores no es difícil que haya ejemplosque aparezcan el doble de veces que otros [Christensen et al., 2003]. En esta referenciase presenta una variante de bagging que consiste en forzar a que el número de veces queaparece cada ejemplo en el proceso total de construcción del conjunto sea constante.En cuanto al estudio del margen, en [Schapire et al., 1998] se muestra que baggingaumenta el margen cuando se incrementa el número de clasificadores. Sin embargo, esteaumento ocurre lentamente, o al menos más lentamente que en boosting. Esto parece lógicoya que bagging es un algoritmo “neutro” con los ejemplos, es decir, construye clasificadoressin tener en cuenta ninguna información ni de los clasificadores previamente construidos
2.6. BOOSTING 41ni de los ejemplos de entrenamiento utilizados para construir cada clasificador. Esto haceque bagging se pueda implementar fácilmente en paralelo ya que la construcción de cadaclasificador base es completamente independiente del resto de clasificadores. Se puede, portanto, generar cada clasificador base en un proceso distinto y combinarlos al final.2.6. BoostingOtra de las técnicas más difundidas y eficaces para la construcción de conjuntos de clasificadoreses Boosting [Freund y Schapire, 1995]. Boosting es una técnica que conviertecualquier aprendiz débil en uno fuerte [Schapire, 1990] (donde por clasificador débil seentiende aquel clasificador que consigue un error un poco mejor que predicción aleatoriamientras que fuerte es aquel método que clasifica bien el concepto excepto por una pequeñafracción de ejemplos). Boosting aprovecha el comportamiento de los clasificadoresbase previamente construidos para generar los siguientes. Breiman designó en [Breiman,1996b] este tipo de algoritmos adaptativos con el nombre de arcing (adaptively resampleand combine). En boosting este proceso adaptativo se consigue asignando pesos a losejemplos de entrenamiento y modificando dichos pesos de acuerdo con los resultados delúltimo clasificador generado. La modificación de pesos se hace de forma que los ejemplosmal clasificados por un clasificador aumenten en importancia para construir el siguienteclasificador. Boosting es el primer algoritmo de arcing desarrollado y el más difundido,aunque no el único. Existen otros algoritmos de arcing como el algoritmo arc-x4 desarrolladopor Breiman [Breiman, 1998], que funciona también dando pesos a los ejemplos. Enarc-x4, después de construir cada clasificador se modifican los pesos multiplicándolos por1 + m(i) 4 , donde m(i) es el número de veces que el ejemplo i ha sido mal clasificado portodos los anteriores clasificadores, y normalizando los pesos posteriormente. De aquí enadelante denominaremos a los algoritmos adaptativos como algoritmos tipo boosting porser éste el término utilizado para definir al primer algoritmo de este tipo.Veamos ahora el funcionamiento de AdaBoost.M1 [Freund y Schapire, 1995], uno delos primeros algoritmos de boosting desarrollados. El pseudocódigo de este algoritmo semuestra en la fig. 2.7. Dado un conjunto de datos de entrenamiento i = 1, 2, ..., N y unconjunto de clasificadores a construir t = 1, 2, ..., T , se asocia un peso por dato de entrenamientoy clasificador, w t [i], inicializando los pesos iniciales según w 1 [i] = 1/N (línea1). Es decir, al principio, todos los ejemplos tienen igual importancia para construir el primerclasificador individual. A continuación se realiza un bucle de T iteraciones donde seconstruye cada clasificador individual. Dentro del bucle: se construye un clasificador baseh t usando todos los datos de entrenamiento ponderados con pesos w t (línea 3); se calculael error ɛ t para el clasificador h t con respecto a los datos de entrenamiento L como la sumade los pesos de los ejemplos mal clasificados (línea 4); Si ɛ t ≥ 0.5 o ɛ t = 0 entonces elproceso termina, descartando el último clasificador si ɛ t ≥ 0.5 y dándole el máximo peso si
Page 1:
Universidad Autónoma de MadridEscu
Page 5 and 6: AgradecimientosAgradezco muy sincer
Page 7 and 8: Índice generalAgradecimientosV1. I
Page 9: A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13: 4.5. Número medio de clasificadore
Page 14 and 15: 3.5. Pseudocódigo de comités IGP
Page 17 and 18: Capítulo 1IntroducciónUn clasific
Page 19 and 20: 3aparecen en el problema concreto d
Page 21 and 22: 5donde se realizan, etc [Dorronsoro
Page 23 and 24: 7algoritmo genera un árbol de deci
Page 25 and 26: de construcción de conjuntos de cl
Page 27 and 28: Capítulo 2Clasificación2.1. Clasi
Page 29 and 30: 2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32: 2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 41 and 42: 2.3. CONJUNTOS DE CLASIFICADORES 25
Page 47 and 48: 2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 55: 2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 59 and 60: 2.6. BOOSTING 43la decisión del co
Page 61 and 62: 2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64: 2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65: Parte INuevos conjuntos de clasific
Page 68 and 69: 52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 88 and 89: 72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 100 and 101: Cuadro 4.3: Resumen de registros vi
Page 106 and 107:
90 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 108 and 109:
92 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 111 and 112:
Capítulo 5Orden de agregación y p
Page 113 and 114:
5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116:
5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118:
5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119 and 120:
5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 121 and 122:
5.4. ALGORITMOS DE ORDENACIÓN 105M
Page 123 and 124:
5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126:
5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128:
5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130:
5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132:
5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133 and 134:
5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 135 and 136:
5.5. RESULTADOS EXPERIMENTALES 119L
Page 137 and 138:
5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140:
5.5. RESULTADOS EXPERIMENTALES 123p
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Cuadro 5.7: Media del error de entr
Page 149 and 150:
Cuadro 5.9: Prueba-t para comparar
Page 151 and 152:
5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154:
Capítulo 6Conclusiones y trabajo f
Page 155 and 156:
139primeros elementos de acuerdo co
Page 157 and 158:
Apéndice ADescripción de los conj
Page 159 and 160:
143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162:
145A.1.8.IonosphereIonosphereReposi
Page 163 and 164:
147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166:
149A.1.16.VehicleVehicle silhouette
Page 167 and 168:
151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170:
Bibliografía[Aha et al., 1991] Dav
Page 171 and 172:
BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174:
BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176:
BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178:
BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?