clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

104 CAPÍTULO 5. ORDEN DE AGREGACIÓN Y PODA EN BAGGINGEn cualquier caso, el uso de un conjunto de validación fijo para todos los clasificadores ysuficientemente grande tampoco conduce a ninguna ordenación que produzca una mejoraapreciable en el error de generalización. Basándonos en estos resultados, concluimos queordenaciones guiadas por las capacidades individuales de los clasificadores del conjunto nollevan a la identificación de un subconjunto que supere al conjunto generado por baggingcompleto. Para diseñar una regla de ordenación válida es necesario tener en cuenta la complementariedadde los clasificadores. De hecho, el combinar clasificadores muy precisospero muy similares no se obtienen mejoras en la clasificación, mientras que si se combinanclasificadores diversos que compensan sus errores sí que se obtiene una mejora en laclasificación.5.4.2. Algoritmos de ordenación codiciososLos métodos de ordenación efectivos han de tener en cuenta la complementariedadentre los distintos elementos del conjunto para realizar la ordenación. Un clasificador individualpuede tener un error alto de clasificación pero su contribución puede ser importanteal combinarlo con otros clasificadores [Esposito y Saitta, 2003; 2004]. A continuación sedescriben las reglas de ordenación propuestas que siguen una estrategia codiciosa y que soneficaces para la reducción del error de generalización como veremos en la sec. 5.5. Estasreglas son: reducción de error, complementariedad, minimización de distancias de margen,ordenación por ángulos y ordenación basada en boosting. Estas reglas usan un conjunto deselección compuesto de N sel ejemplos L sel = {(x i , y i ), i = 1, 2, ..., N sel }, que en principiopuede conincidir con el conjunto de entrenamiento.Reducción de errorEste método es equivalente al presentado en [Margineantu y Dietterich, 1997] sin reajuste(backfitting). Funciona como sigue: (i) se inicializa la secuencia eligiendo el clasificadorcon menor error en el conjunto de datos de selección; (ii) a continuación se añadenclasificadores uno a uno de forma que se minimice el error del conjunto parcial de clasificadoresen el conjunto L sel . Por consiguiente, el clasificador seleccionado en la iteración ues el que maximiza la expresión()∑N sel∑u−1s u = argmax signo h k (x i ) + h st (x i ) y i , (5.2)ki=1donde el índice k tiene como rango las etiquetas de los clasificadores que no han sidoincluídos en el subconjunto de tamaño u − 1.t=1
5.4. ALGORITMOS DE ORDENACIÓN 105Medida de complementariedadEste procedimiento favorece la inclusión de clasificadores cuyo funcionamiento seacomplementario al del subconjunto ya seleccionado. Como en la regla precedente el <strong>conjuntos</strong>e inicia seleccionando el clasificador con menor error en L sel . A continuación, seconstruye el subconjunto de tamaño u a partir del de tamaño u − 1 incorporando el clasificadorque maximiza∑N sels u = argmaxki=1(( u−1I y i = h k (x i ) AND y i ≠ signo∑t=1))h st (x i ) , (5.3)donde k recorre las etiquetas de los clasificadores que aún no han sido seleccionados ydonde I(true) = 1, I(false) = 0. Esta medida se puede interpretar como la cantidadque un clasificador desplaza la decisión del conjunto hacia la clasificación correcta. Estecriterio selecciona para su inclusión en el subconjunto, el clasificador que clasifican bien elmayor número de datos donde el subconjunto parcial está fallando.Minimización de la distancia de margenConsiderando el conjunto de datos L sel compuesto de N sel elementos. Definimos c t ,como el vector característico del clasificador h t , como un vector de dimensión N sel cuyoscomponentes sonc ti = y i h t (x i ), i = 1, 2, . . . , N sel , (5.4)donde c ti es igual a 1 si h t clasifica correctamente el ejemplo i de L sel y −1 en casocontrario. La media de los vectores característicos del conjunto esc ens = 1 TT∑c t . (5.5)tEn un problema de clasificación binario, la componente i del vector característico promediodel conjunto es igual al margen del ejemplo i, definido en el intervalo [−1, 1] como ladiferencia entre los votos que recibe la clase correcta y los votos que recibe la clase incorrectamás común [Schapire et al., 1998]. En general, para problemas con múltiples clases,esta cantidad es igual a (1 − 2 edge(i)) del conjunto para el ejemplo i, donde edge se definecomo la diferencia entre los votos que recibe la clase correcta y todos los que reciben lasclases incorrectas, normalizado al intervalo [0, 1] [Breiman, 1997]. Se tiene por tanto queel ejemplo i será correctamente clasificado por el conjunto si la componente i del vectorcaracterístico promedio c ens es positiva. Esto es, un conjunto cuyo vector característico promedioesté en el primer cuadrante del espacio N sel dimensional clasificará correctamentetodos los ejemplos del conjunto L sel .
Page 1:
Universidad Autónoma de MadridEscu
Page 5 and 6:
AgradecimientosAgradezco muy sincer
Page 7 and 8:
Índice generalAgradecimientosV1. I
Page 9:
A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13:
4.5. Número medio de clasificadore
Page 14 and 15:
3.5. Pseudocódigo de comités IGP
Page 17 and 18:
Capítulo 1IntroducciónUn clasific
Page 19 and 20:
3aparecen en el problema concreto d
Page 21 and 22:
5donde se realizan, etc [Dorronsoro
Page 23 and 24:
7algoritmo genera un árbol de deci
Page 25 and 26:
de construcción de conjuntos de cl
Page 27 and 28:
Capítulo 2Clasificación2.1. Clasi
Page 29 and 30:
2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32:
2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 33 and 34:
Page 35 and 36:
Page 37 and 38:
Page 39 and 40:
Page 41 and 42:
2.3. CONJUNTOS DE CLASIFICADORES 25
Page 43 and 44:
Page 45 and 46:
Page 47 and 48:
2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 49 and 50:
Page 51 and 52:
Page 53 and 54:
Page 55 and 56:
2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 57 and 58:
2.6. BOOSTING 41ni de los ejemplos
Page 59 and 60:
2.6. BOOSTING 43la decisión del co
Page 61 and 62:
2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64:
2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65:
Parte INuevos conjuntos de clasific
Page 68 and 69:
52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 70 and 71: 54 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 88 and 89: 72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 100 and 101: Cuadro 4.3: Resumen de registros vi
Page 111 and 112: Capítulo 5Orden de agregación y p
Page 113 and 114: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116: 5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118: 5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119: 5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 123 and 124: 5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126: 5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128: 5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130: 5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132: 5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133 and 134: 5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 135 and 136: 5.5. RESULTADOS EXPERIMENTALES 119L
Page 137 and 138: 5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140: 5.5. RESULTADOS EXPERIMENTALES 123p
Page 147 and 148: Cuadro 5.7: Media del error de entr
Page 149 and 150: Cuadro 5.9: Prueba-t para comparar
Page 151 and 152: 5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154: Capítulo 6Conclusiones y trabajo f
Page 155 and 156: 139primeros elementos de acuerdo co
Page 157 and 158: Apéndice ADescripción de los conj
Page 159 and 160: 143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162: 145A.1.8.IonosphereIonosphereReposi
Page 163 and 164: 147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166: 149A.1.16.VehicleVehicle silhouette
Page 167 and 168: 151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170: Bibliografía[Aha et al., 1991] Dav
Page 171 and 172:
BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174:
BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176:
BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178:
BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?