clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

2 CAPÍTULO 1. INTRODUCCIÓNpartir de las distribuciones de probabilidad (desconocidas) del problema. Asimismo, suponemosque las distribuciones de probabilidad de los problemas que analizamos tienen unavariación suave. Además, suponemos que el muestreo de los ejemplos de entrenamiento seha realizado con una frecuencia suficientemente alta como para que las distintas regionesdel espacio de atributos relevantes a la clasificación estén bien representadas. Finalmente,dado que los modelos generados son estáticos, consideramos que las distribuciones deprobabilidad del problema son estacionarias, es decir, que no cambian con el tiempo.En general, el proceso completo de un sistema de reconocimiento automático se puededividir en recolección de la información, selección y codificación de atributos, eleccióndel algoritmo a aplicar y construcción y validación del modelo [Duda et al., 2001]. Esteproceso se representa esquemáticamente en la figura 1.1 y se describe a continuación.El primer paso de todo sistema de reconocimiento de patrones es la recolección de lainformación relevante al problema <strong>mediante</strong> sensores u otros medios. En muchas ocasionesel diseñador del sistema de reconocimiento no podrá actuar sobre esta fase del diseño yaque el planteamiento del problema puede ser posterior a la recogida de la información.A continuación, se debe elegir los atributos y codificarlos. Este paso es crítico, ya que nose podrán generar modelos eficaces si no se seleccionan características relevantes al problemade clasificación. El conocimiento experto sobre el problema puede ayudar a identificarlos atributos más adecuados y facilitar así la tarea del algoritmo de clasificación. Tanto enla fase de recolección de la información como en la de codificación se puede introducirruido en los datos, sea por errores de asignación de etiquetas, o por atributos cuyos valoresson erróneos debido a fallos en los detectores, etc. Estos errores en las primeras fasesgeneralmente limitan la fiabilidad de los modelos obtenidos.Una vez que se dispone de los datos codificados se debe elegir el modelo que se consideremás adecuado para el problema. Éste debe ser lo suficientemente complejo comopara capturar la información contenida en los ejemplos y suficientemente robusto comopara no ser sensible a fluctuaciones de muestreo u otros tipos de ruido en los datos. Generalmente,se tiene una preferencia (sesgo) por el modelo más sencillo posible que expliquelos ejemplos de entrenamiento (navaja de Occam, [Blumer et al., 1990]). Estesesgo aplicado a aprendizaje automático indica que a igual error en los ejemplos disponiblespara el entrenamiento se debe elegir el modelo menos complejo. Sin embargo,es importante hacer notar que esta preferencia no conduce necesariamente a la construcciónde un clasificador que generalice mejor: un ejemplo no visto en entrenamiento estarábien clasificado exactamente por la mitad de las hipótesis compatibles con el conjuntode entrenamiento en problemas de dos clases con atributos discretos [Mitchell, 1980;1990]. De hecho, se puede demostrar que, realizando un promedio uniforme sobre todoslos problemas de clasificación, el error esperado de generalización cometido por todos losalgoritmos de clasificación es el mismo (No Free Lunch Theorem, [Wolpert, 1995]). Portanto, la elección del modelo de clasificación se debe basar en elegir familias de clasificadorescuyo sesgo permita identificar preferentemente patrones del mismo tipo que los que
3aparecen en el problema concreto de clasificación que se esté abordando [Mitchell, 1980;1990]. La experiencia previa en el diseño de estos sistemas puede ser muy útil para la rápidadeterminación del modelo a utilizar. Una vez elegido el modelo, éste se entrena con losdatos de ejemplo y posteriormente se valida usando datos independientes de los empleadosen el aprendizaje. Si los resultados no son los esperados y el modelo comete más erroresde lo deseable entonces hay que replantearse uno o varios de los pasos previos. Es posibleque haya que ajustar los parámetros del algoritmo ((a) en la figura 1.1) o que el modeloelegido no tenga un sesgo que le permita captar regularidades en el problema (b) o que losatributos no se hayan escogido correctamente (c) o que se haya partido de una informaciónespuria o no relevante para el problema de clasificación (d). En cualquiera de estos casosse deberá retomar el proceso desde el punto donde se ha detectado el fallo.Figura 1.1: Diseño de un sistema de reconocimiento de patrones (adaptado de [Duda et al.,2001])El aprendizaje automático abarca una multitud de técnicas y de aplicaciones tanto deapoyo al experto como para sistemas autónomos. A continuación destacaremos algunasaplicaciones:Identificación de coberturas terrestres con imágenes de satélite. La generación automáticao semi-automática de mapas de usos del suelo a partir de imágenes multiespectralesde satélite se basa en la clasificación de los valores digitales de los píxeles
Page 1: Universidad Autónoma de MadridEscu
Page 5 and 6: AgradecimientosAgradezco muy sincer
Page 7 and 8: Índice generalAgradecimientosV1. I
Page 9: A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13: 4.5. Número medio de clasificadore
Page 14 and 15: 3.5. Pseudocódigo de comités IGP
Page 17: Capítulo 1IntroducciónUn clasific
Page 21 and 22: 5donde se realizan, etc [Dorronsoro
Page 23 and 24: 7algoritmo genera un árbol de deci
Page 25 and 26: de construcción de conjuntos de cl
Page 27 and 28: Capítulo 2Clasificación2.1. Clasi
Page 29 and 30: 2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32: 2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 41 and 42: 2.3. CONJUNTOS DE CLASIFICADORES 25
Page 47 and 48: 2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 55 and 56: 2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 57 and 58: 2.6. BOOSTING 41ni de los ejemplos
Page 59 and 60: 2.6. BOOSTING 43la decisión del co
Page 61 and 62: 2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64: 2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65: Parte INuevos conjuntos de clasific
Page 68 and 69:
52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 70 and 71:
Page 72 and 73:
Page 74 and 75:
Page 76 and 77:
Page 78 and 79:
Page 80 and 81:
Page 82 and 83:
Page 84 and 85:
Page 86 and 87:
Page 88 and 89:
72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Cuadro 4.3: Resumen de registros vi
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 111 and 112:
Capítulo 5Orden de agregación y p
Page 113 and 114:
5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116:
5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118:
5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119 and 120:
5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 121 and 122:
5.4. ALGORITMOS DE ORDENACIÓN 105M
Page 123 and 124:
5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126:
5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128:
5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130:
5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132:
5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133 and 134:
5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 135 and 136:
5.5. RESULTADOS EXPERIMENTALES 119L
Page 137 and 138:
5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140:
5.5. RESULTADOS EXPERIMENTALES 123p
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Cuadro 5.7: Media del error de entr
Page 149 and 150:
Cuadro 5.9: Prueba-t para comparar
Page 151 and 152:
5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154:
Capítulo 6Conclusiones y trabajo f
Page 155 and 156:
139primeros elementos de acuerdo co
Page 157 and 158:
Apéndice ADescripción de los conj
Page 159 and 160:
143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162:
145A.1.8.IonosphereIonosphereReposi
Page 163 and 164:
147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166:
149A.1.16.VehicleVehicle silhouette
Page 167 and 168:
151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170:
Bibliografía[Aha et al., 1991] Dav
Page 171 and 172:
BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174:
BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176:
BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178:
BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

Create successful ePaper yourself

Delete template?

Save as template?