clasificaci´on mediante conjuntos - Escuela Politécnica Superior

More documents

Recommendations

Info

18 CAPÍTULO 2. CLASIFICACIÓNEl segundo defecto es menos cuantificable. Parece que este criterio no genera divisionesbeneficiosas para el proceso global de construcción del árbol [Breiman et al., 1984]. Enel algoritmo CART [Breiman et al., 1984] se elige una función local de coste i(t) queselecciona para cada nodo t la pregunta que maximiza la variación de la impureza del nodopara todas las divisiones posibles del conjunto de datos pertenecientes a U(t). La variaciónde la impureza, ∆i(t), se define como∆i(t) = i(t) − (i(t L )p L + i(t R )p R ) ,donde p R y p L son la proporción de ejemplos de contenidos en U(t) que, después de ladivisión, caen en los nodos hijos t R y t L respectivamente, esto esp L = p(t L)p(t) , p R = p(t R) N(t), p(t) =p(t) N .La función de impureza i(t) se define en función de las probabilidades p(j|t) de cadaclase dentro de la región definida por el nodo ti(t) = i(p(1|t), . . . , p(C|t)) . (2.9)En [Breiman et al., 1984] se establecen una serie de propiedades que debe cumplir lafunción de impureza definida en la ec. (2.9). Estas son:1. Debe ser máxima sólo en el punto (1/C, 1/C, . . . , 1/C). Es decir, la impureza de unnodo es máxima si la distribución de ejemplos de cada clase es uniforme.2. Debe alcanzar mínimos únicamente en los puntos: (1, 0, . . . , 0), (0, 1, . . . , 0), . . . y(0, 0, . . . , 1). Esto indica que la impureza de un nodo es mínima si sólo existen datosde una clase (nodo puro).3. Suponiendo que todas las clases son equivalentes, debe ser una función simétrica enp(1|t), p(2|t), . . . y p(C|t).Una función de impureza i(t) que cumpla estos criterios tiene la propiedad que ∆i(t) ≥0 para todo t y toda posible división del espacio [Breiman et al., 1984]. Esto es, la impurezanunca se incrementa cuando se hace crecer el árbol independientemente de cómo seelijan las divisiones. En cualquier caso se buscarán divisiones del espacio de atributos queconduzcan a la mayor homogeneidad de clases posible dentro de los nodos hijos. Se buscapor tanto maximizar ∆i(t) con respecto a las divisiones posibles del espacio, S. Esto esmáx∆i(s, t) = máx [i(t) − (i(t L)p L + i(t R )p R )] . (2.10)s∈S s∈S
2.2. ÁRBOLES DE DECISIÓN: CART Y C4.5 19La búsqueda del test óptimo para atributos continuos usando divisiones ortogonales alos ejes puede parecer costosa computacionalmente ya que el umbral puede tomar cualquiervalor del rango de los reales. Sin embargo, sólo existe un número finito de divisiones queconduzcan a particiones de los datos de entrenamiento distintas. Consideremos un atributoordinal x m . Dado que estamos trabajando con un número N finito de datos de entrenamiento,este atributo tiene como máximo N valores distintos, que ordenados y eliminando losvalores repetidos, los podemos denotar por {v 1 , v 2 , . . . , v n } con n ≤ N y con v i < v i+1 .Para cualquier umbral de corte c elegido entre dos valores contiguos v i y v i+1 se obtienela misma variación de impureza (ec. (2.10)), ya que se divide el conjunto {v 1 , v 2 , . . . , v n }en los mismos subconjuntos {v 1 , v 2 , . . . , v i } y {v i+1 , v i+2 , . . . , v n }. Por tanto, el número dedivisiones a comprobar para cada atributo ordinal usando divisiones ortogonales a los ejeses n − 1 (cuyo valor máximo es N − 1). El umbral elegido por CART una vez seleccionadala división es el punto medio ((v i + v i+1 )/2). En C4.5 se toma el umbral con valor v i con elfin de que los umbrales del árbol sean valores que aparecen en el conjunto de entrenamiento.La complejidad computacional de este enfoque para calcular la división óptima aumentaa medida que se incrementa el número de ejemplos N. Cuando el número de ejemplos Nsupera un umbral prefijado N 0 para algún nodo interno de árbol, el algoritmo CART aplicasubmuestreos de los datos originales. Este submuestreo genera un nuevo conjunto de datosde tamaño N 0 con aproximadamente la misma distribución de clases que el conjunto de tamañoN. Sobre este nuevo conjunto se calcula el umbral de la división que posteriormentese aplica a todos los ejemplos para continuar con el proceso de construcción del árbol.El análisis de las posibles divisiones para los atributos categóricos es más complejo,ya que el número de posibles subconjuntos no triviales para un atributo con S posiblesvalores es como mínimo de 2 S−1 − 1. Esto hace inviable la evaluación de todas las posiblesdivisiones a partir de valores de S no muy grandes. Breiman et al. demuestran que paraproblemas de clasificación de dos clases la búsqueda se puede realizar con un algoritmocuya complejidad es de orden S [Breiman et al., 1984]. En caso contrario, CART, hacebúsqueda exhaustiva. En C4.5 se utiliza una heurística para determinar estos subconjuntos.La función de impureza, i(t), que se elige en CART es el criterio de Gini. Este criteriocumple las propiedades previamente expuestas y viene definida pori(t) = ∑ i≠jp(i|t)p(j|t) , (2.11)donde los índices i y j del sumatorio son etiquetas de clase. El algoritmo C4.5 utiliza uncriterio basado en la teoría de la información con i(t) = − ∑ Yj=1 p(j|t) log 2(p(j|t)) (gaincriterion). Como alternativa, Quinlan presenta una variante de la ec. (2.10) normalizada porla información que contiene cada división (gain ratio criterion) que evita que en problemascon atributos multivaluados se obtengan divisiones en los nodos internos del árbol conmuchos nodos hijos. Se ha visto que los distintos criterios para la selección de las divisiones
Page 1: Universidad Autónoma de MadridEscu
Page 5 and 6: AgradecimientosAgradezco muy sincer
Page 7 and 8: Índice generalAgradecimientosV1. I
Page 9: A.1.12. Sonar . . . . . . . . . . .
Page 12 and 13: 4.5. Número medio de clasificadore
Page 14 and 15: 3.5. Pseudocódigo de comités IGP
Page 17 and 18: Capítulo 1IntroducciónUn clasific
Page 19 and 20: 3aparecen en el problema concreto d
Page 21 and 22: 5donde se realizan, etc [Dorronsoro
Page 23 and 24: 7algoritmo genera un árbol de deci
Page 25 and 26: de construcción de conjuntos de cl
Page 27 and 28: Capítulo 2Clasificación2.1. Clasi
Page 29 and 30: 2.1. CLASIFICACIÓN SUPERVISADA Y T
Page 31 and 32: 2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 33: 2.2. ÁRBOLES DE DECISIÓN: CART Y
Page 41 and 42: 2.3. CONJUNTOS DE CLASIFICADORES 25
Page 47 and 48: 2.4. ANÁLISIS DE SU FUNCIONAMIENTO
Page 55 and 56: 2.5. BAGGING Y BOSQUES ALEATORIOS 3
Page 57 and 58: 2.6. BOOSTING 41ni de los ejemplos
Page 59 and 60: 2.6. BOOSTING 43la decisión del co
Page 61 and 62: 2.6. BOOSTING 45el agotamiento tamb
Page 63 and 64: 2.7. OTROS CONJUNTOS DE CLASIFICADO
Page 65: Parte INuevos conjuntos de clasific
Page 68 and 69: 52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 84 and 85:
68 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 86 and 87:
70 CAPÍTULO 3. CONJUNTOS DE ÁRBOL
Page 88 and 89:
72 CAPÍTULO 4. ALTERACIÓN DE ETIQ
Page 90 and 91:
Page 92 and 93:
Page 94 and 95:
Page 96 and 97:
Page 98 and 99:
Page 100 and 101:
Cuadro 4.3: Resumen de registros vi
Page 102 and 103:
Page 104 and 105:
Page 106 and 107:
Page 108 and 109:
Page 111 and 112:
Capítulo 5Orden de agregación y p
Page 113 and 114:
5.2. ORDENACIÓN DE CLASIFICADORES
Page 115 and 116:
5.2. ORDENACIÓN DE CLASIFICADORES
Page 117 and 118:
5.3. OTROS TRABAJOS RELACIONADOS 10
Page 119 and 120:
5.4. ALGORITMOS DE ORDENACIÓN 103c
Page 121 and 122:
5.4. ALGORITMOS DE ORDENACIÓN 105M
Page 123 and 124:
5.4. ALGORITMOS DE ORDENACIÓN 107F
Page 125 and 126:
5.4. ALGORITMOS DE ORDENACIÓN 1093
Page 127 and 128:
5.4. ALGORITMOS DE ORDENACIÓN 111n
Page 129 and 130:
5.4. ALGORITMOS DE ORDENACIÓN 113o
Page 131 and 132:
5.4. ALGORITMOS DE ORDENACIÓN 115s
Page 133 and 134:
5.4. ALGORITMOS DE ORDENACIÓN 1171
Page 135 and 136:
5.5. RESULTADOS EXPERIMENTALES 119L
Page 137 and 138:
5.5. RESULTADOS EXPERIMENTALES 1210
Page 139 and 140:
5.5. RESULTADOS EXPERIMENTALES 123p
Page 141 and 142:
Page 143 and 144:
Page 145 and 146:
Page 147 and 148:
Cuadro 5.7: Media del error de entr
Page 149 and 150:
Cuadro 5.9: Prueba-t para comparar
Page 151 and 152:
5.6. CONCLUSIONES 135Cuadro 5.10: T
Page 153 and 154:
Capítulo 6Conclusiones y trabajo f
Page 155 and 156:
139primeros elementos de acuerdo co
Page 157 and 158:
Apéndice ADescripción de los conj
Page 159 and 160:
143A.1.4.Pima Indian DiabetesPima I
Page 161 and 162:
145A.1.8.IonosphereIonosphereReposi
Page 163 and 164:
147A.1.12.SonarSonarRepositorio UCI
Page 165 and 166:
149A.1.16.VehicleVehicle silhouette
Page 167 and 168:
151A.1.19.WineWineRepositorio UCI(F
Page 169 and 170:
Bibliografía[Aha et al., 1991] Dav
Page 171 and 172:
BIBLIOGRAFÍA 155[Dietterich y Kong
Page 173 and 174:
BIBLIOGRAFÍA 157[Haskell et al., 2
Page 175 and 176:
BIBLIOGRAFÍA 159[Martínez-Muñoz
Page 177 and 178:
BIBLIOGRAFÍA 161[Schapire et al.,
show all

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

Create successful ePaper yourself

Delete template?

Save as template?