clasificaci´on mediante conjuntos - Escuela Politécnica Superior

13.07.2015 Views
16 CAPÍTULO 2. CLASIFICACIÓNFigura 2.2: Ejemplo de árbol de decisiónque genera el árbol de la parte inferior de la figura. Este árbol de decisión representa unasolución posible para la división de ambas clases. Como se puede observar en el ejemplode la figura 2.2 los árboles de decisión también se pueden representar como reglas. En esteejemplo el árbol de decisión corresponde a la reglaSi x 1 > 5 y x 2 > 2la clase es CuadradoEn caso contrario la clase es Círculo .Esta correspondencia entre los árboles de decisión y conjuntos de reglas es una ventaja a lahora de la interpretación del modelo y de las decisiones generadas por el mismo.Para conseguir la partición del espacio de atributos en regiones correspondientes a lasdistintas clases, los árboles de decisión utilizan una estrategia del tipo divide y vencerás.El resultado es que el espacio de atributos es segmentado. Para los atributos cuantitativos,

2.2. ÁRBOLES DE DECISIÓN: CART Y C4.5 17la estrategia más utilizada es dividir el espacio mediante hiperplanos, aunque también sepodría dividir utilizando separaciones no lineales [Ittner y Schlosser, 1996]. En el ejemplode la figura 2.2, dado que es un espacio bidimensional, estas divisiones son rectas. Paralos atributos categóricos, las divisiones se realizan mediante particiones en subconjuntosde los distintos valores de los atributos. Las divisiones del espacio de atributos cuantitativosse pueden realizar utilizando bien hiperplanos de separación ortogonales a los ejes obien oblicuos. Las divisiones ortogonales corresponden a preguntas sobre sólo uno de losatributos del espacio (como en el ejemplo de la figura 2.2) y son de la forma “¿x m ≤ c?”donde m es el índice del atributo y el umbral de decisión, c, está dentro del rango de valoresque puede tomar el atributo x m . Estas divisiones se pueden calcular rápidamente porlo que se utilizan en la mayoría de algoritmos de creación de árboles de decisión. Otroposible método, implementado en CART, consiste en hacer divisiones oblicuas a los ejes.Estas divisiones corresponden a preguntas sobre el valor de una combinación lineal de losatributos (“¿ ∑ Nm=1 a mx m ≤ c?”). Las divisiones oblicuas son mucho más expresivas quelas divisiones paralelas a los ejes y pueden reflejar de manera más precisa las distribucionesde los datos. Las divisiones ortogonales son un caso particular de las oblicuas en las quetodos los coeficientes excepto uno son nulos. Sin embargo el cálculo de la división oblicuaóptima en cada nodo es más complicado, ya que el espacio de búsqueda de posiblesdivisiones es mayor. En CART las divisiones oblicuas se calculan con un método bastanteeficaz y eficiente pero que no garantiza que la división sea óptima. En cualquier caso, elcoste computacional de este tipo de divisiones es mucho mayor que el de las divisionesortogonales. Además el hecho de utilizar tests más expresivos puede llevar a un sobreajustea los datos de entrenamiento.Para los atributos categóricos CART realiza preguntas de la forma “¿x m ∈ V ?” dondeV en un subconjunto de todos los posibles valores que puede tomar el atributo x m . C4.5puede generar divisiones de los atributos categóricos para cada nodo interno en más de dossubconjuntos y consecuentemente se obtienen más de dos nodos hijo.La jerarquía de tests divide el espacio de atributos en regiones disjuntas: cada ejemplose asigna a un solo nodo hijo dependiendo de la respuesta al test en el nodo padre. Otraposible arquitectura son los árboles de decisión borrosos donde cada ejemplo es asignadoa todos los nodos hijos con un distinto grado de pertenencia [Chang y Pavlidis, 1977;Quinlan, 1993; Janikow, 1998; Suárez y Lutsko, 1999; Haskell et al., 2004].El tipo y los parámetros de la pregunta que determinan la división del espacio U(t) deun nodo cualquiera t se eligen mediante la minimización de una función local de coste. Estafunción debe dividir el espacio U(t) en dos regiones, U(t L ) y U(t R ), donde exista mayorhomogeneidad de clases. El uso del error como función de coste podría parecer a priori laelección más acertada. Sin embargo, este criterio presenta dos inconvenientes [Breiman etal., 1984]. El primero consiste en que es posible que ninguna de las divisiones posibles delespacio reduzca el error. Esto ocurre cuando en el nodo padre hay mayoría de ejemplos deuna clase y todas las divisiones conducen a nodos hijos con mayoría de la misma clase.

Page 1: Universidad Autónoma de MadridEscu

Page 5 and 6: AgradecimientosAgradezco muy sincer

Page 7 and 8: Índice generalAgradecimientosV1. I

Page 9: A.1.12. Sonar . . . . . . . . . . .

Page 12 and 13: 4.5. Número medio de clasificadore

Page 14 and 15: 3.5. Pseudocódigo de comités IGP

Page 17 and 18: Capítulo 1IntroducciónUn clasific

Page 19 and 20: 3aparecen en el problema concreto d

Page 21 and 22: 5donde se realizan, etc [Dorronsoro

Page 23 and 24: 7algoritmo genera un árbol de deci

Page 25 and 26: de construcción de conjuntos de cl

Page 27 and 28: Capítulo 2Clasificación2.1. Clasi

Page 29 and 30: 2.1. CLASIFICACIÓN SUPERVISADA Y T

Page 31: 2.2. ÁRBOLES DE DECISIÓN: CART Y

Page 35 and 36: 2.2. ÁRBOLES DE DECISIÓN: CART Y



Page 41 and 42: 2.3. CONJUNTOS DE CLASIFICADORES 25



Page 47 and 48: 2.4. ANÁLISIS DE SU FUNCIONAMIENTO




Page 55 and 56: 2.5. BAGGING Y BOSQUES ALEATORIOS 3

Page 57 and 58: 2.6. BOOSTING 41ni de los ejemplos

Page 59 and 60: 2.6. BOOSTING 43la decisión del co

Page 61 and 62: 2.6. BOOSTING 45el agotamiento tamb

Page 63 and 64: 2.7. OTROS CONJUNTOS DE CLASIFICADO

Page 65: Parte INuevos conjuntos de clasific

Page 68 and 69: 52 CAPÍTULO 3. CONJUNTOS DE ÁRBOL










Page 88 and 89: 72 CAPÍTULO 4. ALTERACIÓN DE ETIQ






Page 100 and 101: Cuadro 4.3: Resumen de registros vi





Page 111 and 112: Capítulo 5Orden de agregación y p

Page 113 and 114: 5.2. ORDENACIÓN DE CLASIFICADORES

Page 115 and 116: 5.2. ORDENACIÓN DE CLASIFICADORES

Page 117 and 118: 5.3. OTROS TRABAJOS RELACIONADOS 10

Page 119 and 120: 5.4. ALGORITMOS DE ORDENACIÓN 103c

Page 121 and 122: 5.4. ALGORITMOS DE ORDENACIÓN 105M

Page 123 and 124: 5.4. ALGORITMOS DE ORDENACIÓN 107F

Page 125 and 126: 5.4. ALGORITMOS DE ORDENACIÓN 1093

Page 127 and 128: 5.4. ALGORITMOS DE ORDENACIÓN 111n

Page 129 and 130: 5.4. ALGORITMOS DE ORDENACIÓN 113o

Page 131 and 132: 5.4. ALGORITMOS DE ORDENACIÓN 115s

Page 133 and 134: 5.4. ALGORITMOS DE ORDENACIÓN 1171

Page 135 and 136: 5.5. RESULTADOS EXPERIMENTALES 119L

Page 137 and 138: 5.5. RESULTADOS EXPERIMENTALES 1210

Page 139 and 140: 5.5. RESULTADOS EXPERIMENTALES 123p




Page 147 and 148: Cuadro 5.7: Media del error de entr

Page 149 and 150: Cuadro 5.9: Prueba-t para comparar

Page 151 and 152: 5.6. CONCLUSIONES 135Cuadro 5.10: T

Page 153 and 154: Capítulo 6Conclusiones y trabajo f

Page 155 and 156: 139primeros elementos de acuerdo co

Page 157 and 158: Apéndice ADescripción de los conj

Page 159 and 160: 143A.1.4.Pima Indian DiabetesPima I

Page 161 and 162: 145A.1.8.IonosphereIonosphereReposi

Page 163 and 164: 147A.1.12.SonarSonarRepositorio UCI

Page 165 and 166: 149A.1.16.VehicleVehicle silhouette

Page 167 and 168: 151A.1.19.WineWineRepositorio UCI(F

Page 169 and 170: Bibliografía[Aha et al., 1991] Dav

Page 171 and 172: BIBLIOGRAFÍA 155[Dietterich y Kong

Page 173 and 174: BIBLIOGRAFÍA 157[Haskell et al., 2

Page 175 and 176: BIBLIOGRAFÍA 159[Martínez-Muñoz

Page 177 and 178: BIBLIOGRAFÍA 161[Schapire et al.,

clasificadores

conjunto

conjuntos

datos

algoritmo

bagging

ejemplos

entrenamiento

boosting

clasificador

mediante

escuela

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior ... View more clasificaci´on mediante conjuntos - Escuela Politécnica Superior

Delete template?

Save as template ?

clasificaci´on mediante conjuntos - Escuela Politécnica Superior clasificaci´on mediante conjuntos - Escuela Politécnica Superior