13.07.2015 Views

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

54 CAPÍTULO 3. CONJUNTOS DE ÁRBOLES IGPEntradas:Árbol TConjunto de datos LSalida:Árbol podado T ∗Para cada nodo t ∈ T , ordenados en modo que cada nodo1. se procesa sólo después de que sus nodos hijos se hayanprocesado:2. Si t ∈ ˆT entonces S(t, L) = R(t, L)3. Si no4. Asignar S(t, L) = S(t L , L) + S(t R , L)5. Si S(t, L) ≥ R(t, L) entonces6. Podar nodo t7. Asignar S(t, L) = R(t, L)Figura 3.2: Método de poda de IGP3.2.2. Conjuntos basados en IGPLa eficacia de bagging para reducir el error de generalización es elevada cuando el clasificadorbase tiene un sesgo bajo y alta varianza [Breiman, 1998]. El algoritmo IGP esinestable con respecto a cómo son asignados los ejemplos a los dos sub<strong>conjuntos</strong> de datosutilizados por dicho algoritmo. Por consiguiente la variabilidad necesaria para la construcciónde los <strong>conjuntos</strong> de clasificadores se puede obtener empleando distintas particiones delconjunto de entrenamiento generadas aleatoriamente. Este mecanismo no se puede utilizaren otros algoritmos de construcción de árboles de decisión, como CART o C4.5, ya que elordenamiento o agrupamiento de los datos no modifica su funcionamiento. Realmente enCART puede haber pequeñas variaciones a la hora de elegir el árbol final de entre la familiade árboles definida en la ec. (2.16) si se realizan particiones distintas para la validacióncruzada. Los <strong>conjuntos</strong> de clasificadores que usan C4.5 o CART como clasificadores basegeneran variabilidad introduciendo una perturbación no intrínseca del algoritmo o datos(muestreo bootstrap en bagging, poderación de los pesos de los ejemplos, etc). Esta perturbacióngeneralmente deteriora la eficacia en clasificación de los árboles individuales. Acontinuación se presentan tres métodos para construir <strong>conjuntos</strong> de clasificadores basadosen árboles IGP que aprovechan la inestabilidad intrínseca de su proceso de construcción.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!