13.07.2015 Views

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

116 CAPÍTULO 5. ORDEN DE AGREGACIÓN Y PODA EN BAGGINGLos parametros de configuración del algoritmo genético fueron ajustados en experimentospreliminares y siguen las recomendaciones dadas en [Eiben y Smith, 2003]. Asimismo,la configuración del experimento es muy similar a la utilizada en [Zhou y Tang, 2003].El número de generaciones y el tamaño de la población es 200 lo que requiere hacer40 000 evaluaciones de la función de idoneidad para cada ejecución. El operador demutación utilizado es la operación lógica “no” para cada bit (bit-flip) con probabilidad0.005. Es decir, en cada generación muta 1 bit por individuo en promedio. Para evitar elsesgo posicional se utilizó cruce uniforme (uniform crossover) con probabilidad 0.65. Seaplicó reemplazamiento de la población con elitismo. Es decir, cada generación se substituyepor la siguiente y se mantienen dos copias del mejor individuo de la generación actualen la siguiente. La población se inicializó diagonalmente de forma que se representan todoslos posibles <strong>conjuntos</strong> de tamaño uno —con inicialización aleatoria se obtienen resultadosen entrenamiento notablemente peores que con la inicialización diagonal. Más concretamente,el individuo i se inicializa con todos sus bits a 0 excepto su gen i que se inicializa a1. Además, en una segunda tanda de experimentos se substituyeron dos cromosomas de lapoblación inicial con la solución dada por el algoritmo reducción de error (el subconjuntocon menor error en entrenamiento). Todos estos parámetros quedan recogidos en el cuadro5.1.Cuadro 5.1: Configuración del AGRepresentaciónCadena binaria de 200-BitsRecombinaciónCruce uniformeProbabilidad de cruce 0.65MutaciónOperación lógica ”no”para cada bit (Bit flip)Probabilidad de mutación0.005 por bitSelección de progenitoresProporcional a la idoneidadSelección de supervivientes Reemplazamiento de la población con elitismoTamaño de la población 200Número de vástagos 200InicializaciónDiagonal (más la solución dada por reducción de error)Condición de parada200 épocasHemos aplicado AG a dos <strong>conjuntos</strong> diferentes de la colección de problemas de UCI[Blake y Merz, 1998]: Pima Indian Diabetes y Waveform. Se han utilizado los mismos<strong>conjuntos</strong> de bagging generados para las experimentaciones de la sección 5.5.2 compuestosde 200 árboles CART y podados usando validación cruzada de 10 particiones. Para cadaproblema se hicieron, por tanto, 100 ejecuciones usando las mismas particiones entre entrenamientoy test que las de los experimentos de la sección 5.5.2 y descritas en el cuadro5.6. Para cada ejecución se han seguido los siguientes pasos:

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!