13.07.2015 Views

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.4. ALGORITMOS DE ORDENACIÓN 105Medida de complementariedadEste procedimiento favorece la inclusión de clasificadores cuyo funcionamiento seacomplementario al del subconjunto ya seleccionado. Como en la regla precedente el <strong>conjuntos</strong>e inicia seleccionando el clasificador con menor error en L sel . A continuación, seconstruye el subconjunto de tamaño u a partir del de tamaño u − 1 incorporando el clasificadorque maximiza∑N sels u = argmaxki=1(( u−1I y i = h k (x i ) AND y i ≠ signo∑t=1))h st (x i ) , (5.3)donde k recorre las etiquetas de los clasificadores que aún no han sido seleccionados ydonde I(true) = 1, I(false) = 0. Esta medida se puede interpretar como la cantidadque un clasificador desplaza la decisión del conjunto hacia la clasificación correcta. Estecriterio selecciona para su inclusión en el subconjunto, el clasificador que clasifican bien elmayor número de datos donde el subconjunto parcial está fallando.Minimización de la distancia de margenConsiderando el conjunto de datos L sel compuesto de N sel elementos. Definimos c t ,como el vector característico del clasificador h t , como un vector de dimensión N sel cuyoscomponentes sonc ti = y i h t (x i ), i = 1, 2, . . . , N sel , (5.4)donde c ti es igual a 1 si h t clasifica correctamente el ejemplo i de L sel y −1 en casocontrario. La media de los vectores característicos del conjunto esc ens = 1 TT∑c t . (5.5)tEn un problema de clasificación binario, la componente i del vector característico promediodel conjunto es igual al margen del ejemplo i, definido en el intervalo [−1, 1] como ladiferencia entre los votos que recibe la clase correcta y los votos que recibe la clase incorrectamás común [Schapire et al., 1998]. En general, para problemas con múltiples clases,esta cantidad es igual a (1 − 2 edge(i)) del conjunto para el ejemplo i, donde edge se definecomo la diferencia entre los votos que recibe la clase correcta y todos los que reciben lasclases incorrectas, normalizado al intervalo [0, 1] [Breiman, 1997]. Se tiene por tanto queel ejemplo i será correctamente clasificado por el conjunto si la componente i del vectorcaracterístico promedio c ens es positiva. Esto es, un conjunto cuyo vector característico promedioesté en el primer cuadrante del espacio N sel dimensional clasificará correctamentetodos los ejemplos del conjunto L sel .

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!