13.07.2015 Views

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

clasificaci´on mediante conjuntos - Escuela Politécnica Superior

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

5.5. RESULTADOS EXPERIMENTALES 119Los resultados se pueden ver en las figuras 5.8 y 5.9 para Pima Indian Diabetes yWaveform respectivamente. Estas figuras muestran por columnas los resultados medios deentrenamiento (primera columna) y test (segunda columna) y por filas los resultados usandolos algoritmos: reducción de error (primera fila), minimización de distancias de margen(segunda fila) y ordenación basada en boosting (tercera fila). En la última fila se muestra laevolución de los errores mínimos obtenidos por cada heurística de ordenación. Los puntosse han unido con rectas que sirven como guías visuales para trazar más fácilmente la evoluciónde los errores mínimos en función del tamaño del conjunto de partida: el mínimo de laordenación que ha usado 11 clasificadores se ha unido con el que ordena 25 elementos, quea su vez se ha enlazado con el de 51, etc. Por ello se observa que cuando una ordenaciónalcanza un mínimo que necesita menos clasificadores que el mínimo de otra ordenaciónque parte de un número menor de clasificadores, la línea retrocede .Las figuras 5.8 y 5.9 muestran que en entrenamiento, inicialmente, las ordenacionespresentan una tendencia de bajada muy similar. A medida que aumenta el número de clasificadoreslas curvas se van separando: las correspondientes a <strong>conjuntos</strong> con un númerototal menor generalmente comienzan a ascender antes que las correspondientes a <strong>conjuntos</strong>iniciales mayores. Las curvas apenas se cruzan unas con otras sino que se van envolviendo.Esto es razonable (sobre todo para el método reducción de error) teniendo en cuenta que seestá usando un conjunto de clasificadores incremental (todos los clasificadores de la ordenaciónque usa, por ejemplo, 251 están en la de 501, 751 y 1000) y que se minimiza unafunción basándose en una medida sobre los datos de entrenemiento.Las curvas de error de test no son tan homogéneas como las correspondientes a error deentrenamiento (sobre todo en el conjunto Pima Indian Diabetes). Las curvas muestran unabajada inicial muy parecida. Tras este descenso las curvas se separan progresivamente. Laseparación de las distintas curvas con respecto a la línea de bajada principal es distinta paraordenación por reducción de error y ordenación basada en boosting que para minimizaciónde distancias de margen. Las dos primeras heurísticas tienen un comportamiento similaral observado en entrenamiento: primero se separan por arriba aquellas curvas correspondientesa <strong>conjuntos</strong> con un número inicial menor de clasificadores. Para la heurística dereducción de distancias de margen las curvas se invierten: en las fases iniciales están porencima las curvas correspondientes a <strong>conjuntos</strong> con un número inicial mayor de elementos.Aun así el punto mínimo alcanzado tiende a ser inferior para las curvas correspondientes a<strong>conjuntos</strong> de clasificadores con más elementos.Estos resultados muestran cómo los mínimos en el conjunto de entrenamiento aparecenpara un número mucho más pequeño que en test. Como caso extremo está el algoritmode minimización de distancias de margen para 1000 árboles en el conjunto Pima IndianDiabetes. En este problema el mínimo en entrenamiento está en 5 árboles mientras que entest está por encima de 170.Los mínimos alcanzados se muestran en las gráficas inferiores de las figuras 5.8 y 5.9.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!