29.01.2014 Views

Técnicas de Classificação

Técnicas de Classificação

Técnicas de Classificação

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Exemplo: C4.5<br />

Questões práticas <strong>de</strong> classificação<br />

Algoritmo simples, em profundida<strong>de</strong>.<br />

Usa o Ganho <strong>de</strong> Informação (Information Gain)<br />

Classifica atributos contínuos em cada nó.<br />

Exige que todos os dados caibam em memória.<br />

Não indicado para gran<strong>de</strong>s conjuntos <strong>de</strong> dados.<br />

– Necessita classificação em disco.<br />

Sub e super-especialização (Un<strong>de</strong>rfitting and<br />

Overfitting)<br />

Valores faltantes<br />

Custo da classificação<br />

O Software po<strong>de</strong> ser baixado do site:<br />

http://www.cse.unsw.edu.au/~quinlan/c4.5r8.tar.gz<br />

Sub e super-especialização (Exemplo)<br />

Sub e super-especialização<br />

Overfitting<br />

500 pontos circulares e<br />

500 pontos<br />

triangulares data.<br />

Pontos circulares:<br />

0.5 ≤ sqrt(x 12 +x 22 ) ≤ 1<br />

Pontos triangulares:<br />

sqrt(x 12 +x 22 ) > 0.5 or<br />

sqrt(x 12 +x 22 ) < 1<br />

Sub-especialização: quando o mo<strong>de</strong>lo é simples <strong>de</strong>mais, os erros com os dados<br />

<strong>de</strong> treinamento e <strong>de</strong> teste são gran<strong>de</strong>s

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!