You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Exemplo: C4.5<br />
Questões práticas <strong>de</strong> classificação<br />
Algoritmo simples, em profundida<strong>de</strong>.<br />
Usa o Ganho <strong>de</strong> Informação (Information Gain)<br />
Classifica atributos contínuos em cada nó.<br />
Exige que todos os dados caibam em memória.<br />
Não indicado para gran<strong>de</strong>s conjuntos <strong>de</strong> dados.<br />
– Necessita classificação em disco.<br />
Sub e super-especialização (Un<strong>de</strong>rfitting and<br />
Overfitting)<br />
Valores faltantes<br />
Custo da classificação<br />
O Software po<strong>de</strong> ser baixado do site:<br />
http://www.cse.unsw.edu.au/~quinlan/c4.5r8.tar.gz<br />
Sub e super-especialização (Exemplo)<br />
Sub e super-especialização<br />
Overfitting<br />
500 pontos circulares e<br />
500 pontos<br />
triangulares data.<br />
Pontos circulares:<br />
0.5 ≤ sqrt(x 12 +x 22 ) ≤ 1<br />
Pontos triangulares:<br />
sqrt(x 12 +x 22 ) > 0.5 or<br />
sqrt(x 12 +x 22 ) < 1<br />
Sub-especialização: quando o mo<strong>de</strong>lo é simples <strong>de</strong>mais, os erros com os dados<br />
<strong>de</strong> treinamento e <strong>de</strong> teste são gran<strong>de</strong>s