27.07.2013 Views

Indução de Árvores de Decisão

Indução de Árvores de Decisão

Indução de Árvores de Decisão

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Razão <strong>de</strong> Ganho<br />

Vimos que o ganho máximo é interessante para<br />

particionar os exemplos, fornecendo bons resultados<br />

Entretanto, ele tem uma tendência (bias) em favor <strong>de</strong><br />

testes com muitos valores<br />

Por exemplo, consi<strong>de</strong>re um conjunto <strong>de</strong> exemplos <strong>de</strong><br />

diagnóstico médico no qual um dos atributos contém o<br />

código <strong>de</strong> i<strong>de</strong>ntificação do paciente (ID)<br />

Uma vez que cada código ID é único, particionando o<br />

conjunto <strong>de</strong> treinamento nos valores <strong>de</strong>ste atributo levará<br />

a um gran<strong>de</strong> número <strong>de</strong> subconjuntos, cada um contendo<br />

somente um caso<br />

Como todos os subconjuntos (<strong>de</strong> 1 elemento)<br />

necessariamente contêm exemplos <strong>de</strong> uma mesma<br />

classe, info(ID,T)=0, assim o ganho <strong>de</strong> informação <strong>de</strong>ste<br />

atributo será máximo<br />

63

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!