Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Razão <strong>de</strong> Ganho<br />
Vimos que o ganho máximo é interessante para<br />
particionar os exemplos, fornecendo bons resultados<br />
Entretanto, ele tem uma tendência (bias) em favor <strong>de</strong><br />
testes com muitos valores<br />
Por exemplo, consi<strong>de</strong>re um conjunto <strong>de</strong> exemplos <strong>de</strong><br />
diagnóstico médico no qual um dos atributos contém o<br />
código <strong>de</strong> i<strong>de</strong>ntificação do paciente (ID)<br />
Uma vez que cada código ID é único, particionando o<br />
conjunto <strong>de</strong> treinamento nos valores <strong>de</strong>ste atributo levará<br />
a um gran<strong>de</strong> número <strong>de</strong> subconjuntos, cada um contendo<br />
somente um caso<br />
Como todos os subconjuntos (<strong>de</strong> 1 elemento)<br />
necessariamente contêm exemplos <strong>de</strong> uma mesma<br />
classe, info(ID,T)=0, assim o ganho <strong>de</strong> informação <strong>de</strong>ste<br />
atributo será máximo<br />
63