Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Atributos com Valores<br />
Desconhecidos<br />
Por exemplo, Quinlan (1993) reporta que em um conjunto<br />
<strong>de</strong> 3000 dados médicos sobre tireói<strong>de</strong>, muitos exemplos<br />
não possuem o sexo do paciente, mesmo sabendo que<br />
esta informação seja usualmente relevante para a<br />
interpretação; mais <strong>de</strong> 30% dos exemplos apresentam<br />
valores <strong>de</strong>sconhecidos<br />
Assim, a falta <strong>de</strong> completeza é típica em dados do mundo<br />
real<br />
Diante disso, há algumas escolhas possíveis<br />
Descartar uma parte (significante) dos exemplos <strong>de</strong> treinamento e<br />
assumir alguns dos novos exemplos (teste) como sendo<br />
inclassificáveis<br />
Pré-processar os dados, substituindo os valores <strong>de</strong>sconhecidos (o<br />
que geralmente altera o processo <strong>de</strong> aprendizado)<br />
Alterar os algoritmos apropriadamente para tratar atributos<br />
contendo valores <strong>de</strong>sconhecidos<br />
86