Indução de Árvores de Decisão
Indução de Árvores de Decisão Indução de Árvores de Decisão
Pré-Poda Evita gastar tempo construindo estruturas (sub-árvores) que não serão usada na árvore final simplificada O método usual consiste em analisar a melhor forma de particionar um subconjunto, mensurando-a sob o ponto de vista de significância estatística, ganho de informação, redução de erro ou outra métrica qualquer Se a medida encontrada encontrar-se abaixo de um valor limite (threshold) o particionamento é interrompido e a árvore para aquele subconjunto é apenas a folha mais apropriada Entretanto, a definição do valor limite não é simples de ser definido Um valor muito grande pode terminar o particionamento antes que os benefícios de divisões subseqüentes tornem-se evidentes Um valor muito pequeno resulta em pouca simplificação 104
Pós-Poda O processo de indução (dividir-e-conquistar) da árvore continua de forma livre e então a árvore super-ajustada (overfitted tree) produzida é então podada O custo computacional adicional investido na construção de partes da árvore que serão posteriormente descartadas pode ser substancial Entretanto, esse custo é compensador devido a uma maior exploração das possíveis partições Crescer e podar árvores é mais lento, mas mais confiável 105
- Page 61: Árvore de Decisão Induzida Umidad
- Page 64 and 65: Razão de Ganho T=[1a,1b,1c,...,1o,
- Page 66 and 67: Razão de Ganho Usando o exemplo a
- Page 68 and 69: Exemplo 68
- Page 70 and 71: Escolha do Atributo para Particiona
- Page 72: Escolha do Atributo para Particiona
- Page 85 and 86: Atributos com Valores Desconhecidos
- Page 87 and 88: Atributos com Valores Desconhecidos
- Page 89 and 90: Escolha de um Teste Assumindo que
- Page 91 and 92: Exercício Calcular info(T), info(A
- Page 93 and 94: Solução 93
- Page 95 and 96: Particionando o Conjunto de Treinam
- Page 97 and 98: Exemplo Quando os 14 exemplos são
- Page 99 and 100: Exemplo Distribuições de classes
- Page 102 and 103: Exemplo aparencia = sol :...umidade
- Page 106 and 107: Pós-Poda Existem várias forma de
- Page 108 and 109: Análise de Complexidade Vamos ass
- Page 110 and 111: Interpretação Geométrica Consid
- Page 112 and 113: X2 8 Interpretação Geométrica p/
- Page 114 and 115: X2 8 Interpretação Geométrica p/
- Page 116 and 117: Combinação Linear de Atributos P
- Page 118 and 119: Resumo Árvores de decisão, em ge
- Page 120 and 121: nenhuma (12) taxa-producao-lagrimas
- Page 122 and 123: nenhuma (12) taxa-producao-lagrimas
- Page 124: 7 6 5 4 3 2 1 C A B 1 2 3 4 5 6 7 8
Pós-Poda<br />
O processo <strong>de</strong> indução (dividir-e-conquistar) da<br />
árvore continua <strong>de</strong> forma livre e então a árvore<br />
super-ajustada (overfitted tree) produzida é então<br />
podada<br />
O custo computacional adicional investido na<br />
construção <strong>de</strong> partes da árvore que serão<br />
posteriormente <strong>de</strong>scartadas po<strong>de</strong> ser substancial<br />
Entretanto, esse custo é compensador <strong>de</strong>vido a<br />
uma maior exploração das possíveis partições<br />
Crescer e podar árvores é mais lento, mas mais<br />
confiável<br />
105