Indução de Árvores de Decisão
Indução de Árvores de Decisão Indução de Árvores de Decisão
Particionando o Conjunto de Treinamento Um teste pode ser selecionado dentre os possíveis testes como antes, utilizando as definições modificadas de gain e split-info Se o atributo selecionado X possui valores desconhecidos, o conceito de particionamento do conjunto T é generalizado da seguinte forma: Assumindo que X assume r valores, ou seja X = O 1 , X = O 2 , ..., X=O r , cada teste particiona o conjunto T nos subconjuntos T 1 , T 2 , ..., T r , respectivamente Quando um exemplo de T com valor conhecido é atribuído ao subconjunto T i isto indica que a probabilidade daquele exemplo pertencer ao subconjunto T i é 1 e em todos os demais subconjuntos é 0 94
Particionando o Conjunto de Treinamento Quando um exemplo possui valor desconhecido, apenas um grau de pertinência probabilístico pode ser feito Assim a cada exemplo em cada subconjunto T i é associado um peso representando a probabilidade do exemplo pertencer a cada subconjunto Se o exemplo tem seu valor conhecido para o teste, o peso é 1 Se o exemplo tem seu valor desconhecido para o teste, o peso é a probabilidade do teste X=O i naquele ponto; cada subconjunto T i é agora uma coleção de exemplos fracionários de forma que |T i | deve ser interpretado como a soma dos pesos fracionários dos exemplos no subconjunto 95
- Page 44 and 45: Exemplo 44
- Page 52: Escolha do Atributo para Particiona
- Page 61: Árvore de Decisão Induzida Umidad
- Page 64 and 65: Razão de Ganho T=[1a,1b,1c,...,1o,
- Page 66 and 67: Razão de Ganho Usando o exemplo a
- Page 68 and 69: Exemplo 68
- Page 70 and 71: Escolha do Atributo para Particiona
- Page 72: Escolha do Atributo para Particiona
- Page 85 and 86: Atributos com Valores Desconhecidos
- Page 87 and 88: Atributos com Valores Desconhecidos
- Page 89 and 90: Escolha de um Teste Assumindo que
- Page 91 and 92: Exercício Calcular info(T), info(A
- Page 93: Solução 93
- Page 97 and 98: Exemplo Quando os 14 exemplos são
- Page 99 and 100: Exemplo Distribuições de classes
- Page 102 and 103: Exemplo aparencia = sol :...umidade
- Page 104 and 105: Pré-Poda Evita gastar tempo const
- Page 106 and 107: Pós-Poda Existem várias forma de
- Page 108 and 109: Análise de Complexidade Vamos ass
- Page 110 and 111: Interpretação Geométrica Consid
- Page 112 and 113: X2 8 Interpretação Geométrica p/
- Page 114 and 115: X2 8 Interpretação Geométrica p/
- Page 116 and 117: Combinação Linear de Atributos P
- Page 118 and 119: Resumo Árvores de decisão, em ge
- Page 120 and 121: nenhuma (12) taxa-producao-lagrimas
- Page 122 and 123: nenhuma (12) taxa-producao-lagrimas
- Page 124: 7 6 5 4 3 2 1 C A B 1 2 3 4 5 6 7 8
Particionando o Conjunto <strong>de</strong><br />
Treinamento<br />
Um teste po<strong>de</strong> ser selecionado <strong>de</strong>ntre os<br />
possíveis testes como antes, utilizando as<br />
<strong>de</strong>finições modificadas <strong>de</strong> gain e split-info<br />
Se o atributo selecionado X possui valores<br />
<strong>de</strong>sconhecidos, o conceito <strong>de</strong> particionamento do<br />
conjunto T é generalizado da seguinte forma:<br />
Assumindo que X assume r valores, ou seja X = O 1 , X<br />
= O 2 , ..., X=O r , cada teste particiona o conjunto T nos<br />
subconjuntos T 1 , T 2 , ..., T r , respectivamente<br />
Quando um exemplo <strong>de</strong> T com valor conhecido é<br />
atribuído ao subconjunto T i isto indica que a<br />
probabilida<strong>de</strong> daquele exemplo pertencer ao<br />
subconjunto T i é 1 e em todos os <strong>de</strong>mais subconjuntos<br />
é 0<br />
94