Indução de Árvores de Decisão
Indução de Árvores de Decisão Indução de Árvores de Decisão
Escolha de um Teste Como mencionado, o ganho de informação de um teste mede a informação necessária para identificar uma classe que pode ser esperada por open the file again. If the red x still appears, you may have to delete the image and then insert it again. meio do particionamento do conjunto de exemplos, calculado como a subtração da informação esperada requerida para identificar a classe de um exemplo após o particionamento da mesma informação antes do particionamento É evidente que um teste não fornece informação alguma sobre a pertinência a uma classe de um exemplo cujo valor do atributo de teste é desconhecido The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then 88
Escolha de um Teste Assumindo que uma fração F de exemplos tenha seu valor conhecido para o atributo X, a definição de ganho pode ser alterada para gain(X,T) = probabilidade de X ser conhecido * The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then open the file again. If the red x still appears, you may have to delete the image and then insert it again. (info(T) – info(X,T)) + probabilidade de X ser desconhecido * 0 gain(X,T) = F * (info(T) – info(X,T)) De forma similar, a definição de split-info(X,T) pode ser alterada considerando os exemplos com valores desconhecidos como um grupo adicional. Se o teste tem r valores, seu split-info é calculado como se o teste dividisse os exemplos em r+1 subconjuntos 89
- Page 38 and 39: Entropia Considere agora que T foi
- Page 40 and 41: Solução [29+,35-] True False [21+
- Page 42 and 43: Exercício [29+,35-] True False [21
- Page 44 and 45: Exemplo 44
- Page 52: Escolha do Atributo para Particiona
- Page 61: Árvore de Decisão Induzida Umidad
- Page 64 and 65: Razão de Ganho T=[1a,1b,1c,...,1o,
- Page 66 and 67: Razão de Ganho Usando o exemplo a
- Page 68 and 69: Exemplo 68
- Page 70 and 71: Escolha do Atributo para Particiona
- Page 72: Escolha do Atributo para Particiona
- Page 85 and 86: Atributos com Valores Desconhecidos
- Page 87: Atributos com Valores Desconhecidos
- Page 91 and 92: Exercício Calcular info(T), info(A
- Page 93 and 94: Solução 93
- Page 95 and 96: Particionando o Conjunto de Treinam
- Page 97 and 98: Exemplo Quando os 14 exemplos são
- Page 99 and 100: Exemplo Distribuições de classes
- Page 102 and 103: Exemplo aparencia = sol :...umidade
- Page 104 and 105: Pré-Poda Evita gastar tempo const
- Page 106 and 107: Pós-Poda Existem várias forma de
- Page 108 and 109: Análise de Complexidade Vamos ass
- Page 110 and 111: Interpretação Geométrica Consid
- Page 112 and 113: X2 8 Interpretação Geométrica p/
- Page 114 and 115: X2 8 Interpretação Geométrica p/
- Page 116 and 117: Combinação Linear de Atributos P
- Page 118 and 119: Resumo Árvores de decisão, em ge
- Page 120 and 121: nenhuma (12) taxa-producao-lagrimas
- Page 122 and 123: nenhuma (12) taxa-producao-lagrimas
- Page 124: 7 6 5 4 3 2 1 C A B 1 2 3 4 5 6 7 8
Escolha <strong>de</strong> um Teste<br />
Assumindo que uma fração F <strong>de</strong> exemplos tenha<br />
seu valor conhecido para o atributo X, a <strong>de</strong>finição<br />
<strong>de</strong> ganho po<strong>de</strong> ser alterada para<br />
gain(X,T) = probabilida<strong>de</strong> <strong>de</strong> X ser conhecido *<br />
The image cannot be displayed. Your computer may not have enough memory to open the image, or the image may have been corrupted. Restart your computer, and then<br />
open the file again. If the red x still appears, you may have to <strong>de</strong>lete the image and then insert it again.<br />
(info(T) – info(X,T))<br />
+ probabilida<strong>de</strong> <strong>de</strong> X ser <strong>de</strong>sconhecido * 0<br />
gain(X,T) = F * (info(T) – info(X,T))<br />
De forma similar, a <strong>de</strong>finição <strong>de</strong> split-info(X,T)<br />
po<strong>de</strong> ser alterada consi<strong>de</strong>rando os exemplos com<br />
valores <strong>de</strong>sconhecidos como um grupo adicional.<br />
Se o teste tem r valores, seu split-info é calculado<br />
como se o teste dividisse os exemplos em r+1<br />
subconjuntos<br />
89