intermediário, é a uni<strong>da</strong><strong>de</strong> <strong>de</strong> toma<strong>da</strong> <strong>de</strong> <strong>de</strong>cisão que avalia através <strong>de</strong> teste lógico qualserá o próximo nó <strong>de</strong>scen<strong>de</strong>nte ou filho. Em contraparti<strong>da</strong>, um nó externo, aquele quenão tem nó <strong>de</strong>scen<strong>de</strong>nte, também conhecido como folha ou nó terminal, está associado aum rótulo ou valor. Assim, apresenta-se um conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> ao nó inicial <strong>da</strong> árvore, e<strong>de</strong>pen<strong>de</strong>ndo do resultado do teste lógico usado pelo nó, a árvore ramifica-se <strong>para</strong> umdos nós filhos e este procedimento é repetido até que um nó terminal é alcançado. Arepetição <strong>de</strong>ste procedimento caracteriza a recursivi<strong>da</strong><strong>de</strong> <strong>da</strong> árvore <strong>de</strong> <strong>de</strong>cisão(BREIMAN et al., 1984).Um dos principais autores contribuintes <strong>para</strong> o <strong>de</strong>senvolvimento <strong>de</strong>ssametodologia foi QUINLAN (1983), através do <strong>de</strong>senvolvimento do algoritmo ID3(Iterative Dichotomizer – Dicotomizador Iterativo), na qual um conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> <strong>de</strong>um exemplo qualquer permitiu a construção automática <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão.Para a construção <strong>de</strong>stas árvores também são usados outros algoritmos como oASSISTANT, C4.5, C5 (QUINLAN, 1983), CART ( BREIMAN et al., 1984), <strong>de</strong>ntreoutros. O C4.5 não <strong>de</strong>pen<strong>de</strong> <strong>de</strong> suposições sobre a distribuição dos valores <strong>da</strong>s variáveisou <strong>da</strong> in<strong>de</strong>pendência entre si <strong>da</strong>s variáveis. Isto é importante quando se utiliza <strong><strong>da</strong>dos</strong> <strong>de</strong>SIG juntamente com <strong><strong>da</strong>dos</strong> <strong>de</strong> imagem (ARAKI, 2005). Não há uma forma <strong>de</strong><strong>de</strong>terminar qual é o melhor algoritmo, sendo que um po<strong>de</strong> ter melhor <strong>de</strong>sempenho em<strong>de</strong>termina<strong>da</strong> situação e outro po<strong>de</strong> ser mais eficiente em outros tipos <strong>de</strong> situações.A figura 1 representa uma árvore <strong>de</strong> <strong>de</strong>cisão on<strong>de</strong> ca<strong>da</strong> nó <strong>de</strong> <strong>de</strong>cisão contém umteste <strong>para</strong> algum atributo, ca<strong>da</strong> ramo <strong>de</strong>scen<strong>de</strong>nte correspon<strong>de</strong> a um possível valor <strong>de</strong>steatributo, os conjuntos <strong>de</strong> ramos são distintos, ca<strong>da</strong> folha está associa<strong>da</strong> a uma classe e,ca<strong>da</strong> percurso <strong>da</strong> árvore, <strong>da</strong> raiz à folha, correspon<strong>de</strong> uma regra <strong>de</strong> classificação.Figura 1 - Representação esquemática <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão (GAMA, 2004).19
Como se po<strong>de</strong> visualizar, a estrutura <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão é forma<strong>da</strong> por:– folhas (nós puros), que correspon<strong>de</strong>m às uni<strong>da</strong><strong>de</strong>s a serem preditas.– nós internos, que correspon<strong>de</strong>m aos atributos (especifica algum teste efetuado numúnico atributo, com duas ou mais sub-árvores que representam saí<strong>da</strong>s possíveis);– ramos, que correspon<strong>de</strong>m aos valores dos atributos.Os algoritmos <strong>de</strong> indução <strong>de</strong> árvores <strong>de</strong> <strong>de</strong>cisão constroem os padrões a partirdos <strong><strong>da</strong>dos</strong> <strong>de</strong> treino, <strong>de</strong> uma forma recursiva efetuando a subdivisão do conjunto <strong>de</strong><strong><strong>da</strong>dos</strong> até que este seja apenas composto por nós “puros”, ou seja, até que ca<strong>da</strong> nórepresente apenas uma única classe ou satisfaça um <strong>de</strong>terminado critério (QUINTELA,2005).O critério utilizado <strong>para</strong> realizar as partições é o <strong>da</strong> utili<strong>da</strong><strong>de</strong> do atributo <strong>para</strong> aclassificação. Aplica-se, por este critério, um <strong>de</strong>terminado ganho <strong>de</strong> informação a ca<strong>da</strong>atributo. O atributo escolhido como atributo teste <strong>para</strong> o corrente nó é aquele que possuio maior ganho <strong>de</strong> informação. A partir <strong>de</strong>sta aplicação, inicia-se um novo processo <strong>de</strong>partição. Nos casos em que a árvore é usa<strong>da</strong> <strong>para</strong> classificação, os critérios <strong>de</strong> partiçãomais conhecidos são baseados na entropia (ONODA, 2001).Entropia é o cálculo do ganho <strong>de</strong> informação baseado em uma medi<strong>da</strong> utiliza<strong>da</strong>na teoria <strong>da</strong> informação (equações 1, 2, 3 e 4), na qual H é a entropia e U(y/x) o grau <strong>de</strong>incerteza <strong>da</strong> informação (equações 5 e 6), sendo y a variável a ser predita e x a original.A entropia caracteriza a pureza/impureza dos <strong><strong>da</strong>dos</strong>: em um conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong>, é umamedi<strong>da</strong> <strong>da</strong> falta <strong>de</strong> homogenei<strong>da</strong><strong>de</strong> dos <strong><strong>da</strong>dos</strong> <strong>de</strong> entra<strong>da</strong> em relação a sua classificação.Por exemplo, a entropia é máxima quando x prediz totalmente y (igual a 1), ou seja,quando o conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> é heterogêneo (MITCHELL (1997); COIMBRA (2008)). Jáquando a entropia é 0, x e y não apresentam associação alguma.A entropia, H, <strong>de</strong> x e y é respectivamente:H ( x)= ∑ − p i. ln pie H ( y)= ∑ − p j. ln pj[1]on<strong>de</strong> i = 1,2.. n, nas classes <strong>de</strong> variáveis x; j = 1,2.. m, nas classes <strong>da</strong> variável y; p é aprobabili<strong>da</strong><strong>de</strong> <strong>de</strong> ocorrência <strong>de</strong> uma classe; ln é o logaritmo natural.A entropia conjunta é:−∑H ( x,y)[2]= p i. ln pj ija entropia <strong>de</strong> x <strong>da</strong>do y é:20
- Page 1 and 2: INSTITUTO AGRONÔMICOCURSO DE PÓS-
- Page 4 and 5: Primeiramente a Deus, pela vida,Ao
- Page 6 and 7: - A toda turma do geoprocessamento
- Page 8 and 9: ÍNDICE DE TABELASTabela 1 - Distri
- Page 10 and 11: ÍNDICE DE FIGURASFigura 1 - Repres
- Page 12 and 13: CRIVELENTI, Rafael Castro. Mineraç
- Page 14 and 15: CRIVELENTI, Rafael Castro. Data min
- Page 16 and 17: 1 INTRODUÇÃOA distribuição espa
- Page 18 and 19: 2 REVISÃO DE LITERATURA2.1 Histór
- Page 20 and 21: 2.2 Levantamento pedológico por m
- Page 22 and 23: corretivas ou compensatórias de ca
- Page 24 and 25: Nesta perspectiva, é oportuno dese
- Page 28 and 29: irregulares (MONTGOMERY, 2003). As
- Page 30 and 31: o objetivo de diminuir o erro por e
- Page 32 and 33: Recentemente, SIRTOLI et al. (2008)
- Page 36 and 37: −∑H x / y)= p .ln( p / p )[3](i
- Page 38 and 39: Estes sistemas manipulam dados geor
- Page 40 and 41: 2.9 Comparação entre resultados d
- Page 42 and 43: mapeamento, considerando as classes
- Page 44 and 45: correlacionaram com a distribuiçã
- Page 46 and 47: 3 MATERIAL E MÉTODOS3.1 Descriçã
- Page 48 and 49: (a)120Extrato do Balanço Hídrico
- Page 50 and 51: (a)(b)Figura 5 - Mapas de geologia
- Page 52 and 53: Conforme PONÇANO (1981), o ambient
- Page 54 and 55: h) Cambissolo: Solos constituídos
- Page 56 and 57: 1:1.000.000 (IPT, 1981), e evidenci
- Page 58 and 59: ) Curvatura em perfil (VALERIANO, 2
- Page 60 and 61: dados estratificados retirados ante
- Page 62 and 63: 4 RESULTADOS E DISCUSSÃO4.1 MDE, G
- Page 64 and 65: (a)(b)(c)Figura 7 - Mapas de variá
- Page 66 and 67: (a)(b)(c)Figura 8 - Mapas de variá
- Page 68 and 69: 4.2 Análise dos dados e elaboraç
- Page 70 and 71: BalanceamentosFigura 10 - Distribui
- Page 72 and 73: ocorrência deixe de ser amostrada
- Page 74 and 75: unidades de mapeamento de solos fos
- Page 76 and 77: devido a sua grande representativid
- Page 78 and 79: Tabela 12 - Atualização da legend
- Page 80 and 81: A análise do mapa permite verifica
- Page 82 and 83: Tabela 15 - Ordenamento das variáv
- Page 84 and 85:
A partir da sobreposição dos mapa
- Page 86 and 87:
Tabela 16 - Matiz de confusão das
- Page 88 and 89:
Tabela 17 - Porcentagem de acerto e
- Page 90 and 91:
Como pode ser observado na figura 1
- Page 92 and 93:
unidades de mapeamento. Por exemplo
- Page 94 and 95:
O latossolo vermelho amarelo textur
- Page 96 and 97:
mapeamento de solos fosse classific
- Page 98 and 99:
predominância de latossolos (64 %)
- Page 100 and 101:
um banco de dados digitais para ess
- Page 102 and 103:
6 SUGESTÕESComo trabalhos futuros
- Page 104 and 105:
mapa de solos na região de Três P
- Page 106 and 107:
COSTA CABRAL, M. & BURGES, S.J. Dig
- Page 108 and 109:
IBGE - INSTITUTO BRASILEIRO DE GEOG
- Page 110 and 111:
McBRATNEY, A.B.; MENDONÇA SANTOS,
- Page 112 and 113:
PISSARA, T.C.T.; POLITANO, W.; FERR
- Page 114 and 115:
TURCOTTE, R.; FORTIN, J.P.; ROUSSEA
- Page 116 and 117:
8 ANEXO(S)Anexo I………………
- Page 118 and 119:
65,9 0,9 3,6 6,8 LVdf text. argilos
- Page 120 and 121:
Balanceamento de classes = 1a b c d
- Page 122:
Anexo VI - Matriz de confusão para