MineraÃ§Ã£o de dados para inferÃªncia da relaÃ§Ã£o solo ... - IAC

More documents

Recommendations

Info

intermediário, é a unidade de tomada de decisão que avalia através de teste lógico qualserá o próximo nó descendente ou filho. Em contrapartida, um nó externo, aquele quenão tem nó descendente, também conhecido como folha ou nó terminal, está associado aum rótulo ou valor. Assim, apresenta-se um conjunto de dados ao nó inicial da árvore, edependendo do resultado do teste lógico usado pelo nó, a árvore ramifica-se para umdos nós filhos e este procedimento é repetido até que um nó terminal é alcançado. Arepetição deste procedimento caracteriza a recursividade da árvore de decisão(BREIMAN et al., 1984).Um dos principais autores contribuintes para o desenvolvimento dessametodologia foi QUINLAN (1983), através do desenvolvimento do algoritmo ID3(Iterative Dichotomizer – Dicotomizador Iterativo), na qual um conjunto de dados deum exemplo qualquer permitiu a construção automática de uma árvore de decisão.Para a construção destas árvores também são usados outros algoritmos como oASSISTANT, C4.5, C5 (QUINLAN, 1983), CART ( BREIMAN et al., 1984), dentreoutros. O C4.5 não depende de suposições sobre a distribuição dos valores das variáveisou da independência entre si das variáveis. Isto é importante quando se utiliza dados deSIG juntamente com dados de imagem (ARAKI, 2005). Não há uma forma dedeterminar qual é o melhor algoritmo, sendo que um pode ter melhor desempenho emdeterminada situação e outro pode ser mais eficiente em outros tipos de situações.A figura 1 representa uma árvore de decisão onde cada nó de decisão contém umteste para algum atributo, cada ramo descendente corresponde a um possível valor desteatributo, os conjuntos de ramos são distintos, cada folha está associada a uma classe e,cada percurso da árvore, da raiz à folha, corresponde uma regra de classificação.Figura 1 - Representação esquemática de uma árvore de decisão (GAMA, 2004).19
Como se pode visualizar, a estrutura de uma árvore de decisão é formada por:– folhas (nós puros), que correspondem às unidades a serem preditas.– nós internos, que correspondem aos atributos (especifica algum teste efetuado numúnico atributo, com duas ou mais sub-árvores que representam saídas possíveis);– ramos, que correspondem aos valores dos atributos.Os algoritmos de indução de árvores de decisão constroem os padrões a partirdos dados de treino, de uma forma recursiva efetuando a subdivisão do conjunto dedados até que este seja apenas composto por nós “puros”, ou seja, até que cada nórepresente apenas uma única classe ou satisfaça um determinado critério (QUINTELA,2005).O critério utilizado para realizar as partições é o da utilidade do atributo para aclassificação. Aplica-se, por este critério, um determinado ganho de informação a cadaatributo. O atributo escolhido como atributo teste para o corrente nó é aquele que possuio maior ganho de informação. A partir desta aplicação, inicia-se um novo processo departição. Nos casos em que a árvore é usada para classificação, os critérios de partiçãomais conhecidos são baseados na entropia (ONODA, 2001).Entropia é o cálculo do ganho de informação baseado em uma medida utilizadana teoria da informação (equações 1, 2, 3 e 4), na qual H é a entropia e U(y/x) o grau deincerteza da informação (equações 5 e 6), sendo y a variável a ser predita e x a original.A entropia caracteriza a pureza/impureza dos dados: em um conjunto de dados, é umamedida da falta de homogeneidade dos dados de entrada em relação a sua classificação.Por exemplo, a entropia é máxima quando x prediz totalmente y (igual a 1), ou seja,quando o conjunto de dados é heterogêneo (MITCHELL (1997); COIMBRA (2008)). Jáquando a entropia é 0, x e y não apresentam associação alguma.A entropia, H, de x e y é respectivamente:H ( x)= ∑ − p i. ln pie H ( y)= ∑ − p j. ln pj[1]onde i = 1,2.. n, nas classes de variáveis x; j = 1,2.. m, nas classes da variável y; p é aprobabilidade de ocorrência de uma classe; ln é o logaritmo natural.A entropia conjunta é:−∑H ( x,y)[2]= p i. ln pj ija entropia de x dado y é:20
Page 1 and 2: INSTITUTO AGRONÔMICOCURSO DE PÓS-
Page 4 and 5: Primeiramente a Deus, pela vida,Ao
Page 6 and 7: - A toda turma do geoprocessamento
Page 8 and 9: ÍNDICE DE TABELASTabela 1 - Distri
Page 10 and 11: ÍNDICE DE FIGURASFigura 1 - Repres
Page 12 and 13: CRIVELENTI, Rafael Castro. Mineraç
Page 14 and 15: CRIVELENTI, Rafael Castro. Data min
Page 16 and 17: 1 INTRODUÇÃOA distribuição espa
Page 18 and 19: 2 REVISÃO DE LITERATURA2.1 Histór
Page 20 and 21: 2.2 Levantamento pedológico por m
Page 22 and 23: corretivas ou compensatórias de ca
Page 24 and 25: Nesta perspectiva, é oportuno dese
Page 28 and 29: irregulares (MONTGOMERY, 2003). As
Page 30 and 31: o objetivo de diminuir o erro por e
Page 32 and 33: Recentemente, SIRTOLI et al. (2008)
Page 36 and 37: −∑H x / y)= p .ln( p / p )[3](i
Page 38 and 39: Estes sistemas manipulam dados geor
Page 40 and 41: 2.9 Comparação entre resultados d
Page 42 and 43: mapeamento, considerando as classes
Page 44 and 45: correlacionaram com a distribuiçã
Page 46 and 47: 3 MATERIAL E MÉTODOS3.1 Descriçã
Page 48 and 49: (a)120Extrato do Balanço Hídrico
Page 50 and 51: (a)(b)Figura 5 - Mapas de geologia
Page 52 and 53: Conforme PONÇANO (1981), o ambient
Page 54 and 55: h) Cambissolo: Solos constituídos
Page 56 and 57: 1:1.000.000 (IPT, 1981), e evidenci
Page 58 and 59: ) Curvatura em perfil (VALERIANO, 2
Page 60 and 61: dados estratificados retirados ante
Page 62 and 63: 4 RESULTADOS E DISCUSSÃO4.1 MDE, G
Page 64 and 65: (a)(b)(c)Figura 7 - Mapas de variá
Page 66 and 67: (a)(b)(c)Figura 8 - Mapas de variá
Page 68 and 69: 4.2 Análise dos dados e elaboraç
Page 70 and 71: BalanceamentosFigura 10 - Distribui
Page 72 and 73: ocorrência deixe de ser amostrada
Page 74 and 75: unidades de mapeamento de solos fos
Page 76 and 77: devido a sua grande representativid
Page 78 and 79: Tabela 12 - Atualização da legend
Page 80 and 81: A análise do mapa permite verifica
Page 82 and 83: Tabela 15 - Ordenamento das variáv
Page 84 and 85:
A partir da sobreposição dos mapa
Page 86 and 87:
Tabela 16 - Matiz de confusão das
Page 88 and 89:
Tabela 17 - Porcentagem de acerto e
Page 90 and 91:
Como pode ser observado na figura 1
Page 92 and 93:
unidades de mapeamento. Por exemplo
Page 94 and 95:
O latossolo vermelho amarelo textur
Page 96 and 97:
mapeamento de solos fosse classific
Page 98 and 99:
predominância de latossolos (64 %)
Page 100 and 101:
um banco de dados digitais para ess
Page 102 and 103:
6 SUGESTÕESComo trabalhos futuros
Page 104 and 105:
mapa de solos na região de Três P
Page 106 and 107:
COSTA CABRAL, M. & BURGES, S.J. Dig
Page 108 and 109:
IBGE - INSTITUTO BRASILEIRO DE GEOG
Page 110 and 111:
McBRATNEY, A.B.; MENDONÇA SANTOS,
Page 112 and 113:
PISSARA, T.C.T.; POLITANO, W.; FERR
Page 114 and 115:
TURCOTTE, R.; FORTIN, J.P.; ROUSSEA
Page 116 and 117:
8 ANEXO(S)Anexo I………………
Page 118 and 119:
65,9 0,9 3,6 6,8 LVdf text. argilos
Page 120 and 121:
Balanceamento de classes = 1a b c d
Page 122:
Anexo VI - Matriz de confusão para
show all

MineraÃ§Ã£o de dados para inferÃªncia da relaÃ§Ã£o solo ... - IAC

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?