11.07.2015 Views

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

<strong><strong>da</strong>dos</strong> estratificados retirados antes <strong>da</strong>s análises. Essa metodologia foi utiliza<strong>da</strong> visandoum maior aprendizado pelo programa, pois o banco <strong>de</strong> <strong><strong>da</strong>dos</strong> é muito extenso, e ametodologia tradicional <strong>de</strong> fazer o teste em 1/3 (33%) dos <strong><strong>da</strong>dos</strong> a partir do aprendizado<strong>de</strong> 2/3(66%) po<strong>de</strong> gerar uma baixa acurácia <strong>de</strong> predição.Com a finali<strong>da</strong><strong>de</strong> <strong>de</strong> melhorar a acurácia geral do mo<strong>de</strong>lo na predição <strong>da</strong>suni<strong>da</strong><strong>de</strong>s <strong>de</strong> mapeamentos dos <strong>solo</strong>s retiraram-se as UNIMAPS com menorrepresentativi<strong>da</strong><strong>de</strong>, ou seja, com probabili<strong>da</strong><strong>de</strong> zero <strong>de</strong> ocorrência no balanceamento <strong>de</strong>classes 0 e que, portanto, não estavam fazendo parte do mo<strong>de</strong>lo por apresentarem umabaixa distribuição espacial nas folhas estu<strong>da</strong><strong>da</strong>s. Uma vez retira<strong>da</strong>s, novos mo<strong>de</strong>losforam gerados através <strong>da</strong>s mesmas metodologias <strong>para</strong> observar os resultados.Para finalizar, refinamentos foram feitos através <strong>de</strong> uma técnica <strong>de</strong>nomina<strong>da</strong>po<strong>da</strong> <strong>da</strong> árvore <strong>de</strong> classificação. As po<strong>da</strong>s foram realiza<strong>da</strong>s com os valores 10, 50 e 100,sendo estes o número mínimo <strong>de</strong> pixels necessários <strong>para</strong> que a folha <strong>da</strong> árvore fosseestabeleci<strong>da</strong> e os resultados foram com<strong>para</strong>dos. Esses valores foram escolhidos emfunção <strong>da</strong> área mínima mapeável, consi<strong>de</strong>ra<strong>da</strong> igual a 0,6 x 0,6 cm 2 , <strong>de</strong> um mapa <strong>de</strong><strong>solo</strong>s na escala 1:50.000.Utilizando-se uma gra<strong>de</strong> <strong>de</strong> 30 x 30 metros <strong>para</strong> a elaboração do MDE nascartas topográficas 1:50.000, têm-se que 1 cm no mapa correspon<strong>de</strong> a 500 metros.Portanto, a área mínima mapeável é <strong>de</strong> 90.000 m 2 , que dividi<strong>da</strong> pela área <strong>de</strong> um pixelcorrespon<strong>de</strong> a um total <strong>de</strong> 100 pixels, sendo este, portanto, o valor máximo <strong>da</strong> po<strong>da</strong>.Além disso, com a finali<strong>da</strong><strong>de</strong> <strong>de</strong> observar o rankeamento dos parâmetrosmorfométricos <strong>para</strong> o mo<strong>de</strong>lo foram feitos testes <strong>de</strong> ganho <strong>de</strong> informação (entropia) equi-quadrado, através dos quais se obteve <strong>de</strong>termina<strong>da</strong> or<strong>de</strong>m <strong>para</strong> o mo<strong>de</strong>lo nas duasfolhas.A Entropia foi <strong>de</strong>scrita no capítulo 2.7 e o Qui-Quadrado (equações 8 e 9),simbolizado por χ 2 , é um teste <strong>de</strong> hipóteses que se <strong>de</strong>stina a encontrar um valor <strong>da</strong>dispersão <strong>para</strong> duas variáveis nominais, avaliando a associação existente entre variáveisqualitativas. O princípio básico <strong>de</strong>ste método é com<strong>para</strong>r proporções, isto é, as possíveisdivergências entre as freqüências observa<strong>da</strong>s e espera<strong>da</strong>s <strong>para</strong> certo evento.Evi<strong>de</strong>ntemente, po<strong>de</strong>-se dizer que dois grupos se comportam <strong>de</strong> forma semelhante se asdiferenças entre as freqüências observa<strong>da</strong>s e as espera<strong>da</strong>s em ca<strong>da</strong> categoria foremmuito pequenas, próximas a zero. PEARSON (1900) propôs a seguinte fórmula <strong>para</strong>medir as possíveis discrepâncias entre proporções observa<strong>da</strong>s e espera<strong>da</strong>s:45

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!