11.07.2015 Views

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

Mineração de dados para inferência da relação solo ... - IAC

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

intermediário, é a uni<strong>da</strong><strong>de</strong> <strong>de</strong> toma<strong>da</strong> <strong>de</strong> <strong>de</strong>cisão que avalia através <strong>de</strong> teste lógico qualserá o próximo nó <strong>de</strong>scen<strong>de</strong>nte ou filho. Em contraparti<strong>da</strong>, um nó externo, aquele quenão tem nó <strong>de</strong>scen<strong>de</strong>nte, também conhecido como folha ou nó terminal, está associado aum rótulo ou valor. Assim, apresenta-se um conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> ao nó inicial <strong>da</strong> árvore, e<strong>de</strong>pen<strong>de</strong>ndo do resultado do teste lógico usado pelo nó, a árvore ramifica-se <strong>para</strong> umdos nós filhos e este procedimento é repetido até que um nó terminal é alcançado. Arepetição <strong>de</strong>ste procedimento caracteriza a recursivi<strong>da</strong><strong>de</strong> <strong>da</strong> árvore <strong>de</strong> <strong>de</strong>cisão(BREIMAN et al., 1984).Um dos principais autores contribuintes <strong>para</strong> o <strong>de</strong>senvolvimento <strong>de</strong>ssametodologia foi QUINLAN (1983), através do <strong>de</strong>senvolvimento do algoritmo ID3(Iterative Dichotomizer – Dicotomizador Iterativo), na qual um conjunto <strong>de</strong> <strong><strong>da</strong>dos</strong> <strong>de</strong>um exemplo qualquer permitiu a construção automática <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão.Para a construção <strong>de</strong>stas árvores também são usados outros algoritmos como oASSISTANT, C4.5, C5 (QUINLAN, 1983), CART ( BREIMAN et al., 1984), <strong>de</strong>ntreoutros. O C4.5 não <strong>de</strong>pen<strong>de</strong> <strong>de</strong> suposições sobre a distribuição dos valores <strong>da</strong>s variáveisou <strong>da</strong> in<strong>de</strong>pendência entre si <strong>da</strong>s variáveis. Isto é importante quando se utiliza <strong><strong>da</strong>dos</strong> <strong>de</strong>SIG juntamente com <strong><strong>da</strong>dos</strong> <strong>de</strong> imagem (ARAKI, 2005). Não há uma forma <strong>de</strong><strong>de</strong>terminar qual é o melhor algoritmo, sendo que um po<strong>de</strong> ter melhor <strong>de</strong>sempenho em<strong>de</strong>termina<strong>da</strong> situação e outro po<strong>de</strong> ser mais eficiente em outros tipos <strong>de</strong> situações.A figura 1 representa uma árvore <strong>de</strong> <strong>de</strong>cisão on<strong>de</strong> ca<strong>da</strong> nó <strong>de</strong> <strong>de</strong>cisão contém umteste <strong>para</strong> algum atributo, ca<strong>da</strong> ramo <strong>de</strong>scen<strong>de</strong>nte correspon<strong>de</strong> a um possível valor <strong>de</strong>steatributo, os conjuntos <strong>de</strong> ramos são distintos, ca<strong>da</strong> folha está associa<strong>da</strong> a uma classe e,ca<strong>da</strong> percurso <strong>da</strong> árvore, <strong>da</strong> raiz à folha, correspon<strong>de</strong> uma regra <strong>de</strong> classificação.Figura 1 - Representação esquemática <strong>de</strong> uma árvore <strong>de</strong> <strong>de</strong>cisão (GAMA, 2004).19

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!