27.10.2013 Views

Tese em PDF - departamento de engenharia florestal - ufpr ...

Tese em PDF - departamento de engenharia florestal - ufpr ...

Tese em PDF - departamento de engenharia florestal - ufpr ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

construído a partir das variáveis selecionadas (NORGAARD et al., 2000 citado por<br />

CARNEIRO, 2008).<br />

A escolha do número <strong>de</strong> variáveis latentes é um dos parâmetros mais<br />

importantes no <strong>de</strong>senvolvimento do mo<strong>de</strong>lo. A validação cruzada foi utilizada<br />

como ferramenta no auxílio da seleção do número <strong>de</strong> variáveis latentes. Se o<br />

número for muito baixo, informações importantes pod<strong>em</strong> não ser mo<strong>de</strong>ladas e se<br />

for alto, <strong>em</strong>bora melhore o ajuste do mo<strong>de</strong>lo <strong>de</strong> calibração, incluirá ruído no<br />

mo<strong>de</strong>lo. Se o número <strong>de</strong> variáveis latentes não for a<strong>de</strong>quado prejudicará o<br />

mo<strong>de</strong>lo (SAMISTRARO, 2008).<br />

A <strong>de</strong>terminação do número variável latentes é um fator relevante para a<br />

qualida<strong>de</strong> do mo<strong>de</strong>lo elaborado quando se utiliza uma técnica <strong>de</strong> calibração<br />

baseada no método PCA, como é o caso do PLS. Existe para cada mo<strong>de</strong>lo um<br />

número ótimo <strong>de</strong> fatores, com informações suficientes para o mo<strong>de</strong>lamento, s<strong>em</strong><br />

causar o efeito <strong>de</strong> superajustamento ou “overfitting”, causado principalmente por<br />

um número excessivo <strong>de</strong> fatores no mo<strong>de</strong>lo. O superajustamento é in<strong>de</strong>sejável,<br />

pois po<strong>de</strong> incluir informações irrelevantes como ruídos e interferências e também<br />

po<strong>de</strong> apresentar baixa habilida<strong>de</strong> <strong>de</strong> previsão. Por outro lado, a inclusão <strong>de</strong> um<br />

número muito baixo <strong>de</strong> fatores po<strong>de</strong> <strong>de</strong>ixar <strong>de</strong> mo<strong>de</strong>lar muitas informações<br />

importantes ocasionando o efeito <strong>de</strong> “un<strong>de</strong>rfitting” ou ajustamento inferior<br />

(CARNEIRO, 2008).<br />

Para Samistraro (2008), o parâmetro envolvido na seleção das variáveis<br />

latentes para cada mo<strong>de</strong>lo <strong>de</strong>senvolvido foi o que proporcionou o menor erro<br />

médio quadrático <strong>de</strong> previsão (RMSEP) na validação cruzada. Os valores<br />

previstos pelo mo<strong>de</strong>lo e os valores referência foram então comparados.<br />

3.2.11.3 Detecção <strong>de</strong> outliers<br />

Anomalias são el<strong>em</strong>entos muito diferentes ou que apresentam erros<br />

grosseiros quando comparados à maioria dos dados. Por este motivo é<br />

necessária a i<strong>de</strong>ntificação e eliminação <strong>de</strong>stes el<strong>em</strong>entos já no processo <strong>de</strong><br />

calibração, pois caso contrário po<strong>de</strong>-se obter um mo<strong>de</strong>lo não representativo.<br />

64

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!