Tese em PDF - departamento de engenharia florestal - ufpr ...
Tese em PDF - departamento de engenharia florestal - ufpr ...
Tese em PDF - departamento de engenharia florestal - ufpr ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
construído a partir das variáveis selecionadas (NORGAARD et al., 2000 citado por<br />
CARNEIRO, 2008).<br />
A escolha do número <strong>de</strong> variáveis latentes é um dos parâmetros mais<br />
importantes no <strong>de</strong>senvolvimento do mo<strong>de</strong>lo. A validação cruzada foi utilizada<br />
como ferramenta no auxílio da seleção do número <strong>de</strong> variáveis latentes. Se o<br />
número for muito baixo, informações importantes pod<strong>em</strong> não ser mo<strong>de</strong>ladas e se<br />
for alto, <strong>em</strong>bora melhore o ajuste do mo<strong>de</strong>lo <strong>de</strong> calibração, incluirá ruído no<br />
mo<strong>de</strong>lo. Se o número <strong>de</strong> variáveis latentes não for a<strong>de</strong>quado prejudicará o<br />
mo<strong>de</strong>lo (SAMISTRARO, 2008).<br />
A <strong>de</strong>terminação do número variável latentes é um fator relevante para a<br />
qualida<strong>de</strong> do mo<strong>de</strong>lo elaborado quando se utiliza uma técnica <strong>de</strong> calibração<br />
baseada no método PCA, como é o caso do PLS. Existe para cada mo<strong>de</strong>lo um<br />
número ótimo <strong>de</strong> fatores, com informações suficientes para o mo<strong>de</strong>lamento, s<strong>em</strong><br />
causar o efeito <strong>de</strong> superajustamento ou “overfitting”, causado principalmente por<br />
um número excessivo <strong>de</strong> fatores no mo<strong>de</strong>lo. O superajustamento é in<strong>de</strong>sejável,<br />
pois po<strong>de</strong> incluir informações irrelevantes como ruídos e interferências e também<br />
po<strong>de</strong> apresentar baixa habilida<strong>de</strong> <strong>de</strong> previsão. Por outro lado, a inclusão <strong>de</strong> um<br />
número muito baixo <strong>de</strong> fatores po<strong>de</strong> <strong>de</strong>ixar <strong>de</strong> mo<strong>de</strong>lar muitas informações<br />
importantes ocasionando o efeito <strong>de</strong> “un<strong>de</strong>rfitting” ou ajustamento inferior<br />
(CARNEIRO, 2008).<br />
Para Samistraro (2008), o parâmetro envolvido na seleção das variáveis<br />
latentes para cada mo<strong>de</strong>lo <strong>de</strong>senvolvido foi o que proporcionou o menor erro<br />
médio quadrático <strong>de</strong> previsão (RMSEP) na validação cruzada. Os valores<br />
previstos pelo mo<strong>de</strong>lo e os valores referência foram então comparados.<br />
3.2.11.3 Detecção <strong>de</strong> outliers<br />
Anomalias são el<strong>em</strong>entos muito diferentes ou que apresentam erros<br />
grosseiros quando comparados à maioria dos dados. Por este motivo é<br />
necessária a i<strong>de</strong>ntificação e eliminação <strong>de</strong>stes el<strong>em</strong>entos já no processo <strong>de</strong><br />
calibração, pois caso contrário po<strong>de</strong>-se obter um mo<strong>de</strong>lo não representativo.<br />
64