Tese em PDF - departamento de engenharia florestal - ufpr ...
Tese em PDF - departamento de engenharia florestal - ufpr ...
Tese em PDF - departamento de engenharia florestal - ufpr ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
edundantes e a pequena variabilida<strong>de</strong> <strong>de</strong> ruídos pod<strong>em</strong> ser r<strong>em</strong>ovidos<br />
(MARTEN; TORMOD, 1989, citado por CARNEIRO, 2008).<br />
Quando aplicamos um algoritmo <strong>de</strong> PCA num conjunto <strong>de</strong> variáveis, como<br />
por ex<strong>em</strong>plo, espectros no infravermelho, o conjunto original <strong>de</strong>stas variáveis é<br />
substituído por um novo conjunto <strong>de</strong> variáveis <strong>de</strong>nominado <strong>de</strong> Componentes<br />
Principais (CPs). A principal característica <strong>de</strong>ste novo conjunto é a<br />
ortogonalida<strong>de</strong>, porém o mesmo é facilmente reconstruído a partir da combinação<br />
linear das variáveis originais (espectros). Como vantag<strong>em</strong>, o novo conjunto <strong>de</strong><br />
variáveis (CPs), geralmente concentra a maior parte da informação (variância) <strong>em</strong><br />
poucas variáveis, diminuindo assim a dimensionalida<strong>de</strong> dos dados, s<strong>em</strong> perda<br />
significativa da informação química (CARNEIRO, 2008).<br />
Cada componente principal t<strong>em</strong> um autovetor e um autovalor <strong>em</strong> particular.<br />
Os autovetores representam os vetores que explicam a máxima variância, que<br />
darão à direção dos novos eixos ou fatores (CARNEIRO, 2008).<br />
As componentes principais são <strong>de</strong>terminadas com base no critério <strong>de</strong><br />
máxima variância. Cada subseqüente componente principal <strong>de</strong>screve um máximo<br />
<strong>de</strong> variância, que não é mo<strong>de</strong>lada para formar a componente anterior. De acordo<br />
com esta afirmação, a primeira componente principal contém mais informação<br />
que a segunda componente, que por sua vez, contém mais informação que a<br />
terceira, <strong>de</strong>sta forma sucessivamente (CARNEIRO, 2008).<br />
As componentes principais pod<strong>em</strong> fornecer a percentag<strong>em</strong> <strong>de</strong> variância<br />
contida <strong>em</strong> cada fator. Todas as componentes juntas <strong>em</strong> um mo<strong>de</strong>lo fornec<strong>em</strong><br />
100% <strong>de</strong> variância e a maior percentag<strong>em</strong> é explicada pela primeira componente<br />
principal (CARNEIRO, 2008).<br />
O princípio da PCA é a aproximação da matriz original X <strong>em</strong> um produto <strong>de</strong><br />
duas matrizes menores: a matriz <strong>de</strong> loadings L e a matriz <strong>de</strong> scores T, dadas pela<br />
equação 1: X = T P T<br />
As colunas <strong>em</strong> T são os vetores scores e as linhas <strong>em</strong> P são chamadas <strong>de</strong><br />
vetores loadings (ambos os vetores são ortogonais). Em termos geométricos, os<br />
scores são as novas coor<strong>de</strong>nadas para o novo sist<strong>em</strong>a <strong>de</strong> eixos e contém<br />
informações a respeito das amostras. Os loadings fornec<strong>em</strong> a direção dos eixos<br />
ou componentes principais e estão relacionados com informações sobre as<br />
variáveis (OTTO, 1999, citado por CARNEIRO 2008).<br />
55