Dissertação em PDF - departamento de engenharia florestal - ufpr ...

Dissertação em PDF - departamento de engenharia florestal - ufpr ... Dissertação em PDF - departamento de engenharia florestal - ufpr ...

floresta.ufpr.br
from floresta.ufpr.br More from this publisher
27.10.2013 Views

Basicamente, a Análise Multivariada consiste no estudo estatístico dos problemas relacionados com (NETO, 2010): • Inferências sobre médias multivariadas; • Análise da estrutura de covariâncias de uma matriz de dados; • Técnicas de reconhecimento de padrão, classificação e agrupamento. Em linhas gerais, os métodos de estatística multivariada são utilizados com o propósito de simplificar ou facilitar a interpretação do fenômeno em estudo através da construção de índices ou variáveis alternativas que sintetizem a informação original dos dados; construir grupos de elementos amostrais que apresentem similaridade entre si, possibilitando a segmentação do conjunto de dados original; investigar as relações de dependência entre as variáveis respostas associadas ao fenômeno e outros fatores (variáveis explicativas), muitas vezes, com objetivos de predição; e, comparar populações ou validar suposições de testes de hipóteses (MINGOTI, 2005). De acordo com Hair Jr et al. (2009), o caráter multivariado consiste nas múltiplas variáveis estatísticas (combinações múltiplas de variáveis) e não apenas no número de variáveis e observações. Assim, para uma amostra ser considerada realmente multivariada, todas as variáveis devem ser aleatórias que se inter- relacionam de tal modo que seus diferentes efeitos não podem ser interpretados separadamente. A análise de múltiplas variáveis é comumente realizada com base em notações matriciais, e seus dados primários constituem as estatísticas descritivas dos vetores aleatórios. No estudo de p ≥ 1 variáveis, geralmente, toma-se n observações de cada variável para obter informações sobre parâmetros, relacionamentos entre variáveis, comparações, etc. Assim, as medidas registradas são xij com i = 1,2,...,n (observações) e j = 1,2,...,p (variáveis) que podem ser agrupadas na matriz de dados nXp, com n linhas e p colunas (NETO, 2010): ⋯ ⋯ ⋮ ⋮ ⋱ ⋮ ⋯ A matriz de dados nXp contém n observações do vetor aleatório p- dimensional X’ = [X1, X2,..., Xp]. As estatísticas descritivas dos vetores aleatórios 44

empregadas como dados primários de análises multivaridadas são o vetor médio amostral, matriz de covariância amostral e matriz de correlação amostral. De acordo com Hair et al. (2009), as técnicas de análise multivariada podem ser divididas em técnicas de dependência e de interdependência. Uma técnica de dependência pode ser definida como uma análise em que uma variável ou conjunto de variáveis é identificada como variável dependente a ser prevista ou explicada por outras variáveis conhecidas como variáveis independentes. As técnicas de análise multivariadas de dependência são: análise de correlação canônica, análise multivariada de variância, análise de regressão múltipla, análise conjunta, análise discriminante múltipla, modelos lineares de probabilidade e modelos de equações estruturais. As técnicas de análise multivariada de interdependência são aquelas em que nenhuma variável ou grupo de variáveis é definida como sendo independente ou dependente. Ao invés disso, o procedimento envolve a análise simultânea de todas as variáveis no conjunto. Dentre as técnicas de análise de interdependência, destacam-se: análise de componentes principais, análise fatorial, análise de agrupamentos, escalonamento multidimensional e análise de correspondência. Nesta pesquisa, utilizou-se a técnica de interdependência análise fatorial. 2.4.1. Suposições estatísticas da análise multivariada Todas as técnicas multivariadas têm suposições inerentes, tanto estatísticas quanto conceituais, que influenciam muito suas habilidades para representar relações multivariadas. As suposições de normalidade multivariada, linearidade, independência de termos de erro e igualdade de variâncias em uma relação de dependência devem ser todas atendidas (Hair et al., 2009). A suposição mais fundamental em análise multivariada é a normalidade, a qual se refere à forma da distribuição de dados para uma variável métrica individual e sua correspondência com a distribuição normal. Se a variação em relação à distribuição normal é suficientemente grande, todos os testes estatísticos resultantes são inválidos (Hair et al., 2009). 45

Basicamente, a Análise Multivariada consiste no estudo estatístico dos probl<strong>em</strong>as<br />

relacionados com (NETO, 2010):<br />

• Inferências sobre médias multivariadas;<br />

• Análise da estrutura <strong>de</strong> covariâncias <strong>de</strong> uma matriz <strong>de</strong> dados;<br />

• Técnicas <strong>de</strong> reconhecimento <strong>de</strong> padrão, classificação e agrupamento.<br />

Em linhas gerais, os métodos <strong>de</strong> estatística multivariada são utilizados com<br />

o propósito <strong>de</strong> simplificar ou facilitar a interpretação do fenômeno <strong>em</strong> estudo através<br />

da construção <strong>de</strong> índices ou variáveis alternativas que sintetiz<strong>em</strong> a informação<br />

original dos dados; construir grupos <strong>de</strong> el<strong>em</strong>entos amostrais que apresent<strong>em</strong><br />

similarida<strong>de</strong> entre si, possibilitando a segmentação do conjunto <strong>de</strong> dados original;<br />

investigar as relações <strong>de</strong> <strong>de</strong>pendência entre as variáveis respostas associadas ao<br />

fenômeno e outros fatores (variáveis explicativas), muitas vezes, com objetivos <strong>de</strong><br />

predição; e, comparar populações ou validar suposições <strong>de</strong> testes <strong>de</strong> hipóteses<br />

(MINGOTI, 2005).<br />

De acordo com Hair Jr et al. (2009), o caráter multivariado consiste nas<br />

múltiplas variáveis estatísticas (combinações múltiplas <strong>de</strong> variáveis) e não apenas<br />

no número <strong>de</strong> variáveis e observações. Assim, para uma amostra ser consi<strong>de</strong>rada<br />

realmente multivariada, todas as variáveis <strong>de</strong>v<strong>em</strong> ser aleatórias que se inter-<br />

relacionam <strong>de</strong> tal modo que seus diferentes efeitos não pod<strong>em</strong> ser interpretados<br />

separadamente.<br />

A análise <strong>de</strong> múltiplas variáveis é comumente realizada com base <strong>em</strong><br />

notações matriciais, e seus dados primários constitu<strong>em</strong> as estatísticas <strong>de</strong>scritivas<br />

dos vetores aleatórios. No estudo <strong>de</strong> p ≥ 1 variáveis, geralmente, toma-se n<br />

observações <strong>de</strong> cada variável para obter informações sobre parâmetros,<br />

relacionamentos entre variáveis, comparações, etc. Assim, as medidas registradas<br />

são xij com i = 1,2,...,n (observações) e j = 1,2,...,p (variáveis) que pod<strong>em</strong> ser<br />

agrupadas na matriz <strong>de</strong> dados nXp, com n linhas e p colunas (NETO, 2010):<br />

<br />

<br />

<br />

<br />

⋯ <br />

⋯ ⋮ ⋮ ⋱ ⋮ <br />

⋯ A matriz <strong>de</strong> dados nXp contém n observações do vetor aleatório p-<br />

dimensional X’ = [X1, X2,..., Xp]. As estatísticas <strong>de</strong>scritivas dos vetores aleatórios<br />

44

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!