ANÁlise de correspondência canônica índice



Baixar 219.12 Kb.
Página1/5
Encontro19.07.2016
Tamanho219.12 Kb.
  1   2   3   4   5

MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

ANÁLISE DE CORRESPONDÊNCIA CANÔNICA


ÍNDICE

Página


1. INTRODUÇÃO 2

2. A ANÁLISE DE CORRESPONDÊNCIA 6

2.1. Algoritmo de Geração da Análise de Correspondência 7

3. A ANÁLISE DE CORRESPONDÊNCIA CANÔNICA 9

3.1. Algoritmo de Geração da Análise de Correspondência Canônica 11

3.2. Reduzindo o Número de Variáveis 13

3.2.1. Seleção Através de Critérios Externos 13

3.2.2. Exame da Estrutura de Correlação 13

3.2.3. Interpretabilidade 13

3.2.4. Análise de Stepwise 14

3.3. Apresentação e Interpretação dos resultados 14

3.4. Implementando a Análise de Correspondência Canônica 17

3.4.1. Preparação dos Dados 17

3.4.2. Execução da CCA no PC-ORD 19

3.4.2.1. Opções de Escala da CCA 19

3.4.2.2. Escalonamento dos Escores de Ordenação 20

3.4.2.3. Escores para os Gráficos: 20

3.4.2.4. Lista de Coeficientes de Correlação para a Matriz Secundária 20

3.4.2.5. Teste de Monte Carlo 20

3.4.3. Resultados da CCA 21

3.4.3.1. Relatório de Interação 22

3.4.3.2. Sumário das Estatísticas dos Eixos 23

3.4.3.3. Resultados da Regressão Múltipla 23

3.4.3.4. Escores Finais para os Sítios e Espécies 25

3.4.3.5. Correlações e Escores Biplots para as Variáveis Ambientais 26

3.4.3.6. Resultados do Teste de Monte Carlo 27

3.4.4. Elaboração dos Gráficos de Ordenação 27

4. REFERÊNCIAS BIBLIOGRÁFICAS 29





1. INTRODUÇÃO


A análise multivariada é a área da análise estatística que se preocupa com as relações entre variáveis dependentes.

Os métodos multivariados são poderosos, permitindo ao pesquisador manipular diversas variáveis simultaneamente. São, porém, bastantes complexos, tanto na sua estrutura teórica como na metodologia operacional. Em alguns casos os testes estatísticos a serem utilizados exigem requisitos muito rígidos e em outros, não apresentam base estatística teórica não havendo, desse modo, possibilidade de testes de significância.



O modelo matemático no qual os procedimentos estatísticos multivariados são baseados é a distribuição normal multivariada. Por sua vez, os dados multivariados apresentam as seguintes características (WALKER, 2001):

  • Possuem múltiplas fontes de variância;

  • Podem ter múltiplas dimensões, como, por exemplo, quando lotes de um mesmo tipo de dados são coletados dentro de lotes de mesmas amostras;

  • Temos interesse nas relações de mais de duas dessas fontes de variância.

Segundo JOHNSON & WICHERN (1988), os métodos multivariados são mais apropriados quando os objetivos da investigação científica incluem:

  • Redução de dados ou simplificação estrutural: O fenômeno estudado é representado de modo mais simples possível, sem sacrificar informações valiosas. Espera-se assim, uma interpretação mais fácil;

  • Classificação ou agrupamento: Grupos de objetos ou variáveis “similares” são criados, baseando-se em medidas características. Alternativamente, regras para classificação de objetos em grupos bem definidos podem ser elaboradas;

  • Investigação de dependência entre variáveis: Neste caso o interesse está na natureza das relações entre variáveis. Todas as variáveis são independentes ou, uma ou mais variável é dependente de outras? Sendo dependente, quais são essas variáveis?

  • Predição: As relações entre variáveis são determinadas com a finalidade de predizer os valores de uma ou mais variáveis, com base nas observações sobre outras variáveis;

  • Construção e teste de hipóteses: São testadas hipóteses estatísticas específicas, formuladas em termos dos parâmetros de populações multivariadas. Isto pode ser feito para validar pressuposições ou reforçar convicções assumidas a priori.

As principais características dos métodos multivariados segundo ORLÓCI (1978) são:

  • Usam dados multidimensionais nos quais os indivíduos são descritos por p vetores de valores nos quais os elementos são medidas de p variáveis. Assume-se que os indivíduos na população são unidades discretas que podem ser reconhecidas sem ambigüidade. Assume-se também, enquanto permitindo correlações entre elas, que as variáveis são diferentes propriedades mensuráveis dos objetos;

  • De modo geral, não associam, a priori, diferentes variáveis com diferentes valores de importância. Se diferente importância é atribuída a diferentes variáveis, os dados são manipulados para introduzir diferentes pesos antes da análise;

  • São concernentes com variáveis correlacionadas em um contexto mais amplo. Se as variáveis em uma amostra são independentes, nenhuma vantagem real pode ser obtida pela aplicação da análise multivariada;

  • Estipulam ou assumem uma forma funcional para as várias correlações. Esta forma freqüentemente é linear, embora existam técnicas que não restringem a não linearidade.

  • Podem ou não requerer pressuposições à cerca da estrutura dos dados. Se um tipo específico de estrutura de dados é assumido, freqüentemente é a gerada quando a distribuição das variáveis é normal multivariada;

  • Podem ser considerados paramétricos num contexto mais amplo, pois utilizam medidas reais. Algumas vezes, também são paramétricos em termos estatísticos ao assumirem um certo tipo de distribuição de probabilidade nos dados. A distribuição mais freqüentemente assumida é a distribuição normal p-dimensional;

  • Normalmente assumem que a estrutura dos dados não incorpora a dimensão de tempo;

  • São extremamente consumidores de tempo de processamento. Normalmente, não poderiam ser contemplados sem o acesso a modernos recursos computacionais.

A escolha do método de análise multivariada mais adequado tem sido determinada pela precisão desejada, pela facilidade da análise, pela forma como os dados foram obtidos e pela natureza dos objetivos a serem alcançados. Assim, por exemplo, a análise de agrupamento difere da análise por componentes principais e por variáveis canônicas em razão de dependerem fundamentalmente de medidas de dissimilaridade, estimadas previamente, como as distâncias euclidianas ou de Mahalanobis, entre outras. Por outro lado, nos métodos de componentes principais e de análise canônica, o objetivo é avaliar a similaridade dos indivíduos por intermédio de uma dispersão gráfica, em que se consideram, em geral, dois eixos cartesianos (CRUZ, 1990).

Neste contexto, PALMER (2001) recomenda os seguintes passos que devem ser seguidos ao se fazer uma análise multivariada:



  • Definir os objetivos;

  • Determinar a estrutura dos dados: Os dados são multidimensionais? Podem ser reduzidos em poucas variáveis? Quais variáveis são dependentes, quais são independentes, e quais podem ser ambas, dependendo do contexto?;

  • Determinar quais tipos de medidas se possui: As variáveis são métricas ou não métricas? Se forem não métricas, poderiam ser convertidas de alguma maneira em métricas, ou, se ordinal, tratadas como métrica? O que se pode ganhar ou perder ao se fazer isto?

  • Determinar se há problemas de suposições ou de modelo com as técnicas;

  • Decidir qual técnica se ajusta ao conjunto de dados, pelo menos nominalmente. A Figura 1 apresenta um guia para auxiliar na escolha das técnicas.

  • Determinar se se deve quebrar o problema em partes suficientemente pequenas: a maioria dos estudos real envolve o uso de diferentes técnicas em diferentes estágios. Muitas vezes o produto de um pode tornar-se a entrada do próximo.



Figura 1 - Guia para seleção de técnicas multivariadas (PALMER, 2001)

É difícil estabelecer um esquema amplamente aceito de classificação para as técnicas multivariadas e que ao mesmo tempo indique a adequação de cada uma delas. Uma classificação distingue técnicas desenhadas para estudar relações de interdependência daquelas desenhadas para estudar relações de dependência. (JOHNSON & WICHERN 1988).

A análise de dependência estuda a dependência de uma ou mais variáveis em relação às outras variáveis. Consideramos, então, dois subconjuntos, um no qual as variáveis são denominadas independentes e outro em que tratamos das variáveis dependentes. Por sua vez, a análise de interdependência estuda as relações de um conjunto de variáveis entre si, sem selecionar nenhuma delas em especial, como variável dependente (KENDALL (1950), citado por FACHEL, 1976).

Enquadram-se na análise de dependência, por exemplo, a análise de regressão, a análise de variância multivariada, a múltipla contingência e a análise discriminante; enquanto na análise de interdependência, salientando-se apenas o caráter de interdependência das variáveis, que se enquadram as técnicas de “Cluster Análise” ou Análise de Agrupamento, Componentes Principais, Correlações Canônicas, Análise Fatorial e Escala.

Outra maneira de se classificar as técnicas multivariadas é colocar cada procedimento em um quadrante de um lattice de acordo com a quantidade de conjuntos de variáveis e de populações que são incluídas no “desenho”, conforme ilustrado na Figura 2.

GAUCH (1982) classifica as técnicas multivariadas, de acordo com o uso em estudos de ecologia de comunidades, em três grupos diferentes: Análise Direta de Gradiente; Classificação e Ordenação.


A análise direta de gradiente utiliza procedimentos gráficos simples para reduzir e revelar a estrutura dos dados multivariados. É usada para estudar a distribuição de espécies ao longo de gradientes ambientais conhecidos e facilmente medidos.

A classificação basicamente envolve o agrupamento de entidades similares em grupos ou “clusters”, sendo que esses grupos podem ou não ser arranjados hierarquicamente.

Os métodos de ordenação consistem basicamente em sintetizar, em um gráfico com eixos perpendiculares (eixos de ordenação) entre si, a variação multidimensional dos dados a serem estudados. O termo ordenação significa, para os biologistas, essencialmente o mesmo que escala significa para o cientista social. Ambas palavras descrevem o processo de produção de um pequeno número de variáveis que pode ser usado para descrever a relação entre um grupo de objetos iniciando ou por uma matriz de distâncias ou similaridades entre os objetos, ou a partir de valores de um grande número de variáveis medidas sobre cada objeto (MANLY, 1994).



Figura 2 - Classificação dos procedimentos multivariados (COOLEY & LOHNES, 1971)

O objetivo deste trabalho é apresentar os principais aspectos da análise de correspondência canônica, uma técnica de ordenação usada principalmente em pesquisas ecológicas para estudar as relações espécies-ambientes.


  1   2   3   4   5


©principo.org 2016
enviar mensagem

    Página principal