ANÁlise de correspondência canônica índice



Baixar 219.12 Kb.
Página3/5
Encontro19.07.2016
Tamanho219.12 Kb.
1   2   3   4   5

3. A ANÁLISE DE CORRESPONDÊNCIA CANÔNICA


Em muitos casos desejamos avaliar as relações entre dois grupos de variáveis: o primeiro grupo consiste de variáveis dependentes múltiplas de interesse direto; e o segundo é composto de variáveis que supostamente influenciam as variáveis do primeiro grupo. Sendo que, os objetivos principais desejados são determinar quais variáveis dependentes, ou suas combinações, são mais influenciadas e estimar os efeitos das variáveis explanatórias, ou suas combinações, que mais influenciam o grupo de variáveis resultantes de interesse.

Enquanto os modelos lineares multivariáveis (regressão multivariada, ou análise de variância múltipla – MANOVA) podem obter o segundo objetivo, mas não o primeiro, os métodos multivariados que não consideram as relações assimétricas entre os grupos de variáveis explanatórias e resultantes, tais como análise de correlações canônicas, não podem obter o segundo objetivo. Assim, para se alcançar os dois objetivos simultaneamente podemos utilizar a análise de correspondência canônica - CCA (FAYE et.al., 1997).

A CCA é uma técnica de análise de gradiente direto baseada na CA, em que os eixos interpretativos são obtidos dentro do algoritmo interativo de ordenação usando um conjunto de variáveis ambientais. Na realidade, é uma ordenação que considera a restrição extra de que os eixos de ordenação sejam combinações lineares de variáveis ambientais (MANLY, 1994).

Existe certa confusão entre análise de correspondência canônica e a análise de correlação canônica que também é freqüentemente abreviada como CCA. A análise de correlação canônica se assemelha à análise de correspondência canônica no fato que ambas buscam as relações entre dois conjuntos de dados multivariados (por exemplo, um conjunto de dados ambientais e um conjunto de dados relativos à abundância de espécie). Porém, a análise de correlação canônica assume respostas lineares para as variáveis ambientais. O que é improvável na natureza. Por sua vez a análise de correspondência canônica, como outros métodos de análise de correspondência, assume de forma mais razoável uma curva de resposta unimodal (TER BRAAK e PRENTICE, 1988).

A CCA tem sido usada principalmente em pesquisas ecológicas para estudar as relações espécies-ambientes. Nesses estudos, dois conjuntos de dados são analisados simultaneamente: o primeiro contém a ocorrência de diferentes espécies e animais; e o segundo descreve as condições ambientais.

A aplicação dessa técnica tem demonstrado ser uma importante ferramenta na identificação das relações espécie - ambiente, permitindo inclusive classificar espécies em termos de suas preferências quanto ao habitat (OLIVEIRA FILHO et al., 1994 a; OLIVEIRA FILHO et al., 1994 b; SMITH, 1995; OLIVEIRA FILHO et al., 1996), além de investigar questões específicas sobre a resposta de espécies às características ambientais (JOSE et al., 1996).

Como exemplos recentes de utilização desta técnica citam-se os trabalhos de BALDUINO (2001), que detectou através da análise de correspondência canônica um padrão de variação de densidade de espécies de uma área de cerrado stricto sensu em Paraopeba - MG, influenciado por algumas características edáficas, que responderam por 64,9% da variação existente nos dados de vegetação; e PEREIRA (1998), que utilizou a análise de correspondência canônica para detectar as variáveis ambientais mais correlacionadas com a distribuição de ocorrência de espécies de formigas cortadeiras em plantios de eucalipto no estado de Minas Gerais.

A maior vantagem da CCA sobre todos os outros métodos de análise multivariada é admitir um teste de significância das variáveis ambientais na determinação dos padrões ambientais, através do teste de Monte Carlo (HOPE, 1968, citado por TER BRAAK, 1988), testando os eixos associados com as variáveis usando os autovalores como teste estatístico (SMITH, 1995).

Na análise de correspondência canônica, a variação da comunidade pode ser diretamente relacionada à variação ambiental, uma vez que os eixos de ordenação são escolhidos à luz do conhecimento das variáveis, por impor a restrição de que os eixos são combi­nações lineares das variáveis ambientais (TER BRAAK, 1986). A CCA é usada para analisar questões específicas sobre as respostas das espécies e unidades amostrais às variá­veis ambientais. Assim, ao contrário de outras técnicas de ordenação, possibilita uma análise direta de gradientes (TER BRAAK, 1987).

3.1. Algoritmo de Geração da Análise de Correspondência Canônica


A CCA é uma técnica que seleciona a combinação linear das variáveis ambientais (Equação 4) que maximiza a dispersão dos escores das espécies (TER BRAAK, 1987). Em outras palavras, CCA escolhe os melhores pesos (cj) para as variáveis ambientais.

Equação 4

Onde, é o valor da variável ambiental j no sítio i; é o peso (não necessariamente positivo) pertencente àquela variável; é o valor resultante da variável ambiental composta do sítio i.

O segundo e demais eixos da CCA também selecionam combinações lineares das variáveis ambientais que maximizam a dispersão dos escores das espécies, mas sujeito à restrição de serem não correlacionados com os eixos anteriores. Podem ser obtidos tantos eixos quanto forem o número de variáveis ambientais.

Incorporando, no algoritmo da CA descrito anteriormente, a restrição de que os escores dos sítios devem ser restritos à combinações lineares das variáveis ambientais medidas (Equação 4) obtemos um algoritmo para a CCA.

Mais precisamente em cada ciclo de interação, uma regressão múltipla deve ser elaborada para os escores dos sítios, obtidos no Passo 3, em função das variáveis ambientais (por razões técnicas tomamos como peso dos sítios). Os valores obtidos desta regressão são por definição uma combinação linear das variáveis ambientais (Equação 4) e são então os novos escores dos sítios para continuar no Passo 4. Como na CA, os escores se estabilizam após várias interações e os escores resultantes constituem num eixo de ordenação da CCA. O autovalor () correspondente é igual à dispersão (maximizada) dos escores das espécies ao longo do eixo.

Os parâmetros da regressão final no processo de interação são os melhores pesos, e são chamados de coeficientes canônicos, e a correlação múltipla desta regressão é chamada de correlação espécies-ambiente. Esta correlação é uma medida da associação entre espécies e ambiente, mas não é a ideal. A importância da associação é melhor expressada pelo autovalor (), porque este mede o quanto da variação nos dados das espécies é explicado pelo eixo e, conseqüentemente, pelas variáveis ambientais.

O algoritmo para a solução da CCA pode então ser resumido conforme a Tabela 2, sendo apresentado na forma matricial, de acordo com a seguinte legenda:
b = u, vetor m contendo os escores das espécies (k=1,...,m);

Y = {}, matriz m x n contendo os dados de m espécies (linhas da matriz) e n sítios (colunas da matriz);

M = diag (), matriz diagonal m x n contendo os totais das linhas de Y;

N = diag (), uma matriz diagonal m x n contendo os totais das colunas de Y;

Z = matriz q x n na qual a j-ésima linha contem os valores centrados da j-ésima variável ambiental ( isto é, );

c = () [j =1,...,q], coeficientes das variáveis ambientais;

N’ e Y’ matriz transposta de N e Y.

Tabela 2 - Algoritmo de Geração da Análise de Correspondência Canônica (TER BRAAK, 1995)

Processo Interativo:
Passo 1: Atribua diferentes valores arbitrários para os escores (valores) dos sítios ();

Passo 2. b = M-1 Y x

Passo 3a. x* = N-1 Y’ b

Passo 3b. c = (ZNZ’)-1 ZN x*

Passo 3c. x = Z’ c

Passo 4: Para o primeiro eixo, vá para o passo 5. Para o segundo e demais eixos, transforme os escores dos sítios em escores não correlacionados com os eixos anteriores através do procedimento de Ortogonolização

descrito a seguir;

Passo 5: Padronize os escores dos sítios ();

Passo 6: Pare quando atingir a convergência, isto é, quando os novos escores dos sítios forem suficientemente próximos dos escores dos sítios do ciclo de interação anterior. Caso contrário volte ao passo 2.
Procedimento de Ortogonolização
Passo 4.1. Denote os escores dos sítios dos eixos anteriores de , e os escores do eixo atual por ;

Passo 4.2. Calcule onde e ;

Passo 4.3. Calcule ;

Passo 4.4. Repita os passos 4.1 a 4.3 para todos os eixos anteriores.


Procedimento de Padronização

Passo 5.1. Calcule o centróide, z, dos escores dos sítios () ;

Passo 5.2. Calcule a dispersão dos escores dos sítios ;

Passo 5.3. Calcule .

Note que após a convergência, s é igual ao autovalor.

Uma vez alcançada a convergência, para garantir que os escores finais dos sítios satisfaçam x = Z ’c (notação matricial da Equação 4), podemos dividir c por . Isto é a mesmo que substituir c na Equação 7 por .


1   2   3   4   5


©principo.org 2016
enviar mensagem

    Página principal