ANÁlise de correspondência canônica índice


A ANÁLISE DE CORRESPONDÊNCIA



Baixar 219.12 Kb.
Página2/5
Encontro19.07.2016
Tamanho219.12 Kb.
1   2   3   4   5

2. A ANÁLISE DE CORRESPONDÊNCIA


A análise de gradiente indireto é uma técnica multivariada que tem se mostrado eficiente na identificação de gradientes ambientais em comunidades vegetais. Através de uma técnica de ordenação, são extraídos, dos dados de espécies, os padrões dominantes de variação na composição da comunidade e, como resultado, as espécies e unidades amostrais são arranjadas em um diagrama de maneira que entidades similares se mostram próximas e as dissimilares apresentam-se separadas. Em um segundo momento, é feita uma tentativa de correlacionar estes padrões, isto é, os primeiros eixos de ordenação, com as variáveis ambientais, ou seja, a correlação espécie/ambiente é estabelecida em um segundo momento, de forma indireta.

Destas técnicas de ordenação, as mais conhecidas são a análise de componente principal e a análise de correspondência (CA). A primeira é um método linear, em que os escores de espécies resultantes são os valores de inclinação das retas geradas. Diferentemente, a análise de correspondência se baseia em médias recíprocas em que as curvas de resposta são unimodais e os escores de espécies podem ser considerados como centro, ou o “ótimo” da curva (GAUCH, 1982).

A análise de correspondência (CA), que atualmente tem sido a técnica mais utilizada para identificar gradientes ambientais, foi proposta por HILL (1973). É um método de construção de eixos contra os quais são plotados, simultaneamente, os objetos de interesse e as características que são usadas para descrever os objetos iniciando com dados sobre a abundância de cada uma das características para cada um dos objetos. Ela é útil em ecologia, por exemplo, onde os objetos de interesse são sítios diferentes, as características são diferentes espécies, e os dados consistem de abundância das espécies em amostras tomadas em cada um dos sítios. A finalidade da análise de correspondência poderia ser então clarear as relações entre os sítios, expressas pelas distribuições das espécies, e as relações entre as espécies expressas pelas distribuições dos sítios (MANLY, 1994) .

Inicia-se com dados tabulares, normalmente de dupla entrada, entretanto a técnica é generalizável a tabelas de n-entradas com mais de duas variáveis. As variáveis devem ser discretas: variáveis nominais, ordinais, ou contínuas segmentadas em faixas. A técnica define uma medida de distância entre dois pontos, onde pontos são os valores (categorias) das variáveis discretas. Desde que distância é um tipo de medida de associação (correlação), a matriz de distância pode ser o “imput” para a análise de componentes principais, da mesma maneira que as matrizes de correlação podem ser o imput para a análise fatorial convencional. Porém, onde a análise fatorial convencional determina quais variáveis se agrupam entre si, a análise de correspondência determina quais valores de categoria estão mais próximos. Isto é visualizado no mapa de correspondência que plota os pontos (categorias) ao longo dos eixos fatoriais computados.

A CA é uma técnica que constrói uma variável teórica que melhor explica os dados das espécies. Isto é feito através da escolha dos melhores valores para os sítios, isto é, valores que maximizam a dispersão dos escores das espécies. Esta variável teórica é chamada de primeiro eixo de ordenação da CA ou, primeiro eixo da CA, e seus valores são os escores do sítio no primeiro eixo da CA. Um segundo eixo e outros mais também podem ser construídos, com a intenção de se obter informações adicionais às obtidas com o primeiro eixo. Esses eixos também maximizam a dispersão dos escores das espécies mas sujeito à restrição de serem não correlacionados com os eixos anteriores. Esta restrição visa garantir que a nova informação seja expressa sobre os eixos anteriores. Na prática desejamos poucos eixos na esperança que representem a maioria da variação dos dados de espécies (TER BRAAK, 1995).

2.1. Algoritmo de Geração da Análise de Correspondência


A CA é também conhecida por “reciprocal averaging”, quando utiliza dados de ausência/presença, e “weighted averaging”, quando utiliza dados de abundância. Pode ser gerada por um algoritmo de ordenação interativo (GAUCH, 1982), cujo sumário é apresentado na Tabela 1.

O algoritmo irá ser explicado no contexto da ordenação de n sítios com base na abundância de p espécies, porém ele pode ser usado igualmente bem com dados que podem ser representados como uma tabela de dupla entrada de medidas de abundância, com as linhas correspondendo a um tipo de classificação e as colunas a um segundo tipo de classificação.

Considerando a abundância das espécies k no sítio i, o escore do sítio i , e os escores das espécies, parte-se de valores de escores dos sítios (amostras) arbitrários e obtêm-se escores de espécies através da seguinte equação:
Equação 1
Em seguida, novos escores dos sítios são obtidos, pela Equação 2 abaixo, utilizando-se dos escores das espécies gerados anteriormente. Novos escores de espécies são então derivados, e assim sucessivamente.
Equação 2

Ao tomarmos médias sucessivas, a faixa dos escores vai se tornando cada vez menor, a cada interação. Assim é necessário que se faça um re-escalonamento (padronização) dos escores das espécies e dos sítios, o que pode ser feito de várias maneiras. No procedimento de padronização utilizado neste algoritmo os escores dos sítios são padronizados para média 0 e variância 1. Sendo os escores dos sítios padronizados, a dispersão dos escores das espécies pode ser escrita como:



, Equação 3
Onde, é abundância total da espécie k; e é o total global.


Processo Interativo:
Passo 1: Atribua diferentes valores arbitrários para os escores (valores) dos sítios ();

Passo 2: Calcule novos escores para as espécies (), através das médias ponderadas dos escores dos sítios (Equação 1);

Passo 3: Calcule novos escores para os sítios (), através das médias ponderadas dos escores das espécies (Equação 2);

Passo 4: Para o primeiro eixo, vá para o passo 5. Para o segundo e demais eixos, transforme os escores dos sítios em escores não correlacionados com os eixos anteriores através do procedimento de Ortogonolização

descrito a seguir;

Passo 5: Padronize os escores dos sítios ();

Passo 6: Pare quando atingir a convergência, isto é, quando os novos escores dos sítios forem suficientemente próximos dos escores dos sítios do ciclo de interação anterior. Caso contrário volte ao passo 2.
Procedimento de Ortogonolização
Passo 4.1. Denote os escores dos sítios dos eixos anteriores de , e os escores do eixo atual por ;

Passo 4.2. Calcule onde e ;

Passo 4.3. Calcule ;

Passo 4.4. Repita os passos 4.1 a 4.3 para todos os eixos anteriores.


Procedimento de Padronização

Passo 5.1. Calcule o centróide, z, dos escores dos sítios () ;

Passo 5.2. Calcule a dispersão dos escores dos sítios ;

Passo 5.3. Calcule .

Note que após a convergência, s é igual ao autovalor.

Tabela 1: Algoritmo de Geração da Análise de Correspondência (TER BRAAK., 1995)
Em cada ciclo de interação a dispersão irá aumentar fortemente, até se aproximar ao seu valor máximo (aproximadamente 10 ciclos). Os escores das espécies e dos sítios se estabilizam ao mesmo tempo. Os escores resultantes têm a dispersão máxima e então se constituem no primeiro eixo da CA.

Um segundo eixo de ordenação pode ser extraído através do mesmo procedimento interativo, com um passo adicional no qual os escores para o segundo eixo são transformados para serem não correlacionados com os escores do primeiro eixo. Isto é obtido através do procedimento de Ortogonolização descrito na Tabela 1. Um terceiro eixo também pode ser derivado do mesmo modo, tornando os escores não correlacionados com os escores dos primeiros dois eixos, e assim sucessivamente.

Os eixos de ordenação da CA são denominados autovetores. Cada autovetor possui um autovalor correspondente, normalmente denominado de . O autovalor representa a dispersão máxima dos escores das espécies nos eixos de ordenação, sendo portanto, a medida de importância dos eixos de ordenação. O primeiro eixo de ordenação possui o autovalor mais alto (), o segundo eixo o segundo mais alto autovalor (), e assim sucessivamente. Todos os autovalores da CA possuem valores entre 0 e 1. Valores acima de 0,5 freqüentemente indicam uma boa separação das espécies ao longo do eixo.

A CA não pode ser aplicada quando os dados contêm valores negativos, uma vez que os dados não poderiam ser padronizados ou centrados.

A interpretação do diagrama de ordenação é feita com o auxílio de dados externos, por exemplo, pelo cálculo dos coeficientes de regressão entre variáveis ambientais e eixos de ordenação, ou por regressão múltipla dos eixos de ordenação sobre as variáveis ambientais. Se as variáveis ambientais mensuradas relacionam-se fortemente com os primeiros eixos de ordenação, estes últimos podem explicar (isto é, eles são suficientes para predizer) a principal parte da variação da composição das espécies. Se as variáveis ambientais não se relacionam fortemente com os primeiros eixos, estes podem não explicar a principal parte da variação, mas eles podem explicar um pouco da variação remanescente, que pode ser substancial. Ainda, a análise de gradiente indireto pode detectar os efeitos de um subconjunto de variáveis ambientais em que uma é particularmente importante na composição da comunidade (CARLETON, 1984).




Compartilhe com seus amigos:
1   2   3   4   5


©principo.org 2019
enviar mensagem

    Página principal