ANÁlise de correspondência canônica índice



Baixar 219.12 Kb.
Página4/5
Encontro19.07.2016
Tamanho219.12 Kb.
1   2   3   4   5

3.2. Reduzindo o Número de Variáveis


O propósito da ordenação é simplificar a interpretação de um conjunto de dados complexo. Porém, este propósito pode não ser alcançado se há um número muito grande de variáveis ambientais. Incluir dúzias de variáveis ambientais em um diagrama de CCA pode ser muito informativo ao investigador em uma fase exploratória do estudo, contudo é difícil de explicar os padrões principais de variação, a menos que os padrões sejam óbvios. Assim às vezes é desejável reduzir o número de variáveis incluído em uma análise.

É impossível reduzir o número de variáveis sem alguma perda de informação.

PALMER (2001) apresenta quatro modos para se reduzir o número de variáveis. Os dois primeiros (se executados a priori) são válidos para pesquisa exploratória e levantamento de hipótese, os dois últimos são válidos somente para pesquisa exploratória:

3.2.1. Seleção Através de Critérios Externos


As variáveis podem ser escolhidas por razões externas ao conjunto de dados. Uma dessas razões poderia ser a compatibilidade com outros estudos. Se outro estudo fosse executado em uma região semelhante, poderia ser valioso usar exatamente as mesmas variáveis. Outro critério externo poderia envolver a biologia da espécie envolvida. Por exemplo, um estudo prévio poderia ter determinado que a profundidade do sistema radicular da maioria da espécie não excedeu a 15 cm. Nesse caso, poderia não ser útil incluir os resultados de análises de solo coletados à 25 cm.

3.2.2. Exame da Estrutura de Correlação


Variáveis ambientais podem ser altamente correlacionadas ou “redundantes” com outras. Por exemplo, pH do solo, cálcio, magnésio, e capacidade de troca catiônica normalmente são fortemente correlacionados. Nesse caso, qualquer uma destas variáveis poderia ser usada como uma aproximação para todas as outras. Geralmente, é melhor escolher a variável que é mais provável de ser a causa direta da resposta da vegetação, e/ou uma variável que já tenha sido usada em outros estudos de vegetação.

Pode-se não se conhecer previamente quais variáveis são correlacionadas entre si. Neste caso, um exame detalhado da matriz de correlação seria útil. Um modo relativamente sofisticado para fazer isto seria executar uma Análise de Componentes Principais (PCA) na matriz de correlação, e escolher a variável ambiental que é fortemente associada com cada um dos primeiros eixos principais.


3.2.3. Interpretabilidade


Variáveis podem ser removidas post-hoc em análises exploratórias se elas não parecem explicar a variação ao longo dos maiores eixos de uma forma facilmente interpretável. O usuário deve estar atento, entretanto, pois mesmo se o resultado não é interpretável, baseado na experiência corrente e na intuição, ele pode representar uma característica muito importante e real. Por isso, recomenda-se remover somente variáveis que são representadas por setas muito pequenas nos primeiros eixos da CCA, ou variáveis cujas setas são quase idênticas às de outras variáveis.

3.2.4. Análise de Stepwise


Variáveis não informativas podem ser removidas por inspeção contínua dos resultados, como sugerido acima, ou por um procedimento de stepwise semi-automatizado. Segundo PALMER (2001) o software CANOCO, utilizado para execução de análise de correspondência canônica, inclui o procedimento de stepwise conhecido como seleção forward que adiciona uma variável ambiental de cada vez até que nenhuma outra variável explique “significativamente” a variação residual. O procedimento é semi - automatizado, e permite ao usuário fazer escolhas sobre inclusão de variáveis. O procedimento funciona como se segue:

  1. A CCA é executada separadamente para cada variável;

  2. Obtêm-se assim, como cada variável se ajusta aos dados;

  3. Escolhe-se uma destas variáveis – baseando-se na qualidade do ajuste, ou na importância que é atribuída à inclusão da variável na análise;

  4. Esta variável pode ser testada para “significância” usando um teste de randomização;

  5. A variável selecionada será usada como um co-variável, em uma análise de correspondência canônica parcial (pCCA) nas variáveis restantes separadamente;

  6. Retorna-se ao passo 2;

  7. Decide-se quando parar - convencionalmente quando o “nível " de significância (p) deixa de ser menor que 0.05. Alternativamente, pode-se parar automaticamente uma vez que se inclui um número fixo de variáveis.

  8. Ao final executa-se uma CCA conjunta com todas as “variáveis significantes”.

A razão de “significante” está entre aspas é porque ele não representa a verdadeira significância estatística - até mesmo com dados aleatórios, se obtêm um grande número de resultados falsamente significantes devido ao problema de comparações múltiplas.

Não há nenhuma garantia que seleção forward (ou qualquer outro procedimento de stepwise) resultará no “melhor” conjunto de variáveis ambientais. O único modo para determinar o melhor conjunto de variáveis é executar uma CCA separada para toda combinação concebível de variáveis; isto é, na maioria dos casos, impossível com a tecnologia atual porque envolve um número astronomicamente grande de combinações. Porém, a falta de uma garantia não deveria ser uma preocupação quando se executa análises exploratórias, onde o objetivo é determinar um número limitado de variáveis que explicam bem a composição de espécie, e não estar fixado com p-valores e pureza matemática.


3.3. Apresentação e Interpretação dos resultados


No diagrama de ordenação produzido pela CCA (Figura 3) as espécies e os sítios (neste caso, as parcelas) são representados por pontos, e as variáveis ambientais, por vetores ou flechas que indicam a direção das mudanças destas variáveis no espaço de ordenação (TER BRAAK, 1987; TER BRAAK e PRENTICE, 1988; TER BRAAK, 1995). Este diagrama possibilita a visualização não apenas de um padrão de variação da comunidade (como padrão de ordenação), mas também das principais características responsáveis pelas distribuições das espécies ao longo das características ambientais (TER BRAAK, 1987).Dessa forma, espécies e parcelas aparecem no diagrama de ordenação como pontos correspondentes aos seus ótimos aproximados no espaço bidimensional. Variáveis ambientais contínuas aparecem como setas, indicando a direção do seu aumento no espaço de ordenação. O comprimento das setas é proporcional à sua importância na explicação da variância projetada no eixo. Variáveis nominais são indicadas como centróides, que são os pontos médios de sua variância projetados no eixo de ordenação (OLIVEIRA FILHO, 1994).

A CCA também identifica, para cada eixo, as variáveis ambientais mais fortemente relacionadas com a distribuição das espécies, além de permitir a ordenação conjunta das variáveis ambientais e das espécies em um mesmo diagrama (biplot). Esta técnica permite utilizar regressões múltiplas, resultando em eixos de ordenação que sumarizam combinações lineares das variáveis ambientais (TER BRAAK, 1987).

Na interpretação do diagrama (biplot) da CCA devemos observar que:


  • No diagrama, as médias ponderadas são aproximadas como desvios da grande média de cada variável ambiental; a grande média é representada pela origem (centróide) do plot;

  • A média ponderada inferida é maior que a média se o ponto de projeção situa-se no mesmo lado da origem como a ponta de uma seta; por outro lado, é menor que a média se a origem estiver entre o ponto de projeção e a ponta de uma seta;

  • A ordenação das espécies é resumida pelas suas posições relativas ao longo de cada eixo;

  • As amostras tendem a ser dominadas pelas espécies que estão localizadas próximo à elas no espaço de ordenação;

  • As posições das amostras indicam a similaridade entre elas;

  • A direção de um vetor ambiental indica sua correlação com cada um dos eixos ilustrados. Um alinhamento paralelo de um vetor com um eixo indica que ele é altamente correlacionado com o mesmo. Por outro lado, um vetor em ângulo entre dois eixos, indica que ele é correlacionado com ambos;

  • Os ângulos entre os vetores ambientais indicam a correlação entre as variáveis ambientais;

  • A localização das amostras próximas aos vetores ambientais sugere as condições ambientais daquelas amostras;

  • A localização dos escores das espécies próximas aos vetores ambientais sugere as afinidades ambientais das espécies;

  • Quanto maior a linha de um vetor ambiental no diagrama de ordenação, maior a relação dessa variável com a comunidade.

Além do diagrama de ordenação, a CCA fornece uma tabela com as correlações entre as espécies e as variáveis ambientais, e sumários de regressões, para os eixos de ordenação, que indicam o quanto cada variável contribui para cada eixo.


Figura 3 - Diagrama de ordenação produzido pela análise de correspondência canônica. As espécies estão representadas por pontos com as respectivas abreviações de seus nomes científicos, e as variáveis ambientais, por vetores (sil = silte; are = areia grossa; arg = argila; Mg = magnésio; Ca = cálcio; e K = potássio) (BALDUINO, 2001).

A CCA fornece ainda uma estimativa da " inércia ", ou a variância total nos dados de espécie. A percentagem da variância explicada por cada eixo é obtida através da divisão do autovetor do eixo pela inércia total. Pode-se também determinar a correlação entre o eixo de ordenação que foi derivado dos dados de espécie e os eixos canônicos, que são combinações lineares das amostras (sítios) e dos dados ambientais. São obtidos dois conjuntos de escores para os sítios: um representado pela média ponderada dos escores das espécies, e outro que é a combinação linear de variáveis ambientais. Assim temos 2 conjuntos de correlações: "Interset” e “Intraset”. As Correlações “Interset” são entre as variáveis ambientais e os escores dos sítios derivados diretamente dos escores de espécie. As Correlações “Intraset” são entre as variáveis ambientais e os eixos canônicos, isto é, os eixos são combinações lineares das variáveis ambientais.


1   2   3   4   5


©principo.org 2016
enviar mensagem

    Página principal