ANÁlise discriminante aplicada a engenharia florestal índice



Baixar 264.81 Kb.
Página1/6
Encontro19.07.2016
Tamanho264.81 Kb.
  1   2   3   4   5   6

MANEJO FLORESTAL – DEF/UFV Prof. Agostinho Lopes de Souza

ANÁLISE DISCRIMINANTE APLICADA A ENGENHARIA FLORESTAL
ÍNDICE

Página



1. INTRODUÇÃO 1

2. O MODELO MATEMÁTICO DA ANÁLISE DISCRIMINANTE 2

3. CRITÉRIOS PARA A SELEÇÃO DE VARIÁVEIS DISCRIMINANTES 4

3.1. Wilks’ lambda 5

3.2. Rao’s V 5

3.3. Distância de Mahalanobis (D2) 6

3.4. F Entre Grupos 6

3.5. Soma da Variância não Explicada 7

3.6. Observações Complementares 7

4. CRITÉRIOS PARA A SELEÇÃO DE FUNÇÕES DISCRIMINANTES 7

4.1. Pordentagem Relativa dos Autovalores 7

4.2. Coeficiente de Correlação Canônica 8

4.3. Teste de Qui-Quadrado 8

5. AS FUNÇÕES DE CLASSIFICAÇÃO 9

6. CONSIDERAÇÕES GERAIS 10

7. USO DA ANÁLISE DISCRIMINANTE NO CAMPO FLORESTAL 11

8. UM ESTUDO DE CASO 13

REFERÊNCIAS BIBLIOGRÁFICAS 21





1. INTRODUÇÃO


A análise discriminante é uma técnica estatística multivariada que busca a separação (discriminação) de séries de indivíduos (observações) e, ou, a alocação (classificação) de novos indivíduos em grupos previamente definidos (JOHNSON e WICHERN, 1988), com base em variáveis mensuradas nos indivíduos que compõem cada um dos grupos (MARRIOTT, 1974; MARDIA et al., 1979; MANLY, 1986).

O modelo de análise discriminante pode ser interpretado como um tipo especial de análise fatorial, que extrai fatores ortogonais das variáveis mensuradas, mas com uma conotação específica de revelar (exibir) e capitalizar sobre as diferenças entre os grupos. O modelo discriminante elege os componentes que melhor separam os grupos no espaço mensurado (COOLEY e LOHNES, 1971), tornando possível a classificação dos indivíduos com vetores mais simples no subespaço definido, ao invés de utilizar os vetores originais, de maior espaço dimensional (MORRISON, 1976).

Portanto, essa técnica é freqüentemente utilizada para definição de regras para designar novos indivíduos aos grupos e para investigação de diferenças observadas, quando os relacionamentos causais não são bem entendidos (JOHNSON e WICHERN, 1988).

A análise discriminante permite avaliar se os grupos diferem entre si, em termos do conjunto das variáveis mensuradas em seus indivíduos, e se o conhecimento prévio dessas variáveis permite designar um novo indivíduo a um dos grupos, com um risco mínimo de erro (BOUROCHE e SAPORTA, 1982).

MARRIOTT (1974) considera a análise discriminante como uma extensão, para observação multivariada, da análise de variância ordinária entre e dentro de grupos. O autor considera ainda essa técnica como um caso especial de análise canônica, mas com o objetivo próprio de determinar regras de alocação e verificação de sua eficiência.

A análise discriminante pode ser empregada com as seguintes finalidades (SOUZA, 1989):



  1. Testar a integridade de agrupamentos.

  2. Selecionar as variáveis com poder real de discriminação.

  3. Determinar o número de funções discriminantes necessário para descrever o modelo de agrupamento.

  4. Construir regras para a alocação de indivíduos aos grupos.

  5. Estimar as probabilidades de classificações corretas.

  6. Verificar a validade de classificações prévias.

  7. Elaborar mapas territoriais dos grupos.

  8. Extrair informações sobre os relacionamentos entre as variáveis e os grupos.

2. O MODELO MATEMÁTICO DA ANÁLISE DISCRIMINANTE


Conforme já mencionado, a aplicação da análise discriminante requer que um esquema classificatório já tenha sido estabelecido. Nesse caso, considera-se um conjunto de n unidades de observação classificadas em g subconjuntos ou grupos, para os quais foram computados valores em p variáveis aleatórias (FERREIRA e LIMA, 1978).

Com o objetivo de estabelecer critérios (regras) de acesso ao modelo de agrupamento, FISHER (1936) sugeriu a transformação das observações multivariadas para observações univariadas, de maneira que essas últimas fossem o mais separadas possível. Para tanto, esse autor propôs o uso de combinações lineares das variáveis originais para criar novas variáveis univariadas, de maneira que essas maximizassem a razão das somas de quadrados entre os grupos e a soma de quadrados dentro dos grupos. O modelo apresenta o pressuposto de que as variáveis possuam distribuição normal multivariada e que os grupos apresentem matrizes de variância iguais (LAUCHENBRUCH, 1975).

O teorema do limite central assegura a robusticidade da técnica para quase todos os tipos de distribuição, cuja variância seja independente da média. No caso de não normalidade, pode-se recorrer a transformação de dados, convencionalmente usada e recomenda em estatística univariada (MARRIOTT, 1974).

O procedimento matemático inicia pela computação das médias e dos desvios-padrão para cada grupo e da média e desvio-padrão para o conjunto de todos os indivíduos, considerando as p variáveis (FERREIRA e LIMA, 1978). Esses parâmetros geram as matrizes de dispersão intergrupos (B) e intragrupos (W), conforme as equações matriciais abaixo (JOHNSON e WICHERN, 1988):




onde




onde


em que


g = número de grupos;

ni = número de indivíduos no i-ésimo grupo;

Si = matriz de variância-covariância amostral do i-ésimo grupo; e

S = matriz de variância-covariância amostral combinada, ponderada pelo

número de indivíduos de cada grupo.
Da análise de variância multivariada, tem-se que a matriz da soma de quadrados e produtos total (T) é igual a soma da matriz de soma de quadrados e produtos intergrupos (B) com a matriz de soma de quadrados intragrupos (W) (COOLEY e LOHNES, 1971; MARRIOTT, 1974).

Considerando o espaço dimensional inicial, a matriz B expressa os desvios dos centróides dos grupos em relação ao grande centróide; a matriz W reflete os desvios dos indivíduos em relação aos centróides dos respectivos grupos; e T congrega os desvios dos indivíduos em relação ao grande centróide (FERREIRA e LIMA, 1978).

De posse das matrizes B e W, pode ser solucionada a equação (W-1B - I)V = 0, sujeita a restrição V’V = 1, onde são as raízes características ou autovalores da matriz W-1B; V são os vetores característicos ou autovalores de W-1B; e I é uma matriz identidade. Se V são os autovetores que maximizam a razão V’BV/V’WV, então as combinações lineares y = V’X = (Xi-) S-1X são as funções discriminantes de Fisher, ou variáveis canônicas, enquanto os autovalores associados valem  = V’BV/V’WV. O número de autovalores reais será igual a g-1 ou p, o menor deles (COOLEY e LOHNES, 1971; JOHNSON e WICHERN, 1988).

As funções discriminantes são derivadas em ordem de importância decrescente. A primeira representa a melhor combinação linear possível das variáveis iniciais, ou seja, ela extrai o máximo possível da variância intergrupos existente no espaço inicial; a segunda extrai o máximo possível da variância remanescente, com restrição de ser ortogonal à primeira; e assim, sucessivamente, são extraídos vetores mutuamente ortogonais, até esgotar-se a variância contida na matriz W-1B (FERREIRA e LIMA, 1978).

As combinações lineares V1’X, V2’X, ..., VkX são a primeira, a segunda e a k-ésima função discriminante, associadas a k autovetores. Essas funções discriminantes geram os escores discriminantes e os centróides dos grupos, que representados graficamente num espaço bidimensional, resultam em mapas territoriais dos grupos (SOUZA, 1989).

  1   2   3   4   5   6


©principo.org 2016
enviar mensagem

    Página principal