A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Carlos A. A. Varella ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS.

Apresentações semelhantes


Apresentação em tema: "Carlos A. A. Varella ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS."— Transcrição da apresentação:

1 Carlos A. A. Varella ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS

2 Segundo KHATTREE & NAIK (2000) é uma técnica da estatística multivariada que estuda a separação de objetos de uma população em duas ou mais classes.

3 A discriminação ou separação é a primeira etapa, sendo a parte exploratória da análise e consiste em se procurar características capazes de serem utilizadas para alocar objetos em diferentes grupos previamente definidos.

4 A classificação ou alocação pode ser definida como um conjunto de regras que serão usadas para alocar novos objetos (JOHNSON & WICHERN, 1999).

5 A função que separa objetos pode também servir para alocar, e, o inverso, regras que alocam objetos podem ser usadas para separar. Normalmente, discriminação e classificação se sobrepõem na análise, e a distinção entre separação e alocação é confusa.

6 Segundo REGAZZI (2000), o problema da discriminação entre dois ou mais grupos, visando posterior classificação, foi inicialmente abordado por Fisher (1936). Funções matemáticas capazes de classificar um indivíduo X em uma de várias populações i; Com base em medidas de um número p de características, buscando minimizar a probabilidade de má classificação, isto é, minimizar a probabilidade de classificar erroneamente um indivíduo em uma população i, quando realmente pertence a população j.

7 Regiões de alocação são conjunto de valores separados por uma fronteira definida por uma função discriminante qualquer. Função Linear Função Quadrática

8

9 Uma boa regra de classificação deve resultar em pequenos erros; Deve haver pouca probabilidade de má classificação; Segundo JOHNSON & WICHERN (1999) para que isso ocorra a regra de classificação deve considerar as probabilidades a priori e os custos de má classificação.

10 As regras de classificação devem considerar se as variâncias das populações são iguais ou não; Quando as variâncias são iguais as funções discriminantes são lineares; Quando são diferentes as funções discriminantes são quadráticas; Redes neurais e lógica fuzzy geram planos não-lineares de separação.

11 É uma combinação linear de características originais que se caracteriza por produzir separação máxima entre duas populações

12 Demonstra-se que a função linear do vetor aleatório X que produz separação máxima entre duas populações é dada por:

13 O valor da função discriminante de Fisher para uma dada observação é: O ponto médio entre as duas médias populacionais univariadas µ 1 e µ 1 é:

14 A regra de classificação baseada na função discriminante de Fisher é: Alocar o x em 1 se mxxD oo 1 21 ' Alocar o x em 2 se mxxD oo 1 21 '

15 Assumimos que as populações 1 e 2 têm a mesma matriz de covariâncias.

16 É obtida substituindo-se os parâmetros µ 1, µ 2 e pelas respectivas quantidades amostrais:

17 Vamos considerar os dados de duas raças de insetos (Quadro 1), apresentados por HOEL (1966) e citado por REGAZZI (2000).

18 Raça ARaça B X1X1 X2X2 X1X1 X2X2 6,365,246,004,88 5,925,125,604,64 5,925,365,644,96 6,445,645,764,80 6,405,165,965,08 6,565,565,725,04 6,645,365,644,96 6,684,965,444,88 6,725,485,044,44 6,765,604,564,04 6,725,085,484,20 5,764,80 Número médio de cerdas primordiais (X 1 ) e número médio de cerdas distais (X 2 ) em duas raças de insetos

19 Raça A, características 1 e 2 Raça B, características 1 e 2

20 Raça A Raça B

21 Assumindo-se que:

22 A matriz inversa é calculada com MATLAB Função: inv(sc)

23 O vetor discriminante é dado por:

24

25

26 Ponto médio da Raça A

27 Ponto médio da Raça B

28 Ponto médio das populações

29 Tendo-se um novo indivíduo Xo. Alocar em Raça A se Alocar em Raça B se

30 Determina se será usada a matriz comum ou não na análise discriminante. Se for pool=yes, o SAS usa a matriz comum para calcular as distâncias entre grupos e o resultado é uma função discriminante linear. Se pool=no, o SAS usa as matrizes de covariância de cada grupo individualmente para o cálculo das distâncias. Neste caso obtemos funções discriminantes quadráticas. O padrão do SAS é POOL=YES.

31


Carregar ppt "Carlos A. A. Varella ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS."

Apresentações semelhantes


Anúncios Google