Carregar apresentação
A apresentação está carregando. Por favor, espere
1
Análise Discriminante
Prof. Elisson de Andrade
2
Acesse: http://profelisson.com.br/estatistica/
Material da Aula Acesse: Senha: esalq
3
Estrutura da Apresentação
Análise Discriminante: uma compreensão “intuitiva” Análise Discriminante: uma compreensão matemática Exemplo prático Processo de decisão em 6 Estágios
4
Análise Discriminante: Uma compreensão “Intuitiva”
5
O que é? Técnicas para classificar indivíduos em 2 ou mais grupos, com base em um conjunto de medidas Cada indivíduo pertence a um determinado grupo Também é possível identificar QUAIS variáveis ajudam a fazer as classificações
6
Exemplo: médico e exames
Será que determinado paciente tem ou não determinada doença X?
7
EXAME 1 Com base em apenas UM exame fica difícil concluir se o paciente tem ou não a doença X
8
Logo, será preciso estabelecer um CRITÉRIO, baseado em todos os exames conjuntamente, que consiga discriminar quem é e quem não é, portador da doença X EXAME 3 EXAME 4 EXAME 1 EXAME 2
9
EXAME 3 EXAME 4 EXAME 1 EXAME 2 Agora suponha que, ao analisar todos os exames em conjunto, seja possível chegar a um ÚNICO VALOR (Score) Exemplo Diagóstico Score Tem a Doença X ≥10 Não tem a Doença X < 10
10
O Objetivo é MINIMIZAR classificar erroneamente os pacientes
Qual o Score que melhor discriminam os grupos (com e sem doença)
11
Vejamos essa situação graficamente...
12
SITUAÇÃO IDEAL Não tem a Doença Tem a Doença SCORE Score = 10
13
Porém, nem tudo é PERFEITO!
14
Não tem a Doença Tem a Doença SCORE Score = 10 Parcela de membros que tem a Doença X, e foram classificados como não portadores
15
Não tem a Doença Tem a Doença SCORE Score = 10 Parcela de membros que NÃO tem a Doença X, e foram classificados como portadores
16
Resumindo “Uma variável estatística discriminante é a combinação de duas ou mais variáveis independentes que melhor discriminarão entre objetos (pessoas, empresas etc) definidos a priori” (Hair et al., 2009)
17
Para tal, é necessário precisamos estudar a FUNÇÃO DISCRIMINANTE mais a fundo...
18
Análise Discriminante: Uma compreensão Matemática
19
Introdução Avaliar quanto é possível separar dois ou mais grupos de indivíduos, sendo dadas medidas para eles através de diversas variáveis Caso geral: Diferentes grupos de tamanho n1, n2, ... , nm Quantidade p de variáveis: X1, X2, ... , Xp – para cada membro da amostra Confira tabela a seguir...
20
Coluna 1: indivíduos analisados, de 1 até nm, devido a existirem m grupos, conforme visto a seguir
... Xp 1 Grupo 1 2 n1 Grupo m nm
21
Indivíduo X1 ... Xp 1 Grupo 1 2 n1 Grupo m nm
22
Variáveis a serem analisadas
Indivíduo X1 ... Xp 1 Grupo 1 2 n1 Grupo m nm
23
Indivíduo 1, do grupo 1, analisando a variável 1
X1 ... Xp 1 x111 Grupo 1 2 n1 Grupo m nm Indivíduo 1, do grupo 1, analisando a variável 1
24
Indivíduo X1 ... Xp 1 x111 x11p Grupo 1 2 x211 x21p n1 xn1 11 xn1 1p x1m1 x1mp Grupo m x2m1 x2mp nm xnm m 1 xnm m p
25
Função Discriminante Onde Z = Score discriminante a = coeficientes
Abordagem mais simples: combinação linear das variáveis X 𝑍= 𝑎 1 𝑋 1 + 𝑎 2 𝑋 2 +…+ 𝑎 𝑝 𝑋 𝑝 Onde Z = Score discriminante a = coeficientes X = variáveis
26
Quando temos vários grupos, é possível obter várias funções Z
Função Discriminante Quando temos vários grupos, é possível obter várias funções Z 𝑍 1 = 𝑎 11 𝑋 1 + 𝑎 12 𝑋 2 +…+ 𝑎 1𝑝 𝑋 𝑝 𝑍 2 = 𝑎 21 𝑋 1 + 𝑎 22 𝑋 2 +…+ 𝑎 2𝑝 𝑋 𝑝 ... 𝑍 𝑖 = 𝑎 𝑖1 𝑋 1 + 𝑎 𝑖2 𝑋 2 +…+ 𝑎 𝑖𝑝 𝑋 𝑝 Obs: o número de funções discriminantes a serem geradas depende do Número de Grupos (NG) existentes, obedecendo a relação: NG -1
27
Como escolher o melhor Z?
Seja: W a matriz das somas de quadrados e de produtos cruzados dentro da amostra T matriz das somas totais de quadrados e produtos cruzados B = T - W Uma possibilidade (dentre várias) citada por Manly (2008) é o Teste da maior raiz de Roy, ou seja, busca-se o maior λ, que é o autovalor da matriz W-1 B
28
Análise Discriminante: Exemplo dos Crânios Egípcios
29
Dados do Problema Vamos comparar algumas medidas de 30 crânios masculinos (Tebas-Egito), entre 5 diferentes épocas Temos 4 variáveis a serem analisadas
30
Comprimento do Maxilar
Altura do Crânio Largura do Crânio Altura Nasal Comprimento do Maxilar
31
Confira os dados (tabela a ser entregue aos alunos)
32
Medidas Coletadas de Crânios Masculinos na Área de Tebas (Egito) – em milímetros
33
Desafio Construir uma função contendo essas 4 variáveis que indique possíveis mudanças das medidas do crânio ao longo do tempo
34
Eis que as funções discriminantes foram estimadas...
35
5 grupos geraram 4 funções discriminantes, as quais:
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 𝑍 2 =0,0031 𝑋 1 +0,0168 𝑋 2 −0,0046 𝑋 3 −0,0022 𝑋 4 𝑍 3 =−0,0068 𝑋 1 +0,0010 𝑋 2 +0,0000 𝑋 3 −0,0274 𝑋 4 𝑍 4 =0,0126 𝑋 1 −0,0001 𝑋 2 +0,0112 𝑋 3 +0,0054 𝑋 4
36
Maior λ significa que maior parte das diferenças entre amostras são explicadas por Z1
Autovalores 𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 λ 1 =0,437 𝑍 2 =0,0031 𝑋 1 +0,0168 𝑋 2 −0,0046 𝑋 3 −0,0022 𝑋 4 λ 2 =0,035 𝑍 3 =−0,0068 𝑋 1 +0,0010 𝑋 2 +0,0000 𝑋 3 −0,0274 𝑋 4 λ 3 =0,015 𝑍 4 =0,0126 𝑋 1 −0,0001 𝑋 2 +0,0112 𝑋 3 +0,0054 𝑋 4 λ 4 =0,002
37
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Quanto mais estreito o crânio, maior o valor de Z1
38
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Quanto mais alto o crânio, maior o valor de Z1
39
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Quanto mais longo o maxilar, maior o valor de Z1
40
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Quanto menor a altura nasal, maior o valor de Z1
41
Calculando Médias e Desvios
É possível calcular o valor de Z1 para todos os indivíduos Utilizando o primeiro indivíduo do período 1, teríamos: 𝑍 1 =−0, , , −0, 𝑍 1 =−0,124 Obs: e isso pode ser feito para todos os indivíduos, gerando o cálculoda média e desvio-padrão para cada um dos 5 grupos
42
Calculando médias e desvios
Amostra Média Desvio-padrão Período 1 -0,029 0,097 Período 2 -0,043 0,071 Período 3 -0,099 0,075 Período 4 -0,143 0,080 Período 5 -0,167 0,095
43
Nota-se que a média de Z1 se tornou mais baixa ao longo do tempo...
Amostra Média Período 1 -0,029 Período 2 -0,043 Período 3 -0,099 Período 4 -0,143 Período 5 -0,167 Nota-se que a média de Z1 se tornou mais baixa ao longo do tempo...
44
Indicando uma TENDÊNCIA para...
45
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Crânios mais LARGOS
46
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Crânios mais CURTOS
47
Analisando os sinais da função
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 Maxilares CURTOS
48
Analisando os sinais da função GRANDES alturas nasais
𝑍 1 =−0,0107 𝑋 1 +0,0040 𝑋 2 +0,0119 𝑋 3 −0,0068 𝑋 4 GRANDES alturas nasais
49
Resumindo Essa análise discriminante obteve sucesso ao pontuar mudanças nas dimensões médias do crânio ao longo do tempo Porém... Ao utilizar um método denominado de Mahalanobis, os resultados não são tão bons...
50
Número do Grupo Alocado
Origem do grupo 1 2 3 4 5 Total 12 8 30 10 15 7 9 11 Apenas 34% de acerto
51
Ou seja, se achássemos um crânio e resolvêssemos estimar seu PERÍODO pelas suas dimensões (Score Z), apenas em 34% dos casos acertaríamos...
52
Análise Discriminante: Processo de Decisão
53
ESTÁGIO 1 Objetivos: defina o que realmente deseja encontrar
Diferenças de grupo em um perfil multivariado? Classificar observações em grupo? Identificar dimensões de discriminação entre grupos?
54
ESTÁGIO 2 Planejamento: consideração das seguintes questões
Seleção das variáveis independentes Tamanho da amostra Criação de amostras de análise e teste
55
ESTÁGIO 3 Suposições: definições como
Normalidade das variáveis independentes? Relações são lineares?
56
ESTÁGIO 4 Estimação das Funções Discriminantes
Estimação simultâneas ou stepwise? Significância das funções Avaliação de precisão preditiva Determinação do Score Ótimo Critérios para avaliação de razão de sucesso Significância estatística de precisão preditiva
57
ESTÁGIO 5 Interpretações das funções discriminantes
Quantas funções serão interpretadas? Avaliação de uma função, funções separadas ou combinadas?
58
ESTÁGIO 6 Validação dos resultados discriminantes
Amostra particionada ou validação cruzada? Perfil de diferentes grupos
59
Bibliografia Consultada
HAIR, J. F. et al. Análise multivariada de dados. 6ª ed. Porto Alegre: Bookman, 2009 MANLY, B. F. J. Métodos estatísticos multivariados: uma introdução. 3ª ed. Porto Alegre: Bookman, 2008
60
FIM
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.