A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Universidade Federal.

Apresentações semelhantes


Apresentação em tema: "Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Universidade Federal."— Transcrição da apresentação:

1 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Universidade Federal do Pará Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Instituto de Ciências Exatas e Naturais Curso de Bacharelado em Estatística Estatística Aplicada Análise Discriminante Prof. Dr. Héliton Tavares Profª. Dra. Regina Tavares Aluno: Otton Moura 2011

2 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise DiscriminanteIntrodução Análise Discriminante é uma técnica multivariada relacionada com a discriminação de grupos de objetos distintos e com a classificação de novos objetos para grupos previamente definidos; Análise Discriminante Simples x Análise Discriminante Múltipla;

3 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Objetivos Imediatos Descrever graficamente ou algebricamente as características diferenciais de objetos a partir de populações conhecidas; Classificar objetos em duas ou mais grupos previamente conhecidos;

4 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Onde pode ser aplicada Ecologia; Medicina; Finanças; Ensino; Diversos outros

5 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise DiscriminanteResumidamente Consiste em determinar uma combinação linear de p variáveis quantitativas que separam eficientemente grupos de amostras, de modo que a razão da variância entre-grupos e inter-grupos seja maximizada. T=E/D (Teorema de Huyghens) ◦ Onde: ◦ T = Matriz de covariância total ◦ E = Matriz de covariância entre-grupos ◦ D = matriz de covariância inter-grupos

6 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Separação e Classificação para duas populações

7 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Matriz de Custo ou Classificação Classificado como 11 22 Grupo verdadeiro 11 0C(2|1) 22 C(1|2)0 C (2|1): custo de classificar em  2 quando é de  1 C (1|2): custo de classificar em  1 quando é de  2 ECM = C(2|1) p(2|1) * p1 + C(1|2) p(1|2) * p2

8 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Classificação com duas populações normais multivariadas Considere observações da variável aleatória multivariada X T = [X 1, X 2,..., X p ] tiradas da população  1 e observações das mesmas quantidades da população  2. As respectivas matrizes de dados são: A partir dessas matrizes de dados, os vetores de média amostral e matrizes de covariância para cada população são determinados por: g = 1, 2

9 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Classificação com duas populações normais multivariadas Assumindo que as populações têm mesma matriz de covariância , as matrizes de covariância amostrais S 1 e S 2 são combinadas como: A função linear discriminante, chamada função linear de Fisher, que maximiza a separação entre as duas populações é dada por:

10 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Classificação com duas populações normais multivariadas A separação máxima entre as amostras é dada pela distância generalizada de Mahalanobis (D 2 ), que é a medida da distância entre médias multivariadas, e é estimada por Quanto maior o valor de D 2, maior será a eficiência da discriminação. A significância da diferença entre os grupos pode ser testada pela razão de variância que, no caso de dois grupos é dada por: Deste modo, se a hipótese H o :  1 =  2 for rejeitada, pode-se concluir que a separação entre as duas populações  1 e  2 é significativa.

11 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Generalização para mais de duas populações Uma regra de classificação consiste em alocar um elemento x 0 na população para a qual a função discriminante é maior, que equivale à menor distância generalizada para o referido elemento x 0. Supondo a normalidade: Função de classificação linear: Matrizes de Covariâncias Iguais onde Função de classificação quadrática: Matrizes de Covariâncias Desiguais

12 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Método de escolha das váriáveis mais importantes para construção da função discriminante Análise de variância univariada Método Forward Método Backward Método Stepwise

13 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise DiscriminanteExemplo Deseja-se classificar as famílias de prováveis proprietários ou não proprietários com base na renda (x 1 ) e área do terreno (x 2 ) de cada família. Uma amostra aleatória de n 1 = 12 proprietários e n 2 = 12 não proprietários foi utilizada para essa análise, cujos dados abaixo. Grupo 1 (  1 )Grupo 2 (  2 ) X 1 (*1000 u.m)X 2 (m 2 )X 1 (*1000 u.m)X 2 (m 2 ) 6018.47519.6 85.516.852.820.8 64.821.664.817.2 61.520.843.220.4 8723.68417.6 110.119.249.217.6 10817.659.416 92.822.46618.4 692047.416.4 9320.83318.8 51225114 81206314.8

14 Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise DiscriminanteSPSS

15 Obrigado !


Carregar ppt "Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Universidade Federal."

Apresentações semelhantes


Anúncios Google