Análise Discriminante

Slides:



Advertisements
Apresentações semelhantes
Análise de Variáveis Canônicas
Advertisements

Filtros de Kalman.
Análise de Variância da Regressão
Intervalos de Confiança
INTELIGÊNGIA COMPUTACIONAL
TESTE PARA ESTRUTURA ESPECIAL DE CORRELAÇÃO
ANÁLISE DISCRIMINANTE LIG, 13 de novembro de 2008.
ANÁLISE DISCRIMINANTE LIG, 18 de novembro de 2008.
ANÁLISE DISCRIMINANTE
ANÁLISE DISCRIMINANTE LIG, 11 de novembro de 2008.
ANÁLISE DISCRIMINANTE
Variável Aleatória Contínua
AULA 03 PERCEPTRON SIMPLES.
A Teoria da Medida Profª. Ms. Juliany Gonçalves Guimarães
Algoritmo de Khachiyan Prof. Júlio Cesar Nievola.
PREDIÇÃO DATA MINING AULA 13 SANDRA DE AMO
ANÁLISE DE AGRUPAMENTO
Análise Discriminante
MANOVA Análise de variância multivariada
Reconhecimento de Padrões Classificadores Lineares
Universidade Federal de Ouro Preto (UFOP)
Reconhecimento de Padrões PCA David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência.
Reconhecimento de Padrões Principal Component Analysis (PCA) Análise dos Componentes Principais David Menotti, Ph.D. Universidade.
Redes de Funções de Base Radial Radial Basis Functions (RBFs)
Análise de Medidas Repetidas: Áreas de Uso
APLICAÇÕES COM EXCEL: Distribuição Binomial
Outras Transforações de Imagens
NOÇÕES BASICAS DE ESTATISTICA
Análise de Componentes Principais
UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA
ESTATÍSTICA.
Estatística e Probabilidade
Aprendizado de Máquina Aula 8
Fórmulas Estatísticas MS Excel®
Alexandre Xavier Falcão & David Menotti
Laís Araújo Lopes de Souza
Tópicos Avançados de Base de Dados
1ª. AULA PRÁTICA.
VALORES ESPERADOS.
Estatística e Probabilidade
Apêndice.
Intervalos de confiança simultâneos (Método de Bonferroni)
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Econometria Propriedades assintóticas dos estimadores MQO
Erros e variáveis aleatórias
Modelagem Estatística
Etapa Estatística Planejamento Análise Estatística Efeito de sequência
O DESVIO PADRÃO Em probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística. O desvio-padrão define-se como a raiz quadrada.
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
F USION O F C ONTINUOUS -V ALUED O UTPUTS Equipe: Henrique Lins (hsmpl) João Pascoal Neto (jrpn) Mário Barbosa (mbaj) Tiago Farias (tfs)
Site: Estatística Prof. Edson Nemer Site:
Introdução à Estatística
Professor Antonio Carlos Coelho
Noções de Inferência Estatística
Matemática Financeira
1 Análise de regressão linear simples: abordagem matricial Álgebra de matrizes é amplamente utilizada na estatística. É praticamente uma necessidade na.
Modelagem e Estimativa
TESTE DE HIPÓTESES TESTE t STUDENT
Apresenta:.
AVALIAÇÃO DA INCERTEZA DE MEDIÇÃO
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Análise de Componentes Principais
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
Matemática Financeira
GESTÃO E GARANTIA DA QUALIDADE
Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Universidade Federal.
Laboratório de Classificação Supervisionada Laboratório de Geoprocessamento do Departamento de Engenharia de Transportes da EPUSP setembro de 2011.
Estatística Aplicada à Adminitração Prof. Alessandro Moura Costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
Spatial analysis of anthropogenic disturbance regimes and roadside shrubs in a fragmented agricultural landscape Peter G.Spooner; Ian D. Lunt; Sue V. Briggs.
Transcrição da apresentação:

Análise Discriminante ANÁLISE MULTIVARIADA APLICADA AS CIÊNCIAS AGRÁRIAS PÓS-GRADUAÇÃO EM AGRONOMIA CIÊNCIA DO SOLO: CPGA-CS Análise Discriminante Carlos A. A. Varella

Análise Discriminante Segundo KHATTREE & NAIK (2000) é uma técnica da estatística multivariada que estuda a separação de objetos de uma população em duas ou mais classes.

Discriminação A discriminação ou separação é a primeira etapa, sendo a parte exploratória da análise e consiste em se procurar características capazes de serem utilizadas para alocar objetos em diferentes grupos previamente definidos.

Classificação A classificação ou alocação pode ser definida como um conjunto de regras que serão usadas para alocar novos objetos (JOHNSON & WICHERN, 1999).

Confusão A função que separa objetos pode também servir para alocar, e, o inverso, regras que alocam objetos podem ser usadas para separar. Normalmente, discriminação e classificação se sobrepõem na análise, e a distinção entre separação e alocação é confusa.

Fisher, 1936 Segundo REGAZZI (2000), o problema da discriminação entre dois ou mais grupos, visando posterior classificação, foi inicialmente abordado por Fisher (1936). Funções matemáticas capazes de classificar um indivíduo X em uma de várias populações i; Com base em medidas de um número p de características, buscando minimizar a probabilidade de má classificação, isto é, minimizar a probabilidade de classificar erroneamente um indivíduo em uma população i, quando realmente pertence a população j.

Regiões de alocação Regiões de alocação são conjunto de valores separados por uma fronteira definida por uma função discriminante qualquer. Função Quadrática Função Linear

Funções discriminantes Funções discriminantes podem ser modelos estatísticos, de redes neurais ou lógica fuzzy. Os parâmetros são ajustados a partir de amostras de treinamento. O modelo de Fisher é estatístico.

Regras de classificação Uma boa regra de classificação deve resultar em pequenos erros; Deve haver pouca probabilidade de má classificação; Segundo JOHNSON & WICHERN (1999) para que isso ocorra a regra de classificação deve considerar as probabilidades a priori e os custos de má classificação.

Regras de classificação As regras de classificação devem considerar se as variâncias das populações são iguais ou não; Quando as variâncias são iguais as funções discriminantes são lineares; Quando são diferentes as funções discriminantes são quadráticas; Redes neurais e lógica fuzzy geram planos não-lineares de separação.

Função discriminante linear de Fisher É uma combinação linear de características originais que se caracteriza por produzir separação máxima entre duas populações

Função discriminante linear de Fisher Demonstra-se que a função linear do vetor aleatório X que produz separação máxima entre duas populações é dada por:

Função discriminante linear de Fisher O valor da função discriminante de Fisher para uma dada observação é: O ponto médio entre as duas médias populacionais univariadas µ1 e µ1 é:

Função discriminante linear de Fisher A regra de classificação baseada na função discriminante de Fisher é: Alocar o x em p 1 se ( ) [ ] m D ³ × S - = 2 ' <

Matriz comum de covariâncias Sc Assumimos que as populações 1 e 2 têm a mesma matriz de covariâncias .

A função discriminante linear amostral de Fisher É obtida substituindo-se os parâmetros µ1, µ2 e  pelas respectivas quantidades amostrais:

Exemplo de aplicação Vamos considerar os dados de duas raças de insetos (Quadro 1), apresentados por HOEL (1966) e citado por REGAZZI (2000).

Exemplo de aplicação Número médio de cerdas primordiais (X1) e número médio de cerdas distais (X2) em duas raças de insetos Raça A Raça B X1 X2 6,36 5,24 6,00 4,88 5,92 5,12 5,60 4,64 5,36 5,64 4,96 6,44 5,76 4,80 6,40 5,16 5,96 5,08 6,56 5,56 5,72 5,04 6,64 6,68 5,44 6,72 5,48 4,44 6,76 4,56 4,04 4,20

Estimativa das médias das raças A e B Raça A, características 1 e 2 Raça B, características 1 e 2

Estimativa das variâncias das raças A e B Raça A Raça B

Matriz comum de covariâncias Sc Assumindo-se que:

A inversa de Sc A matriz inversa é calculada com MATLAB Função: inv(sc)

Vetor discriminante O vetor discriminante é dado por:

Vetor discriminante 𝐿 ′ = 5,794819 2,871023

Função discriminante 𝐷 𝑋 = 5,794819 2,871023 ∙ 𝑋 1 𝑋 2 𝐷 𝑋 =5,794819 ∙𝑋 1 2,871023 ∙𝑋 2

Classificação de novos indivíduos Ponto médio da Raça A

Classificação de novos indivíduos Ponto médio da Raça B

Classificação de novos indivíduos Ponto médio das populações

Regra de classificação Tendo-se um novo indivíduo Xo. Alocar em Raça A se Alocar em Raça B se

Opção pool=no|test|yes Procedimento PROC DISCRIM Determina se será usada a matriz comum ou não na análise discriminante. Se for pool=yes, o SAS usa a matriz comum para calcular as distâncias entre grupos e o resultado é uma função discriminante linear. Se pool=no, o SAS usa as matrizes de covariância de cada grupo individualmente para o cálculo das distâncias. Neste caso obtemos funções discriminantes quadráticas. O padrão do SAS é POOL=YES.

Prática: resolver o exercício anterior usando o SAS http://v8doc. sas