Estimação Não-Paramétrica

Slides:



Advertisements
Apresentações semelhantes
Escola Politécnica de Pernambuco Departamento de Ensino Básico
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Amostragem em Pesquisas Sócio-Econômicas
Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão (
Estatística Dados valores (amostras) de variáveis aleatórias X1, X2, ..., Xn, cuja distribuição conjunta é desconhecida, inferir propriedades desta distribuição.
Algoritmos para Geração de Variáveis Aleatórias
Cássio Luís Fernandes de Oliveira
ESTIMAÇÃO.
EE240/2009 Estimação de Parâmetros de Funções de Distribuição de Probabilidade EE-240/2009 Estimação de Parâmetros de Distribuições.
EE-240 Análise de Tendência: Regressão Linear.
Funções de Núcleo Série: Por que não me contaram antes isto Prof. Dr
Estatística 8 - Distribuições Amostrais
ANÁLISE DE AGRUPAMENTO
MB-711 Fundamentos de Tratamento de Incertezas 3º Encontro de 4 Previstos (+ Avaliação) MPEP – Mestrado Profissional em Produção Prof. Armando Z. Milioni.
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
MEDIDAS E INCERTEZAS O Que é Medição?
Variáveis Aleatórias Contínuas
Análise de Dados.
ESTATÍSTICA: O estudo numérico dos fatos sociais
Coleta e Modelagem dos Dados de Entrada
Estatística Inferencial
J. Landeira-Fernandez Ética e Ciência
Sérgio Mário Lins Galdino
UNIVERSIDADE FEDERAL DO PARANÁ
Módulo 5 – Introdução à Teoria Estatística da Medição
Sistemas de Aquisição e Processamento de Dados
C OMPARAÇÃO DO COMPORTAMENTO DO BIC EM ALGUNS MODELOS PROBABILÍSTICOS Diogo Taurinho Prado Orientadora: Denise Duarte.
Estatística - Estimação – VI - 1; Estimação por intervalo de confiança.
Tópicos Avançados de Base de Dados
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Técnicas de Reamostragem Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó
Avaliação da Viabilidade Econômico-Financeira em Projetos
Fundamentos de Análise de Sinais
FUNÇÃO CARACTERÍSTICA
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
CONCEITOS BÁSICOS.
Erros e variáveis aleatórias
Normalidade e Significância: Valor de p e IC Edvaldo Souza Doutorando do IMIP 2009.
O que é Estatística, afinal de contas?
Aprendizado de Máquina Prof.: Dino R. C. Franklin Aluno.: Thiago Fialho Q. L.
Amostragem Pontos mais importantes:
Site: Estatística Prof. Edson Nemer Site:
Site: Estatística Prof. Edson Nemer Site:
Inferência Estatística
EME709 – PLANEJAMENTO DO EXPERIMENTO Profa. Sachiko A. Lira.
Interpolação e Ajuste de Curvas
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Técnicas de Reamostragem Camilo Daleles Rennó
Probabilidade e Estatística para Avaliação de Desempenho
Fernando Gláuber Júnior Luana. Fase quente Fase fria.
Monitoramento e Controle Ambiental
Especialização em Pesquisa Clínica Módulo 3 – Epidemiologia e Bioestatística Daniel Kashiwamura Scheffer 1o. Semestre – 2009.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Distribuições Contínuas Camilo Daleles Rennó
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
EE-240/2009 EE Introdução EE-240/2009 Introdução.
Medidas de posição e de dispersão
Metodologia da Pesquisa em Ensino de Ciências I
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
1 Reunião do Grupo de Estudos do Serviço de Informática do InCor Artigo-base: Nonparametric Snakes (Umut Ozertem e Deniz Erdogmus) 28 de março de 2008.
Amostragem Sistemática
MEDIDAS DE POSIÇÃO Representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal. As medidas de posições.
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Técnicas.
Módulo 1 Estatística Básica.
Distribuição Amostral 3 Miguel Angel Uribe Opazo.
DETEÇÃO E ESTIMAÇÃO Aula X+1: Simulação de Monte Carlo.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Apresentação da Disciplina Camilo Daleles Rennó
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Distribuições de Probabilidade Camilo Daleles Rennó
Transcrição da apresentação:

Estimação Não-Paramétrica EE-240/2009 Estimação Não-Paramétrica

Estimação Paramétrica Assumir uma certa distribuição (normal, exponencial, Weibull, etc.) Estimar os parâmetros da distribuição a partir das observações Utilizar a distribuição com os parâmetros estimados.

Densidade Normal

30 observações

OK Função densidade de probabilidade estimada (assumindo distribuição normal)

Uma Densidade Bimodal

30 observações

No Good! Função densidade de probabilidade estimada (assumindo distribuição normal)

Métodos não-paramétricos Nãoassumir um tipo específico de distribuição a priori Estimar a densidade de probabilidade a partir das observações Utilizar a densidade de probabilidade estimada.

Exemplo: Histograma (1)

30 observações

Divisão do intervalo em 10 trechos

Normalizar

Ajustar

Divisão do intervalo em 5 trechos

Divisão do intervalo em 20 trechos

60 observações

120 observações

240 observações

480 observações

960 observações

1920 observações

Divisão do intervalo em 10 trechos 30 observações

Divisão do intervalo em 20 trechos

3840 observações

“Kernel density estimation”: K(x) = Função kernel de “área unitária” h = Parâmetro de alargamento (suavização)

h=1 h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=1 Kernel Retangular, h=1

h=2 Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Retangular, h=2

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Triangular, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Triangular, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

Kernel Gaussiano, h=1

[F,XI]=KSDENSITY(X) computes a probability density estimate of the sample in the vector X. KSDENSITY evaluates the density estimate at 100 points covering the range of the data. F is the vector of density values and XI is the set of 100 points. The estimate is based on a normal kernel function, using a window parameter (bandwidth) that is a function of thenumber of points in X. F=KSDENSITY(X,XI) specifies the vector XI of values where the density estimate is to be evaluated. (Matlab Statistics Toolbox)

Vantagens Métodos paramétricos: Propriedades teóricas bem-estabelecidas. Métodos não-paramétricos: Dispensam a escolha a priori de um tipo de distribuição. Aplicabilidade mais ampla. Simplicidade de uso.

Desvantagens Métodos paramétricos: Métodos não-paramétricos: Podem levar a resultados inadequados se a população não seguir a distribuição assumida na análise. Métodos não-paramétricos: Requerem um número maior de amostras para atingir a mesma “qualidade” de ajuste. Maior dificuldade para o estabelecimento de propriedades teóricas.

Bootstrap

Motivação: Em muitos casos, pode não ser trivial obter o intervalo de confiança para uma dada estimativa. Exemplo (prognóstico baseado em análise de tendência): Previsão da Remaining Useful Life com base na série histórica de um índice de degradação.

Pode não ser possível obter o intervalo de confiança de forma analítica se os dados não se conformarem às hipóteses usuais (ruído gaussiano, homoscedástico, etc.)

Bootstrap: Técnica de reamostragem (com reposição) que pode ser empregada para obter informações sobre a incerteza associada a uma estimativa.

Amostragem com reposição Reamostragem Conjunto original Bootstrap

Reamostragem Conjunto original Bootstrap

Reamostragem Conjunto original Bootstrap

Reamostragem Conjunto original Bootstrap

Reamostragem Conjunto original Bootstrap

Reamostragem Conjunto original Bootstrap

Reamostragem Conjunto original Bootstrap

Bootstrap 1 Conjunto original Bootstrap 2 Reamostragens Bootstrap 3

Uso de Bootstrap em estimação Considere que uma variável y tenha sido estimada a partir de n observações de uma variável x: Sejam X1, X2, ..., XN bootstraps gerados a partir de X. Seja ainda: Pode-se então levantar estatísticas com base nas N estimativas resultantes.

Exemplo 1: Estimativa da Mediana Amostra de 10 observações gerada a partir de uma distribuição uniforme no intervalo [0, 10] (números inteiros): X = { 10, 2, 6, 5, 9, 8, 5, 0, 8 }. Cálculo da mediana: Xordenado = { 0, 2, 5, 5, 6, 8, 8, 9, 10 }

Estimativas obtidas (em ordem crescente): Intervalo de confiança para a estimativa (70% de confiança 5-6):

Exemplo 2 Estimativa de Mediana Amostra de 30 observações gerada a partir de uma distribuição uniforme no intervalo [0, 10]:

Exemplo 2 Estimativa de Mediana Amostra de 30 observações gerada a partir de uma distribuição uniforme no intervalo [0, 10]: Em 69 dos 100 bootstraps, a mediana obtida estava no intervalo [4, 6]. Intervalo [4, 6]  69% de confiança.

Densidade de probabilidade para o resultado obtido por Bootstrap Pode-se aplicar o método das janelas de Parzen aos resultados obtidos a partir dos bootstraps. Neste caso, o resultado de cada bootstrap é considerado uma “observação” da grandeza a ser estimada.

Exemplo anterior com kernel gaussiano

Bootstrap e análise de tendência

d d t t d d t t

BOOTSTRP Bootstrap statistics. BOOTSTRP(NBOOT,BOOTFUN,...) draws NBOOT bootstrap data samples and analyzes them using the function, BOOTFUN. NBOOT must be a positive integer. The third and later arguments are the data; BOOTSTRP passes bootstrap samples of the data to BOOTFUN. (Matlab Statistics Toolbox)

Muito Obrigado!