Verossimilhança.

Slides:



Advertisements
Apresentações semelhantes
EST-ICEx-UFMGCap. 5 - Lista 41 5 Lista 4. EST-ICEx-UFMGCap. 5 - Lista 42 Cap. 5 – Variáveis Aleatórias Contínuas e Distribuições de Probabilidade Ex.
Advertisements

Método dos Mínimos Quadrados
Estatística Dados valores (amostras) de variáveis aleatórias X1, X2, ..., Xn, cuja distribuição conjunta é desconhecida, inferir propriedades desta distribuição.
Probabilidade e Esperança Condicional
Estimação de parâmetros
Algoritmos para Geração de Variáveis Aleatórias
AJUSTE DE CURVAS 6.1 Introdução 6.2 Método dos quadrados mínimos
Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.
ESTIMAÇÃO.
Mineração de Dados Avaliação de Classificadores
A fiabilidade é a função complementar de F(t)
ESTATÍSTICA BÁSICA Engenharia Mecânica 15/03/2011.
Estatística Básica Utilizando o Excel
BCC101 – Matemática Discreta
Capítulo 4 Distribuições de Probabilidade
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Inteligência Artificial
MEDIDAS E INCERTEZAS O Que é Medição?
Aula 25/04/08 Maiores detalhes: ufpr
Algoritmos Genéticos – Capítulo 11
Variáveis Aleatórias Uma variável aleatória associa um número real a cada resultado de um experimento aleatório. Mais precisamente…
Variáveis Aleatórias Contínuas
Solução: SIMULAÇÃO Sistemas Complexos
3 - Equações Lineares de Segunda Ordem
Aproximação da binomial pela normal
ME623A Planejamento e Pesquisa
Construção de gráficos
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010 Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Distribuições Discretas Camilo Daleles Rennó
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Inferência Estatística Camilo Daleles Rennó
Avaliação da Viabilidade Econômico-Financeira em Projetos
Cálculo Numérico / Métodos Numéricos
VALORES ESPERADOS.
Distribuições discretas
Exponential Random Graph Models
Distribuição de Probabilidades
Variável Aleatória Contínua.
Apêndice.
DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS
Distribuições de probabilidades referentes a variáveis contínuas e suas aplicações As variáveis contínuas podem assumir qualquer valor dentro de um intervalo.
Intervalos de confiança simultâneos (Método de Bonferroni)
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
TEORIA CINÉTICA DOS GASES Moléculas que colidem com a parede é
Métodos Quantitativos II
Erros e variáveis aleatórias
Modelagem Estatística
Economia e Gestão ESAPL - IPVC
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
Quadrados Mínimos.
Utilizando o R. Técnicas para Predição de Dados2 17/8/2008 Amostragem aleatória  sample (1:40,5) Jogando moedas com reposição  sample (c(“H”,”T”),10,replace=T)
ANÁLISE ESTATÍSTICA II
Distribuição da Proporção Amostral
Soluções Analíticas para Distribuições Discretas na GSPN César Augusto L. Oliveira
Regressão Pontos mais importantes: -objectivo -regressão linear
Redes ADSA António Câmara.
Gerência Financeira das Reservas Técnicas
Inferência Estatística
Professor Antonio Carlos Coelho
Noções de Inferência Estatística
A probabilidade de X tomar um dado valor é zero. Calcula-se a probabilidade de X estar dentro de um intervalo. Função de densidade 1. f(x) ≥ 0 +  2. 
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
7 Ajuste de Curvas UFSC.PósMCI.FME.Ajuste de curvas. (11.1)
Revisão básica Distribuição normal: conhecido o valor de z, podemos dizer qual a probabilidade de encontrar valores entre quaisquer dois números. Por.
DISTRIBUIÇÕES DE PROBABILIDADE
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Distribuição Normal de Probabilidade
Autor : Lênin Charqueiro. Pelotas,8 de março de
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Distribuições de Probabilidade Camilo Daleles Rennó
Estatística Aplicada à Administração Prof. Alessandro Moura Costa INSTITUIÇÃO CURSO.
Transcrição da apresentação:

Verossimilhança

Construção de modelos: 1 estimativa dos parâmetros que melhor ajustam os modelos aos dados, 2 selecionar aqueles modelos que tem o melhor ajuste Métrica usada para avaliar o ajuste Verossimilhança: probabilidade de ocorrência dos dados dado um modelo.

Modelo Parte determinística: Expectativa da média da distribuição de erros. Y= Normal(ax+b, σ) Y=Poisson(ax+b)

As distribuições de erros pertencem à famílias de funções exponenciais e podem ser descritas por: Onde θi e φ são parâmetros de localização e escala, respectivamente. Ex. Poisson:

Binomial Normal

Estimativas de parâmetros: uma única distribuição Conjunto de dados independentes vindos todos da mesma distribuição. Ex: Predação de frutos em experimento de remoção – binomial; Densidade de árvores com distribuição aleatória em parcelas – Poisson. Estimo os parâmetros da distribuição.

Máxima verossimilhança Maximizar a verossimilhança entre os dados e o modelo Estimativa dos parâmetros de conjunto independente de dados: verossimilhança conjunta é o produto das estimativas individuais a partir de cada dado. Se a distribuição é única (dados vindos da mesma distribuição) temos o produto de termos similares

Por convenção, usa-se: - log do valor de verossimilhança e procuramos minimizar o soma das mesmas.

Exemplo: uma única observação: k sucessos em N possibilidades, dado uma probabilidade individual p de sucessos Em n tentativas, cada uma com N possibilidades, e o numero de sucessos da iésima tentativa é ki

Melhor valor para p Analiticamente: derivada do L em relação a p. Máximo – derivada é zero. Numero de sucessos Numero de tentativas

Para Poisson, o melhor estimador de lambda é a média. Para a normal o melhor estimador da média e desvio são estes parâmetros calculados à partir dos dados. Para algumas distribuições, entretanto, não há solução analítica: solução numérica

Solução numérica no R. P1=rbinom(20, size =6, p=0.7) #Crio a função de densidade acumulada (verossimilhança bionomial) para um dado p e conjunto de dados x: binomL=function(p,k,N){-sum(dbinom(k, prob=p, size=N, log=TRUE))} #usando a função optimize. Otimiza o parêmtro escolhido, a partir de uma estimativa inicial, usando alguns métodos O1=optim(fn=binomL,par=c(p=0.5),N=6,k=P1, method= “BFGS”)

library(bbmle) Função mle() já usa o negativo da verossimilhança. M1=mle2(minuslog=binomL,start=list(p=0.5),data=list(N=6, k=P1))

Modelos mais complexos Ex. p=f(x) Y ~ binomial(p,N). Ajuste de uma reta ou uma curva logística usando 3 parametros: y= a/exp((b-x)/c) my=c(5,6,11,20,27,33,57,43,47,31) co=c(5,15,20,25,30,35,40,45,55,60)

Reta com desvios normais #primeiro crio a função de densidade acumulada que combina a parte determinística e a estocástica ren=function(p,mean,sd,x){ a=p[1] b=p[2] myp=a*co+b sd1=((sum((my-myp)^2))/(length(my)-1)^0.5 -sum(dnorm(x,mean=myp,sd=sd1, log=TRUE)) }

Agora uso a função de otimização: O2=optim(fn=ren,x=my,p=c(0.5,5), method=“BFGS”). Como faria se quisesse comparar isto com uma curva construída com distribuição de posson?

rpo=function(p,lambda,x){ a=p[1] b=p[2] myp=a*cob+b -sum(dpois(x,lambda=myp, log=TRUE)) }

logip=function(p,lambda,x){ a=p[1] b=p[2] c=p[3] Agora tente fazer um ajuste a função logística: y= a/exp((b-x)/c). Com desvios normais e depois com Poisson logip=function(p,lambda,x){ a=p[1] b=p[2] c=p[3] myp = a/(1+exp((b-co)/c)) -sum(dpois(x,lambda=myp, log=TRUE)) }

login=function(p,mean,sd,x){ a=p[1] b=p[2] c=p[3] myp = a/(1+exp((b-co)/c)) sd1=(sum((my-myp)^2))^0.5 -sum(dnorm(x,mean=myp,sd=sd1, log=TRUE)) }