Utilizando o R. Técnicas para Predição de Dados2 17/8/2008 Amostragem aleatória  sample (1:40,5) Jogando moedas com reposição  sample (c(“H”,”T”),10,replace=T)

Slides:



Advertisements
Apresentações semelhantes
Escola Politécnica de Pernambuco Departamento de Ensino Básico
Advertisements

Curva Normal de Probabilidade
Utilizando o R. Técnicas para Predição de Dados 2 17/8/2008 Introdução ao R R é um linguagem (ambiente) de programação para computação estatística e gráfica.
Utilizando o R.
Análise Exploratória de Dados
PESQUISA DE MARKETING 1 Metodologia Planejamento Prof. Dr. Fauze Najib Mattar.
2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS
Variável Aleatória Contínua
ESTATÍSTICA BÁSICA Engenharia Mecânica 15/03/2011.
Estatística 8 - Distribuições Amostrais
Estatística Básica Utilizando o Excel
MB-711 Fundamentos de Tratamento de Incertezas
Aula 25/04/08 Maiores detalhes: ufpr
APLICAÇÕES COM EXCEL: Distribuição Binomial
Erros no Teste de Hipóteses
CONCEITOS INICIAIS DE CONFIABILIDADE
Estatística Aplicada (Aula 4)
Análise de Dados.
Distribuição de probabilidade
Distribuição de probabilidade
Verossimilhança.
AULA11 Distribuição normal Josemar Rodrigues.
ESTATÍSTICA.
Aula 0. Doces Lembranças de MAE0219
Aproximação da binomial pela normal
Sérgio Mário Lins Galdino
ME623 Planejamento e Pesquisa
Projeto Linguagem R Heart Disease
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
ESTATÍSTICA.
Exponential Random Graph Models
Variável Aleatória Contínua.
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Erros e variáveis aleatórias
Modelagem Estatística
Normalidade e Significância: Valor de p e IC Edvaldo Souza Doutorando do IMIP 2009.
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
ESTATÍSTICA.
Amostragem Pontos mais importantes:
Utilizando o R.
ANÁLISE ESTATÍSTICA II
Distribuição Normal Prof. Herondino.
Distribuição da Proporção Amostral
ANÁLISE ESTATÍSTICA II
Site: Estatística Prof. Edson Nemer Site:
Inferência Estatística
Clique para editar o estilo do título mestre Clique para editar o estilo do subtítulo mestre 1 Seminário: Disciplina: Probabilidade e Inferência Professor:
Probabilidade e Estatística Exemplo da Moeda Balanceada
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó
A probabilidade de X tomar um dado valor é zero. Calcula-se a probabilidade de X estar dentro de um intervalo. Função de densidade 1. f(x) ≥ 0 +  2. 
Modelagem Estatística
Exemplo completo – ARIMA
EME709 – PLANEJAMENTO DO EXPERIMENTO Profa. Sachiko A. Lira.
DISTRIBUIÇÃO NORMAL.
Professor Antonio Carlos Coelho
Probabilidade e Estatística para Avaliação de Desempenho
GEOESTATÍSTICA APLICADA A RECURSOS NATURAIS
Aula 10 - Distribuição normal, distribuição amostral da média
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Inferência Estatística Camilo Daleles Rennó
Modelos Teóricos Contínuos de Probabilidade
Medidas de posição e de dispersão
R – Funções, Gráficos e Tabelas
Albertazzi.Tratamento de Dados.Descritores (1.1) Tratamento de Dados 1.
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
DETEÇÃO E ESTIMAÇÃO Aula X+1: Simulação de Monte Carlo.
Revisão de Estatística Parte II J M Fernandes. Amostras estatísticas para parâmetros populacionais Assumir que a distribuição é normal X~N(µ(σ 2 )) Gerar.
Transcrição da apresentação:

Utilizando o R

Técnicas para Predição de Dados2 17/8/2008 Amostragem aleatória  sample (1:40,5) Jogando moedas com reposição  sample (c(“H”,”T”),10,replace=T) Calculando a probabilidade de uma dada apostra sem reposição =1/(40*39*38*37*36)  1/prod(40:36)

Técnicas para Predição de Dados3 17/8/2008 Densidades Densidade da distribuição normal  x = seq(-4,4,0.1)  plot (x,dnorm(x), type=“l”) Ou ainda  curve (dnomr(x), from=-4, to 4) Gráfico com a distribuição binomial  (pin diagram)  X=0:50  plot (x,dbinom(x,size=50,prob=.33),type="h")

Técnicas para Predição de Dados4 17/8/2008 Estatísticas descritivas x=rnomr(50) mean(x) # média sd(x) # desvio padrão var(x) # variância median(x) # mediana quantile(x)

Técnicas para Predição de Dados5 17/8/2008 Estatísticas descritivas library (ISwr) # carrega pacote data (juul) # carrega dados hospitalares attach(jull) # disponibiliza os dados mean(igf1) # gera um erro mean(igf1, na.rm=T) length(ifg1) # conta todos os valores opção  sum(!is.na(igf1)) # TRUE = 1 e FALSE = 0

Técnicas para Predição de Dados6 17/8/2008 Estatísticas descritivas summary (igf1) n=length (x) plot(sort(x),(1:n)/n,type="s",ylim=c(0,1)) Onde:  “s” = step function  (1:n)/n  divide o intervalo 1:n em n valores

Técnicas para Predição de Dados7 17/8/2008 Testes para uma amostra t-teste – uma amostra  (n<30 e σ desconhecido)  suposições dados vem de uma distribuição normal X~N(µ,σ 2 )  Deseja-se testar a hipótese nula h0: µ = µ 0  Pode-se estimar os parâmetros µ e σ pela média empirica e pelo desvio padrão amostral s.

Técnicas para Predição de Dados8 17/8/2008 Testes para uma amostra t-teste – uma amostra onde SEM = standard error of the mean Se o experimento for repetido (x) vezes e forem tiradas (x) médias, então essas médias seguirão a distribuição que gerou a amostra

Técnicas para Predição de Dados9 17/8/2008 Testes para uma amostra Para dados normalmente distribuídos há 95% de chance de µ ± 2σ Espera-se que se µ 0 for a verdadeira média, então deveria estar a 2 SEM dela. RangeProporção µ ± 1σ68,3% µ ± 2σ95,5% µ ± 2σ99,7%

Técnicas para Predição de Dados10 17/8/2008 Testes para uma amostra formalmente  ou para ver se t está no limite da região de aceitação, cujo nível de significância é 5% Se t está fora da região de aceitação, então devemos rejeitar a hipótese nula para aquele nível de significância. A região de aceitação está próximo de -2 e 2

Técnicas para Predição de Dados11 17/8/2008 Testes para uma amostra A região de aceitação está próximo de -2 e 2

Técnicas para Predição de Dados12 17/8/2008 Testes para uma amostra Pode-se também calcular o p-value que é a probabilidade de se obter um valor tão grande ou maior que o valor t observado. Não se deve rejeitar h0 se o p-value está próximo do nível de significância α Rejeita-se h0 se o p-value é muito pequeno em relação ao nível de significância α

Técnicas para Predição de Dados13 17/8/2008 Testes para uma amostra daily.intake = c(5260,5470,5640,6180,6390,6515,6805,7515,7 515,8230,8770) # energia ingerida em kJ por 11 mulheres mean(daily.intake) sd(daily.intake) quantile(daily.intake) Os dados amostrais (com média = 6753,639 kJ) constituem evidência suficiente para rejeitar a afirmação de que as mulheres ingerem 7725kJ em média?

Técnicas para Predição de Dados14 17/8/2008 Testes para uma amostra Supondo que os dados vieram de uma distribuição normal, o objetivo é testar se essa distribuição pode ter média µ = 7725 t.test (daily.intake, mu=7725)

Técnicas para Predição de Dados15 17/8/2008 Testes para uma amostra t.test (daily.intake, mu=7725) One Sample t-test data: daily.intake t = , df = 10, p-value = alternative hypothesis: true mean is not equal to percent confidence interval: # sample estimates: mean of x

Técnicas para Predição de Dados16 17/8/2008 Testes t para dados emparelhados Usado para duas medidas no mesmo experimento Trata as diferenças entre as medidas, reduzindo o problema para teste t – uma amostra Deseja-se investigar o grau de ingestão de calorias por mulheres antes e depois da menstruação

Técnicas para Predição de Dados17 17/8/2008 Testes t para dados emparelhados data(intake) attach(intake) intake post – pre # diferença antes e depois h0: (post - pre) = 0 h1: (post - pre) ≠ 0 Todos os valores na amostra foram negativos, dando indícios que as mulheres têm baixa ingestão de calorias depois da menstruação.

Técnicas para Predição de Dados18 17/8/2008 Testes t para dados emparelhados t.test(pre,post, paired=T) Paired t-test data: pre and post t = , df = 10, p-value = 3.059e-07 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of the differences

Utilizando o R