A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses.

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Testes de Hipóteses Forma mais clássica de inferência estatística
Estatística Aplicada (Aula 4)
J. Landeira-Fernandez Ética e Ciência
Análise da Regressão múltipla: Inferência Revisão da graduação
DISTRIBUIÇÕES AMOSTRAIS
Teste de Hipótese.
Professor Antonio Carlos Coelho
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
análise dos estimadores
Calculando o número de observações (tamanho da amostra) Após a comparação de duas médias duas e somente duas afirmativas podem ser feitas: – 1. Rejeitamos.
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Calculando o número de observações (tamanho da amostra)
Aula 4 – Estatística- Conceitos básicos
INFERÊNCIA ESTATÍSTICA PROPORÇÃO POPULACIONAL p
Metodologia da Pesquisa em Ensino de Ciências I
Probabilidade Teste de hipóteses para uma média populacional:
Complementos sobre Testes de Hipóteses. Complementos sobre testes de hipóteses Neste capítulo olharemos para: A segurança da decisão baseada em testes.
Distribuições Contínuas de Probabilidade. Objetivos Apresentar a Distribuição de Probabilidade Normal Apresentar a Distribuição de Probabilidade Normal.
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
INTERVALOS DE CONFIANÇA
Probabilidade Teste de hipóteses para duas médias:
NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional.
Estimação: Estimativa Pontual Estimativa Intervalar
GESTÃO E GARANTIA DA QUALIDADE
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
ERROS E TRATAMENTO DE DADOS ANALÍTICOS
Aula 5 Bioestatística. Estatísticas para uma variável.
Profª. Maria Ester Domingues de Oliveira
Amostragem e tratamento de dados faltantes Prof. Luciana Nunes INFERÊNCIA ESTATÍSTICA.
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Aula 7 Validando os Modelos Prof. José Valentim Machado Vicente, D.Sc.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Análise de Variância (ANOVA) Camilo Daleles Rennó
Inferência Estatística
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Inferência Estatística
Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin “Estatística Básica” 7ª Edição.
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS.
Método Básico de Análise de Dados Ricardo Pereira Brandão Prof. Dr.a Maria Aparecida. 5º administração. Estudo Interdisciplinares de Técnicas de Pesquisa.
Teste t de medidas INDEPENDENTES Estatística Aplicada - Componente Prática.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Intervalo de Confiança Camilo Daleles Rennó
Testes de Hipóteses Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-Graduação em Ciências Mecânicas Programa de Pós-Graduação.
O grau de dispersão de uma amostra em torno da média é: A) desvio médio; B) desvio padrão; C) erro padrão; D) variância; E) coeficiente de variação avaliação.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Revisão de Estatística Parte II J M Fernandes. Amostras estatísticas para parâmetros populacionais Assumir que a distribuição é normal X~N(µ(σ 2 )) Gerar.
Planejamentos com Múltiplos Blocos Delineamento em blocos completos casualizados Um fator de perturbação é um fator que provavelmente tem um efeito sobre.
Aula 6. Inferência Dr. Ricardo Primi Universidade São Francisco
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Inferência Estatística Camilo Daleles Rennó
INFERÊNCIA ESTATÍSTICA
Introdução Estatística Descritiva. Introdução O termo estatística provem da palavra Estado. O termo estatística provem da palavra Estado. –Utilizado originalmente.
Prof a Ana Carla Bittencourt Reis 1 Teoria das Filas.
MAE 0535 – Pesquisa de Mercado Universidade de São Paulo – USP Instituto de Matemática, Estatística e Computação – IME Professora: Silvia Elian Nagib 2º.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Prof. Hubert Chamone Gesser, Dr. Retornar Probabilidades Disciplina de Probabilidade e Estatística.
Métodos Quantitativos em Medicina Cálculo do Tamanho da Amostra Patometria 2015.
Aula 3. Estimação II. Capítulo 11, Bussab&Morettin “Estatística Básica” 7ª Edição.
ESTATÍSTICA AULA 11 Modelos probabilísticos mais comuns – Unidade 7
DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó
DISTRIBUIÇÕES AMOSTRAIS
Amostragem e estimadores
Estatística amintas paiva afonso.
Amostragem e estimadores
Transcrição da apresentação:

A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses

TIPOS DE INFERÊNCIA ESTATÍSTICA Existem basicamente três inferências a serem feitas: pontual, intervalar e testes de hipóteses. Pontual: são cálculos de estatísticas para uma determinada característica do mecanismo aleatório. Intervalar: são estatísticas construídas na forma de um intervalo. Tal intervalo deve conter, na maioria das vezes, uma característica do mecanismo aleatório. Teste de Hipóteses: criamos hipóteses, encontramos estatísticas para testá-las.

INFERÊNCIA PONTUAL Existe uma característica do mecanismo aleatório que deve ser estimada via uma estatística. Geralmente, chamamos esta característica de parâmetro. O objetivo da inferência pontual é determinar com certo grau de precisão o valor do parâmetro.

A Q UALIDADE DE UMA E STATÍSTICA Podemos escolher diversas estatísticas para representar um parâmetro. Como escolher a melhor  Uma estatística é considerada boa se ela é não viesada e possui variabilidade baixa. O desvio-padrão de uma estatística é denominado erro-padrão.

V ÍÉS ( OU V ÍCIO ) Uma estatística é dita ser não viesada (ou não viciada) se, em média, ela é igual ao verdadeiro valor do parâmetro. Estimadores como média, proporção e desvio- padrão são não viesados.

ERRO-PADRÃO É o desvio-padrão de uma estatística. É desejado que ele seja o menor possível, pois assim a estatística vai oscilar pouco em torno do verdadeiro valor do parâmetro. Sua magnitude pode ser controlada: para muitas estatísticas, um erro-padrão segue a fórmula: Assim, o erro-padrão diminui com o aumento do tamanho da amostra.

ERRO-PADRÃO Exemplo 1: o erro-padrão de uma média é estimado por Exemplo 2: o erro-padrão de uma proporção é estimado por onde f é a proporção observada na amostra.

ERRO-PADRÃO E TAMANHO DA AMOSTRA Um modo de determinar o tamanho da amostra é fixar um erro-padrão e procurar pelo tamanho da amostra que resulte nele. Exemplo: deseja-se estimar o tempo de vida médio de certo equipamento. Sabe-se que equipamentos similares tem um desvio padrão do tempo de vida em torno de 0,5 anos de duração. Utilizando esse desvio-padrão, qual o tamanho da amostra para obter uma média com erro-padrão de 0,01 

ERRO-PADRÃO Teremos: Logo, n =50 2 =2.500

CONSISTÊNCIA Uma estatística é dita ser consistente se com o aumento do tamanho da amostra ela se torna aproximadamente não viesada com erro-padrão próximo de zero. Isso é verdadeiro para estatísticas como a média, proporção, frequência relativa, taxas e desvio- padrão. Também é verdadeiro para estatísticas que são “semelhantes” à médias (soma de alguma coisa dividido pelo tamanho da amostra).

I NTERVALO DE C ONFIANÇA São intervalos construídos para conter o verdadeiro valor de um parâmetro. Ao construir um intervalo de confiança, devemos definir um nível de confiança. Exemplo: se encontramos o intervalo de confiança [2,1 ; 5,7] para uma média, então acreditamos que a verdadeira média deve estar nesse intervalo.

N ÍVEL DE C ONFIANÇA Como o experimento é aleatório, os intervalos de confiança podem mudar de experimento para experimento. Assim, existe a chance do intervalo não cobrir o verdadeiro valor do parâmetro. Se fizermos o mesmo experimento infinitas vezes, a frequência relativa com que estes intervalos conterão o verdadeiro valor do parâmetro se aproximará de uma probabilidade. Essa probabilidade é denominada nível de confiança.

N ÍVEL DE C ONFIANÇA

Assim, nós podemos construir um intervalo que gere o nível de confiança desejado. E por que não construir um intervalo com 100% de confiança  Porque intervalos assim em geral são equivalentes ao espaço amostral. Por exemplo, intervalo de 100% de confiança para a altura de um homem seria [0,  ). Esse intervalo não tem utilidade.

N ÍVEL DE C ONFIANÇA Salvo alguma exceções, só podemos definir um nível de confiança se conhecermos a distribuição associada à variável aleatória.

A LGUNS I NTERVALOS DE C ONFIANÇA É comum encontrar intervalos de confiança seguem a seguinte expressão: Onde d é um valor escolhido da distribuição dos dados. Escolhemos d de acordo com o nível de confiança desejado.

I NTERVALO 1. M ÉDIA A MOSTRAL Suponha que a variável em estudo possui distribuição normal. Então, um intervalo de confiança para a média é dado por  é dado por onde t (1-  )/2 é o percentil (1-  )/2 da distribuição t- Student com n-1 graus de liberdade. Esse intervalo funciona bem para pequenas amostras.

I NTERVALO PARA A MÉDIA - 1 Em um experimento, coletamos uma amostra de tamanho 30 e encontramos uma média de 3,2 e um desvio-padrão de 0,45. Queremos um intervalo de 95% de confiança. Com o auxílio de um computador, descobrimos que o percentil 1-0,95/2 =0,025 de um distribuição t-Student com 30-1=29 graus de liberdade é igual a

I NTERVALO PARA A MÉDIA - 1 Assim, Para encontrar o valor de t no R, digite: qt( (1-  )/2,n-1) No nosso exemplo, foi digitado: qt(0.025, 29)

I NTERVALO PARA A MÉDIA - 2 Existe um teorema (chamado Teorema Central do Limite), que afirma que qualquer média terá distribuição normal com o aumento do tamanho da amostra. Assim, mesmo que a variável não seja normal, para uma amostra grande a média amostral vai se comportar como sendo proveniente de uma distribuição normal.

I NTERVALO PARA A MÉDIA - 2 Intervalo de confiança  para uma média, quando o tamanho da amostra é grande (maior que 30 gera uma boa aproximação): onde z (1-  )/2 é o percentil (1-  )/2 de uma distribuição normal com média 0 e variância 1. No R, digite: qnorm((1-  )/2)

INTERVALO PARA PROPORÇÕES Se o tamanho da amostra for grande, podemos utilizar a distribuição normal para construir um intervalo de confiança para a proporção. Seja f a proporção estimada (frequência relativa do evento de interesse). Então, um intervalo com confiança  é dado por

INTERVALO PARA PROPORÇÕES O comprimento desse intervalo dividido por 2 são os famosos “pontos percentuais para mais ou para menos” das pesquisas eleitorais.

T ESTES DE H IPÓTESES Uma hipótese é alguma afirmação em relação ao mecanismo aleatório. Em geral, definimos duas hipóteses complementares. Por exemplo: Hipótese 1: a média da população é igual a 3 Hipótese 2: a média da população é diferente de 3

H IPÓTESE N ULA E A LTERNATIVA As hipóteses do problema são denominas Hipótese Nula e Hipótese Alternativa, denotadas por H 0 e H 1. A Hipótese H 0 sempre terá uma afirmação de igualdade. Por exemplo, seja  a verdadeira média. Exemplo 1: H0:  = 7 contra H1:   7. Exemplo 2: H0:   7 contra H1:  < 7.

E STATÍSTICA DE T ESTE Nosso objetivo final é rejeitar um das hipóteses. Para isso, utilizamos uma estatística que imite a característica a ser testada (por exemplo, a média amostral imita a média populacional). Essa estatística é denominada estatística de teste.

REGIÃO DE REJEIÇÃO Procuramos descobrir se a hipótese H 0 poderia ter gerado o valor da estatística de teste. Se houver alta probabilidade da hipótese H 0 ter gerado a estatística de teste, nós aceitamos H 0. Em caso contrário, aceitaremos H 1. A regra que decide para quais valores da estatística de teste devemos aceitar ou rejeitar H 0 chama-se região de rejeição

T IPOS DE E RROS DecisãoA realidade desconhecida H0 é verdadeiraH1 é verdadeira Aceitamos H0OKErro Tipo II Aceitamos H1Erro Tipo IOK

NÍVEL DE SIGNIFICÂNCIA Temos dois tipos de erro. O ideal seria minimizar os dois, mas isso é complicado. Decidimos então controlar um dos erros: o erro tipo I. Queremos uma região de rejeição que cometa o erro tipo I com probabilidade . Tal probabilidade é denominado nível de significância e é um valor que nós escolhemos.

NÍVEL DE SIGNIFICÂNCIA Podemos escolher um nível de significância igual a zero (ou seja, nunca cometer o erro tipo I). Sim! Basta aceitar H 0 sempre! Deste modo, nunca vamos aceitar H1 e nunca cometeremos o erro do tipo I. Entretanto, aumentaremos em muito a probabilidade do erro tipo II. O ideal é fixar  pequeno, algo menor que 10%, e tipicamente igual a 5%

E O ERRO TIPO II  O erro tipo II fica sem controle direto. O ideal é escolher um teste de tenha o menor erro tipo II possível. Defina o Poder do Teste como sendo o complementar o erro do tipo II. O ideal é procurar testes de nível de significância  com um alto poder do teste.

P-V ALOR Um p-valor é a menor probabilidade de cometer o erro tipo I. Se o p-valor for pequeno, então a probabilidade de cometer um erro ao rejeitar H 0 é pequena, e por isso, podemos rejeitá-la se problemas. Se o p-valor for grande,então existe uma chance grande de cometer um erro ao rejeitar H 0, então é melhor aceitar H 0.

T ESTE T PARA A M ÉDIA Considere que a variável em estudo tem distribuição normal. Queremos testar alguma hipótese sobre a média populacional. Então, o teste de é aquele com maior poder. Ele se comporta bem para amostras pequenas. Fixando um nível , teremos:

T ESTE T PARA A M ÉDIA Teste BilateralUnilateral Hipóteses H 0 :  =  0 H0:   0H0:   0 H0:   0H0:   0 H1:   0H1:   0 H 1 :  <  0 H 1 :  >  0 Estatística de teste Rejeito H 0 seT t 1-  /2 T< t  T> t 1-  onde t  é calculado a partir da t-Student com n-1 graus de liberdade

E XEMPLO Em uma amostra de tamanho 25, observamos uma média amostral que 3,4 com um desvio- padrão igual a 1. Sabemos que os dados tem distribuição normal. Queremos testar se a média dessa população é igual a 3. Vamos fixar um nível de 5% de significância.

E XEMPLO Hipóteses: H 0 : média =3 contra H 1 : média diferente de 3. Estatística de teste:

E XEMPLO Temos n =25 e  =0,05. Digitando no R qt(0.05/2, 24) teremos t  /2 = -2,06 e t 1-  /2 = 2,06 Regra de Decisão: se T t 1-  /2 =2,06, rejeite H 0. Como T não está na região de rejeição, nós aceitamos H 0.

T ESTE Z PARA A M ÉDIA Serve para qualquer variável quantitativa, desde que se tenha uma amostra. Acima, z  é obtido no R via a função qnorm(  ) Teste BilateralUnilateral Hipóteses H 0 :  =  0 H0:   0H0:   0 H0:   0H0:   0 H1:   0H1:   0 H 1 :  <  0 H 1 :  >  0 Estatística de teste Rejeito H 0 seZ z 1-  /2 Z< z  Z> z 1- 

TESTE PARA PROPORÇÕES Serve para testar alguma hipótese sobre a proporção, mas é necessária um tamanho de amostra pelo menos maior que 30. Acima, f é a proporção observada. Teste BilateralUnilateral HipótesesH 0 : p = p 0 H 0 : p  p 0 H 0 : p  p 0 H 1 : p  p 0 H 1 : p < p 0 H 1 : p > p 0 Estatística de teste Rejeito H 0 seZ z 1-  /2 Z< z  Z> z 1 - 

E XEMPLO Uma amostra de 100 eleitores revelou que 40% destes votariam no candidato A. Teste a hipótese de que a proporção de eleitores que votam no candidato A é maior ou igual a 50% Use um nível de significância de 5%

E XEMPLO Hipóteses: H 0  0,5 contra H 1 <0,5. Estatística de Teste: Como o teste é unilateral, vamos calcular z  Usando o R, encontramos z  = -1,64.

E XEMPLO Rejeitamos H 0 se Z<z  Como Z = -2,04 e z  = -1,64, temos que logo, Z<z  devemos rejeitar H 0. A um nível de 5% de significância, rejeitamos a hipótese de que o candidato A terá 50% ou mais dos votos.