A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses.

Apresentações semelhantes


Apresentação em tema: "A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses."— Transcrição da apresentação:

1 A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses

2 TIPOS DE INFERÊNCIA ESTATÍSTICA Existem basicamente três inferências a serem feitas: pontual, intervalar e testes de hipóteses. Pontual: são cálculos de estatísticas para uma determinada característica do mecanismo aleatório. Intervalar: são estatísticas construídas na forma de um intervalo. Tal intervalo deve conter, na maioria das vezes, uma característica do mecanismo aleatório. Teste de Hipóteses: criamos hipóteses, encontramos estatísticas para testá-las.

3 INFERÊNCIA PONTUAL Existe uma característica do mecanismo aleatório que deve ser estimada via uma estatística. Geralmente, chamamos esta característica de parâmetro. O objetivo da inferência pontual é determinar com certo grau de precisão o valor do parâmetro.

4 A Q UALIDADE DE UMA E STATÍSTICA Podemos escolher diversas estatísticas para representar um parâmetro. Como escolher a melhor  Uma estatística é considerada boa se ela é não viesada e possui variabilidade baixa. O desvio-padrão de uma estatística é denominado erro-padrão.

5 V ÍÉS ( OU V ÍCIO ) Uma estatística é dita ser não viesada (ou não viciada) se, em média, ela é igual ao verdadeiro valor do parâmetro. Estimadores como média, proporção e desvio- padrão são não viesados.

6 ERRO-PADRÃO É o desvio-padrão de uma estatística. É desejado que ele seja o menor possível, pois assim a estatística vai oscilar pouco em torno do verdadeiro valor do parâmetro. Sua magnitude pode ser controlada: para muitas estatísticas, um erro-padrão segue a fórmula: Assim, o erro-padrão diminui com o aumento do tamanho da amostra.

7 ERRO-PADRÃO Exemplo 1: o erro-padrão de uma média é estimado por Exemplo 2: o erro-padrão de uma proporção é estimado por onde f é a proporção observada na amostra.

8 ERRO-PADRÃO E TAMANHO DA AMOSTRA Um modo de determinar o tamanho da amostra é fixar um erro-padrão e procurar pelo tamanho da amostra que resulte nele. Exemplo: deseja-se estimar o tempo de vida médio de certo equipamento. Sabe-se que equipamentos similares tem um desvio padrão do tempo de vida em torno de 0,5 anos de duração. Utilizando esse desvio-padrão, qual o tamanho da amostra para obter uma média com erro-padrão de 0,01 

9 ERRO-PADRÃO Teremos: Logo, n =50 2 =2.500

10 CONSISTÊNCIA Uma estatística é dita ser consistente se com o aumento do tamanho da amostra ela se torna aproximadamente não viesada com erro-padrão próximo de zero. Isso é verdadeiro para estatísticas como a média, proporção, frequência relativa, taxas e desvio- padrão. Também é verdadeiro para estatísticas que são “semelhantes” à médias (soma de alguma coisa dividido pelo tamanho da amostra).

11 I NTERVALO DE C ONFIANÇA São intervalos construídos para conter o verdadeiro valor de um parâmetro. Ao construir um intervalo de confiança, devemos definir um nível de confiança. Exemplo: se encontramos o intervalo de confiança [2,1 ; 5,7] para uma média, então acreditamos que a verdadeira média deve estar nesse intervalo.

12 N ÍVEL DE C ONFIANÇA Como o experimento é aleatório, os intervalos de confiança podem mudar de experimento para experimento. Assim, existe a chance do intervalo não cobrir o verdadeiro valor do parâmetro. Se fizermos o mesmo experimento infinitas vezes, a frequência relativa com que estes intervalos conterão o verdadeiro valor do parâmetro se aproximará de uma probabilidade. Essa probabilidade é denominada nível de confiança.

13 N ÍVEL DE C ONFIANÇA

14 Assim, nós podemos construir um intervalo que gere o nível de confiança desejado. E por que não construir um intervalo com 100% de confiança  Porque intervalos assim em geral são equivalentes ao espaço amostral. Por exemplo, intervalo de 100% de confiança para a altura de um homem seria [0,  ). Esse intervalo não tem utilidade.

15 N ÍVEL DE C ONFIANÇA Salvo alguma exceções, só podemos definir um nível de confiança se conhecermos a distribuição associada à variável aleatória.

16 A LGUNS I NTERVALOS DE C ONFIANÇA É comum encontrar intervalos de confiança seguem a seguinte expressão: Onde d é um valor escolhido da distribuição dos dados. Escolhemos d de acordo com o nível de confiança desejado.

17 I NTERVALO 1. M ÉDIA A MOSTRAL Suponha que a variável em estudo possui distribuição normal. Então, um intervalo de confiança para a média é dado por  é dado por onde t (1-  )/2 é o percentil (1-  )/2 da distribuição t- Student com n-1 graus de liberdade. Esse intervalo funciona bem para pequenas amostras.

18 I NTERVALO PARA A MÉDIA - 1 Em um experimento, coletamos uma amostra de tamanho 30 e encontramos uma média de 3,2 e um desvio-padrão de 0,45. Queremos um intervalo de 95% de confiança. Com o auxílio de um computador, descobrimos que o percentil 1-0,95/2 =0,025 de um distribuição t-Student com 30-1=29 graus de liberdade é igual a -2.04.

19 I NTERVALO PARA A MÉDIA - 1 Assim, Para encontrar o valor de t no R, digite: qt( (1-  )/2,n-1) No nosso exemplo, foi digitado: qt(0.025, 29)

20 I NTERVALO PARA A MÉDIA - 2 Existe um teorema (chamado Teorema Central do Limite), que afirma que qualquer média terá distribuição normal com o aumento do tamanho da amostra. Assim, mesmo que a variável não seja normal, para uma amostra grande a média amostral vai se comportar como sendo proveniente de uma distribuição normal.

21 I NTERVALO PARA A MÉDIA - 2 Intervalo de confiança  para uma média, quando o tamanho da amostra é grande (maior que 30 gera uma boa aproximação): onde z (1-  )/2 é o percentil (1-  )/2 de uma distribuição normal com média 0 e variância 1. No R, digite: qnorm((1-  )/2)

22 INTERVALO PARA PROPORÇÕES Se o tamanho da amostra for grande, podemos utilizar a distribuição normal para construir um intervalo de confiança para a proporção. Seja f a proporção estimada (frequência relativa do evento de interesse). Então, um intervalo com confiança  é dado por

23 INTERVALO PARA PROPORÇÕES O comprimento desse intervalo dividido por 2 são os famosos “pontos percentuais para mais ou para menos” das pesquisas eleitorais.

24 T ESTES DE H IPÓTESES Uma hipótese é alguma afirmação em relação ao mecanismo aleatório. Em geral, definimos duas hipóteses complementares. Por exemplo: Hipótese 1: a média da população é igual a 3 Hipótese 2: a média da população é diferente de 3

25 H IPÓTESE N ULA E A LTERNATIVA As hipóteses do problema são denominas Hipótese Nula e Hipótese Alternativa, denotadas por H 0 e H 1. A Hipótese H 0 sempre terá uma afirmação de igualdade. Por exemplo, seja  a verdadeira média. Exemplo 1: H0:  = 7 contra H1:   7. Exemplo 2: H0:   7 contra H1:  < 7.

26 E STATÍSTICA DE T ESTE Nosso objetivo final é rejeitar um das hipóteses. Para isso, utilizamos uma estatística que imite a característica a ser testada (por exemplo, a média amostral imita a média populacional). Essa estatística é denominada estatística de teste.

27 REGIÃO DE REJEIÇÃO Procuramos descobrir se a hipótese H 0 poderia ter gerado o valor da estatística de teste. Se houver alta probabilidade da hipótese H 0 ter gerado a estatística de teste, nós aceitamos H 0. Em caso contrário, aceitaremos H 1. A regra que decide para quais valores da estatística de teste devemos aceitar ou rejeitar H 0 chama-se região de rejeição

28 T IPOS DE E RROS DecisãoA realidade desconhecida H0 é verdadeiraH1 é verdadeira Aceitamos H0OKErro Tipo II Aceitamos H1Erro Tipo IOK

29 NÍVEL DE SIGNIFICÂNCIA Temos dois tipos de erro. O ideal seria minimizar os dois, mas isso é complicado. Decidimos então controlar um dos erros: o erro tipo I. Queremos uma região de rejeição que cometa o erro tipo I com probabilidade . Tal probabilidade é denominado nível de significância e é um valor que nós escolhemos.

30 NÍVEL DE SIGNIFICÂNCIA Podemos escolher um nível de significância igual a zero (ou seja, nunca cometer o erro tipo I). Sim! Basta aceitar H 0 sempre! Deste modo, nunca vamos aceitar H1 e nunca cometeremos o erro do tipo I. Entretanto, aumentaremos em muito a probabilidade do erro tipo II. O ideal é fixar  pequeno, algo menor que 10%, e tipicamente igual a 5%

31 E O ERRO TIPO II  O erro tipo II fica sem controle direto. O ideal é escolher um teste de tenha o menor erro tipo II possível. Defina o Poder do Teste como sendo o complementar o erro do tipo II. O ideal é procurar testes de nível de significância  com um alto poder do teste.

32 P-V ALOR Um p-valor é a menor probabilidade de cometer o erro tipo I. Se o p-valor for pequeno, então a probabilidade de cometer um erro ao rejeitar H 0 é pequena, e por isso, podemos rejeitá-la se problemas. Se o p-valor for grande,então existe uma chance grande de cometer um erro ao rejeitar H 0, então é melhor aceitar H 0.

33 T ESTE T PARA A M ÉDIA Considere que a variável em estudo tem distribuição normal. Queremos testar alguma hipótese sobre a média populacional. Então, o teste de é aquele com maior poder. Ele se comporta bem para amostras pequenas. Fixando um nível , teremos:

34 T ESTE T PARA A M ÉDIA Teste BilateralUnilateral Hipóteses H 0 :  =  0 H0:   0H0:   0 H0:   0H0:   0 H1:   0H1:   0 H 1 :  <  0 H 1 :  >  0 Estatística de teste Rejeito H 0 seT t 1-  /2 T< t  T> t 1-  onde t  é calculado a partir da t-Student com n-1 graus de liberdade

35 E XEMPLO Em uma amostra de tamanho 25, observamos uma média amostral que 3,4 com um desvio- padrão igual a 1. Sabemos que os dados tem distribuição normal. Queremos testar se a média dessa população é igual a 3. Vamos fixar um nível de 5% de significância.

36 E XEMPLO Hipóteses: H 0 : média =3 contra H 1 : média diferente de 3. Estatística de teste:

37 E XEMPLO Temos n =25 e  =0,05. Digitando no R qt(0.05/2, 24) teremos t  /2 = -2,06 e t 1-  /2 = 2,06 Regra de Decisão: se T t 1-  /2 =2,06, rejeite H 0. Como T não está na região de rejeição, nós aceitamos H 0.

38 T ESTE Z PARA A M ÉDIA Serve para qualquer variável quantitativa, desde que se tenha uma amostra. Acima, z  é obtido no R via a função qnorm(  ) Teste BilateralUnilateral Hipóteses H 0 :  =  0 H0:   0H0:   0 H0:   0H0:   0 H1:   0H1:   0 H 1 :  <  0 H 1 :  >  0 Estatística de teste Rejeito H 0 seZ z 1-  /2 Z< z  Z> z 1- 

39 TESTE PARA PROPORÇÕES Serve para testar alguma hipótese sobre a proporção, mas é necessária um tamanho de amostra pelo menos maior que 30. Acima, f é a proporção observada. Teste BilateralUnilateral HipótesesH 0 : p = p 0 H 0 : p  p 0 H 0 : p  p 0 H 1 : p  p 0 H 1 : p < p 0 H 1 : p > p 0 Estatística de teste Rejeito H 0 seZ z 1-  /2 Z< z  Z> z 1 - 

40 E XEMPLO Uma amostra de 100 eleitores revelou que 40% destes votariam no candidato A. Teste a hipótese de que a proporção de eleitores que votam no candidato A é maior ou igual a 50% Use um nível de significância de 5%

41 E XEMPLO Hipóteses: H 0  0,5 contra H 1 <0,5. Estatística de Teste: Como o teste é unilateral, vamos calcular z  Usando o R, encontramos z  = -1,64.

42 E XEMPLO Rejeitamos H 0 se Z<z  Como Z = -2,04 e z  = -1,64, temos que logo, Z<z  devemos rejeitar H 0. A um nível de 5% de significância, rejeitamos a hipótese de que o candidato A terá 50% ou mais dos votos.


Carregar ppt "A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses."

Apresentações semelhantes


Anúncios Google