Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouBenedicta Galvão Correia Alterado mais de 7 anos atrás
1
A ULA 6 B IOESTATÍSTICA Inferência Pontual, Intervalar e Testes de Hipóteses
2
TIPOS DE INFERÊNCIA ESTATÍSTICA Existem basicamente três inferências a serem feitas: pontual, intervalar e testes de hipóteses. Pontual: são cálculos de estatísticas para uma determinada característica do mecanismo aleatório. Intervalar: são estatísticas construídas na forma de um intervalo. Tal intervalo deve conter, na maioria das vezes, uma característica do mecanismo aleatório. Teste de Hipóteses: criamos hipóteses, encontramos estatísticas para testá-las.
3
INFERÊNCIA PONTUAL Existe uma característica do mecanismo aleatório que deve ser estimada via uma estatística. Geralmente, chamamos esta característica de parâmetro. O objetivo da inferência pontual é determinar com certo grau de precisão o valor do parâmetro.
4
A Q UALIDADE DE UMA E STATÍSTICA Podemos escolher diversas estatísticas para representar um parâmetro. Como escolher a melhor Uma estatística é considerada boa se ela é não viesada e possui variabilidade baixa. O desvio-padrão de uma estatística é denominado erro-padrão.
5
V ÍÉS ( OU V ÍCIO ) Uma estatística é dita ser não viesada (ou não viciada) se, em média, ela é igual ao verdadeiro valor do parâmetro. Estimadores como média, proporção e desvio- padrão são não viesados.
6
ERRO-PADRÃO É o desvio-padrão de uma estatística. É desejado que ele seja o menor possível, pois assim a estatística vai oscilar pouco em torno do verdadeiro valor do parâmetro. Sua magnitude pode ser controlada: para muitas estatísticas, um erro-padrão segue a fórmula: Assim, o erro-padrão diminui com o aumento do tamanho da amostra.
7
ERRO-PADRÃO Exemplo 1: o erro-padrão de uma média é estimado por Exemplo 2: o erro-padrão de uma proporção é estimado por onde f é a proporção observada na amostra.
8
ERRO-PADRÃO E TAMANHO DA AMOSTRA Um modo de determinar o tamanho da amostra é fixar um erro-padrão e procurar pelo tamanho da amostra que resulte nele. Exemplo: deseja-se estimar o tempo de vida médio de certo equipamento. Sabe-se que equipamentos similares tem um desvio padrão do tempo de vida em torno de 0,5 anos de duração. Utilizando esse desvio-padrão, qual o tamanho da amostra para obter uma média com erro-padrão de 0,01
9
ERRO-PADRÃO Teremos: Logo, n =50 2 =2.500
10
CONSISTÊNCIA Uma estatística é dita ser consistente se com o aumento do tamanho da amostra ela se torna aproximadamente não viesada com erro-padrão próximo de zero. Isso é verdadeiro para estatísticas como a média, proporção, frequência relativa, taxas e desvio- padrão. Também é verdadeiro para estatísticas que são “semelhantes” à médias (soma de alguma coisa dividido pelo tamanho da amostra).
11
I NTERVALO DE C ONFIANÇA São intervalos construídos para conter o verdadeiro valor de um parâmetro. Ao construir um intervalo de confiança, devemos definir um nível de confiança. Exemplo: se encontramos o intervalo de confiança [2,1 ; 5,7] para uma média, então acreditamos que a verdadeira média deve estar nesse intervalo.
12
N ÍVEL DE C ONFIANÇA Como o experimento é aleatório, os intervalos de confiança podem mudar de experimento para experimento. Assim, existe a chance do intervalo não cobrir o verdadeiro valor do parâmetro. Se fizermos o mesmo experimento infinitas vezes, a frequência relativa com que estes intervalos conterão o verdadeiro valor do parâmetro se aproximará de uma probabilidade. Essa probabilidade é denominada nível de confiança.
13
N ÍVEL DE C ONFIANÇA
14
Assim, nós podemos construir um intervalo que gere o nível de confiança desejado. E por que não construir um intervalo com 100% de confiança Porque intervalos assim em geral são equivalentes ao espaço amostral. Por exemplo, intervalo de 100% de confiança para a altura de um homem seria [0, ). Esse intervalo não tem utilidade.
15
N ÍVEL DE C ONFIANÇA Salvo alguma exceções, só podemos definir um nível de confiança se conhecermos a distribuição associada à variável aleatória.
16
A LGUNS I NTERVALOS DE C ONFIANÇA É comum encontrar intervalos de confiança seguem a seguinte expressão: Onde d é um valor escolhido da distribuição dos dados. Escolhemos d de acordo com o nível de confiança desejado.
17
I NTERVALO 1. M ÉDIA A MOSTRAL Suponha que a variável em estudo possui distribuição normal. Então, um intervalo de confiança para a média é dado por é dado por onde t (1- )/2 é o percentil (1- )/2 da distribuição t- Student com n-1 graus de liberdade. Esse intervalo funciona bem para pequenas amostras.
18
I NTERVALO PARA A MÉDIA - 1 Em um experimento, coletamos uma amostra de tamanho 30 e encontramos uma média de 3,2 e um desvio-padrão de 0,45. Queremos um intervalo de 95% de confiança. Com o auxílio de um computador, descobrimos que o percentil 1-0,95/2 =0,025 de um distribuição t-Student com 30-1=29 graus de liberdade é igual a -2.04.
19
I NTERVALO PARA A MÉDIA - 1 Assim, Para encontrar o valor de t no R, digite: qt( (1- )/2,n-1) No nosso exemplo, foi digitado: qt(0.025, 29)
20
I NTERVALO PARA A MÉDIA - 2 Existe um teorema (chamado Teorema Central do Limite), que afirma que qualquer média terá distribuição normal com o aumento do tamanho da amostra. Assim, mesmo que a variável não seja normal, para uma amostra grande a média amostral vai se comportar como sendo proveniente de uma distribuição normal.
21
I NTERVALO PARA A MÉDIA - 2 Intervalo de confiança para uma média, quando o tamanho da amostra é grande (maior que 30 gera uma boa aproximação): onde z (1- )/2 é o percentil (1- )/2 de uma distribuição normal com média 0 e variância 1. No R, digite: qnorm((1- )/2)
22
INTERVALO PARA PROPORÇÕES Se o tamanho da amostra for grande, podemos utilizar a distribuição normal para construir um intervalo de confiança para a proporção. Seja f a proporção estimada (frequência relativa do evento de interesse). Então, um intervalo com confiança é dado por
23
INTERVALO PARA PROPORÇÕES O comprimento desse intervalo dividido por 2 são os famosos “pontos percentuais para mais ou para menos” das pesquisas eleitorais.
24
T ESTES DE H IPÓTESES Uma hipótese é alguma afirmação em relação ao mecanismo aleatório. Em geral, definimos duas hipóteses complementares. Por exemplo: Hipótese 1: a média da população é igual a 3 Hipótese 2: a média da população é diferente de 3
25
H IPÓTESE N ULA E A LTERNATIVA As hipóteses do problema são denominas Hipótese Nula e Hipótese Alternativa, denotadas por H 0 e H 1. A Hipótese H 0 sempre terá uma afirmação de igualdade. Por exemplo, seja a verdadeira média. Exemplo 1: H0: = 7 contra H1: 7. Exemplo 2: H0: 7 contra H1: < 7.
26
E STATÍSTICA DE T ESTE Nosso objetivo final é rejeitar um das hipóteses. Para isso, utilizamos uma estatística que imite a característica a ser testada (por exemplo, a média amostral imita a média populacional). Essa estatística é denominada estatística de teste.
27
REGIÃO DE REJEIÇÃO Procuramos descobrir se a hipótese H 0 poderia ter gerado o valor da estatística de teste. Se houver alta probabilidade da hipótese H 0 ter gerado a estatística de teste, nós aceitamos H 0. Em caso contrário, aceitaremos H 1. A regra que decide para quais valores da estatística de teste devemos aceitar ou rejeitar H 0 chama-se região de rejeição
28
T IPOS DE E RROS DecisãoA realidade desconhecida H0 é verdadeiraH1 é verdadeira Aceitamos H0OKErro Tipo II Aceitamos H1Erro Tipo IOK
29
NÍVEL DE SIGNIFICÂNCIA Temos dois tipos de erro. O ideal seria minimizar os dois, mas isso é complicado. Decidimos então controlar um dos erros: o erro tipo I. Queremos uma região de rejeição que cometa o erro tipo I com probabilidade . Tal probabilidade é denominado nível de significância e é um valor que nós escolhemos.
30
NÍVEL DE SIGNIFICÂNCIA Podemos escolher um nível de significância igual a zero (ou seja, nunca cometer o erro tipo I). Sim! Basta aceitar H 0 sempre! Deste modo, nunca vamos aceitar H1 e nunca cometeremos o erro do tipo I. Entretanto, aumentaremos em muito a probabilidade do erro tipo II. O ideal é fixar pequeno, algo menor que 10%, e tipicamente igual a 5%
31
E O ERRO TIPO II O erro tipo II fica sem controle direto. O ideal é escolher um teste de tenha o menor erro tipo II possível. Defina o Poder do Teste como sendo o complementar o erro do tipo II. O ideal é procurar testes de nível de significância com um alto poder do teste.
32
P-V ALOR Um p-valor é a menor probabilidade de cometer o erro tipo I. Se o p-valor for pequeno, então a probabilidade de cometer um erro ao rejeitar H 0 é pequena, e por isso, podemos rejeitá-la se problemas. Se o p-valor for grande,então existe uma chance grande de cometer um erro ao rejeitar H 0, então é melhor aceitar H 0.
33
T ESTE T PARA A M ÉDIA Considere que a variável em estudo tem distribuição normal. Queremos testar alguma hipótese sobre a média populacional. Então, o teste de é aquele com maior poder. Ele se comporta bem para amostras pequenas. Fixando um nível , teremos:
34
T ESTE T PARA A M ÉDIA Teste BilateralUnilateral Hipóteses H 0 : = 0 H0: 0H0: 0 H0: 0H0: 0 H1: 0H1: 0 H 1 : < 0 H 1 : > 0 Estatística de teste Rejeito H 0 seT t 1- /2 T< t T> t 1- onde t é calculado a partir da t-Student com n-1 graus de liberdade
35
E XEMPLO Em uma amostra de tamanho 25, observamos uma média amostral que 3,4 com um desvio- padrão igual a 1. Sabemos que os dados tem distribuição normal. Queremos testar se a média dessa população é igual a 3. Vamos fixar um nível de 5% de significância.
36
E XEMPLO Hipóteses: H 0 : média =3 contra H 1 : média diferente de 3. Estatística de teste:
37
E XEMPLO Temos n =25 e =0,05. Digitando no R qt(0.05/2, 24) teremos t /2 = -2,06 e t 1- /2 = 2,06 Regra de Decisão: se T t 1- /2 =2,06, rejeite H 0. Como T não está na região de rejeição, nós aceitamos H 0.
38
T ESTE Z PARA A M ÉDIA Serve para qualquer variável quantitativa, desde que se tenha uma amostra. Acima, z é obtido no R via a função qnorm( ) Teste BilateralUnilateral Hipóteses H 0 : = 0 H0: 0H0: 0 H0: 0H0: 0 H1: 0H1: 0 H 1 : < 0 H 1 : > 0 Estatística de teste Rejeito H 0 seZ z 1- /2 Z< z Z> z 1-
39
TESTE PARA PROPORÇÕES Serve para testar alguma hipótese sobre a proporção, mas é necessária um tamanho de amostra pelo menos maior que 30. Acima, f é a proporção observada. Teste BilateralUnilateral HipótesesH 0 : p = p 0 H 0 : p p 0 H 0 : p p 0 H 1 : p p 0 H 1 : p < p 0 H 1 : p > p 0 Estatística de teste Rejeito H 0 seZ z 1- /2 Z< z Z> z 1 -
40
E XEMPLO Uma amostra de 100 eleitores revelou que 40% destes votariam no candidato A. Teste a hipótese de que a proporção de eleitores que votam no candidato A é maior ou igual a 50% Use um nível de significância de 5%
41
E XEMPLO Hipóteses: H 0 0,5 contra H 1 <0,5. Estatística de Teste: Como o teste é unilateral, vamos calcular z Usando o R, encontramos z = -1,64.
42
E XEMPLO Rejeitamos H 0 se Z<z Como Z = -2,04 e z = -1,64, temos que logo, Z<z devemos rejeitar H 0. A um nível de 5% de significância, rejeitamos a hipótese de que o candidato A terá 50% ou mais dos votos.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.