ESTATÍSTICA.

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Aprendizado de Máquina
Estimação de parâmetros
Estatística amintas paiva afonso.
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
ESTATÍSTICA INFERÊNCIA ESTATÍSTICA
Cássio Luís Fernandes de Oliveira
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves
Estatística 8 - Distribuições Amostrais
Capítulo 6 Estimativas e Tamanho de Amostras
Capítulo 7 Teste de Hipóteses
MB751 – Modelos de previsão
Estatística: Aplicação ao Sensoriamento Remoto ANO 2010
Testes de Hipóteses Forma mais clássica de inferência estatística
CEP – Controle Estatístico de Processo
Estatística Aplicada (Aula 4)
Intervalo de Confiança para a média da população
1 ESTATÍSTICA. 2 UDIII - Relação Entre Duas ou Mais Variáveis ESTATÍSTICA Ass 01: Regressão Múltipla (2 a Parte)
ESTATÍSTICA.
TESTE DE HIPÓTESES PARA A MÉDIA POPULACIONAL 
TESTE DE HIPÓTESES DESENVOLVENDO A HIPÓTESE NULA E ALTERNATIVA
ESTATÍSTICA.
ESTATÍSTICA.
ESTATÍSTICA.
Análise de Variância (ANOVA)
ME623 Planejamento e Pesquisa
ME623A Planejamento e Pesquisa
Inferências Relativas à Média
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
ESTATÍSTICA.
TESTES DE HIPÓTESES Spencer Barbosa da Silva
Estatística e Probabilidade
DISTRIBUIÇÕES AMOSTRAIS
ESTATÍSTICA.
Modelagem Estatística
ESTATÍSTICA.
Amostragem Pontos mais importantes:
Teste de Hipótese S distribuição desconhecida e/ou
ANÁLISE ESTATÍSTICA II
1 2 Observa ilustração. Cria um texto. Observa ilustração.
ANÁLISE ESTATÍSTICA II
ANÁLISE ESTATÍSTICA II
ANÁLISE ESTATÍSTICA II
Inferência Estatística
Teste de Hipótese.
Estatística Aplicada Aula 7
Aula 5 - Método experimental ou de seleção aleatória
Aula 11 - Teste de hipóteses, teste de uma proporção
ANÁLISE ESTATÍSTICA II
UFSC.PósMCI.FME.Inferências Envolvendo Variâncias. (8.1) 6 Inferências Envolvendo Variâncias.
Professor Antonio Carlos Coelho
ANÁLISE ESTATÍSTICA II
Comparando Médias 1. Se um conjunto de medidas(amostra) faz parte de uma população. 1.1 Desvio padrão da população conhecido(teste –z) 1.2 Desvio padrão.
Aula 4 – Estatística- Conceitos básicos
Probabilidade Teste de hipóteses para uma média populacional:
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
Probabilidade Teste de hipóteses para duas médias:
NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional.
Estimação: Estimativa Pontual Estimativa Intervalar
GESTÃO E GARANTIA DA QUALIDADE
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
INTERVALO DE CONFIANÇA PARA A MEDIA POPULACIONAL (σ 2 desconhecido ) Sabemos que se o tamanho da amostra for superior a 30 a distribuição amostral das.
Transcrição da apresentação:

ESTATÍSTICA

UDIII - Inferência Básica ESTATÍSTICA UDIII - Inferência Básica Ass 01: Teste de Hipóteses

OBJETIVOS ESPECÍFICOS Testar hipóteses estatísticas utilizando intervalos de confiança. Determinar o valor-p ( unilateral )

SUMÁRIO 1- Teste de Hipóteses Utilizando Intervalos de Confiança. 2. Valor-p ( Unilateral ).

1. Teste de Hipóteses Utilizando Intervalos de Confiança a ) Um Tratamento Moderno Uma Hipótese Estatística é uma afirmação acerca de uma população, que pode ser testada mediante extração de uma amostra aleatória.

Exemplo: Em uma grande universidade americana, selecionaram-se independentemente, em 1969, 10 professores e 5 professoras, registrando-se seus salários anuais conforme abaixo ( em milhares de dólares): Homens ( ) Mulheres ( ) 12 20 9 11 14 12 19 17 8 16 14 10 22 15 16

Estas médias amostrais dão uma estimativa aproximada das médias populacionais 1 e 2. Talvez possam ser usadas para resolver uma disputa: Um marido alega que não há diferença entre os salários dos homens (1) e os das mulheres (2). Em outras palavras, denotando a diferença por = 1- 2, ele alega que: = 0. Sua esposa, entretanto, afirma que a diferença chega a 7 mil dólares: = 7.

Resolva a questão construindo um intervalo de 95% de confiança. Solução: g.l.= ( n1 - 1 ) + ( n2 - 1 )

Assim, com 95% de confiança, podemos estimar  entre 1,0 e 9,0 Assim, com 95% de confiança, podemos estimar  entre 1,0 e 9,0. A alegação do marido (=0) parece implausível, porque está fora do intervalo de confiança. Já a alegação da esposa (=7) se afigura mais plausível, pois está dentro do intervalo.

Um intervalo de confiança pode ser encarado como o conjunto de hipóteses aceitáveis Se estamos utilizando um intervalo de 95% de confiança, é natural dizermos que a hipótese está sendo testada ao nível de confiança de 95%. Entretanto, de acordo com a tradição, fala-se em geral de um teste ao nível de erro de () de 5% (complemento de 95%). Conclusão: A hipótese =0 é rejeitada ao nível de erro de 5%.

Em outras palavras, coletamos suficiente evidência amostral para podermos discernir uma diferença entre os salários dos homens e os das mulheres. Dizemos então que a diferença é estatisticamente discernível ou estatisticamente significativa, ao nível de erro de 5%. Observação: A conclusão apresentada não mostra necessariamente uma discriminação.

Outro Exemplo: Suponhamos que o intervalo de confiança tenha-se baseado em uma amostra menor, sendo, por conseguinte, mais vago . Especificamente, suponhamos calculado o intervalo de confiança: Como a hipótese =0 está dentro do intervalo, ela não pode ser rejeitada. Ou seja, estes resultados não são mais estatisticamente discerníveis: chamamo-los estatisticamente indiscerníveis ou estatisticamente não-significativos, ao nível de erro de 5%.

b ) O Tratamento Tradicional A hipótese =0 tem interesse especial. Como ela não representa diferença alguma, costuma chamar-se hipótese nula H0. Ao rejeitá-la, por estar fora do intervalo de confiança, estabelecemos o fato importante de que existe realmente uma diferença entre as rendas dos homens e a das mulheres. Tal resultado costuma-se chamar-se tradicionalmente estatisticamente significativo ao nível de significância de 5%.

A expressão “significância estatística” é uma expressão técnica significando simplesmente que foram coletados dados suficientes para afirmar que existe uma diferença. Não significa que a diferença seja necessariamente importante.

Por exemplo, se tivéssemos extraído grandes amostras de populações quase idênticas, o intervalo de 95% de confiança ao invés de:  = 5,0  4,0 ..............(1) poderia ser:  = 0,005  0,004 Esta diferença é tão pequena que poderíamos desprezá-la como não tendo significado real, embora estatisticamente, seja tão significativa quanto (1).

SUMÁRIO 1- Teste de Hipóteses Utilizando Intervalos de Confiança. 2. Valor-p ( Unilateral ).

a ) Que é Valor-p? 2. Valor-p ( UNILATERAL) Vimos anteriormente uma técnica simples para testar qualquer hipótese, examinando se ela está ou não dentro do intervalo de confiança. Adotamos agora uma nova perspectiva, concentrando-nos em apenas uma hipótese, a hipótese nula H0. Calcularemos apenas o grau de apoio que ela tem dos dados.

Exemplo: Um processo tradicional de fabricação tem produzido milhões de válvulas de TV, com vida média =1200 horas e desvio padrão =300 horas. Um novo processo, recomendado pelo departamento de engenharia como sendo melhor, produz uma amostra de 100 válvulas com média =1265. Conquanto esta amostra faça com que o novo processo pareça melhor, é isto apenas uma conseqüência do acaso? É possível que o novo processo não seja realmente melhor do que o processo tradicional e que tenhamos obtido uma amostra não representativa?

Para especificar melhor o problema, formulemos a hipótese nula: o novo processo produziria uma população que não é diferente da anterior, isto é, H0:  = 1200. Costuma-se escrever abreviadamente: 0 = 1200. A alegação do departamento de engenharia é chamada hipótese alternativa, H1:  >1200 Quão consistente é a média amostral ¯ =1265 com a hipótese nula 0 = 1200? Especificamente, se a hipótese nula fosse verdadeira, qual seria a probabilidade de ¯ tomar o valor de 1265?

Solução: Pelo Teorema Central do Limite, a distribuição é normal, com média 0=1200 e desvio padrão /¯:

Conclusão: Se, de fato, o novo processo não é melhor (ou seja, se H0 é verdadeira, haveria apenas uma chance de 1,5% de observar um tão elevado como 1265. 1,5% é o que chamamos de valor-p de H0 ( em inglês, prob-value ( valor de prova ). Neste exemplo os dados parecem não apoiar H0.

Valor-p = P( ser tão grande quanto o valor observado, no caso de H0 ser verdadeira ) 1265 0=1200 Valor-p=1,5%

O valor-p na figura anterior é calculado na cauda direita, porque a hipótese alternativa está do lado direito ( > 1200). Por outro lado, se a hipótese alternativa estivesse à esquerda ( < 1200), então o valor-p seria calculado na cauda esquerda, isto é, Valor-p = P( ser tão pequena quanto o valor observado, no caso de H0 ser verdadeira )

Quer se situe à direta ou à esquerda, o valor-p é um excelente instrumento para resumir o que os dados dizem sobre a credibilidade de H0. Quanto maior o valor-p, maior a credibilidade de H0.

b ) Utilização da Distribuição t 2. Valor-p ( UNILATERAL) b ) Utilização da Distribuição t Vimos como foi padronizada de modo que pudéssemos utilizar a tábua normal. A estatística chave calculada foi

Em geral não se conhece , que deve ser estimado pelo desvio padrão amostral s. Tem-se então a estatística t, em lugar de z:

Exemplo: Uma amostra de n=5 notas acusou = 65 e s =11,6. Suponha a legação de que a média populacional é apenas 50. Qual o valor-p neste caso? Solução: Valor-p<0,025

Vemos que o valor observado de t, 2,89, está além de t0,025=2,776 Vemos que o valor observado de t, 2,89, está além de t0,025=2,776. Isto significa que a probabilidade da cauda é inferior a 0,025. p(t) Valor-p<0,025 0,025 1 2 3 4 5 t t0,025=2,776 tobs=2,89 tobs=2,89

Como o valor-p é uma medida da credibilidade de H0, um valor tão baixo leva-nos a concluir sobre a implausibilidade de H0. Em outras palavras, se H0 fosse verdadeira ( média populacional = 50 ), haveria menos de 2,5 chances em 100 de obter uma média tão elevada quanto à média 65 efetivamente observada.

Pode-se generalizar facilmente o uso de t para abranger outros testes de hipóteses: Freqüentemente a hipótese nula é 0: neste caso, a equação acima toma a forma extremamente simples:

Exemplo: Uma amostra aleatória de salários de 10 professores acusou média anual de 16 mil dólares; uma amostra de salários de 5 professoras acusou média anual de apenas 11 mil dólares. A variância conjunta (pooled) foi 11,7. Calculando-se um intervalo unilateral de 95% de confiança para mostrar a diferença entre os salários dos homens e das mulheres, obtemos: (1- 2)>1700 dólares A hipótese nula (H0: 1- 2 =0) não é plausível porque está fora do intervalo de confiança. Para indicar quão pouca credibilidade os dados a H0, calcule seu valor-p.

Solução: A hipótese nula é 1- 2 = 0, de modo que a equação abaixo é adequada: g.l.=13tobs(2,67) está além de t0,010=2,650. Assim, Valor-p<0,010 (muito baixa credibilidade).

Exemplo: Para investigar se as crianças negras de uma geração passada apresentavam conscientização racial e preconceito antinegro, Clark e Clark (1958) estudaram um grupo de 252 crianças negras. A cada uma pediu-se que escolhesse uma boneca de um grupo de quatro – duas brancas e duas não-brancas. 169 dentre as 252 crianças escolheram boneca branca. Qual o valor-p da hipótese nula, de que as crianças ignoram a cor? (A hipótese alternativa é que as crianças têm preconceito contra os negros, sendo a favor dos brancos.

Solução: Suponhamos que as 252 crianças possam ser encaradas como uma amostra aleatória de uma grande população de crianças negras (é uma mera suposição). De qualquer forma, a hipótese nula é de que a proporção populacional que escolhe boneca branca é 50-50, isto é, 0=0,50. A proporção amostral observada é P=169/252=0,67. Seu erro padrão é dado por:

Solução ( continuação): (utilizamos o valor nulo =0,50 porque o valor-p baseia-se sempre na hipótese nula). Assim:

Solução ( continuação): Como a amostra é suficientemente grande, podemos aplicar a distribuição normal z em lugar de t: Valor-p = P(Z>5,40) < 0,000000287 Com tão minúsculo valor-p, a credibilidade da hipótese nula é praticamente zero. Assim – tanto quanto a nossa amostra reflita as propriedades de uma amostra aleatória – pode-se concluir que, há uma geração passada, mesmo as crianças negras tinham preconceito em favor das brancas.

PRATIQUE COM OS EXERCÍCIOS . BOA SORTE!