DISTRIBUIÇÕES AMOSTRAIS

Slides:



Advertisements
Apresentações semelhantes
DISTRIBUIÇÕES AMOSTRAIS
Advertisements

Professor Antonio Carlos Coelho
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Inferência Estatística e Teste de Hipóteses
MÉTODOS ESTATÍSTICOS PARA TESTAGEM DE HIPÓTESES Carla Daltro.
Testes de hipótese com uma amostra. Testes de hipóteses para média (amostras grandes) 1. Declare afirmação verbal e matemáticamente. Identifique as hipóteses.
Análise de dados Experimentais: Utilização dos Programas Estatísticos
Testes de hipótese com uma amostra. Teste de hipótese  Um processo que usa estatísticas amostrais para testar a afirmação sobre o valor de um parâmetro.
Regressão Linear Múltipla Arquivo: seleção2.sav. Base de dados Variáveis independentes: X 1, X 2, X 3,..., X 14 Variável dependente ou Resposta: Y 1428.
Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes 1.
Amostragem Cuidados a ter na amostragem Tipos de amostragem
TÉCNICAS DE AMOSTRAGEM – Unidade 2 Professor Marcelo Menezes Reis
O que é Estatística? Introdução ao CEQ
Estatística aplicada a ensaios clínicos
Comparação de proporções
Professora Renata Prestes Antonangelo de Oliveira
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Técnicas de Reamostragem Camilo Daleles Rennó
Profa Dra. Denise Pimentel Bergamaschi
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Inferência Estatística Camilo Daleles Rennó
O OBJETIVO FUNDAMENTAL DA DISCIPLINA
Correlação e Regressão
Medidas de Dispersão para uma amostra
Métodos Básicos de Análise de Dados
Medidas de Dispersão Aula 8.
“ASSOCIAÇÃO EDUCACIONAL FANUEL” GUARDA MIRIM DE TELÊMACO BORBA
Estatística Básica Medidas de Dispersão
HEP 175 – Bioestatística Aula 13 Estimação de uma média populacional com variância conhecida e desconhecida.
ANÁLISE FATORIAL.
Análise da Regressão múltipla: Inferência Revisão
Prof. Dr. Adolpho Walter Pimazoni Canton
Profa Dra. Denise Pimentel Bergamaschi
Modelos de variáveis qualitativas multinomiais ordenadas
ESTATÍSTICA . SÍNTESE DO 10.º ANO . RELAÇÕES BIDIMENSIONAIS (11.º ANO)
Análise de Regressão.
ESTATÍSTICA Aula 5.
Inferência Estatística aplicada à Pesquisa em Saúde.
ESTATÍSTICA AULA 06 ANÁLISE EXPLORATÓRIA DE DADOS II – Unidade 4
TMEC011 – ESTATÍSTICA APLICADA
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó
ESTATÍSTICA AULA 01 CONCEITOS E PLANEJAMENTO DE PESQUISA – Unidade 1
INTRODUÇÃO AO CONTROLE ESTATÍSTICO
Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno
NOÇÕES DE TESTE DE HIPÓTESES (I)
Ajustamento de Observações
Tópicos em Econometria I
TESTES DE HIPÓTESES.
Testes de Hipóteses (cont.).
Análise de regressão múltipla
Ms.Rosebel Trindade Cunha Prates
9. Testes de Hipóteses Paramétricos
Secretaria de Gestão e Desenvolvimento Institucional
Estatística Aula 13 Prof. Marllus Gustavo Ferreira Passos das Neves
Ch. 6 Larson/Farber Estatística Aplicada Larson Farber 6 Intervalos de confiança.
Estatística Aplicada Larson Farber 9 Correlação e regressão.
Estatística: Conceitos Básicos
DISTRIBUIÇÕES AMOSTRAIS
O que você deve saber sobre
Procedimentos antes e após coleta dos dados
CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos
Estatística amintas paiva afonso.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Estimação Pontual Camilo Daleles Rennó
Mestrado Profissional em Física Médica
Site: Estatística Prof. Edson Nemer Site:
Teste de hipótese em R.
Noções de Amostragem Denise Duarte Depto de Estatística ICEx- UFMG.
Análise Exploratória de Dados
UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa
Prof. Sidomar
INTRODUÇÃO À ANÁLISE DE REGRESSÃO APLICADA À ENGENHARIA FLORESTAL
Prof. Cezar Augusto Cerqueira – UPE/UNICAP
Transcrição da apresentação:

DISTRIBUIÇÕES AMOSTRAIS Lei dos grandes números – Extraia observações aleatórias e independentes de uma população de média  À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população . Características de uma população podem ser descritas pelos parâmetros. Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra. As distribuições amostrais podem ser vistas como: Distribuição de probabilidades de uma estatística amostral Indicam como variam as estatísticas devido a variações no processo de amostragem.

DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média m e desvio padrão s. A média da distribuição amostral de médias é igual à média populacional O desvio-padrão da distribuição amostral de médias é dada por: A distribuição amostral de médias é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1).

DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse. A média da distribuição amostral da proporção é igual à proporção populacional. O desvio-padrão da distribuição amostral da proporção é dado por: A distribuição amostral da proporção é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1).

ESTIMAÇÃO: NOÇÕES GERAIS Inferência: campo da estatística no qual são tomadas decisões sobre populações, com base na informação extraída de uma amostra. Estimativas sobre os parâmetros populacionais Estimativas pontuais Estimativas por intervalos Formulação de testes de hipóteses sobre os mesmos

INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa. Formato: estimativa +/- margem de erro Nível de confiança: probabilidade de que o método forneça uma resposta correta. A média amostral varia de amostra para amostra Para levar em consideração esta fato devemos construir um intervalo de confiança para a verdadeira média populacional, com base na média amostral. Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.

INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão:

INTERVALO DE CONFIANÇA PARA A PROPORÇÃO O intervalo para uma proporção pode ser representado pela expressão:

  TESTES DE HIPÓTESES Constituem uma outra face do trabalho de inferência estatística e também fazendo uso da informação amostral. Uma hipótese estatística: afirmação sobre parâmetros populacionais. Teste de hipóteses: processo de decisão relativo a uma hipótese particular. A informação de uma amostra é utilizada para avaliar a plausibilidade da hipótese formulada Se tal informação for consistente com a hipótese tenderemos a concluir que não há evidências que favoreçam sua rejeição. O fato de utilizar apenas uma amostra não nos permite concluir com certeza sobre a veracidade ou não de uma hipótese formulada.

TESTES DE HIPÓTESES: exemplo com desvio-padrão conhecido Uma empresa produtora de detergente deseja avaliar se a máquina que enche as garrafas plásticas está adequadamente regulada, para o valor especificado de 5 litros, por garrafa. O desvio padrão do processo é da ordem de 0,5 litros. Caso a máquina esteja devidamente regulada, espera-se que o valor médio de uma amostra de garrafas concorde com um valor médio de 5 litros.

TESTES DE HIPÓTESES Hipóteses envolvidas: H0: hipótese nula H1: hipótese alternativa A hipótese nula (H0) é a que é sempre testada. A hipótese alternativa: oposto de H0. H0 se refere a um valor especificado para um parâmetro da população. H0 geralmente contém um sinal de igualdade. H1 nunca contém sinal de igualdade, pode ser representada por: ¹, < ou >.

TESTES DE HIPÓTESES: exemplo com desvio-padrão conhecido Formula-se então a chamada hipótese nula (H0) como sendo: H0: m = 5, indicando que a máquina está regulada. No caso, suponha que a hipótese alternativa seja definida como: H1: m ¹ 5. Caso a hipótese nula seja verdadeira espera-se que a amostra forneça um valor médio próximo do especificado pela mesma. Porém, devido às variações decorrentes do processo amostral, mesmo que a hipótese nula seja verdadeira, é possível que valores diferentes da mesma sejam obtidos. A metodologia dos testes de hipóteses nos vai fornecer elementos claros para melhor avaliar essas diferenças e tomar uma decisão, com base em critérios probabilísticos.

  TESTES DE HIPÓTESES Erros envolvidos:

TESTES DE HIPÓTESES  Um teste de hipóteses nos auxilia a responder a questão:

TESTES DE HIPÓTESES

TESTES DE HIPÓTESES: as etapas Formulação das hipóteses nula e alternativa Escolha do nível de significância Escolha do tamanho da amostra Determinação da técnica apropriada e estatística do teste Determinação dos valores críticos (região de rejeição/regra de decisão) Coleta de dados e cálculo da estatística do teste. Decisão Expressar a decisão no contexto do problema.

TESTES DE HIPÓTESES: aplicação Formulação das hipóteses nula e alternativa H0: m = 5 H1: m ¹ 5 Escolha do nível de significância a=0,05 (5%) Escolha do tamanho da amostra Vamos tomar uma amostra de n=25 caixas. Determinação da técnica apropriada e estatística do teste Determinação dos valores críticos (região de rejeição/regra de decisão) Se z>1,96 ou z<-1,96, rejeitamos H0.

TESTES DE HIPÓTESES: aplicação Coleta de dados e cálculo da estatística do teste. Supondo que a média amostral foi de 4,75 l, tem-se que: Decisão Como o valor de Z=-2,5<-1,96, não existem evidências que favoreçam a hipótese nula. (rejeitamos H0) Expressar a decisão no contexto do problema. Concluímos que a máquina está mal regulada e, portanto, requer uma intervenção no processo para sanar o problema.

TESTES DE HIPÓTESES: o método do valor-p Supondo H0 verdade, o valor-p ou nível de significância do teste, representa a probabilidade de se obter, para uma amostra n observações, um valor amostral tão ou mais discrepante que a média observada. Se tal probabilidade for muito pequena, a média amostral observada não é compatível com a hipótese H0 e a hipótese formulada tende a ser rejeitada. No exemplo em questão, o teste é bi-lateral, logo a probabilidade de que seja tão extrema é dada por: Como tal valor-p é menor que o especificado (5%), concluímos pela não aceitação de H0, como anteriormente. TESTES DE HIPÓTESES: o método do valor-p

Teste de hipóteses para duas populações: amostras independentes Problema: Dois catalizadores estão sendo testados para se determinar como afetam um processo químico. O catalisador 1 é o que está sendo usado atualmente. Como o catalisador 2 tem menor custo, ele poderia ser adotado, desde que não alterasse o rendimento do processo. Um experimento foi realizado e os rendimentos dos 2 catalisadores foi medido. Os dados são apresentados a seguir. Poderemos afirmar que o rendimento dos 2 catalisadores é o mesmo, ao nível de 5% de significância?

Dados dos rendimentos para as amostras dos 2 catalisadores.

Estatísticas descritivas dos rendimentos dos catalisadores

Resultados teste-t

Concluindo o problema dos catalisadores Como o valor-p foi da ordem de 0,412 ele supera o valor de 0,05 e portanto o teste conclui pela aceitação da hipótese de igualdade nos rendimentos dos 2 catalisadores, assim o catalisador 2, de menor custo deve ser preferido.

Teste t para 2 amostras: emparelhamento Situação tipo Antes X Depois ou Duas medições feitas em cada elemento Formação de pares de observações Utilização de indivíduos gêmeos

Teste t para 2 amostras: emparelhamento Suponha que estamos interessados em testar 2 tipos de ponteira em uma máquina de teste de dureza. A máquina pressiona com certa força a ponteira sobre o material metálico, medindo-se a profundidade da depressão causada. Amostras independentes poderiam causar resultados enganosos nesse caso, devido a possível falta de uniformidade das placas metálicas a serem testadas, em virtudes de fatores externos ao experimento. Nesse caso o ideal seria perfurar cada placa metálica com 2 furos, um com cada ponteira.

Teste t para 2 amostras: emparelhamento Um artigo do Journal of strain analysis (v.18,n2) compara vários métodos para prever a resistencia ao cisalhamento de vigas planas de aço. Dados para 2 desses métodos, Karlsuhe e Lehigh, foram obtidos para uma amostra de 9 vigas e são apresentado a seguir:

Teste t para 2 amostras: emparelhamento

Teste t para 2 amostras: emparelhamento Conclusão: Uma vez que o valor-p=0,001<0,05, rejeita-se a hipótese de igualdade dos métodos, concluindo-se que o Método de Karlsuhe produz previsões maiores que o método de Lehigh.

TESTES DE HIPÓTESES: outros testes Testes para a média com desvio-padrão desconhecido Testes para proporções Testes para diferenças de médias (amostras independentes) Variâncias conhecidas Variâncias desconhecidas e iguais Variâncias desconhecidas e diferentes Testes para diferenças de médias (amostras pareadas ou relacionadas) Testes para diferenças de proporções Testes tipo qui-quadrado Testes não-paramétricos Análise de variância (comparações múltiplas)

EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS Mensurar o tipo e grau de associação entre duas ou mais variáveis. Foco inicial: duas variáveis quantitativas Etapas: Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de Pearson,

Diagrama de dispersão Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo

Construção do diagrama de dispersão Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas; Registrar os dados em uma tabela; Escolher uma variável a ser representada no eixo ‘x’ (preditora) e outra variável em ‘y’ (dependente); Determinar os valores máximo e mínimo para cada variável; Escolher as escalas para ‘x’ e ‘y’ Representar no gráfico os pares de observações (x,y). Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc

Interpretação de diagramas de dispersão Correlação positiva: à medida que x aumenta, y também aumenta.

Interpretação de diagramas de dispersão Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.

Interpretação de diagramas de dispersão Ausência de correlação: os valores das variáveis não estão relacionados.

Interpretação de diagramas de dispersão Moderada correlação negativa: y tende a diminuir com o aumento de x.

Interpretação de diagramas de dispersão Forte correlação negativa: à medida que x aumenta, y diminui.

Interpretação de diagramas de dispersão Outliers: São observações extremas não condizentes com o restante dos dados.

CORRELAÇÃO Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva. Quando as variáveis crescem em sentidos opostos temos uma correlação negativa. Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita. Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula. Cálculo da correlação: coeficiente de correlação linear de Pearson (rxy) – função correl no Excel.

Relação entre 2 variáveis quantitativas: exemplo A corrosão em barras de aço é o problema de durabilidade mais importante em estruturas de concreto. A carbonação do concreto resulta de uma reação química que reduz o nível de PH para iniciar a corrosão do concreto armado. Os dados a seguir representam uma amostra de espécimes retirados de um prédio, sendo: X = nível de carbonação (em mm) e Y = resistência em Mpa. Coeficiente de correlação rxy=-0,935, indicando uma forte correlação negativa entre as variáveis, ou seja, quanto maior os nívels de carbonação menor a resistência do concreto.

Modelos de regressão: relações entre variáveis Em muitos problemas 2 ou mais variáveis estão relacionadas Interessa modelar e explorar esta relação Obter o grau de relacionamento (correlação) Modelar a relação Obter previsão de uma variável em função da(s) outra(s) Relações determinísticas ou não- determinísticas.

Modelos de regressão: relações entre variáveis Exemplo de uma relação determinística: Suponha que o aluguel de um carro custe $ 25 mais 0,30 por Km rodado. Seja Y=valor do aluguel e X=número de kilometros rodados. Portanto Y=25+0,3X O custo para rodar 100 km será Y=25+0,3(100)= $ 55

Modelos de regressão: relações entre variáveis Exemplos de uma relações não- determinísticas: Y=altura e X=peso de indivíduos Y=consumo familiar e X=renda familiar Y=porosidade e X=peso em amostras de concreto. Y=resistência de amostras de concreto e X=nível de carbonação das amostras

Modelos de regressão: relações entre variáveis Análise de regressão: investiga a relação entre duas ou mais variáveis, relacionadas de modo não determinísticos. O Modelo de Regressão Linear Simples: Y = a +bX + e onde: Y= variável dependente X=variável explicativa e = variável aleatória residual

Modelos de regressão: estimação dos parâmetros do modelo (“a” e “b”) Os parâmetros “a”e “b” são estimados pelo método dos mínimos quadrados, que encontra a equação da reta que mais se aproxima dos dados, ou seja, minimizando o erro de predição. QUALIDADE DO AJUSTE: avaliada pelo Coeficiente de Determinação: R2, que varia de 0 a 1 e mede a proporção de variabilidade devida ao modelo ajustado. Quanto mais próximo de 1 melhor a qualidade do ajuste. TESTE DE SIGNIFICÂNCIA DOS PARÂMETROS: feita pela estatística T, geralmente os pacotes fornecem o Valor-p.

Ajuste do modelo de regressão linear simples aos dados do exemplo anterior A equação ajustada foi: Y=28,7-0,3387X com um poder explicativo de 87,5% O teste do coeficiente b foi significativo, indicando que quanto maior o nível de Carbonação menor a resistência do concreto. Poderíamos então usar o modelo ajustado para fazer predições da resistência Para qualquer nível de carbonação, por ex: a resistencia estimada para um ni- Vel de crbonação de 40, seria: Y=28,7-0,338(40)=15,18

O Modelo de Regressão Linear Múltipla Exemplo: Considera-se que a força de frenagem desenvolvida pelo motor de um automóvel seja função da velocidade do motor, do número de octanagem do combustível e da compressão do motor. Realiza-se um teste e os dados são apresentados a seguir. Ajustar um modelo de regressão múltipla e avaliar a qualidade do ajuste.