Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Análise Exploratória de Dados
CAPÍTULO 7 TESTE DE HIPÓTESE
Intervalos de Confiança
TESTE PARA ESTRUTURA ESPECIAL DE CORRELAÇÃO
ANÁLISE DISCRIMINANTE LIG, 13 de novembro de 2008.
2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS
ANÁLISE DISCRIMINANTE LIG, 18 de novembro de 2008.
ANÁLISE DISCRIMINANTE
ANÁLISE DISCRIMINANTE
AVALIAÇÃO DA SUPOSIÇÃO DE NORMALIDADE
CAPÍTULO 7 TESTE DE HIPÓTESE
ESTIMAÇÃO.
Geoestatística Aplicada à Agricultura de Precisão I
Avaliação estatística dos mecanismos de codificação desenvolvidos
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
Estatística e Probabilidade
Análise da Regressão múltipla: Inferência Revisão da graduação
ME623A Planejamento e Pesquisa
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó
DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO DA AMOSTRA OU
DISTRIBUIÇÃO AMOSTRAL DA MÉDIA DA AMOSTRA OU DISTRIBUIÇÃO AMOSTRAL DE
Teste de Hipóteses de uma amostra Prof. Helcio Rocha
TESTES DE HIPÓTESES Spencer Barbosa da Silva
VALORES ESPERADOS.
Exponential Random Graph Models
Estatística e Probabilidade
Estatística e Probabilidade
Distribuição de Probabilidades
ANOVA: Análise de Variância APLICAÇÃO.
DISTRIBUIÇÕES AMOSTRAIS
Pressuposições do Modelo Estatístico e Transformação de Dados
Modelagem Estatística
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
Teste de Hipóteses para a média, caso da pequena amostra
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
Distribuição da Proporção Amostral
Teste de Hipótese.
Aula 5 - Método experimental ou de seleção aleatória
Análise de Incertezas Introdução.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó
COMPARAÇÃO DE DUAS POPULAÇÕES
Formas de calibração 1º - Padrões externos É a forma mais utilizada de calibração. São utilizadas soluções contendo concentrações conhecidas do analito.
Medidas de localização
3. Distribuições de probabilidade
DISTRIBUIÇÃO NORMAL.
Esquematicamente, temos:
Professor Antonio Carlos Coelho
Capítulo 4 As distribuições de probabilidade mais importantes em controle estatístico de qualidade (CEQ): atributos Sumário 4.1 Introdução 4.2 Distribuição.
Regressão e Previsão Numérica.
Laboratório de Física Corpuscular - aula expositiva IF - UFRJ1 Algumas Distribuições de Probabilidade e Estatística de Contagem Prof. Marcelo.
Associação entre duas variáveis: análise bidimensional
Metodologia da Pesquisa em Ensino de Ciências I
Descrição Bivariada Comparando Duas Distribuições
Usando Excel Prof. Rosemberg Trindade. Parte 1 Representação tabular de distribuição com variáveis discretas e contínuas.
Distribuição Normal de Probabilidade
Probabilidade Teste de hipóteses para uma média populacional:
Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -
INTERVALOS DE CONFIANÇA
Estimação: Estimativa Pontual Estimativa Intervalar
Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.
Estatística Inferencial. É um processo de tomada de decisão baseado em probabilidades e pode ser de dois tipos: - Estimação de parâmetros – usando a informação.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Estatística Aplicada - Componente Prática Ensaio de hipóteses estatísticas Ensaio para µ com  2 conhecido e desconhecido.
Autor : Lênin Charqueiro. Pelotas,8 de março de
Universidade Federal do Pará – Ciências Exatas e Naturais – Bacharelado em Estatística – Estatística Aplicada – Análise Discriminante Universidade Federal.
Transcrição da apresentação:

Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil esperado sob normalidade (podem ser usados para validar outras distribuições diferentes da normal). Quando a configuração de pontos no gráfico se aproxima de uma reta, a suposição de normalidade é sustentável. A normalidade é suspeita se houver pontos que se desviam do comportamento linear. A forma como os pontos se desviam do comportamento linear pode fornecer pistas sobre a natureza da não normalidade das observações. Conhecida a razão da não normalidade dos dados, ações corretivas podem ser tomadas (transformações visando normalizar os dados ou uso de técnicas para dados não normais).

PASSOS NA CONSTRUÇÃO DO Q-Q plot Ordenar os n valores da j-ésima componente do vetor aleatório. Seja as observações ordenadas. Os ‘s são os quantis amostrais (i=1,2,...,n). Quando todos os quantis amostrais são distintos entre si, então exatamente i observações são menores ou iguais a . A proporção i/n da amostra à esquerda de x(i) é frequentemente aproximada para (i-0,5)/n por conveniência analítica.

PASSOS NA CONSTRUÇÃO DO Q-Q plot Para uma distribuição normal padrão, podemos obter os quantis q(i) tais que P(Z≤ q(i))=(i-0,5)/n. A idéia será olhar os pontos (q(i),x(i)) com a mesma probabilidade acumulada (i-0,5)/n. Se os dados, de fato, provêm de uma normal, os pares serão aproximadamente linearmente relacionados, pois o quantil esperado sob normalidade é aproximadamente σ q(i)+μ, com σ representando o desvio-padrão e μ a média da distribuição.

Usando o R para a construção do Q-Q plot No R temos a função ppoints(n,0.5) que gera o vetor de valores (i-0,5)/n, para i variando de 1 a n. Para gerar os quantis esperados sob normalidade usaremos a função qnorm(p), que retorna o quantil cuja probabilidade acumulada é p. (Quando não especificamos nada além de p, o R retorna quantis da N(0,1)). A função usada para ordenar um vetor de números no R é a função sort(x).

Avaliação da normalidade das distribuições marginais Uma medida quantitativa para auxiliar na avaliação do Q-Q plot é calcular a correlação rQ entre os quantis esperados e o vetor observado ordenado. A hipótese de normalidade é rejeitada ao nível de significância α se rQ obtido for menor que um valor apropriado. Por exemplo, ao nível de significância de 5% amostras de tamanho 50, a hipótese deve ser rejeitada se rQ for inferiro a 0,9768.

Transformações de normalização Se a suposição de normalidade dos dados não é plausível, que estratégia adotar? 1) Usar técnicas estatísticas apropriadas para dados não-normais, após verificar a distribuição plausível para os dados (Poisson, Gamma,etc.) 2) Transformar os dados para uma nova escala, sob a qual a suposição de normalidade é plausível.   Aqui, somente trataremos da transformação, pois técnicas a serem estudadas a seguir são voltadas para dados normais.

Transformações úteis Escala original Escala transformada Contagens (y) Proporções ( Correlações (r) Fisher

Transformações de normalização Em muitas situações a escolha para melhorar a aproximação normal não é óbvia. Para tais casos é conveniente deixar que os dados mostrem uma transformação. Uma família útil de transformações para esse propósito é a família de transformações de potências : xλ. As transformações de potência só estão definidas para variáveis positivas. Porém, isso não é tão restritivo quanto parece, porque uma única constante pode ser adicionada a cada observação no conjunto de dados se alguns dos valores observados forem negativos. 

Transformações de normalização Box e Cox consideraram a seguinte família de transformações de potência modificada: que é contínua em λ para x>0.  Dada a amostra, escolhe-se λ de modo a maximizar:

Transformações de normalização Observação: A transformação obtida geralmente melhora a aproximação à normalidade. Porém, não há garantias de que mesmo a melhor escolha de λ produzirá um conjunto de dados transformados que seja adequado à suposição de normalidade. Os resultados obtidos por uma transformação selecionada de acordo com esse procedimento devem ser cuidadosamente examinados para possíveis violações da suposição de normalidade. Essa recomendação de fato vale para qualquer transformação usada.