UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa

Slides:



Advertisements
Apresentações semelhantes
Análise descritiva de dados (1) Apresentação de dados em tabelas.
Advertisements

Inferência Estatística e Teste de Hipóteses
MÉTODOS ESTATÍSTICOS PARA TESTAGEM DE HIPÓTESES Carla Daltro.
Testes de hipótese com uma amostra. Testes de hipóteses para média (amostras grandes) 1. Declare afirmação verbal e matemáticamente. Identifique as hipóteses.
Testes de hipótese com uma amostra. Teste de hipótese  Um processo que usa estatísticas amostrais para testar a afirmação sobre o valor de um parâmetro.
Regressão Linear Múltipla Arquivo: seleção2.sav. Base de dados Variáveis independentes: X 1, X 2, X 3,..., X 14 Variável dependente ou Resposta: Y 1428.
PRINCIPAIS MODELOS CONTÍNUOS Modelo uniforme Uma v.a. contínua X tem distribuição uniforme com parâmetros  e  (  <  ) se sua função densidade.
Organização de dados e representação gráfica Estatística Aplicada - Componente Prática.
Variáveis multinomiais ordenadas. Variável dependente ordenada: aplicações Avaliação de pesquisas de satisfação de clientes – Kreke et al. (1995): avaliação.
Amostragem Cuidados a ter na amostragem Tipos de amostragem
TÉCNICAS DE AMOSTRAGEM – Unidade 2 Professor Marcelo Menezes Reis
Bioestatística e Epidemiologia Tabelas e gráficos
Comparação de proporções
ESTATÍSTICA AULA 03 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
Testes de Hipóteses VPS126.
Comparando k amostras (k>2) dependentes
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Técnicas de Reamostragem Camilo Daleles Rennó
Confiabilidade Estrutural
Profa Dra. Denise Pimentel Bergamaschi
TESTES DE HIPÓTESES.
MATEMÁTICA.
O OBJETIVO FUNDAMENTAL DA DISCIPLINA
Probabilidade e Estatística Aplicadas à Contabilidade II
Medidas de Dispersão para uma amostra
Métodos Básicos de Análise de Dados
“ASSOCIAÇÃO EDUCACIONAL FANUEL” GUARDA MIRIM DE TELÊMACO BORBA
Análise da Regressão múltipla: Inferência Revisão
Profa Dra. Denise Pimentel Bergamaschi
Experiências aleatórias
DISTRIBUIÇÃO BINOMIAL
ESTATÍSTICA Aula 5.
Inferência Estatística aplicada à Pesquisa em Saúde.
ESTATÍSTICA AULA 06 ANÁLISE EXPLORATÓRIA DE DADOS II – Unidade 4
Estatística Descritiva: Tabelas e Gráficos
ESTATÍSTICA AULA 04 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
Teste t para amostras independentes (EX. DE QUESTÃO)
Bioestatística Professora Livre Docente Suely Godoy Agostinho Gimeno
Regressão Logística Modelos de regressão não linear são usados, em geral, em duas situações: casos em que as variáveis respostas são qualitativas e os.
MEDIDAS DE LOCALIZAÇÃO E DISPERSÃO
NOÇÕES DE TESTE DE HIPÓTESES (I)
Ajustamento de Observações
Tópicos em Econometria I
ANOVA II.
TESTES DE HIPÓTESES.
Testes de Hipóteses (cont.).
O que é ESTATÍSTICA “Estatística é a Ciência de obter conclusões a partir de dados”. Paul Velleman A Estatística envolve técnicas para coletar, organizar,
ESTATÍSTICA BÁSICA. Por quê? Em alguma fase de seu trabalho, o pesquisador se vê às voltas com o problema de analisar e entender um conjunto de dados.
Centro de Ciências do Mar do Algarve
Matemática IV Prof. Dani Prestini.
9. Testes de Hipóteses Paramétricos
Teste X2 Erikson Cipriano. É um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis categóricas nominais e avaliar.
Representação gráfica dos dados estatísticos
Introdução às distribuições normais AULA 5. Propriedades de uma distribuição normal Suas média, mediana e moda são iguais. Tem forma de sino e é simétrica.
Estatística Aplicada Larson Farber 9 Correlação e regressão.
Representação Gráfica de dados
Estatística: Conceitos Básicos
AULA 2 ESTATÍSTICA DANIEL PÁDUA.
Procedimentos antes e após coleta dos dados
CORRELAÇÃO Universidade Federal Rural do Rio de Janeiro CPGA-Solos
Estatística amintas paiva afonso.
Mestrado Profissional em Física Médica
Inferência Estatística
Teste de hipótese em R.
Prof. Sidomar
Intervalo de confiança (IC95%) e teste do chi-quadrado
Escola Estatística Matemática Professora: ?.
Políticas Públicas de Saúde Bioestatística - Amostragem
ADRIANO FERRETI BORGATTO
Curso Superior de Engenharia Elétrica e de Produção Faculdade Maurício de Nassau Cabo Professora: Aline Dantas ESTATÍSTICA.
Hipótese Políticas Públicas de Saúde no Brasil
Transcrição da apresentação:

UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Analisar os dados - 1 Que passos preliminares antes da análise dos dados recolhidos? Que análise estatística a efectuar? Qual a importância da análise gráfica? Qual a razão dos testes estatísticos de confirmação ou de significância? O que é o teste do Qui-quadrado? Que erros se podem obter? 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Passos preliminares à análise de dados Conhecer o suporte em que se encontram os dados. Saber se o programa informático que vai trabalhar os dados consegue ler o ficheiro. Conhecer as variáveis do ficheiro de dados, a sua codificação Determinar se existem dados em falta (missing data) e tomar uma decisão sobre os dados em falta. Proceder á depuração de dados que perturbam a investigação (registos não completos, com erros, outliers….) 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Análise estatística Análises univariadas: Distribuição de Frequências Representação gráfica: Gráfico de barras/ histograma - Box-plot Stem-and-lef Polígono de frequências Polígonos de frequência acumuladas Representações circulares 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Análise gráfica A representação gráfica pode ser um instrumento de comunicação de extraordinária eficácia. O texto leva a uma exposição de sugestões gráficas capazes de impressionar e interessar os estudantes e os leitores. 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Grafico de barras/histograma 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Stem-and-lef 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

BOX-PLOT 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Polígono de frequências 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Polígono de frequências acumuladas 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Graficos circulares 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Teste de hipóteses Teste para uma média X (U, σ2) Ho : U = Uo Há : U ≠ Uo 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Teste de hipóteses Erro tipo I OK Erro tipo II α (I) – erro de 1ª espécie Β (II) – erro de 2ª espécie Decisão sobre Ho Hipótese Verdadeira (Ho) Hipótese falsa (N Ho) R Ho (rejeitar) Erro tipo I OK NR Ho (não rejeitar) Erro tipo II 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Tabelas de contingência (2x2) Suponha que uma amostra aleatória de homens e mulheres manifestaram-se , a favor, contra ou indecisos face a permanência dos EUA no Iraque. Os resultados são apresentados no quadro ao lado: A favor Contra Indecisos Total H 118 62 25 205 M 84 78 37 199 202 140 404 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Testamos a hipótese que não existe diferença de opinião entre homens e mulheres, isto é, a resposta é independente do sexo da pessoa que foi entrevistada, sendo esta a hipótese nula. Se a hipótese não for verdadeira, então a resposta poderá depender do sexo da pessoa entrevistada. A tabela permitirá calcular o grau de dependência. Uma tabela construída assim, permitindo uma dependência ou associação é designada por tabela de contingência. O objectivo de uma tabela de contingência é a de determinar se uma dependência existe entre duas variáveis qualitativas (categóricas). Adoptamos a hipótese nula. Desta forma deduziremos que a proporção da amostra que são homens é 205/404, e como há 202 pessoas que são a favor da proposta , o numero esperado de homens a favor da proposta é 205/404  202 = 102.5. Por outro lado, o número esperado estimado de homens (linha 1) a favor da medida (coluna 1) é 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

E o número esperado de homens indecisos (linha 1 e coluna 3) Havendo 140 pessoas contra a proposta. O número esperado de homens contra a proposta (linha 1 coluna 2) é E o número esperado de homens indecisos (linha 1 e coluna 3) 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

FORMULA PARA CALCULAR UM VALOR ESPERADO ESTIMADO: Cada célula do valor esperado estimado é igual ao produto dos totais da respectiva linha e coluna dividido pelo total da amostra (n) . 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

eij = valor esperado estimado da célula da linha i e coluna j onde eij = valor esperado estimado da célula da linha i e coluna j Ri = Total da linha i Cj = Total da coluna j n = dimensão da amostra 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Valores esperados (entre parentesis) e observados A favor Contra Indecisos H 118 (102,5) 62 (71) 25 (32,5) M 84 (99,5) 78 (69) 37 (30,5) 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

O teste estatístico do qui-quadrado , 2, é calculado da seguinte forma: O número de graus de liberdade para uma tabela de contingência será sempre (r - 1)  (c -1), onde r é o número de linhas ec é o número de colunas da tabela. Neste exemplo temos dois graus de liberdade . Consultando a tabela de distribuição do qui-quadrado, verificamos que os valores críticos para 2 são 5.99 para um nível de significância de  = .05 e de 9.21 para um nível de significância de  = .01. Em ambos os casos o teste estatístico dá um valor superior ao valor crítico pelo que podemos rejeitar a hipótese nula aceitando a hipótese alternativa de que os homens e mulheres pensam de forma diferente relativamente ao problema proposto com um nível de confiança de 99%. 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Forma genérica do teste do qui-quadrado de independência : H0: As duas variáveis da tabela são independentes Ha: As duas variáveis da tabela são dependentes 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

Região de rejeição: onde r = Numero de linhas da tabela c = Numero de colunas da tabela Oij = Número de respostas observadas na célula da lina i e coluna j. eij = Número esperado estimado de respostas na célula (ij) = (Ri  Cj) / n Região de rejeição: Onde é o valor da tabela da distribuição do qui-quadrado com (r -1)  (c-1) graus de liberdade, tal que 19-04-2019 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG