A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa

Apresentações semelhantes


Apresentação em tema: "UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa"— Transcrição da apresentação:

1 UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa
Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

2 Analisar os dados - 1 Que passos preliminares antes da análise dos dados recolhidos? Que análise estatística a efectuar? Qual a importância da análise gráfica? Qual a razão dos testes estatísticos de confirmação ou de significância? O que é o teste do Qui-quadrado? Que erros se podem obter? Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

3 Passos preliminares à análise de dados
Conhecer o suporte em que se encontram os dados. Saber se o programa informático que vai trabalhar os dados consegue ler o ficheiro. Conhecer as variáveis do ficheiro de dados, a sua codificação Determinar se existem dados em falta (missing data) e tomar uma decisão sobre os dados em falta. Proceder á depuração de dados que perturbam a investigação (registos não completos, com erros, outliers….) Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

4 Análise estatística Análises univariadas: Distribuição de Frequências
Representação gráfica: Gráfico de barras/ histograma - Box-plot Stem-and-lef Polígono de frequências Polígonos de frequência acumuladas Representações circulares Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

5 Análise gráfica A representação gráfica pode ser um instrumento de comunicação de extraordinária eficácia. O texto leva a uma exposição de sugestões gráficas capazes de impressionar e interessar os estudantes e os leitores. Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

6 Grafico de barras/histograma
Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

7 Stem-and-lef Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

8 BOX-PLOT Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

9 Polígono de frequências
Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

10 Polígono de frequências acumuladas
Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

11 Graficos circulares 19-04-2019
Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

12 Teste de hipóteses Teste para uma média X (U, σ2) Ho : U = Uo
Há : U ≠ Uo Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

13 Teste de hipóteses Erro tipo I OK Erro tipo II
α (I) – erro de 1ª espécie Β (II) – erro de 2ª espécie Decisão sobre Ho Hipótese Verdadeira (Ho) Hipótese falsa (N Ho) R Ho (rejeitar) Erro tipo I OK NR Ho (não rejeitar) Erro tipo II Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

14 Tabelas de contingência (2x2)
Suponha que uma amostra aleatória de homens e mulheres manifestaram-se , a favor, contra ou indecisos face a permanência dos EUA no Iraque. Os resultados são apresentados no quadro ao lado: A favor Contra Indecisos Total H 118 62 25 205 M 84 78 37 199 202 140 404 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

15 Testamos a hipótese que não existe diferença de opinião entre homens e mulheres, isto é, a resposta é independente do sexo da pessoa que foi entrevistada, sendo esta a hipótese nula. Se a hipótese não for verdadeira, então a resposta poderá depender do sexo da pessoa entrevistada. A tabela permitirá calcular o grau de dependência. Uma tabela construída assim, permitindo uma dependência ou associação é designada por tabela de contingência. O objectivo de uma tabela de contingência é a de determinar se uma dependência existe entre duas variáveis qualitativas (categóricas). Adoptamos a hipótese nula. Desta forma deduziremos que a proporção da amostra que são homens é 205/404, e como há 202 pessoas que são a favor da proposta , o numero esperado de homens a favor da proposta é 205/404  202 = Por outro lado, o número esperado estimado de homens (linha 1) a favor da medida (coluna 1) é Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

16 E o número esperado de homens indecisos (linha 1 e coluna 3)
Havendo 140 pessoas contra a proposta. O número esperado de homens contra a proposta (linha 1 coluna 2) é E o número esperado de homens indecisos (linha 1 e coluna 3) Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

17 Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

18 FORMULA PARA CALCULAR UM VALOR ESPERADO ESTIMADO:
Cada célula do valor esperado estimado é igual ao produto dos totais da respectiva linha e coluna dividido pelo total da amostra (n) . Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

19 eij = valor esperado estimado da célula da linha i e coluna j
onde eij = valor esperado estimado da célula da linha i e coluna j Ri = Total da linha i Cj = Total da coluna j n = dimensão da amostra Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

20 Valores esperados (entre parentesis) e observados
A favor Contra Indecisos H 118 (102,5) 62 (71) 25 (32,5) M 84 (99,5) 78 (69) 37 (30,5) Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

21 O teste estatístico do qui-quadrado , 2, é calculado da seguinte forma:
O número de graus de liberdade para uma tabela de contingência será sempre (r - 1)  (c -1), onde r é o número de linhas ec é o número de colunas da tabela. Neste exemplo temos dois graus de liberdade . Consultando a tabela de distribuição do qui-quadrado, verificamos que os valores críticos para 2 são 5.99 para um nível de significância de  = .05 e de 9.21 para um nível de significância de  = Em ambos os casos o teste estatístico dá um valor superior ao valor crítico pelo que podemos rejeitar a hipótese nula aceitando a hipótese alternativa de que os homens e mulheres pensam de forma diferente relativamente ao problema proposto com um nível de confiança de 99%. Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

22 Forma genérica do teste do qui-quadrado de independência :
H0: As duas variáveis da tabela são independentes Ha: As duas variáveis da tabela são dependentes Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG

23 Região de rejeição: onde r = Numero de linhas da tabela
c = Numero de colunas da tabela Oij = Número de respostas observadas na célula da lina i e coluna j. eij = Número esperado estimado de respostas na célula (ij) = (Ri  Cj) / n Região de rejeição: Onde é o valor da tabela da distribuição do qui-quadrado com (r -1)  (c-1) graus de liberdade, tal que Fontes e Métodos da Informação Estatística - 2º Economia e 1º NI UM-EEG


Carregar ppt "UNIDADE 8 Analisar os dados -1 Carlos Arriaga Costa"

Apresentações semelhantes


Anúncios Google