A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Análise de Dados. n O que é uma variável? –o que é observado ou medido n Tipos de variáveis: –Categóricas: cada caso pode pertencer a apenas uma de várias.

Apresentações semelhantes


Apresentação em tema: "Análise de Dados. n O que é uma variável? –o que é observado ou medido n Tipos de variáveis: –Categóricas: cada caso pode pertencer a apenas uma de várias."— Transcrição da apresentação:

1 Análise de Dados

2 n O que é uma variável? –o que é observado ou medido n Tipos de variáveis: –Categóricas: cada caso pode pertencer a apenas uma de várias categorias. Ordinais: se as categorias da variável têm uma ordem Ordinais: se as categorias da variável têm uma ordem Nominais: s e as categorias da variável não têm uma ordem Nominais: s e as categorias da variável não têm uma ordem –Contínuas: cada caso pode ter um valor númérico Contínua: pode tomar um infinidade de valores num determinado intervalo Contínua: pode tomar um infinidade de valores num determinado intervalo Classificação de Variáveis

3 Introdução de dados n Recolha de dados: –Formulário ou questionário em papel ou electrónico –Um formulário ou questionário bem desenhado pode reduzir muito o trabalho de introdução –Todos os casos devem ter um identificador único

4 n Uma coluna - uma variável n Uma linha - um caso Criação de variáveis

5 SPSS n SPSS = Statistical Package for Social Science n Janelas: –Dados –Resultado –Sintaxe

6 Codificação de variáveis n É importante codificar as variáveis categóricas: –exemplo: sexo (1-feminino | 2-masculino) –casos omissos (9, 99, 999) ou não aplicáveis (8, 88, 888)

7 Recodificação de variáveis n Por vezes é necessário recodificar variáveis categóricas: –muitas categorias pouco frequentes –interesse para o estudo

8 Criação de variáveis n Por vezes é necessário criar variáveis novas a partir de outras: –somar vários items de uma escala –calcular o nº de dias usando datas –...

9 Verificação dos dados n Erros de introdução de dados: dupla entrada n Verificação - descrevendo os dados podemos verificar se: n As variáveis categóricas têm códigos inexistentes? n As variáveis contínuas têm valores fora do âmbito possível? n As datas são todas possíveis? (ex: ) n Há inconsistências entre as variáveis? n Dados omissos – todos os dados omissos devem ser codificados como tal (ex: 9=não responde)

10 Medidas de Sumário n Medidas de posição: n Média – soma de todos os valores sobre o nº de valores n Mediana – ordenando os valores por ordem crescente é o valor do meio n Outras medidas: moda MedidaVantagensDesvantagensMédia Usa todos os dados Definida algebricamente Distorcida por valores extremos Distorcida por distribuições enviesadas Mediana Não é distorcida por valores extremos Não é distorcida por distribuições enviesadas Ignora muita informação Não definida algebricamente Quadro adaptado de: Medical Statistics at a Glance. Aviva Petrie and Caroline Sabin. Blackwell Science. 2000

11 Medidas de Sumário n Medidas de dispersão: n Âmbito – diferença entre o valor maior e menor n Âmbito de percentis – ordenando os valores por ordem crescente e dividindo os valores em 100 pedaços, o valor que corresponde a x% das observações é o percentil x. Se dividir em 4 grupos iguais chamam-se quartis que correspondem ao percentil 25, 50 e 75. O âmbiro interquartil é a diferença entre o percentil 25 e 75. Também se pode fazer o âmbito entre dois outros percentis. n Variância – (x i -x) 2 /(n-1) n Desvio padrão – raiz quadrada da variância n Outras medidas: skewness and kurtosis

12 Medidas de Sumário MedidaVantagensDesvantagensÂmbito Fácil de calcular Usa apenas dois valores Distorcido por valores extremos Âmbito de percentis Não é distorcida por valores extremos Não pode ser calculado para amostras pequenas Variância Usa todos os dados Definida algebricamente A unidade é o quadrado da unidade dos dados Sensível a valores extremos Não apropriada em distribuições enviesadas Desviopadrão Usa todos os dados Definida algebricamente Unidade é a mesma que a dos dados Fácil de interpretar Sensível a valores extremos Não apropriada em distribuições enviesadas Quadro adaptado de: Medical Statistics at a Glance. Aviva Petrie and Caroline Sabin. Blackwell Science. 2000

13 Descrição de variáveis n Contínuas –Gráfico: histograma –Medidas: média, mediana, desvio padrão ou âmbito n Categóricas –Gráfico: barras ou tarte –Medidas: frequências e percentagens

14 Distribuições teóricas n O que é uma distribuição de probabilidades? –Uma variável pode tomar qualquer valor dentro de um conjunto de valores com uma determinada probabilidade, uma distribuição de probabilidades mostra a probabilidade de todos os valores possíveis de uma variável

15 Função densiade de probabilidade n O eixo dos x representa os valores da variável e desenha-se a curva pela equação da distribuição n A área total abaixo da curva representa a probabilidae de todos os valores possíveis =1 n A probabilidade da variável assumir um valor entre dois possíveis é igual à área abaixo da curva entre esses dois valores.

16 Distribuição normal - Completamente descrita por dois parâmetros (, ) - Em forma de sino - Simétrica para a média (média = mediana) Se o desvio padrão diminui a cuva compacta-se mais a volta da média

17 Distribuição normal n Porque é a distribuição normal tão importante? –Muitos testes estatísticos assumem que os dados vêm de uma distribuição simétrica –A média e a variância não são dependentes –Muitos fenómenos naturais têm aproximadamente uma distribuição simétrica –Qualquer que seja a distribuição de uma variável se se fizerem várias amostras com o mesmo tamanho, a distribuição das médias destas amostras tende para uma distribuição normal com média igual á média da população e com desvio padrão igual ao da população a dividir pela raiz quadrada do tamanho das amostras.

18 Outras distribuições n t n F n Qui-quadrado n Lognormal n Binomial n Poisson


Carregar ppt "Análise de Dados. n O que é uma variável? –o que é observado ou medido n Tipos de variáveis: –Categóricas: cada caso pode pertencer a apenas uma de várias."

Apresentações semelhantes


Anúncios Google