Análise de Dados.

Slides:



Advertisements
Apresentações semelhantes
Curva Normal de Probabilidade
Advertisements

PESQUISA DE MARKETING 10a Aula
Tipos de dados; Apresentação dos Dados (tabelas, gráficos e medidas)
Geoestatística Aplicada à Agricultura de Precisão I
Estatística Descritiva Aula 02
Introdução à Estatística
Estatística 1 - Introdução.
Estatística Básica Utilizando o Excel
Estatística Básica Utilizando o Excel
Geoestatística Aplicada à Agricultura de Precisão I
Capítulo 5 A Distribuição Normal de Probabilidade
Capítulo 6 Estimativas e Tamanho de Amostras
Capítulo 5 Medidas Descritivas.
Distribuição de probabilidade
Diagramas de dispersão
Distribuição de probabilidade
Estatística Descritiva
ESTATÍSTICA.
Estatística e Probabilidade
Análise Exploratória dos Dados
Aula 0. Doces Lembranças de MAE0219
MBA em Gestão de Empreendimentos Turísticos
ESTATÍSTICA.
Estatística Descritiva
Medidas de Dispersão ou de Variabilidade:
Distribuições de probabilidades referentes a variáveis contínuas e suas aplicações As variáveis contínuas podem assumir qualquer valor dentro de um intervalo.
ESTATÍSTICA DECRITIVA
Amostragem Pontos mais importantes:
CLASSES: SÃO INTERVALOS DE VARIAÇÃO DA VARIÁVEL.
INTRODUÇÃO À ESTATÍSTICA APLICADA
ANÁLISE ESTATÍSTICA II
Distribuição Normal Prof. Herondino.
Site: Estatística Prof. Edson Nemer Site:
Curso de Introdução à Metodologia Científica
Medidas de Dispersão Aula 8.
Descrição e Apresentação de Dados
Medidas de localização
CURSO DE ARQUIVOLOGIA CCBSA - UEPB – Campus V
DISTRIBUIÇÃO NORMAL.
Medidas Descritivas ESTATISTICA Aula 5 PROF: CÉLIO SOUZA.
Especialização em Pesquisa Clínica Módulo 3 – Epidemiologia e Bioestatística Daniel Kashiwamura Scheffer 1o. Semestre – 2009.
Estatística Descritiva
Medidas Descritivas ESTATISTICA Aula 5 PROF: CÉLIO SOUZA.
Aula 8A ESTATÍSTICA E PROBABILIDADE
Laboratório de Física Corpuscular - aula expositiva IF - UFRJ1 Algumas Distribuições de Probabilidade e Estatística de Contagem Prof. Marcelo.
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
13/10/2009 Medidas Descritivas. 13/10/2009 Notações de algumas estatísticas. MedidasParâmetrosEstimadores Número de Elementos Nn MédiaμX, com barra acima.
Medidas Estatísticas.
Separatrizes Quartis Decis Percentis TIPOS:
Estatística Descritiva
Climatologia II – ACA226 Prof. Humberto Rocha
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
DISTRIBUIÇÕES DE PROBABILIDADE
Associação entre duas variáveis: análise bidimensional
Medidas de posição e de dispersão
Metodologia da Pesquisa em Ensino de Ciências I
Descrição Bivariada Comparando Duas Distribuições
Estatística Descritiva
Distribuição Normal de Probabilidade
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
ANÁLISE DE DADOS EM BIOLOGIA
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
DISTRIBUIÇÃO NORMAL Estudámos distribuições de probabilidade para variáveis aleatórias discretas. No final do capítulo falaremos da distribuição binomial.
SPSS Guia Prático para Pesquisadores
MEDIDAS DE POSIÇÃO MÉDIAS MODA MEDIANA QUARTIS PERCENTIS.
Prof. Josenildo dos Santos MÉTODOS QUANTITATIVOS APLICADOS ÀS CIÊNCIAS CONTÁBEIS CONTABILIDADE ESTRATÉGICA 2º MÓDULO.
CEPZ1 – 2015 – AULA 06 PROFESSORA: BRUNA CAVALLINI E RODRIGUES
Aula 5 Bioestatística. Estatísticas para uma variável.
Módulo 1 Estatística Básica.
Marcos Antonio Estremote – Aula 2.  Estatística Descritiva:  Resumo ou descrição das características importantes de um conjunto conhecido de dados populacionais.
Transcrição da apresentação:

Análise de Dados

Classificação de Variáveis O que é uma variável? o que é observado ou medido Tipos de variáveis: Categóricas: cada caso pode pertencer a apenas uma de várias categorias. Ordinais: se as categorias da variável têm uma ordem Nominais: se as categorias da variável não têm uma ordem Contínuas: cada caso pode ter um valor númérico Contínua: pode tomar um infinidade de valores num determinado intervalo

Introdução de dados Recolha de dados: Formulário ou questionário em papel ou electrónico Um formulário ou questionário bem desenhado pode reduzir muito o trabalho de introdução Todos os casos devem ter um identificador único

Criação de variáveis Uma coluna - uma variável Uma linha - um caso

SPSS SPSS = Statistical Package for Social Science Janelas: Dados Resultado Sintaxe

Codificação de variáveis É importante codificar as variáveis categóricas: exemplo: sexo (1-feminino | 2-masculino) casos omissos (9, 99, 999) ou não aplicáveis (8, 88, 888)

Recodificação de variáveis Por vezes é necessário recodificar variáveis categóricas: muitas categorias pouco frequentes interesse para o estudo

Criação de variáveis Por vezes é necessário criar variáveis novas a partir de outras: somar vários items de uma escala calcular o nº de dias usando datas ...

Verificação dos dados Erros de introdução de dados: dupla entrada Verificação - descrevendo os dados podemos verificar se: As variáveis categóricas têm códigos inexistentes? As variáveis contínuas têm valores fora do âmbito possível? As datas são todas possíveis? (ex: 31-02-2003) Há inconsistências entre as variáveis? Dados omissos – todos os dados omissos devem ser codificados como tal (ex: 9=não responde)

Medidas de Sumário Medidas de posição: Média – soma de todos os valores sobre o nº de valores Mediana – ordenando os valores por ordem crescente é o valor do meio Outras medidas: moda Medida Vantagens Desvantagens Média Usa todos os dados Definida algebricamente Distorcida por valores extremos Distorcida por distribuições enviesadas Mediana Não é distorcida por valores extremos Não é distorcida por distribuições enviesadas Ignora muita informação Não definida algebricamente Quadro adaptado de: Medical Statistics at a Glance. Aviva Petrie and Caroline Sabin. Blackwell Science. 2000

Medidas de Sumário Medidas de dispersão: Âmbito – diferença entre o valor maior e menor Âmbito de percentis – ordenando os valores por ordem crescente e dividindo os valores em 100 pedaços, o valor que corresponde a x% das observações é o percentil x. Se dividir em 4 grupos iguais chamam-se quartis que correspondem ao percentil 25, 50 e 75. O âmbiro interquartil é a diferença entre o percentil 25 e 75. Também se pode fazer o âmbito entre dois outros percentis. Variância –  (xi-x)2/(n-1) Desvio padrão – raiz quadrada da variância Outras medidas: skewness and kurtosis

Medidas de Sumário Medida Vantagens Desvantagens Âmbito de percentis Fácil de calcular Usa apenas dois valores Distorcido por valores extremos de percentis Não é distorcida por valores extremos Não pode ser calculado para amostras pequenas Variância Usa todos os dados Definida algebricamente A unidade é o quadrado da unidade dos dados Sensível a valores extremos Não apropriada em distribuições enviesadas Desvio padrão Unidade é a mesma que a dos dados Fácil de interpretar Quadro adaptado de: Medical Statistics at a Glance. Aviva Petrie and Caroline Sabin. Blackwell Science. 2000

Descrição de variáveis Contínuas Gráfico: histograma Medidas: média, mediana, desvio padrão ou âmbito Categóricas Gráfico: barras ou tarte Medidas: frequências e percentagens

Distribuições teóricas O que é uma distribuição de probabilidades? Uma variável pode tomar qualquer valor dentro de um conjunto de valores com uma determinada probabilidade, uma distribuição de probabilidades mostra a probabilidade de todos os valores possíveis de uma variável

Função densiade de probabilidade O eixo dos x representa os valores da variável e desenha-se a curva pela equação da distribuição A área total abaixo da curva representa a probabilidae de todos os valores possíveis =1 A probabilidade da variável assumir um valor entre dois possíveis é igual à área abaixo da curva entre esses dois valores.

Distribuição normal - Completamente descrita por dois parâmetros (, ) - Em forma de sino - Simétrica para a média (média = mediana) Se o desvio padrão diminui a cuva compacta-se mais a volta da média

Distribuição normal Porque é a distribuição normal tão importante? Muitos testes estatísticos assumem que os dados vêm de uma distribuição simétrica A média e a variância não são dependentes Muitos fenómenos naturais têm aproximadamente uma distribuição simétrica Qualquer que seja a distribuição de uma variável se se fizerem várias amostras com o mesmo tamanho, a distribuição das médias destas amostras tende para uma distribuição normal com média igual á média da população e com desvio padrão igual ao da população a dividir pela raiz quadrada do tamanho das amostras.

Outras distribuições t F Qui-quadrado Lognormal Binomial Poisson