Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouEdson Paiva Custódio Alterado mais de 8 anos atrás
2
Estatística Básica Jorge Festa 2
3
Análise Exploratória de Dados
Capítulo 1 - Resumo de Dados Introdução Tipos de Variáveis Distribuição de Freqüências Representação Gráfica das Variáveis Quantitativas Ramo-e-folhas
4
INTRODUÇÃO O que é ESTATÍSTICA ?
É fundamental na análise de dados provenientes de quaisquer processos onde exista VARIABILIDADE. Uso de informações na: coleção, apresentação, análise e tomada de decisões, para solucionar problemas. 3
5
Estatística Uma estatística é uma quantidade que é calculada dos dados amostrados. Ela é usada para dar informações a respeito de valores desconhecidos da correspondente população. Por exemplo, a média dos dados amostrados é utilizada para dar informações sobre toda a média da população da qual a amostra foi retirada.
6
GRANDES ÁREAS DA ESTATÍSTICA
Amostragem e planejamento de experimentos coleção ou coleta de dados Estatística descritiva organização, apresentação e sintetização de dados Estatística inferencial métodos para tomada de decisões, nas situações onde existem incertezas e VARIAÇÕES. 4
7
AMOSTRAGEM É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico. Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Ex. Pesquisas sobre tendências de votação. escolha da amostra, redação do questionário, a entrevista, a codificação dos dados, a apuração dos resultados são ETAPAS FUNDAMENTAIS deste tipo de pesquisa. 5
8
ESTATÍSTICA DESCRITIVA
É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão freqüente é o uso de média, índices e gráficos nas notícias. Exemplo: O INPC, Índice Nacional de Preços ao Consumidor Aumento dos produtos da cesta básica. Anuário Estatístico Brasileiro educação, saúde, transporte, economia, cultura etc. 6
9
Estatística Inferencial
A estatística Inferencial faz uso das informações retiradas da amostra para conclusões (inferências), a respeito da população da qual a amostra foi retirada.
10
POPULAÇÃO E AMOSTRA O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e análise de dados estatísticos. População é a coleção de todas as observações sobre determinado fenômeno. Amostra é o conjunto de dados efetivamente observados, ou extraídos da população. Exemplo: Determinação do consumo de óleo diesel em ônibus, avaliação de um programa de ensino, renda média per capita em diversas regiões do país etc. 7
11
INFERÊNCIA A tomada de decisões sobre a população, com base nos dados da amostra, constitui o problema central da INFERÊNCIA ESTATÍSTICA. A tais decisões estão sempre associados um grau de incerteza e, conseqüentemente, uma probabilidade de erro. Exemplo: Teste sobre medicamentos, experimentos agrícolas, análise financeira, consumo de energia etc. 8
12
APRESENTAÇÃO DE DADOS Técnicas que permitem detectar e corrigir erros e inconsistências ocorridos durante um processo de coleta de dados e determinar as principais características destes dados. Grupamento de dados; Construção de distribuições de freqüência; Gráficos. 9
13
Tipos de Variáveis Qualitativa Nominal Região de Procedência Ordinal
Educação, Classe Social Quantitativa Discreta Número de Filhos Contínua Peso de Indivíduos, Salários em R$
14
GRUPAMENTO DE DADOS Alturas, expressas em centímetros de 30 atletas de um clube. 11
15
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Alturas em cm. de 30 atletas 13
16
GRÁFICOS 15
17
GRÁFICOS 16
18
GRÁFICOS 17
19
GRUPAMENTO DE DADOS Número de filhos em 25 famílias observadas 12
20
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Número de filhos em 25 famílias observadas 14
21
GRÁFICOS 18
22
GRÁFICOS 19
23
Análise Exploratória de Dados
Capítulo 2 - Algumas medidas associadas a variáveis Quantitativas Medidas de Posição Medidas de Dispersão Outra Estratégia de Análise Desenho Esquemático
24
Estatísticas Descritivas
Tamanho da Amostra Média Mediana Moda Média Geométrica Variância Desvio-padrão Erro-padrão Mínimo Máximo Amplitude Quartil Inferior Quartil Superior Intervalo Inter-quartil Assimetria “Skewnwss” Assimetria Padronizada Curtose “Kurtosis” Curtose Padronizada Coeficiente de Variação Somatório
25
Estatística Clássica Suposições Probabilísticas das Variáveis Envolvidas Declarações sobre os Parâmetros ou Modelo Utilizado Noções Assintóticas de Consistência Variância “Grandes Amostras” Eficiência “USE A ESTATÍSTICA COMO O BÊBADO USA OS POSTES - MAIS PELO APOIO QUE PELA ILUMINAÇÃO” Andew Lang
26
Análise Exploratória de Dados
Tukey J. W. (1977) Técnicas Visuais Dados = Modelo + Resíduos Modelo = parte Suave Resíduos = parte Grosseira
27
Análise Exploratória de Dados
Ferramentas Principais Ramo-e-folhas - “Stem-and-Leaf” Esquema de cinco números - “5-number summary” Desenho Esquemático - “Box-Plot”
28
Ramo-e-folhas Apresentação RAMO - à esquerda da linha vertical
FOLHAS - à direita da linha vertical Vantagem sobre a Tabela de Freqüência: Não perdemos informação Número de linhas é equivalente ao número de classes
29
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Alturas em cm. de 30 atletas 13
30
RAMO-E-FOLHAS 20
31
CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Número de filhos em 25 famílias observadas 14
32
RAMO-E-FOLHAS 21
33
Esquema ou Resumo de 5 Números
Sugestão (Tukey) (i) a mediana (ii) os extremos (mínimo e máximo) (iii) os quartis ou juntas (inferior e superior) A Mediana é uma Medida Resistente, não é afetada por valores extremos. a Média amostral e o Desvio-padrão são afetados por valores extremos não temos idéia quanto a simetria da distribuição dos dados
34
Desenho Esquemático “UM DESENHO ESQUEMÁTICO OU GRÁFICO DO ESQUEMA DE 5 NÚMEROS VALE MAIS QUE 1000 PALAVRAS” OUTLIERS valores abaixo da J1 - 3/2 dJ valores acima da J3 + 3/2 dJ, onde J1 = 1º quartil, J3 = 3º quartil e dJ = J3 - J1
35
Exemplo
36
Exemplo
37
Análise Exploratória de Dados
Capítulo 3 - Análise Bidimensional Variáveis Multidimensionais Independência de Variáveis Medidas de Dependência entre Duas Variáveis Diagrama de Dispersão Coeficiente de Correlação
38
Variáveis Multidimensionais
Em muitas situações observamos duas ou mais características simultaneamente, para analisar o seu comportamento. A DISTRIBUIÇÃO CONJUNTA das freqüências será um poderoso instrumento na compreensão dos dados.
39
Distribuição Conjunta
Distribuição Conjunta do Grau de Instrução e Região
40
Independência de Variáveis
Um dos principais objetivos de uma distribuição conjunta é descrever a ASSOCIABILIDADE existente ENTRE DUAS VARIÁVEIS, isto é, queremos conhecer o GRAU DE DEPENDÊNCIA entre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da outra.
41
Independência de Variáveis
Distribuição conjunta das freqüências e porcentagens segundo sexo e curso
42
Medidas de Dependência entre Duas Variáveis
coeficientes de associação ou correlação coeficiente de contingência de Karl Pearson
43
Diagramas de Dispersão
44
Coeficiente de Correlação
45
Origem do Termo “Regressão”
46
Probabilidades Capítulo 4 - Probabilidades Introdução
Algumas Propriedades Probabilidade Condicional e Independência Teorema de Bayes
47
Probabilidades Uma das principais ferramentas da estatística é a probabilidade, que teve seu início formal com a escolha de jogos no início do século XVII. Para seu entendimento necessitamos de alguns conhecimentos BÁSICOS que seguem:
48
Experimento É qualquer processo ou estudo de coletar dados revelantes, os quais exibem variações em seus resultados, resultados estes desconhecidos de ante mão. Ex. Lançamento de um dado honesto e observar a cada arremesso a face voltada para cima.
49
Espaço Amostral “W” O espaço amostral “W”, é o conjunto de todos os resultados possíveis, elementares e indivisíveis do experimento, onde cada resultado é um evento simples. Ex. Lançamento de um dado honesto W = { f1, f2, f3, f4, f5, f6 }
50
Evento Um evento, indicado pelas letras A, B, ..., é qualquer subconjunto do espaço amostral “W”. Exemplo 1: A ocorrência de face impar, no lançamento de um dado honesto. evento A = { f1, f3, f5 } Exemplo 2: A ocorrência de face par, no lançamento de um dado honesto. evento B = { f2, f4, f6 }
51
s-álgebra Uma s-álgebra é uma classe de subconjuntos do espaço amostral, W, satisfazendo os seguintes axiomas:
52
Definição de Probabilidade
Definição Clássica Definição Freqüentista Definição Geométrica Definição Axiomática
53
Definição Axiomática
54
Algumas Propriedades
55
Probabilidade Condicional
56
Teorema da Probabilidade Total
57
Teorema de Bayes
58
Regra da Multiplicação
59
Independência
60
Variável Aleatória Uma variável aleatória, indicada por X, é uma função com domínio o espaço amostral e contradomínio o conjunto dos números Reais, tal que, o evento [ X £ x ] pertence a s-álgebra para todos os valores de x que pertencem aos no.s reais.
61
Função Distribuição Uma Função Distribuição, indicada por F(x), é uma função, com domínio os Reais e contradomínio o intervalo [0,1], satisfazendo as seguintes propriedades: F(x) é não decrescente; F(x) é contínua à direita; F(-¥) = 0 e F(¥) = 1
62
Função Distribuição Acumulada
Dada a variável aleatória X, chamaremos de função distribuição acumulada a função
63
O Conceito de Variável Aleatória Discreta
Uma variável aleatória X, é dita discreta, se ela assume um número finito ou infinito enumerável. A função, indicada por p(x), nós chamamos função de probabilidade da variável aleatória discreta X.
64
Função de Probabilidade
65
O Conceito de Variável Aleatória Contínua
Uma variável aleatória, indicada por X, é dita contínua, se existe uma função f(x), chamada função densidade de probabilidade, tal que:
66
Função Densidade de Probabilidade
67
Valor Esperado de uma Variável Aleatória
Dada uma variável aleatória X, chamamos valor médio ou esperança matemática de X ao valor
68
Valor Esperado de Uma Função de uma Variável Aleatória X “g(X)”
Dada a variável aleatória X, chamamos esperança ou valor esperado da função g(x) ao valor:
69
Propriedades Se g(x) = aX + b, E[g(x)] = E(aX + b) = a E(X) + b
Se g(x) =[X - E(X)]2 E[g(x)] = Var(X)
70
Alguns Modelos Discretos
Distribuição Uniforme Discreta Distribuição Bernoulli Distribuição Binomial Distribuição Hipergeométrica Distribuição Geométrica Distribuição Binomial Negativa Distribuição Poisson
71
Alguns Modelos Contínuos
Uniforme Contínua Normal Exponencial Gama Beta Cauchy Lognormal Dupla-exponencial Weibull Logística Pareto Gumbel (Valor Extremo) t-Student’s F-Snedecor’s Qui-quadrado Normal Bivariada
72
Variáveis Aleatórias Multidimensionais
Capítulo 7 - Variáveis Aleatórias Multidimensionais Distribuição Conjunta Distribuições Marginais e Condicionais Funções de Variáveis Aleatórias Covarância de Duas Variáveis Aleatórias Variáveis Contínuas
73
Distribuição Conjunta
Em muitos experimentos, a um mesmo ponto amostral w,atribuímos valores de duas ou mais variáveis aleatórias. Ex. Suponha que queremos estudar a composição de famílias com 3 crianças, quanto ao sexo. X = número de meninos Y = 1 (se for homem) e 0 (se for mulher) Z = no. de vezes que houve variação do sexo W = número de meninas
74
Função Densidade Conjunta
75
Tabela de Probabilidades
76
Distribuições Marginais
77
Distribuições Condicionais
78
Distribuições Independentes
79
Covariância de duas variáveis aleatórias
80
Coeficiente de Correlação de X e Y
81
Referências Bibliográficas
Montgomery, Douglas C. & Runger, George C. Applied statistics and probability for engineers. New York, Wiley, 1994. Montgomery, Douglas C., Introduction to statistical quality control. New York, Wiley, 1991. Bussab, Wilton O., Estatística Básica. 4.ed. São Paulo, 1987
82
Variáveis Aleatórias Discretas
Capítulo 5 - Variáveis Aleatórias Discretas O Conceito de VA. Discreta Valor Esperado de uma va. Algumas Propriedades da Esperança Função Distribuição Acumulada Alguns Modelos Probabilísticos
83
Introdução à Inferência Estatística
Capítulo 8 - Introdução à Inferência Estatística População e Amostra Problemas de Inferência Como Selecionar Uma Amostra Amostragem Casual Simples Estatística e Parâmetros Distribuições Amostrais Distribuição Amostral da Média Distribuição Amostral da Proporção Outras Distribuições Amostrais
84
Estimação Capítulo 9 - Estimação Primeiras Idéias
Propriedades dos Estimadores Estimadores de Mínimos Quadrados Estimadores de Máxima Verossimilhança Intervalos de Confiança
85
Teste de Hipóteses Capítulo 10 - Testes de Hipóteses Introdução
Procedimento Geral do Teste de Hipóteses Passos para Construção de um Teste de Hipóteses Testes sobre a Média de uma População Poder de Um Teste Teste para a Proporção Nível Descritivo ( P-valor )
86
Outros Tópicos Capítulo - Outros Tópicos
Algumas Distribuições Importantes a distribuição Qui-Quadrado a distribuição F (Snedcor) Testes para a Média de uma Normal Testes para a Variância de uma Normal Comparação das Médias de duas populações Normais Comparação das Variâncias de duas populações Normais Observações Emparelhadas
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.