A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Básica Jorge Festa 2. Estatística Básica Jorge Festa 2.

Apresentações semelhantes


Apresentação em tema: "Estatística Básica Jorge Festa 2. Estatística Básica Jorge Festa 2."— Transcrição da apresentação:

1

2 Estatística Básica Jorge Festa 2

3 Análise Exploratória de Dados
Capítulo 1 - Resumo de Dados Introdução Tipos de Variáveis Distribuição de Freqüências Representação Gráfica das Variáveis Quantitativas Ramo-e-folhas

4 INTRODUÇÃO O que é ESTATÍSTICA ?
É fundamental na análise de dados provenientes de quaisquer processos onde exista VARIABILIDADE. Uso de informações na: coleção, apresentação, análise e tomada de decisões, para solucionar problemas. 3

5 Estatística Uma estatística é uma quantidade que é calculada dos dados amostrados. Ela é usada para dar informações a respeito de valores desconhecidos da correspondente população. Por exemplo, a média dos dados amostrados é utilizada para dar informações sobre toda a média da população da qual a amostra foi retirada.

6 GRANDES ÁREAS DA ESTATÍSTICA
Amostragem e planejamento de experimentos coleção ou coleta de dados Estatística descritiva organização, apresentação e sintetização de dados Estatística inferencial métodos para tomada de decisões, nas situações onde existem incertezas e VARIAÇÕES. 4

7 AMOSTRAGEM É o processo de escolha da amostra. É a parte inicial de qualquer estudo estatístico. Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo. Ex. Pesquisas sobre tendências de votação. escolha da amostra, redação do questionário, a entrevista, a codificação dos dados, a apuração dos resultados são ETAPAS FUNDAMENTAIS deste tipo de pesquisa. 5

8 ESTATÍSTICA DESCRITIVA
É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe quão freqüente é o uso de média, índices e gráficos nas notícias. Exemplo: O INPC, Índice Nacional de Preços ao Consumidor Aumento dos produtos da cesta básica. Anuário Estatístico Brasileiro educação, saúde, transporte, economia, cultura etc. 6

9 Estatística Inferencial
A estatística Inferencial faz uso das informações retiradas da amostra para conclusões (inferências), a respeito da população da qual a amostra foi retirada.

10 POPULAÇÃO E AMOSTRA O estudo de qualquer fenômeno, seja ele natural, social, econômico ou biológico, exige a coleta e análise de dados estatísticos. População é a coleção de todas as observações sobre determinado fenômeno. Amostra é o conjunto de dados efetivamente observados, ou extraídos da população. Exemplo: Determinação do consumo de óleo diesel em ônibus, avaliação de um programa de ensino, renda média per capita em diversas regiões do país etc. 7

11 INFERÊNCIA A tomada de decisões sobre a população, com base nos dados da amostra, constitui o problema central da INFERÊNCIA ESTATÍSTICA. A tais decisões estão sempre associados um grau de incerteza e, conseqüentemente, uma probabilidade de erro. Exemplo: Teste sobre medicamentos, experimentos agrícolas, análise financeira, consumo de energia etc. 8

12 APRESENTAÇÃO DE DADOS Técnicas que permitem detectar e corrigir erros e inconsistências ocorridos durante um processo de coleta de dados e determinar as principais características destes dados. Grupamento de dados; Construção de distribuições de freqüência; Gráficos. 9

13 Tipos de Variáveis Qualitativa Nominal Região de Procedência Ordinal
Educação, Classe Social Quantitativa Discreta Número de Filhos Contínua Peso de Indivíduos, Salários em R$

14 GRUPAMENTO DE DADOS Alturas, expressas em centímetros de 30 atletas de um clube. 11

15 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Alturas em cm. de 30 atletas 13

16 GRÁFICOS 15

17 GRÁFICOS 16

18 GRÁFICOS 17

19 GRUPAMENTO DE DADOS Número de filhos em 25 famílias observadas 12

20 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Número de filhos em 25 famílias observadas 14

21 GRÁFICOS 18

22 GRÁFICOS 19

23 Análise Exploratória de Dados
Capítulo 2 - Algumas medidas associadas a variáveis Quantitativas Medidas de Posição Medidas de Dispersão Outra Estratégia de Análise Desenho Esquemático

24 Estatísticas Descritivas
Tamanho da Amostra Média Mediana Moda Média Geométrica Variância Desvio-padrão Erro-padrão Mínimo Máximo Amplitude Quartil Inferior Quartil Superior Intervalo Inter-quartil Assimetria “Skewnwss” Assimetria Padronizada Curtose “Kurtosis” Curtose Padronizada Coeficiente de Variação Somatório

25 Estatística Clássica Suposições Probabilísticas das Variáveis Envolvidas Declarações sobre os Parâmetros ou Modelo Utilizado Noções Assintóticas de Consistência Variância “Grandes Amostras” Eficiência “USE A ESTATÍSTICA COMO O BÊBADO USA OS POSTES - MAIS PELO APOIO QUE PELA ILUMINAÇÃO” Andew Lang

26 Análise Exploratória de Dados
Tukey J. W. (1977) Técnicas Visuais Dados = Modelo + Resíduos Modelo = parte Suave Resíduos = parte Grosseira

27 Análise Exploratória de Dados
Ferramentas Principais Ramo-e-folhas - “Stem-and-Leaf” Esquema de cinco números - “5-number summary” Desenho Esquemático - “Box-Plot”

28 Ramo-e-folhas Apresentação RAMO - à esquerda da linha vertical
FOLHAS - à direita da linha vertical Vantagem sobre a Tabela de Freqüência: Não perdemos informação Número de linhas é equivalente ao número de classes

29 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Alturas em cm. de 30 atletas 13

30 RAMO-E-FOLHAS 20

31 CONSTRUÇÃO DE DISTRIBUIÇÕES DE FREQÜÊNCIA
Número de filhos em 25 famílias observadas 14

32 RAMO-E-FOLHAS 21

33 Esquema ou Resumo de 5 Números
Sugestão (Tukey) (i) a mediana (ii) os extremos (mínimo e máximo) (iii) os quartis ou juntas (inferior e superior) A Mediana é uma Medida Resistente, não é afetada por valores extremos. a Média amostral e o Desvio-padrão são afetados por valores extremos não temos idéia quanto a simetria da distribuição dos dados

34 Desenho Esquemático “UM DESENHO ESQUEMÁTICO OU GRÁFICO DO ESQUEMA DE 5 NÚMEROS VALE MAIS QUE 1000 PALAVRAS” OUTLIERS valores abaixo da J1 - 3/2 dJ valores acima da J3 + 3/2 dJ, onde J1 = 1º quartil, J3 = 3º quartil e dJ = J3 - J1

35 Exemplo

36 Exemplo

37 Análise Exploratória de Dados
Capítulo 3 - Análise Bidimensional Variáveis Multidimensionais Independência de Variáveis Medidas de Dependência entre Duas Variáveis Diagrama de Dispersão Coeficiente de Correlação

38 Variáveis Multidimensionais
Em muitas situações observamos duas ou mais características simultaneamente, para analisar o seu comportamento. A DISTRIBUIÇÃO CONJUNTA das freqüências será um poderoso instrumento na compreensão dos dados.

39 Distribuição Conjunta
Distribuição Conjunta do Grau de Instrução e Região

40 Independência de Variáveis
Um dos principais objetivos de uma distribuição conjunta é descrever a ASSOCIABILIDADE existente ENTRE DUAS VARIÁVEIS, isto é, queremos conhecer o GRAU DE DEPENDÊNCIA entre elas, de modo que possamos prever melhor o resultado de uma delas quando conhecemos a realização da outra.

41 Independência de Variáveis
Distribuição conjunta das freqüências e porcentagens segundo sexo e curso

42 Medidas de Dependência entre Duas Variáveis
coeficientes de associação ou correlação coeficiente de contingência de Karl Pearson

43 Diagramas de Dispersão

44 Coeficiente de Correlação

45 Origem do Termo “Regressão”

46 Probabilidades Capítulo 4 - Probabilidades Introdução
Algumas Propriedades Probabilidade Condicional e Independência Teorema de Bayes

47 Probabilidades Uma das principais ferramentas da estatística é a probabilidade, que teve seu início formal com a escolha de jogos no início do século XVII. Para seu entendimento necessitamos de alguns conhecimentos BÁSICOS que seguem:

48 Experimento É qualquer processo ou estudo de coletar dados revelantes, os quais exibem variações em seus resultados, resultados estes desconhecidos de ante mão. Ex. Lançamento de um dado honesto e observar a cada arremesso a face voltada para cima.

49 Espaço Amostral “W” O espaço amostral “W”, é o conjunto de todos os resultados possíveis, elementares e indivisíveis do experimento, onde cada resultado é um evento simples. Ex. Lançamento de um dado honesto W = { f1, f2, f3, f4, f5, f6 }

50 Evento Um evento, indicado pelas letras A, B, ..., é qualquer subconjunto do espaço amostral “W”. Exemplo 1: A ocorrência de face impar, no lançamento de um dado honesto. evento A = { f1, f3, f5 } Exemplo 2: A ocorrência de face par, no lançamento de um dado honesto. evento B = { f2, f4, f6 }

51 s-álgebra Uma s-álgebra é uma classe de subconjuntos do espaço amostral, W, satisfazendo os seguintes axiomas:

52 Definição de Probabilidade
Definição Clássica Definição Freqüentista Definição Geométrica Definição Axiomática

53 Definição Axiomática

54 Algumas Propriedades

55 Probabilidade Condicional

56 Teorema da Probabilidade Total

57 Teorema de Bayes

58 Regra da Multiplicação

59 Independência

60 Variável Aleatória Uma variável aleatória, indicada por X, é uma função com domínio o espaço amostral e contradomínio o conjunto dos números Reais, tal que, o evento [ X £ x ] pertence a s-álgebra para todos os valores de x que pertencem aos no.s reais.

61 Função Distribuição Uma Função Distribuição, indicada por F(x), é uma função, com domínio os Reais e contradomínio o intervalo [0,1], satisfazendo as seguintes propriedades: F(x) é não decrescente; F(x) é contínua à direita; F(-¥) = 0 e F(¥) = 1

62 Função Distribuição Acumulada
Dada a variável aleatória X, chamaremos de função distribuição acumulada a função

63 O Conceito de Variável Aleatória Discreta
Uma variável aleatória X, é dita discreta, se ela assume um número finito ou infinito enumerável. A função, indicada por p(x), nós chamamos função de probabilidade da variável aleatória discreta X.

64 Função de Probabilidade

65 O Conceito de Variável Aleatória Contínua
Uma variável aleatória, indicada por X, é dita contínua, se existe uma função f(x), chamada função densidade de probabilidade, tal que:

66 Função Densidade de Probabilidade

67 Valor Esperado de uma Variável Aleatória
Dada uma variável aleatória X, chamamos valor médio ou esperança matemática de X ao valor

68 Valor Esperado de Uma Função de uma Variável Aleatória X “g(X)”
Dada a variável aleatória X, chamamos esperança ou valor esperado da função g(x) ao valor:

69 Propriedades Se g(x) = aX + b, E[g(x)] = E(aX + b) = a E(X) + b
Se g(x) =[X - E(X)]2 E[g(x)] = Var(X)

70 Alguns Modelos Discretos
Distribuição Uniforme Discreta Distribuição Bernoulli Distribuição Binomial Distribuição Hipergeométrica Distribuição Geométrica Distribuição Binomial Negativa Distribuição Poisson

71 Alguns Modelos Contínuos
Uniforme Contínua Normal Exponencial Gama Beta Cauchy Lognormal Dupla-exponencial Weibull Logística Pareto Gumbel (Valor Extremo) t-Student’s F-Snedecor’s Qui-quadrado Normal Bivariada

72 Variáveis Aleatórias Multidimensionais
Capítulo 7 - Variáveis Aleatórias Multidimensionais Distribuição Conjunta Distribuições Marginais e Condicionais Funções de Variáveis Aleatórias Covarância de Duas Variáveis Aleatórias Variáveis Contínuas

73 Distribuição Conjunta
Em muitos experimentos, a um mesmo ponto amostral w,atribuímos valores de duas ou mais variáveis aleatórias. Ex. Suponha que queremos estudar a composição de famílias com 3 crianças, quanto ao sexo. X = número de meninos Y = 1 (se for homem) e 0 (se for mulher) Z = no. de vezes que houve variação do sexo W = número de meninas

74 Função Densidade Conjunta

75 Tabela de Probabilidades

76 Distribuições Marginais

77 Distribuições Condicionais

78 Distribuições Independentes

79 Covariância de duas variáveis aleatórias

80 Coeficiente de Correlação de X e Y

81 Referências Bibliográficas
Montgomery, Douglas C. & Runger, George C. Applied statistics and probability for engineers. New York, Wiley, 1994. Montgomery, Douglas C., Introduction to statistical quality control. New York, Wiley, 1991. Bussab, Wilton O., Estatística Básica. 4.ed. São Paulo, 1987

82 Variáveis Aleatórias Discretas
Capítulo 5 - Variáveis Aleatórias Discretas O Conceito de VA. Discreta Valor Esperado de uma va. Algumas Propriedades da Esperança Função Distribuição Acumulada Alguns Modelos Probabilísticos

83 Introdução à Inferência Estatística
Capítulo 8 - Introdução à Inferência Estatística População e Amostra Problemas de Inferência Como Selecionar Uma Amostra Amostragem Casual Simples Estatística e Parâmetros Distribuições Amostrais Distribuição Amostral da Média Distribuição Amostral da Proporção Outras Distribuições Amostrais

84 Estimação Capítulo 9 - Estimação Primeiras Idéias
Propriedades dos Estimadores Estimadores de Mínimos Quadrados Estimadores de Máxima Verossimilhança Intervalos de Confiança

85 Teste de Hipóteses Capítulo 10 - Testes de Hipóteses Introdução
Procedimento Geral do Teste de Hipóteses Passos para Construção de um Teste de Hipóteses Testes sobre a Média de uma População Poder de Um Teste Teste para a Proporção Nível Descritivo ( P-valor )

86 Outros Tópicos Capítulo - Outros Tópicos
Algumas Distribuições Importantes a distribuição Qui-Quadrado a distribuição F (Snedcor) Testes para a Média de uma Normal Testes para a Variância de uma Normal Comparação das Médias de duas populações Normais Comparação das Variâncias de duas populações Normais Observações Emparelhadas


Carregar ppt "Estatística Básica Jorge Festa 2. Estatística Básica Jorge Festa 2."

Apresentações semelhantes


Anúncios Google