A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Prof. Cezar Augusto Cerqueira – UPE/UNICAP

Apresentações semelhantes


Apresentação em tema: "Prof. Cezar Augusto Cerqueira – UPE/UNICAP"— Transcrição da apresentação:

1 Prof. Cezar Augusto Cerqueira – UPE/UNICAP
CURSO DE ESTATÍSTICA BÁSICA Prof. Cezar Augusto Cerqueira – UPE/UNICAP

2 Incerteza e Probabilidade
Entendimento de fenômenos aleatórios; presença do acaso; raciocínio diferente do lógico matemático, dedutivo. Probabilidade –sec. XVI Cardano; sec. XVII – Pascal e Fermat (1654); jogos de azar. Huyghens (1657); Bernoulli (1713); DE Moivre (1733); Bayes (1763); Laplace (1812); Gauss (1823), entre outros

3 Incerteza e Probabilidade
Escolhas entre diferentes possibilidades A aleatoriedade está presente em diversos fenômenos Demografia: nascimentos, óbitos Saúde: ocorrências de doenças; epidemias... Direito: criminalidade Engenharia: resistências de peças, qualidade, tempo de vida de peças, problemas de trânsito, etc O mundo é probabilístico Vivemos rodeados por fenômenos casuais ou aleatórios.

4 ESTATÍSTICA: UMA VISÃO GERAL
Ciência de coletar, organizar, interpretar dados Visando...tomada de decisões ESTATÍSTICAS Somos bombardeados por elas a todo momento Números, informações, indicadores... Sociais, econômicos, demográficos, gerenciais

5 ESTATÍSTICA: UMA VISÃO GERAL
Compreensão a partir dos dados Origens “status”; Estado; estado das coisas. Evolução Contagens de habitantes; terras, tributação; guerras; religião. Ciências físicas Ciências agrárias, biológicas, comportamentais Decisões econômicas, financeiras, empresariais

6 ESTATÍSTICA: POR QUE CONHECÊ-LA?
Gestores modernos lidam com grande quantidade de informação. Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as informações Tirar conclusões sobre grandes populações com base em amostras Melhorar processos Obter previsões confiáveis

7 ESTATÍSTICA: FATORES IMPULSIONADORES
Necessidade de dados Desenvolvimento da matemática Desenvolvimento da informática

8 A estatística reúne métodos para:
 Coleta Processamento Análise e interpretação de dados Informações numéricas analisadas servem de base para tomada de decisões; As estatísticas nos auxiliam a entender melhor os fenômenos em geral;

9 GRANDES ÁREAS EM ESTATÍSTICA:
ESTATÍSTICA DESCRITIVA PROBABILIDADES INFERÊNCIA

10 ESTATÍSTICA DESCRITIVA
Tabelas Gráficos Medidas Técnicas Visuais Descrição Organização Resumo

11 INFERÊNCIA ESTATÍSTICA
PROBABILIDADE Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório. INFERÊNCIA ESTATÍSTICA Trata da análise e interpretação de dados amostrais O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma.

12 População Amostra Inferência Descrição Análise

13 PRODUÇÃO DE DADOS: UMA PALAVRA SOBRE FONTES DE DADOS
Obter dados já publicados por fontes governamentais, industriais ou individuais. Planejar e executar um experimento para obter os dados necessários. Planejar e executar uma pesquisa ou levantamento de campo (estudo observacional).

14 Indivíduo e Variável Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc) Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.

15 OBSERVAÇÃO versus EXPERIMENTO
Estudo observacional Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas ou sem modoficar os sujeitos objetos de estudo. Experimento Impõe-se algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas

16 Levantamentos amostrais
População Grupo inteiro de indivíduos sobre o qual se deseja informações Amostra Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.

17 Amostragem

18 Aleatorização e estrtégias amostrais
Amostra não-probabilística Auto-seleção, conveniência, cotas, etc Amostra probabilística Cada membro tem uma chance conhecida (mas não necessariamente igual de ser selecionada) Amostra Aleatória Simples Toda amostra possível de tamanho n tem igual chance de ser selecionada.

19 Aleatorização e estratégias amostrais
Amostragem Sistemática Sorteamos um ponto inicial e, em seguida, cada kº elemento fica automaticamente selecionado (por exemplo o 10º) Amostragem Estratificada Subdividimos a população em, pelo menos, dois subgrupos (estratos) de modo que os elementos do mesmo subgrupo compartilhem as mesmas características e, em seguida, extraímos uma amostra em cada subgrupo. Amostragem por Conglomerado Inicialmente dividimos a área da população em seções (conglomerados), depois selecionamos aleatoriamente alguns desses conglomerados e a seguir escolhemos todos (ou parte) dos membros desses conglomerados selecionados.

20 APRESENTAÇÃO DE DADOS: Tipos de variáveis
QUALITATIVAS Nominais (sexo, região...) Ordinais (grau de instrução) QUANTITATIVAS Discretas (número de defeitos) Contínuas (peso, altura...)

21 O Banco de Dados

22 GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS
Diagrama de Pontos Considere os dados: , , Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações

23 GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas

24 Distribuições de frequência: Caso contínuo - Histograma

25 Apresentação de Dados Distribuições de frequências: caso nominal

26 Distribuições de frequência: Caso discreto

27 Gráfico de Sequencias no tempo
Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:

28 Distribuições de frequência: Gráfico de Pareto

29 Gráfico de Pareto Para causas: equipamentos, insumos, informação do processo ou medidas, condições ambientais, pessoas, métodos ou procedimentos. Para efeitos: qualidade, custo, entrega, segurança, etc. Expresso em unidades monetárias Gráfico de Pareto estratificado (por operador, etc) Comparações tipo antes e depois Desdobramento de gráficos de Pareto (causas e sub-causas)

30 RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO CENTRO DOS DADOS
Média Aritmética Mediana Valor do meio em uma sequencia ordenada de dados Moda Valor mais frequente de uma série de dados Dados agrupados Dados brutos “n” ímpar “n” par Dados agrupados

31 OUTRAS MEDIDAS DE LOCAÇÃO: Quartis
Primeiro Quartil 25% das observações são menores e 75% maiores Segundo Quartil (Mediana) Terceiro Quartil

32 VARIABILIDADE Medidas de tendência central podem mascarar importantes aspectos em uma série de dados Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas. matérias-primas, condições de equipamentos, métodos de trabalho, condições ambientais e operadores

33 VARIABILIDADE: Problematizando
Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada: Turma A: Turma B: Turma C: Em termos de tendência central como podemos analisar os grupos ? E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade? Façamos uma investigação gráfica do fenômeno. Como obter uma medida de variabilidade média para os grupos?

34 MEDINDO A VARIABILIDADE
Variância Populacional Variância Amostral Desvio Padrão Corresponde à raiz quadrada da variância

35 MEDINDO A VARIABILIDADE: outras medidas
Amplitude Total Xmax-Xmin Amplitude Interquartil J = Q3–Q1 Coeficiente de variação Comparação de grupos muito diferentes Comparação de dispersão com escalas diferentes

36 ESTUDO DA FORMA: ASSIMETRIA
Curva Simétrica

37 ESTUDO DA FORMA: ASSIMETRIA
Assimetria Positiva Assimetria Negativa Média > Mediana Média < Mediana

38 Gráfico Box-Plot Índice de Desenvolvimento Humano no Brasil, por Região Juntas: Q1,Q2,Q3 Extremos: E1 e E2

39 EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS
Mensurar o tipo e grau de associação entre duas ou mais variáveis. Foco inicial: duas variáveis quantitativas Etapas: Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de Pearson,

40 CORRELAÇÃO: diagrama de dispersão
Gráfico que representa no plano cartesiano duas variáveis quantitativas Ferramenta simples que permite aprofundar o estudo da associação entre 2 variáveis. Como ilustração, considere a tabela abaixo, que representa o tempo de serviço e o volume de vendas semanais de uma amostra de 5 vendedores de determinado produto: 55 50 42 40 35 Vendas 8 6 4 3 1 Tempo (anos)

41 Diagrama de Dispersão

42 CORRELAÇÃO Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva. Quando as variáveis crescem em sentidos opostos temos uma correlação negativa. Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita. Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.

43 CORRELAÇÃO: diagrama de dispersão
Correlação Perfeita Positiva r = +1 Correlação Perfeita Negativa r = -1

44 CORRELAÇÃO: diagrama de dispersão
Correlação Forte e Positiva r = 0,97 Correlação Forte e Negativa r = -0,94

45 CORRELAÇÃO: diagrama de dispersão
Correlação Fraca r 0 Correlação Não-Linear

46 COEFICIENTE DE CORRELAÇÃO LINEAR: FÓRMULA DE CÁLCULO
onde: Lembre que: -1£ rxy £ 1

47 COEFICIENTE DE CORRELAÇÃO LINEAR: CÁLCULO PARA O EXEMPLO ANTERIOR
Indica uma associação forte e positiva !! CUIDADO!!! Correlação não implica em relação de causa efeito. !!

48 REGRESSÃO LINEAR SIMPLES
O diagrama de dispersão pode revelar importantes informações acerca da relação entre duas variáveis X e Y Quando os pontos traçados no diagrama de dispersão se agrupam em torno de uma reta, podemos obter a equação dessa reta e assim determinar um modelo matemático para a relação entre as variáveis

49 O modelo de regressão linear simples
Yi = A + BXi + ei, onde: Yi = variável dependente ou variável resposta. Xi = variável explicativa A = coeficiente linear da reta ou ponto de interseção de Y B = coeficiente angular da reta ou inclinação. ei = variável residual

50 O coeficiente linear da reta corresponde ao ponto onde a mesma corta o eixo-Y, ou seja, o ponto onde o valor da variável explicativa X é zero. A inclinação indica o quanto varia a média da variável Y para o aumento de uma unidade na variável X. A reta de regressão pode ser estimada pelo método dos mínimos quadrados, resultando na expressão:

51 Os valores dos coeficientes linear e angular resultantes desse processo de minimização podem ser escritos como: A qualidade do ajuste pode ser avaliada pelo coeficiente de determinação (R2), que mede a proporção de variação na variável dependente que pode ser explicada pelo modelo linear ajustado. R2 Î[0,1], quanto mais próximo de 1, melhor o poder explicativo do modelo.

52 RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS
Comparação do Comportamento de uma Variável Contínua por Grupos Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via: Diagrama de Pontos Gráficos tipo Box-Plot Gráfico Ramo-e-Folhas

53 RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Tabela de contingência a 2 fatores Variável dependente e explicativa Medir associações Encontrar distribuições percentuais Distribuições marginais Distribuições condicionais

54 RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Exemplo:

55 RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Exemplo: percentuais de linha

56 RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Exemplo: representação gráfica

57 NOÇÕES DE PROBABILIDADE
Lançamento de uma moeda 2 resultados possíveis: cara e coroa Equiprováveis Moeda equilibrada (honesta) Qual a probabilidade de dar cara? Experimento de lançar “n” vezes e calcular a frequencia relativa de caras. (Kerrick, Bufon) Abordagem empírica Probabilidade tende para ½.

58 NOÇÕES DE PROBABILIDADE
Modelos probabilísticos (a priori) Empirica (a partir de dados) Subjetiva Modelos Probabilísticos simples Espaço Amostral (S): conjunto de todos os resultados possíveis de um experimento aleatório. Evento: subconjunto do espaço amostral Coleção de resultados com ao menos uma característica em comum Lista de resultados e respectivas probabilidades Operações com eventos

59 PROBABILIDADE: algumas regras
1)Seja A um evento qualquer, então 0 £ P(A) £ 1. 2) Seja Ac o chamado evento complementar de A, então P(Ac) = 1 – P(A). 3) P(A È B) = P(A) + P(B) – P(A Ç B), sendo A e B eventos quaisquer. 4) P(F) = 0. 5) Se A e B são excludentes (P(A Ç B)=F), então: P(A Ç B) = 0.

60 NOÇÕES DE PROBABILIDADE: probabilidade condicional
A probabilidade de B, sendo A conhecido é dada por: Dois eventos A e B são independentes se:

61 Variáveis Aleatórias Discretas - contagem Contínuas - medição
São variáveis numéricas cujos resultados podem variar de uma realização para outra do experimento. Tipos Discretas - contagem Contínuas - medição

62 Variáveis Aleatórias Discretas: distribuição de probabilidades
Valores de X e respectivas probabilidades: Média Valor esperado): Variância: Pn ...... p3 p2 p1 P(X) Xn X3 X2 X1 X

63 Modelos Probabilísticos para variáveis Discretas: Distribuição de Bernoulli
Experimentos com apenas 2 resultados possíveis: Sucesso e fracasso. Lançamento de uma moeda Uma peça é escolhida de um lote e classificada como defeituosa ou perfeita. Um indivíduo é selecionado e pergunta-se se é ou não favorável ao desarmamento.

64 Modelos Probabilísticos para variáveis Discretas: Distribuição de Bernoulli
Seja p=Prob. de Sucesso (1-p)=Prob. de fracasso Definimos a VA X com valores: 1 se ocorre sucesso 0 se ocorre fracasso Distribuição de Probabilidades de X: E(X)=p e V(X)=p(1-p) 1 P 1-p p(x) total X

65 Modelos Probabilísticos para variáveis Discretas: Distribuição Binomial
Considera n repetições independentes de um experimento de Bernoulli. Exemplos: Jogue uma moeda 10 vezes. Seja X=nº de caras obtido Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas. Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado. Seja a VA X=nº de sucessos obtidos. Portanto: E(X)=np e V(X)=np(1-p)

66 Modelos Probabilísticos para variáveis Discretas: Distribuição de Poisson
Largamente empregada quando se deseja contar o número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume. Exemplos: Fórmula: Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo. Número de falhas em um computador em um dia de operação. Número de defeitos em uma chapa de metal de 1 m2 produzida.

67 Modelos Probabilísticos para variáveis contínuas: Distribuição Normal
· O exame dos gráficos de freqüência sugere a curva representativa da distribuição da variável. · As curvas de distribuição permitem o cálculo de probabilidades sobre a Variável estudada. ·    A curva normal é uma das mais importantes e utilizadas na Estatística. ·   Muitas variáveis, na prática, seguem o modelo normal. · O Modelo Normal possui dois parâmetros: a média (m) e o desvio padrão (s). ·    Notação X~N( m,s )

68 Modelos Probabilísticos para variáveis contínuas: Distribuição Normal
Representação Gráfica: Propriedades: 1) A área sob a curva é igual a 1. 2) A curva é simétrica em relação à sua média. 3) f(x) tende para 0 quando X tende para +/- ¥ 4) A curva possui um ponto máximo em x = m.

69 Distribuição Normal: uso da tabela
P(0<Z<1) P(Z>-1) 0,3413 0,5+0,3413 P(Z>1) Uso inverso da Tabela 0,5-0,3413


Carregar ppt "Prof. Cezar Augusto Cerqueira – UPE/UNICAP"

Apresentações semelhantes


Anúncios Google