A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Prof. Cezar Augusto Cerqueira – UPE/UNICAP

Apresentações semelhantes


Apresentação em tema: "Prof. Cezar Augusto Cerqueira – UPE/UNICAP"— Transcrição da apresentação:

1 Prof. Cezar Augusto Cerqueira – UPE/UNICAP
CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICA Prof. Cezar Augusto Cerqueira – UPE/UNICAP

2 ESTATÍSTICA: UMA VISÃO GERAL
Ciência de coletar, organizar, interpretar dados Visando...tomada de decisões ESTATÍSTICAS Somos bombardeados por elas a todo momento Números, informações, indicadores... Sociais, econômicos, demográficos, gerenciais

3 A estatística reúne métodos para:
 Coleta Processamento Análise e interpretação de dados Informações numéricas analisadas servem de base para tomada de decisões; As estatísticas nos auxiliam a entender melhor os fenômenos em geral;

4 Métodos Estatísticos: Importância - profissional
Ferramenta fundamental no processo de solução de problemas Gestores modernos lidam com grande quantidade de informação. Auxílio na determinação de planos de ação para resolução de problemas Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as informações Tirar conclusões sobre grandes populações com base em amostras Melhorar processos Obter previsões confiáveis

5 Métodos Estatísticos: Importância - empresa
Aumento na competitividade Eliminação de desperdícios Redução na necessidade de inspeção Aumento no grau de satisfação dos clientes

6 PROCESSO Equipamentos Insumos Métodos ou procedimentos
Condições ambientais Pessoas Informações do processo Fabricação de um bem ou fornecimento de um serviço Uma Ferramenta importante: o fluxograma

7 INFERÊNCIA ESTATÍSTICA
PROBABILIDADE Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório. INFERÊNCIA ESTATÍSTICA Trata da análise e interpretação de dados amostrais O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma.

8 População Amostra Inferência Descrição Análise

9 Coleta de dados Dados: base para tomada de decisões Inteligência
(Projetos) Conhecimento (Tomada de decisão) Informação (Modelos Probab - Inferencia)) Dados Observados (análise exploratória)

10 COLETA DE DADOS: OBJETIVOS
Desenvolvimento de novos produtos Pesquisas de mercado Inspeção Classificação de produtos/insumos Controle e acompanhamento de processos produtivos Verificar se o processo está sob controle; quantificar a variabilidade; verificar se o processo é atende a especificações. Melhoria de processos produtivos Produtos que não satisfazem à meta Melhoria frente a novas exigências e necessidade de sobrevivencia da empresa.

11 Indivíduo e Variável Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc) Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.

12 OBSERVAÇÃO versus EXPERIMENTO
Estudo observacional Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas Experimento Impõe algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas

13 TIPOS DE DADOS: VARIÁVEIS
QUALITATIVAS Nominais (sexo, região...) Ordinais (grau de instrução) QUANTITATIVAS Discretas (contagens) Ex: número de itens defeituosos; número de arranhões em certa peça; número de acidentes de trabalho no mês. Contínuas (mensurações em escala contínua) Diâmetro de uma peça; rendimento de uma reação química; tempo gasto na execução de uma tarefa; espessura de uma peça.

14 O Banco de Dados

15 Levantamentos amostrais
População Grupo inteiro de indivíduos sobre o qual se deseja informações Amostra Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.

16 Amostragem

17 ESTRATIFICAÇÃO Agrupamento da informação (dados) sob vários pontos de vista para dar foco à ação. Equipamentos, insumos, pessoas, métodos, medidas, condições ambientais. Tempo (manhã, tarde, noite) Local (linhas de produção, regiões) Tipo (fornecedor) Indivíduo(operadores)

18 Gráfico de Pareto Princípio de Pareto (80/20)
Em torno de 80% dos problemas vem de 20% das causas Atacar 1/5 das causas solucionaria 4/5 dos problemas

19 Distribuições de frequência: Gráfico de Pareto

20 Gráfico de Pareto Para causas: equipamentos, insumos, informação do processo ou medidas, condições ambientais, pessoas, métodos ou procedimentos. Para efeitos: qualidade, custo, entrega, moral, segurança, etc. Expresso em unidades monetárias Gráfico de Pareto estratificado (por operador, etc) Comparações tipo antes e depois Desdobramento de gráficos de Pareto (causas e sub-causas)

21 Organização e Análise de dados

22 FERRAMENTAS GRÁFICAS SIMPLES: VARIÁVEIS CONTÍNUAS
Diagrama de Pontos Considere os dados: , , Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações

23 GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas

24 Apresentação de Dados Distribuições de frequências: caso nominal

25 VARIABILIDADE Sempre presente em processos de produção ou serviços
É afetada por diversos fatores Produtos defeituosas são produzidos devido à presença da variabilidade A redução da variabilidade implica na redução do número de itens defeituosos Causas comuns (inerentes) e causas especiais Processo sob controle: atuam apenas as causas comuns

26 Gráfico de Sequencias no tempo
Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:

27 HISTOGRAMA Distribuição: modelo estatístico para o padrão de ocorrencia dos valores de determinada população O histograma é um gráfico de barras no qual o eixo horizontal é subdividido em vários pequenos intervalos, sendo construída uma barra vertical, de área proporcional ao número de observações na amostra cujos valores pertencem ao intervalo correspondente. As informações são dispostas de modo a permitir a possível visualização da forma da distribuição dos dados e a percepção do valor central e da dispersão em torno desta valor central.

28 Distribuições de frequência: Caso contínuo - Histograma
As distribuições podem diferir em: Locação (centralidade, média, mediana) Variabilidade (desvio padrão, variância) Forma (assimetria)

29 Um procedimento para construção de um Histograma (variáveis contínuas)
Coletar “n” observações Escolher o número de intervalos (k) Calcular a amplitude total dos dados (R) R = Max - Min Calcular o comprimento de cada intervalo (amplitude de classe, h) h=R/k Arredondar convenientemente h Calcular os limites de cada intervalo Construir a tabela de frequencias, que deve conter: Limites de cada intervalo; ponto médio; frequencia simples (fi); frequencia relativa; frequencia acumulada (simples e relativa) Desenhar o Histograma

30 Distribuições de frequência variável contínua: Histograma
Dados relativos ao comprimento de uma amostra de 100 parafusos

31 Distribuições de frequência: Caso discreto
Dados referentes ao número de defeitos encontrados em uma amostra de 90 chapas de aço

32 Tipos de Histogramas: simétrico
Valor médio no centro Frequencia mais alta no centro diminuindo gradualmente de forma simétrica em direção aos extremos Média=mediana=moda

33 Tipos de Histogramas: assimétrico positivo
freqüência decresce bruscamente em um dos lados e de forma gradual no outro Média fora do centro do histograma cauda mais longa em um dos lados Média>mediana; média>moda

34 Tipos de Histogramas: despenhadeiro
Frequencia diminui de forma abrupta de um ou dos 2 lados Processo não atende às especificações

35 Tipos de Histogramas: dois picos
Mistura de dados com médias diferentes Dados de 2 máquinas ou 2 turnos, etc

36 Tipos de Histogramas: ilhas isoladas
Erros de medição, erros de registro ou transcrição dos dados Anormalidades temporárias no processo

37 Tipos de Histogramas: achatado (platô)
Mistura de várias distribuições com médias diferentes Classes centrais possuem aproximadamente a mesma frequência.

38 Histograma: estratificação
Quando estratificado o Histograma pode exibir diferentes distribuições para distintos fatores. A existencia de diferentes distribuições podem estar contribuindo para aumentar a variabilidade do processo.

39 Histogramas e limites de especificação

40 Resumindo dados: análise descritiva e exploratória
“Um estatístico é um sujeito que se está com a cabeça num forno e os pés enterrados no gelo, ainda diz que na média a temperatura está ótima”.( K. Dunnigan)

41 RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO CENTRO DOS DADOS
Média Aritmética Mediana Valor do meio em uma sequencia ordenada de dados Moda Valor mais frequente de uma série de dados Dados agrupados Dados brutos “n” ímpar “n” par Dados agrupados

42 OUTRAS MEDIDAS DE LOCAÇÃO: Quartis
Primeiro Quartil 25% das observações são menores e 75% maiores Segundo Quartil (Mediana) Terceiro Quartil

43 VARIABILIDADE Medidas de tendência central podem mascarar importantes aspectos em uma série de dados Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas. matérias-primas, condições de equipamentos, métodos de trabalho, condições ambientais e operadores

44 VARIABILIDADE: Problematizando
Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada: Turma A: Turma B: Turma C: Em termos de tendência central como podemos analisar os grupos ? E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade? Façamos uma investigação gráfica do fenômeno. Como obter uma medida de variabilidade média para os grupos?

45 MEDINDO A VARIABILIDADE
Variância Populacional Variância Amostral Desvio Padrão Corresponde à raiz quadrada da variância

46 MEDINDO A VARIABILIDADE: outras medidas
Amplitude Total Xmax-Xmin Amplitude Interquartil J = Q3–Q1 Coeficiente de variação Comparação de grupos muito diferentes Comparação de dispersão com escalas diferentes

47 ESTUDO DA FORMA: ASSIMETRIA
Curva Simétrica

48 ESTUDO DA FORMA: ASSIMETRIA
Assimetria Negativa Simetria Assimetria Positiva

49 Gráfico Box-Plot Índice de Desenvolvimento Humano no Brasil, por Região Juntas: Q1,Q2,Q3 Extremos: E1 e E2

50 Explorando a relação entre variáveis

51 EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS
Mensurar o tipo e grau de associação entre duas ou mais variáveis. Foco inicial: duas variáveis quantitativas Etapas: Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de Pearson,

52 Diagrama de dispersão Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo

53 Construção do diagrama de dispersão
Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas; Registrar os dados em uma tabela; Escolher uma variável a ser representada no eixo ‘x’ (preditora) e outra variável em ‘y’ (dependente); Determinar os valores máximo e mínimo para cada variável; Escolher as escalas para ‘x’ e ‘y’ Representar no gráfico os pares de observações (x,y). Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc

54 Interpretação de diagramas de dispersão
Correlação positiva: à medida que x aumenta, y também aumenta.

55 Interpretação de diagramas de dispersão
Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.

56 Interpretação de diagramas de dispersão
Ausência de correlação: os valores das variáveis não estão relacionados.

57 Interpretação de diagramas de dispersão
Moderada correlação negativa: y tende a diminuir com o aumento de x.

58 Interpretação de diagramas de dispersão
Forte correlação negativa: à medida que x aumenta, y diminui.

59 Interpretação de diagramas de dispersão
Outliers: São observações extremas não condizentes com o restante dos dados.

60 Interpretação de diagramas de dispersão
Exemplo: O diagrama ao lado mostra forte correlação negativa entre as variáveis Tensão e Variação no Corte.

61 Estratificação de Diagramas de Dispersão
Em muitos casos a estratificação de um diagrama de dispersão permite a descoberta da causa de um problema.

62 CORRELAÇÃO: diagrama de dispersão
Gráfico que representa no plano cartesiano duas variáveis quantitativas Ferramenta simples que permite aprofundar o estudo da associação entre 2 variáveis. Como ilustração, considere a tabela abaixo, que representa o tempo de serviço e o volume de vendas semanais de uma amostra de 5 vendedores de determinado produto: 55 50 42 40 35 Vendas 8 6 4 3 1 Tempo (anos)

63 Diagrama de Dispersão

64 CORRELAÇÃO Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva. Quando as variáveis crescem em sentidos opostos temos uma correlação negativa. Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita. Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.

65 COEFICIENTE DE CORRELAÇÃO LINEAR: FÓRMULA DE CÁLCULO
onde: Lembre que: -1£ rxy £ 1

66 COEFICIENTE DE CORRELAÇÃO LINEAR: CÁLCULO PARA O EXEMPLO ANTERIOR
Indica uma associação forte e positiva !! CUIDADO!!! Correlação não implica em relação de causa efeito. !!

67 RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS
Comparação do Comportamento de uma Variável Contínua por Grupos Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via: Diagrama de Pontos Gráficos tipo Box-Plot Gráfico Ramo-e-Folhas

68 RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS
Tabela de contingência a 2 fatores Variável dependente e explicativa Medir associações Encontrar distribuições percentuais Distribuições marginais Distribuições condicionais

69 Noções de Probabilidade e Inferência: mensurando a incerteza
Noções de Probabilidade e Inferência: mensurando a incerteza O Acaso existe? “ O acaso não existe: tudo é provação, ou punição, ou recompensa, ou previdencia”. (Voltaire) “O acaso é a causa ignorada de um efeito conhecido” (Voltaire)

70 NOÇÕES DE PROBABILIDADE
Aleatoriedade Experimentos aleatórios Resultados imprevisíveis regularidade Probabilidade chance de ocorrência de um evento aleatório. idealização do que aconteceria se feita uma sequencia longa de repetições Proporção de vezes em quem um evento ocorre em uma sequencia longa de repetições do experimento Independencia Resultado de uma tentativa não deve influenciar o resultado de outra

71 Modelos Probabilísticos para variáveis Discretas: Distribuição Binomial
Considera n repetições independentes de um experimento de Bernoulli. Exemplos: Jogue uma moeda 10 vezes. Seja X=nº de caras obtido Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas. Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado. Seja a VA X=nº de sucessos obtidos. Portanto: E(X)=np e V(X)=np(1-p)

72 Modelos Probabilísticos para variáveis Discretas: Distribuição de Poisson
Largamente empregada quando se deseja contar o número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume. Exemplos: Fórmula: Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo. Número de falhas em um computador em um dia de operação. Número de defeitos em uma chapa de metal de 1 m2 produzida.

73 Modelos Probabilísticos para variáveis contínuas: Distribuição Normal
Representação Gráfica: A distribuição Normal é um modelo estatístico que fornece uma base teórica para o estudo do padrão de ocorrência dos elementos de várias populações de interesse. µ é a média da distribuição (centro) ơ é o desvio padrão da distribuição (dispersão)

74 Curva Normal Para calcular probabilidades associadas a uma variável Normal de média µ e desvio padrão ơ, (N(µ,ơ)), deve ser utilizada a variável Normal padronizada ou reduzida: A média de Z é zero e seu desvio padrão é 1.

75 X µ-3ơ µ-2ơ µ-ơ µ+ơ µ+2ơ µ+3ơ z -3 -2 -1 1 2 3

76 Distribuição Normal: uso da tabela
P(0<Z<1) P(Z<-1) 0,3413 0,5+0,3413 P(Z>1) Uso inverso da Tabela 0,5-0,3413

77 Curva Normal Propriedades: 1) A área sob a curva é igual a 1.
2) A curva é simétrica em relação à sua média. 3) f(x) tende para 0 quando X tende para +/- ¥ 4) A curva possui um ponto máximo em x = m. Intervalo Probabilidade (Área) Interna Externa (µ±ơ) 68,3% 31,7% (µ±2ơ) 95,5% 4,5% (µ±3ơ) 99,73% 0,27

78 DISTRIBUIÇÕES AMOSTRAIS
Lei dos grandes números – Extraia observações aleatórias e independentes de uma população de média  À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população . Características de uma população podem ser descritas pelos parâmetros. Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra. As distribuições amostrais podem ser vistas como: Distribuição de probabilidades de uma estatística amostral Indicam como variam as estatísticas devido a variações no processo de amostragem.

79 DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS
Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média m e desvio padrão s. A média da distribuição amostral de médias é igual à média populacional O desvio-padrão da distribuição amostral de médias é dada por: A distribuição amostral de médias é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1).

80 DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES
Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse. A média da distribuição amostral da proporção é igual à proporção populacional. O desvio-padrão da distribuição amostral da proporção é dado por: A distribuição amostral da proporção é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1).

81 INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido
Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa. Formato: estimativa +/- margem de erro Nível de confiança: probabilidade de que o método forneça uma resposta correta. A média amostral varia de amostra para amostra Para levar em consideração esta fato devemos construir um intervalo de confiança para a verdadeira média populacional, com base na média amostral. Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.

82 INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido
O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão:


Carregar ppt "Prof. Cezar Augusto Cerqueira – UPE/UNICAP"

Apresentações semelhantes


Anúncios Google