Prof. Cezar Augusto Cerqueira – UPE/UNICAP

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Prof. Cezar Augusto Cerqueira – UPE/UNICAP
Prof. Darlan Marcelo Delgado
Cássio Luís Fernandes de Oliveira
A CARTOGRAFIA TEMÁTICA E A ESTATÍSTICA
ESTIMAÇÃO.
Introdução à Estatística
Capítulo 6 Estimativas e Tamanho de Amostras
Métodos Quantitativos
MEDIDAS E INCERTEZAS O Que é Medição?
Análise de Dados.
Métodos Quantitativos
Estatística Descritiva
ESTATÍSTICA: O estudo numérico dos fatos sociais
Estatística e Probabilidade
Estatística Descritiva
Estatística Descritiva (I)
MBA em Gestão de Empreendimentos Turísticos
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Passo 4: Definição do número de classes
ESTATÍSTICA DECRITIVA
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
Amostragem Pontos mais importantes:
Métodos Quantitativos
Site: Estatística Prof. Edson Nemer Site:
Introdução à Estatística
Regressão Linear.
Medidas de localização
Ferramentas apresentadas
Estudo dos gráficos Objetivos: Como construir um gráfico.
Estatística Descritiva
Análise de Dados Ciências Contábeis.
Estatística.
Professor Antonio Carlos Coelho
CONTROLE ESTATÍSTICO DA QUALIDADE
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
Regressão e Previsão Numérica.
MÉTODO CIENTÍFICO Hipóteses (conjecturas, modelos, teoria)
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
Definição de Estatística
ESTATÍSTICA - Princípios
Estudo dos gráficos Objetivos: Como construir um gráfico.
Separatrizes Quartis Decis Percentis TIPOS:
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
DISTRIBUIÇÕES DE PROBABILIDADE
Associação entre duas variáveis: análise bidimensional
Estatística Aplicada a Administração
Metodologia da Pesquisa em Ensino de Ciências I
Introdução à Estatística
O QUE SÃO... FERRAMENTAS DA QUALIDADE
ANÁLISE DE DADOS EM BIOLOGIA Prof. Ronei Baldissera.
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
ANÁLISE DE DADOS EM BIOLOGIA
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
Estimação: Estimativa Pontual Estimativa Intervalar
Regressão Linear Simples
1 Estatística Descritiva (I). 2 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação.
CEPZ1 – 2015 – AULA 06 PROFESSORA: BRUNA CAVALLINI E RODRIGUES
Métodos Quantitativos Prof. Edson Nemer Site:
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Módulo 1 Estatística Básica.
Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.
Aula 4 Bioestatística Probabilidade para variáveis aleatórias.
Autor : Lênin Charqueiro. Pelotas,8 de março de
Regressão Linear (aula 14 – Parte 2).
INFERÊNCIA ESTATÍSTICA
Transcrição da apresentação:

Prof. Cezar Augusto Cerqueira – UPE/UNICAP CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICA Prof. Cezar Augusto Cerqueira – UPE/UNICAP

ESTATÍSTICA: UMA VISÃO GERAL Ciência de coletar, organizar, interpretar dados Visando...tomada de decisões ESTATÍSTICAS Somos bombardeados por elas a todo momento Números, informações, indicadores... Sociais, econômicos, demográficos, gerenciais

A estatística reúne métodos para:  Coleta Processamento Análise e interpretação de dados Informações numéricas analisadas servem de base para tomada de decisões; As estatísticas nos auxiliam a entender melhor os fenômenos em geral;

Métodos Estatísticos: Importância - profissional Ferramenta fundamental no processo de solução de problemas Gestores modernos lidam com grande quantidade de informação. Auxílio na determinação de planos de ação para resolução de problemas Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as informações Tirar conclusões sobre grandes populações com base em amostras Melhorar processos Obter previsões confiáveis

Métodos Estatísticos: Importância - empresa Aumento na competitividade Eliminação de desperdícios Redução na necessidade de inspeção Aumento no grau de satisfação dos clientes

PROCESSO Equipamentos Insumos Métodos ou procedimentos Condições ambientais Pessoas Informações do processo Fabricação de um bem ou fornecimento de um serviço Uma Ferramenta importante: o fluxograma

INFERÊNCIA ESTATÍSTICA PROBABILIDADE Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório. INFERÊNCIA ESTATÍSTICA Trata da análise e interpretação de dados amostrais O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma.

População Amostra Inferência Descrição Análise

Coleta de dados Dados: base para tomada de decisões Inteligência (Projetos) Conhecimento (Tomada de decisão) Informação (Modelos Probab - Inferencia)) Dados Observados (análise exploratória)

COLETA DE DADOS: OBJETIVOS Desenvolvimento de novos produtos Pesquisas de mercado Inspeção Classificação de produtos/insumos Controle e acompanhamento de processos produtivos Verificar se o processo está sob controle; quantificar a variabilidade; verificar se o processo é atende a especificações. Melhoria de processos produtivos Produtos que não satisfazem à meta Melhoria frente a novas exigências e necessidade de sobrevivencia da empresa.

Indivíduo e Variável Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc) Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.

OBSERVAÇÃO versus EXPERIMENTO Estudo observacional Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas Experimento Impõe algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas

TIPOS DE DADOS: VARIÁVEIS QUALITATIVAS Nominais (sexo, região...) Ordinais (grau de instrução) QUANTITATIVAS Discretas (contagens) Ex: número de itens defeituosos; número de arranhões em certa peça; número de acidentes de trabalho no mês. Contínuas (mensurações em escala contínua) Diâmetro de uma peça; rendimento de uma reação química; tempo gasto na execução de uma tarefa; espessura de uma peça.

O Banco de Dados

Levantamentos amostrais População Grupo inteiro de indivíduos sobre o qual se deseja informações Amostra Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.

Amostragem

ESTRATIFICAÇÃO Agrupamento da informação (dados) sob vários pontos de vista para dar foco à ação. Equipamentos, insumos, pessoas, métodos, medidas, condições ambientais. Tempo (manhã, tarde, noite) Local (linhas de produção, regiões) Tipo (fornecedor) Indivíduo(operadores)

Gráfico de Pareto Princípio de Pareto (80/20) Em torno de 80% dos problemas vem de 20% das causas Atacar 1/5 das causas solucionaria 4/5 dos problemas

Distribuições de frequência: Gráfico de Pareto

Gráfico de Pareto Para causas: equipamentos, insumos, informação do processo ou medidas, condições ambientais, pessoas, métodos ou procedimentos. Para efeitos: qualidade, custo, entrega, moral, segurança, etc. Expresso em unidades monetárias Gráfico de Pareto estratificado (por operador, etc) Comparações tipo antes e depois Desdobramento de gráficos de Pareto (causas e sub-causas)

Organização e Análise de dados

FERRAMENTAS GRÁFICAS SIMPLES: VARIÁVEIS CONTÍNUAS Diagrama de Pontos Considere os dados: 3 4 4,5 4,5 6 8 Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações

GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas

Apresentação de Dados Distribuições de frequências: caso nominal  

VARIABILIDADE Sempre presente em processos de produção ou serviços É afetada por diversos fatores Produtos defeituosas são produzidos devido à presença da variabilidade A redução da variabilidade implica na redução do número de itens defeituosos Causas comuns (inerentes) e causas especiais Processo sob controle: atuam apenas as causas comuns

Gráfico de Sequencias no tempo Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:

HISTOGRAMA Distribuição: modelo estatístico para o padrão de ocorrencia dos valores de determinada população O histograma é um gráfico de barras no qual o eixo horizontal é subdividido em vários pequenos intervalos, sendo construída uma barra vertical, de área proporcional ao número de observações na amostra cujos valores pertencem ao intervalo correspondente. As informações são dispostas de modo a permitir a possível visualização da forma da distribuição dos dados e a percepção do valor central e da dispersão em torno desta valor central.

Distribuições de frequência: Caso contínuo - Histograma As distribuições podem diferir em: Locação (centralidade, média, mediana) Variabilidade (desvio padrão, variância) Forma (assimetria)

Um procedimento para construção de um Histograma (variáveis contínuas) Coletar “n” observações Escolher o número de intervalos (k) Calcular a amplitude total dos dados (R) R = Max - Min Calcular o comprimento de cada intervalo (amplitude de classe, h) h=R/k Arredondar convenientemente h Calcular os limites de cada intervalo Construir a tabela de frequencias, que deve conter: Limites de cada intervalo; ponto médio; frequencia simples (fi); frequencia relativa; frequencia acumulada (simples e relativa) Desenhar o Histograma

Distribuições de frequência variável contínua: Histograma Dados relativos ao comprimento de uma amostra de 100 parafusos

Distribuições de frequência: Caso discreto Dados referentes ao número de defeitos encontrados em uma amostra de 90 chapas de aço

Tipos de Histogramas: simétrico Valor médio no centro Frequencia mais alta no centro diminuindo gradualmente de forma simétrica em direção aos extremos Média=mediana=moda

Tipos de Histogramas: assimétrico positivo freqüência decresce bruscamente em um dos lados e de forma gradual no outro Média fora do centro do histograma cauda mais longa em um dos lados Média>mediana; média>moda

Tipos de Histogramas: despenhadeiro Frequencia diminui de forma abrupta de um ou dos 2 lados Processo não atende às especificações

Tipos de Histogramas: dois picos Mistura de dados com médias diferentes Dados de 2 máquinas ou 2 turnos, etc

Tipos de Histogramas: ilhas isoladas Erros de medição, erros de registro ou transcrição dos dados Anormalidades temporárias no processo

Tipos de Histogramas: achatado (platô) Mistura de várias distribuições com médias diferentes Classes centrais possuem aproximadamente a mesma frequência.

Histograma: estratificação Quando estratificado o Histograma pode exibir diferentes distribuições para distintos fatores. A existencia de diferentes distribuições podem estar contribuindo para aumentar a variabilidade do processo.

Histogramas e limites de especificação

Resumindo dados: análise descritiva e exploratória “Um estatístico é um sujeito que se está com a cabeça num forno e os pés enterrados no gelo, ainda diz que na média a temperatura está ótima”.( K. Dunnigan)

RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO CENTRO DOS DADOS Média Aritmética Mediana Valor do meio em uma sequencia ordenada de dados Moda Valor mais frequente de uma série de dados Dados agrupados Dados brutos “n” ímpar “n” par Dados agrupados

OUTRAS MEDIDAS DE LOCAÇÃO: Quartis Primeiro Quartil 25% das observações são menores e 75% maiores Segundo Quartil (Mediana) Terceiro Quartil

VARIABILIDADE Medidas de tendência central podem mascarar importantes aspectos em uma série de dados Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas. matérias-primas, condições de equipamentos, métodos de trabalho, condições ambientais e operadores

VARIABILIDADE: Problematizando Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada: Turma A: 3 4 5 6 7 Turma B: 1 3 5 7 9 Turma C: 5 5 5 5 5 Em termos de tendência central como podemos analisar os grupos ? E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade? Façamos uma investigação gráfica do fenômeno. Como obter uma medida de variabilidade média para os grupos?

MEDINDO A VARIABILIDADE Variância Populacional Variância Amostral Desvio Padrão Corresponde à raiz quadrada da variância

MEDINDO A VARIABILIDADE: outras medidas Amplitude Total Xmax-Xmin Amplitude Interquartil J = Q3–Q1 Coeficiente de variação Comparação de grupos muito diferentes Comparação de dispersão com escalas diferentes

ESTUDO DA FORMA: ASSIMETRIA Curva Simétrica

ESTUDO DA FORMA: ASSIMETRIA Assimetria Negativa Simetria Assimetria Positiva

Gráfico Box-Plot Índice de Desenvolvimento Humano no Brasil, por Região - 2000 Juntas: Q1,Q2,Q3 Extremos: E1 e E2

Explorando a relação entre variáveis

EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS Mensurar o tipo e grau de associação entre duas ou mais variáveis. Foco inicial: duas variáveis quantitativas Etapas: Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de Pearson,

Diagrama de dispersão Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo

Construção do diagrama de dispersão Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas; Registrar os dados em uma tabela; Escolher uma variável a ser representada no eixo ‘x’ (preditora) e outra variável em ‘y’ (dependente); Determinar os valores máximo e mínimo para cada variável; Escolher as escalas para ‘x’ e ‘y’ Representar no gráfico os pares de observações (x,y). Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc

Interpretação de diagramas de dispersão Correlação positiva: à medida que x aumenta, y também aumenta.

Interpretação de diagramas de dispersão Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade.

Interpretação de diagramas de dispersão Ausência de correlação: os valores das variáveis não estão relacionados.

Interpretação de diagramas de dispersão Moderada correlação negativa: y tende a diminuir com o aumento de x.

Interpretação de diagramas de dispersão Forte correlação negativa: à medida que x aumenta, y diminui.

Interpretação de diagramas de dispersão Outliers: São observações extremas não condizentes com o restante dos dados.

Interpretação de diagramas de dispersão Exemplo: O diagrama ao lado mostra forte correlação negativa entre as variáveis Tensão e Variação no Corte.

Estratificação de Diagramas de Dispersão Em muitos casos a estratificação de um diagrama de dispersão permite a descoberta da causa de um problema.

CORRELAÇÃO: diagrama de dispersão Gráfico que representa no plano cartesiano duas variáveis quantitativas Ferramenta simples que permite aprofundar o estudo da associação entre 2 variáveis. Como ilustração, considere a tabela abaixo, que representa o tempo de serviço e o volume de vendas semanais de uma amostra de 5 vendedores de determinado produto: 55 50 42 40 35 Vendas 8 6 4 3 1 Tempo (anos)

Diagrama de Dispersão

CORRELAÇÃO Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva. Quando as variáveis crescem em sentidos opostos temos uma correlação negativa. Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita. Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.

COEFICIENTE DE CORRELAÇÃO LINEAR: FÓRMULA DE CÁLCULO onde: Lembre que: -1£ rxy £ 1

COEFICIENTE DE CORRELAÇÃO LINEAR: CÁLCULO PARA O EXEMPLO ANTERIOR Indica uma associação forte e positiva !! CUIDADO!!! Correlação não implica em relação de causa efeito. !!

RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS Comparação do Comportamento de uma Variável Contínua por Grupos Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via: Diagrama de Pontos Gráficos tipo Box-Plot Gráfico Ramo-e-Folhas

RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS Tabela de contingência a 2 fatores Variável dependente e explicativa Medir associações Encontrar distribuições percentuais Distribuições marginais Distribuições condicionais

Noções de Probabilidade e Inferência: mensurando a incerteza Noções de Probabilidade e Inferência: mensurando a incerteza... O Acaso existe? “ O acaso não existe: tudo é provação, ou punição, ou recompensa, ou previdencia”. (Voltaire) “O acaso é a causa ignorada de um efeito conhecido” (Voltaire)

NOÇÕES DE PROBABILIDADE Aleatoriedade Experimentos aleatórios Resultados imprevisíveis regularidade Probabilidade chance de ocorrência de um evento aleatório. idealização do que aconteceria se feita uma sequencia longa de repetições Proporção de vezes em quem um evento ocorre em uma sequencia longa de repetições do experimento Independencia Resultado de uma tentativa não deve influenciar o resultado de outra

Modelos Probabilísticos para variáveis Discretas: Distribuição Binomial Considera n repetições independentes de um experimento de Bernoulli. Exemplos: Jogue uma moeda 10 vezes. Seja X=nº de caras obtido Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas. Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado. Seja a VA X=nº de sucessos obtidos. Portanto: E(X)=np e V(X)=np(1-p)

Modelos Probabilísticos para variáveis Discretas: Distribuição de Poisson Largamente empregada quando se deseja contar o número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume. Exemplos: Fórmula: Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo. Número de falhas em um computador em um dia de operação. Número de defeitos em uma chapa de metal de 1 m2 produzida.

Modelos Probabilísticos para variáveis contínuas: Distribuição Normal Representação Gráfica: A distribuição Normal é um modelo estatístico que fornece uma base teórica para o estudo do padrão de ocorrência dos elementos de várias populações de interesse. µ é a média da distribuição (centro) ơ é o desvio padrão da distribuição (dispersão)

Curva Normal Para calcular probabilidades associadas a uma variável Normal de média µ e desvio padrão ơ, (N(µ,ơ)), deve ser utilizada a variável Normal padronizada ou reduzida: A média de Z é zero e seu desvio padrão é 1.

X µ-3ơ µ-2ơ µ-ơ µ µ+ơ µ+2ơ µ+3ơ z -3 -2 -1 1 2 3

Distribuição Normal: uso da tabela P(0<Z<1) P(Z<-1) 0,3413 0,5+0,3413 P(Z>1) Uso inverso da Tabela 0,5-0,3413

Curva Normal Propriedades: 1) A área sob a curva é igual a 1. 2) A curva é simétrica em relação à sua média. 3) f(x) tende para 0 quando X tende para +/- ¥ 4) A curva possui um ponto máximo em x = m. Intervalo Probabilidade (Área) Interna Externa (µ±ơ) 68,3% 31,7% (µ±2ơ) 95,5% 4,5% (µ±3ơ) 99,73% 0,27

DISTRIBUIÇÕES AMOSTRAIS Lei dos grandes números – Extraia observações aleatórias e independentes de uma população de média  À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população . Características de uma população podem ser descritas pelos parâmetros. Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra. As distribuições amostrais podem ser vistas como: Distribuição de probabilidades de uma estatística amostral Indicam como variam as estatísticas devido a variações no processo de amostragem.

DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média m e desvio padrão s. A média da distribuição amostral de médias é igual à média populacional O desvio-padrão da distribuição amostral de médias é dada por: A distribuição amostral de médias é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1).

DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse. A média da distribuição amostral da proporção é igual à proporção populacional. O desvio-padrão da distribuição amostral da proporção é dado por: A distribuição amostral da proporção é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1).

INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa. Formato: estimativa +/- margem de erro Nível de confiança: probabilidade de que o método forneça uma resposta correta. A média amostral varia de amostra para amostra Para levar em consideração esta fato devemos construir um intervalo de confiança para a verdadeira média populacional, com base na média amostral. Tal intervalo tem uma probabilidade (nível de confiança) de estar estimando corretamente (conter) o parâmetro.

INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão: