Prof. Cezar Augusto Cerqueira – UPE/UNICAP

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

DISTRIBUIÇÕES AMOSTRAIS
Estatística amintas paiva afonso.
Analise de Regressão Parte 2.
A CARTOGRAFIA TEMÁTICA E A ESTATÍSTICA
Introdução à Estatística
. Capítulo 1 Introdução à Estatística Capítulo 1 Introdução à Estatística Prof. Paulo Renato de Morais ESTATÍSTICA APLICADA.
Métodos Quantitativos
Estatística Descritiva
ESTATÍSTICA: O estudo numérico dos fatos sociais
Estatística e Probabilidade
Estatística Descritiva
Profa. Maria Ivanilde S. Araújo
Site: Estatística Prof. Edson Nemer Site:
Estatística Descritiva (I)
DISTRIBUIÇÕES DE PROBABILIDADES DE VARIÁVEIS ALEATÓRIAS DISCRETAS
DISTRIBUIÇÕES AMOSTRAIS
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
ESTATÍSTICA DECRITIVA
O que é Estatística, afinal de contas?
Modelos de distribuição de erros
Amostragem Pontos mais importantes:
CLASSES: SÃO INTERVALOS DE VARIAÇÃO DA VARIÁVEL.
Site: Estatística Prof. Edson Nemer Site:
Introdução à Estatística
Estatística Aula 13 Prof. Marllus Gustavo Ferreira Passos das Neves
Aplicações Estatísticas uma rápida abordagem
Regressão Linear.
Matemática Financeira
INTRODUÇÃO À BIOESTATÍSTICA
Estatística Descritiva
Análise de Dados Ciências Contábeis.
Estatística.
Professor Antonio Carlos Coelho
Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.
Regressão e Previsão Numérica.
Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.
MÉTODO CIENTÍFICO Hipóteses (conjecturas, modelos, teoria)
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
Definição de Estatística
Professor: WALDEMAR SANTA CRUZ OLIVEIRA JR CONCEITOS BÁSICOS UNIVERSIDADE FEDERAL DE PERNABUCO - UFPE Curso: TURISMO Disciplina: ESTATÍSTICA BÁSICA ET-229.
Prof. Cezar Augusto Cerqueira – UPE/UNICAP
ESTATÍSTICA - Princípios
Separatrizes Quartis Decis Percentis TIPOS:
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
DISTRIBUIÇÕES DE PROBABILIDADE
Noções de Estatística - I
Metodologia da Pesquisa em Ensino de Ciências I
Experimento Aleatório Experimento aleatório é um procedimento cujo resultado é incertoExperimento aleatório é um procedimento cujo resultado é incerto.
Descrição Bivariada Comparando Duas Distribuições
Introdução à Estatística
Unidade I ESTATÍSTICA Prof. Celso Guidugli.
DISTRIBUIÇÃO BINOMIAL
Probabilidade Análise Exploratória de Dados: Medidas de Centro
ANÁLISE DE DADOS EM BIOLOGIA Prof. Ronei Baldissera.
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
ANÁLISE DE DADOS EM BIOLOGIA
É o conjunto de métodos estatísticos usados no tratamento da variabilidade nas ciências médicas e biológicas. A Bioestatística fornece métodos para decisões,
Regressão Linear Simples
1 Estatística Descritiva (I). 2 O que é Estatística A Estatística originou-se com a coleta e construção de tabelas de dados para o governo. A situação.
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
 JERRY ADRIANE DOMINGOS  Tecnólogo em Mecânica, - UFES – 2001  Auditoria Interna da Qualidade IEL  Gestão da Qualidade – FINDES  Inspeção.
INTRODUÇÃO à ESTATÍSTICA Sérgio Mélega.
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Correlação Análise do grau de relacionamento entre duas variáveis quantitativas.
Módulo 1 Estatística Básica.
Aula 4 Bioestatística Probabilidade para variáveis aleatórias.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Distribuições de Probabilidade Camilo Daleles Rennó
Regressão Linear (aula 14 – Parte 2).
Transcrição da apresentação:

Prof. Cezar Augusto Cerqueira – UPE/UNICAP CURSO DE ESTATÍSTICA BÁSICA Prof. Cezar Augusto Cerqueira – UPE/UNICAP

Incerteza e Probabilidade Entendimento de fenômenos aleatórios; presença do acaso; raciocínio diferente do lógico matemático, dedutivo. Probabilidade –sec. XVI Cardano; sec. XVII – Pascal e Fermat (1654); jogos de azar. Huyghens (1657); Bernoulli (1713); DE Moivre (1733); Bayes (1763); Laplace (1812); Gauss (1823), entre outros

Incerteza e Probabilidade Escolhas entre diferentes possibilidades A aleatoriedade está presente em diversos fenômenos Demografia: nascimentos, óbitos Saúde: ocorrências de doenças; epidemias... Direito: criminalidade Engenharia: resistências de peças, qualidade, tempo de vida de peças, problemas de trânsito, etc O mundo é probabilístico Vivemos rodeados por fenômenos casuais ou aleatórios.

ESTATÍSTICA: UMA VISÃO GERAL Ciência de coletar, organizar, interpretar dados Visando...tomada de decisões ESTATÍSTICAS Somos bombardeados por elas a todo momento Números, informações, indicadores... Sociais, econômicos, demográficos, gerenciais

ESTATÍSTICA: UMA VISÃO GERAL Compreensão a partir dos dados Origens “status”; Estado; estado das coisas. Evolução Contagens de habitantes; terras, tributação; guerras; religião. Ciências físicas Ciências agrárias, biológicas, comportamentais Decisões econômicas, financeiras, empresariais

ESTATÍSTICA: POR QUE CONHECÊ-LA? Gestores modernos lidam com grande quantidade de informação. Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as informações Tirar conclusões sobre grandes populações com base em amostras Melhorar processos Obter previsões confiáveis

ESTATÍSTICA: FATORES IMPULSIONADORES Necessidade de dados Desenvolvimento da matemática Desenvolvimento da informática

A estatística reúne métodos para:  Coleta Processamento Análise e interpretação de dados Informações numéricas analisadas servem de base para tomada de decisões; As estatísticas nos auxiliam a entender melhor os fenômenos em geral;

GRANDES ÁREAS EM ESTATÍSTICA: ESTATÍSTICA DESCRITIVA PROBABILIDADES INFERÊNCIA

ESTATÍSTICA DESCRITIVA Tabelas Gráficos Medidas Técnicas Visuais Descrição Organização Resumo

INFERÊNCIA ESTATÍSTICA PROBABILIDADE Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório. INFERÊNCIA ESTATÍSTICA Trata da análise e interpretação de dados amostrais O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma.

População Amostra Inferência Descrição Análise

PRODUÇÃO DE DADOS: UMA PALAVRA SOBRE FONTES DE DADOS Obter dados já publicados por fontes governamentais, industriais ou individuais. Planejar e executar um experimento para obter os dados necessários. Planejar e executar uma pesquisa ou levantamento de campo (estudo observacional).

Indivíduo e Variável Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc) Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere.

OBSERVAÇÃO versus EXPERIMENTO Estudo observacional Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas ou sem modoficar os sujeitos objetos de estudo. Experimento Impõe-se algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas

Levantamentos amostrais População Grupo inteiro de indivíduos sobre o qual se deseja informações Amostra Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo.

Amostragem

Aleatorização e estrtégias amostrais Amostra não-probabilística Auto-seleção, conveniência, cotas, etc Amostra probabilística Cada membro tem uma chance conhecida (mas não necessariamente igual de ser selecionada) Amostra Aleatória Simples Toda amostra possível de tamanho n tem igual chance de ser selecionada.

Aleatorização e estratégias amostrais Amostragem Sistemática Sorteamos um ponto inicial e, em seguida, cada kº elemento fica automaticamente selecionado (por exemplo o 10º) Amostragem Estratificada Subdividimos a população em, pelo menos, dois subgrupos (estratos) de modo que os elementos do mesmo subgrupo compartilhem as mesmas características e, em seguida, extraímos uma amostra em cada subgrupo. Amostragem por Conglomerado Inicialmente dividimos a área da população em seções (conglomerados), depois selecionamos aleatoriamente alguns desses conglomerados e a seguir escolhemos todos (ou parte) dos membros desses conglomerados selecionados.

APRESENTAÇÃO DE DADOS: Tipos de variáveis QUALITATIVAS Nominais (sexo, região...) Ordinais (grau de instrução) QUANTITATIVAS Discretas (número de defeitos) Contínuas (peso, altura...)

O Banco de Dados

GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS Diagrama de Pontos Considere os dados: 3 4 4,5 4,5 6 8 Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações

GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas

Distribuições de frequência: Caso contínuo - Histograma

Apresentação de Dados Distribuições de frequências: caso nominal  

Distribuições de frequência: Caso discreto

Gráfico de Sequencias no tempo Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos:

Distribuições de frequência: Gráfico de Pareto

Gráfico de Pareto Para causas: equipamentos, insumos, informação do processo ou medidas, condições ambientais, pessoas, métodos ou procedimentos. Para efeitos: qualidade, custo, entrega, segurança, etc. Expresso em unidades monetárias Gráfico de Pareto estratificado (por operador, etc) Comparações tipo antes e depois Desdobramento de gráficos de Pareto (causas e sub-causas)

RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO CENTRO DOS DADOS Média Aritmética Mediana Valor do meio em uma sequencia ordenada de dados Moda Valor mais frequente de uma série de dados Dados agrupados Dados brutos “n” ímpar “n” par Dados agrupados

OUTRAS MEDIDAS DE LOCAÇÃO: Quartis Primeiro Quartil 25% das observações são menores e 75% maiores Segundo Quartil (Mediana) Terceiro Quartil

VARIABILIDADE Medidas de tendência central podem mascarar importantes aspectos em uma série de dados Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas. matérias-primas, condições de equipamentos, métodos de trabalho, condições ambientais e operadores

VARIABILIDADE: Problematizando Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada: Turma A: 3 4 5 6 7 Turma B: 1 3 5 7 9 Turma C: 5 5 5 5 5 Em termos de tendência central como podemos analisar os grupos ? E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade? Façamos uma investigação gráfica do fenômeno. Como obter uma medida de variabilidade média para os grupos?

MEDINDO A VARIABILIDADE Variância Populacional Variância Amostral Desvio Padrão Corresponde à raiz quadrada da variância

MEDINDO A VARIABILIDADE: outras medidas Amplitude Total Xmax-Xmin Amplitude Interquartil J = Q3–Q1 Coeficiente de variação Comparação de grupos muito diferentes Comparação de dispersão com escalas diferentes

ESTUDO DA FORMA: ASSIMETRIA Curva Simétrica

ESTUDO DA FORMA: ASSIMETRIA Assimetria Positiva Assimetria Negativa Média > Mediana Média < Mediana

Gráfico Box-Plot Índice de Desenvolvimento Humano no Brasil, por Região - 2000 Juntas: Q1,Q2,Q3 Extremos: E1 e E2

EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS Mensurar o tipo e grau de associação entre duas ou mais variáveis. Foco inicial: duas variáveis quantitativas Etapas: Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de Pearson,

CORRELAÇÃO: diagrama de dispersão Gráfico que representa no plano cartesiano duas variáveis quantitativas Ferramenta simples que permite aprofundar o estudo da associação entre 2 variáveis. Como ilustração, considere a tabela abaixo, que representa o tempo de serviço e o volume de vendas semanais de uma amostra de 5 vendedores de determinado produto: 55 50 42 40 35 Vendas 8 6 4 3 1 Tempo (anos)

Diagrama de Dispersão

CORRELAÇÃO Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva. Quando as variáveis crescem em sentidos opostos temos uma correlação negativa. Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita. Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula.

CORRELAÇÃO: diagrama de dispersão Correlação Perfeita Positiva r = +1 Correlação Perfeita Negativa r = -1

CORRELAÇÃO: diagrama de dispersão Correlação Forte e Positiva r = 0,97 Correlação Forte e Negativa r = -0,94

CORRELAÇÃO: diagrama de dispersão Correlação Fraca r 0 Correlação Não-Linear

COEFICIENTE DE CORRELAÇÃO LINEAR: FÓRMULA DE CÁLCULO onde: Lembre que: -1£ rxy £ 1

COEFICIENTE DE CORRELAÇÃO LINEAR: CÁLCULO PARA O EXEMPLO ANTERIOR Indica uma associação forte e positiva !! CUIDADO!!! Correlação não implica em relação de causa efeito. !!

REGRESSÃO LINEAR SIMPLES O diagrama de dispersão pode revelar importantes informações acerca da relação entre duas variáveis X e Y Quando os pontos traçados no diagrama de dispersão se agrupam em torno de uma reta, podemos obter a equação dessa reta e assim determinar um modelo matemático para a relação entre as variáveis

O modelo de regressão linear simples Yi = A + BXi + ei, onde: Yi = variável dependente ou variável resposta. Xi = variável explicativa A = coeficiente linear da reta ou ponto de interseção de Y B = coeficiente angular da reta ou inclinação. ei = variável residual

O coeficiente linear da reta corresponde ao ponto onde a mesma corta o eixo-Y, ou seja, o ponto onde o valor da variável explicativa X é zero. A inclinação indica o quanto varia a média da variável Y para o aumento de uma unidade na variável X. A reta de regressão pode ser estimada pelo método dos mínimos quadrados, resultando na expressão:

Os valores dos coeficientes linear e angular resultantes desse processo de minimização podem ser escritos como: A qualidade do ajuste pode ser avaliada pelo coeficiente de determinação (R2), que mede a proporção de variação na variável dependente que pode ser explicada pelo modelo linear ajustado. R2 Î[0,1], quanto mais próximo de 1, melhor o poder explicativo do modelo.

RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS Comparação do Comportamento de uma Variável Contínua por Grupos Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via: Diagrama de Pontos Gráficos tipo Box-Plot Gráfico Ramo-e-Folhas

RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS Tabela de contingência a 2 fatores Variável dependente e explicativa Medir associações Encontrar distribuições percentuais Distribuições marginais Distribuições condicionais

RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS Exemplo:

RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS Exemplo: percentuais de linha

RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS Exemplo: representação gráfica

NOÇÕES DE PROBABILIDADE Lançamento de uma moeda 2 resultados possíveis: cara e coroa Equiprováveis Moeda equilibrada (honesta) Qual a probabilidade de dar cara? Experimento de lançar “n” vezes e calcular a frequencia relativa de caras. (Kerrick, Bufon) Abordagem empírica Probabilidade tende para ½.

NOÇÕES DE PROBABILIDADE Modelos probabilísticos (a priori) Empirica (a partir de dados) Subjetiva Modelos Probabilísticos simples Espaço Amostral (S): conjunto de todos os resultados possíveis de um experimento aleatório. Evento: subconjunto do espaço amostral Coleção de resultados com ao menos uma característica em comum Lista de resultados e respectivas probabilidades Operações com eventos

PROBABILIDADE: algumas regras 1)Seja A um evento qualquer, então 0 £ P(A) £ 1. 2) Seja Ac o chamado evento complementar de A, então P(Ac) = 1 – P(A). 3) P(A È B) = P(A) + P(B) – P(A Ç B), sendo A e B eventos quaisquer. 4) P(F) = 0. 5) Se A e B são excludentes (P(A Ç B)=F), então: P(A Ç B) = 0.

NOÇÕES DE PROBABILIDADE: probabilidade condicional A probabilidade de B, sendo A conhecido é dada por: Dois eventos A e B são independentes se:

Variáveis Aleatórias Discretas - contagem Contínuas - medição São variáveis numéricas cujos resultados podem variar de uma realização para outra do experimento. Tipos Discretas - contagem Contínuas - medição

Variáveis Aleatórias Discretas: distribuição de probabilidades Valores de X e respectivas probabilidades: Média Valor esperado): Variância: Pn ...... p3 p2 p1 P(X) Xn X3 X2 X1 X

Modelos Probabilísticos para variáveis Discretas: Distribuição de Bernoulli Experimentos com apenas 2 resultados possíveis: Sucesso e fracasso. Lançamento de uma moeda Uma peça é escolhida de um lote e classificada como defeituosa ou perfeita. Um indivíduo é selecionado e pergunta-se se é ou não favorável ao desarmamento.

Modelos Probabilísticos para variáveis Discretas: Distribuição de Bernoulli Seja p=Prob. de Sucesso (1-p)=Prob. de fracasso Definimos a VA X com valores: 1 se ocorre sucesso 0 se ocorre fracasso Distribuição de Probabilidades de X: E(X)=p e V(X)=p(1-p) 1 P 1-p p(x) total X

Modelos Probabilísticos para variáveis Discretas: Distribuição Binomial Considera n repetições independentes de um experimento de Bernoulli. Exemplos: Jogue uma moeda 10 vezes. Seja X=nº de caras obtido Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas. Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado. Seja a VA X=nº de sucessos obtidos. Portanto: E(X)=np e V(X)=np(1-p)

Modelos Probabilísticos para variáveis Discretas: Distribuição de Poisson Largamente empregada quando se deseja contar o número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume. Exemplos: Fórmula: Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo. Número de falhas em um computador em um dia de operação. Número de defeitos em uma chapa de metal de 1 m2 produzida.

Modelos Probabilísticos para variáveis contínuas: Distribuição Normal · O exame dos gráficos de freqüência sugere a curva representativa da distribuição da variável. · As curvas de distribuição permitem o cálculo de probabilidades sobre a Variável estudada. ·    A curva normal é uma das mais importantes e utilizadas na Estatística. ·   Muitas variáveis, na prática, seguem o modelo normal. · O Modelo Normal possui dois parâmetros: a média (m) e o desvio padrão (s). ·    Notação X~N( m,s )

Modelos Probabilísticos para variáveis contínuas: Distribuição Normal Representação Gráfica: Propriedades: 1) A área sob a curva é igual a 1. 2) A curva é simétrica em relação à sua média. 3) f(x) tende para 0 quando X tende para +/- ¥ 4) A curva possui um ponto máximo em x = m.

Distribuição Normal: uso da tabela P(0<Z<1) P(Z>-1) 0,3413 0,5+0,3413 P(Z>1) Uso inverso da Tabela 0,5-0,3413