A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística e Análise de Dados

Apresentações semelhantes


Apresentação em tema: "Estatística e Análise de Dados"— Transcrição da apresentação:

1 Estatística e Análise de Dados
Professor Leandro Morilhas

2 Agenda Conceito e origem da Estatística. Áreas de Estudo.
Medidas de posição central. Medidas de dispersão. Probabilidade. Correlação e regressão linear.

3 Um passeio pela história …

4 3000 AC – Censos no Egito

5 Outras cenas ...

6 Na Babilônia também …

7 Na Bíblia … Quarto livro do velho testamento Instrução a Moisés
Fazer um levantamento dos homens de Israel que estivessem aptos a guerrear

8 Augusto César Édito para que se fizesse o censo em todo o império romano Censere em latim = taxar

9 Maria e José Em função do édito, Maria e José viajaram para Belém

10 Guilherme o conquistador
Inglaterra 1085 Levantamento estatístico Terras Propriedades Empregados Animais Base de cálculo de impostos Domesday = Dia do juízo final

11 Um livro para os impostos …

12 Séc XVII - Tábuas de Mortalidade
John Graunt Análises de nascimentos e mortes % de homens ligeiramente superior a de mulheres

13 Palavra Estatística Cunhada pelo acadêmico alemão Gottfried Achenwall por volta da metade do século XVIII O verbete “statistics” apareceu pela primeira vez na Enciclopédia Britânica em 1797

14 Estatística Poder público Caracterização dos dados Para entender a ...
Status Estado Poder público Caracterização dos dados

15 Uma origem controversa
Estatística para cobrar IMPOSTOS

16 Facilitar a análise de DADOS
E depois …. Facilitar a análise de DADOS

17 A Estatística é dividida em:
Análise de dados: Coleta, organização e resumo dos dados Probabilidade: Necessária para tirar conclusões a partir de amostras Inferência estatística: Tirar conclusões estatísticas de dados específicos usando os conhecimentos de probabilidade

18 É uma parte da população selecionada para análise
Definições: População É o conjunto de todos os elementos de interesse em um determinado estudo Amostra É uma parte da população selecionada para análise

19 Dados Dados: são observações (tais como medidas, sexo, respostas de pesquisa) que tenham sido coletados Quantitativos: Quando é possível atribuir um valor numérico Qualitativos: Representam a informação que identifica alguma qualidade, categoria ou característica 

20 Campos de Aplicação Estudos de mercado
O gerente de uma fábrica de detergentes pretende lançar um novo produto para lavar a louça, pelo que, encarrega uma empresa especializada em estudos de mercado de "estimar" a percentagem de potenciais compradores desse produto. População: conjunto de todos as famílias do país Amostra: conjunto de algumas famílias, pesquisados pela empresa Problema: pretende-se, a partir da percentagem de respostas afirmativas, de entre os entrevistados sobre a compra do novo produto, obter uma estimativa do número de compradores na População.

21 Campos de Aplicação Controle de qualidade
O administrador de uma fábrica de parafusos pretende assegurar-se de que a percentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. População: conjunto de todos os parafusos fabricados ou a fabricar pela fábrica, utilizando o mesmo processo. Amostra: conjunto de parafusos escolhidos ao acaso de entre o lote de produzidos. Problema: pretende-se, a partir da percentagem de parafusos defeituosos presentes na amostra, "estimar" a percentagem de defeituosos em toda a produção.

22 Analisando ... Frequências Média Mediana Desvio-Padrão

23 Medidas de Posição Central

24 Medidas úteis para a decisão
Medidas de posição central: Média ou Valor Esperado Moda Mediana

25 Média Aritmética Simples
Mais usual das medidas estatísticas Relação entre soma e contagem Centro geométrico de um conjunto de dados

26 Exercícios 1 – Em março de 2009, os vendedores da Empresa Equilibrada Ltda. tiveram um aumento de 44% sobre os respectivos salários mensais. Ao final de junho, tendo em vista o considerável aumento das vendas da empresa, foi concedido um novo aumento a cada vendedor, de US$ 200 que começou a ser pago a partir de julho. Sabendo-se que, ao final do ano de 2009, o salário médio mensal dos vendedores da empresa passou a ser de US$ 1.100, pede-se calcular o salário médio mensal dos vendedores da empresa em fevereiro de 2009.

27 Exercícios 2 – O salário médio mensal pago aos funcionários da Empresa ABC, foi de US$ 199 no primeiro semestre de Sabendo-se que a partir de julho houve um aumento que fez com que a média, ao final dos doze meses do ano subisse para US$ 217, pede-se calcular: A - O volume total gasto com o pagamento dos salários no mês de julho. B – Mantendo-se os valores do primeiro semestre e o valor encontrado para o mês de julho, caso a empresa queira reduzir os gastos com pessoal, de tal modo que a média ao final do ano de 2009 atinja US$ 180, qual deve ser a média mensal entre agosto e dezembro?

28 Média aritmética ponderada
É preciso considerar as frequências …

29 Exercícios 3 – Um caminhão cujo peso vazio é de kg será carregado com 470 caixas de 11 kg cada, 360 caixas de 9 kg cada, 500 caixas de 4 kg cada e 750 caixas de 6 kg cada. O motorista do caminhão pesa 75 kg e a lona de cobertura da carga pesa 48 kg. A – Sabendo-se que esse caminhão tem que passar por uma balança que só permite passagens a veículos com peso máximo de 16 toneladas, pergunta-se: ele passará pela balança? B – Qual o peso médio das caixas carregadas no caminhão?

30 Financiamentos de Longo Prazo
Exercícios 4 – O capital da Empresa Maguary Ltda. é formado pelo aporte dos acionistas, por financiamento de longo prazo e pela emissão de debêntures. Cada tipo de capital possui um custo anual diferente dado por uma taxa de juros anual, conforme o quadro: Calcular a taxa média do capital da empresa. Forma de Capital Participação em US$ Taxa de Juros Acionistas 2.400 12% Financiamentos de Longo Prazo 1.200 8% Debêntures 400 14%

31 Aparências podem enganar!
Cuidado com as médias!!! Aparências podem enganar!

32 Maior problema da média …
Maldição dos extremos ou outliers Extremos distorcem algumas medidas

33 Solução para o problema …
Remover os extremos!!

34 Pesquisa sobre remuneração
Empresa paga $400,00 aos estagiários de Administração Quer saber … É muito ou pouco? Coletou amostra de dados Dados: {300; 350; 6000; 340; 310; 380} Pouquíssimo!!! 7680 $1.280,00 6

35 Organizando os dados … Dados: {300; 350; 6000; 340; 310; 380}
Rol: {300; 310; 340; 350; 380; 6000} $400,00 Extremo distorce a média! Rol sem extremo: {300; 310; 340; 350; 380} Alto! Média = 1680/5 = $336,00

36 O centro dos dados ordenados
Onde está o centro ???

37 {3; 7; 9; 10; 4; 8; 2} {2; 3; 4; 7; 8; 9; 10} n par?
Mediana Valor central de uma série ordenada de dados (Rol) {3; 7; 9; 10; 4; 8; 2} Ordenando no Rol 3 maiores {2; 3; 4; 7; 8; 9; 10} n par? 3 menores mediana = 6 {2; 3; 4; 8; 9; 10}

38 O que é mais frequente Será que está na moda???

39 {2; 3; 4; 7; 7; 9; 10} {2; 2; 4; 7; 7; 9; 10} {2; 3; 4; 7; 8; 9; 10}
Moda Valor que se repete com maior frequência {2; 3; 4; 7; 7; 9; 10} unimodal {2; 2; 4; 7; 7; 9; 10} bimodal ou multimodal {2; 3; 4; 7; 8; 9; 10} amodal

40 Medidas de Localização Não Centrais
Usadas para resumir ou descrever as propriedades de grandes conjuntos de dados numéricos: Quartis Percentis

41 Quartis Dividem os dados ordenados em quatro partes: Primeiro Quartil (Q1): valor que faz com que 25% das observações sejam menores e 75% sejam maiores que Q1 Segundo Quartil (Q2): é a MEDIANA – 50% das observações são menores que Q2 e 50% são maiores Terceiro Quartil (Q3): valor que faz com que 75% das observações sejam menores e 25% sejam maiores que Q3

42 Dados não agrupados Q1 = valor que corresponde à posição:
    Q2 = valor que corresponde à posição: Q3 = valor que corresponde à posição:

43 Regras usadas para obter os valores do quartil
Se o ponto de posicionamento for um número inteiro, é só usar o número correspondente àquela posição Se o ponto de posicionamento estiver na metade entre 2 números inteiros, a média dos dois números à direita e à esquerda será o quartil Se o ponto de posicionamento não for a metade do caminho entre dois números inteiros, usamos o que estiver mais próximo.

44 Exercícios 5 - Os salários mensais para uma amostra de 12 administradores são: Determine os três quartis. 6 - Para estimar a quantidade de água que seria necessária para abastecer uma cidade na próxima década, a prefeitura precisa descobrir a quantidade de água que uma amostra de famílias utiliza atualmente. As famílias da amostra utilizaram o seguinte volume de água, em milhares de litros: 11,1 21,5 16,4 19,7 14,6 16,9 32,2 18,2 13,1 23,8 18,3 15,5 18,8 22,7 14,0 Encontre os três quartis.

45 Exercícios 7 - Considere uma população constituída de profissionais liberais que foram, questionados sobre o número de revistas e/ou jornais que os mesmos são assinantes, obteve-se a seguinte tabela: Nº de Publicações Nº de Profissionais 3 1 12 2 15 10 4 16 Quais são os três quartis?

46 Exercícios 8 - Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa de distribui conforme a tabela da população: No de defeito No de caixas 32 1 28 2 11 3 4 5 Determine o valor da moda, da mediana e da média

47 Medidas de dispersão

48 Medidas de Dispersão Amplitude Desvio médio Variância Desvio padrão

49 Encontrando os extremos dos dados
Fundo de investimento, com retornos: {7, 3 e 2} Amplitude Maior menos menor Range ou intervalo Maior - R = Menor R = 7 - 2 = 5

50 Desvio médio Média = 4 Série 2 3 7 Desvios -2 -1 3 Soma 0 Média 0
Desvio médio ou afastamento médio em relação à média Média = 4 Série 2 3 7 Desvios -2 -1 3 É preciso calcular os desvios ABSOLUTOS Soma 0 Média 0

51 Desvio médio absoluto Média = 4 Série 2 3 7 Desv Abs 2 1 3 Soma 6
Desvio médio absoluto ou afastamento médio absoluto em relação à média Média = 4 Série 2 3 7 Desv Abs 2 1 3 Calculamos os MÓDULOS Soma 6 Média 2

52 Exercícios 9 – A produção de manteiga dos últimos seis meses do Laticínio Sabor do Leite Ltda. está apresentada a seguir. Com base nos números apresentados, calcule: A- Média. B – O desvio médio absoluto Produção mensal de manteiga em toneladas: { 11; 8; 4; 10; 9; 12}

53 Variância Média = 4 Série 2 3 7 Desvio2 4 1 9 Soma 14 Média 4,67
Dispensa o uso do MÓDULO Usa o desvio ao quadrado Média = 4 Série 2 3 7 Desvio2 4 1 9 Soma 14 Média 4,67

54 Desvio padrão Desvio = Raiz (4,67) = 2,16
Resolve o problema dimensional da variância Raiz da variância Desvio = Raiz (4,67) = 2,16

55 Exercícios 10 – Considerando o enunciado do exercício 9, calcule a variância e o desvio padrão.

56 Fórmulas Amostral Populacional Variância Desvio Padrão

57 Coeficiente de variação

58 Exercícios 11 - A U.S. Energy Information Administration monitora todas as usinas de energia nuclear operando nos Estados Unidos. A tabela a seguir lista o número de usinas ativas operando em cada um dos 20 estados da amostra. A - Encontre a amplitude, a variância e o desvio-padrão desse conjunto de dados. B - Elimine o maior valor dos dados e repita a alternativa a. C - Que efeito a retirada dessa medição tem nas medidas de variação encontradas na letra a? D - Elimine o maior e o menor valor do conjunto de dados e repita a alternativa a. Que efeito a retirada de ambas as medições tem sobre a variação encontrada na alternativa a? 58 58

59 12 - Uma amostra aleatória de 15 empresas dentre as que pediram concordata no último mês em São Paulo foi selecionada por um analista. As idades das empresas, em anos, foram registradas: Exercícios A - Encontre a média, a amplitude, a variância e o desvio-padrão desse conjunto de dados. B - Calcule o valor da média menos o desvio-padrão; calcule também o valor da média mais o desvio-padrão. C - Quantos valores estão entre o intervalo definido pela média menos o desvio-padrão e a média mais o desvio-padrão? D - O que você pode inferir com estes resultados? 59 59

60 Exercícios 13 - Um fábricante de baterias automotivas alega que a duração média da vida útil de uma bateria tipo A é de 60 meses. Entretanto, a garantia dessa marca é de apenas 36 meses. Suponha que o desvio-padrão da vida útil seja de 10 meses e a distribuição de freqüência dos dados da vida útil tenda a ter um formato numérico, conforme os dados a seguir. A - Qual a porcentagem das baterias tipo A desse fábricante irão durar mais de 50 meses? B - Qual a porcentagem das baterias tipo A desse fábricante irão durar menos de 41 meses? C - Suponha que sua bateria dure 37 meses. O que você pode inferir sobre a alegação do fábricante? 60 60

61 Estudo de Caso: 1 - Consolidated Foods

62 Estudo de Caso: Consolidated Foods
A Consolidated Foods opera uma rede de supermercados no Novo México, no Arizona e na Califórnia. Os dados na Tabela 1 mostram as quantias em dólar e os métodos de pagamento para uma amostra de 100 clientes. Os gerentes da Consolidated solicitaram a amostra para descobrirem as práticas de pagamento dos clientes da loja. Em particular, os gerentes estão interessados em saber como uma nova opção de pagamento por cartão de crédito está relacionada com as quantias gastas pelos clientes.

63 Estudo de Caso: Consolidated Foods

64 Estudo de Caso: Consolidated Foods
Relatório Gerencial: Use os métodos de estatística descritiva para sintetizar os dados da amostra. Forneça separadamente sumários das quantias gastas para clientes que pagaram à vista, clientes de cheque pessoal e clientes de cartão de crédito. Seu relatório deve conter os seguintes sumários e discussões. 1 – Uma comparação e interpretação das médias e das medianas. 2 – Uma comparação e interpretação das medidas de variabilidade tais como a amplitude e o desvio-padrão. 3 – A identificação e interpretação da regra de cinco itens para cada método de pagamento. 4 – Gráficos de pontos para cada método de pagamento.

65 Estudo de Caso: 2 – Empresa Platox

66 Estudo de Caso: Empresa Platox
A empresa Platox, S.A. fabrica e comercializa celulares. A empresa tem sede administrativa e fábrica na cidade de Curitiba e filiais em mais cinco cidades do Brasil. As empresas Platox-Rio, Platox-Brasília, Platox-São Paulo, Platox – Belo Horizonte e Platox-Salvador, foram criadas com o objetivo de descentralizar a comercialização de celulares e para responder de forma mais eficiente às necessidades dos três tipos de clientes-alvo da empresa: adolescentes, executivos e pessoas fanáticas por novas tecnologias. A empresa atua no mercado desde 2000, mas as filiais de São Paulo, Belo Horizonte e Salvador só foram criadas em 2003. A capacidade produtiva da fábrica é de celulares por ano, mas até agora a utilização dessa capacidade não ultrapassou os 70%: até 2002 foram produzidos celulares por ano; e a partir de 2003, com a abertura das três novas filiais, esse número elevou-se para unidades.

67 Estudo de Caso: Empresa Platox
Para aproveitar o efeito sinérgico que pode resultar do forte crescimento que se esperava para a economia nacional, e atendimento à evolução favorável das margens de comercialização que se tem verificado nos últimos anos, os responsáveis pela empresa pretendem aumentar a produção de celulares para unidades por ano. Assim, e antes de decidir pela maior utilização da capacidade produtiva, a Administração da empresa deu instruções no sentido da diretoria de planejamento apresentar um relatório completo sobre as vendas de todas as filiais ao longo dos últimos anos. Paralelamente foi encomendado um estudo de marcado a uma empresa de consultoria, com o objetivo de saber qual é o posicionamento competitivo da empresa no mercado de celulares, tanto em nível nacional como em nível regional. Do estudo de mercado deverão resultar também algumas idéias sobre a estratégia de marketing a ser implementada em cada uma das filiais. Portanto, cabe à diretoria de planejamento da empresa, a realização de um estudo do qual possam ser extraídas algumas conclusões importantes sobre o comportamento das vendas de todas as filiais ao longo dos últimos anos.

68 Estudo de Caso: Empresa Platox
Para a Administração da empresa importa saber em cada filial: 1 – Os níveis médio e mediano das vendas; 2 – O comportamento das vendas em relação ao nível médio, para se poder concluir sobre o grau de risco em aumentar a produção; 3 – A forma como as vendas se distribuíram ao longo do tempo; 4 – O grau de concentração das vendas dentro da própria empresa, para saber se as vendas se repartiram de forma mais ou menos equitativa por todas as filiais; 5 – Que ações devem ser realizadas tendo em vista o aumento das vendas para fazer face à maior utilização da capacidade produtiva.

69 Estudo de Caso: Empresa Platox
Observação: No quadro seguinte apresentam-se as vendas (em reais) das seis filiais da empresa ao longo dos últimos anos. Os dados foram já introduzidos planilha para que os cálculos possam ser feitos pelo Excel.

70 Probabilidade

71 “Curva normal dos erros”
Distribuição Normal “Curva normal dos erros”

72 Médias, desvios e sinos …
Uso da curva normal Freqüência Variável X Alta frequência Baixa frequência Média Área sob a curva permite obter as probabilidades

73 Características da curva
Na teoria, prolonga-se de – infinito a + infinito Área sob toda a curva igual a 100% Simétrica Área de cada lado igual a 50%

74 Áreas sob a curva normal
68% 95% > 99% – 3 s – 2 s – 1 s + 1 s + 2 s + 3 s Probabilidade 68% 95% 99%

75 Para sempre lembrar! Uma indústria de cosméticos analisa a sua produção de frascos de esmalte de unha que apresenta uma produção normalmente distribuída, com média igual a 12g e desvio 4g. Freqüência Variável X  = 4  = 12

76 A gerência industrial quer saber …
a) Qual a probabilidade de um frasco escolhido ao acaso apresentar um peso entre 12 e 14,56 g?

77 Assinalando a área no gráfico
Freqüência Variável X 12  = 4 14,56

78 Convertendo a variável original
x Número de desvios de afastamento em relação à média

79 Calcule a probabilidade ...
Probabilidade em tabela Z Freqüência Variável X 12  = 4 14,56 Z = +0,64 Z 0,64

80 Tabelas facilitam os cálculos
Para Z =0,64 Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 0,2389

81 Probabilidade em tabela Z
Exercícios . 14 - Calcule a probabilidade entre 12 e 17 g, entre 6 e 12g e entre 11 e 15g. Probabilidade em tabela Z Freqüência Variável X 12  = 4 17 Z

82 Exercícios 15 – Calcule o valor de Z para a área central igual a 90%. Frequência Variável X média 90%

83 Exercícios 16 – Latas de conserva são fabricadas por uma indústria com média de 990g e desvio padrão de 10g. Uma lata é rejeitada pelo controle de qualidade dessa indústria se possuir peso menor que 975g. Assim, qual é a probabilidade de uma lata de conserva ser rejeitada pelo controle de qualidade?

84 Distribuição Normal Padronizada
Anexos … Distribuição Normal Padronizada

85 Tabelas de Z (1) Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,10 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,20 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,30 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,40 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,50 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,60 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,70 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,80 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,90 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389

86 Tabelas de Z (2) Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,00 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,10 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,20 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,30 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,40 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,50 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,60 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,70 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,80 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,90 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767

87 Tabelas de Z (3) Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 2,00 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,10 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,20 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,30 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,40 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,50 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,60 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,70 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,80 0,4975 0,4976 0,4977 0,4978 0,4979 0,4980 0,4981 2,90 0,4982 0,4983 0,4984 0,4985 0,4986

88 Correlação e Regressão
Linear

89 Duas variáveis quantitativas
X independente Y dependente

90 Sem relação … Análise de regressão: ajuste de reta aos pontos
X Y Análise de regressão: ajuste de reta aos pontos Sem relação aparente

91 Com relação Análise de regressão: ajuste de reta aos pontos
X Y Com relação aparente

92 Erros quadráticos mínimos
Erros2 devem ser mínimos!!! X Y

93 Definindo a equação da reta
X Y Equação da reta Y = a + b.X

94 Uma aplicação didática …
Análise e separação de gastos … Fixos: não oscilam conforme produção e vendas Variáveis: oscilam conforme produção e vendas

95 Uma análise de vendas e gastos
Mês Vendas Gastos jan 3 18 fev 9 39 mar 6 30 abr 15 mai 2 12 jun 45

96 Uma análise gráfica … Vendas Gastos 3 18 9 39 6 30 15 2 12 45 X Y

97 Calculando os somatórios
Vendas X Gastos Y 3 18 9 39 6 30 15 2 12 45 X2 Y2 XY 9 324 54 81 1.521 351 36 900 180 225 45 4 144 24 2.025 405 S 32 159 220 5139 1059

98 b = 4,27703 Calculando b 6 1059 32 159 6 220 32 n SX SY SX2 SY2 SXY 6
5.139 1.059 6 1059 32 159 6 220 32 b = 4,27703

99 a = 3,6892 Calculando a 159 4,42770 32 6 n SX SY SX2 SY2 SXY 6 32 159
220 5.139 1.059 159 4,42770 32 6 a = 3,6892

100 No gráfico …

101 Assim … Equação obtida … y = 3, ,277x Para vendas previstas iguais a 10 unidades … y = 3, ,277(10) y = 46,4592

102 Análise de correlação …
Estuda a qualidade do ajuste linear feito para os pontos

103 Diferentes níveis de aproximação
Positiva Positiva Perfeita r > 0 r = 1 Negativa Negativa perfeita r = -1 r < 0

104 Correlação inexistente

105 Coeficiente de determinação

106 Coeficiente de Pearson

107 Exercícios 17 – As exportações da castanha in natura, processadas pela Empresa Castanheira Ltda., no período 2002 a 2008, encontram-se na tabela a seguir Onde a variável quantidade está expressa em toneladas. Pede-se: A- a equação de regressão linear da quantidade sobre o tempo. B – O coeficiente de correlação linear. C – A quantidade estimada para exportação em 2009. Ano 2002 2003 2004 2005 2006 2007 2008 Quantidade 50 46 36 31 25 11 18

108 Exercícios 18 – A Empresa Squadrus Ltda., fabricante de implementos agrícolas de alta tecnologia, realizou um levantamento do custo total de um de seus produtos (Y), expresso em US$ 1.000,00, em função do número total de peças produzidas (X), expresso em unidades, durante cinco meses, com o objetivo de montar uma regressão linear simples, entre essas variáveis, obtendo os somatórios: Ʃx = 440 Ʃy = Ʃxy = Ʃx² = Ʃy² = 3.200 Nessas condições, pede-se: A – A reta que melhor se ajuste a esses dados. B – O valor do coeficiente de correlação linear. C – O valor mais provável dos custos fixos. D – O valor estimado do custo variável para uma produção de 500 unidades. E – Admitindo-se um preço de venda de US$ 3.000,00, por unidade, estimar a quantidade mínima que se deve produzir para se obter um lucro de US$ ,00

109 U. S. Department of Transportation
Estudo de Caso: U. S. Department of Transportation

110 Estudo de Caso: U.S. Department of Transportation
Como parte de um estudo de segurança no transporte, o U. S. Department of Transportation levantou dados do número de acidentes fatais por carteiras de habilitação, e a porcentagem de motoristas licenciados abaixo de 21 anos que possuem habilitação em uma amostra de 42 cidades. Os dados obtidos são apresentados na tabela 2. Relatório Gerencial: A-) Desenvolva sumários gráficos e numéricos dos dados. B-) Use análise de regressão para investigar a relação entre o número de acidentes fatais e a porcentagem de motoristas abaixo da idade de 21 anos. Discuta suas conclusões. C-) Quais conclusões e/ou recomendações você pode derivar de suas análises?

111 Department of Transportation
Estudo de Caso: U.S. Department of Transportation

112 ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)

113 ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)

114 ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)

115 ANEXO: Análise de Regressão Linear Simples - Excel
Fonte: Prof. Canton (FEA – USP)

116 ANEXO: Análise de Regressão Linear Simples - Excel
Coeficiente de Correlação Linear de Pearson Coeficiente de Determinação : Neste exemplo 93 % da variabilidade da variável das vendas é explicada pelo modelo Número de observações utilizadas no cálculo dos coeficientes do modelo de regressão Testa a hipótese de que existe relação linear entre as variáveis. Quando este valor for < 0,10 concluímos que existe relação linear entre as variáveis Quando esse valor for menor do que 0,10 a constante deve fazer parte do modelo. Coeficientes do modelo Vendas = anos de experiencia Valor = 0, Quando esse valor for menor do que 0,10 existe relação linear entre as variáveis Fonte: Prof. Canton (FEA – USP)

117 Referências Bibliográficas
Anderson, D; Sweeney, D e Williams, T; ESTATÍSTICA APLICADA À ADMINISTRAÇÃO E ECONOMIA. São Paulo: Pioneira Thomson Learning, 2003. Bruni, A. L. ESTATÍSTICA APLICADA À GESTÃO EMPRESARIAL. São Paulo: Atlas, 2007. Kazmier, L. ESTATÍSTICA APLICADA À ECONOMIA E ADMINISTRAÇÃO. São Paulo: Mc Graw-Hill, 1982. Oliveira, F. E. M. ESTATÍSTICA E PROBABILIDADE: Exercícios Resolvidos e Propostos. 2 ed. São Paulo: Atlas, 1999. Smailes, J e Mc Graine, A. ESTATÍSTICA APLICADA À ADMINISTRAÇÃO COM EXCEL. São Paulo: Atlas, 2002.

118 Professor Leandro Morilhas
Muito Obrigado! Professor Leandro Morilhas


Carregar ppt "Estatística e Análise de Dados"

Apresentações semelhantes


Anúncios Google