A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes 1.

Apresentações semelhantes


Apresentação em tema: "Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes 1."— Transcrição da apresentação:

1 Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes mbotelho@usp.br www.marcelobotelho.com 1

2 Como sintetizar os Dados? 2

3 Estatística Descritiva: Métodos Tabulares e Métodos Gráficos Capítulo 2 3

4 x y Sintetizando Dados Qualitativos Distribuição de Frequência Distribuição de Frequência Relativa Distribuição de Frequência Percentual Gráfico de Barras Gráfico de Pizza Análise Exploratória de Dados Tabulação Cruzada e Diagramas de Dispersão 4

5 Distribuição de Frequência Uma distribuição de frequência é um sumário tabular de dados que mostra o número (frequência) de itens em cada uma das diversas classes não sobrepostas O objetivo é fornecer informações sobre os dados que não podem ser rapidamente obtidos procurando-se apenas com os dados originais 5

6 Exemplo: Marada Inn Os hóspedes Marada Inn foram convidados a avaliar a qualidade das suas acomodações como sendo excelente, acima da média, média, abaixo da média, ou ruim. As classificações de fornecidos por uma amostra de 20 pessoas são: 6 Abaixo da médiaMédiaAcima da média Abaixo da média MédiaRuim Acima da médiaExcelenteAcima da média MédiaAcima da médiaMédia Acima da MédiaMédia

7 Exemplo: Marada Inn Distribuição de Frequência 7 Ruim Abaixo da Média Média Acima da Média Excelente 2 3 5 9 1 Total 20 ClasseFrequência

8 Distribuição de Frequência Relativa A frequência relativa de uma classe equivale à fração ou proporção dos itens pertencentes a uma classe. É um sumário tabular Para um conjunto de dados com n observações: 8

9 Distribuição de Frequência Percentual A frequência percentual de uma classe é a frequência relativa multiplicada por 100 Corresponde a um sumário tabular com o percentual de cada classe 9

10 Distribuições de Frequência Relativa e Frequência Percentual 10 Ruim Abaixo da Média Média Acima da Média Excelente 0,10 0,15 0,25 0,45 0,05 Total 1.00 10 15 25 45 5 100 Frequência Relativa Frequência Percentual Classe 0,10(100) = 10 1/20 = 0,05

11 Gráfico de Barras Um gráfico de barras, ou gráfico em barras, é um dispositivo gráfico para descrever os dados qualitativos No eixo horizontal são especificados os rótulos para as classes (categorias) No eixo vertical a escala de frequência, relativa ou percentual Usamos uma barra de largura fixa acima do rótulo até a frequência desta As barras devem ser separadas para enfatizar que cada classe é uma categoria distinta 11

12 Gráfico de Barras 12 Ruim Abaixo da Média Abaixo da Média Média Acima da Média Acima da Média Excelente Frequência Classes 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 Marada Inn Classificação de Qualidade

13 Gráfico em Setores (Pizza) O gráfico em setores (pizza) constitui outro dispositivo gráfico para representar as distribuições de frequência relativa Primeiro desenhamos um círculo que representa todos os dados. Depois, usamos a frequência relativa para subdividir o círculo em setores, ou partes, que correspondem à frequência relativa Como um círculo tem 360 graus, uma classe com frequência relativa de 0,25 tem uma faixa de 0,25(360) = 90 graus do círculo 13

14 Gráfico em Setores (Pizza) 14 Abaixo da Média 15% Abaixo da Média 15% Média 25% Média 25% Acima da Média 45% Acima da Média 45% Ruim 10% Ruim 10% Excelente 5% Excelente 5% Marada InnQuality Ratings Marada Inn Quality Ratings

15 Exemplo: Marada Inn Conhecimentos adquiridos a partir do gráfico de pizza Metade dos clientes pesquisados ​​deram Marada uma classificação de qualidade de "acima da média" ou "excelente" (olhando para o lado esquerdo da pizza). Isso pode agradar o gerente Para cada cliente que deu a classificação "excelente", havia dois clientes que deram uma classificação "ruim" (olhando para o topo da pizza). Isto deve desagradar o gerente 15

16 Exemplo Prático Dados de Refrigerante SoftDrink 16

17 Sintetizando Dados Quantitativos Distribuição de Frequência Distribuição de Frequência Relativa e Frequência Percentual Gráfico de Dispersão Unidimensional Histograma Distribuições Cumulativas Ogivas 17

18 Exemplo: Estatística Descritiva Mecânica Hudson O gerente da Mecânica Hudson queria ter um melhor conhecimento sobre os custos das peças utilizadas no conserto dos motores realizados na empresa Ele examina 50 faturas de clientes para consertos. Os custos de peças, arredondado para o inteiro, estão listadas no próximo slide 18

19 Exemplo: Estatística Descritiva Mecânica Hudson Amostra de custo das peças de 50 consertos 19 91789357755299809762 71697289667579757276 10474626897105776580109 85978868836871696774 6282981017910579696273

20 Distribuição de Frequência Número de classes são os intervalos para agrupar os dados Instrução para selecionar o número de classes Use entre 5 e 20 classes Conjuntos de dados com grande número de elementos usualmente requerem um maior número de classes Conjuntos de dados menores geralmente requerem menores números de classes 20

21 Distribuição de Frequência Instrução para selecionar a amplitude das classes Use classes de mesma amplitude Amplitude aproximada de classe= 21

22 Distribuição de Frequência Os limites das classes devem ser escolhidos de forma que cada uma das observações pertença a uma e somente uma classe Limite inferior de classe Limite superior de classe 22

23 Distribuição de Frequência Para a Hudson, foram escolhidas seis classes Amplitude aproximada de classe = (109 – 52)/6 = 9,5 ≈ 10 23 50-59 60-69 70-79 80-89 90-99 100-109 2 13 16 7 5 Total 50 Custo ($)Frequência

24 Distribuições de Frequência Relativa e Percentual 24 50-59 60-69 70-79 80-89 90-99 100-109 Custo Peças ($) 0,04 0,26 0,32 0,14 0,10 Total 1,00 Frequência Relativa 4 26 32 14 10 100 Frequência Percentual 2/500,04(100)

25 Distribuições de Frequência Relativa e Percentual Conhecimentos obtidos a partir da distribuição de frequência percentual Apenas 4% dos custos das peças estão na classe de $50-59 30% dos custos das peças estão abaixo de $70 O maior percentual (32% ou quase um terço) dos custos das peças estão na classe $70-79 10% dos custos das peças são de $100 ou mais 25

26 Gráfico de Dispersão Unidimensional Um dos mais simples gráfico de síntese de dados é o de dispersão unidimensional (dot plot) O eixo horizontal mostra o intervalo dos dados Cada valor é representado por um ponto acima do eixo 26

27 Gráfico de Dispersão Unidimensional 27 50 60 70 80 90 100 110 Custo ($) Custo das Peças

28 Histograma Outra forma comum de representação gráfica de dados quantitativos é o Histograma A variável de interesse é colocada no eixo horizontal e a frequência no eixo vertical Um retângulo é desenhado acima de cada intervalo de classe e com a altura correspondente a frequência, frequência relativa ou frequência percentual de cada intervalo Diferentemente do gráfico de barras, um histograma não tem a separação natural entre os retângulos de classes adjacentes 28

29 Histograma 29 2 2 4 4 6 6 8 8 10 12 14 16 18 Custo Peças ($) Custo Peças ($) Frequência 50-59 60-69 70-79 80-89 90-99 100-110 Custo das Peças

30 Histograma Simétrico A cauda esquerda espelha a cauda direita Exemplo: altura e peso das pessoas 30 Frequência Relativa 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0 0

31 Histograma Moderadamente inclinado para a esquerda Sua cauda se estende bem a esquerda Exemplo: pontuação de exames 31 Frequência Relativa 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0 0

32 Histograma Moderadamente inclinado para a direita Sua cauda se estende bem à direita Exemplo: preço de casas 32 Frequência Relativa 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0 0

33 Histograma Fortemente inclinado para a direita Uma longa cauda para a direita Exemplo: compras em uma loja de feminina 33 Frequência Relativa 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0 0

34 Distribuições Cumulativas Distribuição de frequência cumulativa - mostra o número de itens de dados com valores menores ou iguais ao limite superior de cada classe Distribuição de frequência relativa cumulativa - mostra a proporção de itens de dados Distribuição de frequência cumulativa percentual- mostra a percentagem de itens de dados com valores menores ou iguais ao limite superior de cada classe 34

35 Distribuição Cumulativa Hudson 35 < 59 < 69 < 79 < 89 < 99 < 109 Custo($) Frequência Cumulativa Frequência Relativa Cumulativa Frequência Percentual Cumulativa 2 15 31 38 45 50 0, 0,04 0,30 0,62 0,76 0,90 1,00 4 30 62 76 90 100 2 + 1315/50 0,30(100)

36 Ogivas Uma ogiva é um gráfico de distribuição cumulativa Os valores são apresentados no eixo horizontal No eixo vertical Frequência cumulativa, ou Frequência relativa cumulativa, ou Frequência percentual cumulativa A frequência (uma das acima) de cada classe é um ponto no gráfico Os pontos no gráfico são conectados por linhas retas 36

37 Ogivas Devido aos limites de classe para os dados de custo serem 50-59, 60-69, e assim por diante, parece haver uma lacuna de 59 a 60, 69 a 70, e assim por diante Essas lacunas são eliminados através da plotagem pontos a meio caminho entre os limites de classe Assim, 59,5 é usado para a classe de 50-59, 69,5 é usado para a classe de 60-69, e assim por diante 37

38 Ogiva com Frequência Percentual Cumulativa 38 Custo Custo Peças ($) Custo Custo Peças ($) 2020 4040 6060 8080 100100 Frequência Percentual Cumulativa 50 60 70 80 90 100 110 (89,5; 76) Custo das Peças

39 Exemplo Prático Tempo de Auditoria Audit 39

40 Análise Exploratória de Dados As técnicas de análise exploratória de dados consistem em cálculos aritméticos simples e em gráficos fáceis de desenhar que podem ser usados para sintetizar dados rapidamente Uma dessas técnicas é denominada apresentação de ramo-e-folha 40

41 Apresentação de Ramo-e-Folha Uma apresentação ramo-e-folha mostra simultaneamente tanto a ordem de classificação quanto a forma dos dados É similar ao histograma, mas tem a vantagem de apresentar os valores atuais dos dados Os primeiros dígitos de cada item são arranjados a esquerda da linha vertical A direita da linha vertical registramos o último dígito de cada valor de dados Cada linha é um ramo Cada dígito é uma folha 41

42 Exemplo: Estatística Descritiva Mecânica Hudson O gerente da Mecânica Hudson queria ter um melhor conhecimento sobre os custos das peças utilizadas no conserto dos motores realizados na empresa Ele examina 50 faturas de clientes para consertos. Os custos de peças, arredondado para o inteiro, estão listadas no próximo slide 42

43 Exemplo: Estatística Descritiva Mecânica Hudson Amostra de custo das peças de 50 consertos 43 91789357755299809762 71697289667579757276 10474626897105776580109 85978868836871696774 6282981017910579696273

44 Apresentação de Ramo-e-Folha 44 5 6 7 8 9 10 2 7 2 2 2 2 5 6 7 8 8 8 9 9 9 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 0 0 2 3 5 8 9 1 3 7 7 7 8 9 1 4 5 5 9 Um ramo Uma folha

45 Apresentação de Ramo-e-Folha Estendida Se acreditamos que a exibição ramo e folha original condensou os dados demais, podemos esticar a tela usando duas linhas para cada dígito(s) Sempre que um valor linha é indicado por duas vezes, o primeiro valor corresponde a valores de folha de 0-4, e o segundo valor corresponde a valores de folha de 5 - 9. 45

46 Apresentação de Ramo-e-Folha Estendida 46 5 5 9 1 4 7 7 7 8 9 1 3 5 8 9 0 0 2 3 5 5 5 6 7 8 9 9 9 1 1 2 2 3 4 4 5 6 7 8 8 8 9 9 9 2 2 7 2 5 6 7 8 9 10

47 Apresentação de Ramo-e-Folha Unidades folha Um único dígito é usado para definir cada folha No exemplo anterior, a unidade folha foi de 1 Unidades folha podem ser de 100, 10, 1, 0,1, e assim por diante Quando a unidade folha não é mostrada é assumido que seu valor é igual a 1 47

48 Exemplo: Unidade Folha = 0,1 Se temos valores do tipo A apresentação ramo-e-folha desses dados será 48 8,6 11,79,49,110,211,08,8 8 9 10 11 Unidade Folha = 0,1 6 8 1 4 2 0 7

49 Exemplo: Unidade Folha = 10 Se temos valores do tipo A apresentação ramo-e-folha desses dados será 49 1806171719741791168219101838 16 17 18 19 8 0 3 1 7 O 82 em 1682 é arredondado para baixo em 80 e é representado por um 8 Unidade Folha = 10

50 Tabulação Cruzada e Diagramas de Dispersão Até agora temos nos concentrado em métodos que são usados ​​para resumir os dados para uma variável de cada vez Muitas vezes um gerente está interessado em métodos de tabelas e gráficos que ajudam a compreender a relação entre duas variáveis Tabulação cruzada e diagrama de dispersão são dois métodos de síntese dos dados para duas (ou mais) variáveis ​​simultaneamente 50

51 Tabulação Cruzada Uma tabulação cruzada é um resumo tabular de dados para duas variáveis Tabulação cruzada pode ser usada quando uma variável é qualitativa e a outra é quantitativa ambas as variáveis ​​são qualitativas ambas as variáveis ​​são quantitativas 51

52 Tabulação Cruzada Exemplo: o número de casas vendidos para cada estilo e preço nos últimos dois anos é mostrada abaixo 52 Faixa de Preços Colonial Longa Sobrado Pequena Total < $99.000 > $99.000 18 6 19 12 55 45 30 20 35 15 Total 100 12 14 16 3 Tipo de Casa Variável quantitativa Variável qualitativa

53 Tabulação Cruzada Observações através da tabulação cruzada O maior número de casas na amostra (19) são um estilo de dois andares e custa menos do que ou igual a $99.000 Apenas três casas da amostra são do tipo pequena e custam mais de $99.000 53

54 Tabulação Cruzada 54 Faixa de Preços Colonial Longa Sobrado Pequena Total < $99.000 > $99.000 18 6 19 12 55 45 30 20 35 15 Total 100 12 14 16 3 Tipo de Casa Distribuição de frequência para a variável preço Distribuição de frequência para a variável tipo de casa

55 Tabulação Cruzada: Porcentagem em linha ou coluna Converter as entradas na tabela em percentagens na linha ou porcentagens na coluna pode fornecer informações adicionais sobre a relação entre as duas variáveis 55

56 Tabulação Cruzada: Porcentagem em linha 56 Faixa de Preços Colonial Longa Sobrado Pequena Total < $99.000 > $99.000 Tipo de Casa 32,73 10,91 34,55 21,82 100 26,67 31,11 35,56 6,67 Nota: Os totais de linha são realmente 100,01, devido a arredondamentos (Colonial e > $99K)/(Todos >$99K) x 100 = (12/45) x 100

57 Tabulação Cruzada: Porcentagem em coluna 57 60,00 30,00 54,29 80,00 40,00 70,00 45,71 20,00 100 100 100 100 Total (Colonial e > $99K)/(Todas Colonial) x 100 = (12/30) x 100 Faixa de Preços Colonial Longa Sobrado Pequena < $99.000 > $99.000 Tipo de Casa

58 Tabulação Cruzada: O Paradoxo de Simpson Os dados em duas ou mais tabulações cruzadas são muitas vezes agregados para produzir uma tabulação cruzada resumida Devemos ter cuidado em tirar conclusões sobre a relação entre as duas variáveis ​​na tabulação cruzada agregada Paradoxo de Simpson: Em alguns casos as conclusões com base em uma tabulação cruzada agregada pode ser completamente invertida, se olharmos para os dados não- agregados 58

59 Diagramas de Dispersão e Linhas de Tendência Um diagrama de dispersão é uma representação gráfica da relação entre duas variáveis ​​quantitativas Uma variável é mostrada no eixo horizontal e a outra variável é mostrada no eixo vertical O padrão geral dos pontos plotados sugere a relação global entre as variáveis Uma linha de tendência é uma linha que fornece a aproximação da relação 59

60 Diagrama de Dispersão Uma relação positiva 60 x y

61 Diagrama de Dispersão Uma relação negativa 61 x y

62 Diagrama de Dispersão Sem relação aparente 62 x y

63 Exemplo Vendas de Equipamentos de Som Arquivo: Stereo Número de Comerciais eixo (X) Vendas eixo (Y) 63

64 Métodos Gráficos e Tabulares 64 Dados Dados Qualitativos Dados Quantitativos Métodos Tabulares Métodos Tabulares Métodos Gráficos Métodos Gráficos Distribuição de Frequência Dist. Freq. Relativa Dist. Freq. Percentual Tabulação Cruzada Gráfico de Barras Gráfico de Pizza Gráfico de Pontos Histograma Ogivas Apresentação Ramo-e-Folha Diagrama de Dispersão Distribuição de Frequência Dist. Freq. Relativa Dist. Freq. Cumulativa Dist. Freq. Rel. Cumulativa Tabulação Cruzada Métodos Tabulares Métodos Tabulares Métodos Gráficos Métodos Gráficos

65 Obrigado pela Atenção!!! Prof. Dr. Marcelo Botelho da Costa Moraes mbotelho@usp.br www.marcelobotelho.com 65


Carregar ppt "Probabilidade e Estatística Aplicadas à Contabilidade I Prof. Dr. Marcelo Botelho da Costa Moraes 1."

Apresentações semelhantes


Anúncios Google