A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística Aula 08 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado.

Apresentações semelhantes


Apresentação em tema: "Estatística Aula 08 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado."— Transcrição da apresentação:

1 Estatística Aula 08 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado pelo Prof. Wayne Santos de Assis

2 Aula 08 Medidas de Dispersão Amplitude e Desvio médio Amplitude e Desvio médio Variância e Desvio padrão Variância e Desvio padrão Coeficiente de variação Coeficiente de variação

3 Medidas de Dispersão Se os gráficos abaixo representam duas séries temporais, qual das Se os gráficos abaixo representam duas séries temporais, qual das duas séries possuem os dados mais dispersos? duas séries possuem os dados mais dispersos? Tendência Central (média,...) Dados Introdução

4 Medidas de Dispersão Os dados estão mais ou menos dispersos em torno da tendência. Se os gráficos abaixo representam duas séries temporais, qual das Se os gráficos abaixo representam duas séries temporais, qual das duas séries possuem os dados mais dispersos? duas séries possuem os dados mais dispersos? Introdução

5 E agora, nos histogramas E agora, nos histogramas ao lado? ao lado? Medidas de Dispersão Introdução Quase nunca uma única Quase nunca uma única medida é suficiente para medida é suficiente para descrever de modo descrever de modo satisfatório um conjunto de satisfatório um conjunto de dados dados CVDOT

6 Medidas de Dispersão Sejam as observações de temperaturas T A e T B indicadas: TATA TBTB (medidas em ºC) Percebe-se, entretanto, que T B apresenta dispersão muito maior que T A Ambas têm a mesma média: 25ºC São necessárias medidas que indiquem o grau de dispersão, ou variabilidade, em relação ao valor central

7 Medidas de Dispersão Acredite se quiser, mas estes 2 grupos de parafusos possuem a mesma média! Os parafusos da segunda marca parecem ter uma variação maior

8 Medidas de Dispersão Amplitude Chama-se amplitude (A t ou R) de um conjunto de dados, x 1, x ´2, …, Chama-se amplitude (A t ou R) de um conjunto de dados, x 1, x ´2, …, x i, …, x n, à diferença entre o máximo e o mínimo do conjunto de x i, …, x n, à diferença entre o máximo e o mínimo do conjunto de dados dados Ache a amplitude para o caso da amostra de medidas de níveis de chumbo no ar (abaixo) 1,20 1,10 0,42 0,73 0,48 1,10 A t = 1,20 – 0,42 = 0,78 g/m 3 Para o caso dos 2 grupos de parafusos A t (grupo 1) = 2,03 – 1,95 = 0,08 in A t (grupo 2) = 2,50 – 1,70 = 0,80 in

9 Medidas de Dispersão Dados agrupados em classes estimativa com a diferença entre o limite superior da última classe e o limite inferior da primeira Dados agrupados em classes estimativa com a diferença entre o limite superior da última classe e o limite inferior da primeira Amplitude A t = – 0 = kg

10 Amplitude Para o conjunto abaixo, a amplitude é 71 – 49 = 22 Para o conjunto abaixo, a amplitude é 71 – 49 = 22 Considerando os dados agrupados, a amplitude é 72 – 48 = 24 Considerando os dados agrupados, a amplitude é 72 – 48 = 24

11 Amplitude A presença de uma única observação muito alta ou muito baixa tem uma grande influência sobre o valor da amplitude A amplitude é insensível a qualquer variação dos valores intermediários Mesmo que não existam valores isolados muito altos ou muito baixos, a amplitude não deve ser utilizada para comparar a variabilidade de várias amostras, a não ser que tenham a mesma dimensão É natural que à medida que a dimensão da amostra aumenta a amplitude tende aumentar É muito simples indicar os valores extremos e, portanto, calcular a amplitude de um conjunto de dados. No entanto, esta medida é muito pouco resistente para avaliar bem a dispersão dos dados pelas seguintes razões:

12 Outliers Outliers influenciando na amplitude Amplitude CVDOTCVDOT

13 Observe os seguintes conjuntos de dados representados por diagramas de pontos correspondentes a três conjuntos de observações: Para qualquer uma das três distribuições a amplitude é = 8 A amplitude é igual, mas as distribuições são muito diferentes Amplitude CVDOT

14 Amplitude Interquartil Ao contrário da amplitude, a amplitude interquartil Ao contrário da amplitude, a amplitude interquartil (AI ou IQR) é uma medida resistente (AI ou IQR) é uma medida resistente A amplitude interquartil é definida a partir dos quartis, A amplitude interquartil é definida a partir dos quartis, e é representada pela diferença entre o 3° e o 1° quartil e é representada pela diferença entre o 3° e o 1° quartil AI = Q 3 – Q 1 AI = Q 3 – Q 1 ou ainda ou ainda AI = P 75 – P 25 AI = P 75 – P 25

15 Exemplo Determinar a amplitude interquartil para os resultados de resistência à compressão (em MPa) apresentados abaixo: Amplitude Interquartil Q 3 deixa pelo menos 75% dos dados abaixo e pelo menos 25% dos dados acima dele 75% de 40 são 30 25% de 40 são 10 Contando 30 do menor para o maior: 63 Contando 10 do maior para o menor: 64 Q 3 = = 63,5 AI = Q 3 – Q 1 AI = Q 3 – Q 1

16 Exemplo Amplitude Interquartil Q 1 deixa pelo menos 25% dos dados abaixo e pelo menos 75% dos dados acima dele 25% de 40 são 10 75% de 40 são 30 Contando 10 do menor para o maior: 53 Contando 30 do maior para o menor: 53 Q 1 = 53 AI = Q 3 – Q 1 AI = Q 3 – Q 1 = 63,5 – 53 AI = 10,5

17 Diagrama de Caixa (Box-Plot) Este tipo de diagrama é útil para revelar: o centro a dispersão (variação) a distribuição dos dados além da presença dos outliers São necessários 5 números (Resumo dos 5 números): Limite inferior, 1º quartil, Mediana (2º quartil), 3º quartil e Limite superior Limite inferior, 1º quartil, Mediana (2º quartil), 3º quartil e Limite superior

18 Diagrama de Caixa (Box-Plot) Outlier Linha de whisker 1 o quartil 2 o quartil 3 o quartil Linha de whisker Outlier Outlier extremo AI = Q 3 – Q 1 AI = Q 3 – Q 1

19 Diagrama de Caixa (Box-Plot) Outlier Linha de whisker 1 o quartil 2 o quartil 3 o quartil Linha de whisker Outlier Outlier extremo Os diagramas de caixa não dão informação tão detalhada como os histogramas, de modo que podem não ser a melhor escolha ao lidar com um único conjunto de dados. Eles são, em geral, ótimos para comparar 2 ou mais conjuntos de dados. Nestes casos, é importante utilizar a mesma escala para comparações corretas

20 Linha de Whisker Linha que inicia-se nas extremidades da caixa e prolonga-se até o último valor respeitado um comprimento para a linha de no máximo 1,5 vezes a amplitude interquartilOutlier Ponto além da linha, porém a menos de 3 amplitudes interquartis a partir da extremidade da caixa. Outlier Extremo Ponto além da linha, porém a mais de 3 amplitudes interquartis a partir da extremidade da caixa. Linha de Whisker Outlier Linha de Whisker Outlier Outlier extremo Diagrama de Caixa (Box-Plot) Limite inferior: Q 1 – 1,5 (Q 3 – Q 1 ) Limite superior: Q 3 + 1,5 (Q 3 – Q 1 ) Limite superior: Q 3 + 1,5 (Q 3 – Q 1 ) Q3Q3 Q1Q1 Q2Q2

21 Exemplo Variação espacial e temporal da concentração de cloretos no Riacho do Silva em Maceió Diagrama de Caixa (Box-Plot) Exutório lagoa Mundaú

22 Diagrama de Caixa (Box-Plot) Montante jusante (em direção à lagoa Mundaú) Exemplo Variação espacial e temporal da concentração de cloretos no Riacho do Silva em Maceió (mg/L) O aumento considerável pode estar relacionado com a poluição? Ou com a influência do mar na lagoa?

23 Diagrama de Caixa (Box-Plot) Exemplo Variação espacial e temporal da concentração de cloretos no Riacho do Silva em Maceió (mg/L) Médias mensais de todos os pontos Há efeito sazonal?

24 Diagrama de Caixa (Box-Plot) Exemplo Variação espacial e temporal da concentração de cloretos no Riacho do Silva em Maceió (mg/L) Médias mensais de todos os pontos Há efeito sazonal?

25 Diagrama de Caixa (Box-Plot) Exemplo Do livro Hidrologia estatística

26 Exemplo Desenhar o diagrama de caixa para os resultados de resistência à compressão apresentados a seguir: Q 1 = 53 Q 2 = 57,5 Q 3 = 63,5 AI = 10,5 Diagrama de Caixa (Box-Plot) Limite inferior: Q 1 – 1,5 (Q 3 – Q 1 ) = 53 – 1,5 (10,5) = 37,25 Limite superior: Q 3 + 1,5 (Q 3 – Q 1 ) = 63,5 + 1,5 (10,5) = 79,25 Outliers extremos: x i Q (Q 3 – Q 1 ) Outliers extremos: x i 95

27 Outliers Diagrama de Caixa (Box-Plot) Q 1 = 53 Q 2 = 57,5 Q 3 = 63,5 AI = 10,5

28 Medidas de Dispersão Desvio médio amostral Uma maneira natural de calcular a dispersão é o desvio A dispersão total seria a média da soma destes desvios Mas...

29 Medidas de Dispersão Desvio médio amostral absoluto É uma maneira de contornar a incômoda propriedade do desvio médio amostral Esta maneira foi abandonada por que criou dificuldades nos métodos de inferência estatística e não representa um estimativa de dispersão populacional

30 Se n observações de uma amostra forem representadas por x 1, x 2,..., x n, a variância da amostra será: Medidas de Dispersão Variância ou

31 Variância A variância não é geralmente utilizada como medida de dispersão, mas é o suporte para o cálculo do desvio-padrão A interpretação do significado da variância, em situações concretas, levanta problemas Por exemplo, se estivermos estudando a concentração de um poluente num lago, em g/L, a média das concentrações é expressa em g/L, mas a variância será expressa em (g/L) 2

32 Varância para dados agrupados Se as observações de uma amostra estiverem agrupadas em classes, a variância será:Onde: k é o número de classes n i é a freqüência da i-ésima classe x i é o ponto médio da i-ésima classe x é a média dos dados agrupados n é a quantidade total de observações

33 Medidas de Dispersão Desvio-padrão Note que: Se n observações de uma amostra forem representadas por x 1, x 2,..., x n, o desvio padrão amostral será: O desvio-padrão corresponde à raiz quadrada positiva da variância

34 Propriedades do desvio-padrão 1. O desvio-padrão é sempre não negativo 3. Se o desvio-padrão é igual a zero é porque não existe variabilidade, isto é, os dados são todos existe variabilidade, isto é, os dados são todos iguais iguais 2. Quanto maior for o desvio-padrão maior será a dispersão dos dados em relação à média dispersão dos dados em relação à médiaDesvio-Padrão 4. O valor do desvio padrão pode crescer dramaticamente com a inclusão de um ou mais dramaticamente com a inclusão de um ou mais outliers outliers 5. As unidades do desvio padrão são as mesmas unidades dos dados originais unidades dos dados originais

35 Como achar o desvio-padrão? 1. Calcule a média 3. Eleve ao quadrado cada uma das diferenças obtidas no passo 2. isto resulta em números da forma no passo 2. isto resulta em números da forma 2. Subtraia a média de cada valor individual para obter a lista dos desvios da forma a lista dos desvios da formaDesvio-Padrão 4. Adicione todos os quadrados obtidos no passo 3. Esse é o valor Esse é o valor 5. Divida o total do passo 4 por n-1 6. Ache a raiz quadrada do resultado do passo 5

36 Medidas de Dispersão Coeficiente de variação É uma medida relativa de variabilidade, que compara o É uma medida relativa de variabilidade, que compara o desvio padrão com a média desvio padrão com a média cv = S x Como o desvio-padrão e a média apresentam a mesma Como o desvio-padrão e a média apresentam a mesma unidade dos dados, o coeficiente de variação é adimensional unidade dos dados, o coeficiente de variação é adimensional A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de diferentes conjuntos de dados A grande utilidade do coeficiente de variação é permitir a comparação das variabilidades de diferentes conjuntos de dados

37 Coeficiente de Variação Exemplo Exemplo Os resultados de ensaios de tração de dois tipos de aço forneceram os seguintes resultados: Aço A Aço B x = s = 512 MPa 13 MPa x = s = 590 MPa 18 MPa Qual deles apresenta menor variabilidade relativa?

38 Coeficiente de Variação A determinação da variabilidade relativa é feita a partir do coeficiente de variação: Desse modo, o aço A é o que apresenta resultados com menor variabilidade relativa Para o aço A: cv = 13 / 512 = 0,025 = 2,5% Para o aço B: cv = 18 / 592 = 0,031 = 3,1%

39 Determinar o coeficiente de variação para as observações de Determinar o coeficiente de variação para as observações de temperaturas T A e T B indicadas abaixo: temperaturas T A e T B indicadas abaixo: TATA TBTB Exemplo (medidas em ºC) Coeficiente de Variação

40 Passo 1: determinação das médias Passo 1: determinação das médias TATA TBTB (medidas em ºC) Coeficiente de Variação Para T A : x = ( )/5 = 125/5 = 25 Para T A : x = ( )/5 = 125/5 = 25 Para T B : x = ( )/5 = 125/5 = 25 Para T B : x = ( )/5 = 125/5 = 25 Passo 2: determinação do desvio-padrão Passo 2: determinação do desvio-padrão Para T A : s = { [ (21-25) 2 + (22-25) 2 + (24-25) 2 + (26-25) 2 + (32-25) 2 ] / (5-1) } 1/2 Para T B : s = { [ (10-25) 2 + (20-25) 2 + (26-25) 2 + (31-25) 2 + (38-25) 2 ] / (5-1) } 1/2 s = { 76 / 4 } 1/2 s = 4,36 o C s = { 456 / 4 } 1/2 s = 10,68 o C

41 Passo 3: determinação do coeficiente de variação Passo 3: determinação do coeficiente de variação Coeficiente de Variação TATA TBTB (medidas em ºC) Para T A : cv = 4,36 / 25 = 0,174 = 17,4 % Para T A : cv = 4,36 / 25 = 0,174 = 17,4 % Para T B : cv = 10,68 / 25 = 0,427 = 42,7 % Para T B : cv = 10,68 / 25 = 0,427 = 42,7 % Logo: Logo: Para T A, cv = 17,4 % e para T B, cv = 42,7 % Para T A, cv = 17,4 % e para T B, cv = 42,7 %

42 Estatística Aula 08 Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado pelo Prof. Wayne Santos de Assis Universidade Federal de Alagoas Centro de Tecnologia


Carregar ppt "Estatística Aula 08 Universidade Federal de Alagoas Centro de Tecnologia Prof. Marllus Gustavo Ferreira Passos das Neves Adaptado do material elaborado."

Apresentações semelhantes


Anúncios Google