MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
Estatística Medidas de posição Medidas de variabilidade ou dispersão ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO: Medidas de posição Medidas de variabilidade ou dispersão
Medidas de Tendência Central É um valor calculado para um grupo de dados usado para descrever esses dados. Tipicamente, desejamos que o valor seja representativo de todos os valores do grupo os dados observados tendem, em geral, a se agrupar em torno dos valores centrais.
Medidas de Tendência Central São Medidas de Tendência Central: média; mediana; moda
1 - MÉDIA ARITMÉTICA definida como a soma dos valores dividida pelo número de elementos. Sua aplicação é seguramente a mais usada podem ser: Média para dados simples Média para dados agrupados Média para dados agrupados em classes.
1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES (X) Exemplo: Dado um a idade de 5 crianças Xi (idade) : 4; 6; 8; 10; 12 média - x = 4 + 6 + 8 + 10 +12 5 X = ∑xi n sendo “ n “ o número de elementos Assim: X = 40 = 8 5 Portanto a idade média dessas 5 crianças é 8 anos.
Exemplo: Idade de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) Exemplo: Idade de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 X = 1+1+1 + 2+2+2 + 3+3+3+3 + 5+5+5+5+5+5 + 6+6+6 + 9 20 X = 1 . 3 + 2 . 3 + 3 . 4 + 5 . 6 + 6 . 3 + 9 .1 = 3+6+12+30+18+9 3 + 3 + 4 + 6 + 3 + 1 20
1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) Quando o conjunto de dados para os quais precisamos calcular a média é mais extenso, temos a necessidade de agrupar os dados. Assim, a média desse grupo é calculado da seguinte forma: X = (Xi . fi ) fi
1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) Xi fi Xi . fi 1 3 3 X = Xi . fi 2 3 6 fi 3 4 12 X = 78 = 3,9 5 6 30 20 6 3 18 9 1 9 - 20 78 Fonte: dados fictícios
1.3. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM CLASSES IDADE DE ALUNOS Xi PM fi PM.fi 0 2.......... 1 3 1.3 = 6 2 4.......... 3 7 3.7 = 21 4 6.......... 5 6 5.6 = 30 6 8.......... 7 3 7.3 = 21 8 10.......... 9 1 9.1 = 9 total ......... 20 87 Fonte: Dados fictícios X = (PM. Fi ) X = 87 X = 4,35 fi 20
2 – MEDIANA ( X ) É o valor que se localiza no centro da distribuição é obtida a partir de seus valores centrais Pode ser: 2.1 MEDIANA PARA DADOS SIMPLES 2.2 MEDIANA PARA DADOS AGRUPADOS 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES INTERVALARES
2.1 MÉDIANA PARA DADOS SIMPLES (X) ~ Há duas situações: 1) Quando o número de elementos pesquisados é ímpar Xi (idade) : 4; 6; 8; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª Xi posição central “ n “ o número de elementos ímpar Uma posição central - P P = n +1 P = 5 + 1 = 3ª posição => Xi = 8, portanto X = 8 2 2 ~
2.1 MÉDIANA PARA DADOS SIMPLES (X) ~ 2.1 MÉDIANA PARA DADOS SIMPLES (X) 2) Quando o número de elementos pesquisados é par Xi (idade) : 4; 6; 8; 10; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª 6ª X1 X2 P1 P2 (2 Posições centrais) “ n = 6 número PAR de elementos Duas posições centrais - P1 e P2 P1 = n P1 = 6 = 3ª posição => X1 = 8, X = X1 + X2 = 8 + 10 2 2 2 2 P2 = é a próxima P2 = 4ª posição => X2= 10, X = 9 ~ ~
2.2 MEDIANA PARA DADOS AGRUPADOS 1)Quando o nº de elementos é IMPAR Xi fi fac nº de elementos = 1 2 2 fi = 19 (ímpar) 2 3 5 3 4 9 uma posição central 5 6 15 P = fi +1 = 19+1 6 3 18 2 2 9 1 19 P = 10ª posição - 19
2.2 MEDIANA PARA DADOS AGRUPADOS Xi fi fac 1 2 2 2 3 5 3 4 9 5 6 15 6 3 18 9 1 19 Σ 19 Xi 1 1 2 2 2 3 3 posição 1ª 2ª 3ª 4ª 5ª 6ª 7ª Xi 3 3 5 5 5 5 5 posição 8ª 9ª 10ª 11ª 12ª 13ª 14ª Xi 5 6 6 6 9 posição 15ª 16ª 17ª 18ª 19ª
2.2. MÉDIANA PARA DADOS AGRUPADOS 1) Quando o nº de elementos é IMPAR Xi fi fac P = 10ª posição 1 2 2 2 3 5 3 4 9 Xi = 5 6 15 6 3 18 X = 5 9 1 19 - 19 ~
2.2 MÉDIANA PARA DADOS AGRUPADOS 2)Quando o nº de elementos é PAR Xi fi fac nº de elementos = fi = 20(par) 1 2 2 2 3 5 3 4 9 duas posição centrais 5 6 15 P1 = fi = 20 = 10ª posição 6 3 18 2 2 9 2 20 P2 = é a próxima= 11ª posição - 20
2.2 MÉDIANA PARA DADOS AGRUPADOS 2)Quando o nº de elementos é PAR Xi fi fac P1 = 10ª posição 1 2 2 P2 = 11ª posição 2 3 5 3 4 9 X1= X2= 5 6 15 6 3 18 X = (X1+ X2) = 5 + 5 9 2 20 2 2 - 20 X = 5 ~
2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO CENTRAL “P” P = Fi P = 23 P = 11,5º posição 2 2 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA”
2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac 0 2.......... 1 3 3 faa 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO CENTRAL “P” P = Fi P = 23 P = 11,5º posição 2 2 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA” li ls
2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac 0 2.......... 1 3 3 faa 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição central -> P = 11,5º posição Limite inferior da classe -> li = 2 Limite superior da classe -> ls = 4 Amplitude da classe -> h = ls - li = 4 – 2 = 2 Freqüência da classe -> fi = 10 Freqüência acumulada anterior -> faa = 3 ~ P - faa . h X = li + li fi ls ~ 11,5 - 3 . 2 X = 2 + 10
2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi PM fi fac 0 2.......... 1 3 3 faa 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 ~ 8,5 . 2 X = 2 + li 10 ls ~ X = 2 + 0,85 . 2 ~ X = 2 + 1,70 ~ X = 3,70
É o ponto de maior concentração de ocorrências de uma variável 2 – MODA ( X ) ^ É o ponto de maior concentração de ocorrências de uma variável Coincide com o conceito vulgar da palavra, isto é, o que ocorre com maior freqüência
2.1 – MODA PARA DADOS SIMPLES ( X ) ^ Exemplo: Idade de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 O valor que apareceu maior número de vezes é o 5 portanto => X = 5 ^
2.2 – MODA PARA DADOS AGRUPADOS ( X ) ^ Xi fi 1 2 2 3 3 4 5 6 6 3 9 1 - 19 Xi = Maior valor de fi ^ Xi = 5
2.3. MODA PARA DADOS AGRUPADOS EM CLASSES – MODA DE CZUBER - Xcz ^ Xi PM fi 0 2.......... 1 3 2 4.......... 3 10 4 6.......... 5 6 6 8.......... 7 3 8 10.......... 9 1 total ......... 23 1º passo: Achar a classe onde se encontra a maior freqüência - fmax fmax
Xi PM fi 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 2.3. MODA DE Czuber - XCZ ^ Xi PM fi 0 2.......... 1 3 2 4.......... 3 10 4 6.......... 5 6 6 8.......... 7 3 8 10.......... 9 1 total ......... 23 Limite inferior => li = 2 freqüência máxima => fmax = 10 Limite superior => ls = 4 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 fant li fmax ls fpos
1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 ^ 2.3. MODA DE Czuber - XCZ ^ Limite inferior => li = 2 freqüência máxima => fmax = 10 Limite superior => ls = 4 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 = 7 2 = fmax – fpost = 10 – 6 = 4 Cálculo da moda de Czuber Xcz = li + ___ 1 ___ . h 1 + 2 Xcz = 2 + __7__ . 2 = 2 + _7_ . 2 = 2 + 14 = 2 + 1,3 = 3,3 7 + 4 11 11 ^ ^
Xi PM fi ^ 2.3. MODA DE KING - Xki fant li fmax ls fpos 0 2.......... 1 3 2 4.......... 3 10 4 6.......... 5 6 6 8.......... 7 3 8 10.......... 9 1 total ......... 23 Limite inferior => li = 2 freqüência máxima => fmax = 10 Limite superior => ls = 4 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 fant li fmax ls fpos
2.3. MODA DE KING - Xki ^ Limite inferior => li = 2 freqüência máxima => fmax = 10 Limite superior => ls = 4 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 Amplitude da classe=> h = ls – li = 4 – 2 = 2 Cálculo da moda de KING Xki = li + fpost . h fant + fpost Xcz = 2 + 6 . 2 = 2 + 6 . 2 = 2 + 12 = 2 + 1,3 = 3,3 3 + 6 9 9 ^ ^
^ 2.3. MODA DE Pearson - Xpe _ ~ ^ ~ ^ ^ Cálculo da moda de PEARSON Xpe = 3. X - 2. X Exemplo: Em um levantamento de dados onde a Mediana = X = 4 Média = X = 4,2 A moda de Pearson será: X = 3.4 - 2 . 4,2 = 12 – 8,4 X = 3,6 _ ^ ~ ~ ^ ^
Outras separatrizes A Mediana divide a distribuição em duas partes. É o atributo que está no meio da distribuição: 50% dos valores acima da mediana 50% dos valores abaixo da mediana
Outras separatrizes QUARTIS ou QUARTILHOS o Quartil divide a distribuição em 4 partes de igual freqüência. Seu cálculo é importante para as medidas de dispersão e variabilidade São três:
Outras separatrizes Quartil São três: Q1 = quartil inferior ou primeiro quartil. Tem 25% da distribuição abaixo de si Q2 = é a mediana ou quartil mediano Q3 = quartil superior ou terceiro quartil. Tem 75% da distribuição abaixo de si
Quartil 1º quartil - Q1 = assume a posição P1q = Σfi 4
1º QUARTIL – Q1 Xi PM fi fac 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO DO PRIMEIRO QUARTIL “ P1q ” P1q = Fi P1q = 23 P 1q = 5,75º posição 4 4 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO QUARTIL – Q1”
Xi PM fi fac 1º QUARTIL – Q1 P1q - faa . h Q1 = li + li fi ls 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição 1º quartil -> P 1q= 5,75º posição Limite inferior da classe -> li = 2 Limite superior da classe -> ls = 4 Amplitude da classe -> h = ls - li = 4 – 2 = 2 Freqüência da classe -> fi = 10 Freqüência acumulada anterior -> faa = 3 P1q - faa . h Q1 = li + li fi ls 5,75 - 3 . 2 Q1 = 2 + 10
Xi PM fi fac 1º QUARTIL – Q1 2,75 . 2 Q1 = 2 + li 10 ls Q1 = 2 + 0,55 0 2.......... 1 3 3 faa 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 2,75 . 2 Q1 = 2 + li 10 ls Q1 = 2 + 0,55 Q1 = 2,55
3º QUARTIL – Q3 Xi PM fi fac 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO DO TERCEIRO QUARTIL “ P3q ” P3q = 3. Fi P3q = 3. 23 P 3q = 17,25º posição 4 4 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O TERCEIRO QUARTIL – Q3”
Xi PM fi fac 3º QUARTIL – Q3 P3q - faa . h Q3 = li + fi li ls 0 2.......... 1 3 3 2 4.......... 3 10 13 faa 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição central -> P 3q= 17,25º posição Limite inferior da classe -> li = 4 Limite superior da classe -> ls = 6 Amplitude da classe -> h = ls - li = 6 – 4 = 2 Freqüência da classe -> fi = 6 Freqüência acumulada anterior -> faa = 13 P3q - faa . h Q3 = li + fi li ls 17,25 - 13 .2 Q3 = 4 + 6
Xi PM fi fac 3º QUARTIL – Q3 4,25 . 2 Q3 = 4 + 13 li ls Q3 = 4 + 0,65 0 2.......... 1 3 3 faa 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 4,25 . 2 Q3 = 4 + 13 li ls Q3 = 4 + 0,65 Q3 = 4,65
Outras separatrizes Decil Dividem a distribuição em 10 partes de igual freqüência. São nove o quinto decil é a mediana.
Decil 1º decil - D1 = assume a posição P1d= Σfi 10
1º DECIL – D1 Xi PM fi fac 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO DO PRIMEIRO DECIL “ P1d ” P1d = Fi P1d = 23 P 1d = 2,3º posição 10 10 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO DECIL – D1”
Xi PM fi fac 1º DECIL – D1 P1d - faa . h li D1 = li + fi ls 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição 1º DECIL -> P 1d= 2,3º posição Limite inferior da classe -> li = 0 Limite superior da classe -> ls = 2 Amplitude da classe -> h = ls - li = 2 – 0 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 0 P1d - faa . h li D1 = li + fi ls 2,3 – 0 . 2 D1 = + 3
Xi PM fi fac 1º DECIL – D1 2,3 . 2 D1 = + 3 D1 = 1,53 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 2,3 . 2 D1 = + 3 D1 = 1,53
9º DECIL – D9 Xi PM fi fac 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO DO NONO DECIL “ P9d ” P9d = 9. Fi P9d = 9. 23 P9d = 20,70º posição 10 10 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O NONO DECIL – D9”
Xi PM fi fac 9º DECIL – D9 P9d - faa . h D9 = li + fi li ls 0 2.......... 1 3 3 2 4.......... 3 10 13 faa 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição central -> P 9d= 20,7º posição Limite inferior da classe -> li = 6 Limite superior da classe -> ls = 8 Amplitude da classe -> h = ls - li = 8 – 6 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 19 P9d - faa . h D9 = li + fi li ls 20,7 - 19 .2 D9 = 6 + 3
Xi PM fi fac 9º DECIL – D9 1,7 . 2 D9 = 6 + 3 D9 = 6 + 1,13 D9 = 7,13 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 faa 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1,7 . 2 D9 = 6 + 3 D9 = 6 + 1,13 D9 = 7,13
Outras separatrizes Centil ou Percentil Dividem a distribuição em 100 partes de igual freqüência. São noventa e nove o qüinquagésimo centil é a mediana.
Percentil - Ci 1º percentil - C1 = assume a posição P1c= Σfi 100
Xi PM fi fac 10º PERCENTIL – C10 0 2.......... 1 3 3 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO DO DÉCIMO PERCENTIL “ P10c ” P10c = 10 . Fi P10c = 10 .23 P 10c = 2,3º posição 100 100 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O Décimo Percentil – C10”
Xi PM fi fac 10º PERCENTIL – C10 P10c - faa . h li C10 = li + fi ls 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição 10º percentil -> P 10c= 2,3º posição Limite inferior da classe -> li = 0 Limite superior da classe -> ls = 2 Amplitude da classe -> h = ls - li = 2 – 0 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 0 P10c - faa . h li C10 = li + fi ls 2,3 – 0 . 2 C10 = + 3
Xi PM fi fac 10º PERCENTIL – C10 2,3 . 2 C10 = + 3 C10 = 1,53 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 2,3 . 2 C10 = + 3 C10 = 1,53
Xi PM fi fac 90º percentil – C90 0 2.......... 1 3 3 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1º passo: ACHAR A POSIÇÃO DO NONAGÉSIMO PERCENTIL “ P90c ” P90c = 90. Fi P90c = 9. 23 P90c = 20,70º posição 100 100 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O nonagésimo percentil – C90”
Xi PM fi fac 90º PERCENTIL – C90 P90c - faa . h C90 = li + fi li ls 0 2.......... 1 3 3 2 4.......... 3 10 13 faa 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 Posição central -> P 90c= 20,7º posição Limite inferior da classe -> li = 6 Limite superior da classe -> ls = 8 Amplitude da classe -> h = ls - li = 8 – 6 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 19 P90c - faa . h C90 = li + fi li ls 20,7 - 19 .2 C90 = 6 + 3
Xi PM fi fac 90º PERCENTIL – C90 1,7 . 2 C90 = 6 + 3 C90 = 6 + 1,13 0 2.......... 1 3 3 2 4.......... 3 10 13 4 6.......... 5 6 19 6 8.......... 7 3 22 8 10.......... 9 1 23 total ......... 23 1,7 . 2 C90 = 6 + 3 C90 = 6 + 1,13 C90 = 7,13
Relações Q1 = = C25 Q2 = D5 = C50 = X Q3 = = C75 D9 = C90 Quartil Decil Percentil Mediana D1 = C10 Q1 = = C25 Q2 = D5 = C50 = X Q3 = = C75 D9 = C90 ~
Outras médias Outras médias MÉDIA DE INTERVALO É a média entre a menor e a maior observação em um conjunto de dados. MÉDIA DAS JUNTAS ou Midhinge É a média entre o primeiro e o terceiro quartil. XMENOR + XMAIOR XMENOR + XMAIOR Média de Intevalo = Média de Intevalo = 2 2 Q1 + Q3 Midhinge = 2
Medidas de Dispersão As Medidas de Tendência Central: representam de certa forma uma determinada distribuição de dados só elas não são suficientes para caracterizar a distribuição. Para uma análise estatística mais exata é necessária a verificação da flutuação dos valores em torno de sua média aritmética
Medidas de Dispersão Suponha as notas de 2 grupos de estudantes, cada qual com 5 alunos. GRUPO “A” : 4, 5, 5, 6 GRUPO “B” : 0, 0, 10, 10 Média do grupo “A”: 5 Média do grupo “B”: 5
Medidas de Dispersão Os dois grupos apresentam a mesma média O comportamento dos 2 grupos são bem distintos. GRUPO “A”: valores são mais homogêneos GRUPO “B”: valores são dispersos em relação à média
Medidas de Dispersão Dentre as medidas de dispersão pode-se citar algums delas: a) Amplitude Total b) Amplitude Interquartil c) Desvio Quartílico ou Amplitude Semi-interquartílico d)Desvio Médio e) Variância f) Desvio Padrão
a) Amplitude Total - R é a diferença entre o maior e o menor valor observados. R = Limite superior - Limite Inferior Exemplo 5: Idade de 20 alunos: Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9 R = 9 – 1 = 8
b) Amplitude Interquartil – AIQ ou IQR ( InterQuartile Range ) é a diferença entre o terceiro quartil e o primeiro quartil. AIQ ou IQR = Q3 - Q1 Supera a dependência dos valores extremos Abrange 50% dos valores centrais, eliminando os 25% dos valores mais baixos e os 25% dos valores mais altos
c) Desvio Quartílico ou Amplitude Semi-interquartílico é a diferença entre o terceiro quartil e o primeiro quartil. Dq = Q3 - Q1 2
d) Desvio Médio - DM é a diferença entre o terceiro quartil e o primeiro quartil. DM = Σ Xi – X_ n Sendo: DM = Desvio Médio Xi = vr. variável n = nº elementos X = média aritmética
d) Desvio Médio - DM Exemplo 6: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 Calcule a média X = = = 4 Montar a tabela a seguir: Σ Xi 40 n 10
d) Desvio Médio - DM Σ 14 Xi Xi - x Xi – x 2 2 – 4 = - 2 2 2 2 – 4 = - 2 2 3 3 – 4 = - 1 1 3 3 – 4 = - 1 1 DM = = 4 4 – 4 = 0 0 4 4 – 4 = 0 0 DM = 1,56 5 5 – 4 = 1 1 10 10 – 4 = 6 6 Σ 14 Σ Xi – x_ 14 n - 1 9
d) Variância - 2 é a média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética Revela a dispersão do conjunto que se estuda
d.1) Variância - 2 – dados simples Exemplo 7: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 Calcule a média X = = = 4 Montar a tabela a seguir: Σ Xi 40 n 10
d.1) Variância - 2 – dados simples Xi Xi - x ( Xi – x )2 2 2 – 4 = - 2 22 = 4 3 3 – 4 = - 1 12 = 1 3 3 – 4 = - 1 12 = 1 2 = = 4 4 – 4 = 0 02 = 0 4 4 – 4 = 0 02 = 0 2 = = 5,33 5 5 – 4 = 1 12 = 1 10 10 – 4 = 6 62 = 36 Σ 48 Σ ( Xi – x )2 n - 1 48 9
d.2) Variância - 2 – dados agrupados Xi fi Xi . fi Xi - x ( Xi – x )2 ( Xi – x )2 . fi 2 2 2 . 2 = 4 2 – 4 = -2 (-2)2 = 4 4 . 2 = 8 3 4 3 . 3 = 9 3 – 4 = -1 (-1)2 = 1 1 . 3 = 3 4 3 4 . 3 = 12 4 – 4 = 0 02 = 0 0 . 3 = 0 5 1 5 . 1 = 5 5 – 4 = 1 12 = 1 1 . 1 = 1 10 1 10 . 1 = 10 10 - 4 = 6 62 = 36 36 . 1 = 36 Σ fi = 10 Σ fi = 40 Σ fi = 48 2 = 2 = = 5,33 Σ ( Xi – x )2 . fi Σ fi - 1 48 9
d.2) Variância - 2 – dados agrupados em classes Xi PM fi PM.fi PM-x ( PM–x )2 ( PM–x )2.fi 0 2..... 1 2 1.2 = 2 1-5= -4 (-4)2 = 16 16 . 2 = 32 2 4..... 3 4 3.4 = 12 3-5= -2 (-2)2 = 4 4 . 4 = 16 4 6..... 5 8 5.8 = 40 5-5= 0 02 = 0 0 . 8 = 0 6 8..... 7 6 7.6 = 42 7-5= 2 (2)2 = 4 4 . 6 = 24 8 10.... 9 1 9.1 = 9 9-5= 4 (4)2 = 16 16 . 1 = 16 total .... 21 105 88 Σ ( PM.fi) X = 105 = X = 5 Σ fi 2 = 4,4 21 Σ ( PM – x )2 . fi 88 2 = 2 = = 20 Σ fi - 1
d) Desvio Padrão - Por definição, é a raiz quadrada da média aritmética dos quadrados dos desvios É a mais utilizada Revela a dispersão do conjunto que se estuda = 2
e) Desvio Padrão - Se todos os valores forem iguais, o desvio padrão é nulo. quanto maior o desvio padrão mais heterogênea é a distribuição, significa que os valores são mais dispersos em torno da média MEDIA ± 1 => 68,26% dos valores MEDIA ± 2 => 95,44% dos valores MEDIA ± 3 => 99,74% dos valores
f) Coeficiente de Variação - CV CV = - desvio padrão X X - média artitmética o CV mede o grau de heterogeneidade da distribuição Valor máximo é CV = 1 0 ≤ CV ≤ 1
Coeficiente de Variação - CV Quanto mais próximo de 1: mais heterogênea é a distribuição Os valores estão mais dispersos Quanto mais próximo de 0: mais homogênea é a distribuição Os valores da variável estão mais próximos em torno da média
Coeficiente de Variação - CV Ex: Dado 2 estudantes cujas notas bimestrais foram: “a”: 60; 40; 50; 50 “b”: 70; 70; 30; 30 Qual foi mais regular ?
f) Coeficiente de Variação - CV Na comparação de variabilidade de dois ou mais conjuntos de dados: expressos em diferentes unidades de medida expressos nas mesmas unidades, mas com médias diferentes.
f) Coeficiente de Variação - CV Comparação de valores expressos em diferentes unidades de medida Exemplo 8: Deseja-se comparar qual grandeza varia mais: PESO ou COMPRIMENTO XPESO = 20 g XCOMPRIMENTO = 50 metros PESO = 2 g COMPRIMENTO = 4 metros
f) Coeficiente de Variação - CV PESO 2 CVP = CVP = CVP = 0,10 20 XPESO COMPRIMENTO 4 CVC = CVC = CVC = 0,08 50 XCOMPRIMENTO CVPESO = 0,10 ≥ CVCOMPRIMENTO = 0,08 PESO varia mais que o comprimento
f) Coeficiente de Variação - CV expressos nas mesmas unidades, mas com médias diferentes Exemplo 9: Deseja-se comparar qual grupo “ A ” ou “ B “ tem mais variação de rendimento em um processo: XA = 80 % XB = 50 % A = 2 % B = 1 %
f) Coeficiente de Variação - CV 2 CVA = CVP = CVA = 0,025 80 XA B 1 CVB = CVB = CVB = 0,020 50 XB CVA = 0,025 ≥ CVB = 0,020 O rendimento do Produto A varia mais que o rendimento do produto B no decorrer do processo
Esquema dos 5 Números Box – Plot ou Gráfico Box-and-Whisker XMENOR XMAIOR 25% 25% 25% dos dados 25% dos dados ~ Q1 3º Quartil X Mediana Q3 3º Quartil
Dados suspeitos ou Outliers IQR = Q3 - Q1 Q1 - 3 . IQR Q3 + 3 . IQR Q1 – 1,5. IQR Q3 + 1,5. IQR Possível suspeito