IV - Descrição e Apresentação dos Dados Prof. Herondino
Dados A palavra "dados" é um termo relativo, tratamento de dados comumente ocorre por etapas, e os "dados processados" a partir de uma etapa podem ser considerados os "dados brutos" do próximo. (Wikipédia) Dados Brutos Em informática dados brutos (raw data) designam os dados/valores recolhidos e estocados tal qual foram adquiridos, sem terem sofrido o menor tratamento (Wikipédia)
Dados Brutos Suponhamos o seguintes dados Brutos como sendo a idade de alunos de uma turma de informática 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12
Frequência A frequência de uma observação é o número de repetições dessa observação no conjunto de observações, ou ainda, é o número de vezes que conjuntos de dados aparecem em uma “população”.
Distribuição de Frequência Simples ( ) Dados ou variável (Idade) 11 2 12 5 13 6 14 7 15 3 16 17 1 Frequência (nº de Alunos)
Frequências Relativas A frequência relativa é o valor da frequência absoluta dividido pelo número total de observações. Variável (idade) frequência absoluta (Nº de alunos) frequência relativa 11 2 2/26 = 0,0769 12 5 5/26 = 0,1923 13 6 6/26 = 0,2308 14 7 7/26 = 0,2692 15 3 3/26 = 0,1154 16 17 1 1/26 = 0,0385 TOTAL = 26 1,0000
Frequência Acumulada Variável freqüência absoluta freqüência relativa relativa acumulada 11 2 2/26 = 0,0769 2/26 = 0,0769 12 5 5/26 = 0,1923 7 7/26 = 0,2692 13 6 6/26 = 0,2308 13/26 = 0,5000 14 7/26 = 0,2692 20 20/26 = 0,7692 15 3 3/26 = 0,1154 23 23/26 = 0,8846 16 25 25/26 = 0,9615 17 1 1/26 = 0,0385 26 26/26 = 1,0000 TOTAL = 26 =1,0000
Regras de arredondamento na Numeração Decimal Norma ABNT NBR 5891 1) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação Exemplo: 1,333 3 arredondado à primeira decimal tornar-se-á 1,3
Regras de arredondamento na Numeração Decimal 2) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for superior a 5, ou, sendo 5, for seguido de no mínimo um algarismo diferente de zero, o último algarismo a ser conservado deverá ser aumentado de uma unidade Exemplo 1,666 6 arredondado à primeira decimal tornar-se-á: 1,7. 4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.
Regras de arredondamento na Numeração Decimal 3) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for 5 seguido de zeros, dever-se-á arredondar o algarismo a ser conservado para o algarismo par mais próximo. Consequentemente, o último a ser retirado, se for ímpar, aumentará uma unidade. Exemplo: 4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6.
Regras de arredondamento na Numeração Decimal 4) Quando o algarismo imediatamente seguinte ao último a ser conservado for 5 seguido de zeros, se for par o algarismo a ser conservado, ele permanecerá sem modificação. Exemplo: 4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.
Atividade - III Verificar a altura em centímetro de cada aluno da turma e construir uma sequência de Dados Brutos; A partir dos Dados Brutos obtidos, construir a distribuição de frequência absoluta simples, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891.
Apresentação dos dados Quando se dispõe de um grande número de observações, torna-se extremamente difícil a leitura de valores colocados em tabela.
Histograma Um histograma é uma representação gráfica de uma única variável que representa a frequência de ocorrências (valores dos dados) dentro de categorias de dados. O histograma tanto pode ser representado para as frequências absolutas como para as frequências relativas. Nota nº de Alunos 1 2 3 4 6 5 8 12 7 10 9 Total 50
Polígono de Frequência O Polígono de frequências é obtido ligando-se os pontos médios dos topos dos retângulos de um histograma.
Sobrepondo
Histograma de frequência acumulada (ou ogiva) histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento da frequência acumulada.
Gráfico de Setores É designado por um círculo, onde cada classe é representada por um setor circular, cujo ângulo é proporcional ao tamanho da amostra.
Distribuição de Frequência agrupadas em Classe Para a determinação de classes não existe uma regra pré estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada. 1. Definir o número de classes Se n representa o número de observações (na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculado por Número de Classes = arredondando os resultados. Quando tratamos de variáveis quantitativas contínuas os valores observados devem ser tabulados em intervalos de classes.
Exemplo Nº de Classes = Fazendo arredondamento para 6 Altura em cm da Turma CA 2013 Nº de Classes = Fazendo arredondamento para 6 Fonte: Marques, 2013
Distribuição de Frequência agrupadas em Classe 2. Calcular a amplitude das classes Essa será obtida conhecendo-se o número de classes e amplitude total dos dados. A amplitude total dos dados é o resultado da subtração valor máximo - valor mínimo da série de dados
Exemplo Rol Fonte: Vaz,2013
Distribuição de Frequência agrupadas em Classe 3. Distribui a frequência dos dados agrupados por classe O limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite superior, com exceção da última classe. (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 02 158 164 03 164 170 04 170 176 05 176 182 06 182 188 Total Limite Inferior Limite Superior
Distribuição de Frequência agrupadas em Classe (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total Fonte: Tillmann, 2013
Medidas de posição ou tendência central 1. Média Aritmética
Exemplo: A nota final (NF) do curso será dada pela fórmula: Em que: AP – Avaliação Parcial AF – Avaliação Final Sendo AP (Avaliação Parcial) a média aritmética das atividades propostas (AT1, AT2,...,ATn) A cada AT será atribuído valores de 1 a 5.
Exemplo:
Medidas de posição ou tendência central Propriedades da média aritmética A média é um valor típico, ou seja, ela é o centro de gravidade da distribuição, um ponto de equilíbrio. Seu valor pode ser substituído pelo valor de cada item na série de dados sem mudar o total. Simbolicamente temos: 2. A soma dos desvios das observações em relação a média é igual a zero. A soma dos desvios elevados ao quadrado das observações em relação a média é menor que qualquer soma de quadrados de desvios em relação a qualquer outro número. Em outras palavras, é um mínimo.
Exemplo
Medidas de posição ou tendência central 2. Média Ponderada Onde é o peso da observação i
Exemplo A universidade definiu que as avaliações parciais teriam peso de 30% e a prova final teria peso de 40% no cálculo dos rendimentos dos alunos. Veja o quadro abaixo e calcule a média do aluno. 8,0 0,30 Ap 2 9,0 9,6 Ap nota peso Ap 1 Final 0,40
Média aritmética Ponderada em dados agrupados (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total ( Ponto médio)
Média aritmética Ponderada em dados agrupados (Nº de Ordem) (Altura em cm) ( Nº de alunos) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total ( Ponto médio) 155 1395 161 1288 167 835 173 692 179 537 185 4932
Mediana (Md) A mediana é o valor do item central da série quando estes são arranjados em ordem de magnitude Exemplo: 2, 4, 5, 7, 8 Md=5 2, 5, 6, 9, 10, 13, 15 Md=9 3, 5 ,8 ,10, 15 ,21 Md=9 Para o calculo da mediana, têm-se: Se a série for ímpar sua posição será dada por ou se for Par a sua posição é dada por
Mediana (Md) Cálculo da mediana Se série ímpar Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 2, 5 } Md=2 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 1 2 3 4 5
Mediana (Md) Cálculo da mediana Se a sequência for par Ex: Calcule a mediana da série { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 } 1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª 9ª 10ª 1 2 3 4 5 6
Mediana (Md) para valores agrupados A partir da distribuição de frequência acumulada ou ogiva, inicialmente determina-se a classe que contem a mediana. (Nº de Ordem) (Altura em cm) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total 9 30 17 57 22 73 26 87 29 97 100
Mediana (Md) para valores agrupados mmm 17 9 158 Md 164
Mediana (Md) para valores agrupados = limite de classe inferior da classe da mediana; = frequência acumulada da classe imediatamente anterior à classe da mediana; = frequência absoluta simples da classe da mediana, = amplitude (tamanho) da classe da mediana.
Exemplo:
Moda (Mo) É o valor que ocorre com maior frequência em uma série de valores. Exemplos: a){ 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. b){ 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal. c){ 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal.
Moda (Mo) – Dados agrupados Sem intervalo de classe: é o valor da variável de maior frequência. Exemplo: Nota nº de Alunos 1 2 3 4 6 5 8 12 7 10 9 Total 50
Moda (Mo) – Dados agrupados Com intervalos de classe: A classe que apresenta a maior frequência é denominada classe modal. Nesta, é o valor dominante que está compreendido entre os limites da classe modal. O cálculo da moda consiste em tomar o ponto médio da classe modal (Moda Bruta). (Nº de Ordem) (Altura em cm) 01 152 158 9 02 158 164 8 03 164 170 5 04 170 176 4 05 176 182 3 06 182 188 1 Total
Moda (Mo) – Classes agrupada Método pela fórmula de CZUBER: : limite inferior da classe modal : frequência anterior a classe modal : frequência posterior a classe moda : frequência da classe modal : amplitude da classe modal 54 58 9 58 62 11 62 66 8 66 70 5
Interpretação Geométrica
Atividade IV
Referência BERTHOUEX, Paul Mac; BROWN, Linfield C.. Statistics for Environmental Engineers. 2ª Boca Raton London New York Washington, D.c: Lewis Publishers, 2002. MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. São Paulo: Saraiva, 2006. TRIOLA, Mario F. Introdução à estatística. Rio de Janeiro: LTC, 1999.