Medidas de tendência central Mostra o valor em torno do qual se agrupam as observações Média aritmética Mediana Moda Juntamente com as medidas de dispersão, as medidas de tendência central permitem caracterizar de maneira concisa um conjunto de dados.
Média Aritmética Média – distribuição de freqüência Se os dados estiverem classificados em distribuição de freqüência tem-se: com k classes Xj são os valores centrais das classes e fj são as freqüências
Ex. 1: Média = [(0x32) + (1x46) + (2x50) + ...+ (2x8)]/200 Numero médio de filhos = 2,11 Pode-se utilizar a freqüência relativa. Nesse caso:
Ex. 2: Média = [(154x2) + (159x6) +(164x24)+....+(194x2)]/200 Altura média dos estudantes = 174 cm
Mediana Mediana de um conjunto de dados é o valor tal que metade dos dados são iguais ou inferiores a esse valor e metade dos dados são iguais ou superiores a esse valor Dispõem-se os dados em ordem crescente ou decrescente A mediana é o valor que é precedido e seguido pelo mesmo número de dados.
Para números ímpares de dados – a mediana é o valor central Ex.: Conjunto dos pesos em quilogramas de cinco pessoas P = {61, 74, 69, 68, 59} e, reorganizando, P ={59, 61, 68, 69, 74} Mediana = 68 Para números pares de dados, a mediana é a média dos dois valores centrais A = {2, 3, 5, 6, 7, 10} Mediana = 5,5
Mediana - dados dispostos em distribuição de freqüência (variável discreta) Ex.1: Mediana = ?
Mediana - dados dispostos em distribuição de freqüência (variável contínua) Primeiro tem-se que localizar a classe mediana (classe que contém a mediana) D = mediana h = h-ésima classe Lh = limite inferior da classe mediana Lh+1 = limite superior da classe mediana n = número de observações fh = freqüência da classe mediana
Ex. 2:
Moda Moda de um conjunto de dados é o valor que ocorre com maior freqüência, isto é, é o valor mais comum. Um conjunto de observações pode não ter moda ou ter mais de uma moda: A = {2, 3, 5, 6, 7, 10} não tem moda B = {1, 2, 2, 3, 4} moda = 2 C = {1, 1, 2, 3, 4, 4} tem duas modas
Moda - dados dispostos em distribuição de freqüência (variável discreta)
Moda - dados dispostos em distribuição de freqüência (variável contínua) Primeiro localiza-se a classe modal: para intervalos de classe que têm a mesma amplitude, a classe modal é aquela que apresenta a maior freqüência; para intervalos de classe com diferentes amplitudes, a classe modal é aquela que apresenta o maior valor para o quociente da divisão da freqüência pela amplitude do intervalo de classe; No histograma, a classe modal é aquela que corresponde ao retângulo de maior altura. Pode-se adotar o valor central da classe modal como sendo a moda da distribuição de freqüência, mas alguns autores recomendam:
M = moda h = h-ésima classe Lh = limite inferior da classe modal Lh+1 = limite superior da classe modal fh = freqüência da classe modal fh-1 = freqüência da classe anterior à modal fh+1 = freqüência da classe posterior à modal
Ex. 1:
Posição relativa da média, da moda e da mediana e a assimetria da distribuição Média = Moda = Mediana = 3 f X
Moda < Mediana < Média f X
Média < Mediana < Moda X f
Média Geométrica Aplicando-se logaritmos Para qualquer conjunto de n números não-negativos tem-se:
Média Geométrica - continuação Conclui-se que: só se É um valor positivo
Média Harmônica Demonstração H < G Para duas observações: Lembrando que Tem-se
Média Harmônica - continuação Como e ambos são positivos
Média Ponderada
Propriedades A moda é o valor em relação ao qual é máximo o número de desvios nulos (conseqüência imediata da definição da moda). A média aritmética é o valor em relação ao qual é mínima a soma do quadrados dos desvios. A mediana é o valor em relação ao qual é mínima a soma dos valores absolutos dos desvios
A média aritmética é o valor em relação ao qual é mínima a soma dos quadrados dos desvios. A soma dos desvios em relação à média é igual a zero. Considerando na qual a é um valor qualquer
Elevando ambos os membros ao quadrado e somando: Para a diferente da média, a soma dos quadrados dos desvios é maior que a soma dos quadrados dos desvios em relação à média.
D3 = terceiro decil h = h-ésima classe Lh = limite inferior da classe que contém o ponto de interesse Lh+1 = limite superior da classe que contém o ponto de interesse n = número de observações fh = freqüência da classe que contém o ponto de interesse