MANIPULAÇÃO DE DADOS Medidas.

Slides:



Advertisements
Apresentações semelhantes
Introdução ao processamento de dados e à estatística - parte 02
Advertisements

LOGÍSTICA EMPRESARIAL
CAPÍTULO 7 TESTE DE HIPÓTESE
PESQUISA DE MARKETING 10a Aula
Q-Q plots Construídos a partir das distribuições marginais de cada componente do vetor p-variado. São de fato um gráfico do quantil amostral versus quantil.
Separatrizes As separatrizes são medidas de posição que permitem calcularmos valores da variável que dividem ou separam a distribuição em partes iguais.
Medidas de Dispersão.
CAPÍTULO 7 TESTE DE HIPÓTESE
A CARTOGRAFIA TEMÁTICA E A ESTATÍSTICA
ESTIMAÇÃO.
Estatística Descritiva Aula 02
Medidas de Tendência Central DADOS AGRUPADOS
QUESTIONÁRIOS Prof. Adalberto.
Medidas de Posição e Dispersão
Estatística Básica Utilizando o Excel
. Capítulo 1 Introdução à Estatística Capítulo 1 Introdução à Estatística Prof. Paulo Renato de Morais ESTATÍSTICA APLICADA.
Capítulo 6 Estimativas e Tamanho de Amostras
Métodos Quantitativos
ALGUMAS MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS
MEDIDAS DE DISPERSÃO Medidas de tendência central fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação.
ESTATÍSTICA BÁSICA.
Estatística Descritiva
Estatística e Probabilidade
Probabilidade e estatística-Mat013
ESTATÍSTICA.
MBA em Gestão de Empreendimentos Turísticos
MEDIDAS DE VARIABILIDADE DADOS NÃO-AGRUPADOS
Quais são, suas médias, medianas e modas?
Quais são, suas médias, medianas e modas?
ESTATÍSTICA DESCRITIVA
Medidas de Dispersão ou de Variabilidade:
Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.
Aula 08 Medidas de posição - Prof. Diovani Milhorim
Estatística – Unidade 2.
ESTATÍSTICA DECRITIVA
ELABORAÇÃO DE QUESTIONÁRIOS
Desafios gerenciais Aula 4.
Medidas de tendência central
Modelagem Estatística
CLASSES: SÃO INTERVALOS DE VARIAÇÃO DA VARIÁVEL.
Escalas de medidas E. Maranhão
ANÁLISE ESTATÍSTICA II
Aula 07 Medidas de posição - Média Prof. Diovani Milhorim
Inferência Estatística
Aula 10 Medidas de dispersão Prof. Diovani Milhorim
Estatística Aula 13 Prof. Marllus Gustavo Ferreira Passos das Neves
Medidas de Dispersão Aula 8.
Prof. André Aparecido da Silva
Medidas Estatísticas Para Dados Agrupados Prof. Gercino Monteiro Filho
Matemática Financeira
Medidas de localização
CURSO DE ARQUIVOLOGIA CCBSA - UEPB – Campus V
13/10/2009 Medidas Descritivas. 13/10/2009 Notações de algumas estatísticas. MedidasParâmetrosEstimadores Número de Elementos Nn MédiaμX, com barra acima.
Definição de Estatística
Disciplina Engenharia da Qualidade II
Separatrizes Quartis Decis Percentis TIPOS:
PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA
DISTRIBUIÇÕES DE PROBABILIDADE
Metodologia da Pesquisa em Ensino de Ciências I
Estatística Descritiva
Usando Excel Prof. Rosemberg Trindade. Parte 1 Representação tabular de distribuição com variáveis discretas e contínuas.
MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
MEDIDAS DE TENDÊNCIA CENTRAL
ESTATÍSTICA.
NOÇÕES DE INFERÊNCIA ESTATÍSTICA
Distribuição. de freqüência
Distribuição de freqüências
Estatística Aplicada à Administração Prof. Alessandro Moura costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.
Autor : Lênin Charqueiro. Pelotas,8 de março de
Transcrição da apresentação:

MANIPULAÇÃO DE DADOS Medidas

IDENTIFICAR Cada elemento na amostra deverá ser identificado. Isto é particularmente importante para manter anonimato. Se os sujeitos foram selecionados aleatoriamente ou designados aleatoriamente, os números usados para o procedimento aleatório podem ser usados. Faça uma lista mestra de nomes com números de identificação correspondentes e mantê-la num arquivo seguro no caso de ser necessário mais referências.

Medição adequada Para garantir o uso da análise estatística selecionada é importante que o item representando cada variável esteja no nível de medição desejada e apropriada.   Por exemplo, o pesquisador pode desejar usar o Teste “t”, mas tem dado ordinal. Neste caso, o nível de medição não é apropriado.

Procedimentos de análise 1. Atribuir Números às Categorias.   2. Inserir dados no Computador. 3. Usar Resultados de Estudo Piloto para o Estabelecimento de Categorias.

Marca ótica Utilizada para leitura automática. Exemplo: cartao resposta de vestibulares.

Escolher análise apropriada Checar que cada tipo de análise estatística e resumo de dados produzem dados na forma que você desejar.

PLANEJAR EDIÇÃO DE DADOS Vc pode encontras inconsistencias devido: Sem Resposta (Dados que faltam / perdidos).  Vc deve decidir como manipular possíveis dados perdidos (ou que faltam).   Respostas Incorretas.  Recomendação. A autora recomenda a omissão de tais respostas com base em que não podem realmente saber quais as intenções que os entrevistados tinham na realidade.  Manuscrito Ilegível. Linguagem Firme e Inventiva. Pode utilizar linguagem indecente.

Continuação Respostas inconsistentes. Por exemplo, um entrevistado pode checar o grupo de idade “15-18” e então checar o nível educacional “grau doutoral”. De fato, alguns pesquisadores usam itens semelhantes, estes como escalas “falsas” para determinar se um entrevistado pode estar mentindo e neste caso invalidar o instrumento por inteiro.

Planejar tempo para examinar dados Planejar o tempo no qual os dados podem ser completamente examinados para resultados imprevistos. É mais importante que ir direto para suas questões de pesquisa ou hipóteses.

Exemplos A DEMONSTRAÇÃO O QUE FOI OMITIDO E DEVERÁ SER INCLUIDO   1. Significativamente mais entrevistados 97% dos entrevistados não usam marca X do que marca Y. usaram marca X ou Y. 2. A hipótese de que a fábrica Texas tem Nenhum empregado em qualquer fábrica esteve uma elevada taxa de absenteísmo foi ausente mais do que 2 dias por mês.  3. Uma proporção maior de pessoas 75% dos entrevistados foram que não trabalham fora de casa mulheres. preferiu assistir TV durante o horário do dia mais do que no começo ou mais tarde da noite. 4. A correlação de 0.09 foi significante O valor é muito baixo.

Descobertas imprevistas Uma das maiores razões para examinar os dados é para constatar descobertas imprevistas. Estes são dados que o pesquisador não espera encontrar. No exemplo acima, o pesquisador não antecipa que 97% dos entrevistados não usaram tampouco Marca X ou Marca Y (embora talvez eles deveriam ter).

Exemplos Pessoas que concluíram um levantamento sobre a freqüência no cinema pode começar a assistir mais filmes ou pessoas dadas a certas dietas pode começar a necessitar de açúcar.

Gerar novas variáveis Exemplo: Por exemplo, itens do questionário incluem medições de variáveis: 1) freqüência de assistência de concertos ou bales; 2) freqüência de comparecimento ao teatro legítimo, e; 3) freqüência de jantar nos restaurantes. Estas variáveis podem ser combinadas para formar uma outra variável chamada “tipo de estilo de vida” .

Distribuição de frequencia Primeiro passo para redução de dados. Definição. Um arranjo de contagens ou categorias com a freqüência de ocorrência (f) de cada contagem ou categoria indicada. Pode se adotar intervalos de classe.

Exemplos 1.Número de vendas na quinta-feira 3. Exemplo de distribuição de freqüência com intervalos de classes   Nº de cada venda f Total de vendas Contagem no teste f 5 12 60 95-99 3 4 21 84 90-94 5 3 36 108 85-89 12 2 23 46 80-84 18 1 18 18 75-79 23 0 14 0 70-74 20 65-69 19 Total 124 316 60-64 15 55-59 7 12 pessoas fizeram 5 vendas cada quinta- feira 50-54 5 Total de pretendentes 127

Medidas de tendencia central Definição. Uma medida da média ou contagem típica numa distribuição de contagens. As três medidas de tendência central mais freqüentemente usadas são: 1) a média, a qual requer pelos menos um intervalo no nível de medição; 2) a mediana, a qual requer pelo menos um nível ordinal de medição, e ; 3) a moda, a qual requer pelos menos um nível nominal de medição.  

Média As médias são muito familiares para todos nós porque elas são usadas também freqüentemente por toda nossa vida para relatar contagens médias. Por exemplo, os negociantes freqüentemente relatam suas vendas totais médias, despesas, número de pessoas empregadas e número de unidades vendidas.

Média EXPOSIÇÃO 14.3. O PROCESSO PARA CALCULAR UMA MÉDIA   1. Registrar as contagens. 2. Juntar todas as contagens. 3. Dividir pelo número total de contagens. Fórmula: X = X / N onde: X = a média de uma amostra X = soma das contagens N = número de contagens. Exemplo: O número de fornos microondas vendido durante 5 dias foi: 10, 9, 15, 6, 10. X = 50 X = 50 / 5 = 10 ( o número médio de fornos microondas vendidos por dia).

Média A média reflete e é afetada por toda contagem na distribuição, porque toda contagem é usada na soma. Por conseguinte, as contagens extremas afetam a média. Por exemplo: 5 vendedores venderam o seguinte número de lavadoras de pratos: 40, 6, 6, 5, 3. Se a média foi calculada, a conclusão seria que a média das vendas das 5 pessoas foi 12 lavadoras de pratos. Todavia, quatro das cinco pessoas venderam menos do que 7 e uma vendeu 40! A média não é uma medida representativa da tendência central em tais casos.  

Média Quando há contagens extremas, também usa-se a mediana ou, no caso de um conjunto de contagens muito diferentes, descrever as contagens. Por exemplo, no item 2 acima podemos informar que o número mediano de lavadoras de pratos vendidas foi 6, mesmo que uma pessoa vendeu 40. Se há poucas contagens submetidas ao conjunto completo de contagens para melhor entendimento. A média é adequada somente para dados ao nível de intervalos ou de razão de medição.

Média Por conseguinte, a média não pode ser usada quando os dados à nível de intervalo ou de razão tenham sido modificados para ordinal.

Média Não obstante estes cuidados, a média é considerada a medida de tendência central mais estável. O fundamento para essa conclusão é que quando diversas amostras são retiradas de uma população, as médias destas amostras serão totalmente similares e diferirão menos do que amostras de medianas ou modas.

Mediana Definição. Uma medida de tendência central que é a contagem central num conjunto ordenado de dados que são para o ordinal ou nível de medição mais alto. Com um número impar de contagens, a mediana é o valor central. Para um número igual de contagens, a mediana é a metade entre os dois valores centrais.

Mediana O PROCESSO PARA CALCULAR UMA MEDIANA 1. Registrar as dados em ordem do mais superior para o mais inferior. 2. Selecionar o valor central, se há um número ímpar de contagens. 3. Se há um número par de contagens, somar as duas medidas centrais consecutivamente e dividir por 2.

Exemplo Número Impar de Contagens Número Par de Contagens 10 15 7 12 10 15 7 12 5 10 3 8 2 5 4 Mediana = 5 Mediana =( 10 + 8) / 2 = 9

Moda Definição. Uma medida de tendência central cuja contagem freqüentemente mais aparece numa distribuição de contagens as quais são nominais ou de nível de medição mais alto.  O PROCESSO PARA ESCOLHER UMA MODA 1. Registrar os dados em ordem do mais superior para o mais inferior. 2. Escolher o valor que ocorre mais freqüentemente como a moda. Exemplo: 15, 15, 15, 9, 8, 8, 1, 1, 1, 1. A moda = 1 a contagem que ocorre mais freqüentemente. CUIDADO: Notar que a moda é muito instável. Se as duas contagens mais inferiores forem omitidas, a moda seria 15 em vez de 1.

Medidas de variabilidade As medidas de variabilidade são usadas para avaliar a extensão ou a dispersão de um conjunto de dados. Elas são freqüentemente mais usadas em: 1) análises estatísticas, e; 2) em projetos de pesquisa . Definição. Variabilidade: O grau para o qual os dados dentro dos limites de uma distribuição diferem entre si. As medidas de variabilidade mais freqüentemente usadas são o desvio padrão e seu quadrado, a variância. Ambas requerem ao menos um nível de intervalo de medição.

Variância e desvio padrão Definição. Variância: Uma medida de variabilidade que é a média dos desvios quadrados da média numa distribuição. A variância é o quadrado do desvio padrão. Símbolos: s2 , 2  Definição. Desvio Padrão: Uma medida de variabilidade que é a raiz quadrada da variância. Ele indica a média dos desvios dos dados da média de uma distribuição. Símbolos: s , 

Desvio padrão e variância Fórmulas para Desvio Padrão:  =  ( X - Xm )2 / N =   x2 / N =  N  X2 - (  X )2 / N2 *   Onde:  X = soma dos dados X = média  X2 = soma de cada valor ao quadrado N = número de dados ou observações. (  X )2 = soma dos valores ao quadrado x = X - X ou contagem do desvio ( * ) Notar que N(N-1) é usado no lugar de N2 quando calcula-se s, o desvio padrão da amostra.

Amplitude A amplitude é uma simples medida de variabilidade muitas vezes usada para uma rápida observação dos dados. Definição. Amplitude: Uma medida de variabilidade que é geralmente calculada pela subtração entre o menor valor e o maior valor.

Tabela de contingencia Um outro método útil para resumir e examinar os dados é usar uma tabela de contingência na qual as observações são tabuladas em cruz.   Definição. Tabela de Contingência: Uma tabela que demonstra classificações agrupadas de duas ou mais variáveis, indicando o número de observações em cada uma das classificações agrupadas = células. Definição. Tabulação cruzada: A tabulação do número total de observações dentro de classificações associadas de duas ou mais variáveis.

Exemplo EXPOSIÇÃO 14.9. EXEMPLO DE UMA TABELA DE CONTINGÊNCIA   Bônus Preferenciais Dinheiro Férias Total Fêmeas 20 10 30 Machos 20 30 50 Total 40 40 80 20 das 30 fêmeas e 20 dos 50 machos preferiram dinheiro como um bônus.

Percentagens A adição de porcentagens às distribuições de freqüência ou às tabelas de contingência freqüentemente ajuda na interpretação dos dados. Contudo, cuidado deve ser tomado quando porcentagens são usadas.  1. Não usar porcentagens com números pequenos. Eles seriam ilusórios.    Por exemplo: Número e Percentual de Pessoas Que Adquiriram Tipos de Feijão  Tipo Número % Feijão Verde 4 50 Feijão Pinto 2 25 Feijão Kidney 1 12.5 Feijão Wax 1 12.5 Total 8 100 Um leitor vê que 25% das pessoas compraram feijão pinto, certamente ilusório embora considerando que somente 2 pessoas compraram também.

Pacotes estatísticos Para usar os pacotes estatísticos multifunção adquira os manuais dos programas e siga as orientações. Os manuais da maioria dos pacotes dá as orientações explícitas e requerem muito pouca experiência. Uma alternativa é ter uma pessoa com bom conhecimento no uso do pacote particular que conduz as análises. CUIDADO: Uma das menos desejáveis porém predominantes conseqüências do uso de pacotes estatísticos é que, por eles serem fáceis de usar, muitas pessoas inexperientes em procedimentos estatísticos seguidos de análises estatísticas não sabem como interpretar os resultados .  

FIM