Exploração e Cruzamento de Variáveis

Slides:



Advertisements
Apresentações semelhantes
A17 – Primeiros passos na utilização das TIC
Advertisements

Separatrizes As separatrizes são medidas de posição que permitem calcularmos valores da variável que dividem ou separam a distribuição em partes iguais.
Nome : Resolve estas operações começando no centro de cada espiral. Nos rectângulos põe o resultado de cada operação. Comprova se no final.
Excel Profa. Cristina M. Nunes.
Estatística Descritiva Aula 02
Medidas de Posição e Dispersão
Estatística Básica Utilizando o Excel
Estatística Básica Utilizando o Excel
Estatística Básica Utilizando o Excel
Tutorial de exercícios Estatística Básica Utilizando o Excel Delamaro e Marins 2a. Aula - Estatística Descritiva.
Métodos Quantitativos
ALGUMAS MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS
Folha de Cálculo TIC 10.
Folha de Cálculo TIC 10.
Internet e Informação Electrónica INTERNET EXPLORER
Análise de Dados.
Introdução ao Stata 16 de abril de 2013
ESTATÍSTICA.
Estatística e Probabilidade
ESTATÍSTICA.
Probabilidade e estatística-Mat013
Journal of Citation Reports Recursos B-on Journal of Citation Reports Saber usar Novembro,2008.
Estatística Professor: Carlos Alberto de Albuquerque
Aula 0. Doces Lembranças de MAE0219
MBA em Gestão de Empreendimentos Turísticos
Estatística Descritiva
ESTATÍSTICA DESCRITIVA
ESTATÍSTICA DECRITIVA
Uma ação muito comum em relação ao tratamento de uma distribuição de dados é agrupamento, que consiste em agrupar conjuntos grandes de dados antes de efetuar.
SÉRIES ESTATÍSTICAS TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. De acordo com a Resolução.
Amostragem Pontos mais importantes:
Modelagem Estatística
CLASSES: SÃO INTERVALOS DE VARIAÇÃO DA VARIÁVEL.
Site: Estatística Prof. Edson Nemer Site:
Microsoft Excel Folha de cálculo
Aula 6 ESTATÍSTICA E PROBABILIDADE
Exercício - 1. Criar no SPSS o banco de dados com as informações fornecidas 2. Salvar o banco com o nome atividade física na pasta pos pilates 3.
1 Limites e Preenchimentos da Tabela Limites e preenchimento {Borders and Shading}, do menu Tabela {Table}, na barra de Ferramentas Tabelas e limites.
Microsoft Office Excel Fórmulas complexas  Se  Soma.Se  Contar.Se  Contar.Val  Contar.Vazio.
Distribuição de Freqüência
Medidas de tendência central e de dispersão
Métodos Quantitativos Prof. Edson Nemer Site:
Lição nº52 e /11/2013 Sumário: Tratamento de Dados: frequências, mediana,gráficos e dados agrupados em classes.
Planilha eletrônica Fórmulas e Funções Informática Aplicada a Saúde I
Regressão Linear.
Matemática Financeira
Medidas de localização
ANOVA II.
Estudo dos gráficos Objetivos: Como construir um gráfico.
Transformação de Dados
Série Geográfica (espaço).
ANOVA.
Aula 8A ESTATÍSTICA E PROBABILIDADE
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
Estudo dos gráficos Objetivos: Como construir um gráfico.
Estatística Descritiva
ANOVA.
Usando Excel Prof. Rosemberg Trindade. Parte 1 Representação tabular de distribuição com variáveis discretas e contínuas.
Visão Geral do SPSS.
Testes de Hipóteses.
Complementos sobre Testes de Hipóteses. Complementos sobre testes de hipóteses Neste capítulo olharemos para: A segurança da decisão baseada em testes.
MEDIDAS DE TENDÊNCIA CENTRAL MEDIDAS DE DISPERSÃO
Testes de Hipóteses.
Regressão Linear. Introdução A relação linear entre duas variáveis contínuas pode ser aferida através do coeficiente de correlação ou do modelo de regressão.
SPSS. 1 - Inserir dados na planilha: digite os dados na planilha.
Profª Juliana Schivani TABELAS.
Distribuição de freqüências
Marcos Antonio Estremote – Aula 2.  Estatística Descritiva:  Resumo ou descrição das características importantes de um conjunto conhecido de dados populacionais.
Profª Juliana Schivani GRÁFICOS.
Prof. João Saturnino GRÁFICOS.
Transcrição da apresentação:

Exploração e Cruzamento de Variáveis com o SPSS

Exploração de Variáveis Neste capítulo olharemos para a distribuição de uma variável, visualizando a sua representação gráfica.   Neste capítulo veremos também como obter informação adicional sobre a distribuição das variáveis. Consulte o ficheiro de dados

Resumo de uma distribuição ·  Na barra de menus escolher:   Analyze  Descriptive Statistics  Explore… ·  Seleccionar a variável (ou variáveis) que se pretende explorar e colocá-la na lista de variáveis dependentes.    Seleccionar a variável que define os grupos de casos e movê-la para a lista de factores.

Resumo de uma distribuição Preparação do cálculo:

Resumo de uma distribuição Obtém-se o seguinte resultado : Número de casos da opção muito satisfeito. Número de casos em falta para a mesma opção. Percentagem de casos em falta.

Resumo de uma distribuição Verifica-se que há 325 casos na categoria muito satisfeito para os quais a idade está disponível.   O número de casos em falta é 2. Isto significa que 2 casos muito satisfeitos não têm um valor válido para a variável idade. Este número representa apenas 0,6% do total de casos, pelo que o seu efeito é de somenos importância. O número de casos varia consideravelmente entre os quatro grupos: mais de 300 indivíduos dizem-se moderadamente satisfeitos; 74 estão um pouco insatisfeitos; e apenas 26 estão muito insatisfeitos. As conclusões extraídas sobre os últimos dois grupos têm que ser cuidadosas, pois são baseadas num número pequeno de casos.

Resumo de uma distribuição A tabela seguinte apresenta o resultado das estatísticas sobre os grupos de casos.

Resumo de uma distribuição Utilize o editor de tabelas, Pivot Table Editor, para modificar a tabela.   Para esconder linhas ou colunas, fazer Ctrl+Alt+Click sobre o topo da linha ou coluna. Depois premir o botão direito do rato e escolher Hide Category. As médias das idades variam do valor mais elevado de 41,5 no grupo muito satisfeito, até ao valor mais baixo de 38,58 no grupo muito insatisfeito. O valor das medianas é sensivelmente mais baixo para todos os grupos, porque as distribuições de idade têm caudas nos valores mais elevados de idade.

Resumo de uma distribuição A média equilibrada (trimmed mean) evita este problema pois exclui os valores mais elevados, assim como os mais baixos. Na 5% trimmed mean, apenas são considerados 90% dos casos, no centro da distribuição, excluindo-se os 5% do extremo superior e os 5% do extremo inferior.   O desvio padrão mais elevado pertence ao grupo muito satisfeito, pois este contém o valor de idade mais elevado: 82 anos. A linha Range dá-nos a amplitude de idades do grupo. O Interquartile range dá-nos a amplitude de idades do grupo, medida entre os percentis 25 e 75, não sendo por isso afectado pelo valores extremos.

Resumo de uma distribuição Para identificar os valores extremos, deve premir o botão Statistics na caixa de diálogo Explore e seleccionar a opção Outliers.

Resumo de uma distribuição A tabela seguinte apresenta os valores extremos para o grupo muito satisfeito. O caso 344 é o indivíduo mais velho, com 82 anos de idade. O caso 173 é o indivíduo mais novo, com 19 anos de idade.

Resumo de uma distribuição Com o Explore podem obter-se os percentis para cada grupo.   Para isso deve premir o botão Statistics na caixa de diálogo Explore e seleccionar a opção Percentiles.

Resumo de uma distribuição Percentis (resultados): 10% dos casos têm 27 ou menos anos, no grupo muito satisfeito. 10% dos casos têm 57,4 ou mais anos, no grupo muito satisfeito.

Histograma Para obter o histograma, deve premir o botão Plots na caixa de diálogo Explore e seleccionar a opção Histogram.

Histograma O intervalo com o ponto médio 40 é o que tem mais casos.

O gráfico tronco e folhas Para obter o gráfico tronco e folhas, deve premir o botão Plots na caixa de diálogo Explore e seleccionar a opção Stem-and-leaf (tronco e folhas).

O gráfico tronco e folhas Idade do respondente Stem-and-Leaf Plot para SAT_EMP= Um pouco insatisfeito   Frequency Stem & Leaf 2,00 2 . 33 13,00 2 . 5556777899999 7,00 3 . 0123334 18,00 3 . 555566666777788899 7,00 4 . 0012234 13,00 4 . 5556666677888 5,00 5 . 02223 5,00 5 . 55679 3,00 6 . 013 1,00 Extremes (>=72) Stem width: 10 Each leaf: 1 case(s) Cinco casos têm 29 anos de idade. Apenas um caso tem 34 anos de idade. Multiplicar o caule pela largura do caule e somar as folhas para obter os valores (60, 61 e 63). Se a largura do tronco (stem width) fosse 100, então os valores do tronco de valor 6 seriam 600, 610 e 630.

A caixa de bigodes Para obter a caixa de bigodes, seleccionar a opção Plots, ou Both na caixa de diálogo Explore.

A caixa de bigodes Valores isolados. As extremidades estendem-se ao maior e menor valor observado até 1,5 do comprimento da caixa. A caixa estende-se do percentil 25 até ao 75. A linha é a mediana.

Cruzamento de Variáveis Uma tabela de frequências é insuficiente para visualizar o grau de satisfação no emprego, por cada categoria de salário. Para isso há necessidade de recorrer ao cruzamento de variáveis.   ·       Na barra de menus escolher: Analyze  Descriptive Statistics  Crosstabs… ·       Seleccionar a variável (ou variáveis) que vai ocupar as linhas da tabela e colocá-la em Row(s).        Seleccionar a variável (ou variáveis) que vai ocupar as colunas da tabela e colocá-la em Column(s).

Cruzamento de Variáveis Preparação do cálculo:

Cruzamento de Variáveis Mova diversas variáveis para as listas de linhas ou colunas, para obter múltiplos cruzamentos bivariados.   Para visualizar três ou mais variáveis em simultâneo, coloque as variáveis adicionais em camadas sucessivas (layers).

Cruzamento de Variáveis Cruzamento de sat_emp com receita4.

Cruzamento de Variáveis Cruzamento de sat_emp com receita4 e sexo.

Percentagens de linha e coluna Para visualizar-se as percentagens das células, deve premir o botão Cells na caixa de diálogo Crosstabs e seleccionar as opções Row, Column ou Total.

Percentagens de linha e coluna Todas as colunas somam 100% de percentagem.

Visualização gráfica Os resultados do cruzamento de variáveis podem ser apresentados graficamente.   ·       Na barra de menus escolher: Graphs  Bar… ·       Escolher Stacked e premir Define. ·       Escolher a variável receita4 para o eixo das categorias. ·     Escolher a variável sat_emp para a definição dos clusters.

Visualização gráfica

Visualização gráfica Para apresentar a percentagem de casos, as variáveis devem ser escolhidas por ordem inversa.   Depois, no editor de gráficos deve fazer-se: Series  Transpose Data

Visualização gráfica

Visualização gráfica Desta forma consegue-se comparar a distribuição inspeccionando as barras para cada grupo.   Observa-se que o grupo das pessoas com menor rendimento é o que possui menor percentagem de indivíduos muito satisfeitos com o seu emprego. Representam também a menor percentagem de indivíduos muito insatisfeitos. Pode ver-se que a soma das percentagens dos indivíduos muito satisfeitos e moderadamente satisfeitos é sensivelmente a mesma para os quatro grupos.