Programa de Pós-Graduação em Educação Física Professor: Adriano Ferreti Borgatto, Dr. Colaboração: Jeovani Schmitt – Doutorando PPGEPS
1. Introdução ao STATA 2. Importar conjunto de dados 3. Manipulação de variáveis 4. Cálculo de Medidas Resumo 5. Distribuição de Frequência: Gráficos e Tabelas 6. Intervalo de Confiança para média e proporção
1. Introdução ao STATA
Abrindo o Programa
Apresentação do Menu
Apresentação do Menu... continuação Digitação de comandos Histórico de comandos Área de Resultados Variáveis da base Propriedades das variáveis
Uso do Help nome da função Ou simplesmente: help help tabulate
2. Importar conjunto de dados
Atividade 1: Importar o conjunto de dados “descritiva” File / Import / Excel spreadsheet (*.xls, *.xlsx) 1 2 3
1 2 3
Variáveis importadas Histórico do comando Obs.: Posicionando-se na área de comandos, por meio das teclas RESULTADO você pode conhecer o comando que o STATA realiza em cada operação
Salvar o arquivo importado 1 2 Informe um nome desejado e OK. IMPORTANTE: Utilize SEMPRE caracteres simples, evitando: ç - ~ [ ´ ‘
Explorando outras funções no Menu
3. Manipulação de variáveis
Atividade 2: Colocar Label (rótulo) para as categorias da Variável Sexo Data / Variables Manager 1 2 Ou usar o atalho do Menu:
1 2
= Feminino
OK 2 = Masculino
Por fim: 1 2
RESULTADO
Pelo Menu: Data / Describe data / Describe data contents (codebook) Atividade 3: Identificar o código utilizado para a variável Satisfação
Utilizando comando:
Atividade 4: Criar rótulo para a variável Satisfação 1 – Sim 2 - Não
4. Cálculo de Medidas Resumo
Vamos gravar os resultados das nossas análises (log), clicando em:
Atividade 5: Calcular as medidas resumo para a variável Peso Pelo Menu: Statistics / Summaries, tables, and tests / Summary and descriptive statistics / Summary statistics
1 2 3
RESULTADO
SKEWNESS (ASSIMETRIA)
KURTOSIS A curtose está relacionada com a altura da curva de distribuição em relação a ordenada
Atividade 6: Calcular as medidas resumo para a variável Altura sum Altura,detail Utilizando comando:
Atividade 7: Calcular a altura média por sexo
tabstat Altura, by(Sexo) columns(variables) RESULTADO
5. Distribuição de Frequência: Gráficos e Tabelas
Atividade 8: Construir uma distribuição de frequência para a variável Sexo (tabela)
Atividade 9: Construir uma tabela cruzada para a variável Sexo x Satisfação
Incluir percentual!
Atividade 9: Construir uma tabela cruzada para a variável Sexo x Satisfação
tabulate Sexo Satisfao, column
tabulate Sexo Satisfao, row
Atividade 10: Construir um box plot variável Peso
graph box Peso
Atividade 11: Construir um box plot variável Peso por Sexo Pelo Menu: Graph Box Plots
graph box Peso, over(Sexo) Atividade 11: Construir um box plot variável Peso por Sexo
graph hbox Peso, over(Sexo) Apresentação Horizontal
Atividade 12: Construir um histograma para a variável Peso
histogram Peso, normal
histogram Peso, normal by(Sexo) Atividade 13: Construir um histograma para a variável Peso para cada Sexo.
6. Intervalo de Confiança para média e proporção
Atividade 14: Construir um IC de 95% de confiança para estimar a verdadeira média de Peso da população Interpretação: Com 95% de confiança podemos afirmar que a verdadeira média da população está contida no intervalo entre 61,9 kg e 67,8 Kg.
ci Peso
Atividade 15: Construir um IC de 95% de confiança para estimar a proporção de mulheres na população ?
Vamos recodificar a variável Sexo para variável binária: 0 / 1
recode Sexo (2 = 0) (1 = 1)
Atividade 16: Construir um IC de 95% de confiança para estimar a proporção das variáveis VAR_A e VAR_B do arquivo CI
Comandos e funções úteis na preparação da base describe # descreve a base de dados help operator#exibe os símbolos do STATA para realizar as operações disp 3/2 #mostra o resultado da operação 3/2 summarize #mostra as estatística descritivas summarize p* #mostra as estatísticas descritivas para as variáveis que iniciam com a letra p codebook x #propriedades da variável x As teclas Pg Dn / Pg Up são úteis para repetir os últimos comandos utilizados.
Criar uma nova variável Como criar uma variável calculada? Utiliza-se o comando generate ou gen Exemplo: Criar a variável IMC, dado que IMC = Peso / (Altura x Altura) generate imc = Peso / (Altura * Altura)
#Comando é egen Criar 3 grupos de pessoas a partir do seu IMC (igual número de pessoas em cada grupo) egen float categ_IMC = cut(imc), group(3) icodes
Exemplo: Criar três categorias para IMC abaixo de 20 de 20 a ou mais Definindo pontos de corte para a variável IMC egen float IMC_Faixa = cut(imc), at( ) icodes