MSF – Centro Operacional de Bruxelas, Luxemburgo EpiData Analysis The Union, Paris, França MSF – Centro Operacional de Bruxelas, Luxemburgo OMS, Genebra
Antes de começar esta sessão Exclua todos os arquivos do EpiData da pasta Epidata_course Abra a pasta Resources Day 3 resources Lecture 1 folder Copie os arquivos A_Analysis.Rec e A_Analysis.Chk e cole-os na pasta Epidata_course
Objetivos Aprender a configuração/funções básicas do EpiData Analysis Aprender a realizar a síntese estatística usando os comandos do menu Aprender a criar novas variáveis Aprender a realizar análises bivariadas simples Aprender a criar gráficos Aprender a usar o ‘Editor’ para escrever comandos num programa que pode ser salvo para criar um “arquivo de execução” permanente * Observe que este curso não se destina a ensinar métodos analíticos sofisticados (para isso, utilize o arquivo e os comandos de ajuda – F1)
Tela do EpiData Analysis Barra de processos – selecione os comandos aqui Janela de resultados (visualização) Comandos (escolha com F2) Histórico (escolha com F7) Barra de comandos – digite os comandos aqui (selecione com o mouse ou com F4)
Conceito do EpiData Analysis O programa lê bases de dados (que podem ser arquivos *.Rec do EpiData, mas também arquivos de texto gerados pelo Excel, como *.csv) É possível navegar, modificar e analisar os dados mas, no uso normal do programa, as alterações nos dados não são salvas – ou seja, a sua base de dados central permanece intacta Para documentar e reproduzir a sua análise, é possível escrever um programa no editor que pode posteriormente ser executado na base de dados sempre que você queira repetir a análise
Exercício básico no EpiData Analysis Leia os dados que deseja analisar (A_analysis.rec) no programa; para isso: CTRL+O → selecione o arquivo ALT+R → selecione o arquivo Digite Read "c:\epidata_course\A_analysis.rec" na barra de comandos Clique em “Read” na barra de processos → selecione o arquivo
Para navegar pelos dados, clique em “Browse” na barra de processo. Navegação pelos dados Para navegar pelos dados, clique em “Browse” na barra de processo. Selecione variáveis específicas para navegação, ou selecione todas para uma visualização completa Para navegar pelos dados, clique em “Browse” na barra de processo. É possível navegar pelos dados manualmente – os valores e etiquetas dos dados podem ser alternados com o botão “Values/Labels” Selecione variáveis específicas para navegação, ou selecione todas para uma visualização completa Se você criou um arquivo Chk vinculado ao arquivo Rec, e se a função chk estiver no mesmo local (ou seja, na mesma pasta) que o arquivo Rec no qual está trabalhando, você pode usar o botão Value/Label para alternar entre os valores de dados e seus rótulos. É possível navegar pelos dados manualmente – os valores e rótulos dos dados podem ser alternados com o botão “Values/Labels” Todas as variáveis no conjunto de dados lido (alterne com F3)
Navegação pelos dados Para ver um resumo geral do conjunto de dados (número e tipo de variáveis, rótulos de dados etc.), digite “var” na linha de comando Obs: Isto lembra vagamente a ficha de documentação de dados, com alguns componentes a menos.
Análise dos dados Depois que os dados foram lidos, podemos realizar seu processamento e análise Vamos inserir todos os comandos pela barra de processos, mas eles também podem ser digitados na barra de comandos
Análise univariada utilizando a síntese estatística Variáveis categóricas Variáveis contínuas Frequências, Média, mediana, intervalo, desvio Proporções padrão, IIQ, percentis
Síntese de variáveis categóricas: Frequências e proporções Usando a barra de processos: Na tela que surgir, selecione as opções desejadas – aqui, vamos avaliar a frequência desordenada de homens e mulheres, com percentuais por linha e intervalos de confiança
Frequências e proporções Obs: Se você puser o cursor na barra de comandos, pode usar os botões “para cima” e “para baixo” para ver todos os comandos que já executou na sessão Observe que todos os comandos introduzidos pela barra de processos também são exibidos na seção de resultados, para você se familiarizar com o formato exigido para digitar comandos na barra de comandos
Frequências e proporções Se inserido na barra de comandos Tables gender /R /CI /F Outros comandos alternam a forma de exibição dos dados: /v: somente o valor é exibido /vl: valor e etiqueta são exibidos /vn: nome da variável é exibido /vnl: nome e etiqueta da variável são exibidos
Síntese de variáveis contínuas Para variáveis contínuas (como idade, peso etc.), o comando describe permite calcular a média, a mediana, o intervalo e os percentis:
Síntese de variáveis contínuas Obs: Como decidir entre usar a média ou a mediana para uma variável contínua? Devemos apresentar a média ou a mediana?
Síntese de variáveis contínuas Vimos quais sínteses estatísticas podem ser feitas usando o comando describe Outro comando útil, e às vezes mais informativo, é o comando means
Síntese de variáveis contínuas Cuidado! Se na sua variável faltarem dados aos quais foi atribuído um valor específico (99, por exemplo), estes devem ser excluídos antes de executar os comandos describe ou means (caso contrário, esses valores serão incluídos nos cálculos da média, mediana etc.) Isso é feito com o comando select not Obs: Como decidir entre usar a média ou a mediana para uma variável contínua?
Comando select not A variável t0weight tem dados faltantes (indicados pelo valor 999) que devem ser excluídos antes de executar o comando describe
Mais sobre o comando select Como vimos anteriormente: select NOT(t0weight=999)seleciona todos os registros nos quais o valor de t0weight não é 999 Obs: As operações subsequentes só serão executadas nesse subconjunto de dados Para desfazer a seleção (ou seja, restaurar o conjunto de dados completo), digite select Qualquer operador lógico (>, <, =, OR, AND, NOT) pode ser usado com o comando “select”
Geração de novas variáveis Suponha que queremos categorizar uma variável contínua, como a idade: Passo 1: Defina uma nova variável numérica de dimensão 1: define agegroup # Ao navegarmos pelos dados vemos uma nova variável, ainda vazia em todos os registros
Geração de novas variáveis Passo 2: Indique as categorias da variável agegroup: if age<35 then agegroup=1 if age>=35 AND age<55 then agegroup=2 if age>=55 then agegroup=3 Obs: Pode ser usado qualquer operador lógico (>, <, =, OR, AND, NOT) Passo 3: Rotule os valores de agegroup: labelvalue agegroup /1=“<35 anos” /2=“35–54 anos” / 3=“55+ anos”
Geração de novas variáveis Ao navegar pelos dados, vemos agora:
Geração de novas variáveis Suponha que queremos recategorizar uma variável categórica, como o desfecho. Neste exemplo, queremos agrupar os desfechos favoráveis (‘Vivo em TAR’) ou adversos (‘Óbito’, ‘Abandono terapêutico’ e ‘Transferido’):
Geração de novas variáveis Vamos chamar esta nova variável de desfecho de ‘bioutcome’ define bioutcome # if outcome =1 then bioutcome=1 if outcome >1 then bioutcome=2 labelvalue bioutcome /1=Favorável /2=Adverso
Exclusão de variáveis Se você gerou uma variável e depois deseja excluí-la, pode usar o comando drop: drop agegroup drop bioutcome excluindo assim a variável recém-gerada.
Introdução à análise bivariada A análise de duas variáveis categóricas pode ser feita usando a tabulação cruzada dos dados – vejamos como os desfechos favoráveis e adversos (‘bioutcome’) estão distribuídos segundo o tipo de HIV: 2ª A primeira variável em que clicarmos será a variável da coluna, e a segunda será a variável da linha. Por convenção, embora esta não seja uma regra rígida, a variável de desfecho fica na coluna e a variável de exposição fica na linha. De fato, é assim que o EpiData Analysis trata os dados. 1ª
Análise de dados – tabelas
Análise de dados – tabelas Se executado pela barra de comando: Tables bioutcome hivtype /R Outros comandos permitem um maior refinamento (e análise): /C exibe as colunas com porcentagens /d0, /d2,... define o número de casas decimais dos percentuais
Análise bivariada de uma variável categórica e contínua
Gráficos Também é possível gerar gráficos usando a barra de comandos ou de processos. Por exemplo, para criar um histograma simples:
Gráficos Os gráficos são salvos automaticamente num arquivo gráfico *.png na pasta analysis do seu computador
Gráficos Outros gráficos têm opções mais complexas – tente gerar gráficos de dispersão, caixas e pizza para diferentes variáveis:
EpiData Editor As alterações nos dados (novas variáveis, cálculos etc.) não são armazenadas na memória Para fazer um registro permanente de tudo o que foi feito (reprodutibilidade, compartilhamento dos dados da análise etc.), é possível escrever um programa no EpiData Editor Esse programa pode então ser executado em outros conjuntos de dados (como atualizações na base de dados etc.) e pode ser compartilhado com outras pessoas para, por exemplo, resolver problemas Essencialmente, o programa é escrito usando as mesmas linhas de comandos
Como usar o Editor O programa Editor pode ser acessado: Pressionando F5 Clicando em “Editor” na barra de processos:
Como usar o Editor – primeiros passos A maioria dos programas começa com: * Este é o nome do programa (qualquer texto após um asterisco é considerado um comentário, e não um comando do programa) cls (limpa a tela) close (fecha todos os arquivos que possam estar abertos) logclose (fecha todos os logs de sessões anteriores) cd c:/file_location (define a localização do arquivo que desejamos abrir) read "database_filename" (abre o arquivo em que estamos interessados)
Como usar o Editor – primeiros passos Portanto, um programa geralmente começa com : Pressione F9 ou clique em “Run” para executar o programa, linha por linha
Como usar o Editor – programação Os diferentes comandos podem ser inseridos como se tivessem sido digitados na linha de comandos.
Como usar o Editor – programação Os primeiros resultados depois de executar o programa:
Como usar o Editor – programação O programa pode ser salvo (como um arquivo .pgm) – se você enviar esse arquivo .pgm junto com os arquivos .rec e.chk, qualquer pessoa poderá refazer e conferir a sua análise.