A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

JUNHO/2010 Paula Strassmann PGS Medical Statistics Regressão Linear Simples Análise de Sobrevivência Testes Diagnósticos.

Apresentações semelhantes


Apresentação em tema: "JUNHO/2010 Paula Strassmann PGS Medical Statistics Regressão Linear Simples Análise de Sobrevivência Testes Diagnósticos."— Transcrição da apresentação:

1 JUNHO/2010 Paula Strassmann PGS Medical Statistics Regressão Linear Simples Análise de Sobrevivência Testes Diagnósticos

2 JUNHO/2010 Paula Strassmann PGS Medical Statistics Relações entre variáveis numéricas PROPOSTAS Coeficiente linear de Pearson versus Regressão Linear Simples OBJETIVO Quantificar o grau de associação linear entre 2 variáveis numéricas. Equacionar a relação entre uma variável resposta numérica e uma variável explicativa (numérica ou categórica).

3 JUNHO/2010 Paula Strassmann PGS Medical Statistics r = 1 : correlação perfeita positiva r = -1: correlação perfeita negativa r = 0 : Não existe correlação entre as variáveis Observação: Associação não implica em relação causal Coeficiente de Correlação (r) -1 ≤ r ≤ 1

4 JUNHO/2010 Paula Strassmann PGS Medical Statistics Regressão Linear Simples Descreve matematicamente a associação entre 2 ou mais variáveis. Determina a linha ou curva que melhor se ajusta aos pontos no diagrama de dispersão Situações mais utilizadas Quando duas variáveis medem a mesma coisa, e uma delas é dispendiosa ou de difícil coleta; Para explicar valores de uma variável em termos da outra; Para predizer valores de uma variável.

5 JUNHO/2010 Paula Strassmann PGS Medical Statistics Correlação e Regressão (Resumo) Objetivo: Previsão da variável Y, utilizando a variável X. X está relacionada com Y? Como?  Gráfico de dispersão (tipo de relação, outliers);  Coeficiente de correlação: -1 ≤ r ≤ 1;  Regressão linear simples: y = a + b  x; e  Qualidade do ajuste: 0 ≤ r² ≤ 1;  Transformação dos dados / regressão múltipla (X 1, X 2,...).

6 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo: Desejamos investigar se a quantidade de gordura existente em nosso corpo está associada com a idade. Foram registradas as medidas de 18 indivíduos:

7 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo (Continuação) Maior idade parece implicar maior porcentagem de gordura corporal?

8 JUNHO/2010 Paula Strassmann PGS Medical Statistics Idade (X)% Gordura (Y) 239,5-23,33-19,11445,9259544,4444365,2346 277,8-19,33-20,81402,3481373,7778433,1023 2717,8-19,33-10,81209,0148373,7778116,8801 4527,4-1,33-1,211,61481,77781,4668 2327,9-23,33-0,7116,5926544,44440,5057 3931,4-7,332,79-20,451953,77787,7779 4125,9-5,33-2,7114,459328,44447,3501 4925,22,67-3,41-9,09637,111111,6357 5031,13,672,499,125913,44446,1946 5334,76,676,0940,592644,444437,0746 53426,6713,3989,259344,4444179,2623 5429,17,670,493,748158,77780,2390 5632,59,673,8937,592693,444415,1235 5730,310,671,6918,0148113,77782,8523 583311,674,3951,2037136,111119,2623 5833,811,675,1960,5370136,111126,9246 6041,113,6712,49170,6815186,7778155,9723 6134,514,675,8986,3704215,111134,6790 46,3328,61––1627,53332970,00001421,5378 Exemplo (Continuação)

9 JUNHO/2010 Paula Strassmann PGS Medical Statistics Portanto, Exemplo (Continuação) r 2 = 0,79 2 = 0,63 = 63%;

10 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo (Continuação) Interpretação dos parâmetros: : indica que a porcentagem de gordura esperada em nosso corpo, independentemente da idade, é de 3,22%. : indica que um aumento de 1 ano na idade implica em um ganho médio esperado de 0,55% de gordura.

11 JUNHO/2010 Paula Strassmann PGS Medical Statistics Interpretação dos parâmetros: r: indica a associação entre as variáveis X e Y (r = 0,79 indica uma associação positiva muito boa entre as variáveis). r 2 : indica a qualidade do ajuste do modelo (r 2 = 63% indica um bom ajuste do modelo). Exemplo (Continuação)

12 JUNHO/2010 Paula Strassmann PGS Medical Statistics Análise de Sobrevida A análise de sobrevida, também chamada de análise de sobrevivência, é utilizada quando o tempo é o objeto de interesse. Sobrevida: Tempo decorrido entre o início da observação de um paciente e a ocorrência de um determinado evento com significado especial.

13 JUNHO/2010 Paula Strassmann PGS Medical Statistics Análise de Sobrevida início da observação X ocorrência do evento “tempo de sobrevida” Exemplos: Tempo até o óbito Tempo até progressão da doença Tempo livre de doença

14 JUNHO/2010 Paula Strassmann PGS Medical Statistics A curva de sobrevida fornece, a cada tempo t, a probabilidade de um paciente sobreviver um tempo T > t; Cada “degrau” da curva indica a ocorrência de um (ou mais) eventos; Sobrevida mediana (t’): tempo até o qual metade dos pacientes sobrevivem. Análise de Sobrevida t´ Exemplo

15 JUNHO/2010 Paula Strassmann PGS Medical Statistics Censura: quando a análise de sobrevida é realizada antes da ocorrência do evento de interesse e existe uma incerteza quanto ao momento de ocorrência do evento. início da observação análise de sobrevida “tempo de sobrevida” (dado censurado) X Razões para a ocorrência de censura: perda de follow-up; não ocorrência do evento até o momento da análise; ocorrência do evento devido a outra causa que não o tratamento; outra terapia não prevista Análise de Sobrevida

16 JUNHO/2010 Paula Strassmann PGS Medical Statistics Parâmetros mais importantes: probabilidade de sobrevida no curso de cada um dos intervalos considerados; probabilidade de sobrevida acumulada, isto é, a probabilidade de sobreviver do tempo zero até o tempo final considerado S(t). Observação: As principais técnicas são o método atuarial e o método do produto-limite de Kaplan-Meier. Métodos estatísticos para análise de sobrevida

17 JUNHO/2010 Paula Strassmann PGS Medical Statistics Métodos estatísticos para análise de sobrevida (Kaplan-Meier) Exemplo: cálculo da taxa de sobrevida observada – método de Kaplan-Meier

18 JUNHO/2010 Paula Strassmann PGS Medical Statistics Comentários do Exemplo: Na linha referente a 11 meses após o diagnóstico,verifica-se a ocorrência de 1 óbito entre os 12 pacientes vivos no início do mês. Assim, a probabilidade condicional de morte foi de 0,0833 (1/12) e a probabilidade condicional de sobrevida de 0,9167 (1 - 0,0833) naquele mês. Sobrevida acumulada aos 11 meses: 0,4278 (resultado da multiplicação das probabilidades de sobrevida dos períodos anteriores). Métodos estatísticos para análise de sobrevida (Kaplan-Meier)

19 JUNHO/2010 Paula Strassmann PGS Medical Statistics Conclusão: para os pacientes dessa população, a probabilidade de sobrevida após 11 meses foi de 42,78%. Métodos estatísticos para análise de sobrevida (Kaplan-Meier)

20 JUNHO/2010 Paula Strassmann PGS Medical Statistics Curva de sobrevida Métodos estatísticos para análise de sobrevida (Kaplan-Meier)

21 JUNHO/2010 Paula Strassmann PGS Medical Statistics Para comparar as curvas de sobrevida acumulada entre diferentes categorias de uma mesma variável, recomenda-se utilizar o teste log-rank. Baseia-se no confronto entre os eventos observados e os esperados nos dois grupos. A diferença entre casos observados e esperados é avaliada através do teste Qui-quadrado. Métodos estatísticos para análise de sobrevida – Log- rank

22 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo: Comparar as duas curvas com relação ao tratamento Métodos estatísticos para análise de sobrevida – Log- rank

23 JUNHO/2010 Paula Strassmann PGS Medical Statistics Log-rank – cálculo do Qui-quadrado H 0 : Não existe diferença entre os tratamentos X H 1 : Existe diferença entre os tratamentos Valores observados (correspondentes a um momento da Tabela de sobrevida) Valores esperados supondo H 0 Variância de cada tabela Ҳ 2 : soma para todas as tabelas

24 JUNHO/2010 Paula Strassmann PGS Medical Statistics Log-rank – cálculo do Qui-quadrado Exemplo para a primeira linha da Tabela, supondo: Tratamento 1 (T1 = Óbito) e Tratamento 2 (T2 = Não óbito (Censura)). T1T2 Falha 5 (F1)0 (F2)5 (TF) Não-falha 24 (NF1)29 (NF2) 53 (TNF) Total 29 (NT1)29 (NT2) 58 (Total) Status Tratamento Total

25 JUNHO/2010 Paula Strassmann PGS Medical Statistics A análise de regressão múltipla também pode ser aplicada em dados de sobrevida, quando se deseja avaliar o efeito conjunto de algumas variáveis independentes, sejam as observações incompletas ou não. Métodos estatísticos para análise de sobrevida – Regressão de Cox Regressão de Cox: Indicada quando se deseja estudar sobrevida sob o prisma de causalidade ou da predição, pois fornece as estimativas das razões de risco (HR) dos fatores estudados, podendo-se avaliar o impacto que alguns fatores de risco têm no tempo até a ocorrência do evento de interesse. Razão de risco (HR) = Risco de falha dado um fator Risco de falha independente A interpretação da HR é semelhante à de RR(Risco relativo)

26 JUNHO/2010 Paula Strassmann PGS Medical Statistics Paralelo entre RR e HR A interpretação de risco relativo (RR) é a mesma de hazard ratio (HR): Risco de ocorrência de um evento quando exposto a um fator em relação à ocorrência deste evento quando não exposto ao fator. No RR, em estudos de coorte, o evento pode ser uma doença ou morte. RR não considera o tempo dos indivíduos no estudo. É a relação entre os riscos de exposição e é calculado ao final do estudo. A interpretação de risco relativo (RR) é a mesma de hazard ratio (HR): Risco de ocorrência de um evento quando exposto a um fator em relação à ocorrência deste evento quando não exposto ao fator. No RR, em estudos de coorte, o evento pode ser uma doença ou morte. RR não considera o tempo dos indivíduos no estudo. É a relação entre os riscos de exposição e é calculado ao final do estudo.

27 JUNHO/2010 Paula Strassmann PGS Medical Statistics No HR em estudos de sobrevida, o evento pode ser progressão da doença ou morte. HR é calculada com base no total de tempo dos indivíduos no estudo (incluindo o tempo dos dados censurados). É a relação entre duas forças de “mortalidade” e pode ser calculada em cada unidade de tempo de estudo. Para ambos, o fator pode ser qualquer variável categórica dicotômica, como sexo, uso de droga, tratamento, etc. No HR em estudos de sobrevida, o evento pode ser progressão da doença ou morte. HR é calculada com base no total de tempo dos indivíduos no estudo (incluindo o tempo dos dados censurados). É a relação entre duas forças de “mortalidade” e pode ser calculada em cada unidade de tempo de estudo. Para ambos, o fator pode ser qualquer variável categórica dicotômica, como sexo, uso de droga, tratamento, etc. Paralelo entre RR e HR

28 JUNHO/2010 Paula Strassmann PGS Medical Statistics A função de risco representa a probabilidade de que um evento venha a ocorrer durante um específico intervalo de tempo, dado que não ocorreu desde o início desse intervalo. Métodos estatísticos para análise de sobrevida – Regressão de Cox No modelo de Cox, as covariáveis têm um efeito multiplicativo, ou proporcional, na probabilidade de falha. Assim o termo “proportional hazards model” é comumente utilizado. O modelo envolve uma equação exponencial complicada, que está além do escopo desta aula.

29 JUNHO/2010 Paula Strassmann PGS Medical Statistics Métodos estatísticos para análise de sobrevida – Regressão de Cox Exemplo: O modelo de Cox foi usado para examinar a relação do consumo de potássio com a mortalidade por infarto, ajustada pela idade, pressão sanguínea, nível de colesterol no sangue, obesidade, glicose, fumo e uso de hormônio nas mulheres.

30 JUNHO/2010 Paula Strassmann PGS Medical Statistics O estudo de coorte foi feito com 859 pacientes. Em 12 anos de acompanhamento, foram registrados 24 óbitos relacionados ao infarto. Assim, os pacientes vivos entraram na análise como dados censurados. Métodos estatísticos para análise de sobrevida – Regressão de Cox

31 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo – interpretação Em mulheres que tomam 10 mmol de potássio, RR = 0,56. Isso indica que o potássio tem um efeito protetor sobre o infarto, independentemente da idade do paciente, pressão, colesterol, etc. Para homens, foi encontrada relação positiva entre infarto e o nível de glicose. Nenhum outro fator foi significante, já que o intervalo de confiança para RR (IC-95%) contém o valor 1.

32 JUNHO/2010 Paula Strassmann PGS Medical Statistics Y = a + b1X1 + b2X2 +....+ bnXn 1. Executa-se um teste de hipóteses para cada variável (Xi), com nível alto de significância (25%, p.ex.). 2. Inclua todas as variáveis significantes no modelo. 3. Inclua variáveis que julgar importantes, mesmo que não sejam significantes. A variável de principal interesse é obrigatória. MODELAGEM DE REGRESSÃO MÚLTIPLA DE SOBREVIDA (seguindo Hosmer & Lemeshow)

33 JUNHO/2010 Paula Strassmann PGS Medical Statistics 4. Inclua possíveis interações que julgar importantes (X1*X2, X3*X6, p.ex.). 5. Teste as interações no p = 5%. As interações significantes devem permanecer juntamente com os termos individuais. 6. Covariável com característica de variável de confusão deve permanecer no modelo. MODELAGEM DE REGRESSÃO MÚLTIPLA DE SOBREVIDA (seguindo Hosmer & Lemeshow)

34 JUNHO/2010 Paula Strassmann PGS Medical Statistics O critério de decisão sobre confusão não é baseado em teste de hipóteses mas, sim, em importância de modificação do efeito da variável principal. A variável para ser de confusão tem que mudar a HR da variável dependente em ≥ 10%. MODELAGEM DE REGRESSÃO MÚLTIPLA DE SOBREVIDA (seguindo Hosmer & Lemeshow)

35 JUNHO/2010 Paula Strassmann PGS Medical Statistics VARIÁVEIS SIGNIFICANTES + INTERAÇÕES SIGNIFICANTES + VARIÁVEIS COMPONENTES DAS INTERAÇÕES + COVARIÁVEIS DE CONFUSÃO + VARIÁVEIS SELECIONADAS POR CRITÉRIOS NÃO ESTATÍSTICOS MODELO FINAL DE REGRESSÃO MÚLTIPLA DE SOBREVIDA:

36 JUNHO/2010 Paula Strassmann PGS Medical Statistics Nos estudos que contemplam períodos extensos de observação é necessário assegurar que não tenham existido mudanças importantes nas características destes indivíduos e no diagnóstico, exposição ou tratamento da doença em estudo ao longo deste período. Tais mudanças poderiam introduzir viés nas estimativas de sobrevida, cuja direção depende das características da coorte e do período estudado. Considerações – Análise de Sobrevida

37 JUNHO/2010 Paula Strassmann PGS Medical Statistics As estimativas do modelo de Cox podem ser afetadas pelo tamanho amostral e pelo número de eventos e censuras. As estatísticas utilizadas nos testes para comparação das curvas de Kaplan-Meyer e na regressão de Cox não são as mesmas, e contemplam premissas diferentes. Portanto, podem gerar nem sempre as mesmas conclusões. Considerações – Análise de Sobrevida

38 JUNHO/2010 Paula Strassmann PGS Medical Statistics Aplicação de Análise de Sobrevida Objetivos clínicos que determinam a eficácia dos tratamentos em oncologia: Sobrevida global (OS) – é o tempo desde a randomização do paciente até sua morte por qualquer razão. Sobrevida livre de progressão (PFS) – é o tempo desde a randomização até a progressão objetiva do tumor ou morte. Tempo até progressão (TTP) – é o tempo desde a randomização até a progressão objetiva do tumor. Sobrevida livre de doença (DFS) – é o tempo desde a randomização até a recorrência do tumor (local ou à distância) ou morte por qualquer razão.

39 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS “b” – falso positivo “c” – falso negativo “a+c” – realmente doentes “b+d” – realmente sadios

40 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS Qual a capacidade diagnóstica do teste da FERRITINA para a ANEMIA FERROPRIVA?

41 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS SENSIBILIDADE = a / (a+c) – mede a capacidade que o teste da ferritina tem de identificar os indivíduos POSITIVOS entre os verdadeiramente DOENTES. Ou, probabilidade do teste dar o resultado correto, dado que o indivíduo é doente. SENSIBILIDADE = 731/809 = 0,904 = 90,4% Ou seja, a ferritina sérica é capaz de identificar, aproximadamente 90 em cada 100 indivíduos doentes.

42 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS ESPECIFICIDADE = d / (b+d) – mede a capacidade que o teste da ferritina tem de identificar os indivíduos NEGATIVOS entre os verdadeiramente NÃO DOENTES. Ou, probabilidade do teste dar o resultado correto, dado que o indivíduo é não doente. ESPECIFICIDADE = 1500/1770 = 0,847 = 84,7% Ou seja, a ferritina sérica é capaz de identificar, aproximadamente 85 em cada 100 indivíduos sadios.

43 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS Quanto maior a SENSIBILIDADE menor o número de falsos negativos. Quanto maior a ESPECIFICIDADE menor o número de falsos positivos.

44 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS VALOR PREDITIVO POSITIVO (VPP) É a probabilidade de indivíduo ter uma determinada doença DADO que ele é positivo a um teste diagnóstico. VPP = a / (a+b) VPP = 731/1001 = 0,73, ou seja, um indivíduo desta amostra que seja POSITIVO ao teste da ferritina sérica tem aproximadamente 73% de probabilidade de ser portador de anemia ferropriva.

45 JUNHO/2010 Paula Strassmann PGS Medical Statistics TESTES DIAGNÓSTICOS VALOR PREDITIVO NEGATIVO (VPN) É a probabilidade de indivíduo não ter uma determinada doença DADO que ele é negativo a um teste diagnóstico. VPN = d / (c+d) VPN = 1500/1578 = 0,95 - Ou seja, um indivíduo desta amostra que seja NEGATIVO ao teste da ferritina sérica tem 95% de probabilidade de não ser portador de anemia ferropriva.

46 JUNHO/2010 Paula Strassmann PGS Medical Statistics Revisão para a Prova

47 JUNHO/2010 Paula Strassmann PGS Medical Statistics Aula 1: Noções básicas de bioestatística; Aula 2: Estatística descritiva (Introdução); Aula 3: Estatística descritiva: Representação gráfica e tabular da distribuição dos dados e Medidas resumo; Aula 4: Princípios da Análise Estatística: Distribuições amostrais de probabilidades, Intervalos de confiança e Testes de hipóteses; Aula 5: Comparando grupos: Dados categóricos e dados numéricos Tópicos abordados anteriormente

48 JUNHO/2010 Paula Strassmann PGS Medical Statistics 1. Definição do problema: definir objetivos e a pergunta de interesse 2.Planejamento: como? quais dados? tipo de levantamento? cronograma? custos? cálculo do n? Coleta de dados: registro sistemático de dados. Apuração dos dados: resumo dos dados através de contagens, agrupamentos, medidas descritivas → condensação e tabulação dos dados. Apresentação dos dados: em forma de tabelas e gráficos. Análise e Interpretação dos dados: aplicação de testes estatísticos fundamentados na teoria da probabilidade. Fases do Método Estatístico Noções básicas de bioestatística

49 JUNHO/2010 Paula Strassmann PGS Medical Statistics Desenvolvimento de novas perguntas de interesse Coleta de dados Pesquisa Científica e Estatística Planejamento de Experimentos e Técnicas de Amostragem Objetivos / Pergunta de Interesse Análise Descritiva Análise Inferencial Conclusões sobre a pergunta de interesse Noções básicas de bioestatística

50 JUNHO/2010 Paula Strassmann PGS Medical Statistics Protocolo Planejamento Estatístico 1. Definição das variáveis a serem analisadas 2. Formulação das hipóteses estatísticas baseadas nos end-points primário e secundário 3. Desenho do estudo 4. Fixação das regras de decisão (α, β, poder do teste) 5. Tamanho da amostra Noções básicas de bioestatística

51 JUNHO/2010 Paula Strassmann PGS Medical Statistics 6. Critérios de inclusão e exclusão 7. Definição da técnica de amostragem 8. Definição das estatísticas descritivas, tabelas e gráficos 9. Definição da análise inferencial: a. Diferença entre grupos b. Diferença entre tempos c. Associação entre variáveis (correlações) d. Relações temporais (sobrevida) Protocolo Planejamento Estatístico (cont.) Noções básicas de bioestatística

52 JUNHO/2010 Paula Strassmann PGS Medical Statistics 10. Definição de análises interinas e intermediárias 11. Definição de análise ITT e/ou PP 12. Determinação do tipo de variáveis 13. Tipo do instrumento de coleta 14. Plano de estatística SAP baseado em GCP, ICH-E2/E3/E9, 21 CFR part 11, SOPs,... Protocolo Planejamento Estatístico (cont.) Paula Strassmann PGS Medical Statistics MAIO/2010 Noções básicas de bioestatística

53 JUNHO/2010 Paula Strassmann PGS Medical Statistics O objetivo do cálculo do tamanho da amostra é garantir o sucesso dos estudos realizados, assegurando a validade dos ensaios clínicos, e garantindo que os ensaios tenham um poder suficiente para detectar corretamente uma diferença clínica significativa da entidade farmacêutica em estudo, se essa diferença realmente existe. CÁLCULO DO TAMANHO DA AMOSTRA Noções básicas de bioestatística

54 JUNHO/2010 Paula Strassmann PGS Medical Statistics técnica estatística a ser utilizada; variabilidade da resposta sob investigação; magnitude das diferenças que se pretendem detectar; previsão de perdas de pacientes durante o estudo tipo de estudo: ensaio clínico, prevalência, coorte,.. qual é a principal medida de resultado: variável nominal, ordinal, contínua; tipo de análise: entre grupos, intra-grupo; margem de erro que pode assumir para o estudo: nível de significância, poder do teste; conhecimento prévio da variável em estudo. O cálculo do tamanho da amostra depende de: Noções básicas de bioestatística

55 JUNHO/2010 Paula Strassmann PGS Medical Statistics População X Amostra População Amostragem Inferência amostra Estimação de parâmetros Teste de hipóteses “A distinção entre amostra e população é a chave para a melhor compreensão da estatística.” Noções básicas de bioestatística

56 JUNHO/2010 Paula Strassmann PGS Medical Statistics Vantagens: Reduzir a quantidade de dados, diminuindo tempo e custo da pesquisa; Aumentar a representatividade da amostra e a confiabilidade nos resultados. Amostragem Noções básicas de bioestatística

57 JUNHO/2010 Paula Strassmann PGS Medical Statistics Métodos probabilísticos: cada elemento da população possui a mesma probabilidade de ser selecionado. casual ou aleatória simples estratificada sistemática conglomerados Paula Strassmann PGS Medical Statistics MAIO/2010 Noções básicas de bioestatística Amostragem

58 JUNHO/2010 Paula Strassmann PGS Medical Statistics Métodos não probabilísticos: escolha deliberada dos elementos da amostra* acidental intencional * Não é representativa da população, logo seus resultados não podem ser generalizados. Paula Strassmann PGS Medical Statistics MAIO/2010 Noções básicas de bioestatística Amostragem

59 JUNHO/2010 Paula Strassmann PGS Medical Statistics Amostragem Aleatória Simples Técnicas de Amostragem Noções básicas de bioestatística

60 JUNHO/2010 Paula Strassmann PGS Medical Statistics Amostragem Sistemática Técnicas de Amostragem Noções básicas de bioestatística

61 JUNHO/2010 Paula Strassmann PGS Medical Statistics Amostragem Estratificada Técnicas de Amostragem Noções básicas de bioestatística

62 JUNHO/2010 Paula Strassmann PGS Medical Statistics Amostragem por Conglomerado Técnicas de Amostragem Noções básicas de bioestatística

63 JUNHO/2010 Paula Strassmann PGS Medical Statistics Amostragem de Conveniência Técnicas de Amostragem Noções básicas de bioestatística

64 JUNHO/2010 Paula Strassmann PGS Medical Statistics Erro amostral É a diferença entre um resultado amostral e o verdadeiro resultado populacional (flutuações amostrais aleatórias). Erro não amostral Quando os dados amostrais são coletados, registrados ou analisados incorretamente. Escolha de uma amostra não aleatória e tendenciosa Utilização de um instrumento de mensuração defeituoso Uma questão formulada de modo tendencioso Um grande número de recusas de resposta Cópia incorreta dos dados amostrais Amostragem Noções básicas de bioestatística

65 JUNHO/2010 Paula Strassmann PGS Medical Statistics Formas de obtenção de dados Pergunta de Interesse Comparação de Tratamentos Caracterização de Grupos Amostra Casual Simples Amostra Estratificada Amostra Pareada Amostra Não Pareada Noções básicas de bioestatística

66 JUNHO/2010 Paula Strassmann PGS Medical Statistics Problema: Estimar a prevalência de desnutridos entre alunos de escolas públicas do Estado de São Paulo. População: alunos de escolas públicas do Estado de São Paulo. Amostra: alunos de uma escola estadual do Morumbi. Parâmetro: prevalência (p) de desnutrição – proporção de crianças desnutridas na população. Estimador: proporção de crianças desnutridas observada na amostra (p). Estimativa: valor observado, por exemplo, 15%. Inferência: generalização dos resultados da amostra para a população. Termos básicos Noções básicas de bioestatística

67 JUNHO/2010 Paula Strassmann PGS Medical Statistics Variáveis Características que serão observadas, medidas ou contadas nos elementos da amostra, como por exemplo, sexo, estado civil, peso, altura, etc, e que podem variar, isto é, assumir um valor diferente para cada elemento da amostra. Identificadas as variáveis de interesse, é necessário distinguir os seus tipos (classificações). Estatística descritiva

68 JUNHO/2010 Paula Strassmann PGS Medical Statistics Qualitativas: resultam de uma classificação por tipos ou atributos nominais ordinais: existe uma ordem natural entre as classes Quantitativas: valores expressos em números Discretas: assumem apenas valores pertencentes a um conjunto enumerável (números inteiros não negativos) Contínuas: resultam, em geral, de uma mensuração, podendo assumir, teoricamente, qualquer valor num intervalo de variação. Tipos de Variáveis Estatística descritiva

69 JUNHO/2010 Paula Strassmann PGS Medical Statistics Tipos de variáveis QualitativasQuantitativas Nominal (classificação) Ordinal (classificação) pressão sangüínea (baixa, nl, alta), nível de escolaridade sexo, raça, nacionalidade, grupo sangüineo Discreta (contagem) Contínua (mensuração) nº de dias de internação, nº de filhos peso (Kg), altura (cm), glicemia (mg/dl) Estatística descritiva

70 JUNHO/2010 Paula Strassmann PGS Medical Statistics Variáveis Quantitativas x Qualitativas Exemplos: Nível de glicemia no sangue Índice de Massa Corpórea Quantitativo Qualitativo Quantitativo Qualitativo Valor numérico expresso em mg/dl Normal Alterado Valor numérico expresso em kg/m² Normal Sobrepeso Obeso Estatística descritiva

71 JUNHO/2010 Paula Strassmann PGS Medical Statistics Os dados se ajustam às categorias Chamados de dados categóricos Medidas resumo: contagem, proporção ou porcentagem Métodos gráficos: gráficos de barra ou colunas, setores (pizza) Exemplos: resultados de diagnóstico: normal ou anormal, sexo: masculino ou feminino Tipos de dados: Qualitativos Estatística descritiva

72 JUNHO/2010 Paula Strassmann PGS Medical Statistics Tipos de dados: Quantitativos Medem uma quantidade As diferenças entre os valores têm um significado numérico em uma escala. Medidas resumo: Média, desvio padrão,... Métodos gráficos: Box-plot, histograma,... Exemplos: peso, idade Estatística descritiva

73 JUNHO/2010 Paula Strassmann PGS Medical Statistics IdadeAlturaPeso Média ± DP31,5 ± 9,981,68 ± 0,0971,3 ± 12,55 Mínimo171,5255 Mediana30,51,6870 Máximo521,90106 Exemplo de tabela para variáveis numéricas: Estatística descritiva

74 JUNHO/2010 Paula Strassmann PGS Medical Statistics Transformando uma variável numérica em uma variável categórica Faixa etárian(%) 16 a 25 anos8(40,0%) 26 a 35 anos5(25,0%) 36 a 45 anos5(25,0%) 46 a 55 anos2(10,0%) Total20(100,0%) Estatística descritiva

75 JUNHO/2010 Paula Strassmann PGS Medical Statistics Representação gráfica para Variáveis qualitativas (categóricas) ou quantitativas discretas GRÁFICO DE BARRAS / COLUNAS: É utilizado para apresentar variáveis categóricas ou numéricas discretas. Em geral, no eixo das abscissas encontram-se as categorias e a altura das colunas correspondem às freqüências (simples ou relativas) das categorias. Estatística descritiva

76 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de colunas para variáveis quantitativas discretas Nº de filhos Nº de funcionários casados 19 213 37 43 Estatística descritiva

77 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de colunas para variáveis qualitativas SatisfaçãoIndivíduos Insatisfeito50 Pouco satisfeito75 Muito satisfeito120 Estatística descritiva

78 JUNHO/2010 Paula Strassmann PGS Medical Statistics Cruzamentos: Variáveis categóricas x Variáveis categóricas Sexo \ TabagismoSimNãoTotal Masculino175(81%)40(19%)215(100%) Feminino50(83%)10(17%)60(100%) Total225(82%)50(18%)275(100%) Estatística descritiva

79 JUNHO/2010 Paula Strassmann PGS Medical Statistics Cruzamentos: Variáveis categóricas x Variáveis categóricas (Outro exemplo) Faixa etária \ Estado civilSolteiroCasadoSeparado / viúvoTotal Até 30 anos62(73%)18(21%)5(6%)85(100%) 30 a 50 anos23(24%)57(59%)17(18%)97(100%) Mais de 50 anos12(14%)42(50%)30(36%)84(100%) Total97(36%)117(44%)52(20%)266(100%) Estatística descritiva

80 JUNHO/2010 Paula Strassmann PGS Medical Statistics Cruzamentos: Variáveis categóricas x Variáveis categóricas (Outro exemplo – Continuação) Estatística descritiva

81 JUNHO/2010 Paula Strassmann PGS Medical Statistics Representação gráfica para variáveis qualitativas (categóricas) GRÁFICO DE SETORES (PIZZA): Cada “fatia” corresponde à porcentagem de ocorrências em cada categoria de resposta da variável. É indicado para variáveis qualitativas (preferencialmente nominais). Neste tipo de gráfico, todas as observações da amostra estão classificadas em uma das categorias, ou seja, a soma das porcentagens deve ser igual a 100%. Estatística descritiva

82 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de setores (pizza) para variáveis qualitativas Estatística descritiva

83 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo de gráfico de setores (pizza) para variáveis qualitativas Sexof(%) Homens150(75,0%) Mulheres50(25,0%) Total200(100,0%) Estatística descritiva

84 JUNHO/2010 Paula Strassmann PGS Medical Statistics Histograma: Gráfico de barras justapostas em que no eixo horizontal está a variável de interesse, dividida em classes geralmente de mesmo tamanho. No eixo vertical, constrói-se uma barra para cada classe com altura igual à freqüência absoluta ou relativa correspondente. A barra é centrada no ponto médio da classe. Polígono de Freqüências: Construído a partir do histograma, onde se une através de segmentos de reta as ordenadas correspondentes aos pontos médios de cada classe. Representação gráfica para Variáveis quantitativas contínuas Estatística descritiva

85 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo de histograma: Dados de registro pediátrico da concentração de chumbo na urina de 140 crianças de uma determinada região. Concentração de chumbo umol/24 hrsNº de crianças 0|  0.4 2 0.4 |  0.8 7 0.8 |  1.2 10 1.2 |  1.6 16 1.6 |  2.0 23 2.0 |  2.4 28 2.4 |  2.8 19 2.8 |  3.2 16 3.2 |  3.6 11 3.6 |  4.0 7 4.0 |  4.4 1 Total140 Estatística descritiva

86 JUNHO/2010 Paula Strassmann PGS Medical Statistics  Valor que ocorre com maior freqüência. Exemplo: As idades dos alunos de uma classe são: 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 20 anos;  Pode existir mais de uma moda. Distribuição é bimodal, trimodal,... Exemplo: As idades dos alunos de uma classe são: 19, 19, 19, 20, 20, 20, 21, 22. Nesse caso, Moda = 19 e 20 anos (bimodal);  Pode não existir moda (não ter um valor mais freqüente). Exemplo: As idades dos alunos de uma classe são: 18, 19, 20, 21, 22. Nesse caso, Não existe Moda. Medidas de posição – Moda Estatística descritiva

87 JUNHO/2010 Paula Strassmann PGS Medical Statistics  É a medida de tendência central mais utilizada;  Leva em conta todos os valores da variável;  É afetada por valores extremos;  É o “ponto de equilíbrio” da distribuição dos dados. Média 2 (Dados ordenados) Média 1 (Dados ordenados) Medidas de posição – Média Estatística descritiva

88 JUNHO/2010 Paula Strassmann PGS Medical Statistics Exemplo: Um estudante fez 5 provas e obteve notas 75, 90, 83, 77 e 92. Então sua nota média é: Medidas de posição – Cálculo da Média Estatística descritiva

89 JUNHO/2010 Paula Strassmann PGS Medical Statistics  Divide os dados ordenados ao meio;  Medida resistente: pouco afetada por mudanças de valores discrepantes (extremos). mediana 50% (Dados ordenados) Medidas de posição – Mediana Estatística descritiva

90 JUNHO/2010 Paula Strassmann PGS Medical Statistics  Ordenam-se os dados;  Seleciona-se a observação central.  n ímpar: valor da observação central  n par: média das duas observações centrais Posição da mediana = 3Mediana = 83 Posição da mediana = 3,4 Mediana = (83 + 90)/2 = 86,5 Medidas de posição – Cálculo da Mediana Estatística descritiva

91 JUNHO/2010 Paula Strassmann PGS Medical Statistics Medidas de posição central São valores únicos representativos dos dados. Os mais usados são média aritmética, moda e mediana. Exemplo: Mediana = 49 anos (posição central) Moda = 39 anos (idade mais freqüente) Média = (575/11) = 52,3 anos Estatística descritiva

92 JUNHO/2010 Paula Strassmann PGS Medical Statistics Concluindo: Média: É o “ponto de equilíbrio” da distribuição dos dados. Moda: É o valor que ocorre com mais frequência. Mediana: Divide os dados ordenados ao meio. Estatística descritiva

93 JUNHO/2010 Paula Strassmann PGS Medical Statistics Q1Q1 Q2Q2 Q3Q3 Dados em ordem crescente  Dividem os dados ordenados em 4 partes iguais: 25% dos dados estão abaixo do 1º quartil (Q1) 50% dos dados estão abaixo do 2º quartil (Q2 ou mediana) 75% dos dados estão abaixo do 3º quartil (Q3) Dados Resistentes Medidas de posição – Quartis Estatística descritiva

94 JUNHO/2010 Paula Strassmann PGS Medical Statistics 3 o quartil (Q3) Mediana 1 o quartil (Q1) 1,5 (Q3 - Q1) Ponto discrepante Box-plot 1,5 (Q3 - Q1) Valor máximo entre os não discrepantes Valor mínimo entre os não discrepantes Estatística descritiva

95 JUNHO/2010 Paula Strassmann PGS Medical Statistics Medidas de Dispersão – Variância amostral A variância quantifica a variabilidade ou espalhamento ao redor da média das medidas. Tende a ser um número grande e o seu valor sai dos limites dos valores observados em um conjunto de dados. Além disso, sua unidade de medida corresponde a unidade de medida da média elevada ao quadrado. Estatística descritiva

96 JUNHO/2010 Paula Strassmann PGS Medical Statistics Medidas de Dispersão – Desvio padrão amostral O desvio padrão, que é a raiz quadrada da variância, tem a mesma unidade de medida da média e pode ser usado para descrever a quantidade de dispersão na distribuição da freqüência. Estatística descritiva

97 JUNHO/2010 Paula Strassmann PGS Medical Statistics O desvio padrão por si só não nos diz muita coisa. Um desvio padrão de 2 unidades pode ser considerado pequeno para um conjunto de dados cujo valor médio é 200; no entanto, se a média for igual a 20, o mesmo não pode ser dito. Além disso, o fato de o desvio padrão ser expresso na mesma unidade dos dados limita o seu emprego quando desejamos comparar dois ou mais conjuntos de dados, relativamente à sua dispersão ou variabilidade, quando expressas em unidades diferentes. Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos ao seu valor médio, medida essa denominada coeficiente de variação (CV). Medidas de Dispersão (Continuação) Estatística descritiva

98 JUNHO/2010 Paula Strassmann PGS Medical Statistics  Indica a dispersão em relação à média;  É uma medida de variabilidade relativa, definida como a razão entre o desvio padrão e a média, sendo uma medida adimensional expressa em percentual.  Pode ser usado para comparar a dispersão de dois conjuntos de dados, sem que eles estejam necessariamente na mesma unidade de medida. Medidas de Dispersão – Coeficiente de correlação Estatística descritiva

99 JUNHO/2010 Paula Strassmann PGS Medical Statistics Coeficiente de variação – Exemplo Como 13 representa 18% de 72, então o CV é de 18% Por exemplo, em uma amostra de pacientes para determinação do clearance de creatinina, constatou-se que a média era de 72 ml/min e o desvio- padrão, de 13. Estatística descritiva

100 JUNHO/2010 Paula Strassmann PGS Medical Statistics Princípios da Análise Estatística Distribuições amostrais: Conceitos fundamentais para verificar a precisão da amostra É o valor esperado do desvio padrão das médias de várias amostras. ERRO PADRÃO (E.P.) = medida de variabilidade de uma amostra para outra. S = desvio padrão da variável na amostra n = tamanho da amostra Variável Contínua E.P. (média) = Variável Categórica E.P. (proporção) =

101 JUNHO/2010 Paula Strassmann PGS Medical Statistics Distribuição normal A maior parte dos estudos clínicos tem seus dados seguindo uma distribuição normal, pois esta é a tendência natural dos fenômenos biológicos. Exemplos: peso, altura, pressão arterial, quociente de inteligência, etc. A escolha do teste estatístico ideal é determinada pelo fato de os dados se encaixarem ou não no padrão de distribuição normal. Distribuição Normal padrão: Curva de Gauss Princípios da Análise Estatística

102 JUNHO/2010 Paula Strassmann PGS Medical Statistics A curva normal é determinada por uma fórmula matemática que envolve os parâmetros média e desvio-padrão. Através de uma fórmula, pode-se transportar os dados de todos os possíveis tipos de variáveis e unidades utilizáveis em pesquisa clínica para uma distribuição normal padrão. Princípios da Análise Estatística Distribuição normal

103 JUNHO/2010 Paula Strassmann PGS Medical Statistics De cada valor coletado no estudo, subtraímos a média dos dados e dividimos o resultado pelo desvio-padrão. Dessa forma, obtemos valores correspondentes, que vão de -3 a 3 (valores de Z), na distribuição normal padrão. D.P. amostral = média amostral X = Valor observado Princípios da Análise Estatística

104 JUNHO/2010 Paula Strassmann PGS Medical Statistics Propriedades da Distribuição Normal (a) Média = Moda = Mediana (b) É completamente determinada pela média e pelo desvio padrão (c) A curva de freqüência é simétrica em torno de média (d) O achatamento é padrão Distribuição normal padrão: µ = 0 σ = 1 Princípios da Análise Estatística

105 JUNHO/2010 Paula Strassmann PGS Medical Statistics Propriedades da Distribuição Normal Distribuição normal padrão: µ = 0 σ = 1 95% dos valores observados encontram- se entre -1,96 e 1,96 Z corresponde a p 1,96  0,05 Z corresponde a p 1,96  0,05 Princípios da Análise Estatística

106 JUNHO/2010 Paula Strassmann PGS Medical Statistics (i) A distribuição das médias amostrais será NORMAL se a distribuição dos dados na população for Normal. (ii) A distribuição das médias amostrais será aproximadamente Normal não importando a distribuição da variável na população, desde que a amostra seja de tamanho grande. TEOREMA DO LIMITE CENTRAL Distribuições amostrais Princípios da Análise Estatística

107 JUNHO/2010 Paula Strassmann PGS Medical Statistics Distribuições amostrais Erro amostral (EA): medida de precisão da estimativa associada a um certo nível de confiança. Como não conheço a média populacional, então o erro amostral tem associado a ele um grau de confiança. Princípios da Análise Estatística

108 JUNHO/2010 Paula Strassmann PGS Medical Statistics 95% das 95% das amostras de tamanho n têm média entre x-1,96EP e x+1,96EP. Supondo a “normalidade” dos dados, “INTERVALOS DE CONFIANÇA (IC)” Erro amostral (EA). 68% das amostras de tamanho n vão fornecer uma média que se afasta da verdadeira no máximo 1 erro padrão. IC (68%) = IC (95%) = Princípios da Análise Estatística

109 JUNHO/2010 Paula Strassmann PGS Medical Statistics Procedimentos para obter o Intervalo de Confiança (1) Calcular a medida resumo da amostra. (2) Calcular o erro padrão correspondente. (3) Calcular o Erro Amostral correspondente para uma específica confiança (90%, 95%, etc.) e interpretar a expressão: medida resumo  EA : 90% ou 95% das amostras fornecem uma média (proporção) que se afasta da verdadeira no máximo por EA. Princípios da Análise Estatística

110 JUNHO/2010 Paula Strassmann PGS Medical Statistics (4) Obter o intervalo de confiança da seguinte forma: Limite inferior: medida resumo - EA Limite superior: medida resumo + EA Observação: Este procedimento pode ser utilizado para qualquer medida resumo. O que precisamos saber é como obter o Erro Padrão correspondente. Princípios da Análise Estatística Procedimentos para obter o Intervalo de Confiança

111 JUNHO/2010 Paula Strassmann PGS Medical Statistics Quanto maior a amplitude do intervalo, menor a precisão e maior a incerteza associada à estimativa. Os intervalos de confiança podem ser utilizados não só para fazer estimativas, mas também para comparar estimativas obtidas em diferentes amostras (ou subgrupos de uma mesma amostra). Em estudos comparativos, para comparar as médias de 2 ou mais grupos, podemos avaliar a sobreposição dos intervalos de confiança. Considerações finais sobre o IC Princípios da Análise Estatística

112 JUNHO/2010 Paula Strassmann PGS Medical Statistics Teste de Hipótese – Exemplo estatística do teste “p-value” p =...... zo =...... Comparação entre dois tratamentos: Taxa de resposta  H 0 : Trat. A = Trat. B  H a : Trat. A  Trat. B H 0 : Trat. A - Trat. B = 0  H a : Trat. A - Trat. B  0 Valor p: Supondo H 0 verdadeira, p é a chance de encontrar um resultado tal como o obtido na amostra Princípios da Análise Estatística

113 JUNHO/2010 Paula Strassmann PGS Medical Statistics Teste unilateralTeste bilateral Ho: Tratamento novo é tão bom quanto o tratamento padrão Ha: Tratamento novo é melhor que o tratamento padrão Ho: Tratamento novo é semelhante ao tratamento padrão Ha: Tratamento novo é diferente do tratamento padrão Ho: Trat. novo  Trat. padrão Ha: Trat. novo > Trat. padrão Ho: Trat. novo = Trat. padrão Ha: Trat. novo  Trat. padrão  /2  se p-value  rejeita Hose p-value  /2  rejeita Ho Princípios da Análise Estatística

114 JUNHO/2010 Paula Strassmann PGS Medical Statistics Os erros que podemos cometer Erro tipo I: rejeitamos a hipótese nula quando ela é verdadeira (rejeitamos que os tratamentos são igualmente eficazes quando eles de fato são). Precisamos decidir sobre o valor de α antes de coletar os dados. Em geral, o valor atribuído é 0,05 (5%). A probabilidade máxima de cometer um erro doTipo I é denotada por α (alfa). α é o nível de significância do teste. Princípios da Análise Estatística

115 JUNHO/2010 Paula Strassmann PGS Medical Statistics Erro tipo II: não rejeitamos a hipótese de nulidade quando ela é falsa (aceitamos que os tratamentos são igualmente eficazes, quando na verdade não o são). Poder do teste, portanto, é a chance de detectar como estatisticamente significante uma “diferença” real. A probabilidade de cometer um erro doTipo II é denotada por β (beta). O complemento de β (1 - β ) é o poder do teste. Princípios da Análise Estatística Os erros que podemos cometer

116 JUNHO/2010 Paula Strassmann PGS Medical Statistics Erros tipo I (  ) e tipo II (  ) Erro tipo II (  ) H0 verdadeira H0 falsa Erro tipo I (  ) Aceita H0 (p >  ) Rejeita H0 (p ≤  ) poder do teste (1-  ) p = nível descritivo (p-value)  = probabilidade de ocorrência do erro tipo I (nível de significância)  = probabilidade de ocorrência do erro tipo II 1-  = poder do teste Princípios da Análise Estatística

117 JUNHO/2010 Paula Strassmann PGS Medical Statistics Tamanho Amostral Testes de Hipóteses Os cálculos para o tamanho da amostra estão baseados nos princípios dos Testes de Hipóteses. erros do Tipo I (α - confiança) e do Tipo II (poder), O cálculo leva em consideração os erros do Tipo I (α - confiança) e do Tipo II (poder), de forma que as estimativas de interesse tenham precisão suficiente para serem utilizadas. Princípios da Análise Estatística

118 JUNHO/2010 Paula Strassmann PGS Medical Statistics Análise Inferencial Testes paramétricos suposições básicas sobre a população da qual a amostra foi retirada distribuição normal (simétrica) dados numéricos, de distribuição contínua.... Testes não-paramétricos os testes independem da distribuição da população distribuição pode ser assimétrica dados não contínuos... Vantagem: mais eficiente Desvantagem: restrições para aplicação do teste estatístico Vantagem: poucas restrições para aplicação do teste estatístico Desvantagem: menos eficiente Princípios da Análise Estatística

119 JUNHO/2010 Paula Strassmann PGS Medical Statistics Variáveis Categóricas Independentes Teste Qui-Quadrado (  2 ) comparação de dados nominais (categóricos) ou ordinais; medida de discrepância entre as frequências observadas e esperadas; detectar diferenças entre grupos independentes quanto a determinada caracteristica (2 ou mais amostras); teste não-paramétrico.  2 =...... p =...... Comparando grupos

120 JUNHO/2010 Paula Strassmann PGS Medical Statistics Risco Relativo (RR) estudos prospectivos risco de desenvolver doença quando exposto a um determinado fator de risco, comparado com pacientes não expostos ao fator de risco. Odds Ratio (OR) – (razão de chances) estudos retrospectivos chance de que pacientes com uma determinada doença tenham sido expostos a um determinado fator de risco, quando comparado com pacientes não doentes. Medidas de intensidade da associação (Variáveis Independentes) RISCO RELATIVO E ODDS RATIO Comparando grupos

121 JUNHO/2010 Paula Strassmann PGS Medical Statistics Variáveis Categóricas Dependentes Teste de McNemar (Qui-Quadrado de McNemar) Comparação de dados nominais (categóricos) ou ordinais Verificar a significância das mudanças em 2 situações, para respostas nos mesmos indivíduos. teste não-paramétrico  2  2 MC =...... p =...... Linha i, coluna j da Tabela de frequências Comparando grupos

122 JUNHO/2010 Paula Strassmann PGS Medical Statistics HbA Gestantes Média ( X ) Desvio Padrão (s) n Normais 7,36 0,85 30 Diabéticas 9,27 0,76 30 t = -5,32 p< 0,0001 Hemoglobina glicosilada (HbA) entre dois grupos de gestantes (normais e diabéticas). DUAS AMOSTRAS INDEPENDENTES: t de Student ESTATÍSTICA INFERENCIAL Testes paramétricos (supondo distribuição Normal) Comparando grupos

123 JUNHO/2010 Paula Strassmann PGS Medical Statistics ANOVA – Analysis of Variance extensão do teste t-Student para mais de duas amostras comparação de médias amostras independentes Exemplo: 3 tratamentos H 0 = trat.A = trat.B = trat.C Ha = pelo menos 1 dos tratamentos difere dos demais Fator de análise : tratamento F =....p =.... MAIS DE 2 AMOSTRAS INDEPENDENTES: ANOVA A estatística “F” é calculada de uma forma mais complexa e não vamos nos aprofundar aqui. ESTATÍSTICA INFERENCIAL (Continuação) Testes paramétricos (supondo distribuição Normal) Comparando grupos

124 JUNHO/2010 Paula Strassmann PGS Medical Statistics Formulação das hipóteses: H 0 :  Dif = 0 H A :  Dif  0 Teste de Hipóteses: Quando as amostras são dependentes, para cada indivíduo é calculada a diferença nas suas medidas: (Pulso Depois – Pulso Antes ). Se essa diferença for igual a zero, poderemos concluir que não houve alteração na pulsação. (  ) Para um grupo, esperamos que o valor médio (  ) da diferença seja zero. ESTATÍSTICA INFERENCIAL (Continuação) Testes paramétricos (supondo distribuição Normal) Comparando grupos

125 JUNHO/2010 Paula Strassmann PGS Medical Statistics  Valor p = 0,260 No exemplo Conclusão: Como p = 0,260  p > 0,05  t está na região de não-rejeição. Não rejeitamos a igualdade das pulsações antes e depois. ESTATÍSTICA INFERENCIAL (Continuação) Testes paramétricos (supondo distribuição Normal) Comparando grupos

126 JUNHO/2010 Paula Strassmann PGS Medical Statistics Em geral, para cada teste paramétrico existe o correspondente não paramétrico: Teste não paramétrico Teste paramétrico Mann-Whitney . (Teste t) Wilcoxon Sinalizado . (Teste t pareado) Kruskall-Wallis . (ANOVA) Friedman . (ANOVA com medidas repetidas) ESTATÍSTICA INFERENCIAL (Dados Numéricos) Testes paramétricos e não paramétricos Os testes não paramétricos são baseados em “postos”. A cada dado é atribuída uma ordem. Exemplo: Valores originais:1,92,40,85,30,5 Postos  3 4 2 5 1 Comparando grupos

127 JUNHO/2010 Paula Strassmann PGS Medical Statistics Esquema resumido: Testes Estatísticos mais utilizados na área médica VARIÁVEISVARIÁVEIS Nº grupos Grupos são Independentes? Grupos são Independentes? 2 3 ou mais Nº grupos Grupos são Independentes? Grupos são Independentes? 2 3 ou mais Sim Não Teste t Mann-Whitney Teste t pareado Wilcoxon Sinalizado ANOVA e ANCOVA Kruskal-Wallis ANOVA com medidas repetidas Friedman Quantitativas Sim Não Sim Não Qui-Quadrado/Fisher McNemar Qui-Quadrado Cochran Existe diferença? Qualitativas

128 JUNHO/2010 Paula Strassmann PGS Medical Statistics Bibliografias recomendadas PAGANO, Marcello (1945) – Princípios de bioestatística / Marcello Pagano, Kimberlee Gauvreau; tradução Luiz Sérgio de Castro Paiva; revisão técnica Lúcia Pereira Barroso. – São Paulo: Pioneira Thomson Learning, 2004. (paginas 304-317). Titulo original: Principles of bioestatistics Bussab, W.O. e Morettin, P.A. (2005) - Estatística Básica. 5ª Edição. São Paulo: Saraiva. 526p. Dawson-Saunders, Beth e Trapp, Robert G. (1994) - Basic & Clinical Biostatistics – A Lange medical book. Second Edition – Prentice-Hall Internationl Inc. 344p. Riffenburgh, Robert H. (2006) – Statistics in Medicine – Second Edition – San Diego, Caifornia – Elsevier Academic Press – 622p. Del Giglio, Auro (2008) – Conselhos para um jovem médico – 1ª Ed. – Editora Manole Ltda. – 118 p.

129 JUNHO/2010 Paula Strassmann PGS Medical Statistics Paula G. Strassmann pstrass@pgs.com.br Paula Strassmann PGS Medical Statistics


Carregar ppt "JUNHO/2010 Paula Strassmann PGS Medical Statistics Regressão Linear Simples Análise de Sobrevivência Testes Diagnósticos."

Apresentações semelhantes


Anúncios Google