Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 6 Prof. Cristina Ortiz Valete.

Slides:

Advertisements

Apresentações semelhantes

Análise Estatística Testes de Hipóteses.

Advertisements

Estatística amintas paiva afonso.

ANOVA 1 fator Prof. Ivan Balducci FOSJC / Unesp.

Departamento de Informática em Saúde Universidade Federal de São Paulo – UNIFESP UNIFESP Teste de Mann-Whitney Alex E. J. Falcão (

Analise de Regressão Parte 2.

CAPÍTULO 7 TESTE DE HIPÓTESE

Análise de Variância da Regressão

2.5 INFERÊNCIAS SOBRE A DIFERENÇA NAS MÉDIAS, COMPARAÇÕES EMPARELHADAS

CAPÍTULO 7 TESTE DE HIPÓTESE

EE-240 Análise de Tendência: Regressão Linear.

DELINEAMENTO COMPLETAMENTE CASUALIZADO

Prof. Marllus Gustavo Ferreira Passos das Neves

Prof. Marllus Gustavo Ferreira Passos das Neves

Estatística Aula 19 Prof. Marllus Gustavo Ferreira Passos das Neves

Estatística 8 - Distribuições Amostrais

MANOVA Análise de variância multivariada

MB751 – Modelos de previsão

ANÁLISE DE VARIÂNCIA.

Distribuição F Considere duas populações com distribuição de Gauss com médias 1, 2 e variâncias 12 e 22 . Retire uma amostra aleatória de tamanho.

Inferências para uma amostra

Kruskal-Wallis Test Ex: Pesos em Kg de 3 grupos de indivíduos de grupos étnicos diferentes (caucasianos, latinos e asiáticos). Grupo 1: 72; 75; 73; 67;

One-Way ANOVA Com mais de duas amostras independentes de indivíduos queremos saber se as médias dos grupos na população são iguais.

Testes de Hipótese Dr Hermano Alexandre Doutorando em Saúde Coletiva

ANOVA Prof. Herondino.

Análise de Variância (ANOVA)

ME623A Planejamento e Pesquisa. Não Interação no Modelo de 2 Fatores A presença de interação tem um impacto na interpretação dos dados No entanto, se.

ME623 Planejamento e Pesquisa

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2014 Intervalo de Confiança Camilo Daleles Rennó

MEDIDAS DE VARIABILIDADE DADOS NÃO-AGRUPADOS

Teste de Hipóteses de uma amostra Prof. Helcio Rocha

ANOVA: Análise de Variância APLICAÇÃO.

Estatística Para um dado conjunto de dados, podemos calcular as seguintes grandezas: 1) Medidas de posição 2) Medidas de dispersão 3) Parâmetros de simetria.

Diogo Fernando Bornancin Costa Fábio de H.C.R. dos Santos

Aula 5 - Método experimental ou de seleção aleatória

Probabilidade e Estatística Exemplo da Moeda Balanceada

VARIÂNCIA NÃO EXPLICADA (WITHIN) ou INTRÍNSECA (FLUTUAÇÕES)

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Intervalo de Confiança Camilo Daleles Rennó

Noções de Inferência Estatística

COMPARAÇÃO DE DUAS POPULAÇÕES

Estatística e Probabilidade

EME709 – PLANEJAMENTO DO EXPERIMENTO Profa. Sachiko A. Lira.

Teste de Hipóteses Pontos mais importantes: -objectivo

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Variância (ANOVA) Camilo Daleles Rennó

UFSC.PósMCI.FME.Inferências Envolvendo Variâncias. (8.1) 6 Inferências Envolvendo Variâncias.

Introdução ao Stata 03 de maio de 2013

Aula 12 - Teste de associação1 DATAAulaCONTEÚDO PROGRAMÁTICO 10/03Segunda1Níveis de mensuração, variáveis, organização de dados, apresentação tabular 12/03Quarta2Apresentação.

Regressão e Previsão Numérica.

Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 2 Prof. Cristina Ortiz Valete.

análise dos estimadores

ERROS E TRATAMENTO DE DADOS ANALÍTICOS

Dinâmica I (aula 2) Queda no ar!.

Disciplina Engenharia da Qualidade II

Introdução a planejamento e otimização de experimentos

Métodos Estatísticos Aplicados às Ciências Biológicas - 7ª aula -

PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –

Métodos Estatísticos Aplicados às Ciências Biológicas - 9ª aula -

Métodos Estatísticos Aplicados às Ciências Biológicas 10ª aula.

Métodos Estatísticos Aplicados às Ciências Biológicas 8ª aula - Prática.

Regressão Linear Simples

AULA 2 Prof. Dr. Márcio A. Fiori -

Regressão linear simples

Estimação e Intervalo de Confiança. Estimação Frequentemente necessitamos, por meio das amostras, conhecer informações gerais da população. A estimação.

Inferência 1:Estimação de Parâmetros Relembrando o Teorema Central do Limite Da aula anterior: a) Os estimadores da média e da s 2 são não viciados e de.

AULA 11 – REGRESSÃO Parte I

Estatística Aplicada à Adminitração Prof. Alessandro Moura Costa UNIVERSIDADE FEDERAL DO PAMPA BACHARELADO EM ADMINISTRAÇÃO DE EMPRESAS.

Regressão Linear (aula 14 – Parte 2).

Variância/ Covariância, Correlação Regressão. Variância.

Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.

Transcrição da apresentação:

Universidade Federal Fluminense Faculdade de Medicina Mestrado Profissional em Saúde Materno-Infantil 2011 BIOESTATÍSTICA-aula 6 Prof. Cristina Ortiz Valete Prof. Adjunta de Pediatria Doutora em Epidemiologia

Análise de variância-ANOVA ▫Quando precisamos comparar mais de dois grupos de médias, precisamos lançar mão de outros testes, ao invés de comparar cada grupo de pares pelo teste t. ▫Uma única análise pode olhar para todo o conjunto de dados-ANOVA one-way (um fator-os grupos) ou two-way (dois fatores-os grupos + outro fator) ▫Teste paramétrico

Sabemos que existe uma variabilidade entre indivíduos de um mesmo grupo mas em geral o que interessa é buscar diferença entre grupos A análise baseia-se no pressuposto que as amostras vem de uma população com distribuição próxima a normal e são independentes Faz-se a estimativa da variação dentro de cada grupo A hipótese nula é de que as amostras não são diferentes, ou seja, possuem a mesma média e variância Trabalhamos com tabelas de distribuição F

Após rodar a análise de variância, observamos a variação dos indivíduos “ao redor” da média do grupo. A média do grupo é o valor ajustado (fitted) e a diferença entre os valores observados e ajustados é chamada de resíduo. Devemos construir gráficos dos resíduos para observar o pressuposto de normalidade (homocedasticidade) Obs: se rodarmos uma análise de variância para dois grupos, será o mesmo que um teste t

A variabilidade total é medida pelo total da soma dos quadrados, que baseia-se na soma dos quadrados das diferenças das observações em relação a media Este total surge da soma das diferenças dentro dos grupos e entre os grupos. Cada soma dos quadrados é transformada em mean square (media dos quadrados) através da divisão pelos graus de liberdade

variaçãoGraus de liberdade Soma dos quadrados Mean squares Fpvalor Entre grupos 2 (3 grupos) (é a razão entre as mean squares) 0.04 Dentro grupos 19 (retira- se uma observação de cada grupo) total Exemplo de uma saída comentada: nivel de folato em três grupos de cardiopatas independentes submetidos a diferentes doses de óxido nitroso (oneway). Altman Desvio padrão dos resíduos Os grupos não precisam ter o mesmo n

Sob a hipótese nula de igualdade de variâncias, a razão das variâncias seria 1 e Ho=  1=  2=  3; Ha: pelo menos um dos grupos é diferente Como a razão foi de 3.71 (valor de F 2,19, 0.95 =3.52), dizemos que a variância observada entre os grupos é 3.71 vezes maior do que a esperada (se a hipótese nula fosse verdadeira) e que há diferença entre as médias pois 3.71>3.52) Comparando o valor 3.71 na tabela F com 2 e 19 graus de liberdade, achamos valor p<0.05

Existe também a análise de variância não paramétrica-Kruskal Wallis (extensão do Mann Whitney) Este, não trabalha com a distribuição F

Se há dois fatores de classificação, a análise é chamada ANOVA two-way Neste tipo de análise é necessário ter o mesmo n em cada grupo, portanto, não pode haver missings

sujeitoTempo (minutos)médiaSD (4.1) (3.4) (2.5) (8.0) (4.9) (2.8) (2.4) (2.4) (2.6) média (SD)(16.4)(17.8)(17.2)(16.5)(16.4) Exemplo: efeito do enalapril no batimento cardíaco em vários momentos Altman

Novamente, existe variabilidade, intra individuos (o 1 com ele mesmo em outros momentos-within subjects) e entre sujeitos (between) É uma extensão do teste t pareado...

variaçãoGraus de liberdade Soma dos quadrados Mean squares Fpvalor sujeitos (compara- se com 8 e 24 graus de liberdade) < (este é o resultado principal) tempos (compara- se com 3 e 24 graus de liberdade) resíduo total Neste caso, o valor de F será obtido pela divisão dos mean squares pela variância dos resíduos Hipótese nula rejeitada; há diferença da frequência cardíaca em duas horas

Trabalhamos então neste caso com ▫A média global ▫O efeito do paciente ▫O efeito do tempo ▫Erro aleatório normal de média zero e variância constante

A diferença entre os valores observados e o valor ajustado, chamamos de resíduos, conforme citado; devem ter média zero e variância constante Não há necessidade de haver distribuição normal no ANOVA two-way, mas os resíduos devem ter distribuição normal Chamada também de repeated measures ANOVA

Outro exemplo: medidas de PC fetais por quatro examinadores obs 1obs2obs3obs4 Feto Feto Feto

variaçaoGraus de liberdade Soma dos quadrados Mean squares Fpvalor fetos < observadores Fetos x obs (interação) resíduos total Como a interação feto-observador não foi significativa, refaz-se o modelo sem esta variável

Modelos de regressão ▫Linear-modelagem estatística da associação entre variáveis contínuas ▫Logística ▫Deve ser sempre observado o gráfico de dispersão entre as variáveis

Para construir modelos de regressão linear simples precisamos observar o diagrama de dispersão e o método dos mínimos quadrados Modelo de regressão simples ▫Uma amostra com n observações ▫Duas variáveis contínuas, X e Y ▫Queremos saber como os valores de Y mudam em média a medida que X assume valores diferentes ▫Existe uma função de regressão de Y (variável dependente) em X (variável independente)

O modelo de regressão linear simples supõe que E (Y  X =x)=  +  x, com distribuição normal e variância constante e as observações são não- correlacionadas, ou, Y i =E (Y i  X =x i ) +  i =  +  x i +  i Os estimadores  e 

O valor de  deve ser interpretado como o valor esperado da variável dependente Y quando a variável X for igual a zero. Na prática isso muitas vezes não faz sentido (ex. peso ao nascer). Por isso, substitui-se o conjunto de valores centrados na média;  é o acréscimo esperado quando X – X=0  é o acréscimo esperado na variável dependente Y quando o valor da variável independente X é acrescido de uma unidade; pode ser diminuição  e  são os coeficientes de regressão

Método dos mínimos quadrados ▫É um critério de estimação de ,  e  2 que consiste em minimizar a soma dos quadrados dos erros ▫A estimação dá origem a ,  e s 2 (erro quadratico médio) ▫Y i =  +  x i ▫A reta de regressão é definida na expressão acima e passa entre os n pontos do diagrama de dispersão e minimiza a soma dos quadrados das distâncias dos pontos a reta de mínimos quadrados

O estimador dos minimos quadrados é a razão entre a soma dos quadrados dos resíduos e o respectivo número de graus de liberdade A partir da reta de regressão pode-se obter as previsões e os erros de previsão (residuos) O teste de hipótese mais importante é o que estabelece a significância de , que é a inclinação da reta de regressão (Ho:  =0; H1:  0)

Diagnóstico do modelo de regressão ▫Fundamental! ▫Exame gráfico dos resíduos- não deve mostrar padrão definido

Resíduos x previsões

Na regressão linear múltipla são introduzidas n variáveis explicativas O estimador dos mínimos quadrados neste caso é obtido em notação matricial Ho:  i =0 Ha:  i  0 A estatística do teste é a razão t ou de Wald A ANOVA desempenha papel importante nos modelos lineares A soma dos quadrados das respostas (pela média-SQT) é igual a soma dos quadrados dos resíduos (SQE) mais a soma dos quadrados das previsões (do modelo-SQR) Para cada um dos parâmetros do modelo

Quanto menor SQE, melhor o modelo R 2 =SQR quanto maior, melhor SQT R 2 ajustado: quanto maior o numero de variaveis explicativas, maior será o R 2. Por isso, o consideramos quando há muitos parâmetros R 2 ajustado= 1 – (1 - R 2 ) n-1 n-p

Yi=  0 +  1 x 1 +  2 x  i Faça sempre a regressão linear simples isolada de cada variável e depois rode o conjunto. Muitas variáveis significativas isoladamente, deixam de ser em conjunto (isso ocorre quando há multicolinearidade-as (variáveis possuem relações lineares). A matriz de correlação de Pearson pode sugerir associações prévias.

Seleção do melhor modelo ▫Pela análise dos resíduos (graficos var x resíduos studentizados e Q-Q plot ou gráfico de probabilidade normal) ▫Pela parcimônia (o menor número de parâmetros com maior poder de explicação) ▫Pelo R 2 ajustado (quanto maior, melhor)

Procedimentos em modelos de regressão ▫Stepwise forward-o modelo começa a ser construído pela variável mais significativa e daí por diante ▫Stepwise backward-o modelo é construído excluindo-se a variável independente de menor poder explicativo ▫O procedimento se encerra quando todas as variaveis incluidas são significativas de acordo com o  estabelecido