A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Correlação e Regressão

Apresentações semelhantes


Apresentação em tema: "Correlação e Regressão"— Transcrição da apresentação:

1 Correlação e Regressão
Patometria I Correlação e Regressão Sétima Aula 2015

2 Testes de Hipóteses? Estabelecem se existe associação entre duas variáveis, mas... Não quantificam a força da associação; e Não permitem representar a relação existente sob uma forma funcional.

3 Associação &Variáveis Quantitativas
Exercício da aula prática: Banco de dados de um estudo no qual gestantes foram avaliadas quanto à deficiência de ácido fólico e vitamina B12 no início do pré-natal e no 7º mês de gestação. Um grupo controle de mulheres saudáveis foi constituído para servir de referência para as medidas das vitaminas mencionadas. Há resultados disponíveis para vários exames hematológicos. Utilizaremos este banco de dados para analisar se é possível estimar a concentração de hemoglobina e a contagem de leucócitos e de hemácias no sangue a partir da medida do hematócrito. Como verificar se essas variáveis estão associadas?

4 Associação &Variáveis Quantitativas
HB: Hemoglobina (g/dL) no início do pré-natal HT: Hematócrito (%) no início do pré-natal HEM: Contagem de Hemácias (milhões/mm3) no início do pré-natal LEUC: Contagem de Leucócitos (milhares/mm3) no início do pré-natal É possível fazer um gráfico das variáveis de interesse e analisar a existência de uma relação a partir da análise desse gráfico.

5 Associação &Variáveis Quantitativas
Diagrama de Dispersão Representação gráfica que permite a visualização do comportamento conjunto das duas variáveis. É gráfico sobre o qual cada medida individual é representada por um ponto, sendo que a posição de cada ponto é determinada pelos valores observados em um indivíduo, para as duas características medidas (por exemplo, hematócrito e hemoglobina). É denominado, também, de gráfico XY.

6 Diagrama de Dispersão Análise
Parece não haver uma relação entre o valor do hematócrito e o valor do leucócito.

7 Diagrama de Dispersão Análise
Há uma relação crescente entre o valor do hematócrito e o valor de hemoglobina. Esta relação parece ser linear.

8 Diagrama de Dispersão Análise
Há uma relação crescente entre o valor do hematócrito e a contagem de hemácias. Esta relação parece ser linear.

9 Diagramas de Dispersão
A análise não é alterada, se trocamos as variáveis X e Y, ou seja, a existência ou não da relação não depende de qual variável é considerada independente. O modelo matemático, porém, será alterado a depender de quem é X.

10 Associação &Variáveis Quantitativas
Coeficiente de correlação linear de Pearson Valor numérico que mede a intensidade da associação linear existente entre as duas variáveis, medida a partir de uma série de observações. Karl Pearson (1857 – 1936)

11 Coeficiente de Correlação Linear
Medindo a Força da Associação Onde: desvio-padrão de x x sx = desvio-padrão de y y sy =

12 Coeficiente de Correlação Linear
Interpretando o valor de r r assume valores entre – 1 e + 1. x  y  r  – correlação linear negativa forte; r  ausência de correlação linear; r  correlação linear positiva forte; x  y 

13 Coeficiente de Correlação Linear
Relação perfeita r  - 0,80 r = - 1 Relação perfeita

14 Coeficiente de Correlação Linear
Valor de r ( + ou - ) Interpretação Correlação bem fraca Correlação fraca Correlação moderada 0.70 – 0.89 Correlação forte 0.90 – 1.00 Correlação muito forte

15 Teste de Hipóteses sob o Coeficiente de Correlação Linear
Testamos as hipóteses: (bicaudal) A estatística do teste é dada por: e sob H0 , t tem distribuição t-Student com (n - 2) graus de liberdade.

16 Coeficiente de Correlação Linear Teste de Hipóteses
Exemplo 1: Vamos calcular o coeficiente de correlação de Pearson entre as variáveis hemoglobina e hematócrito (dados da aula prática de ácido fólico na gestação e anticorpos contra rubéola). n = 40 (gestantes) Para a=0,05: p < a Há correlação entre hematócrito e hemoglobina.

17 Coeficiente de Correlação Linear Teste de Hipóteses
Exemplo 2: Vamos calcular o coeficiente de correlação de Pearson entre as variáveis leucócito e hematócrito (dados da aula prática de ácido fólico na gestação e anticorpos contra rubéola). Para  = 0,05, temos: Não há correlação entre hematócrito e leucócito.

18 Associação &Variáveis
Quantitativas Modelos de Regressão Modelo matemático para a relação linear analisada. Permite a predição de uma variável em função de outra.

19 Qual a reta que melhor se ajusta a estes dados?
Modelos Lineares Situação 2: Uma vez verificada a existência de uma relação entre a quantidade de hemoglobina e o número de hematócritos, desejamos desenvolver um modelo para estimar a medida de hemoglobina (variável y) a partir da medida de hematócrito (variável x). Qual a reta que melhor se ajusta a estes dados?

20 Animações sobre ajuste de reta

21 Modelos Lineares Equação da Reta Intercepto y Inclinação da reta
parâmetros da reta Inclinação da reta

22 Regressão Linear Simples
Método dos Mínimos Quadrados O objetivo é minimizar a soma do quadrado dos erros: Obtendo os valores de e que minimizam a equação acima. erro

23 Regressão Linear Simples
Método dos Mínimos Quadrados Podemos utilizar a reta de regressão para estimar os valores de .

24 Reta de Regressão & Estimativa
Estimativa da Medida de Hemoglobina Análise O valor de homoglobina média estimada, para um valor observado de hematócrito igual a 40%, é de 13,95 g/dl.

25 Reta de Regressão & Estimativa
Estimativa da Medida de Hematócrito Suponha que desejemos considerar o hematócrito como variável dependente. Neste caso, podemos calcular outra reta de regressão, pelo método dos mínimos quadrados, considerando a hemoglobina como variável x (independente) e o hematócrito como variável y (dependente). O valor de hematócrito médio estimado, para um valor observado de hemoglobina Hb = 13,95 g/dl, é de 39,3%. Note que a reta, para Ht, não é a inversa da obtida para Hb.

26 Qualidade do Ajuste na Regressão
Coeficiente de Determinação R2 = proporção da variabilidade de y que é explicada pelo modelo (reta de regressão) Se R2 = 0,90 significa que 90% da variação em y pode ser explicada pela equação obtida.

27 Qualidade do Ajuste na Regressão Coeficiente de Determinação
Quando fazemos uma regressão linear, os valores observados (xi,yi) estão espalhados ao redor da reta de regressão. Quanto menor for este espalhamento, melhor a reta de regressão representa o conjunto de valores observados. A variância amostral total, como estimador do espalhamento, pode ser decomposta da seguinte forma: Valores observados Valor médio Valores estimados

28 Qualidade do Ajuste na Regressão Coeficiente de Determinação
SQT total SQE --- Erro SQR --- Regressão Onde r é o coeficiente de correlação de Pearson.

29 Qualidade do Ajuste na Regressão
Associação entre hematócrito e hemoglobina R2 = 0,747 Isto significa que 74,7% das variações nas medidas de hemoglobina podem ser explicadas pela variabilidade na proporção de hematócritos, dada pela reta de regressão. E 25,3% da variabilidade da amostra de hemoglobina podem ser explicados por fatores diferentes daqueles considerados no modelo de regressão linear.

30 Regressão Linear Pressupostos
A variância de y é igual para cada valor de x; Os valores de y são independentes; A variância dos erros é igual para cada valor de x; Os valores dos erros são independentes; A reta não pode ser estendida além dos pontos medidos; Modelo bem ajustado não garante previsibilidade; Sensível aos valores aberrantes (outliers).

31 Correlação & Regressão Cuidados
A análise de r deve vir acompanhada do diagrama de dispersão, pois a associação pode não ser linear. r = 0 r  0,90 Correlação não implica relação de Causa & Efeito.

32 Critérios de Causalidade
Causa & Efeito Critérios de Causalidade Existência de associação; Intensidade de associação (estatística); Consistência (reprodutibilidade); Especificidade (exemplo máximo: um fator produz um único efeito); Temporalidade (causa antecede o efeito); Gradiente biológico (relação dose-resposta); Plausibilidade (concordância com outros conhecimentos); Coerência (concordância com conhecimento específico); Evidência experimental; Evidências por analogia (efeitos similares)

33 Exemplo: dados

34 Exemplo: retas ajustadas

35 Exemplo: parâmetros ajustados
Referência: F.X. Diebold, Elements of Forecasting. Thomson, 2007.

36 Modelos Não-lineares Associações & Estimativas
Exemplo Hipotético: Estudo de relação dose-dependente entre o consumo de cigarros e o risco de desenvolver enfisema pulmonar. Modelo linear Modelo Exponencial

37 Associação & Variáveis Qualitativas Ordinais Charles Edward Spearman
Medida não paramétrica da associação de duas variáveis Pode ser calculado como o coeficiente de Pearson para postos Coeficiente de correlação de postos de Spearman (r) Charles Edward Spearman (1863 – 1945)

38 r = 1 r = 0,841 r = 1

39 Referências Regressão Linear: Leitura:
Draper NR, Smith H. Applied Regression Analysis. Wiley, 3.ed., 1998. Leitura: Salsburg D. Uma Senhora Toma Chá. Zahar, 2009.


Carregar ppt "Correlação e Regressão"

Apresentações semelhantes


Anúncios Google