A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Estatística para Cursos de Engenharia e Informática

Apresentações semelhantes


Apresentação em tema: "Estatística para Cursos de Engenharia e Informática"— Transcrição da apresentação:

1 Estatística para Cursos de Engenharia e Informática
Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004 Cap. 11 – Complemento: Regressão Múltipla APOIO: Fundação de Ciência e Tecnologia de Santa Catarina (FUNCITEC) Departamento de Informática e Estatística (INE/CTC/UFSC)

2 Regressão Múltipla Predizer valores de uma variável dependente (Y) em função de variáveis independentes (X1, X2, ..., Xk). Conhecer o quanto as variações de Xj (j = 1,...,k) podem afetar Y.

3 Regressão Múltipla (X1, X2, ..., Xk) Y
Aplicação na educação física: X1 = exercício aeróbico X2 = calorias ingeridas X3 = circunferência da cintura Y = perda de peso

4 Regressão Múltipla (X1, X2, ..., Xk) Y
Aplicação no Índice de Massa Corporal (IMC) : X1 = velocidade X2 = potência X3 = agilidade Y = IMC

5 Modelo de Regressão Múltipla
E(y) = f(X1, X2, ..., Xk) Linear: E(y) = 0 + 1X1 + 2X kXk onde Y, X1, ..., Xk podem representar as variáveis originais ou transformadas. Admite-se que Y, X1, ..., Xk são variáveis contínuas.

6 Modelo de Regressão Múltipla
E(y) = 0 + 1X1 + 2X kXk O coeficiente k representa a variação esperada de Y para cada unidade de variação em Xk (k = 1, 2, ..., k), considerando as outras variáveis independentes fixas.

7 Modelo de Regressão Múltipla
AMOSTRA: variáveis obs. Y X1 X2 ... Xk 1 y1 x11 x x1k 2 y2 x21 x x2k n yk xn1 xn2 ... xnk E(y) = 0 + 1X1 + 2X kXk yi = 0 + 1xi1 + 2xi kxik + ei termo aleatório (erro)

8 Modelo de Regressão Múltipla Suposições
yi = 0 + 1xi1 + 2xi kxik + ei termo aleatório (erro) Os erros (ei) são independentes e variam aleatoriamente segundo uma distribuição (normal) com média zero e variância constante.

9 Regressão Múltipla Equação de regressão ajustada aos dados:
Valores preditos: Resíduos:

10 Medida do Ajuste Coeficiente de determinação (R2) explicada 0  R2  1
Variação total explicada 0  R2  1

11 Regressão Múltipla: teste sobre o modelo
ANOVA: através da Análise de variância, testa-se a hipótese H0 dada a seguir E(y) = 0 + 1X1 + 2X kXk H0: 1 = 2 = ... = k = 0

12 Regressão Múltipla: teste sobre um particular coeficiente
E(y) = 0 + 1X1 + 2X kXk H0: j = 0 sendo se o erro padrão da estimativa bj Sob H0 e considerando as suposições do modelo, t tem distrib. t de student

13 Ex. de regressão múltipla
A academia de ginástica “Boa Forma” decidiu ilustrar uma abordagem teórica de como os exercícios aeróbicos e a ingestão de calorias podem afetar o peso. Doze dos membros estabelecidos na academia registraram cuidadosamente o número de minutos de exercícios aeróbicos que praticaram no decorrer de uma semana, juntamente com sua ingestão calórica semanal.

14 Academia BOA FORMA (perda_peso.sav)
Ex. aeróbico Cal. Ingerida(x1000) Perda de peso (X1) (X2) (Y) , ,27 , ,26 , ,63 , ,63 , ,17 , ,71 , ,49 , ,13 , ,17 , ,90 , ,49 , ,50

15 Regressão múltipla: com variáveis independentes qualitativas
Ex. (Qualitativa.sav) Variável dependente: IMC; Variáveis independentes: TR (dobra cutânea triciptal); SOMA_DC (soma da dobra cutânea); SEXO (0 = feminino, 1= masculino) As variáveis qualitativas devem entrar no modelo na forma de variáveis indicadoras (0 - 1)

16 Regressão múltipla: com variáveis independentes qualitativas
E(y) = 0 + 1Sexo + 2TR + 3Soma_dc O coeficiente de uma variável indicadora indica a variação esperada em Y quando a variável indicadora muda de 0 para 1, mantendo-se as demais variáveis constantes. Ex: 1 é o incremento esperado no IMC pelo indivíduo ser do sexo masculino.

17 Seleção de variáveis: Ex. (seleção.sav) Backward Forward Stepwise
Variável dependente: IMC Backward Forward Stepwise

18 MÉTODO FORWARD (passo a frente)
Considera-se inicialmente um modelo de regressão linear simples, usando como variável auxiliar (X), aquela de maior valor da estatística t (ou menor valor de p) quando ajustada a variável dependente Y. As etapas se sucedem quando uma variável por vez pode vir a ser incorporada; Se em uma outra etapa não houver inclusão, o processo é interrompido e as variáveis selecionadas até esta etapa definem o modelo final.

19 PROCEDIMENTO Passo 1) ajustar todos os modelos com m variáveis (no modelo inicial m=1) e escolher a variável candidata com maior valor da estatística t para entrar no modelo, considerando que o valor de p ≤  (caso p> o modelo é interrompido); Passo 2) para cada variável não pertencente ao modelo do passo 1, ajustar um modelo de regressão considerando no modelo as variáveis que entraram no passo 1 e escolher a variável candidata que tiver o maior valor da estatística t, desde que p ≤  (caso p> o modelo é interrompido);

20 Passo 3) Fazer o processo sucessivamente, até que todas as variáveis que não estão no modelo apresentem um valor de t, tal que o valor p>.

21 MÉTODO BACKWARD (passo atrás)
Neste método incorporam-se inicialmente todas as variáveis em um modelo de regressão linear múltipla; Percorrem-se etapas, nas quais uma variável por vez pode vir a ser eliminada; Se em cada etapa não houver eliminação de alguma variável, o processo é interrompido e as variáveis restante definem o modelo final.

22 PROCEDIMENTO Passo 1) ajustar o modelo completo de k variáveis;
Passo 2) retirar do modelo completo a variável com menor valor da estatística t (ou maior valor de p). Caso todas as variáveis apresentem p ≤  o processo é interrompido e o modelo final é selecionado; Passo 3) ajustar o modelo com k-1 variáveis e voltar ao passo 2.

23 MÉTODO STEPWISE (passo a passo)
Consiste em uma generalização do procedimento Forward; Após cada etapa de incorporação de uma variável, temos uma etapa em que uma das variáveis já selecionadas pode ser descartada; O procedimento chega ao final quando nenhuma variável é incluída ou descartada.

24 PROCEDIMENTO Passo 1) ajustar todos os modelos com m variáveis (no modelo inicial m=1) e escolher a variável candidata com maior valor da estatística t para entrar no modelo, considerando que o valor de p ≤  (caso p> o modelo é interrompido); Passo 2) para cada variável não pertencente ao modelo do passo 1, ajustar um modelo de regressão considerando no modelo as variáveis que entraram no passo 1 e escolher a variável candidata que tiver o maior valor da estatística t, desde que p ≤  (caso p> o modelo é interrompido);

25 Passo 3) verificar se o valor da estatística t das variáveis que estão no modelo apresentam p≤. Caso uma ou mais variáveis que já estão no modelo apresente p> , retira-se a variável do modelo que possua o maior valor de p. Passo 4) ajustar o modelo no passo 3, tal que p≤ para todas as variáveis. Voltar o passo 2 e repetir todo o processo até que todas as variáveis que estão fora do modelo tenham p>.


Carregar ppt "Estatística para Cursos de Engenharia e Informática"

Apresentações semelhantes


Anúncios Google