Carregar apresentação
A apresentação está carregando. Por favor, espere
1
Laís Araújo Lopes de Souza
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Curso de Estatística Laís Araújo Lopes de Souza Samantha Faasen Vagner Júnio Ferreira Prof.: Glaura Franco Belo Horizonte, 11 de junho de 2012.
2
Roteiro Regressão Múltipla Resíduos Resíduos Estudentizados
Ajuste do Modelo Exemplo Bootstrap nos resíduos Algoritmo Bootstrap resíduos ANOVA Gráficos Coeficientes Exercício Bibliografia
3
Regressão Múltipla Técnicas estatísticas para construir modelos que descrevem de maneira razoável relações entre várias variáveis explicativas de um determinado processo. Alguns objetivos: Descrever a relação entre variáveis para entender um processo ou fenômeno Prever o valor de uma variável a partir do conhecimento de outras variáveis Substituir a medição de uma variável pelo conhecimento de outras variáveis Controlar os valores de uma variável em uma faixa de interesse
4
Regressão Múltipla Modelo valores das variáveis explicativas, isto é,
constantes desconhecidas são parâmetros ou coeficientes da regressão erro aleatório do modelo, com média zero e variância
5
Suposições do Modelo Suposições: i) O erro tem média zero e variância desconhecida ii) Os erros são não correlacionados iii) Os erros têm distribuição normal iv) As variáveis regressoras assumem valores fixos
6
Significado dos coeficientes de regressão
O parâmetro 0 é o intercepto do plano de regressão O parâmetro 1 indica a mudança na resposta média E(Y) por unidade de acréscimo em X1 quando X2 é mantido constante. Da mesma forma 2 indica a mudança na resposta média por unidade de aumento em X2 quando X1 é mantido constante e assim sucessivamente
7
Modelo de regressão linear múltipla em termos matriciais
A expressão do modelo linear geral de regressão é dada por: Em termos matriciais, precisamos definir:
8
Em termos matriciais, o modelo de regressão linear geral é dado por:
é um vetor de variáveis aleatórias independentes e normalmente distribuídas com esperança (média), E()=0 e matriz de variância-covariância dada por: =2I Assim, o vetor das observações Y tem esperança e variância dadas por:
9
Resíduos Diagnóstico para a variável resposta é realizado através de uma análise de resíduos. Os resíduos são definidos como: Os resíduos podem ser considerados como erros observados, para distingui-los do erro verdadeiro desconhecido i no modelo de regressão:
10
Resíduos Para o modelo de regressão, temos a seguinte pressuposição:
Se o modelo é adequado, os resíduos devem refletir essas propriedades
11
Propriedades dos resíduos
Média Variância Se o modelo está adequado, o QME é um estimador não tendencioso da variância do erro
12
Propriedades dos resíduos
Os resíduos não são variáveis aleatórias independentes pois eles envolvem os valores os quais são baseados na mesma equação de regressão Quando o tamanho da amostra é grande, o efeito de dependência entre os resíduos é relativamente sem importância e pode ser ignorado.
13
Resíduos Estudentizados
Vantagens Os resíduos estudentizados tem variâncias constantes e iguais a 1, o que consequentemente torna muito prática a procura por outliers Apropriado para verificar normalidade dos erros e homogeneidade Desvantagem Dificuldade de detectar violações do modelo, uma vez que esses resíduos são menores
14
Ajuste do Modelo Análise Gráfica dos Resíduos
1. Gráfico dos resíduos versus variáveis preditoras 2. Gráfico dos resíduos absolutos ou quadráticos versus variáveis preditoras 3. Gráficos dos resíduos versus valores ajustados (estimados) 4. Gráfico normal de probabilidades dos resíduos. Testes Estatísticos
15
Exemplo Dados referentes à doença de Chagas
Variável resposta - Prazo para chegar ao hospital Variáveis explicativas – Tempo e Distância Modelo:
16
Bootstrap nos resíduos
1- Ajustar o modelo e reter os valores ajustados e os resíduos , i=1,...,n. 2- Para cada par na qual x é a variável explicativa (possivelmente multivariada)adicionar um resíduo reamostrado residual, para a variável resposta aleatoriamente .Em outras palavras, criar variáveis respostas sintéticas , para a variável resposta, , onde j é selecionado aleatoriamente a partir da lista para cada i. 3- Volte a colocar o modelo usando as variáveis de resposta fictícios e manter as quantidades de interesse (muitas vezes os parâmetros estimada a partir dos sintéticos ). 4- Repetir os passos 2 e 3 um número estatisticamente significativo de vezes.
17
Algoritmo Bootstrap resíduos
18
ANOVA
19
Diagrama de Dispersão
20
Gráfico resíduos versus valores ajustados
Homocedasticidade isto é, constante
21
Gráfico resíduos Estudentizados versus valores ajustados
Homocedasticidade
22
Gráfico resíduos versus Casos
Independência
23
Gráfico resíduos Estudentizados versus Casos
Independência
24
Gráfico resíduos versus Distância
Independência
25
Gráfico resíduos Estudentizados versus Distância
Independência
26
Gráfico de Probabilidade Normal dos resíduos
Resíduos Normais
27
Gráfico de Probabilidade Normal dos resíduos Estudentizados
Resíduos não Normais
28
Teste de Normalidade Resíduos
29
Teste de Normalidade resíduos Estudentizados
30
Coeficientes
31
Exercício Realize o Bootstrap conforme o procedimento descrito anteriormente e calcule o vício dos parâmetros.
32
Bibliografia Chernick, M. R., Labudde, R. A., An Introduction to Bootstrap Methods with Applications to R. John Willey and Sons Efron B, Tibshirani R An Introduction to the bootstrap. New York: Chapman and Hall
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.