A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Laís Araújo Lopes de Souza

Apresentações semelhantes


Apresentação em tema: "Laís Araújo Lopes de Souza"— Transcrição da apresentação:

1 Laís Araújo Lopes de Souza
Universidade Federal de Minas Gerais Instituto de Ciências Exatas Curso de Estatística Laís Araújo Lopes de Souza Samantha Faasen Vagner Júnio Ferreira Prof.: Glaura Franco Belo Horizonte, 11 de junho de 2012.

2 Roteiro Regressão Múltipla Resíduos Resíduos Estudentizados
Ajuste do Modelo Exemplo Bootstrap nos resíduos Algoritmo Bootstrap resíduos ANOVA Gráficos Coeficientes Exercício Bibliografia

3 Regressão Múltipla  Técnicas estatísticas para construir modelos que descrevem de maneira razoável relações entre várias variáveis explicativas de um determinado processo. Alguns objetivos: Descrever a relação entre variáveis para entender um processo ou fenômeno Prever o valor de uma variável a partir do conhecimento de outras variáveis Substituir a medição de uma variável pelo conhecimento de outras variáveis Controlar os valores de uma variável em uma faixa de interesse

4 Regressão Múltipla Modelo valores das variáveis explicativas, isto é,
constantes desconhecidas são parâmetros ou coeficientes da regressão erro aleatório do modelo, com média zero e variância

5 Suposições do Modelo Suposições: i) O erro tem média zero e variância desconhecida ii) Os erros são não correlacionados iii) Os erros têm distribuição normal iv) As variáveis regressoras assumem valores fixos

6 Significado dos coeficientes de regressão
O parâmetro 0 é o intercepto do plano de regressão O parâmetro 1 indica a mudança na resposta média E(Y) por unidade de acréscimo em X1 quando X2 é mantido constante. Da mesma forma 2 indica a mudança na resposta média por unidade de aumento em X2 quando X1 é mantido constante e assim sucessivamente

7 Modelo de regressão linear múltipla em termos matriciais
A expressão do modelo linear geral de regressão é dada por: Em termos matriciais, precisamos definir:

8 Em termos matriciais, o modelo de regressão linear geral é dado por:
é um vetor de variáveis aleatórias independentes e normalmente distribuídas com esperança (média), E()=0 e matriz de variância-covariância dada por: =2I Assim, o vetor das observações Y tem esperança e variância dadas por:

9 Resíduos Diagnóstico para a variável resposta é realizado através de uma análise de resíduos. Os resíduos são definidos como: Os resíduos podem ser considerados como erros observados, para distingui-los do erro verdadeiro desconhecido i no modelo de regressão:

10 Resíduos Para o modelo de regressão, temos a seguinte pressuposição:
Se o modelo é adequado, os resíduos devem refletir essas propriedades

11 Propriedades dos resíduos
Média  Variância  Se o modelo está adequado, o QME é um estimador não tendencioso da variância do erro

12 Propriedades dos resíduos
Os resíduos não são variáveis aleatórias independentes pois eles envolvem os valores os quais são baseados na mesma equação de regressão Quando o tamanho da amostra é grande, o efeito de dependência entre os resíduos é relativamente sem importância e pode ser ignorado.

13 Resíduos Estudentizados
Vantagens Os resíduos estudentizados tem variâncias constantes e iguais a 1, o que consequentemente torna muito prática a procura por outliers Apropriado para verificar normalidade dos erros e homogeneidade Desvantagem Dificuldade de detectar violações do modelo, uma vez que esses resíduos são menores

14 Ajuste do Modelo Análise Gráfica dos Resíduos
1. Gráfico dos resíduos versus variáveis preditoras 2. Gráfico dos resíduos absolutos ou quadráticos versus variáveis preditoras 3. Gráficos dos resíduos versus valores ajustados (estimados) 4. Gráfico normal de probabilidades dos resíduos. Testes Estatísticos

15 Exemplo Dados referentes à doença de Chagas
Variável resposta - Prazo para chegar ao hospital Variáveis explicativas – Tempo e Distância Modelo:

16 Bootstrap nos resíduos
1- Ajustar o modelo e reter os valores ajustados  e os resíduos , i=1,...,n. 2- Para cada par na qual x é a variável explicativa (possivelmente multivariada)adicionar um resíduo reamostrado residual, para a variável resposta aleatoriamente .Em outras palavras, criar variáveis respostas sintéticas , para a variável resposta, , onde j é selecionado aleatoriamente a partir da lista para cada i. 3- Volte a colocar o modelo usando as variáveis de resposta fictícios e manter as quantidades de interesse (muitas vezes os parâmetros estimada a partir dos sintéticos ). 4- Repetir os passos 2 e 3 um número estatisticamente significativo de vezes.

17 Algoritmo Bootstrap resíduos

18 ANOVA

19 Diagrama de Dispersão

20 Gráfico resíduos versus valores ajustados
Homocedasticidade isto é, constante

21 Gráfico resíduos Estudentizados versus valores ajustados
Homocedasticidade

22 Gráfico resíduos versus Casos
Independência

23 Gráfico resíduos Estudentizados versus Casos
Independência

24 Gráfico resíduos versus Distância
Independência

25 Gráfico resíduos Estudentizados versus Distância
Independência

26 Gráfico de Probabilidade Normal dos resíduos
Resíduos Normais

27 Gráfico de Probabilidade Normal dos resíduos Estudentizados
Resíduos não Normais

28 Teste de Normalidade Resíduos

29 Teste de Normalidade resíduos Estudentizados

30 Coeficientes

31 Exercício Realize o Bootstrap conforme o procedimento descrito anteriormente e calcule o vício dos parâmetros.

32 Bibliografia Chernick, M. R., Labudde, R. A., An Introduction to Bootstrap Methods with Applications to R. John Willey and Sons Efron B, Tibshirani R An Introduction to the bootstrap. New York: Chapman and Hall


Carregar ppt "Laís Araújo Lopes de Souza"

Apresentações semelhantes


Anúncios Google