A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Regressão Logística e Aplicações em Software Estatísticos Orientando : Alexandro Vieira Lopes Orientadora : Profª. Drª.Vilma Mayumi Tachibana Co-Orientador.

Apresentações semelhantes


Apresentação em tema: "Regressão Logística e Aplicações em Software Estatísticos Orientando : Alexandro Vieira Lopes Orientadora : Profª. Drª.Vilma Mayumi Tachibana Co-Orientador."— Transcrição da apresentação:

1 Regressão Logística e Aplicações em Software Estatísticos Orientando : Alexandro Vieira Lopes Orientadora : Profª. Drª.Vilma Mayumi Tachibana Co-Orientador : Prof. Dr. Fernando Antônio Moala 1/ 29

2 INTRODUÇÃO 2/ 29 Modelagem Regressão Logística Simples Regressão Logística Múltipla Seleção de Variáveis STEPWISE Avaliação do ajuste do modelo Noções sobre Regressão Logística Multinomial

3 MODELAGEM 3/ 29 OBJETIVO : Refletir sobre uma porção da realidade, na tentativa de explicá-la, de entendê-la. O processo é selecionar no sistema, argumentos ou parâmetros considerados essenciais e formalizá-los : o modelo. (representação do sistema). Quanto mais complexo for o modelo, mais difícil será mostrar sua validade, isto é, que ele descreve a realidade.

4 MODELAGEM 4/ 29 Etapas da Modelagem 1 Experimentação : obtenção os dados. 2 Abstração : procedimento formulação dos modelos matemáticos, procura-se estabelecer: -Seleção de variáveis: variáveis de estado que descrevem a evolução do sistema variáveis de controle que agem sobre o sistema. -Formulação de hipóteses: observação dos fatos, comparação com outros estudos, dedução lógica,etc.

5 MODELAGEM 5/ 29 3 Resolução : A Formulação as vezes só pode ser viabilizada através de métodos computacionais, dando uma solução numérica aproximada. 4 Validação : é o processo de aceitação ou não do modelo proposto. Teste dos dados empíricos, comparando suas soluções e previsões com os valores obtidos no sistema real.

6 MODELAGEM 5 Modificação : alguns fatores ligados ao problema original podem provocar a rejeição ou aceitação dos modelos. Alguma hipótese : falsa ou não suficientemente próxima da verdade, ou seja, os pressupostos de partida são incorretos; Alguns dados ou informações podem ter sido obtidos de maneira incorreta; Existem outras variáveis envolvidas na situação real que não foram utilizadas. 6/ 29

7 MODELAGEM Escolha de temas Buscar informações relacionadas com o assunto. Uma das formas é a coleta de dados qualitativos ou numéricos que pode ser executada de várias formas: Entrevistas & pesquisas executadas com métodos de amostragem aleatória. Pesquisa bibliográfica, utilizando dados já obtidos e catalogados em livros e revistas especializadas. 7/ 29

8 MODELAGEM A natureza dos dados orienta a formulação matemática dos modelos. A relação funcional entre duas variáveis é expressa por uma fórmula matemática: y = f (x) x variável independente y variável dependente 8/ 29

9 REGRESSÃO LOGÍSTICA SIMPLES 9/ 29 P(Y = 1) relacionada com X 1, X 2,..., X p. p assume valores no intervalo ]0,1[, não é possível admitir uma relação linear da forma p( x ) = x p x p, Contornar este problema transformação g, g(p( x )) pertença ao intervalo ]-, + [ modelada pela função linear x p x p. Contexto de modelos lineares generalizados, a função g é denominada função de ligação.

10 REGRESSÃO LOGÍSTICA SIMPLES 10/29, g(x i ) = x i Função de Ligação

11 REGRESSÃO LOGÍSTICA SIMPLES 11/29 Transformação Logito g(x i ) = x i Logito x varia de - a +, g(x i ) apresenta a mesma variação.

12 REGRESSÃO LOGÍSTICA SIMPLES 12/ 29 Estimar 0 e 1 por Método da Máxima Verossimilhança f (x i ) f (x i ) é a função que expressa a probabilidade dos dados observados como uma função de parâmetros desconhecidos, seus estimadores maximizam esta função e se aproximam mais dos dados observados. L( ) = Função de Verossimilhança ln L( ) = [ y i ln(x i )+ (1-y i )ln(1-(x i )) ]

13 REGRESSÃO LOGÍSTICA SIMPLES 13/ 29 Não é possível igualar as expressões das derivadas parciais a zero para obter os estimadores, pois estas expressões em Regressão Logística não são lineares em 0 e 1 e assim requerem métodos especiais para suas soluções. Estes métodos são de natureza iterativa e têm sido programados em software disponíveis de Regressão Logística. Equações de Verossimilhança &

14 REGRESSÃO LOGÍSTICA MÚLTIPLA 14/ 29 Logito Regressão Logística Múltipla : g( x ) = x x p x p Modelo da Regressão Logística : Regressão Logística Simples uma variável independente Regressão Logística Múltipla diferentes escalas e várias variáveis independentes. Probabilidade Sucesso : P ( Y = 1| x ) = ( x ) em que x = (x 1, x 2,..., x p )

15 SELEÇÃO DE VARIÁVEIS STEPWISE 15/ 29 Etapa (0) : Supondo p variáveis independentes: ajuste do modelo apenas com o intercepto e seja L 0 o log da verossimilhança. ajuste de cada um dos p possíveis modelos univariados de regressão logística e os log de verossimilhança são comparados. As variáveis mais importantes são aquelas com menor p- valor. Usa-se p-valor de entrada = 0,25.

16 SELEÇÃO DE VARIÁVEIS STEPWISE 16/ 29 Etapa (0) : Exemplo Hipotético y x 1 x 2 x 3 x 4 Modelo com Intercepto: y = 0 y = x 1 y = x 2 y = x 3 y = x 4 menor p valor

17 SELEÇÃO DE VARIÁVEIS STEPWISE 17/ 29 Etapa (1) : Ajuste do modelo de Regressão Logística contendo X 3. log da verossimilhança deste modelo. y = x x 1 y = x x 2 y = x x 4 Comparação do log verossimilhança Razão de Verossimilhanças (G) p-valor < p ENTRADA menor p valor

18 SELEÇÃO DE VARIÁVEIS STEPWISE 18/ 29 Etapa (2) : devido a entrada de X 2, a variável X 3, não seja mais importante. Seleção Backward. Para decidir se X 3 deve ser removido comparação com um segundo nível alfa p REMOÇÃO escolhido anteriormente. Comparação de log de verossimilhanças p-valor > p REMOÇÃO. p R > p E para que o algoritmo não introduza e remova a mesma variável nas etapas sucessivas. Na fase de Seleção Forward, cada um dos p – 2 modelos de Regressão Logística são ajustados.

19 SELEÇÃO DE VARIÁVEIS STEPWISE 19/ 29 Etapa (3) : O algoritmo representa uma verificação na eliminação backward seguida por uma seleção forward continuando desta maneira até última etapa (S). Etapa (S) : A etapa (S) ocorre se: todas as p variáveis que entraram no modelo OU todas as variáveis no modelo que têm p-valores para sair menores que p R, e as variáveis não incluídas no modelo têm p-valores para entrar maiores que p E. y = x x 3

20 VERIFICAÇÃO DO AJUSTE: TABELA DE CLASSIFICAÇÃO 20/ 29 Resume os resultados do ajuste do modelo de Regressão Logística. Classificação cruzada da variável resposta y com os valores dicotômicos derivados da probabilidade estimada logística. Ponto de corte c comparado com a probabilidade estimada de c. Se a probabilidade exceder c, então a variável derivada é igual a 1, senão é igual a 0. O valor comum para c = 0,5.

21 VERIFICAÇÃO DO AJUSTE: TABELA DE CLASSIFICAÇÃO 21/ 29 A razão geral da Classificação correta é estimada como: 100 [( ) /575]% = 75,3 % de acerto do modelo. SENSITIVIDADEESPECIFICIDADE

22 VERIFICAÇÃO DO AJUSTE DO MODELO: 22/ 29 Teste de Homer-Lemeshow Área abaixo da Curva ROC (curva Característica do Recebimento de Operação ou Receiver Operating Characteristic). Estatística R 2 Estatística Pearson Qui-Quadrado e Deviance

23 REGRESSÃO LOGÍSTICA MULTINOMIAL 23/ 29 Variável resposta qualquer número de níveis. Exemplo : Estudo da escolha de um plano de saúde. A variável resposta indica o tipo de plano: A, B ou C com as covariáveis: idade, tamanho da família, renda, etc. A Regressão Logística Multinomial também pode ser chamada Regressão Logística Politômica.

24 REGRESSÃO LOGÍSTICA MULTINOMIAL 24/ 29 Exemplo : 3 categorias da variável resposta Modelo necessita de 2 funções logito. Comparação de Categorias: Y = 0 como referência e comparar com Y =1 e Y = 2.

25 RELATÓRIO FINAL 25/ 29 Comparação entre Software Estatísticos Diagnóstico em Regressão Logística Regressão Logística Ordinal

26 REFERÊNCIAS 26/ 29 BASSANEZI, R. C. Ensino-aprendizagem com modelagem matemática. São Paulo: Contexto, p. BUSSAB, W. de O.; MORETIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, p. COLLETT, D. Modelling binary data. London: Chapman & Hall, p. FARHAT, C. A. V. Análise de diagnóstico em regressão logística f. Dissertação (Mestrado em Estatística) – Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo.

27 REFERÊNCIAS 27/ 29 HOSMER, D. W.; LEMESHOW, S. Applied logistic regression. 2nd ed. New York: Wiley, p. ISHIKAWA, N. I. Uso de transformações em modelos de regressão logística f. Dissertação (Mestrado em Ciências) – Instituto de Matemática e Estatística, Universidade de São Paulo, São Paulo. KUBRUSLY, R. S. O tamanho do infinito. Projeto novas tecnologias de ensino. Rio de Janeiro, Disponível em:. Acesso em: 1 jan SOUZA, E. C. Análise de influência local no modelo de regressão logística f. Dissertação (Mestrado em Agronomia) – Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba. Disponível em:. Acesso em: 19 mar

28 BIBLIOGRAFIA 28/ 29 BUSSAB, W. de O. Análise de variância e de regressão. São Paulo: Atual, p. HAIR Jr, J. F. et al. Análise multivariada de dados. Tradução de Adonai Schlup Santana, Anselmo Chaves Neto. Bookman, p. MOOD, A. M.; GRAYBILL, A. F.; BOES, C. D. Introduction to the theory of statistics. 3rd ed. New York: McGraw-Hill, p. SOUZA, A. D. P. Métodos aproximados em modelos hierárquicos dinâmicos bayesianos f. Tese (Doutorado em Ciências em Engenharia de Produção) – COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro. TACHIBANA, V. M. Métodos aproximados em modelos bayesianos de resposta aleatorizada e regressão logística f. Tese (Doutorado em Ciências em Engenharia de Produção) – COPPE, Universidade Federal do Rio de Janeiro, Rio de Janeiro.

29 Alexandro Vieira Lopes PRESIDENTE PRUDENTE º ANO ESTATÍSTICA Contato: Regressão Logística e Aplicações em Software Estatísticos 29/ 29


Carregar ppt "Regressão Logística e Aplicações em Software Estatísticos Orientando : Alexandro Vieira Lopes Orientadora : Profª. Drª.Vilma Mayumi Tachibana Co-Orientador."

Apresentações semelhantes


Anúncios Google