Estatística para Cursos de Engenharia e Informática

Slides:

Advertisements

Apresentações semelhantes

Estatística para Cursos de Engenharia e Informática

Advertisements

6. Andando na Superfície de Resposta Técnica de otimização baseada em planejamentos fatoriais Etapas distintas: Modelagem e deslocamento Modelagem: ajuste.

Parâmetros do paciente e cálculos de dosagem Profa. Dra. Patricia Moriel.

Correlação e Regressão

Correlação entre Variáveis Correlação entre Variáveis Regressão Linear e Não Linear.

Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE5801 – Regressão e Covariância Taciana Villela Savian Sala 304, pav. Engenharia,

O Processo de Poisson Série: Processos Estocásticos Disciplina: Métodos Matemáticos 1C Dennis S. Poisson, Sceaux, France.

Análise estatística de dados da PNAD: incorporando a estrutura do plano amostral Pedro Luís do Nascimento Silva, Djalma Galvão Carneiro Pessoa e Maurício.

Professores: Cristiano Cassoli Lucilene Sebastião

Revisão Medidas de Dispersão

Teoremas de rede Prof. Luis S. B. Marques MINISTÉRIO DA EDUCAÇÃO

Prof. Leonardo Bianco de Carvalho FCAV/UNESP – Câmpus de Jaboticabal

Confiabilidade Estrutural

TÉCNICAS DE AMOSTRAGEM AMOSTRAGENS NÃO PROBABILÍSTICAS

ESTATÍSTICA AULA 15 Testes de hipóteses – Unidade 10

Bioestatística e Epidemiologia Aula 3: Medidas de Tendência Central

ESTATÍSTICA AULA 11 Modelos probabilísticos mais comuns – Unidade 7

Probabilidade e Estatística Aplicadas à Contabilidade II

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO

Análise Discriminante

Módulo VII – O Sistema de Informações de Marketing (S.I.M)

Estatística Bivariada

ESTATÍSTICA . SÍNTESE DO 10.º ANO . RELAÇÕES BIDIMENSIONAIS (11.º ANO)

Estatística Descritiva (I)

Seleção de Atributos.

Estimação de Parâmetros – Unidade 9 Professor Marcelo Menezes Reis

Regressão com uma variável dependente Binária

Probabilidade e Estatística Aplicadas à Contabilidade I

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2017 Intervalo de Confiança Camilo Daleles Rennó

Algoritmos e Estruturas de Dados I

ESTATÍSTICA AULA 12 Inferência Estatística e Distribuição Amostral – Unidade 8 Professor Marcelo Menezes Reis.

Padronização.

CURSO DE ENGENHARIA ELÉTRICA

Algumas Distribuições de Probabilidade e Estatística de Contagem

Estimação de Máxima Verossimilhança

Regressão Linear Múltipla

PROBABILIDADES.

Prof. Eduardo Bezerra (CEFET/RJ)

Introdução – Análise de Variâncias (ANOVA)

Análise de Regressão Ajuste de Parâmetros.

Análise de regressão múltipla

Tutorial para a escolha do Teste Estatístico

Estatística Descritiva

INTRODUÇÃO AO R E ESTATÍSTICA BÁSICA:

O QUE É CONTROLE DE QUALIDADE ?

DISTRIBUIÇÕES AMOSTRAIS

7 Resultados de Medições Indiretas

Semana 3 – Análise global dos dados

Análise Discriminante

Profa. Dra. Andreia Adami

Enfoque sistêmico na agricultura Fundamentos Estatísticos

A) Introdução. Noções Fundamentais.

Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.

A) Introdução. Noções Fundamentais

Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.

Controlando por covariadas

Prof. Artur Parte III: Análise dos dados de entrada e resultados

Variância e Desvio padrão

Mestrado Profissional em Física Médica

Algumas Distribuições de Probabilidade e Estatística de Contagem

INTEGRAÇÃO POR SUBSTITUIÇÃO

Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.

Aplicação do Modelo de Regressão no Processo de Produção de Gasolina

Prof. Antonio Lopo Martinez

Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2018 Intervalo de Confiança Camilo Daleles Rennó

Aula 13 Goodies* * Goodies related to animals, plants and numbers…

Metodologia da Pesquisa em Ensino de Ciências I

Probabilidade e Estatística Aplicadas à Contabilidade II

Metodologia da Pesquisa em Ensino de Ciências I

Análise e apresentação dos dados

Transcrição da apresentação:

Estatística para Cursos de Engenharia e Informática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004 Cap. 11 – Complemento: Regressão Múltipla APOIO: Fundação de Ciência e Tecnologia de Santa Catarina (FUNCITEC) Departamento de Informática e Estatística (INE/CTC/UFSC)

Regressão Múltipla Predizer valores de uma variável dependente (Y) em função de variáveis independentes (X1, X2, ..., Xk). Conhecer o quanto as variações de Xj (j = 1,...,k) podem afetar Y.

Regressão Múltipla (X1, X2, ..., Xk) Y Aplicação na educação física: X1 = exercício aeróbico X2 = calorias ingeridas X3 = circunferência da cintura Y = perda de peso

Regressão Múltipla (X1, X2, ..., Xk) Y Aplicação no Índice de Massa Corporal (IMC) : X1 = velocidade X2 = potência X3 = agilidade Y = IMC

Modelo de Regressão Múltipla E(y) = f(X1, X2, ..., Xk) Linear: E(y) = 0 + 1X1 + 2X2 + ... + kXk onde Y, X1, ..., Xk podem representar as variáveis originais ou transformadas. Admite-se que Y, X1, ..., Xk são variáveis contínuas.

Modelo de Regressão Múltipla E(y) = 0 + 1X1 + 2X2 + ... + kXk O coeficiente k representa a variação esperada de Y para cada unidade de variação em Xk (k = 1, 2, ..., k), considerando as outras variáveis independentes fixas.

Modelo de Regressão Múltipla AMOSTRA: variáveis obs. Y X1 X2 ... Xk 1 y1 x11 x12 ... x1k 2 y2 x21 x22 ... x2k ... ... ... ... ... ... n yk xn1 xn2 ... xnk E(y) = 0 + 1X1 + 2X2 + ... + kXk yi = 0 + 1xi1 + 2xi2 + ... + kxik + ei termo aleatório (erro)

Modelo de Regressão Múltipla Suposições yi = 0 + 1xi1 + 2xi2 + ... + kxik + ei termo aleatório (erro) Os erros (ei) são independentes e variam aleatoriamente segundo uma distribuição (normal) com média zero e variância constante.

Regressão Múltipla Equação de regressão ajustada aos dados: Valores preditos: Resíduos:

Medida do Ajuste Coeficiente de determinação (R2) explicada 0  R2  1 Variação total explicada 0  R2  1

Regressão Múltipla: teste sobre o modelo ANOVA: através da Análise de variância, testa-se a hipótese H0 dada a seguir E(y) = 0 + 1X1 + 2X2 + ... + kXk H0: 1 = 2 = ... = k = 0

Regressão Múltipla: teste sobre um particular coeficiente E(y) = 0 + 1X1 + 2X2 + ... + kXk H0: j = 0 sendo se o erro padrão da estimativa bj Sob H0 e considerando as suposições do modelo, t tem distrib. t de student

Ex. de regressão múltipla A academia de ginástica “Boa Forma” decidiu ilustrar uma abordagem teórica de como os exercícios aeróbicos e a ingestão de calorias podem afetar o peso. Doze dos membros estabelecidos na academia registraram cuidadosamente o número de minutos de exercícios aeróbicos que praticaram no decorrer de uma semana, juntamente com sua ingestão calórica semanal.

Academia BOA FORMA (perda_peso.sav) Ex. aeróbico Cal. Ingerida(x1000) Perda de peso (X1) (X2) (Y) 1 112 11,216 0,27 2 190 7,552 1,26 3 171 10,101 0,63 4 148 9,560 0,63 5 193 8,338 1,17 6 235 7,252 1,71 7 237 7,631 1,49 8 176 8,097 1,13 9 185 8,300 1,17 10 186 8,121 0,90 11 228 7,212 1,49 12 100 10,202 0,50

Regressão múltipla: com variáveis independentes qualitativas Ex. (Qualitativa.sav) Variável dependente: IMC; Variáveis independentes: TR (dobra cutânea triciptal); SOMA_DC (soma da dobra cutânea); SEXO (0 = feminino, 1= masculino) As variáveis qualitativas devem entrar no modelo na forma de variáveis indicadoras (0 - 1)

Regressão múltipla: com variáveis independentes qualitativas E(y) = 0 + 1Sexo + 2TR + 3Soma_dc O coeficiente de uma variável indicadora indica a variação esperada em Y quando a variável indicadora muda de 0 para 1, mantendo-se as demais variáveis constantes. Ex: 1 é o incremento esperado no IMC pelo indivíduo ser do sexo masculino.

Seleção de variáveis: Ex. (seleção.sav) Backward Forward Stepwise Variável dependente: IMC Backward Forward Stepwise

MÉTODO FORWARD (passo a frente) Considera-se inicialmente um modelo de regressão linear simples, usando como variável auxiliar (X), aquela de maior valor da estatística t (ou menor valor de p) quando ajustada a variável dependente Y. As etapas se sucedem quando uma variável por vez pode vir a ser incorporada; Se em uma outra etapa não houver inclusão, o processo é interrompido e as variáveis selecionadas até esta etapa definem o modelo final.

PROCEDIMENTO Passo 1) ajustar todos os modelos com m variáveis (no modelo inicial m=1) e escolher a variável candidata com maior valor da estatística t para entrar no modelo, considerando que o valor de p ≤  (caso p> o modelo é interrompido); Passo 2) para cada variável não pertencente ao modelo do passo 1, ajustar um modelo de regressão considerando no modelo as variáveis que entraram no passo 1 e escolher a variável candidata que tiver o maior valor da estatística t, desde que p ≤  (caso p> o modelo é interrompido);

Passo 3) Fazer o processo sucessivamente, até que todas as variáveis que não estão no modelo apresentem um valor de t, tal que o valor p>.

MÉTODO BACKWARD (passo atrás) Neste método incorporam-se inicialmente todas as variáveis em um modelo de regressão linear múltipla; Percorrem-se etapas, nas quais uma variável por vez pode vir a ser eliminada; Se em cada etapa não houver eliminação de alguma variável, o processo é interrompido e as variáveis restante definem o modelo final.

PROCEDIMENTO Passo 1) ajustar o modelo completo de k variáveis; Passo 2) retirar do modelo completo a variável com menor valor da estatística t (ou maior valor de p). Caso todas as variáveis apresentem p ≤  o processo é interrompido e o modelo final é selecionado; Passo 3) ajustar o modelo com k-1 variáveis e voltar ao passo 2.

MÉTODO STEPWISE (passo a passo) Consiste em uma generalização do procedimento Forward; Após cada etapa de incorporação de uma variável, temos uma etapa em que uma das variáveis já selecionadas pode ser descartada; O procedimento chega ao final quando nenhuma variável é incluída ou descartada.

PROCEDIMENTO Passo 1) ajustar todos os modelos com m variáveis (no modelo inicial m=1) e escolher a variável candidata com maior valor da estatística t para entrar no modelo, considerando que o valor de p ≤  (caso p> o modelo é interrompido); Passo 2) para cada variável não pertencente ao modelo do passo 1, ajustar um modelo de regressão considerando no modelo as variáveis que entraram no passo 1 e escolher a variável candidata que tiver o maior valor da estatística t, desde que p ≤  (caso p> o modelo é interrompido);

Passo 3) verificar se o valor da estatística t das variáveis que estão no modelo apresentam p≤. Caso uma ou mais variáveis que já estão no modelo apresente p> , retira-se a variável do modelo que possua o maior valor de p. Passo 4) ajustar o modelo no passo 3, tal que p≤ para todas as variáveis. Voltar o passo 2 e repetir todo o processo até que todas as variáveis que estão fora do modelo tenham p>.