Regressão Linear.

Slides:



Advertisements
Apresentações semelhantes
Correlação e Regressão
Advertisements

Estatística amintas paiva afonso.
Prof. Darlan Marcelo Delgado
TRANSFORMAÇÃO POR ANÁLISE DE ERRO
ANÁLISES DE REGRESSÃO.
Analise de Regressão Parte 2.
AJUSTE DE CURVAS 6.1 Introdução 6.2 Método dos quadrados mínimos
MÉTODOS QUANTITATIVOS
REGRESSÃO LINEAR. O coeficiente de correlação não mede a relação causa-efeito entre duas variáveis, apesar de que essa relação possa estar presente. Por.
FUNÇÕES.
Folha de Cálculo TIC 10.
Diagramas de dispersão
Regressão linear A regressão linear é usada para determinar o valor de uma variável dependente contínua baseando-se na sua relação linear com uma (regressão.
Métodos Numéricos Computacionais
Laís Araújo Lopes de Souza
Modelos de regressão Cláudio Monteiro
Estatística e Probabilidade
Problemas de Otimização
Aceite para publicação em 15 de Março de 2010
Quadrados Mínimos.
Aula teórica: Tratamento de dados, recta
Regressão Pontos mais importantes: -objectivo -regressão linear
TECNOLOGIAS DA INFORMAÇÃO E COMUNICAÇÃO TIC 10 Folha de Cálculo.
Aula 6 - Método não-experimental ou de seleção não-aleatória
Mario de Andrade Lira Junior lira.pro.br\wordpress 2/4/2015 lira.pro.br\wordpress - Reservados todos os direitos autorais.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Regressão Camilo Daleles Rennó
Professor Antonio Carlos Coelho
Exploração e Cruzamento de Variáveis
Professores André Fernando André Cavalieri
Formas de calibração 1º - Padrões externos É a forma mais utilizada de calibração. São utilizadas soluções contendo concentrações conhecidas do analito.
Função quadrática: a função geral de 2º grau
Equações algébricas e transcendentais
Interpolação e Ajuste de Curvas
2.3 Experimentos Fatoriais 22 Efeitos das Interações
1 Análise de regressão linear simples: abordagem matricial Álgebra de matrizes é amplamente utilizada na estatística. É praticamente uma necessidade na.
Modelagem Estatística
Contabilidade e Regressão Linear
Regressão e Previsão Numérica.
7 Ajuste de Curvas UFSC.PósMCI.FME.Ajuste de curvas. (11.1)
Regressão.
Ajuste do Modelo Avaliação dos Coeficientes
Regressão Linear Múltipla
Descrição Bivariada Comparando Duas Distribuições
ANOVA.
Visão Geral do SPSS.
Testes de Hipóteses.
Aulas Introdutórias O processo de medida;
Estatística e Probabilidade
Métodos Estatísticos Aplicados às Ciências Biológicas
PPGTI AULA 3 Prof. Dr. Márcio A. Fiori –
Métodos Estatísticos Aplicados às Ciências Biológicas - 11ª aula -
Regressão Linear Simples
Testes de Hipóteses.
Correlação e regressão
Regressão Linear. Introdução A relação linear entre duas variáveis contínuas pode ser aferida através do coeficiente de correlação ou do modelo de regressão.
SPSS. 1 - Inserir dados na planilha: digite os dados na planilha.
CEPZ1 – 2015 – AULA 09 PROFESSORA: BRUNA CAVALLINI E RODRIGUES
Regressão linear simples
Regressão linear simples
MATEMÁTICA E SUAS TECNOLOGIAS
Correlação Análise do grau de relacionamento entre duas variáveis quantitativas.
Experimentação e Instrumentação Regressão Linear e Múltipla
Aproximação e Interpolação MCEF 2011/12. O Problema da interpolação consiste na obtenção de funções que descrevam de forma exacta um conjunto de dados.
1. C.Dougherty “Introduction to Econometrics” 2. Capítulo 16. Bussab&Morettin “Estatística Básica” 7ª Edição.
AULA 11 – REGRESSÃO Parte I
LINEARIDADE Kamila Dias Nayara Rayanne Pereira Renata Fernandes Solange Araújo.
Profa Dra. Denise Pimentel Bergamaschi
Regressão Linear (aula 14 – Parte 2).
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Como construir modelos empíricos. Nos modelos estudados, cada fator foi fixado em dois níveis Por esta razão temos que nos contentar com uma visão limitada.
Transcrição da apresentação:

Regressão Linear

Introdução Objectivos da regressão linear: Mostrar de que forma as variáveis independentes explicam as variáveis dependentes. Fazer previsões sobre as variáveis dependentes a partir dos valores das independentes. A relação linear entre duas variáveis contínuas pode ser aferida através do coeficiente de correlação ou do modelo de regressão linear.

Procedimentos Deve construir-se um quadro – diagrama de dispersão – a partir dos pares de valores (X,Y) de variáveis independente e dependente. Funções do diagrama de dispersão: Ajudar a determinar se existe relação entre as variáveis. Permitir identificar a equação matemática mais apropriada para descrever essa relação (linear, exponencial, logarítmica, potência, etc.).

Relação linear A relação linear entre duas variáveis pode ser descrita através da equação: Em que: Y = variável dependente X = variável independente  = variável residual (inclui factores exteriores ao modelo e erros de medição)  = parâmetro ordenada na origem  = parâmetro declive

Relação linear Cada valor observado para a variável dependente pode ser decomposto numa soma de três factores:  = um valor constante. X = o efeito da variável independente.  = o efeito de uma variável residual, que impede uma relação linear perfeita entre X e Y.

Recta de regressão O método dos mínimos quadrados permite o ajustamento de uma linha recta aos dados observados, de modo a minimizar os efeitos da variável residual. A recta ajustada a um conjunto de valores amostrais terá a forma: Onde os efeitos da variável residual foram anulados.

Parâmetros são os estimadores dos parâmetros  e . Calculam-se do seguinte modo:

Parâmetros pode também calcular-se como: Onde:

Exemplo Pretende ajustar-se um modelo de regressão linear simples aos dados observados para 10 consumidores do sexo masculino da cidade de Lisboa, referentes aos seus rendimentos médios mensais (variável independente) e às despesas mensais em bebidas alcoólicas (variável dependente). Consulte esta tabela

Exemplo Efectua-se o cálculo dos parâmetros:

Interpretação dos resultados A estimativa encontrada para o parâmetro  significa que, independentemente do rendimento mensal auferido, os consumidores masculinos da cidade de Lisboa gastam 6,16 € em bebidas alcoólicas mensalmente. A estimativa de 0,093 para o parâmetro  indica que, por cada 100€ de variação no rendimento dos consumidores, as despesas em bebidas alcoólicas variam 9,3€, estando as duas variáveis associadas positivamente, ou seja, um aumento no rendimento implica um aumento no consumo de bebidas alcoólicas.

Coeficiente de correlação O coeficiente de correlação é uma medida do grau de associação linear entre as duas variáveis (dependente e independente). É obtido a partir da relação entre o desvio explicado e o desvio total.

Coeficiente de determinação A relação directa entre o desvio explicado e o desvio total é o coeficiente de determinação, que indica o grau de aderência do ajustamento feito através do método de mínimos quadrados. Varia entre 0% (mínimo) e 100% (máximo).

Coeficiente de correlação de Pearson O coeficiente de correlação linear r (raiz quadrada positiva do coeficiente de determinação) é uma medida do grau de associação linear entre variáveis. Toma valores entre –1 e +1.

SPSS No SPSS, os dados deverão ser introduzidos da seguintes forma: Consulte esta tabela Depois, seleccionar nos menus: Analyze  Regression  Linear

SPSS Seleccionar as variáveis dependente e independente:

SPSS Obtém-se o seguinte quadro de respostas: Ordenada na origem Declive Consulte esta tabela De onde se extraem os valores de 6,163 e 0,093 para  e , respectivamente.

SPSS - Gráfico · Na barra de menus escolher: Graphs  Scatter…   Graphs  Scatter… ·       Seleccionar Simple e premir Define. ·       Seleccionar a variável dependente para o eixo Y. ·       Seleccionar a variável independente para o eixo X. ·       Em Label Cases by colocar o nome da variável que vai identificar os pontos nos gráficos.

SPSS - Gráfico A janela deverá ser preenchida da seguinte forma:

SPSS - Gráfico Para identificar os pontos, editar o gráfico e usar a opção Point ID. O resultado é o seguinte:

SPSS – Regra de regressão Para visualizar a recta de regressão, escolher na barra de menus:   Chart  Options… ·       Em Fit Line escolher Total.       Em Fit Options escolher Linear regression. Para visualizar o erro quadrático, escolher na barra de menus: ·       Em Fit Options escolher Display R-square in legend.

SPSS – Escala Para alterar a gama de valores representados, escolher na barra de menus:   Chart  Axis… Para a gama do eixo X, escolher X scale. Modificar, então, os valores mínimo e máximo de Range. Para a gama do eixo Y, proceder do mesmo modo.

SPSS – Gráfico Ordenada na origem

SPSS – Valores previstos e valores residuais Os valores previstos pela recta são diferentes dos valores reais para cada caso. A diferença entre os dois constitui o valor residual.   O SPSS calcula os valores previstos pelo modelo linear, assim como os valores residuais. ·       Na caixa de diálogo Linear Regression escolher a opção Save.   ·       Em Predicted Values e Residuals seleccionar as opções Unstandardized.

SPSS – Valores previstos e valores residuais Premir, depois, o botão Continue.

SPSS – Valores previstos e valores residuais São geradas as variáveis pre_1 e res_1, respectivamente, com os valores previstos e residuais para cada caso.   É possível visualizar os valores previstos junto dos valores reais. ·       Na barra de menus escolher:   Analyze  Reports  Case Summaries… ·       Seleccionar as variáveis a analisar e movê-las para a lista de variáveis.

SPSS – Valores previstos e valores residuais Valores previstos pelo modelo Valores residuais

SPSS – Valores previstos e valores residuais Neste caso, o modelo afirma que:   alcool =  0,0930  rendim + 6,163 expressão a partir da qual se podem calcular os valores previstos pelo modelo e respectivos valores residuais.

SPSS – Coeficiente de correlação A tabela seguinte, apresentada como um dos resultados do cálculo de regressão linear, dá-nos o valor do coeficiente de correlação (R), assim como o seu quadrado (R Square). Coeficiente de correlação Proporção de variação explicada pelo modelo Dois gráficos, para duas situações distintas, podem ter os mesmos valores de declive e ordenada na origem. No entanto, aquele que apresentar o maior coeficiente de correlação é o que melhor se adapta à realidade modelada.

Regressão linear múltipla Tem como objectivo desenvolver um modelo de relações entre uma variável dependente e um conjunto de variáveis independentes, de tal modo que os valores da primeira possam ser explicados – e que previsões possam ser feitas – com base nos valores do segundo conjunto de variáveis.

Cálculo dos coeficientes de regressão Para simplicidade de exposição, considere-se que Y depende apenas dos valores assumidos por duas variáveis X1 e X2. Que dá origem a:

Método dos mínimos quadrados O método dos mínimos quadrados permite-nos encontrar os estimadores pretendidos. A aplicação deste método fornece-nos três equações para a determinação de (1) (2) (3)

Resolução A primeira destas equações pode ser escrita como: (4) ou (5)

Resolução Substituindo (5) em (2), obtém-se: (6)

Resolução Torna-se necessário definir seis somas de quadrados (SS):

Resolução Usando a notação de soma de quadrados é possível rescrever as equações (6) e (3): (7) (8) A resolução deste sistema de equações permite obter Depois, estima-se o valor de  a partir da equação (5).

Resumo da resolução Os passos necessários para encontrar os estimadores de mínimos quadrados, num modelo de regressão linear com duas variáveis independentes, podem ser resumidos do seguinte modo: