Profa. Andréia Adami adami@cepea.org.br Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.

Slides:



Advertisements
Apresentações semelhantes
6. Andando na Superfície de Resposta Técnica de otimização baseada em planejamentos fatoriais Etapas distintas: Modelagem e deslocamento Modelagem: ajuste.
Advertisements

Estudo de Repetitividade e Reprodutibilidade de Sistemas de Medição
Correlação e Regressão
Correlação entre Variáveis Correlação entre Variáveis Regressão Linear e Não Linear.
Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE5801 – Regressão e Covariância Taciana Villela Savian Sala 304, pav. Engenharia,
Estatística Aplicada a Finanças 1. Aprimorar os conceitos estatísticos básicos – Medidas de tendência e dispersão – Probabilidade – Intervalo de confiança.
Introdução à prática da
Medições – parte I: Precisão.
Revisão Medidas de Dispersão
Prof. Leonardo Bianco de Carvalho FCAV/UNESP – Câmpus de Jaboticabal
ESTATÍSTICA AULA 15 Testes de hipóteses – Unidade 10
Bioestatística e Epidemiologia Aula 3: Medidas de Tendência Central
Confiabilidade Estrutural
ESTATÍSTICA AULA 11 Modelos probabilísticos mais comuns – Unidade 7
Probabilidade e Estatística Aplicadas à Contabilidade II
DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO
Probabilidade e Estatística Aplicadas à Contabilidade I
Análise Discriminante
Regressão Linear Simples
Estatística Bivariada
Estatística para Cursos de Engenharia e Informática
ESTATÍSTICA . SÍNTESE DO 10.º ANO . RELAÇÕES BIDIMENSIONAIS (11.º ANO)
Estatística Descritiva (I)
Regressão com uma variável dependente Binária
ESTATÍSTICA AULA 12 Inferência Estatística e Distribuição Amostral – Unidade 8 Professor Marcelo Menezes Reis.
Padronização.
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS
Modelos de Equações simultâneas
CURSO DE ENGENHARIA ELÉTRICA
Estimação de Máxima Verossimilhança
Regressão Linear Múltipla
Pesquisa em Psicologia
A.L. 1.0│Medição em Química.
Frequência (n.Pessoas)
Prof. Eduardo Bezerra (CEFET/RJ)
Introdução – Análise de Variâncias (ANOVA)
Análise de Regressão Ajuste de Parâmetros.
Análise de regressão múltipla
Alguns tópicos do gretl
Tutorial para a escolha do Teste Estatístico
Estatística Descritiva
A área de medição da interceptação compreende uma faixa de 10 x 10 m onde foram catalogadas 172 árvores. Os diâmetros das árvores aqui apresentados foram.
Probabilidade e Estatística Aplicadas à Contabilidade II
ESTATÍSTICA AULA 04 ANÁLISE EXPLORATÓRIA DE DADOS I – Unidade 3
A.L. 1.0│Medição em Química.
DISTRIBUIÇÕES AMOSTRAIS
Universidade São Francisco
7 Resultados de Medições Indiretas
Prof. Elisson de Andrade
Correlação: Há um Relacionamento entre as variáveis?
Análise Discriminante
Profa. Dra. Andreia Adami
Inferência Estatística
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
FUNDAMENTOS DA ESTATÍSTICA
Prof. Elisson de Andrade
AULA 4 ESTATÍSTICA DANIEL PÁDUA.
Profa. Andréia Adami Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.
Revisão de inferência.
Variância e Desvio padrão
Mestrado Profissional em Física Médica
Aplicação do Modelo de Regressão no Processo de Produção de Gasolina
Prof. Antonio Lopo Martinez
PROJETO FATORIAL 23 Considere que três fatores A, B e C, cada um em dois níveis O projeto experimental é denominado projeto fatorial 23 Oito combinações.
Aula 05 Distribuição de freguência Prof. Diovani Milhorim
Aula 13 Goodies* * Goodies related to animals, plants and numbers…
Probabilidade e Estatística Aplicadas à Contabilidade II
BIOESTATÍSTICA Mestrado em Educação Física Encontro 2
Análise e apresentação dos dados
Estatística descritiva: medidas DE dispersão
Transcrição da apresentação:

Profa. Andréia Adami adami@cepea.org.br Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa. Andréia Adami adami@cepea.org.br

Relembrando as aulas 01 e 02 Tipos de variáveis Qualitativas nominais (sexo, cor dos olhos, espécies arbóreas, etc...); Qualitativas ordinais (grau de instrução, estado civil, grau de severidade de doenças, etc...); Quantitativas discretas (número de filhos, número de insetos/folha, número de empresas sustentáveis, etc..); Quantitativas contínuas (peso, altura, volume, diâmetro, produção, produtividade, etc....). Construção de Tabelas de Distribuição de Frequências para os três primeiros tipos de variáveis.

Relembrando as aulas 01, 02 e 03 Nem sempre estamos interessados em avaliar uma variável por vez; Analisar a distribuição de duas ou mais variáveis conjuntamente; Quando consideramos duas variáveis, podemos ter basicamente 3 situações: 1) As duas variáveis qualitativas (Tabelas de Contingência e Coeficiente de Contingência Pearson Corrigido); 2) Uma das variáveis qualitativa e a outra quantitativa (Tabelas de Contingência e Coeficiente de Contingência Pearson Corrigido); 3) As duas variáveis quantitativas ? Gráficos de dispersão e Coeficiente de Correlação de Pearson

Análise bidimensional Coeficiente de Correlação de Pearson (r) 𝒓= 𝑺𝑷𝑿𝒀 𝑺𝑸𝑿 (𝑺𝑸𝒀) r é sempre um número entre -1 e 1; r = 0 não indica independência entre as variáveis, indica apenas que não existe uma relação “LINEAR” entre as variáveis; |r| próximo a 1, indica alta associação entre as variáveis (positiva/negativa) |r| próximo a 0,5, indica associação moderada.

Análise bidimensional Gráfico de Dispersão Segundo o resultado da correlação obtida (r=0,95), pode-se notar que há uma forte correlação linear entre as variáveis quantidade de adubo aplicado e produção da cultura. Nota-se que à medida que a quantidade de adubo aplicado aumenta também aumenta a produção da cultura, o que é coerente com o gráfico de dispersão apresentado. 𝒓=𝟎,𝟗𝟓

Análise bidimensional Gráfico de Dispersão Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? ????

Análise bidimensional Gráfico de Dispersão Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo?

Análise bidimensional Gráfico de Dispersão Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? 𝑌=𝑎+𝑏x (Equação da reta) Modelo de regressão linear simples

Regressão Linear Simples Consideremos duas variáveis “quantitativas” X e Y. Dados n pares de valores 𝑋 1 , 𝑌 1 … 𝑋 𝑛 , 𝑌 𝑛 , se Y é uma função linear de X, podemos estabelecer uma regressão linear simples cujo modelo estatístico é: 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 , para i=1, ..., n.

Regressão Linear Simples Modelo de Regressão Linear Simples 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 , 𝑌 𝑖 é a variável resposta (variável dependente); 𝑋 𝑖 é a variável independente; 𝛽 0 e 𝛽 1 são os parâmetros do modelo; 𝜀 𝑖 variável aleatória chamado de erro do modelo.

Modelo de Regressão Linear Simples 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 , Com base nos dados da amostra vamos encontrar valores para os parâmetros 𝛽 0 e 𝛽 1 (estimar parâmetros) para construir o modelo de regressão.

Modelo de Regressão Linear Simples Estimação dos parâmetros 𝛽 0 = 𝑌 − 𝛽 1 𝑋 𝛽 1 = 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 𝑛

Modelo de Regressão Linear Simples Estimação dos parâmetros Adubo (X) Produção (Y) X.Y X² Y² 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝛽 1 = 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 𝑛 = 𝑆𝑃𝑋𝑌 𝑆𝑄𝑋 = 76 20 =3,8

Modelo de Regressão Linear Simples Estimação dos parâmetros Adubo (X) Produção (Y) X.Y X² Y² 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝛽 0 = 𝑌 − 𝛽 1 𝑋 = 300 5 −3,8 25 5

Modelo de Regressão Linear Simples Estimação dos parâmetros Adubo (X) Produção (Y) X.Y X² Y² 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝛽 0 = 𝑌 − 𝛽 1 𝑋 =60−3,8 5 =41

Modelo de Regressão Linear Simples Estimação dos parâmetros Adubo (X) Produção (Y) X.Y X² Y² 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 Estimativa do 𝛽 0 : intercepto y do modelo de regressão  valor da produção da cultura quando é aplicado X=0 de adubo 𝑌 =41+3,8X

Modelo de Regressão Linear Simples Estimação dos parâmetros Adubo (X) Produção (Y) X.Y X² Y² 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 Estimativa do 𝛽 1 : coeficiente angular do modelo  o quanto aumenta a produção da cultura quando aumentamos a quantidade de adubo em uma “unidade” 𝑌 =41+3,8X

Modelo de Regressão Linear Simples Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? 𝒀=𝟒𝟏+𝟑,𝟖 𝟑 =𝟓𝟐,𝟒 toneladas 𝑌 =41+3,8X

Modelo de Regressão Linear Simples Adubo (X) Produção (Y) X.Y X² Y² 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝒀=𝟒𝟏+𝟑,𝟖 𝟐 =𝟒𝟖,𝟔 𝒀=𝟒𝟏+𝟑,𝟖 𝟑 =𝟓𝟐,𝟒 𝑌𝑖 =41+3,8Xi

Modelo de Regressão Linear Simples Método de Estimação dos parâmetros Mínimos quadrados ordinários (MQO): Minimizar a soma dos quadrados das diferenças entre os valores observados de 𝑌 𝑖 e seu valor esperado 𝑌 𝑖

Modelo de Regressão Linear Simples Método de Estimação dos parâmetros Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? 𝜀 3 𝜀 4 Modelo de regressão linear simples

Modelo de Regressão Linear Simples Método de Estimação dos parâmetros Minimizando a soma dos quadrados dos Resíduos (SQR): Reordenando as equações temos: 𝜕( 𝜀 𝑖 2 ) 𝜕 =2 𝑌 𝑖 − − 𝑋 𝑖 −1 =0 𝜕( 𝜀 𝑖 ²) 𝜕 =2 𝑌 𝑖 − − 𝑋 𝑖 − 𝑋 𝑖 =0 𝑌 𝑖 −𝑛 − 𝑋 𝑖 =0 Equações normais de MQO 𝑋 𝑖 𝑌 𝑖 − 𝑋 𝑖 − 𝑋 𝑖 ² =0

Modelo de Regressão Linear Simples Estimação dos parâmetros 𝛽 0 = 𝑌 − 𝛽 1 𝑋 𝛽 1 = 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 𝑛 Teorema de Gauss-Markov: Dadas as pressuposições do modelo, os estimadores de MQO, na classe dos estimadores não-viesados, têm variância mínima.

Modelo de Regressão Linear Simples Pressuposições do modelo O modelo é linear, ou a relação entre X e Y é linear; Os valores de X são fixos em amostras repetidas; E( ) =0; 4. A variância do erro é constante: 5. Ausência de autocorrelação resíduo: 6. Covariância zero entre 𝜀 𝑖 e 𝑋 𝑖 , ou 𝐸 𝜀 𝑖 𝑋 𝑖 =0; 7. Os erros 𝜀 𝑖 ′ 𝑠 têm distribuição normal; 8. O número de observações n deve ser maior que o número de parâmetros a serem estimados. Alternativamente, o número de observações n devem ser maior que o número de variáveis explicativas 𝜀 𝑖 𝑉𝑎𝑟( 𝜀 𝑖 )=𝐸( 𝜀 𝑖 ² )= 𝜎 2 𝐶𝑜𝑣( 𝜀 𝑖 , 𝜀 𝑗 )=0

Modelo de Regressão Linear Simples Qualidade do ajuste do modelo Componente não explicado ( 𝜀 𝑖 ) Y X 𝑋 𝑌 𝑌 𝑖 − 𝑌 𝑌 𝑖 − 𝑌 𝑖 = 𝜀 𝑖 ( 𝑌 𝑖 − 𝑌 ) Componente explicado ( 𝑌 𝑖 ) (𝑌 𝑖 − 𝑌 )² = ( 𝑌 𝑖 − 𝑌 )² + 𝜀 𝑖 ² 𝑆𝑄𝑇𝑜𝑡 = 𝑆𝑄𝑅𝑒𝑔 + 𝑆𝑄𝑅𝑒𝑠

Coeficiente de Determinação Coeficiente de determinação (R²): Mede o grau de ajustamento da reta de regressão aos dados, ou seja, é uma medida descritiva da qualidade do ajuste. Em geral referimo-nos ao R² como a quantidade de variabilidade nos dados que é explicada pelo modelo de regressão ajustado. 0 ≤ R² ≥ 1 𝑅 2 = 𝑆𝑄𝑅𝑒𝑔 𝑆𝑄𝑇𝑜𝑡 = (𝑆𝑃𝑋𝑌)2 𝑆𝑄𝑋𝑆𝑄𝑌

Exercícios Exemplo 3: obter o modelo de regressão linear simples e coeficiente de determinação R2 No Excel: Salinidade (X) 3,85 9,61 2,26 2,06 6,10 2,89 10,58 11,40 Temperatura (Y) 24 23 25,5 25 24,3

Exercícios Para a próxima aula (14/03/18) obter o modelo de regressão linear simples e R2 para o problema a seguir: Meses Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Leite X 1,90 2,00 2,20 2,50 2,30 2,60 2,90 2,70 2,80 Queijo Y 15,00 16,00 17,00 19,00 18,00 23,00 21,00 27,00 25,00 22,00