A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Profa. Andréia Adami adami@cepea.org.br Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa.

Apresentações semelhantes


Apresentação em tema: "Profa. Andréia Adami adami@cepea.org.br Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa."— Transcrição da apresentação:

1 Profa. Andréia Adami adami@cepea.org.br
Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa. Andréia Adami

2 Relembrando as aulas 01 e 02 Tipos de variáveis
Qualitativas nominais (sexo, cor dos olhos, espécies arbóreas, etc...); Qualitativas ordinais (grau de instrução, estado civil, grau de severidade de doenças, etc...); Quantitativas discretas (número de filhos, número de insetos/folha, número de empresas sustentáveis, etc..); Quantitativas contínuas (peso, altura, volume, diâmetro, produção, produtividade, etc....). Construção de Tabelas de Distribuição de Frequências para os três primeiros tipos de variáveis.

3 Relembrando as aulas 01, 02 e 03 Nem sempre estamos interessados em avaliar uma variável por vez; Analisar a distribuição de duas ou mais variáveis conjuntamente; Quando consideramos duas variáveis, podemos ter basicamente 3 situações: 1) As duas variáveis qualitativas (Tabelas de Contingência e Coeficiente de Contingência Pearson Corrigido); 2) Uma das variáveis qualitativa e a outra quantitativa (Tabelas de Contingência e Coeficiente de Contingência Pearson Corrigido); 3) As duas variáveis quantitativas ? Gráficos de dispersão e Coeficiente de Correlação de Pearson

4 Análise bidimensional
Coeficiente de Correlação de Pearson (r) 𝒓= 𝑺𝑷𝑿𝒀 𝑺𝑸𝑿 (𝑺𝑸𝒀) r é sempre um número entre -1 e 1; r = 0 não indica independência entre as variáveis, indica apenas que não existe uma relação “LINEAR” entre as variáveis; |r| próximo a 1, indica alta associação entre as variáveis (positiva/negativa) |r| próximo a 0,5, indica associação moderada.

5 Análise bidimensional
Gráfico de Dispersão Segundo o resultado da correlação obtida (r=0,95), pode-se notar que há uma forte correlação linear entre as variáveis quantidade de adubo aplicado e produção da cultura. Nota-se que à medida que a quantidade de adubo aplicado aumenta também aumenta a produção da cultura, o que é coerente com o gráfico de dispersão apresentado. 𝒓=𝟎,𝟗𝟓

6 Análise bidimensional
Gráfico de Dispersão Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? ????

7 Análise bidimensional
Gráfico de Dispersão Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo?

8 Análise bidimensional
Gráfico de Dispersão Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? 𝑌=𝑎+𝑏x (Equação da reta) Modelo de regressão linear simples

9 Regressão Linear Simples
Consideremos duas variáveis “quantitativas” X e Y. Dados n pares de valores 𝑋 1 , 𝑌 1 … 𝑋 𝑛 , 𝑌 𝑛 , se Y é uma função linear de X, podemos estabelecer uma regressão linear simples cujo modelo estatístico é: 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 , para i=1, ..., n.

10 Regressão Linear Simples
Modelo de Regressão Linear Simples 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 , 𝑌 𝑖 é a variável resposta (variável dependente); 𝑋 𝑖 é a variável independente; 𝛽 0 e 𝛽 1 são os parâmetros do modelo; 𝜀 𝑖 variável aleatória chamado de erro do modelo.

11 Modelo de Regressão Linear Simples
𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 , Com base nos dados da amostra vamos encontrar valores para os parâmetros 𝛽 0 e 𝛽 1 (estimar parâmetros) para construir o modelo de regressão.

12 Modelo de Regressão Linear Simples
Estimação dos parâmetros 𝛽 0 = 𝑌 − 𝛽 1 𝑋 𝛽 1 = 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 𝑛

13 Modelo de Regressão Linear Simples
Estimação dos parâmetros Adubo (X) Produção (Y) X.Y 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝛽 1 = 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 𝑛 = 𝑆𝑃𝑋𝑌 𝑆𝑄𝑋 = =3,8

14 Modelo de Regressão Linear Simples
Estimação dos parâmetros Adubo (X) Produção (Y) X.Y 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝛽 0 = 𝑌 − 𝛽 1 𝑋 = −3,8 25 5

15 Modelo de Regressão Linear Simples
Estimação dos parâmetros Adubo (X) Produção (Y) X.Y 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝛽 0 = 𝑌 − 𝛽 1 𝑋 =60−3,8 5 =41

16 Modelo de Regressão Linear Simples
Estimação dos parâmetros Adubo (X) Produção (Y) X.Y 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 Estimativa do 𝛽 0 : intercepto y do modelo de regressão  valor da produção da cultura quando é aplicado X=0 de adubo 𝑌 =41+3,8X

17 Modelo de Regressão Linear Simples
Estimação dos parâmetros Adubo (X) Produção (Y) X.Y 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 Estimativa do 𝛽 1 : coeficiente angular do modelo  o quanto aumenta a produção da cultura quando aumentamos a quantidade de adubo em uma “unidade” 𝑌 =41+3,8X

18 Modelo de Regressão Linear Simples
Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? 𝒀=𝟒𝟏+𝟑,𝟖 𝟑 =𝟓𝟐,𝟒 toneladas 𝑌 =41+3,8X

19 Modelo de Regressão Linear Simples
Adubo (X) Produção (Y) X.Y 2 48 2x48 = 96 4 2.304 56 4x56 = 224 16 3.136 5 64 5x64 = 320 25 4.096 6 60 6x60 = 360 36 3.600 8 72 8x72 = 576 5.184 300 1.576 145 18.320 𝒀=𝟒𝟏+𝟑,𝟖 𝟐 =𝟒𝟖,𝟔 𝒀=𝟒𝟏+𝟑,𝟖 𝟑 =𝟓𝟐,𝟒 𝑌𝑖 =41+3,8Xi

20 Modelo de Regressão Linear Simples
Método de Estimação dos parâmetros Mínimos quadrados ordinários (MQO): Minimizar a soma dos quadrados das diferenças entre os valores observados de 𝑌 𝑖 e seu valor esperado 𝑌 𝑖

21 Modelo de Regressão Linear Simples
Método de Estimação dos parâmetros Qual é a produção da cultura A se forem aplicadas 3 toneladas de adubo? 𝜀 3 𝜀 4 Modelo de regressão linear simples

22 Modelo de Regressão Linear Simples
Método de Estimação dos parâmetros Minimizando a soma dos quadrados dos Resíduos (SQR): Reordenando as equações temos: 𝜕( 𝜀 𝑖 2 ) 𝜕 =2 𝑌 𝑖 − − 𝑋 𝑖 −1 =0 𝜕( 𝜀 𝑖 ²) 𝜕 =2 𝑌 𝑖 − − 𝑋 𝑖 − 𝑋 𝑖 =0 𝑌 𝑖 −𝑛 − 𝑋 𝑖 =0 Equações normais de MQO 𝑋 𝑖 𝑌 𝑖 − 𝑋 𝑖 − 𝑋 𝑖 ² =0

23 Modelo de Regressão Linear Simples
Estimação dos parâmetros 𝛽 0 = 𝑌 − 𝛽 1 𝑋 𝛽 1 = 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 𝑛 Teorema de Gauss-Markov: Dadas as pressuposições do modelo, os estimadores de MQO, na classe dos estimadores não-viesados, têm variância mínima.

24 Modelo de Regressão Linear Simples
Pressuposições do modelo O modelo é linear, ou a relação entre X e Y é linear; Os valores de X são fixos em amostras repetidas; E( ) =0; 4. A variância do erro é constante: 5. Ausência de autocorrelação resíduo: 6. Covariância zero entre 𝜀 𝑖 e 𝑋 𝑖 , ou 𝐸 𝜀 𝑖 𝑋 𝑖 =0; 7. Os erros 𝜀 𝑖 ′ 𝑠 têm distribuição normal; 8. O número de observações n deve ser maior que o número de parâmetros a serem estimados. Alternativamente, o número de observações n devem ser maior que o número de variáveis explicativas 𝜀 𝑖 𝑉𝑎𝑟( 𝜀 𝑖 )=𝐸( 𝜀 𝑖 ² )= 𝜎 2 𝐶𝑜𝑣( 𝜀 𝑖 , 𝜀 𝑗 )=0

25 Modelo de Regressão Linear Simples
Qualidade do ajuste do modelo Componente não explicado ( 𝜀 𝑖 ) Y X 𝑋 𝑌 𝑌 𝑖 − 𝑌 𝑌 𝑖 − 𝑌 𝑖 = 𝜀 𝑖 ( 𝑌 𝑖 − 𝑌 ) Componente explicado ( 𝑌 𝑖 ) (𝑌 𝑖 − 𝑌 )² = ( 𝑌 𝑖 − 𝑌 )² 𝜀 𝑖 ² 𝑆𝑄𝑇𝑜𝑡 = 𝑆𝑄𝑅𝑒𝑔 𝑆𝑄𝑅𝑒𝑠

26 Coeficiente de Determinação
Coeficiente de determinação (R²): Mede o grau de ajustamento da reta de regressão aos dados, ou seja, é uma medida descritiva da qualidade do ajuste. Em geral referimo-nos ao R² como a quantidade de variabilidade nos dados que é explicada pelo modelo de regressão ajustado. 0 ≤ R² ≥ 1 𝑅 2 = 𝑆𝑄𝑅𝑒𝑔 𝑆𝑄𝑇𝑜𝑡 = (𝑆𝑃𝑋𝑌)2 𝑆𝑄𝑋𝑆𝑄𝑌

27 Exercícios Exemplo 3: obter o modelo de regressão linear simples e coeficiente de determinação R2 No Excel: Salinidade (X) 3,85 9,61 2,26 2,06 6,10 2,89 10,58 11,40 Temperatura (Y) 24 23 25,5 25 24,3

28 Exercícios Para a próxima aula (14/03/18) obter o modelo de regressão linear simples e R2 para o problema a seguir: Meses Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Leite X 1,90 2,00 2,20 2,50 2,30 2,60 2,90 2,70 2,80 Queijo Y 15,00 16,00 17,00 19,00 18,00 23,00 21,00 27,00 25,00 22,00


Carregar ppt "Profa. Andréia Adami adami@cepea.org.br Escola Superior de Agricultura “Luiz de Queiroz” Universidade de São Paulo LCE0211 – Estatística Geral Profa."

Apresentações semelhantes


Anúncios Google