Relação do Desempenho Escolar e Sua Relação com Dados Socio-econômicos no Município de São Paulo
A Pergunta... Existe algum padrão espacial associado ao processo ? É possível relacionar Indicadores de Desempenho Escolar à dados Sócioecônomicos
Coeficiente de Determinação R 2 = 0, pares de escolas/setores censitários Desempenho escolar de Alunos da quinta série (5ª) do período diurno do ensino fundamental das escolas estaduais, comparado aos anos de escolaridade do responsável pelo domicílio. Literatura... Resultados do Autor (Torres e Gomes 2002)
Objetivo do Trabalho Estudar a relação espacial existente entre as variáveis Nota, Renda e Escolaridade Desempenho escolar de Alunos da Quinta Série (5ª) do período diurno do ensino fundamental das escolas estaduais avaliado pela nota SARESP, comparado aos anos de escolaridade e renda do responsável pelo domicílio dado por Setor Censitário do censo 2000.
Metodologia Agregação de Dados Estudo de Dependência Espacial da Variável Nota Estudo das Variáveis Regressão Linear Simples Estudo dos Resíduos da Regressão Linear Simples Aplicação da Regressão Espacial (Modelos Globais) Análise dos Resíduos da Regressão Espacial
O Problema Setores 581 Escolas
Primeira Aproximação - Distritos Média das “notas médias” por escola em cada distrito × Média da “escolaridade média” do responsável por domicílio para cada distrito
EscolaridadeRendaNota das Escolas Distritos excluídos por não haverem dados... Distribuição de Dados Agregados
Dependência Espacial Moran global = Mapa de Moran - Variável Nota Nota Gráfico de Espalhamento de Moran
Análise de Variáveis Correlação Nota Renda Escol Nota Renda Escol Colinearidade Variable Coefficient Std.Error t-Statistic Probability CONSTANT RENDA ESCOL Estatísticas Média: Desvio Padrão: Mediana: Variância: Teste de Normalidade Kolmogorov Smirnov P-valor
Regressão Linear Simples Variable Coefficient Std.Error t-Statistic Probability CONSTANT ESCOL R-squared : Adjusted R-squared : F-statistic : Log likelihood : Akaike : Gráfico – Nota X Escolaridade
Análise dos Resíduos TESTE VALOR P- Valor Jarque-Bera Breusch-Pagan Moran's I (error) Análise de Resíduos Não Normal Homocedastico
Modelos Espaciais Lag Model R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability W_NOTA CONSTANT ESCOL Regressão Linear R-squared : Log likelihood : Akaike : Error Model R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability CONSTANT ESCOL LAMBDA
Análise dos Resíduos Moran dos Resíduos – LAG Valor = Moran dos Resíduos- Error Valor = Mapa Moran dos Resíduos Regressão - LAG Mapa Moran dos Resíduos Regressão - Error
Conclusão A análise de Distritos é pouco representativa pois considera áreas muito grandes o que distorce a realidade das escolas consideradas. Tanto o modelo LAG, como o modelo Error contribuíram pouco para a melhoria do modelo linear o que reforça a idéia de uma baixa correlação espacial. A operação de média “ amacia” o dado de forma que conclusões não significativas podem ser tiradas do dado. Busca por uma subdivisão espacial mais adequada.
Segunda Aproximação - Microáreas Média das “notas médias” por escola em cada microárea. X Média da “escolaridade média” do responsável por domicílio para cada microárea.
Escolaridade RendaNota Distribuição de Dados Agregados Microáreas excluídas por ausência de dados...
Moran Global = Mapa Moran Variavel Nota Dependência Espacial da Variável Resposta Gráfico de Espalhamento Moran
Colinearidade Variable Coefficient Std.Error t-Statistic Probability CONSTANT ESCOL RENDA Correlação Nota Escol Renda Nota Escol Renda Análise de Variáveis Estatísticas Média: Desvio Padrão: Mediana: Variância: Teste de Normalidade Kolmogorov Smirnov P-valor =
Regressão Linear Simples Variable Coefficient Std.Error t-Statistic Probability CONSTANT ESCOL R-squared : F-statistic : Adjusted R-squared : Log likelihood : Akaike : Gráfico – Nota X Escolaridade
TESTE VALOR P- Valor Jarque-Bera Breusch-Pagan Moran's I (error) Análise de Resíduos Não Normal Homocedastico
LAG Model R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability W_NOTA CONSTANT ESCOL Regressão Linear R-squared : F-statistic : Akaike : Error Model R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability CONSTANT ESCOL LAMBDA Modelos Espaciais
Análise dos Resíduos Moran dos Resíduos Valor = LAG Moran dos Resíduos Valor = Error Mapa Moran dos Resíduos Regressão - LAG Mapa Moran dos Resíduos Regressão - Error
Conclusão Os resultado dos para a análise de microrregiões apresentaram uma menor correlação espacial porém o modelo LAG se ajustou melhor. Apesar da do melhor ajuste, o valor de AKAIKE diminuiu pouco indicando a baixa correlação espacial apresentada pelo índice de Moran dos resíduos. Outro problema apresentado é a persistência e “média das notas das escolas” o que distorce a representatividade dos dados. Busca por um dado mais representativo.
Terceira Aproximação - Áreas de Influência “Notas médias” por escola × Média da “escolaridade média” do responsável por domicílio para cada região de influência
Como Foram Criadas... Interpolação Vizinho mais Próximo Raio = 2000 m
Escolaridade RendaNota Distribuição de Dados Agregados Regiões excluídas por falta de vizinhos...
Dependência Espacial Nota Valor Moran = 0,2083 Mapa de Moran - Variável Nota Gráfico de Espalhamento Moran
Correlação Nota Escol Renda Nota Escol Renda Colinearidade Variable Coefficient Std.Error t-Statistic Probability CONSTANT ESCOL RENDA Análise de Variável Estatísticas Média: Desvio Padrão: Mediana: Variância: Teste de Normalidade Kolmogorov Smirnov P-valor = 0
Nota X Escolaridade Variable Coefficient Std.Error t-Statistic Probability CONSTANT ESCOL R-squared : Adjusted R-squared : F-statistic : Log likelihood : Akaike : Gráfico – Nota X Escolaridade
Análise do Resíduos TESTE VALOR P- Valor Jarque-Bera Breusch-Pagan Moran's I (error) Não Normal Homocedastico
LAG Model R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability W_SPRCLASSE CONSTANT ESCOL Regressão Linear R-squared : Log likelihood : Akaike : Error model R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability CONSTANT ESCOL LAMBDA Modelos Espaciais
Análise dos Resíduos Moran dos Resíduos Valor = LAG Moran dos Resíduos Valor = Error Mapa Moran dos Resíduos Regressão - LAG Mapa Moran dos Resíduos Regressão - Error
R-squared : Adjusted R-squared : F-statistic : Log likelihood : Akaike : Variable Coefficient Std.Error t-Statistic Probability CONSTANT RENDA Nota x Renda TESTE VALOR P- Valor Jarque-Bera Breusch-Pagan Moran's I (error) Regressão Linear Teste dos Resíduos Não Normal Heterocedastico
Lag Model R-squared : Log likelihood : Akaike : Error Model R-squared : Log likelihood : Akaike : Regressão Linear R-squared : Log likelihood : Akaike : Variable Coefficient Std.Error z-value Probability W_NOTA CONSTANT RENDA Variable Coefficient Std.Error z-value Probability CONSTANT RENDA LAMBDA
Moran dos Resíduos Valor = - 0,0466 LAG Moran dos Resíduos Valor = Error Mapa Moran dos Resíduos Regressão - LAG Mapa Moran dos Resíduos Regressão - Error Análise dos Resíduos
Conclusão Parcial - Regiões de Influência Regiões de Influencia apresentam uma maior “fidelidade” aos dados. Para a relação de escolaridade e nota, os modelos espaciais não contribuíram para a explicação do modelo. A relação Renda e Nota apresentou um melhor resultado onde o a redução do AKAIKE foi maior e significativa. A diferença entre as áreas de influência faz com que os dados de Renda e escolaridade sejam agregados de forma diferenciada o que pode distorcer os resultados.
Conclusão Presença de Dependência Espacial da variável Nota para as três delimitações de agregação consideradas. À medida que se diminui a região de agregação diminui-se a dependência espacial. Em Geral os modelos espaciais contribuíram pouco para a diminuição do valor de AKAIKE o que indica a baixa dependência espacial dos resíduos de regressão linear. A forma de agregação dos dados pode distorcer a dependência espacial de forma distorcer o resultado final. Não se pode afirmar que está se comparando a a nota do aluno à condição de sua família por não se ter certeza da localização da residência do aluno. A utilização de um modelo multivariado ou multinível pode ter mais sucesso na explicação da relação entre dados de desempenho escolar e dados socioeconômicos