Modelagem Estatística Variáveis
Dois tipos de pesquisas empíricas DE LEVANTAMENTO Características de interesse de uma população são levantadas (observadas ou medidas), mas sem manipulação. EXPERIMENTAL Grupos de indivíduos (ou animais, ou objetos) são manipulados para se avaliar o efeito de diferentes tratamentos.
Pesquisas de levantamento POPULAÇÃO: todos os possíveis consumidores Amostra: um subconjunto dos consumidores inferência amostragem Ilustração de um levantamento por amostragem
os elementos a serem pesquisados POPULAÇÃO Como? Perguntas que precisam ser respondidas no planejamento de um levantamento O quê? características a serem observadas VARIÁVEIS Quem? os elementos a serem pesquisados POPULAÇÃO Como? o instrumento de coleta de dados QUESTIONÁRIO / ENTREVISTA ESTRUTURADA
População x amostra População: conjunto dos elementos que se deseja estudar. Amostra: subconjunto da população. Amostragem: processo de seleção da amostra
Amostragem e Inferência estatística universo do estudo (população) dados observados Amostragem inferência
Planejamento de experimentos Estudo experimental: Manipulam-se, de forma planejada, certas variáveis independentes ou fatores (A, B, C, ...) para verificar o efeito que esta manipulação provoca numa certa variável dependente ou resposta Y
Dados e variáveis
Dados e variáveis variável qualitativa ou categórica quantitativa dados qualitativos ou categorizados dados quantitativos
Distribuição de freqüências A distribuição de freqüências consiste na organização dos dados de acordo com as ocorrências dos diferentes resultados observados. Pode ser apresentada em tabela ou gráfico.
Dados Provedor usado por cada usuário indivíduo provedor 1 2 3 4 5 6 7 8 9 10 C A B D 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
Distribuição de frequências variáveis qualitativas Tabela. Distribuição de frequências do provedor usado pelo visitante do site. Provedor Freqüência Percentagem A 10 25,0 B 17 42,5 C 7 17,5 D 6 15,0 Total 40 100,0
Distribuição de frequências variáveis qualitativas Gráfico de colunas para a apresentação da distribuição de frequências do provedor usado pelo visitante do site.
Distribuição de frequências variáveis qualitativas Gráfico de setores para a apresentação da distribuição de frequências do provedor usado pelo visitante do site.
Distribuição de frequências variáveis quantitativas discretas % de itens 16 14 12 10 8 6 4 2 1 2 3 4 5 6 7 Número de defeitos
Variáveis contínuas Construção da distribuição de frequências 5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2 8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7 8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1 6,0 4,7 14,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9 6,5 5,9 amplitude dos dados 11 classes de amplitude unitária 4 5 6 7 8 9 10 11 12 13 14 15 4,7 14,1
Tabela de frequências variável contínua Classes de tempo Ponto médio Número de observações nj Percentagem de observações 100fj Percentagem acumulada 100Fj 4 |— 5 5 |— 6 6 |— 7 7 |— 8 8 |— 9 9 |— 10 10 |— 11 11 |— 12 12 |— 13 13 |— 14 14 |— 15 4,5 5,5 6,5 7,5 8,5 9,5 10,5 11,5 12,5 13,5 14,5 7 18 13 4 5 2 1 14 36 26 8 10 50 76 84 94 98 100 Total -
Histograma
Ramo-e-Folhas Taxa de Mortalidade Infantil dos Municípios da Micro-Região Oeste Catarinense, ano de 1982. 1 00234 2 0002233344 3 00233 1 67888 2 5779 3 6689 Unidade = 1 valor discrepante = 6 | 2
Formas de uma distribuição de frequências Distribuições diferentes em termos da posição central
Formas de uma distribuição de frequências Distribuições diferentes quanto à dispersão
Formas de uma distribuição de frequências Distribuições diferentes quanto à assimetria
Formas de uma distribuição de freqüências Distribuições diferentes quanto à curtose
Medidas descritivas A média aritmética: uma medida de posição central.
Exemplo: notas dos alunos de três turmas Média da turma A B C 4 5 5 6 6 7 7 8 1 2 4 6 6 9 10 10 0 6 7 7 7 7,5 7,5 6,00
Exemplo: notas dos alunos de três turmas 2 4 6 8 10 12 notas Turma A Turma B Turma C
Dispersão Embora as três distribuições apresentem a mesma média, as variabilidades são diferentes. Esta característica é denominada dispersão. Como é possível quantificar a dispersão?
distância (desvio) em relação à média Como medir a dispersão? Exemplo: Turma A (4 5 5 6 6 7 7 8) 4 5 6 7 8 distância (desvio) em relação à média
Como medir a dispersão? xi Variância (da amostra): Descrição notação resultados numéricos Valores (notas dos alunos) xi 4 5 5 6 6 7 7 8 Média 6 Desvios em relação à média -2 -1 -1 0 0 1 1 2 Desvios quadráticos 4 1 1 0 0 1 1 4 Variância (da amostra):
Como medir a dispersão? xi Desvio padrão (da amostra): Descrição notação resultados numéricos Valores (notas dos alunos) xi 4 5 5 6 6 7 7 8 Média 6 Desvios em relação à média -2 -1 -1 0 0 1 1 2 Desvios quadráticos 4 1 1 0 0 1 1 4 Desvio padrão (da amostra):
Variância Populacional Quando tratar-se de uma população, a variância (2) é calculada usando-se n no denominador. 2 = n X-X)2
Medidas descritivas das notas finais dos alunos de três turmas. Número de alunos Média Desvio padrão A B C 8 7 6,00 1,31 3,51 2,69 Interprete.
Ex: Rendimento de um processo químico Interprete.
Medidas baseadas na ordenação dos dados 25% qi md qs Quartil inferior mediana Quartil superior
Medidas baseadas na ordenação dos dados Dados ordenados: 25% qi md qs Se fracionário interpolação linear
Comparação entre média e mediana A média é mais influenciada por valores discrepantes. 10 20 30 40 50 60 70 md = 22,5 50% dos valores
Comparação entre média e mediana 50% média = mediana (a) distribuição simétrica 50% mediana média (b) distribuição assimétrica
Diagrama em caixas qs + 1,5dq qi md qs max min dq = qs - qi
Diagrama em caixas e forma da distribuição 25% Ÿ
Interprete o gráfico 3 8 13 18 23 28 Monte Verde Encosta do Morro Renda familiar (sal. mín.)
Orientação geral para análise exploratória dados não temporais Análise univariada Variável qualitativa Variável quantitativa Distribuição de freqüências Percentagens Tabela Gráfico de barras, colunas ou setores Medidas descritivas (média, desvio padrão, mediana, etc.) Histograma Ramo-e-folhas
Orientação geral para análise exploratória dados não temporais Análise biivariada Uma variável quantitativa e outra qualitativa Duas variáveis qualitativas Duas variáveis quantitativas Medidas descritivas da variável quantitativa em cada categoria da qualitativa Diagrama em caixas múltiplo Tabela de contingência (Cap. 10) Diagrama de dispersão (Cap. 11) Coeficiente de correlação (Cap. 11)