A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

“Aplicação da Análise Multivariada para um grande volume de dados”

Apresentações semelhantes


Apresentação em tema: "“Aplicação da Análise Multivariada para um grande volume de dados”"— Transcrição da apresentação:

1 “Aplicação da Análise Multivariada para um grande volume de dados”
Sandra Souza Lima, MSc

2 Técnicas Multivariadas
Consiste em um conjunto de métodos estatísticos utilizados em situações nas quais várias variáveis são medidas simultaneamente, em cada elemento amostral. São classificadas em: Técnicas Interdependência Técnicas de Dependência

3 Técnicas de dependência
Regressão Múltipla e Correlação Múltipla, Análise Discriminante Múltipla Modelos Lineares de Probabilidade (Logit e Probit), Análise de Correlação Canônica Análise Multivariada de Variância (MANOVA), Análise Multivariada de Covariância (MANCOVA) Modelagem de Equações Estruturais Técnicas de Interdependência Análise Fatorial Análise de Agrupamentos Escalonamento Multidimensional Análise de Correspondência.

4 Análise de Dados Análise Univariada/Bivariada Análise Multivariada
Idade média de pacientes com infecção X Associação entre uso de TARV e CD4 Análise Multivariada Índice de qualidade de vida Índice de custo de vida Fatores de risco de uma determinada doença

5 Análise Multivariada Técnicas Interdependência
Análise de Componentes Principais Técnicas de Dependência

6 Objetivo da análise de componentes principais

7 Análise de Componentes Principais
Aplicação da análise de componentes principais Exemplos: Gerar um índice de qualidade de atendimento em uma determinada empresa, de acordo com um questionário aplicado nos clientes. Gerar um índice socioeconômico por bairro de uma determinada cidade de acordo com os dados do censo/IBGE. Gerar um índice de qualidade de vida de pessoas de determinado município de acordo com um questionário aplicado.

8 Atenção As variáveis escolhidas - usar variáveis que já tenham sido validadas por outros autores. Matriz de correlação O primeiro componente gerado representa um índice global dos dados.

9

10 Exemplo

11 Ribeirão Preto possui - IDH de 0,855.
Está entre os municípios com a mais alta de taxa de co-infecção HIV/TB do Estado de São Paulo, liderados por Santos e São José dos Campos. Objetivo: identificar áreas de maior vulnerabilidade para a coinfecção HIV/TB no ano de 2006.

12 Metodologia Análise socioeconômica
Foram selecionadas variáveis do censo/IBGE, com base em trabalhos anteriormente realizados, para que pudessem representar a renda, educação, aglomeração no domicílio e grupos mais vulneráveis (mulheres). Análise de componentes principais Entre os índices obtidos, foi escolhido aquele responsável pela maior proporção da variação total apresentada. O índice, por representar aspectos socioeconômicos, foi nomeado de fator socioeconômico.

13 Metodologia Foi calculado escore que corresponde ao valor do fator socioeconômico para cada setor censitário; quanto maior seu valor, melhor o nível socioeconômico do setor. Os setores foram ordenados de forma decrescente e divididos segundo tercis, resultando em três grupos: de nível socioeconômico superior (condições socioeconômicas mais favoráveis), de nível intermediário e de nível inferior (menos favoráveis). A incidência de casos de coinfecção foi calculada para cada uma dessas áreas.

14 Resultados

15

16

17 Resumo Escolha das variáveis que irão compor o indicador
Matriz de correlação Aplica a análise de componentes principais Avalia o % de explicação dos dados no primeiro componente

18 Obrigada


Carregar ppt "“Aplicação da Análise Multivariada para um grande volume de dados”"

Apresentações semelhantes


Anúncios Google