Abordagem comparativa

Slides:



Advertisements
Apresentações semelhantes
ANÁLISE MULTIVARIADA DE DADOS
Advertisements

Correlação e Regressão
ANÁLISES DE REGRESSÃO.
“Ecologia quantitativa”
Relembrando... A Investigação como processo tem seis etapas sucessivas: Construção do problema Entendimento do problema: a partir de quais perspectivas.
INTELIGÊNGIA COMPUTACIONAL
TESTE PARA ESTRUTURA ESPECIAL DE CORRELAÇÃO
ANÁLISE DISCRIMINANTE
Por Que o Pesquisador Social Utiliza a Estatística
Tutorial de exercícios Estatística Básica Utilizando o Excel Delamaro e Marins 2a. Aula - Estatística Descritiva.
Universidade Federal de Ouro Preto (UFOP)
Reconhecimento de Padrões PCA David Menotti, Ph.D. Universidade Federal de Ouro Preto (UFOP) Programa de Pós-Graduação em Ciência.
Reconhecimento de Padrões Principal Component Analysis (PCA) Análise dos Componentes Principais David Menotti, Ph.D. Universidade.
Resposta forçada II Objetivos:
Linguagem Orientada a Matrizes COB 727
Análise de Medidas Repetidas: Áreas de Uso
Outras Transforações de Imagens
Relatório de INC 2009 Embrapa Solos Temas de P&D a serem treinados
Pesquisa HOSS, Osni.
Exercício 1 No MS-Excel: Clicar em algum dado da tabela.
Estatística e Probabilidade
Técnicas Experimentais Aplicadas em Ciência do Solo
“Aplicação da Análise Multivariada para um grande volume de dados”
Gráfico de Pareto O termo Gráfico de Pareto ficou conhecido depois que Juran começou a utilizá-lo. O nome se originou no trabalho de Vilfredo Pareto, durante.
1ª. AULA PRÁTICA.
DISTRIBUIÇÕES AMOSTRAIS
CONCEITOS BÁSICOS.
Análise Fatorial Factor analysis.
Para início de estudo Estatística.
Regressão Múltipla Profas: Gardênia da Silva Abbad Elaine Rabelo Neiva
COMPONENTES DO TCC ‘REFERENCIAL TEÓRICO E RESULTADOS’
Introdução à Estatística
Universidade Estadual Paulista “Júlio de Mesquita Filho” FCLassis – Depto de Ciências Biológicas Programa de Pós-graduação em Biociências Área de Concentração.
A PESQUISA E SUAS CLASSIFICAÇÕES
Aplicações Estatísticas uma rápida abordagem
Regressão Linear.
Aula 8. Classificação Não Supervisonada por Regiões
MÚLTIPLOS GRAUS DE LIBERDADE
Seleção de atributos Mariana Pinheiro Bento IA368Q.
Sobre o uso de métodos estatísticos auxiliares nos estágios iniciais de seleção dos programas de melhoramento de plantas Luiz Alexandre Peternelli Área.
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Componentes Principais Camilo Daleles Rennó
Análise de Agrupamentos Marcílio Souto DIMAp/UFRN.
Professor Antonio Carlos Coelho
Análise Multivariada BioEstat
Regressão e Previsão Numérica.
análise dos estimadores
Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2015 Análise de Agrupamento Camilo Daleles Rennó
Aula 16- Análise de variância (ANOVA) 1 Lembrando: para testar hipóteses segundo estratégia de Neyman e Pearson é necessário 1) formular as hipóteses estatísticas;
Clustering Algorithms for Gene Expression Analysis Pablo Viana Fagner Nascimento.
FMIE / MIE - 2º ano Economia 1º ano NI 1 Unidade 2 – FONTES DE INFORMAÇÃO. Porque a necessidade de fontes de informação? Que Informação? Que.
Estatística Descritiva. 2 oO que é a estatística ? Para muitos, a estatística não passa de conjuntos de tabelas de dados numéricos. Os estatísticos são.
Disciplina Engenharia da Qualidade II
Noções de Estatística - I
Metodologia da Pesquisa em Ensino de Ciências I
Descrição Bivariada Comparando Duas Distribuições
FEATURE SELECTION. Introdução  Estudo de metodologias relacionadas a seleção de atributos  Maldição da dimensionalidade  O número de atributos do desenvolvedor.
Distribuição Normal de Probabilidade
O QUE SÃO... FERRAMENTAS DA QUALIDADE
Análise de Componentes Principais
TEU 08/10/2013: Software Statistica Profª: Francieli Dalcanton.
Média e valor médio No estudo da estatística descritiva, para além das tabelas de frequências e gráficos, estudam-se outros métodos para resumir a informação.
PREPARAÇÃO DE UM ARTIGO CIENTÍFICO
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Componentes.
Igor Menezes. “É uma técnica estatística multivariada apoiada no pressuposto de que uma série de variáveis empíricas ou observáveis, pode ser explicada.
Distribuição de freqüências
EAL ESTATÍSTICA, PLANEJAMENTO E OTIMIZAÇÃO DE EXPERIMENTOS.
Profª Juliana Schivani GRÁFICOS.
Camilo Daleles Rennó Estatística: Aplicação ao Sensoriamento Remoto SER ANO 2016 Análise.
Prof. João Saturnino GRÁFICOS.
Técnicas de Avaliação de Interfaces Prof. Jorge Cavalcanti.
Transcrição da apresentação:

Abordagem comparativa Análises Multivariadas Abordagem comparativa Pearson (1901) e Hotelling (1933) O objetivo principal é a obtenção de um pequeno número de combinações lineares (componentes principais) de um conjunto de variáveis, que retenham o máximo possível da informação contida nas variáveis originais. Redução dos dados originais Facilitar a interpretação através da descoberta de relacionamentos não suspeitos previamente.

Abordagem comparativa Análises Multivariadas Abordagem comparativa 1) Compara ecossistemas e define similaridade ou diferenças entre variáveis; 2) Concentra-se em uma ou poucas características dentro do ecossistema, com grande valor teórico ou prático; 3) Estuda como relações causais variam dentro dos ecossistemas.

Abordagem comparativa Análises Multivariadas Abordagem comparativa A análise de componentes principais substitui um conjunto de variáveis correlacionadas por um conjunto de novas variáveis não-correlacionadas, sendo essas combinações lineares das variáveis iniciais e colocadas em ordem decrescente por suas variâncias Var CP1 > Var CP2 > .... > Var CPp

Variáveis x Unidades amostrais Análises Multivariadas Variáveis x Unidades amostrais Unidades amostrais: - Rios, lagos, reservatórios, pontos de coletas, datas 2) P variáveis: Campo: pH, cond.elétrica, OD, temp. turbidez, Secchi, etc. Laboratório: Alcalinidade, CO2, clorofila-a, etc. Bióticas: densidade, biomassa, biovolume, cobertura, presença/ausência. Portanto: utiliza-se P variáveis e n unidades amostrais

Abordagem comparativa Análises Multivariadas Abordagem comparativa

Análises Multivariadas • Se fosse utilizar análise univariada teria que comparar cada variável por unidade. - Problemas na síntese e interpretação dos resultados; - Geração de muita estatística; - Muita informação a ser apresentada; - Aumento da probabilidade de erro. Assim: Indica-se para estudos de gradientes ambientais e estudos de limnologia regional ou comparada.

Análises Multivariadas • Sendo as variáveis resultantes de um processo, ou seja, correlacionadas, as análises pretendem: 1) Descrever o padrão de similaridade entre as unidades amostrais considerando a correlação entre as variáveis; 2) Encontrar o mesmo conjunto de variáveis que possam ser redundantes, buscando a redução na dimensionalidade dos dados.

Abordagem comparativa Análises Multivariadas Abordagem comparativa • Sendo as variáveis resultantes de um processo, ou seja, correlacionadas, as análises pretendem: 1) Descrever o padrão de similaridade entre as unidades amostrais considerando a correlação entre as variáveis; 2) Encontrar o mesmo conjunto de variáveis que possam ser redundantes, buscando a redução na dimensionalidade dos dados.

Análises Multivariadas • An. Multivariadas descritivas (explanatórias) de inferência (confirmação) Em ecologia téc. Ordenação téc. Classificação Hierárquica N. Hierárquica

Análises Multivariadas Hierárquica • Análise de agrupamento (Aglomerativa): “Cluster Analysis” - Arranjo hierárquico de unidades amostrais; - trabalha-se com a similaridade entre elas; - Calcula-se o índice de similaridade e/ou (Dist.Euclidiana; Jaccard; Camberra; Bray-Curtis...) - Aplica-se o método de ligação (UPGMA – lig. Média) - Constrói-se o dendograma.

Análises Multivariadas Hierárquica • Análise de agrupamento (Aglomerativa): “Cluster Analysis”

Análises Multivariadas Análise NÃO Hierárquica • Aplicação: - Arranjo hierárquico de unidades amostrais; - Lagoas num gradiente; rios, etc.; - Utiliza-se técnicas de ordenação Ordenação: objetiva resumir a dimensionalidade dos dados ACP: mais utilizada

Análises Multivariadas Análise de Componentes Principais • Trabalha com a matriz de correlação de Pearson entre as variáveis; • Calcula-se os autovetores: fornece as combinações lineares; • As combinações são: - componente principal 1, - componente principal 2, - componente principal 3... • Calcula-se os escores para ordenar as unidades amostrais; • Faz-se o gráfico.

Análises Multivariadas Análise de Componentes Principais Princípios: • Se as variáveis forem intercorrelacionadas, a PCA não pode ser usada; • A PCA funcionará bem para respostas lineares; • A PCA pode ser muito bem empregada para espécies, se os dados forem lineares.

Análises Multivariadas Análise de Componentes Principais

O esquema descrito na Figura servirá de base para a aplicação da ACP Análises Multivariadas O esquema descrito na Figura servirá de base para a aplicação da ACP

Análises Multivariadas Análise de Componentes Principais

Análises Multivariadas Análise de Componentes Principais A Componente Principal é o arranjo que melhor representa a distribuição dos dados (linha vermelha na Figura ) e a Componente secundária é perpendicular a componente principal (linha azul na Figura ).

Análises Multivariadas

Análises Multivariadas • O fundamental na PCA são os: - Autovalores (eigenvalues) - Autovetores (eingenvectors) • Autovetores: -são o grupo de escores que correspondem às variáveis originais; - cada variável tem um autovetor que varia de –1 a 1; - O autovetor vai dar a correlação (proximidade com o eixo; - As que forem próximas a –1 e 1 são as mais importantes.

Análises Multivariadas • Autovalor: -representa o maior grau possível de correlação de todas as variáveis com o eixo principal; - Quanto maior for o valor de um autovalor, maior a correlação; - O segundo eixo será ortogonal ao primeiro e o autovalor será menor; - As que forem próximas a –1 e 1 são as mais importantes.

Análises Multivariadas • Próximo passo: obter os escores das estações de amostragens nos eixos. Seleção do número de componentes Kaiser ou Método da Raiz Latente: autovalores maiores que 1 (Johnson = 0,7); Scree test – gráfico dos autovalores.

Análises Multivariadas Loadings

Análises Multivariadas

Análises Multivariadas

Análises Multivariadas PC-ord Passo 1   Elabora-se a planilha no Excel que não deve conter campos vazios; dados com todos os nomes diferentes; a primeira letra não pode ser número; nome com oito letras e as amostras não devem conter apenas zeros. Observe se existem muitas espécies raras ou dados raros.

Análises Multivariadas PC-ord Spp. ou variáveis Q = quantitativa C = categórica M = mista

Análises Multivariadas PC-ord Passo 2   Elaborar a planilha com a configuração abaixo para ser aceita no PCord.

Análises Multivariadas PC-ord Passo 3   Salvar em WK1, all (1, 2, 3) no EXCEL e abrir no PCord. Ordanation PCA Observo os resultados e interpreto os dois primeiro eixos do autovalor. Inspeciono o gráfico. Faço uma transformação no Modify Data e Standardization, Logarithmic Transformation e comparo os resultados com o obtido anteriormente para optar pelo melhor modelo.

Análises Multivariadas PC-ord Passo 4   Resultados da transformação: Se o resultado do autovalor dos eixos 1 e 2, respectivamente não melhoraram, bem como o percentual de explicação, logo utilizo os resultados anteriores sem transformação. Salvo os resultados e abro no EXCEL.

Análises Multivariadas PC-ord Passo 5   Abre no EXCEL o arquivo que tem saída .OUT, e faço a largura fixa (avançar) e delimito onde quero que seja delimitada a largura. Retenho apenas os resultados dos eixos 1 e 2 para os diferentes reservatórios, alem dos autovalores e percentual de explicação.

Análises Multivariadas PC-ord Resultados: Retenho os eixos que tenham autovalores maiores que Broken-stick.  

Análises Multivariadas PC-ord Como as sequencias das linhas não mudam posso fazer a colagem de dados anteriores e a planilha deve ficar organizada como abaixo, faço a ordenação por bacia e em ordem decrescente da PC1 seguida da PC2:

Análises Multivariadas