Monitoração de Qualidade de água com o uso de Dados simbólicos Afonso Gustavo Ataide Ferreira.

Slides:



Advertisements
Apresentações semelhantes
Construção de listas de decisão Os tópicos anteriores tratam de indução de conceitos que podem ser descritos usando uma única região de decisão Neste tópico.
Advertisements

Gestão das águas no Semi-árido: algumas reflexões
Otimização com Simulated Annealing e Tabu Search
I CENSO NACIONAL DE RESIDÊNCIA OU ESTÁGIO EM CIRURGIA CARDIOVASCULAR
INDICE DA QUALIDADE DA ÁGUA (IQA)
Mineração de Dados Avaliação de Classificadores
Araken de Medeiros Santos Anne Magály de Paula Canuto
Leonardo de Oliveira Martins
Método de Clusterização baseado em Densidade Algoritmo DBSCAN
PREDIÇÃO DATA MINING AULA 13 SANDRA DE AMO
Aprendem a partir de seus vizinhos AULA 9 DATA MINING Sandra de Amo
DESENVOLVIMENTO DE SISTEMA DE APOIO A GESTÃO DA PISCICULTURA
Reconhecimento de Padrões Tipos de Aprendizagem
A Review of Algorithms for Audio Fingerprinting Autores : Pedro Cano Ton Kalker IEEE - MMSP – International WorkShop on Multimedia Signal Processing 2003.
Reconhecimento de Padrões Aprendizagem Supervisionada (KNN)
. Capítulo 1 Introdução à Estatística Capítulo 1 Introdução à Estatística Prof. Paulo Renato de Morais ESTATÍSTICA APLICADA.
Jacques Robin, Francisco Carvalho, Flávia Barros
Support Vector Machines (SVM)
Gestão das Informações Ambientais
Solos CETESB – Manual de Gerenciamento de Áreas Contaminadas
através de um experimento em que se produzia vapor de água que fazia circular em um tubo, até uma câmara onde havia metano, amônia e hidrogênio, simulando.
Métodos de Investigação Epidemiológica em Doenças Transmissíveis
Estatística Descritiva (I)
Alexandre Xavier Falcão & David Menotti
Aprendizado Baseado em Instâncias – Algoritmo k-NN
K-Means / Clustering.
OBJETIVO E CONTEXTUALIZAÇÃO RESULTADOS E CONCLUSÕES
Marcus Vinicius Silva Soares Orientador: Luiz Merschmann Outubro / 2010.
Gerhard M¨unz, Sa Li, Georg Carle Computer Networks and Internet Wilhelm Schickard Institute for Computer Science University of Tuebingen, Germany Traffic.
Ferramenta de classificação da qualidade da água da Bacia do Rio Piracicaba na WEB Alexandre Marino 21/11/2003
Área de Pesquisa: Redes de Computadores
Avaliação de Clusteres Parte II
Aprendizado de Máquina - Introdução
Data Mining: A arte de minerar conhecimento. Roteiro Visão do Problema –Introdução 1 –Motivação 2 Desafios Tecnologias: –Algoritmos de otimização de mineração.
DIEGO RICARDO DE ARAUJO DEPARTAMENTO DE CIÊNCIA DA COMPUTAÇÃO INSTITUTO DE CIÊNCIA EXATAS UNIVERSIDADE FEDERAL DE JUIZ DE FORA Seleção de Características.
Instituto Nacional de Pesquisa da Amazônia – INPA Coordenação de Pesquisa em Clima e Recursos Hídricos - CPCR Programa Institucional de Bolsas de Iniciação.
APLICANDO O PROCESSO DIRIGIDO POR RESPONSABILIDADES PARA A CRIAÇÃO DE UM SUBFRAMEWORK PARA VALIDAÇÃO SINTÁTICA DE FÓRMULAS Autores: Rafael Hornung Simone.
IA - Prof. Paulemir Campos
Classificação de imagens de fotografias históricas usando detecção de linhas e paralelogramos pela presença de edifícios Natália Cosse Batista Grupo 8.
FLORAÇÃO DE CIANOBACTÉRIAS
O que falta ao trabalhador brasileiro
NA GESTÃO DE RECURSOS HÍDRICOS
DIRETORIA DE GESTÃO DAS ÁGUAS E DO TERRITÓRIO - DIGAT GERÊNCIA DE AVALIAÇÃO DE QUALIDADE DAS ÁGUAS – GEAG MONITORAMENTO DA QUALIDADE DAS ÁGUAS (atualização.
Evidências.com 1/31 Projeto de Pesquisa: contexto.
Estatística Aplicada Aula 7
O Processo de KDD Data Mining SUMÁRIO - AULA1 O processo de KDD
XVIII Exposição de Experiências Municipais em Saneamento
Marcus Sampaio DSC/UFCG. Marcus Sampaio DSC/UFCG Etapas do Processo.
Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira.
DIRETORIA DE GESTÃO DAS ÁGUAS E DO TERRITÓRIO - DIGAT GERÊNCIA DE AVALIAÇÃO DE QUALIDADE DAS ÁGUAS – GEAG MONITORAMENTO DA QUALIDADE DAS ÁGUAS (atualização.
Bacia do Rio Paraíba do Sul Qualidade das Águas
PROBLEMA DO EMPACOTAMENTO
Monitoramento Automático de Parâmetros Hidrológicos na Bacia do Rio Purus, AM - HIDROPURUS - Centro de Previsão de Tempo e Estudos Climáticos – CPTEC/INPE.
Introdução ao Curso e Análise Descritiva de Dados ESTATISTICA Aula 1 1PROF: CÉLIO SOUZA.
U SO DA S ELEÇÃO DE P ROTÓTIPOS P ARA O TIMIZAR A C LASSIFICAÇÃO B ASEADA EM D ISSIMILARIDADE Felipe Soares Queiroga (fsq)
CALCULADORA INTERVALAR PARA OPERAÇÕES ARITMÉTICAS EM JAVA
Classificação/Categorização Christian Diego – cdad Icamaan Viegas – ibvs.
Meio Ambiente Tratamento de Água Turma F Warlen Librelon.
Reconhecimento de Faces
Categorização de Documentos Mariana Lara Neves CIn/UFPE.
Redes Neurais Treinamento de MLP. Treinamento Divisão das entradas Parâmetros de treinamento –350 iterações –Nº de nós da camada interna (26, 46, 92)
Luana Bezerra Batista Redes Neurais Luana Bezerra Batista
Classificação de Textos
ASrank Carlos Carlim.
Detecção de tráfego Skype na Web através de Redes Neurais Artigo Original: Freire, P. E., Ziviani, A., and Salles, R. M. (2008). Detecting skype flows.
DIRETORIA DE GESTÃO DAS ÁGUAS E DO TERRITÓRIO - DIGAT GERÊNCIA DE AVALIAÇÃO DE QUALIDADE DAS ÁGUAS – GEAG MONITORAMENTO DA QUALIDADE DAS ÁGUAS (atualização.
Prof. MSc. Rodrigo Alves do Carmo
1 Projeto Híbrido de Redes Neurais Ricardo Bastos C. Prudêncio Orientação: Teresa B. Ludermir CIn - UFPE Jan
Avaliação da qualidade das águas do Distrito Federal frente às classes de enquadramento propostas Camila Aida Campos Welber F. Alves, Érica Y. Freitas,
Laboratório de Classificação Supervisionada Laboratório de Geoprocessamento do Departamento de Engenharia de Transportes da EPUSP setembro de 2011.
Transcrição da apresentação:

Monitoração de Qualidade de água com o uso de Dados simbólicos Afonso Gustavo Ataide Ferreira

Cenário  Preocupação Mundial Escassez Escassez Conflitos Armados Conflitos Armados Mundo volta-se para a qualidade. (IQA) Mundo volta-se para a qualidade. (IQA)  Iniciativas Brasileiras Conama Conama ANA ANA

Roteiro  Estado da Arte  Metodologia  Resultados  Conclusões e Trabalhos Futuros

Estado da Arte Classificação de Amostras de Água

 CONRADS (MLP x Branch/BLTM)  YONG (SOM x MLP)  BARUAH (MLP)

Estado da Arte Análise de Dados Simbólicos

 Dado Numérico  Dado Categórico  Conjuntos  Intervalos Numéricos  Conjuntos associados a pesos

Análise de Dados Simbólicos PessoaIdadeAltura(m)Peso(kg)Sexo W1W1 181,795M W2W2 251,651F W3W3 601,5860F W4W4 141,555M W5W5 101,142F GrupoIdadeAltura (m)Peso (kg)Sexo G1G1 {(Pré-adolescente, 2/5), (Adolescente,1/5), (Adulto, 2/5)} {(Alto, 1/5), (Médio, 2/5), (Baixo, 1/5) } { (Magro, 1/5), (Normal, 3/5), (Gordo, 1/5) } {(M, 2/5), (F, 3/5)}

Classificador Simbólico  Amostras:  Espaço:

Classificador Simbólico  Join:

Classificador Simbólico  Aprendizagem:  Sem Mutual Neighborhood Graph  Mutual Neighborhood Graph: Múltiplas regiões. Múltiplas regiões. Sem interseção com outras classes. Sem interseção com outras classes.

Classificador Simbólico  Classificação:

Metodologia Coleta de Dados Seleção de Variáveis Limpeza dos Dados Análise dos Dados Divisão dos Conjuntos

Coleta de Dados  Bases da CETESB  35 Características  IQA e outros índices  onze rios, 239 amostras.

Seleção de Variáveis

 Oxigênio Dissolvidos  Coliformes Fecais  Potencial Hidrogeniônico (pH)  Demanda Bioquímica de Oxigênio  Temperatura  Nitrogênio Total  Fósforo Total  Turbidez  Resíduo Total

Limpeza dos Dados  Valores não numéricos Ex: NKT < 0,2 Ex: NKT < 0,2

Limpeza dos Dados  Valores Ausentes: Substituídos pela média da classe Substituídos pela média da classe

Análise dos Dados  Tamanho do conjunto

Análise dos Dados

Conjuntos de Treinamento e Teste  Hold-out estratificado (50 – 50) ClasseTreinamentoTeste C01009 C277 C312 C421

Resultados ProtótipoExperimentos

Protótipo  Java J2SE1.5  Tanagra

Experimentos  Classificador Simbólico: Taxa de Erro: 21,20% Taxa de Erro: 21,20% Desempate: Maior Volume Desempate: Maior Volume

Experimentos  K-Vizinhos (5-nn) Distância: Euclidiana Distância: Euclidiana Taxa de Erro: 28,84% Taxa de Erro: 28,84%

Experimentos  Classificador Simbólico: Taxa de Erro: 29,63% Taxa de Erro: 29,63% Desempate: Menor Volume Desempate: Menor Volume

Resultados  Teste Estatístico 1000 iterações 1000 iterações

Conclusões

Conclusões  Classificador Simbólico um pouco melhor que o k-vizinhos  Performance ruim em algumas classes  Utilização de MNG aumentou taxa de erro.

Trabalhos Futuros

 Mudança do formato de Região H-Region H-Region  Adaptação do algoritmo de MNG  Testes com outras bases de Dados

Referências  ANA – Agência Nacional de Águas  Java –  ICHINO, M., YAGUCHI, H. AND DIDAY, E.: A fuzzy symbolic pattern classifier In: Diday, E. et al (Eds.): Ordinal and Symbolic Data Analysis. Springer, Berlin, (1996) 92–102  D’OLIVEIRA, S. T., CARVALHO, F.A.T., SOUZA, R. M. C. R.. A Classifier for Quantitative Feature Values Based on a Region Oriented Symbolic Approach. C. Lemaître, C.A. Reyes, J. A. Gonzalez: IBERAMIA 2004, LNAI 3315 pp ,2004  TANAGRA. TANAGRA - A Free DATA MINING Software for Teaching and Research. Disponível em:. Acesso em: Janeiro 2006.