Carregar apresentação
A apresentação está carregando. Por favor, espere
PublicouVinícius Cornelio Alterado mais de 9 anos atrás
1
Monitoração de Qualidade de água com o uso de Dados simbólicos Afonso Gustavo Ataide Ferreira
2
Cenário Preocupação Mundial Escassez Escassez Conflitos Armados Conflitos Armados Mundo volta-se para a qualidade. (IQA) Mundo volta-se para a qualidade. (IQA) Iniciativas Brasileiras Conama Conama ANA ANA
3
Roteiro Estado da Arte Metodologia Resultados Conclusões e Trabalhos Futuros
4
Estado da Arte Classificação de Amostras de Água
5
CONRADS (MLP x Branch/BLTM) YONG (SOM x MLP) BARUAH (MLP)
6
Estado da Arte Análise de Dados Simbólicos
7
Dado Numérico Dado Categórico Conjuntos Intervalos Numéricos Conjuntos associados a pesos
8
Análise de Dados Simbólicos PessoaIdadeAltura(m)Peso(kg)Sexo W1W1 181,795M W2W2 251,651F W3W3 601,5860F W4W4 141,555M W5W5 101,142F GrupoIdadeAltura (m)Peso (kg)Sexo G1G1 {(Pré-adolescente, 2/5), (Adolescente,1/5), (Adulto, 2/5)} {(Alto, 1/5), (Médio, 2/5), (Baixo, 1/5) } { (Magro, 1/5), (Normal, 3/5), (Gordo, 1/5) } {(M, 2/5), (F, 3/5)}
9
Classificador Simbólico Amostras: Espaço:
10
Classificador Simbólico Join:
11
Classificador Simbólico Aprendizagem: Sem Mutual Neighborhood Graph Mutual Neighborhood Graph: Múltiplas regiões. Múltiplas regiões. Sem interseção com outras classes. Sem interseção com outras classes.
14
Classificador Simbólico Classificação:
16
Metodologia Coleta de Dados Seleção de Variáveis Limpeza dos Dados Análise dos Dados Divisão dos Conjuntos
17
Coleta de Dados Bases da CETESB 35 Características IQA e outros índices onze rios, 239 amostras.
18
Seleção de Variáveis
19
Oxigênio Dissolvidos Coliformes Fecais Potencial Hidrogeniônico (pH) Demanda Bioquímica de Oxigênio Temperatura Nitrogênio Total Fósforo Total Turbidez Resíduo Total
20
Limpeza dos Dados Valores não numéricos Ex: NKT < 0,2 Ex: NKT < 0,2
21
Limpeza dos Dados Valores Ausentes: Substituídos pela média da classe Substituídos pela média da classe
22
Análise dos Dados Tamanho do conjunto
23
Análise dos Dados
24
Conjuntos de Treinamento e Teste Hold-out estratificado (50 – 50) ClasseTreinamentoTeste C01009 C277 C312 C421
25
Resultados ProtótipoExperimentos
26
Protótipo Java J2SE1.5 Tanagra
27
Experimentos Classificador Simbólico: Taxa de Erro: 21,20% Taxa de Erro: 21,20% Desempate: Maior Volume Desempate: Maior Volume
28
Experimentos K-Vizinhos (5-nn) Distância: Euclidiana Distância: Euclidiana Taxa de Erro: 28,84% Taxa de Erro: 28,84%
29
Experimentos Classificador Simbólico: Taxa de Erro: 29,63% Taxa de Erro: 29,63% Desempate: Menor Volume Desempate: Menor Volume
30
Resultados Teste Estatístico 1000 iterações 1000 iterações
31
Conclusões
32
Conclusões Classificador Simbólico um pouco melhor que o k-vizinhos Performance ruim em algumas classes Utilização de MNG aumentou taxa de erro.
33
Trabalhos Futuros
34
Mudança do formato de Região H-Region H-Region Adaptação do algoritmo de MNG Testes com outras bases de Dados
35
Referências ANA – Agência Nacional de Águas Java – http://java.sun.com http://java.sun.com ICHINO, M., YAGUCHI, H. AND DIDAY, E.: A fuzzy symbolic pattern classifier In: Diday, E. et al (Eds.): Ordinal and Symbolic Data Analysis. Springer, Berlin, (1996) 92–102 D’OLIVEIRA, S. T., CARVALHO, F.A.T., SOUZA, R. M. C. R.. A Classifier for Quantitative Feature Values Based on a Region Oriented Symbolic Approach. C. Lemaître, C.A. Reyes, J. A. Gonzalez: IBERAMIA 2004, LNAI 3315 pp. 464-473,2004 TANAGRA. TANAGRA - A Free DATA MINING Software for Teaching and Research. Disponível em:. Acesso em: Janeiro 2006.
Apresentações semelhantes
© 2024 SlidePlayer.com.br Inc.
All rights reserved.