Gestão da Informação em Grandes Repositórios de Dados Multimidia Marcos André Gonçalves Professor Adjunto Departamento de Ciência da Computação Universidade.

Slides:



Advertisements
Apresentações semelhantes
Terminologia Definicao Construção Exemplos
Advertisements

Simulação de Sistemas Antonio J. Netto AULA1.
O papel da informática na educação que queremos
Proposta de uma Biblioteca Digital para Trabalhos Monográficos do Departamento de Computação da Universidade Federal de Ouro Preto Gustavo Henrique Braz.
‘ Por que estudar sistemas de informação?
1 / 38 AVALIAÇÃO DE UM PROCESSO E SOFTWARE PARA A PRODUÇÃO DE CONTEÚDOS DE ENSINO Foz do Iguaçu, 02 de Setembro de Luciete Basto de Andrade Albuquerque.
EMPRESA ACESSO DIGITAL SAFE-DOC Professora: ÚRSULA BLATTMANN
Propriedades de Documentos
Apresentação da Monografia
Faculdade de Ciências Sociais de Aplicadas de Petrolina – FACAPE
Interação Homem-Máquina
Introdução aos Sistemas Gerenciadores de Banco de Dados
Ontologia para Sistemas Configurarionais Urbanos
Escola de Ciência da Informação (ECI)
Ontologia e Sistemas de Informação Geográfica Departamento de Informática - Universidade Federal de Viçosa Jugurta Lisboa Filho Alcione de Paiva Oliveira.
1 Data Integration in a Bandwidth-Rich World Ian Foster and Robert L. Grossman Universidade Federal Fluminense Doutorado em Computação – Engenharia de.
Seminário do grupo de pesquisa em IHC do DIMAp-UFRN
GHHITS – Mining the Web Link Structure Universidade Federal de Pernambuco Centro de Informática Roberta Coelho Silvio Meira.
Metodologias para Aplicações Ambientais
SIG e Modelagem de Dados Parte II
INTRODUÇÃO AO GEOPROCESSAMENTO
Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação Desenvolvimento e Avaliação de Algoritmos.
Avaliação de Sistemas Operacionais
Avaliação de Desempenho
Junções Adaptativas em consultas Federadas sobre Linked Data
BUSCA POR CONTEÚDO EM IMAGENS ATRAVÉS DE TRANSFORMA WAVELET APLICADA À IDENTIFICAÇÃO DE FOLHAS DE ESPÉCIES VEGETAIS. BUSCA POR CONTEÚDO EM IMAGENS ATRAVÉS.
UNIVERSIDADE FEDERAL DE SANTA CATARINA - UFSC PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA E GESTÃO DO CONHECIMENTO EGC – GESTÃO DO CONHECIMENTO E FERRAMENTAS.
GERINDO Gerência e Recuperação de Informação em Documentos UFRGS – UFMG - UFAM Abril
Bruno Augusto Vivas e Pôssas
Seminário de Andamento UNILASALLE André Sandri Maio 2006 PROFILE EM UML PARA MODELAGEM SIMPLIFICADA DE INTERFACES GRÁFICAS EM APLICATIVOS.
Instituto Tecnológico da Aeronáutica – ITA Divisão de Ciência de Engenharia Eletrônica e Computação EE-09 Inteligência Artificial Prof. Adilson Marques.
Algoritmos: Teoria e Engenharia
Práticas da Gestão do Conhecimento e Ferramentas Computacionais aplicadas aos Processos da Comunicação Científica Domingos Bernardo Gomes Santos, Josemir.
Integrando Textura e Forma para a Recuperação de Imagens por Conteúdo
Carlos Alberto de Freitas Pereira Júnior
Composição e Geração de Aplicações usando Aspectos
A área de banco de dados Cristina Paludo Santos –
Prof.Alfredo Parteli Gomes
Matheus dos Santos Lima
II Workshop de Dissertação Pós-Graduação em Ciência da Computação Faculdade de Computação – FACOM Universidade Federal de Uberlândia – UFU Dezembro/2008.
IB 1 Introdução à Computação Apresentação do curso Fonte: Prof: Joseana Macedo Fachine na01.ppt.
Grandes Desafios da Informática
Bruno Florencio Pinheiro Orientador: Renato Fernandes Corrêa
Tecnologia da informação
AS PROFISSÕES DA ÁREA DA COMPUTAÇÃO
GRADE Conceito Histórico –NASSA’s Information Power Grid (Primeira) “A” GRADE e “uma” GRADE; GRID Middleware –Exs: Condor, GLOBUS e Unicore;
1 My GRID: Bio-informática personalizada em uma grade de informação. Francisco Silva
Apresentação do Curso de Ciência da Computação
Recuperação de Informação
Por que estudar sistemas de informação?
Professor: Márcio Amador
Software engineering, the software process and their support M.M. Lehman Apresentadora: Tarciana Dias da Silva.
I Workshop GERINDO Grupo de Bancos de Dados DCC/UFMG Hotel Floresta Mágica Abril de 2003.
TVDesigner Uma Ferramenta para Criação de Aplicações MHP Interativas para TV Digital Orientador: Prof. Ph.D. Carlos André Guimarães Ferraz Aluno: Djaci.
1 Luís Cláudio Dallier Saldanha Análise da pesquisa em EaD.
Uma Interface em Linguagem Natural em Português para Pergunta-Resposta na Web Grupo de Inteligência Computacional Mestrado em Ciência da Computação Aluno:
Sistemas de Informações Geográficas: História e Definições
E-Commerce, Systems Performance Evaluation, and Experimental Development Laboratory A Model Checking Methodology for E-commerce Systems Adriano Machado.
Gestão do Conhecimento e da Informação
Capítulo 1 Sistemas de Banco de Dados
Nº Aluno: Nome: António Paulo Santos Sessão Controlo Tese 2º Semestre 2007/2008.
Luiz Chaimowicz Universidade Federal de Minas Gerais
INTRODUÇÃO THOBER CORADI DETOFENO, MSC. Aula 01 JOINVILLE 2015 Universidade do Estado de Santa Catarina – CCT/UDESC.
Computação na Engenharia Antônio Carlos Maida Bruno Dodorico Gabriel Furlan Douglas Alves Leonardo Possi 1 Pontifícia Universidade Católica de Campinas.
Curso de verão Data Mining Web Mining. O que é Web Mining?  Web Mining é o uso de técnicas de data mining para descobrir e extrair automaticamente informações.
INTELIGÊNCIA EMPRESARIAL Aula 6 – Componentes dos Sistemas de Apoio à Decisão.
Informação Nos últimos 30 anos do século XX, foram produzidas mais informações do que nos cinco mil anos anteriores. Nos últimos 30 anos do século XX,
ONTOLOGIAS NO CONTROLE DA ADAPTAÇÃO AO CONTEXTO EM ESPAÇO UBÍQUO ONTOLOGIAS NO CONTROLE DA ADAPTAÇÃO AO CONTEXTO EM ESPAÇO UBÍQUO Nelsi Warken, Luiz A.
Técnicas de Avaliação de Interfaces Prof. Jorge Cavalcanti.
Temas de Pesquisa para 2016 Prof. Elvis Fusco. Data Science e Big Data Analytics Estudo e aplicações do conceito de Data Science no desenvolvimento de.
Transcrição da apresentação:

Gestão da Informação em Grandes Repositórios de Dados Multimidia Marcos André Gonçalves Professor Adjunto Departamento de Ciência da Computação Universidade Federal de Minas Gerais Simpósio Jovem Cientista Academia Brasileira de Ciências Rio de Janeiro, 05 de Maio de 2008

Ciência da Computação Foco na Resolução de Problemas! “Ciência da computação tem tanto a ver com o computador como a Astronomia com o telescópio, a Biologia com o microscópio, ou a Química com os tubos de ensaio.” (Dijkstra) Aspectos de Ciência, Matemática, e Engenharia Grande interdisciplinaridade Se tornando ubíqua!

Computação: Interface Com outras Ciências e Engenharias Matemática E muitos outras... Estatistica Computação Ciência da Informação Biologia Física Relation of CS with other sciences: from Math we use tools on algorithmic analysis and on the other way computing is a tool for example in numerical analysis. Same in the other cases, examples: - bioinformatics vs. biological inspired computing (Bioinformatics uses computation to advance the scientific understanding of living systems. The people in our unit help life scientists use computing tools to make biological research more productive.) - hardware design vs. automatic control software - physics simulation vs. quantum computing (quantum computer is any device for computation that makes direct use of distinctively quantum mechanical phenomena, such as superposition and entanglement, to perform operations on data.) Engenharia Eletrica/ Eletrônica

Ciência da Computação – Grandes Áreas (ACM) Hardware Computer Systems Organization Software Data Theory of Computation Mathematics of Computing Information Systems MODELS AND PRINCIPLES DATABASE MANAGEMENT INFORMATION STORAGE AND RETRIEVAL INFORMATION SYSTEMS APPLICATIONS INFORMATION INTERFACES AND PRESENTATION (e.g., HCI) Computing Methodologies Computer Applications

Ciência da Computação – Grandes Desafios 2006-2016 (Brasil) 1. Gestão da informação em grandes volumes de dados multimídia distribuídos 2. Modelagem computacional de sistemas complexos artificiais, naturais e sócioculturais e da interação homem-natureza 3. Impactos para a área da computação da transição do silício para novas tecnologias 4. Acesso participativo e universal do cidadão brasileiro ao conhecimento 5. Desenvolvimento tecnológico de qualidade: sistemas disponíveis, corretos, seguros, escaláveis, persistentes e ubíquos

Gestão da Informação em Grandes Volumes de Dados Multimídia Distribuídos Problema: Quase tudo que vemos, lemos, ouvimos, escrevemos, medimos é coletado e disponibilizado em sistemas de informação computacionais Captura-se cada vez mais dados da natureza. Como viver, trabalhar, ter lazer e evoluir nesse universo informacional? Como tornar isso um ganho para a sociedade? Objetivo: Desenvolver soluções para o tratamento, a recuperação e a disseminação de informação relevante, a partir de volumes exponencialmente crescentes de várias modalidades de dados, incluindo multimídia

Soluções em Ciência da Computação Algoritmos e estruturas de dados formam o núcleo da ciência da computação Algoritmo Descrição de um padrão de comportamento, expresso em termos de um conjunto finito de ações (Dijkstra, 1971) Implementável como conjuntos de instruções de máquina Manipulam dados Estruturas de Dados Representação organizada dos dados para fins de manipulação eficiente

Foco da Pesquisa Teorias e Métodos para Sistemas de Informação Complexos Bibliotecas Digitais Algoritmos e Métodos para Recuperação de Informação e Bancos de Dados Aprendizado de Máquina

Teorias e Métodos para Sistemas de Informação Complexos Bibliotecas Digitais Sistemas de informação bastante complexos que envolvem coleções de objetos digitais e conjuntos de serviços (e.g., busca, navegação, recomendação) normalmente customizados para uma comunidade alvo.

Teorias e Métodos para Sistemas de Informação Complexos Contribuições Teóricas: Modelo 5S (Streams, Structures, Spaces Scenarios, Societies) 1o. Modelo Teórico-Formal para a área Modelos de Qualidade Ontologias. Contribuições Práticas: Ferramentas de Design: 5SGraph Ferramentas de Geração de Código: 5SL + 5SGen Arcabouços de Componentes: WS-ODL Ferramentas de Aferição de Qualidade: 5SQual

Algoritmos e Métodos para Recuperação de Informação e Bancos de Dados ? Tecnologia Repositório (Web, Bibliotecas Digitais, Bancos de Dados)

Exemplos de Tópicos de Pesquisa Modelos de RI e Técnicas de Busca: Determinam a qualidade da resposta a consultas e formam a base tecnológica do componente principal de qualquer sistema de RI, o processador de consultas

Modelos de RI e Técnicas de Busca CCA (SIGIR 2007) Lazy Associative Ranking (SIGIR 2008)

Modelos de RI e Técnicas de Busca

Exemplos de Tópicos de Pesquisa Modelos de RI para Recuperação de Imagens baseada em Conteúdo Permitem a recuperação de imagens baseadas em seu conteúdo (cor, forma, textura) Problemas: propriedades subjetivas da imagem são muito difíceis de capturar, diferentes percepções para diferentes usuários Solução: combinar diferentes descritores para capturar as diversas propriedades da imagem Descritor: função de extração de características + função de similaridade Abordagem de combinação proposta: programação genética

Exemplos de Tópicos de Pesquisa Modelos de RI para Recuperação de Imagens baseada em Conteudo TORRES, Ricardo da Silva ; FALção, Alexandre X ; GONÇALVES, Marcos André ; Papa, J. P. ; ZHANG, Bãoping ; FAN, Weiguo FOX, Edward A . A Genetic Programming Framework for Content-based Image Retrieval. Pattern Recognition, 2008.

Exemplos de Tópicos de Pesquisa Classificação Automatica de Texto Tarefa de assinalar automaticamente um documento a categorias semânticas pré-definidas Baseada em aprendizado de máquina Coleção de treino para geração de um classificador Mas as características dos documentos podem mudar ao longo do tempo Novas informações são geradas Novos termos são introduzidos Novos campos de conhecimento emergem e grandes campos são divididos em campos mais especializados Dimensão temporal ignorada pelas técnicas atuais de classificação automática de texto

Exemplos de Tópicos de Pesquisa Classificação Automatica de Texto 1o. trabalho a estudar e propor uma metodologia para analisar os fatores temporais em classificação Conclui-se que ganhos de até 20% na performance do classificador podem ser obtidos se esses fatores são isolados Rocha, L. ; Mourão, F. ; GONÇALVES, Marcos André ; MEIRA JR, Wagner . Characterizing and Understanding the Impact of Temporal Evolution on Document Classification. In Proceedings of the First ACM International Conference on Web Search and Data Mining -- WSDM 2008.

Classificação Automatica de Texto

Exemplos de Tópicos de Pesquisa Deduplicação em Bancos de Dados Bancos de Dados podem conter dados replicados devido a: falta de padronização erros na entradas dos dados falta de chaves de identificação, etc. Dados duplicados causam degradação de performance, perda da qualidade da informação, aumento de custos operacionais, etc. Identificação de replicas manual: tarefa cara e custosa Solução proposta: método que usa programação genética para identificar e combinar as melhores evidências para produzir uma função de similaridade que maximiza a performance Identificar o maior número possível de réplicas sem produzir erros Evidência: similaridade entre dois campos do banco de dados

Exemplos de Tópicos de Pesquisa Deduplicação em Bancos de Dados Carvalho, CARVALHO, Moises Gomes de ; LAENDER, Alberto H F ; GONÇALVES, Marcos André ; SILVA, Altigran Soares da . Replica Identification using Genetic Programming. In: ACM Symposium on Applied Computing, 2008, Fortaleza. Proceedings of the 2008 ACM Symposium on Applied Computing.

Agradecimentos CNPq CAPES Fapemig UFMG NSF AOL Alunos de doutorado e de mestrado

?