Algoritmos: Teoria e Engenharia

Slides:



Advertisements
Apresentações semelhantes
Medidas de Avaliação de Sistemas de Recuperação de Informação
Advertisements

Operações sobre o Texto
Inteligência Artificial - IA
Inteligência Artificial
Organização de Computadores I
Introdução à Ciência da Computação Linguagens de Programação.
Tecnologia da Informação para Valor de Negócio
INTELIGÊNGIA COMPUTACIONAL
Introdução à Programação uma Abordagem Funcional Programação I Prof.ª Claudia Boeres CT VII - Sala 32 Departamento de Informática Centro.
Propriedades de Documentos
CONTEÚDO PROGRAMÁTICO
Ronaldo Gilberto de Oliveira
Compressão de Dados ORI Ednaldo Pizzolato.
Faculdade de Ciências Sociais de Aplicadas de Petrolina – FACAPE
Aldilene Silva Célia Regina Daniela Alencar Maria do Socorro
Sistemas Baseados em Conhecimento
A Review of Algorithms for Audio Fingerprinting
Avaliação de Desempenho Planejamento de Experimentos 2 Aula 2 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de.
Avaliação de Desempenho Planejamento de Experimentos 1
Avaliação de Desempenho
Avaliação de Desempenho Introdução Aula 1 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de Ciências Matemáticas.
FACENS – Engenharia da Computação Lógica Computacional II
Estruturas de Dados e Complexidade de Algoritmos
00(c) 2007 Gustavo Motta1 Introdução ao -calculus Prof. Gustavo Motta Departamento de Informática/UFPB.
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
I – Informação Digital Escola Politécnica da USP MBA EPUSP em Gestão e Engenharia do Produto EP018 O Produto Internet e suas Aplicações Tecnologias de.
Problemas NP-completo
TEORIA DAS RESTRIÇÕES Prof Samir Silveira.
Gestão da Informação em Grandes Repositórios de Dados Multimidia Marcos André Gonçalves Professor Adjunto Departamento de Ciência da Computação Universidade.
Pontifícia Universidade Católica de Campinas
Informática Teórica Engenharia da Computação
Aprendizado de Máquina Aula 8
Inteligência Artificial
Informática Teórica Engenharia da Computação
Monitoria de Introdução à Computação
Aprendizagem de Máquina - Agrupamento
Processamento Digital de Imagens
Compressão de Textos Juliano Palmieri Lage.
Treinamento do Microsoft® Access® 2010
Problemas de Otimização
Algorítmos e estrutura de dados III
IB 1 Introdução à Computação Apresentação do curso Fonte: Prof: Joseana Macedo Fachine na01.ppt.
Alexis Adriano da Silva Vitek Consultoria Ltda.
Sistemas de Apoio à DecisãoMárcio MoreiraUnidade 5 – Decisões Não Estruturadas – Recuperação de Informações – Slide 1 5Decisões Não Estruturadas 5.1Recuperação.
Inteligência Artificial Aplicada a Problemas de Tomada de Decisão
Algoritmos 1º Semestre Materia: Informática Profº: Cristiano.
ÍNDICES DE CARGA E DE DESEMPENHO SSC-642 SISTEMAS COMPUTACIONAIS DISTRIBUÍDOS.
Aula 6 - Método não-experimental ou de seleção não-aleatória
Complexidade computacional
Geração de Código aula-12-geração-de-código.pdf.
Experimentação Algorítmica
Sistemas Operacionais
Graphics Interchange Format formato para intercâmbio de gráficos
Problemas NP-completos e Programação Dinâmica
Complexidade de Computação Katia Guimarães. Avaliando a Qualidade de um Algoritmo É preciso ter bem definido –O que é dado de entrada e –O que é esperado.
On The Complexity of Determining Autonomic Policy Constrained Behaviour Sobre a Complexidade de Determinação de Política Autônoma de Comportamento Restrito.
Seleção do Processo de Usinagem
Analise de Algoritmos e Notação Assintótica
Análise e Síntese de Algoritmos Algoritmos GreedyCLRS, Cap. 16.
 São métodos formais de tornar disponíveis para a administração, quando oportuno, as informações necessárias para facilitar o processo de tomada de decisão.
Algoritmos e Programação I
Técnicas de Compressão de Dados
Escola Politécnica da USP abril de 2013 PTC 2550 – Redes de Comunicação De Dados e P1 Transporte Multimídia PTC 2550 – Redes de Comunicação De Dados e.
PSI2653: Meios Eletrônicos Interativos I I – Informação Digital Escola Politécnica da USP Engenharia de Sistemas Eletrônicos Meios Eletrônicos Interativos.
INTRODUÇÃO THOBER CORADI DETOFENO, MSC. Aula 01 JOINVILLE 2015 Universidade do Estado de Santa Catarina – CCT/UDESC.
S I S T E M A S M U L T I M Í D I A Prof. Welington Fraga Rizo.
Taís Sineiro Herig Laboratório de Genômica e Expressão / UNICAMP
Sistemas Multimídia Distribuídos Projeto Carlos A. G. Ferraz
Disciplina: Estrutura de dados e Algoritmos Docentes: MSc. Manuel Zunguze.
Transcrição da apresentação:

Algoritmos: Teoria e Engenharia Eduardo Sany Laber Departamento de Informática PUC-RIO Agradecer convite

O Computador Impacto na sociedade Permite armazenar e processar uma quantidade enorme de dados Impacto gigantesco em diversos ramos da ciência

Ciência da Computação Quais problemas podem ser resolvidos com o auxílio de um computador ? Modelo formal de um computador (Turing, Church, década de 30) Existem problemas que não podem ser resolvidos por um computador (Turing, Church, década de 30) David Hilbert (1928)

Ciência da Computação Quais problemas podem ser resolvidos eficientemente com o auxílio de um computador ? Teoria da complexidade computacional (Cook, Levin e Karp, anos 70) Fortes evidências que milhares de problemas de diversas áreas do conhecimento são intratáveis computacionalmente

Minha Pesquisa Projetar e analisar algoritmos e técnicas algorítmicas para problemas relevantes que emergem em diferentes áreas do conhecimento

Minha Pesquisa Compressão de Dados Sistemas de Diagnóstico Tratamento de Informações em Grandes Coleções de Dados Transporte em oleodutos Desenho de Leilões

Compressão de Dados Aplicações Transmissão de dados Compressor Dado Original Dado Comprimido Aplicações Transmissão de dados Armazenamento de diferentes mídias: som, imagem, texto e vídeo (gzip,jpeg,mp3) Melhorar figura

Compressão de Dados Tamanho original 769 Kb Dado Comprimido 49 kb

Compressão de Dados Códigos de Huffman Técnica fundamental para compressão de dados Utilizado em compressão sem perda (texto) e em compressão com perda (som, imagem e vídeos)

Compressão de Dados Códigos de Huffman Associa caracteres mais (menos) frequentes a códigos com menos (mais) bits ASCII A 1000001 B 1000010 . Z 1000110 Huffman A 100 B 110001 . Z 1010110010

Compressão de Dados Códigos de Huffman com restrição de comprimento Limitam o tamanho da maior sequência de bits atribuída a um símbolo Permitem decodificações mais rápidas Códigos de Huffman dinâmicos Permitem codificar dados de forma online Fundamental em transmissão de dados

Compressão de Dados Contribuições Algoritmos eficientes para construir códigos de Huffman com restrição de comprimento. aumenta sensivelmente a velocidade de decodificação Prova de que restringir o comprimento produz uma perda de compressão muito pequena.

Compressão de Dados Contribuições Análise da taxa de compressão de códigos de Huffman dinâmicos Prova da conjectura de J. Vitter (JACM) sobre a taxa de compressão dos códigos de Huffman dinâmicos Perda de compressão é de no máximo 2 bits/símbolo

Compressão de Dados Principais Publicações Prêmio Siam Journal on Computing Journal of Algorithms Algorithmica IEEE Transactions on Information Theory IEEE Data Compression Conference Prêmio Primeiro prêmio no concurso de teses de doutorado da Sociedade Brasileira de Computação 2000

Sistemas de Diagnósticos O paciente tem uma doença Y? Se teste HB1 e (OU TAC > 70% E histórico familiar ) (OU biopsia E pressão alta ) (OU MRI negativo E teste XK2 positivo ) Então Sim Diagnóstico depende de um conjunto de diferentes exames com diferentes custos de realização

Sistemas de Diagnósticos Como obter o diagnóstico correto com o menor custo possível ?

Sistemas de Diagnósticos Framework Entrada Diagnóstico/função f sobre variáveis x1,...,xn Vetor de custos c=(c(x1),,... c(xn)), que define o custo de obter a informação associada a cada variável Objetivo Projetar métodos que permitam determinar o valor da função f gastando o mínimo possível com a aquisição de informações

Sistemas de Diagnósticos Outras Aplicações Planejamento estratégico Decisão sobre investimento em projeto depende de uma série de informações que têm diferentes custos de aquisição Jogos para computadores Otimização de consultas em Banco de Dados

Sistemas de Diagnósticos Contribuições Metodologia baseada em programação linear que permite projetar e analisar algoritmos eficientes para minimizar o custo de computar diagnósticos Caracterização da solução ótima para importantes classes de diagnósticos/funções (e.g. funções booleanas monótonas)

Sistemas de Diagnósticos Principais Publicações ACM Symposium on Theory of Computing ACM-SIAM Symposium on Discrete Algorithms European Symposium on Algorithms ICALP Journal of ACM (submetido)

Tratamento de Informações em Grandes Coleções de Dados (WWW) World Wide Web (WWW) Conteúdo altamente dinâmico Usuários com diversos interesses Dados poucos estruturados Diferentes formatos Como encontrar informações de interesse ?

Tratamento de Informações em Grandes Coleções de Dados (WWW) Como encontrar informações de interesse ? Taxonomias ( Yahoo!, ODP) Bastante populares no final da década de 90 Motores de Busca (MSN,Google,Yahoo!) Bastante populares atualmente

Tratamento de Informações em Grandes Coleções de Dados (WWW) Política Economia Esportes Taxonomia Basquete Futebol Tênis Informação Brasil Mundo Informação Seleção Brasileira Clubes Informação Informação Informação Informação Informação

Tratamento de Informações em Grandes Coleções de Dados (WWW) Como otimizar a taxonomia de modo a minimizar o tempo médio de acesso do usuário a informação desejada ?

Tratamento de Informações em Grandes Coleções de Dados (WWW) Clubes de Futebol Política Economia Esportes Basquete Futebol Tênis Informação Brasil Mundo Informação Seleção Brasileira Clubes Informação Informação Informação Informação Informação

Tratamento de Informações em Grandes Coleções de Dados (WWW) Contribuições Métodos que permitem adicionar poucos links por página e minimizar sensivelmente o tempo de acesso do usuário a informação desejada Melhores métodos existentes Redução estimada de 19% no tempo de acesso a informações no site da PUC-RIO utilizando um link extra por web page

Tratamento de Informações em Grandes Coleções de Dados (WWW) Principais Publicações ACM Transactions on Information Systems ISAAC ALENEX

Tratamento de Informações em Grandes Coleções de Dados (WWW) Motores de Busca Consumidores de Conteúdo Criadores de Conteúdo

Tratamento de Informações em Grandes Coleções de Dados (WWW) Motores de busca Selecionam páginas relacionadas com a consulta do usuário Ordenam as páginas selecionadas segundo algum critério de relevância

Tratamento de Informações em Grandes Coleções de Dados (WWW)

Tratamento de Informações em Grandes Coleções de Dados (WWW) Contribuições Novas métricas para o problema de extração de detecção de conteúdo relevante Métodos para extração automática de conteúdo relevante Transferência Tecnológica

Tratamento de Informações em Grandes Coleções de Dados (WWW) Quantidade significativa de conteúdo ‘não relevante ‘ Estima-se que o volume deste conteúdo represente entre 40% e 50% do volume total da Web. A remoção de conteúdo não relevante melhora a qualidade de tarefas importantes realizadas por máquinas de busca: detecção de páginas e ranking