Consulta a fluxo continuo de dados (“data streaming”)

Slides:



Advertisements
Apresentações semelhantes
INTRODUÇÃO À COMPUTAÇÃO Sistemas Operacionais
Advertisements

Algoritmos Distribuídos
Sistemas distribuídos Metas de Projeto Prof. Diovani Milhorim
Sistemas Distribuídos
Redes de computadores I
Resumo 1.1) Introdução 1.2) Abordagem Convencional de Arquivos
SISTEMAS DE INFORMAÇÃO
Unidades de Execução e de Controle Sistemas Digitais.
CPU – based DoS Attacks Against SIP Servers
Mapeamento Objeto Relacional
Cognitive Wireless Mesh Networks with Dynamic Spectrum Access IEEE Journal on Selected Area in Communication, Jan issue 1 Kaushik R. Chowdhury Ian.
Introdução Redes LAN - abrangência: edifícios e campos.
Sistemas Operacionais Planejamento de Experimento
Avaliação de Desempenho Planejamento de Experimentos 2 Aula 2 Marcos José Santana Regina Helena Carlucci Santana Universidade de São Paulo Instituto de.
Avaliação de Desempenho Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Departamento de Sistemas de Computação Marcos José
Indexação e Hashing Muitas consultas referenciam apenas uma pequena porção dos registros em uma tabela. Portanto necessitamos ser capaz de localizar estes.
Sistemas Distribuídos
Conceitos Básicos Dado: fato do mundo real que está registrado e possui um significado implícito no contexto de um domínio de aplicação Exemplos: endereço,
Simulação de Sistemas Prof. MSc Sofia Mara de Souza AULA2.
ESTRUTURA DE COMUNICAÇÃO DE DADOS
SISTEMAS DISTRIBUÍDOS Princípios e Paradigmas 2ª Edição ANDREW S
Gerência de Redes Áreas Funcionais de Gerenciamento
3 – Projeto Lógico da Rede
Administração de Sistemas de Informação Banco de Dados
Kraemer CCNA Exploration (Protocolos e Conceitos de Roteamento) Protocolos de Roteamento link-state.
Switched Ethernet Fast Ethernet Gigabit Ethernet
REDUNDÂNCIA POR SOFTWARE
Introdução a Banco de Dados com exercícios de aplicação
Maria Tereza Nagel Junho 2004 Grids de Agentes Processadores para Gerência de Redes de Computadores e Telecomunicações Orientador: Prof. Dr. Carlos Becker.
Carlos Eduardo Calvente Ribeiro Universidade Federal do Rio de Janeiro
EEL878 – Redes de Computadores I
Research Directions in Sensor Data Streams: Solutions and Challenges Eduardo Habib B. Maia Daniel Câmara {habib, 2/11/2004 Eiman Elnahrawy.
Sistemas Distribuídos
Redes de Computadores Equipamentos de Redes.
CCNA 1 – Comutação Ethernet
Banco de Dados e Usuários do Banco de Dados (capítulo 1)
Business Intelligence:
MapReduce Conceitos e Aplicações
Carolina Gelenske Carlos Eduardo Laís Xavier
Otimizando sua TI, maximizando seus negócios
BD Distribuído Conceitos Iniciais.
Sistemas Operacionais
Introdução aos Protocolos de Roteamento Dinâmico
Sistemas operacionais
Processos.
Módulo 3 Implantação do IPv6.
Resilient Packet Ring Eudes Raphael de Sá Santana.
Teste.
© 2007 Cisco Systems, Inc. All rights reserved.Cisco Public ITE PC v4.0 Chapter 1 1 RIP versão 1 Protocolos e Conceitos de Roteamento – Capítulo 5.
Protocolo MODBUS [ Slide de Abertura com a presença de outras logomarcas ] A segunda opção é a mais apropriada para a presença de mais de duas marcas.
On Topology Construction in Layered P2P Live Streaming Networks Construção de topologia em redes P2P baseadas em camadas para streaming ao vivo Runzhi.
CONECTIVIDADE Prof.: Alessandro V. Soares Ferreira
IEEE (WLAN) Camada Física João Paulo Martins de França.
MSCC - Introdução Baseado no capítulo 1 do livro Performance Evalution of Computer and Communication Systems, de Jean-Yves Le Boudec (EPFL)
Sumário 1 SQL Embutida 2 Processamento de Consultas
INE5630 Segurança em Computação Distribuída 1 MIP x HIP Um Estudo Sobre Segurança Em Redes Móveis Gino Dornelles Calebe Augusto do Santos Florianópolis,
Sistemas de Arquivos Sistemas Operacionais Profa. Priscila Facciolli
Daniel Paulo Introdução O tempo de resposta de um sistema é determinado pelo tempo que ele leva para retornar aos usuários às.
Transmissão de Dados O Modelo de Referência TCP/IP A Camada de Rede
1 Database Systems, 8 th Edition Sistemas de Banco de Dados: Projeto, Implementação e gestão Oitava Edição Capítulo 2 Modelo de Dados.
Detecção de tráfego Skype na Web através de Redes Neurais Artigo Original: Freire, P. E., Ziviani, A., and Salles, R. M. (2008). Detecting skype flows.
Sistemas Operacionais Multimídia. Sistemas de Arquivos Multimídia Duas abordagens para tratar mídias contínuas em sistemas de arquivos: –1a.: organização.
TÉCNICAS DE ESTIMATIVAS
Banco de Dados Distribuídos Sílvia Cristina de Matos Soares
Comunicação Multimídia. Sub-sistema de Aplicação Computação colaborativa = CSCW Dimensões de colaboração –tempo trabalho cooperativo assíncrono trabalho.
Copyright © 2011 Ramez Elmasri and Shamkant Navathe slide 1 Tópicos  Introdução  Um exemplo  Características da abordagem de banco de dados  Vantagens.
1 Redes de Sensores INE Bancos de Dados II Professor Doutor Renato Fileto.
COMUNICAÇÃO ENTRE OS MÓDULOS PROCESSADORES
CIn-UFPE1 Projeto de Gerenciamento de Dados. CIn-UFPE2 Objetivos n Definir o que significa gerenciamento de dados do sistema; n Entender abordagens diferentes.
Redes de Computadores e Aplicações – Camada de Rede Protocolos de Roteamento dinâmico RIP IGOR ALVES.
Transcrição da apresentação:

Consulta a fluxo continuo de dados (“data streaming”) Banco de Dados Celso Brennand Saulo de Tarso 2006

Roteiro Introdução Redes de Sensores Sem Fio Sensor Stream In-network Storage In-network Aggregation Alternativas para o processamento de consultas em RSSF Acesso Cougar Acesso Fjord Acesso TAG Acesso TinyDB Conclusão

Introdução Consultar fluxos contínuos de dados O que é? Dificuldades Como consultar?

Introdução Caracteristicas Data Streams Dados chegando rapidamente, em intervalos variáveis e com fluxo ilimitado. Dados são melhores modelados como stream’s de dados transientes e não como relações persistentes. SGBD´s tradicionais não foram desenvolvidos para armazenar dados de forma contínua e rápida e não suportam consultas contínuas. Exemplos: Monitoração de redes, redes de sensores, aplicações web, etc.

Introdução Dificuldades Fluxo contínuo de dados. Não existe controle da ordem de chegada de cada elemento a ser processado. Stream de dados tem tamanho ilimitado. Uma vez processado, um elemento é geralmente descartado. Consultas sobre essas stream`s precisam ser processadas quase que em tempo real.

Introdução Trabalhos atuais Necessidades futuras Focam em: redes de sensores Necessidades futuras Mineração de dados on-line Pesquisa e eliminação de ruídos em dados com ruídos Manipulação de dados incompletos

Redes de Sensores Sem Fio RSSFs consistem, tipicamente, em vários sensores (Sensor Stream) que coletam e comunicam, continuamente, seus dados para uma ou mais estações-base. Exemplos: trânsito segurança clima e tempo

Limitações das RSSFs Energia. Largura de banda. Capacidade de processamento. Capacidade de armazenamento. Perda de pacotes . Topologia pode mudar continuamente.

Sensor Stream Sistemas que extraem dados dos sensores permitem que usuários observem, analisem e consultem estes dados. Eficientes em energia Escaláveis Auto-organizáveis e robustos contra falha de nós e mudanças de topologia.

Sensor Stream Prover armazenamento persistente e consultas como um sistema centralizado provê é difícil para uma RSSF. In-network Storage In-network Aggregation

In-network Storage Três formas básicas de armazenamento: Externo: Dados enviados continuamente ao ponto de acesso - custo com transmissão. Local: Dados são armazenados no nó de origem – custo com consulta. Data Centric Storage (DCS): Um nó armazena os dados semelhantes de um conjunto de nós – custo com transmissão e com consulta amenizados.

In-network Aggregation É um mecanismo para reduzir a quantidade total de energia e banda necessárias para processar uma consulta, permitindo que os nós façam agregação intermediária dos dados. Uma consulta é enviada a rede ou a uma área específica, e a resposta pode ser roteada por uma árvore onde é possível realizar a agregação de dados.

In-network Aggregation - Vantagens Redução do número de pacotes enviados pela rede. Redução da probabilidade de colisão de pacotes. Redução de dados redundantes recebidos no ponto de acesso.

Roteamento Abordagem centrada no endereço: Abordagem centrada em dados Encontrar rotas curtas entre pares de nós endereçáveis. Abordagem centrada em dados Encontrar rotas de múltiplos nós para um único destino que permita a agregação de dados redundantes dentro da rede.

Roteamento

Métrica de Custos Métrica tradicionais não se aplicam a streams como acesso a disco. Métricas mais apropriadas são: exatidão e atraso do uso da memória Taxa de banda consumo de energia

Alternativas para o processamento de consultas em RSSF Acesso Cougar Acesso Fjord Acesso TAG Acesso TinyDB

Acesso Cougar As consultas envolvem dois tipos de dados: dados armazenados e os dados do sensor. As consultas possuem um tempo de validação: timestamp (tempo discreto ou tempo compartilhado). Dados são constantemente alterados (em tempo de execução das consultas). Persistência = as atualizações são feitas na ordem crescente e a álgebra usada não for modificada (seqüência das operações relacionais).

Acesso Cougar Utilização de tipos de dados abstratos (ADT). Um sensor ADT é definido para todos os sensores de um mesmo tipo. As consultas são processadas em uma base de dados centralizada. Mecanismo de interação com os nós do sensor, emitindo o resultado ao front-end.

Acesso Cougar Utilização de uma Relação Virtual. Uma relação virtual é uma representação tabular de um método. Sempre que existe um resultado um novo registro é adicionado à relação. Um relacional virtual é dividido através de todos os sensores do mesmo sensor ADT.

Acesso Fjord Permitem consultas que combine streaming de dados e dados da fonte padrão. Possuem operadores proxies do sensor (mediadores entre o processador de consultas e os sensores físicos). Proxy evita desperdício de energia e tempo. (Consultas são aceitas pelos sensores pertinentes). O proxy controla continuamente o sensor, mesmo não existindo consultas.

Acesso Fjord Outras funções do proxy: Ajusta a taxa de amostra dependendo da necessidade (podendo desligar o sensor caso necessário). Refinamento da consulta (Intervalos setado ao sensor). Os fjord são os outros componentes desse tipo de acesso. Suporta combinação de streaming de dados e dados conservado no disco. Utiliza filas de pull e push. Para cada nova consulta é alocado um novo fjord.

Acesso TAG Oferece serviços distribuídos de agregação para redes ad hoc com uma pequena parte do TinyOS (Pequeno sistema de chamadas). Os usuários realizam suas consultas agregadas em uma basestation poderosa com recursos em abundancia. Resultados de dados na árvore de distribuição. Os nós agregam os dados produzidos localmente com os dados recebidos de outros nós.

Acesso TAG Árvore de Distribuição: Periodicamente se auto-organiza, verificando se cada nó esta ajustado ao nível certo. (ajuste, ID da mensagem mais um). A comunicação entre o nó e a raiz é feita periodicamente, a fim de localizar possíveis falhas (Comunicação feita através dos pais).

< z >= f (< x >,< y >) Acesso TAG O TAG implementa qualquer agregação através de três funções: f função de união. i inicializador. e avaliador. < z >= f (< x >,< y >) Onde < x > e < y > são valores parciais multivalorados do estado sobre um ou mais valores do sensor.

Acesso TAG A execução de uma consulta é um processo bifásico. Uma fase de distribuição para todos os nós. Uma fase de coleta de dados, onde os filhos transmitem para seus pais. O tempo é subdividido em épocas. A vantagem principal do TAG comparada ao acesso centralizada é redução da comunicação necessária.

Acesso TAG O TAG também possui outros benefícios: O TAG tolera desconexões e perda. O fato que o tempo está dividido nas épocas permite saber quando o processador é inativo.

Acesso TinyDB Representa o modelo mais atual de processador de consultas. É um processador de consultas distribuído, de forma a agir em cada nó independente em uma rede de sensores. Usar a habilidade de sensores espertos de controlar onde, quando e como os dados são adquiridos frequentemente a fim reduzir o consumo de potência. Possui muitas características de processadores tradicionais de consultas (seleções, projeções, junções e agregação de dados).

Acesso TinyDB Possui uma tabela “sensors” com uma coluna diferente para cada sensor físico da rede. A tabela possui o ID do sensor, a posição do nó (local físico), a época de amostrageme a leitura. A arquitetura básica: As consultas são submetidas a basestation. A consulta é otimizada. Cada nó contem Metadados associado a seus atributos, eventos e predicados definidos pelo usuário.

Acesso TinyDB TinyDB adota a execução das agregações através de três funções que inicializam, fundem e atualizam o valor final de registros parciais. Cada nó emite periodicamente uma cópia de seu próprio catálogo ao basestation onde é usado pelo otimizador. O TinyDB tem suporte a consultas baseadas em eventos.

Acesso TinyDB Os nós pais verificam se os nós filhos são capazes de realizar a consulta, a fim de evitar desperdício de energia. O tempo também é subdividido em épocas. Os nós dormem a maioria das épocas, acordando quando necessário. TinyDB estende o acesso TAG. A cada nova consulta apenas os nós que possuem dados úteis são alocados.

Conclusões Formas mais acessíveis aos fluxo contínuo de dados foram demonstrados. Vários problemas e limitações das redes de sensores foram levantados e enfatizados, como também no seus processamentos de consultas. Foi dado uma visão geral da pesquisa em armazenamento e consulta de dados em redes de sensores e em streams.

Referência State of the Art and Future Directions in Wireless Sensor Network’s Data Management Project: Management of Data in Wireless Sensor Networks (MaD-WiSe) G. Amato, A. Caruso, S. Chessa, V. Masi and A. Urpi. Fjording the Stream: An Architecture for Queries over Streaming Sensor Data Samuel Madden and Michael J. Franklin. TAG: a Tiny AGgregation Service for Ad-Hoc Sensor Networks Samuel Madden, Michael J.Franklin, and Joseph M. Hellerstein Wei Hong, 5th Annual Symposium on Operating Systems Design and Implementation (OSDI). December, 2002. Processamento de Consultas para Fluxo Contínios de Dados: Perkusich, M. L. et al, VII SBAI/ II IEEE LARS. São Luís. Setember, 2002.