A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Bancos de Dados Distribuídos Página 1 Bancos de Dados Distribuídos Alcides Calsavara.

Apresentações semelhantes


Apresentação em tema: "Bancos de Dados Distribuídos Página 1 Bancos de Dados Distribuídos Alcides Calsavara."— Transcrição da apresentação:

1 Bancos de Dados Distribuídos Página 1 Bancos de Dados Distribuídos Alcides Calsavara

2 Bancos de Dados Distribuídos Página 2 Bancos de Dados Distribuídos o Introdução o Arquitetura de SGBD Distribuídos o Projeto de Banco de Dados Distribuído o Controle Semântico de Dados o Processamento de Consulta Distribuído o Gerenciamento de Transação Distribuída o Sistemas Operacionais de Banco de Dados Distribuído o Sistemas Abertos e Interoperabilidade o Sistemas de Banco de Dados Paralelos o Gerenciamento de Objeto Distribuído o Observações Finais

3 Bancos de Dados Distribuídos Página 3 Motivação Tecnologia de Banco de Dados Rede de Computadores integraçãodistribuição integração integração distribuição Sistemas de Banco de Dados Distribuído

4 Bancos de Dados Distribuídos Página 4 O que é um Banco de Dados Distribuído ? Um Banco de Dados Distribuído (B.D.D.) é uma coleção de múltiplos, logicamente interrelacionados Bancos de Dados, distribuídos por uma rede de computadores. Um S.G.B.D.D. é um software que gerencia o B.D.D. e que provê um mecanismo de acesso que torna esta distribuição transparente para o usuário.

5 Bancos de Dados Distribuídos Página 5 SGBD Centralizado em uma Rede Rede de Comunicação Site 5 Site 1 Site 2 Site 3 Site 4

6 Bancos de Dados Distribuídos Página 6 Ambiente de SGBD Distribuído Rede de Comunicação Site 5 Site 1 Site 2 Site 3 Site 4

7 Bancos de Dados Distribuídos Página 7 Suposições Implícitas Dados armazenados em vários sites ï cada site logicamente consiste de um único processador. Dados processados em diferentes sites são interconectados por uma rede de computadores ï não há multiprocessadores à sistemas de Banco de Dados Paralelos Banco de Dados Distribuído é um Banco de Dados, não uma coleção de arquivos ï dados logicamente relacionados à modelo de dados relacional n SGBDD é um SGBD full-fledged (completo)

8 Bancos de Dados Distribuídos Página 8 n Industriais - especialmente indústrias com várias filiais n Controle e Comando Militar n Empresas Aéreas n Redes de Hoteis n Qualquer organização que tenha uma estrutura descentralizada Aplicações

9 Bancos de Dados Distribuídos Página 9 n Autonomia local n Melhora de desempenho n Melhora de integridade/eficácia n Economia n Expansibilidade n Compartilhamento Vantagens do SGBDD

10 Bancos de Dados Distribuídos Página 10 n Complexidade n Custo n Controle da distribuição n Falta de experiência Desvantagens do SGBDD

11 Bancos de Dados Distribuídos Página 11 As Regras de Date de um SGBDD n Autonomia local n Independência de um local central n Operação contínua n Independência de localização n Independência de fragmentação n Independência de replicação

12 Bancos de Dados Distribuídos Página 12 As Regras de Date de um SGBDD n Processamento de consultas distribuídas n Gerência de transações distribuídas n Independência de hardware n Independência de sistema operacional n Independência de rede n Independência de banco de dados

13 Bancos de Dados Distribuídos Página 13 Questões sobre um SGBDD n Projeto de Banco de Dados Distribuído à Como distribuir o banco de dados? à Distribuição com replicação ou não? à Como gerenciar a distribuição? Processamento de Consultas à converter transações de usuário (SQL) para instruções de manipulação de dados (acesso a tabelas) à problema de otimização à mínimo custo = transmissão de dado + processamento local à a formulação geral é um problema NP-completo

14 Bancos de Dados Distribuídos Página 14 Questões sobre um SGBDD Controle de Concorrência à sincronização de acesso concorrente à consistência e isolamento dos efeitos de transações à gerenciamento de deadlock n Confiabilidade à Como fazer o sistema recuperar de falhas? à atomicidade e persistência

15 Bancos de Dados Distribuídos Página 15 Relacionamento entre as Questões Gerenciamento da Distribuição Confiabilidade Gerenciamento de Deadlock Controle de Concorrência Projeto da Distribuição Processamento de Consulta

16 Bancos de Dados Distribuídos Página 16 n Suporte do sistema operacional à sistema operacional com suporte próprio para operações de banco de dados distribuídos à dicotomia entre as necessidades de processamento de âmbito geral e de banco de dados n Sistemas Abertos e Interoperabilidade à Sistemas distribuídos e homogêneos: Multidatabases à Questões de Paralelismo Questões Relacionadas

17 Bancos de Dados Distribuídos Página 17 Promessas de um SGBDD ¶ Gerenciamento transparente de dados distribuídos, fragmentados e/ou replicados · Melhora de integridade/eficácia através de transações distribuídas ¸ Melhora de desempenho ¹ Expansão de sistemas de forma mais fácil e econômica

18 Bancos de Dados Distribuídos Página 18 Suporte de Transparência n Sem considerar a replicação n Geralmente sem fragmentação à Fragmentação horizontal pode ocorrer n Transparência da distribuição limitada à especificação de caminho à aliasing à acesso remoto a um SGBD n Maioria dos sistemas possuem vários clientes e apenas um servidor

19 Bancos de Dados Distribuídos Página 19 Desempenho Potencialmente Melhorado n Proximidade dos dados dos sites de uso à Necessita algum suporte para fragmentação e replicação n Paralelismo na execução à Paralelismo entre consulta à Paralelismo na consulta

20 Bancos de Dados Distribuídos Página 20 Necessidades de Paralelismo Muitos dos dados que cada aplicação necessita estão nos sites onde ela executa à Replicação total n E quanto às atualizações ? à Atualizações de dados replicados necessitam de implementação de controle de concorrência distribuída e protocolos de commit

21 Bancos de Dados Distribuídos Página 21 Alternativas de Sistemas Comerciais n Multiplex de tempo entre leitura e atualização à Banco de dados aberto para a leitura durante um tempo regular determinado; executa atualizações ao final deste tempo à Alguns sistemas bancários trabalham desta maneira n Multiplex de banco de dados à Banco de dados de consulta. à Banco de dados de produção

22 Bancos de Dados Distribuídos Página 22 Expansão do Sistema n Questão de escalabilidade do banco de dados n Tecnologias de microprocessadores e estações de trabalho ( workstation ) à Processamento no modelo Cliente-Servidor

23 Bancos de Dados Distribuídos Página 23 Objetivo Fundamental da Transparência Prover independência de dados no ambiente distribuído à Transparência da rede (distribuição) à Transparência da replicação à Transparência da fragmentação

24 Bancos de Dados Distribuídos Página 24 n Imunidade das aplicações do usuário para mudanças na definição e/ou organização dos dados e vice-versa. à Independência lógica de dado u Imunidade das aplicações do usuário para mudanças na estrutura lógica do banco de dados. u A definição da estrutura (schema) do banco de dados pode mudar sem afetar as aplicações do usuário. u Por exemplo, adição de novos atributos em uma relação, a criação de novas relações, reordenação lógica de atributos. à Independência física de dados u Esconde os detalhes da estrutura de armazenamento das aplicações do usuário. u Descrição física dos dados pode mudar sem afetar as aplicações do usuário. u Por exemplo, dados podem ser movidos (trocados) de um volume de disco para outro; a organização dos dados pode mudar. Independência de Dados

25 Bancos de Dados Distribuídos Página 25 n A existência da rede não deve ser notada pelas aplicações do usuário. n Requer duas coisas: à Transparência de acesso u O comando que é usado é independente do local onde está o dado e do local onde a operação será realizada. u Exemplo: Deve haver uma única operação para abrir tanto um banco de dados local como um banco de dados remoto. à Transparência de localização u Provendo um nome único para cada objeto no sistema distribuído. u Não embutir informações de localização nos nomes. u Exemplo: Os nomes dos bancos de dados e das suas tabelas não devem conter indicações de nomes de computadores na rede. Transparência de Rede

26 Bancos de Dados Distribuídos Página 26 n Se existem réplicas de objetos (relações/tabelas, tuplas/registros, atributos/colunas) do banco de dados, sua existência deve ser controlada pelo sistema e não pelo usuário. n Tradeoff: à Se o usuário está ciente da existência de réplicas e é responsável pelo seu gerenciamento, então o sistema tem que fazer um trabalho mínimo e o desempenho pode ser melhor. Transparência de Replicação

27 Bancos de Dados Distribuídos Página 27 n Se relações/tabelas do banco de dados são fragmentadas, então o sistema tem que lidar com a conversão de consultas do usuário definidas em relações globais para consultas definidas em fragmentos. n Tradução de consultas globais para consultas de fragmento e colocação de fragmentos juntos em uma resposta. Transparência de Fragmentação

28 Bancos de Dados Distribuídos Página 28 Acesso Transparente SELECT ENAME,SAL FROM E,G,S WHERE DUR > 12 AND E.ENO = G.ENO AND E.TITLE = S.TITLE Boston Communication Network Montreal Paris New York Boston projects Boston employees Boston assignments Paris projects Paris employees Paris assignments Boston employees Montreal projects Paris projects New York projects Montreal employees Montreal assignments Boston projects New York employees New York projects New York assignments Tokyo G - projects: projetos E - employees: empregados S - assignments: tarefas

29 Bancos de Dados Distribuídos Página 29 Visão Interna Esquema Externo Esquema Conceitual Esquema Interno Visão do usuário individual Visão do conjunto de usuários Visão do armazenamento Visão conceitual Visão externa Visão externa Visão externa Arquitetura ANSI/SPARC Study Group on Data Management Systems - Relatório Interno/1975

30 Bancos de Dados Distribuídos Página 30 Arquitetura ANSI/SPARC Nível Conceitual MineralVegetalAnimal Reinos Naturais Primários Acessórios Secundários 1 n n n 1 Mamíferos PrimatasCetáceos

31 Bancos de Dados Distribuídos Página 31 Arquitetura ANSI/SPARC Nível Externo MineralVegetalAnimal Reinos Naturais Biólogo BotânicoZoólogoGeólogo

32 Bancos de Dados Distribuídos Página 32 Arquitetura ANSI/SPARC Nível Interno Reino Animal : Mamíferos/Primatas/Homo Pitecantropo Rodesiano Homem Solo Neandertal Mongolóides Africanos Eurasianos

33 Bancos de Dados Distribuídos Página 33 Arquitetura ANSI/SPARC Nível Interno Reino Animal : Mamíferos/Primatas/Homo Neandertal Mongolóides Africanos Eurasianos Altura Peso Alimentação Organização Longevidade Ferramentas...

34 Bancos de Dados Distribuídos Página 34 Dimensões do Problema n Distribuição à Se os componentes do sistema estão localizados na mesma máquina ou não n Heterogeneidade à Diferentes níveis: hardware, comunicação, sistema operacional, SGBD à SGBD: u modelo de dados, linguagem de consulta, algoritmos de gerenciamento de transações,... n Autonomia à Autonomia de projeto: Habilidade de um componente do SGBD decidir sobre questões relacionadas com seu próprio projeto. à Autonomia de comunicação: Habilidade de um componente do SGBD decidir como comunicar-se com outros SGBDs. à Autonomia de execução: Habilidade de um componente do SGBD executar operações locais da maneira que ele desejar.

35 Bancos de Dados Distribuídos Página 35 Alternativas de Implementação do DBMS Distribuição Heterogeneidade Autonomia Distributed homogeneous DBMS Distributed, homogeneous, federated DBMS Distributed, homogeneous, multi-DBMS Logically integrated and homogeneous multiple DBMSs Distributed heterogeneous DBMS Distributed heterogeneous federated DBMS Heterogeneous integrated DBMS Single site heterogeneous federated DBMS Heterogeneous multi-DBMS Distributed heterogeneous multi-DBMS Multi-DBMS Homogeneous federated DBMS

36 Bancos de Dados Distribuídos Página 36 Acesso de Tempo Compartilhado a um Banco de Dados Centralizado Sem memória Host (servidor) executando todos os softwares Communications DBMS Services Rede Terminais ou PCs emulando terminais Solicitações Batch Respostas Application Software Database

37 Bancos de Dados Distribuídos Página 37 Multiplos Clientes/Único servidor Rede Communications Client Services ApplicationsCommunications DBMS Services Solicitações de alto-nível Somente dados filtrados Communications Client Services Applications Communications Client Services Applications Database

38 Bancos de Dados Distribuídos Página 38 Vantagens da Arquitetura Cliente-Servidor n Divisão do trabalho mais eficiente n Escalabilidade dos recursos n Melhor preço/performance nas máquinas clientes n Habilidade de usar ferramentas familiares nas máquinas clientes n Acessos de clientes a dados remotos (via padrões, como ODBC) n Toda funcionalidade do SGBD oferecida às máquinas clientes n Acima de tudo, melhor preços/performance dos sistemas

39 Bancos de Dados Distribuídos Página 39 Problemas com Múltiplos- Clientes/Único Servidor n Congestionamento no servidor n Único ponto de falha no servidor n Difícil escalabilidade no servidor

40 Bancos de Dados Distribuídos Página 40 Múltiplos Clientes/Múltiplos Servidores n diretórios n caching n decomposição de consultas n protocolos de commit Communications Client Services Applications Rede Communications DBMS Services Database Communications DBMS Services Database

41 Bancos de Dados Distribuídos Página 41 Problemas no Design n Na montagem geral: Tomar decisões sobre a disposição dos dados e programas através de sites de uma rede de computadores, bem como possivelmente desenhar a própria rede em si. n Num SGBD distribuído, a disposição de vínculos das aplicações à disposição do software do SGBD distribuído à disposição das aplicações que executam no B.D.

42 Bancos de Dados Distribuídos Página 42 Design da Distribuição n De cima para baixo (Top-Down) à principalmente ao desenhar sistemas a partir do nada à principalmente em sistemas homogêneos n De baixo para cima (Bottom-Up) à Quando os Bancos de Dados já existem em um número de sites

43 Bancos de Dados Distribuídos Página 43 Arquitetura de um SGBD Distribuído n ES : External Schema n GCS : Global Conceptual Schema n LCS : Local Conceptual Schema n LIS : Local Internal Schema

44 Bancos de Dados Distribuídos Página 44 Lógica de Dados numa Arquitetura de um SGBD Distribuído... ES 1 ES 2 ES n GCS LCS 1 LCS 2 LCS n LIS 1 LIS 2 LIS n

45 Bancos de Dados Distribuídos Página 45 Top-Down Design Análise das Necessidades Input do Usuário Integração da Visão Input do Usuário Objetivos Design Conceitual Design da Visão Informação de Acesso ESsGCS Design da Distribuição Design Físico LCSs LISs

46 Bancos de Dados Distribuídos Página 46 Questões de Design de Distribuição ¶ Por que fragmentar afinal ? · Como fragmentar ? ¸ O quanto fragmentar ? ¹ Como testar exatidão ? º Como alocar ? » Necessidades de informação ?

47 Bancos de Dados Distribuídos Página 47 Alternativas de Fragmentação - Horizontal J 1 :projetos com orçamentos inferiores a $200,000 J 2 :projetos com orçamentos maiores ou iguais a $200,000 J JNOJNAMEBUDGETLOC J1Instrumentação150000Montreal J3CAD/CAM250000New York J2Desenvolv.do B.D New York J4Manutenção310000Paris J5CAD/CAM500000Boston J1J1 JNOJNAMEBUDGET LOC J3CAD/CAM250000New York J4Manutenção310000Paris J5CAD/CAM500000Boston JNOJNAME LOC J1Instrumentação150000Montreal J2Desenv. do B.D New York BUDGET J2J2

48 Bancos de Dados Distribuídos Página 48 Alternativas de Fragmentação - Vertical J 1 :informações sobre orçamentos de projetos J 2 :informações sobre nomes e localidades de projetos JNOJNAMEBUDGETLOC J1Instrumentação150000Montreal J3CAD/CAM250000New York J2Desenv. do B.D New York J4Manutenção310000Paris J5CAD/CAM500000Boston J JNOBUDGET J J J J J JNOJNAMELOC J1InstrumentaçãoMontreal J3CAD/CAMNew York J2Desenv. do B.D.New York J4ManutençãoParis J5CAD/CAMBoston J1J1 J2J2

49 Bancos de Dados Distribuídos Página 49 n Completitude ( Completeness ) à Decomposição da relação R em fragmentos R 1, R 2,..., R n está completa se e somemte se cada item de dado em R puder ser encontrado em algum R i n Reconstrução Se a relação R for decomposta em fragmentos R 1, R 2,..., R n, então deverá existir algum operador relacional tal que R = 1 i n R i n Disjunção Se a relação R for decomposta em fragmentos R 1, R 2,..., R n, e o item de dado d i estiver em R j, então d i não deveria estar em qualquer outro fragmento R k ( k j ). Exatidão da Fragmentação

50 Bancos de Dados Distribuídos Página 50 Grau de Fragmentação Encontrando o nível adequado de particionamento dentro desta extensão tuplas ou atributos relações Número finito de alternativas

51 Bancos de Dados Distribuídos Página 51 Fragmentação n Não podemos apenas distribuir relações ? n O que é uma unidade de distribuição razoável ? à relação visões são subconjuntos de relações ê localidade u comunicação extra à fragmentos de relações (sub-relações) u execução concorrente de um número de transações que acessam diferentes partes da relação u visões que não podem ser definidas num simples fragmento irão requerer processamento extra u controle de dados semânticos (especialmente esforço de integridade) mais difícil

52 Bancos de Dados Distribuídos Página 52 Alternativas de Alocação n Não-replicada à particionada: cada fragmento reside somente em um site n Replicada à totalmente replicada: cada fragmento em cada site à parcialmente replicada: cada fragmento em alguns dos sites n Regra prática: Se replicação é vantajosa, em caso contrário a replicação pode causar problemas read - only queries update queries 1

53 Bancos de Dados Distribuídos Página 53 Processamento de Consulta Consultas em linguagem de alto nível (SQL) processador de consulta comandos de manipulação de dados em linguagem de baixo nível

54 Bancos de Dados Distribuídos Página 54 Componentes de Processamento de Consulta n A linguagem de consulta que é normalmente utilizada à SQL: linguagem de dados intergalática n Metodologia de execução de consulta à As etapas que se atravessa na execução de consultas de alto- nível (declarativas) do usuário. n Otimização de consulta à Como se determina o melhor plano de execução?

55 Bancos de Dados Distribuídos Página 55 Minimizar uma função de custo Custo de E/S + custo de UCP + custo de comunicação Podem ter pesos diferentes em diferentes ambientes distribuídos WAN - Redes Remotas à o custo de comunicação é dominante u baixa largura de faixa u baixa velocidade u protocolo com alto overhead à a maioria dos algoritmos ignora todos os outros componentes de custo LAN - Redes Locais à custo de comunicação não tão dominantes à custo total da função deveria ser considerado Pode-se também querer maximizar throughput Objetivos da Otimização de Consultas

56 Bancos de Dados Distribuídos Página 56 n Assuma à relações de cardinalidade n à acesso sequencial Complexidade de Operações Relacionais Operação Complexidade Seleção Projeção (sem eliminação de duplicatas) O( n ) Projeção (com eliminação de duplicatas) Group O( n log n ) Junção Semi-junção Divisão Operadores de conjunto O( n log n ) Produto cartesianoO( n 2 )

57 Bancos de Dados Distribuídos Página 57 Questões de Otimização de Consulta – Tipos de Otimizadores n Pesquisa exaustiva à baseada em custo à resultado ótimo à complexidade combinatória no número de relações n Heurística à resultado não ótimo à reagrupamento de sub-expressões comuns à avalia primeiramente a projeção e seleção à substitui uma junção por uma série de semi-junções à reordena operações para reduzir o tamanho da relação intermediária à otimiza operações individuais

58 Bancos de Dados Distribuídos Página 58 Questões de Otimização de consulta – Topologia da Rede n Redes remotas (WAN) - ponto a ponto à características u baixa largura de faixa u baixa velocidade u protocolo com alto overhead à custo de comunicação dominante; ignore todos os outros fatores de custo à horário global para minimizar custo de comunicação à estratégias locais de acordo com a otimização de consulta centralizada n Redes locais (LAN) à custo de comunicação não tão dominante à função de custo total deveria ser considerada à pode explorar bradcasting (junção) à algoritmos particulares existem para redes tipo estrela

59 Bancos de Dados Distribuídos Página 59 Metodologia de Processamento de Consulta Distribuída Consulta em Cálculo sobre Relações Distribuídas SITE DE CONTROLE SITES LOCAIS Decomposição de consulta Decomposição de consulta Localização de Dados Localização de Dados Consulta em Algébrica em Relações Distribuídas Otimização Global Otimização Global Consulta Fragmentada Otimização Local Otimização Local Consulta Fragmentada Otimizada induzindo Operações de Comunicação Consultas Locais Otimizadas ESQUEMA GLOBAL ESQUEMA GLOBAL ESQUEMA FRAGMENTADO ESQUEMA FRAGMENTADO ESTATÍSTICAS NOS FRAGMENTOS ESTATÍSTICAS NOS FRAGMENTOS ESQUEMAS LOCAIS ESQUEMAS LOCAIS

60 Bancos de Dados Distribuídos Página 60 grande volume de dados ï utilize disco e memória principal grande n gargalo I/O (ou gargalo de acesso à memória) à velocidade(disco) << velocidade(RAM) << velocidade(microprocessador) n Prognósticos à crescimento de velocidade do (micro-) processador : 50 % por ano crescimento da capacidade DRAM : 4 a cada três anos atravessamento do disco : 2 nos últimos dez anos n Conclusão : o gargalo do I/O irá piorar O Problema do B.D.

61 Bancos de Dados Distribuídos Página 61 n Aumente a largura da banda do I/O à repartição de dados à acesso a dados paralelos n Origens (anos 80): equipamentos de B.D. orientados para hardware ï custo-desempenho ruim ï falhas à exceção notável : ICL's CAFS ISP n Anos 90 : a mesma solução, porém utilizando componentes de hardware padronizados integrados em um multiprocessador à orientados para software à padrão essencial para explorar os contínuos aperfeiçoamentos tecnológicos A Solução

62 Bancos de Dados Distribuídos Página 62 n Alto-desempenho com melhor custo-desempenho do que mainframe ou supercomputadores array n Utiliza muitos nós, cada um com bom custo- desempenho, comunicando através de rede à bom custo através de componentes de grande volume à bom desempenho n Tendências à multiprocessador à rede n O verdadeiro desafio é paralelizar aplicações de forma que executem com bom equilíbrio de carga Objetivos do Multiprocessador

63 Bancos de Dados Distribuídos Página 63 n Três maneiras de explorar sistemas de multi- processador de alto-desempenho: ¶ automaticamente detecte paralelismo em programas sequenciais ¶ aumente uma linguagem existente com construções paralelas ¶ ofereça uma nova linguagem na qual o paralelismo possa ser expresso ou automaticamente inferido n Crítica à difícil de desenvolver paralelizando computadores, aceleração resultante limitada · possibilita ao programador expressar computações paralelas, porém de muito baixo nível ¸ pode combinar as vantagens de (1) e (2) Processamento de Dados Paralelos

64 Bancos de Dados Distribuídos Página 64 n Custo/desempenho muito melhor do que a solução mainframe n Alto desempenho através de paralelismo à alto atravessamento através do paralelismo inter-query à baixo tempo de resposta com paralelismo intra-operação n Alta disponibilidade e confiabilidade explorando a replicação de dados n Extensividade com os objetivos ideais à aceleração linear à escalamento linear Sistemas de B.D. Paralelos - Objetivos

65 Bancos de Dados Distribuídos Página 65

66 Bancos de Dados Distribuídos Página 66

67 Bancos de Dados Distribuídos Página 67 Barreiras ao Paralelismo n Iniciar à o tempo necessário para iniciar uma operação pode dominar o tempo real de computação n Interferência à quando acessar recursos compartilhados, cada novo processo desacelera os outros n Assimetria à o tempo de resposta de um conjunto de processos paralelos é o tempo do mais lento n Técnicas de gerenciamento de dados paralelos pretendem ultrapassar estas barreiras

68 Bancos de Dados Distribuídos Página 68 Funções do B.D. Paralelo n gerenciador da sessão à interface do hospedeiro à monitoramento da transação para OLTP n gerenciador da solicitação à compilação e otimização à gerenciamento do diretório de dados à controle de dados semânticos à controle da execução n gerenciador de dado à execução de operações do B.D. à suporte de gerenciamento da transação à gerenciamento do dado

69 Bancos de Dados Distribuídos Página 69 Arquiteturas do Sistema Paralelo n Extremos da arquitetura de multiprocessador à memória compartilhada (tudo compartilhado) à nada compartilhado (passagem de mensagem) n Arquitetura intermediária: disco compartilhado

70 Bancos de Dados Distribuídos Página 70 Arquitetura de Memória Compartilhada Exemplos:multiprocessadores simétricos (Sequent, Encore, Bull's Escala), XPRS (U. of Berkeley), DBS3 (Bull) à simplicidade, equilíbrio de carga, comunicação rápida à custo da rede, baixa extensividade, baixa disponibilidade P1P1 PnPn Memória Global D interconectar

71 Bancos de Dados Distribuídos Página 71 Arquitetura de Disco Compartilhado Exemplos :DEC's VAXcluster, IBM's IMS/VS Data Sharing à custo da rede, extensividade, migração de uni-processador à complexidade, problema de desempenho potencial para coerência de cópia D P1P1 M1M1 PnPn MnMn interconectar

72 Bancos de Dados Distribuídos Página 72 Arquitetura Nada Compartilhado Exemplos :Teradata (ATT GIS), NonStopSQL (Tandem), Gamma (U. of Wisconsin), Bubba (MCC) à custo, extensividade, disponibilidade à complexidade, difícil equilíbrio de carga P1P1 M1M1 D1D1 PnPn MnMn DnDn interconectar

73 Bancos de Dados Distribuídos Página 73 Comparações de Desempenho número de nós desempenho SN SD SM

74 Bancos de Dados Distribuídos Página 74 n combina o bom balanceamento de carga SM(Shared Memory - memória compartilhada) com a extensividade de SN(Shared Nothing - nada compartilhado) n alternativas à número limitado de grandes nós, ex: nós de processador 4 x 16 à grande número de pequenos nós,ex: nós de processador 16 x 4, tem um custo-desempenho muito melhor (pode ser um aglomerado de workstations) Aglomeração de Nós SM P1P1 PnPn Memória Global D interconectar P1P1 PnPn Memória Global D interconectar

75 Bancos de Dados Distribuídos Página 75 Comentários finais n BD distribuídos: teoria antiga, prática recente n Estudo de arquiteturas à paralelismo incluído n Arquitetura C/S e camadas lógicas n Protocolos de confiabilidade à sistemas comerciais? n Processamento de consultas à Muitos problemas em aberto! n Tendências à Feedback da prática: novas demandas (e.g. BD Multimídia)


Carregar ppt "Bancos de Dados Distribuídos Página 1 Bancos de Dados Distribuídos Alcides Calsavara."

Apresentações semelhantes


Anúncios Google