A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Segurança no Armazenamento 1. Introdução

Apresentações semelhantes


Apresentação em tema: "Segurança no Armazenamento 1. Introdução"— Transcrição da apresentação:

1 Segurança no Armazenamento 1. Introdução
Márcio Aurélio Ribeiro Moreira

2 Objetivos da unidade Explicitar a necessidade de armazenamento
Avaliar as alternativas de solução Revisar os principais conceitos de armazenamento Explorar os tipos de RAID Mostrar as alternativas de redes de armazenamento

3 O armazenamento não está resolvido?
O número total de livros produzidos desde o começo da imprensa não passa de 1 bilhão: Se cada livro tiver em média 500 páginas com 2000 caracteres cada. Logo, 1 MB é suficiente para armazenar cada livro sem compressão Para armazenar todos os livros precisamos de 1 bilhão de MB ou 1 PetaByte (PB) Considerando Us$20 / GB, 1 PB pode ser comprado por Us$20 milhões

4 O armazenamento nas organizações
Banco da Índia (2007): filiais em todo o país escritórios conectados ao Data Center Mais de 20 milhões de clientes ≈ 100 TB armazenados Crescimento exponencial Questões de segurança: Compressão / Cifragem Antivírus Firewall e IDS Fonte: Ramakrishnan

5 Demanda de performance e espaço
8X 300% 7X 253% 250% 6X Demanda anual de 50% de espaço e performance 200% 5X 169% 4X 7.6X 150% 3X 113% 100% 5.1X 2X 75% Fonte: Ramakrishnan 3.4X 50% 50% 1X 2.3X 1X 1.5X Hoje 1 Ano 2 anos 3 anos 4 anos 5 anos

6 Alternativas para a demanda
Podemos resolver com RAMs? Caras e voláteis  só para processamento Podemos utilizar fitas? Baratas e lentas por serem seqüenciais  backups Podemos resolver com CDs e DVDs? Baratos e aleatórios. Mas, lentos  distribuição Podemos resolver com HDs? Preço justo, aleatórios e rápidos  muitos HDs Onde colocar tantos HDs? Fora do gabinete

7 Camada de Banco de Dados
Camadas de dados Computadores Notebooks Camada web Camada Aplicações Camada de Banco de Dados Pessoas e Coisas Camada de Storage Dispositivos Fonte: Ramakrishnan

8 1º dispositivo magnético
A superfície do disco (ou fita) é coberta com uma substância magnética Movimento mecânico posiciona cabeça do dispositivo para: Gravação: definir a polarização. Leitura: testar a polarização Por ser magnética, a polarização é mantida mesmo sem energia Copyright © 2003 EMC Corporation. All Rights Reserved.

9 Armazenamento em discos
Organiza os dados em áreas endereçáveis Devem ser formatados para serem endereçáveis pelos sistemas operacionais O acesso direto provê performance adequada para acessos seqüencial ou randômico O desempenho do disco é impactado pelo tempo de posicionamento da cabeça para o acesso Os discos são conectados fisicamente ao sistema: É inviável movê-los para um novo local ou novo sistema Como conectar vários discos num mesmo sistema?

10 Vamos olhar os discos de perto

11 Formatação para acesso direto
Trilha Cada prato do disco é segmentado em vários anéis concêntricos chamados trilhas Cilindro Um cilindro é o conjunto formato por uma trilha específica em todos os pratos juntas O endereço único de uma área em um drive de disco é composto de: Cilindro, Cabeça e Setor. Um setor é a menor parte endereçável de uma trilha Setor Fonte: EMC

12 Tempo de acesso ao drive de disco
Seek Time: Tempo de busca Média de tempo gasto para mover o braço do atuador para a posição de leitura ou gravação da cabeça na trilha Normalmente, informado em milissegundos (ms) Fonte: EMC

13 Tempo de acesso ao drive de disco
Latency: Tempo de Latência ou tempo de espera racional Média de tempo gasto para esperar o disco girar e o setor desejado chegar o início da posição de acesso Tempo de meia volta: 50% * 1 / RPM / 60 * 1000 Fonte: EMC

14 Tempo de acesso ao drive de disco
Transfer Rate: Taxa de Transferência Média de tempo gasto para ler (ou escrever) e enviar (ou receber) os dados do setor para o drive de disco (MB) Tempo de Transferência: Kbytes / (taxa * 1024) * 1000 (ms) Fonte: EMC

15 Variáveis da performance de discos
Tempo de Busca (TB) Tempo de Latência (TL): Velocidade rotação RPM  RPM   Tempo de Latência  RPM tem menor impacto na Taxa de Transferência TL = 50% * 1 / RPM / 60 * 1000 (ms) Taxa de Transferência (TT): Ultra SCSI: 40 MB/sec Canal de fibra: 100 MB/sec TT = Kb / (taxa * 1024) * 1000 (ms) Tempo de Resposta (TR): TR = TB + TL + TT Fonte: EMC

16 Evolução da tecnologia de discos
A capacidade continua aumentando muito com o aumento da densidade dos dados A performance aumenta marginalmente com: Aumento da velocidade de rotação (RPM) Aumento do uso da memória e cache no nível de drive As interfaces são dirigidas por padrões da indústria: ATA (Advanced Technology Attachment) Ultra SCSI (Small Computer System Interface) Canal de Fibra Desafios da indústria: Aumentar a capacidade por disco reduzindo custo. Mas, … Reduzir o número de atuadores mantendo a capacidade Fonte: EMC

17 Necessidades de armazenamento
High-End Us$40/GB 100% 99.999% Alta Performance Tempo Crítico Midrange Us$20/GB Deman-da do negócio Alta Capacidade Custo Crítico 99.9% Longo Prazo SATA Us$5/GB Tape Us$0.5/GB Fonte: Ramakrishnan

18 Tecnologia RAID Como obter performance e confiabilidade? RAID:
Redundant Array of Independent Disks Um conjunto de HDs é visto pelo SO como uma única unidade de disco Vantagens: Grande capacidade de armazenamento Acesso paralelo  melhor performance Permite o espelhamento de dados Desvantagens: Custo: requer hardware ou software especial Se espelhado: requer o dobro de espaço

19 Conexões físicas dos discos
Variáveis para conexões físicas: Tipos de cabos Número de vias Conectores físicos Regras para conexões lógicas: Identificar os comandos (de leitura e gravação) e os dados Formato do drive: Esquema de endereçamento Sistema controlador ou placa de circuito: ESCON para mainframe Host Bus Adapter (placas para fibra ótica) para sistemas abertos Placas proprietárias para o AS/400 System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Fonte: EMC

20 Como a operação de I/O ocorre
Iniciando uma requisição de leitura: System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Fonte: EMC

21 Como a operação de I/O ocorre
Completando a requisição de leitura: System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Fonte: EMC

22 Usando melhor a CPU e a memória
“Vamos ver”: Acessamos o cliente 1 Depois o cliente 2 Qual será o próximo? Presumo o cliente 3 Técnica: Cache Read ahead Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA CACHE Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading Fonte: EMC

23 Melhorando ainda mais Usar controladora no RAID: Libera processamento
Libera memória RAM Customer 3 Meter Reading CACHE Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CPU System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Customer 1 Meter Reading Customer 2 Meter Reading Fonte: EMC

24 Como a operação de I/O ocorre
Iniciando um comando de escrita: System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Fonte: EMC

25 Como a operação de I/O ocorre
Completando o comando de escrita: System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Fonte: EMC

26 Melhor uso da CPU e memória
Comando de escrita: “Grave a conta mensal do cliente no disco”. A confirmação de escrita é emitida assim que os dados e o comando de gravação estão seguros dentro de uma área completamente tolerante à falha CACHE Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CPU System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Fonte: EMC

27 Por dentro dos Disk Arrays
Fault Tolerant Cache Memory Array Controller Disk Directors Host Interface Gaveta do sistema operacional Gavetas de discos Fonte: EMC

28 RAID 0 - Striping ou Fracionamento
Os dados são divididos em segmentos e estes são colocados nos HDs Não há redundância Volume 1 End Com RAID 0: Os volumes são divididos em blocos e movidos para balancear a carga de atividades. Middle Beginning Sem RAID: 3 HDs num mesmo host. Cada HD contem um volume Volume 2 Volume 3 Fonte: EMC

29 RAID 1 - Mirroring ou Espelhamento
Os dados de um HD são espelhados em outro gerando redundância Volume 1 End Middle Beginning Volume 2 Volume 3 Sem RAID: 3 HDs num mesmo host. Volume 1 End Middle Beginning Volume 2 Volume 3 Com RAID 1: Um espelho de cada HD é criado gerando um para de HDs. Fonte: EMC

30 RAID 1+0 - Performance e Redundância
Os HDs (volumes físicos) são espelhados e os volumes lógicos divididos Volume 1 End Middle Beginning Volume 2 Volume 3 Sem RAID: 3 HDs num mesmo host. Volume 1 End Volume 2 Volume 3 Middle Beginning Com RAID 1+0: HDs espelhados. Volumes lógicos fracionados para balancear carga. Fonte: EMC

31 Paridade de dados A paridade é utilizada para tentar recuperar dados perdidos Parity for 3rd Group = 1 1 LOST DATA Parity for 2nd Parity for 1st Group = 0 Group 1 Group 2 Group 3 Group = 0 Group = 1 Group ? = 1 DATA + DATA + DATA = Parity Fonte: EMC

32 RAID 5 - Fracionamento e paridade
Divide os dados no nível de bloco e acrescenta um bloco de paridade Requer no mínimo 3 discos Parity for 1st Group Volume 1 End Volume 2 Volume 3 2nd Group Middle 3rd Group Beginning Sem RAID: 3 HDs num mesmo host. Com RAID 5: Um grupo de drives são agrupados como um volume físico. Fonte: EMC

33 Níveis de RAID Nível Técnica Mínimo Discos Aplicação Comentários Fracionamento em blocos 2 Alta performance Sem redundância 1 Espelhamento Alta disponibilidade e performance Implantação simples Fracionamento em bits Monitoramento em RAM Alta performance e disponibilidade Nenhum uso comercial 3 Fracionamento em bytes Disco de paridade Menor custo 4 Fracionamento em blocos (Múltiplos I/O) Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial 5 Discos de paridade independentes 6 Múltiplos discos de paridade independentes Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0): Múltiplos I/O  Independência de leitura e gravação (acesso múltiplo). Custo comparado para níveis que oferecem mesmos benefícios. Fonte: EMC, IBM, Wikipedia e experiência.

34 Arquiteturas típicas de storage
Direct Attached Storage (DAS) Windows NT/2K Linux/Unix Netware Network Attached Storage (NAS) Storage Area Network (SAN) Storage FC Switch NAS DAS: Direct Attached Storage NAS: Network Attached Storage SAN: Storage Area Network We have shown the customers that RAID array storage devices are a better solution to internal disks. We have shown how we can protect the data better at the storage array level by offloading the CPU of that task so we can deliver more cycles to the applications that are running on the server. Customers adopted this storage array concept and started creating islands of storage in their environment due to the distributed computing model that was prevalent at the time. These islands of storage became more difficult to manage as IT budgets were cut and manpower requirements were not filled. Customers were having to do more management tasks with fewer people. These islands of storage also offered poor utilization of the storage because the storage was only available to the servers that were attached to it. When the customer was rolling out new applications, they were typically buying servers and storage and propagating the distributed model. The other challenge for customers was the integration of IT infrastructure due to mergers and acquisitions. Trying to integrate the hardware and applications of the new company could prove to be very difficult because the technology did not conform to what the current IT staff was used to. How can we ease these challenges? How can we provide an environment in which the customer can share their storage infrastructure amongst all the applications but maintain security and performance? The answer is a Networked Storage infrastructure. Let us take a look at our options and understand the benefits of each. Copyright © 2003 EMC Corporation. All Rights Reserved.

35 Conexões típicas SAN Switch Storage Array Network Router
Tape Drive Device In a complete computer system, there will be many peripheral devices connected to the computer. Disk storage for applications, data, and other software, tape storage for backup copies or to archive old infrequently used data, connections to the internal or user network, connections to the external network or the internet, and so on. Here we see an open system server perhaps a Unix server or windows server with tape drives, network connections, disk, and a SAN, or storage Area Network switch connected to the computer. The SAN switch may be connected to additional storage devices like disk subsystems or tape drives. Notice that the connection to the Network Router is made by using a NIC, or Network Interface Card. The NIC card plays a similar role as the HBA, but is designed as an interface between the system bus and a network router device. The data transferred to and from a network router and computer is in a different format, structure, and utilizes a different instruction set than the data transferred between the computer and a disk. As a result, a different interface card, designed for their respective devices they support is needed. The relevance to us is that there are generally a limited number of slots within a computer or server to install these adapter cards that allow the connection of a wide variety of important devices. Before the advent of SAN switches, many servers were prevented from adding storage capacity or other devices simply because they ran out of slots. The SAN switch still requires a slot to connect the switch to the computer, but the SAN switch in turn can be connected to literally dozens and dozens of peripheral devices. HBA HBA NIC HBA System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) Copyright © 2003 EMC Corporation. All Rights Reserved.

36 Produtos de Storage da EMC
Symmetrix CLARiiON Centera ADIC Scalar Series CX700 NS700/G Centera DL700 CX500 CX300 DMX3000-M2 DMX2000-M2 DMX1000-M2 Celerra CNS The need for higher and high capacities, intelligent processing at the disk storage level, increased functionality, and the need for increased reliability has resulted in the development of the disk array, or disk subsystem. An intelligent device that controls the operation of many disk drives in a way that provides better performance, access, availability and functionality than could otherwise be accomplished. Instead of directly connecting say, 10 individual disk drives to a computer, an array creates a single machine that controls and manages the 10 disk drives. The advantage of the array becomes readily apparent when we see the capabilities to increase performance, availability, and functionality that can be provided by the array. Not all, but certainly some of these capabilities could be implemented by the host computer using it’s CPU and main memory resource, but that comes as a taxing cost to a very valuable resource. The CPU that is asked to perform instructions and programs in place of a disk array is using processing cycles that would otherwise be used to run business applications and support the users of the system. Not all, but many disk arrays will map the physical drives to a different set of logical drives. This allows the storage array to be configured in a way that best suits the particular host computer it connects to. For example 4, 20gigabyte disk drives can be portrayed to the host computer as 20, 4gigabyte disk drives. The industry terminology would describe these as 4 GB logical volumes.   EMC has a wide selection of disk storage array offerings to complement every customer need. EMC constantly refreshes the technology within its disk array family ensuring that the entire product line is always providing the customer with the best available solution and a lower total cost of ownership. DMX3000 DMX2000 DMX1000 DMX800 AX 100 Netwin 110 SAN / NAS / Backup- to-Disk Tape & Tape Emulation SAN / NAS CAS Copyright © 2003 EMC Corporation. All Rights Reserved.

37 Referências EMC. Storage Basics. EMC. Jun-2006.
S. Ramakrishnan. Management of large scale Terabyte Store information servers. IACITS Jul-2007. Khattar, Murphy, Tarella e Nystrom. Introduction to Storage Area Network, SAN. IBM. Redbooks. SG


Carregar ppt "Segurança no Armazenamento 1. Introdução"

Apresentações semelhantes


Anúncios Google