domingo, outubro 24, 2010

Meios de armazenamento

Definida as necessidades básicas a serem atendidas devemos selecionar um do tipos de

armazenamento, que podem ser: on-line, Próximos e off-line.

As mídias de armazenamento on-line, consiste em discos rígidos ou arrays de discos. Estas mídias

fornecem uma disponibilidade em tempo real e são normalmente utilizados para fornecer uma forma

altrnativa de armazenamento. Estas mídias não substituem os backups offline;

O armazenamento próximo é formado por “Jukeboxes” óticos e cópias locais, que estão

rapidamente acessíveis, normalmente fazem uso de robos para gerenciarem as mídias fornecendo um

acesso rápido aos dados quando o serviço on-line não está disponível;

Já o armazenamento off-line consiste no arquivamento de mídias fora da rede de dados em um local

seguro e protegido contra roubo, catástrofes naturais e outros ameças. Sempre que possível as mídias

devem ser armazenadas em local geográficamente diferente e fora das instalações comerciais da empresa.

Para a realização deste tipos de backup podem ser utilizadas três tipos de mídias diferentes:

fitas/discos magnéticos, armazenamento ótico e arrays de disco.

As fitas magnéticas são as mídias mais comuns, mais baratas utilizadas nos backups off-line, mas

por outro lado são as mais lentas e que ocupam um grande espaço. Seus principais tipos são: 8mm,

Travan, DLT, DAT e Magstar

O armazenamento ótico é muito popular em ambientes onde a velocidade e a confiabilidade são as

maiores preocupações, estes ambientes fazem uso de servidores com jukboxes óticos de alta

disponibilidade que são soluções caras porem muito eficientes.

Os arrays de discos ou simplesmente RAIDs (Redundant Array of Independet Disks) são um

subsistema de discos rígidos que melhoram o desempenho e a tolerância a falhas, uma vez que os dados

são gravados em mais de um disco ao mesmo tempo. Estas soluções podem ser tanto implementadas em

software quanto em hardware. Neste caso quando uma unidade de disco falha o administrador do sistema

pode substitui-la, em alguns casos, sem parar o funcionamento do servidor.

Os principais tipos de RAID são:

_ RAID 0 : este nível realiza um “join” dos discos, ou seja, ele combina todos os

discos em uma única unidade lógica, útil quando desejamos aumentar a

capacidade de armazenamento de dados;

_ RAID 1: realiza o espelhamento de um disco em um outro, nesta solução um

dos discos fica inativo, apenas recebendo os dados do disco mestre até que ele

falhe. Este nível oferece uma boa tolerância a falhas, visto que ao ocorrer a

falha de um disco os usuários são automaticamente redirecionados para o

antigo disco escravo;

_ RAID 3: também implementa um espelhamento só que neste caso três ou mais

unidades de disco são espelhadas em uma outra, este nível também fornece

tolerância a falhas, uma vez que grava os bits de paridade em uma unidade

dedicada e permite que os discos trabalhem em paralelo, fornecendo assim alto

nível de desempenho;

_ RAID 5: esta faz uso de três unidades, em duas são armazenados os dados e

na terceira os bits de paridade, sendo esta é a solução mais utilizada;

_ RAID 10: é a combinação do RAID 1 e 0, ou seja, espelhamento e intercalação

entre unidade de disco.

A solução de RAID fornece um melhor desempenho e tolerância a falhas, mas de forma alguma

substituir o processo de backup off-line. Vale lembrar que dois ou mais discos podem falhar ao mesmo

tempo, perdendo o acesso total aos dados armazenados no array.

Outra solução de proteção aos dados é o HSM (Hierarchical Storage Management), que é um

sistema automatizado para o gerenciamento de dados e espaço em disco, muito utilizado em mainframes.

Esta solução monitora a capacidade das unidades e move os dados para as mídias de armazenamento

próximo ou offline, mais lentas.

O HSM pode mover os dados segundo sua idade, freqüência de uso ou baseado em outros critérios,

permitindo deste modo uma migração de dados automática. Esta solução é relativamente cara e difícil de

ser implementada.

Já as SANS (Storage Area Networks) ligam diretamente os servidores de dados as unidade de

armazenamento, graças ao uso de um canal de fibra (fiberchannel), permite uma conexão de alta velocidade

e implementa uma subrede de armazenamento, com isto libera a rede de produção do peso do backup de

dados e economiza largura de banda . Além disto oferecem alta velocidade, confiabilidade e gerenciamento

centralizado.

Por outro lado as NAS (Network Attached Storage) funcionam de forma semelhante aos servidores

de arquivos, visto que estão conectados diretamente a rede ethernet e possuem sistemas operacionais

embutidos nos equipamentos. Esta estrutura é uma alternativa a inclusão de unidades de dados nos

servidores. Para garantir a segurança dos dados estes equipamentos implementas um dos níveis de RAID

estudados anteriormente, mas backups de grades volumes de dados podem afetar a velocidade da rede.

Esta solução é relativamente barata, simples e possui grande compatibilidade entre fornecedores.