Definida as necessidades básicas a serem atendidas devemos selecionar um do tipos de
armazenamento, que podem ser: on-line, Próximos e off-line.
As mídias de armazenamento on-line, consiste em discos rígidos ou arrays de discos. Estas mídias
fornecem uma disponibilidade em tempo real e são normalmente utilizados para fornecer uma forma
altrnativa de armazenamento. Estas mídias não substituem os backups offline;
O armazenamento próximo é formado por “Jukeboxes” óticos e cópias locais, que estão
rapidamente acessíveis, normalmente fazem uso de robos para gerenciarem as mídias fornecendo um
acesso rápido aos dados quando o serviço on-line não está disponível;
Já o armazenamento off-line consiste no arquivamento de mídias fora da rede de dados em um local
seguro e protegido contra roubo, catástrofes naturais e outros ameças. Sempre que possível as mídias
devem ser armazenadas em local geográficamente diferente e fora das instalações comerciais da empresa.
Para a realização deste tipos de backup podem ser utilizadas três tipos de mídias diferentes:
fitas/discos magnéticos, armazenamento ótico e arrays de disco.
As fitas magnéticas são as mídias mais comuns, mais baratas utilizadas nos backups off-line, mas
por outro lado são as mais lentas e que ocupam um grande espaço. Seus principais tipos são: 8mm,
Travan, DLT, DAT e Magstar
O armazenamento ótico é muito popular em ambientes onde a velocidade e a confiabilidade são as
maiores preocupações, estes ambientes fazem uso de servidores com jukboxes óticos de alta
disponibilidade que são soluções caras porem muito eficientes.
Os arrays de discos ou simplesmente RAIDs (Redundant Array of Independet Disks) são um
subsistema de discos rígidos que melhoram o desempenho e a tolerância a falhas, uma vez que os dados
são gravados em mais de um disco ao mesmo tempo. Estas soluções podem ser tanto implementadas em
software quanto em hardware. Neste caso quando uma unidade de disco falha o administrador do sistema
pode substitui-la, em alguns casos, sem parar o funcionamento do servidor.
Os principais tipos de RAID são:
_ RAID 0 : este nível realiza um “join” dos discos, ou seja, ele combina todos os
discos em uma única unidade lógica, útil quando desejamos aumentar a
capacidade de armazenamento de dados;
_ RAID 1: realiza o espelhamento de um disco em um outro, nesta solução um
dos discos fica inativo, apenas recebendo os dados do disco mestre até que ele
falhe. Este nível oferece uma boa tolerância a falhas, visto que ao ocorrer a
falha de um disco os usuários são automaticamente redirecionados para o
antigo disco escravo;
_ RAID 3: também implementa um espelhamento só que neste caso três ou mais
unidades de disco são espelhadas em uma outra, este nível também fornece
tolerância a falhas, uma vez que grava os bits de paridade em uma unidade
dedicada e permite que os discos trabalhem em paralelo, fornecendo assim alto
nível de desempenho;
_ RAID 5: esta faz uso de três unidades, em duas são armazenados os dados e
na terceira os bits de paridade, sendo esta é a solução mais utilizada;
_ RAID 10: é a combinação do RAID 1 e 0, ou seja, espelhamento e intercalação
entre unidade de disco.
A solução de RAID fornece um melhor desempenho e tolerância a falhas, mas de forma alguma
substituir o processo de backup off-line. Vale lembrar que dois ou mais discos podem falhar ao mesmo
tempo, perdendo o acesso total aos dados armazenados no array.
Outra solução de proteção aos dados é o HSM (Hierarchical Storage Management), que é um
sistema automatizado para o gerenciamento de dados e espaço em disco, muito utilizado em mainframes.
Esta solução monitora a capacidade das unidades e move os dados para as mídias de armazenamento
próximo ou offline, mais lentas.
O HSM pode mover os dados segundo sua idade, freqüência de uso ou baseado em outros critérios,
permitindo deste modo uma migração de dados automática. Esta solução é relativamente cara e difícil de
ser implementada.
Já as SANS (Storage Area Networks) ligam diretamente os servidores de dados as unidade de
armazenamento, graças ao uso de um canal de fibra (fiberchannel), permite uma conexão de alta velocidade
e implementa uma subrede de armazenamento, com isto libera a rede de produção do peso do backup de
dados e economiza largura de banda . Além disto oferecem alta velocidade, confiabilidade e gerenciamento
centralizado.
Por outro lado as NAS (Network Attached Storage) funcionam de forma semelhante aos servidores
de arquivos, visto que estão conectados diretamente a rede ethernet e possuem sistemas operacionais
embutidos nos equipamentos. Esta estrutura é uma alternativa a inclusão de unidades de dados nos
servidores. Para garantir a segurança dos dados estes equipamentos implementas um dos níveis de RAID
estudados anteriormente, mas backups de grades volumes de dados podem afetar a velocidade da rede.