[MASOCH-L] Armazenamento

Durval Menezes durval at tmp.com.br
Wed Aug 3 06:44:49 BRT 2005


Alo Thiago,

On Tue, Aug 02, 2005 at 04:20:32PM -0300, Thiago Damas wrote:
>   Falando em RAID,
>   alguem ja leu algum artigo de comparação de RAID via software e
> hardware? Eu ja vi um a um tempo atras, comparando o RAID por software
> do linux, freebsd e netbsd mas nao lembro onde.

Ja' li alguns artigos e fiz meus proprios benchmarks. Resumindo, se voce
tem um minimo de CPU (qualquer P4 ou Athlon >2Ghz), o RAID de software e'
tao ou mais rapido que o de hardware. O de hardware ganha se voce tiver uma
daquelas controladoras com bastante RAM (128MB ou mais) e *bateria* na
propria placa para manter esta RAM em caso de desligamento imprevisto da
maquina (falta de luz, etc) pois neste caso as operacoes de escrita podem
ser feitas em regime de "writeback" e para datasets de escrita de tamanho
comparavel `a quantidade de RAM, ganha-se bastante em desempenho. Nos demais
casos, o RAID de hardware perde feio ou no maximo empata (quando o limite
sao os discos).

>   Respondendo ao email do Durval Menezes, esta maquina servira somente
> para armazenamento; nao pretendo rodar nenhum servico na maquina a nao
> ser os necessarios para o compartilhamento dos arquivos; tenho
> atualmente servidores "individuais" que fazem este serviço,
> totalizando cerca de 150Gb de dados, mas penso que fazendo um servidor
>  centralizado de storage fique mais facil e barato de manter os dados.

Qual volume de dados voce ira' trafegar nas aplicacoes que irao acessar
estes dados compartilhados?

>   Que tipo de armazenamento é utilizado, por exemplo, por provedores
> que oferecem 1Gb de espaço?

Depende do porte do provedor; repare que "oferecer 1Gb de espaco" quer
dizer muito pouco, se nao especificar tambem: para QUANTOS usuarios?
qual a quantidade de acessos simultaneos? e etc...

No final das contas, para dimensionar um sistema de armazenamento, e'
importante saber (ou calcular) PELO MENOS(*) dois numeros: qual a taxa de
transferencia total desejada (em MB/s) e a quantidade de acessos (em
acessos/s). Se voce ja' tem as aplicacoes em producao, isto pode ser
obtido a partir delas mesmas (kernel profiling, analise de logs, etc).

> SCSI ou Fibrechannel nao ficaria muito caro?

Depende do seu orcamento. A turma do Google (que oferece 1Gb de espaco
no gmail) provavelmente acha FC baratissimo, deve estar usando algum EMC
(Equipamento Muito Caro, segundo o Rubens :-)) ou ate' mesmo algo ainda
mais caro. Ja' pensou em fazer um IPO? :-)

> Acho que SATA pode ser uma boa solução, apesar de ter uma
> confiabilidade menor, nada impede de usar um RAID e ter discos
> reservas.

Bingo: voce entendeu direitinho. Afinal de contas, o "I" de RAID 
era para querer dizer "inexpensive"...

> Existem placas da adaptec de RAID para 4 canais SATA por 300
> dolares.

Existem placas SATA 4 canais da Promise com suporte a NCQ/hotswap/PM
e etc por menos de $100, e com excelente suporte na LIBATA do Linux...

Um Grande Abraco,
-- 
   Durval Menezes (durval AT tmp DOT com DOT br, http://www.tmp.com.br/)

(*)O "pelo menos" acima e' porque o dimensionamento tomando como base
somente numeros absolutos de MB/s e acessos/s e' muito simplista pois 
nao leva em conta a estatistica destes acessos na linha do tempo (pico,
media, etc) e muito menos a necessidade de desempenho das aplicacoes
(para dar um exemplo absurdo, se voce nao se incomoda com desempenho,
ate' mesmo um unico disco IDE de 5400RPM pode bastar, so' que os acessos
vao levar desde muitos segundos ate' varios minutos, horas ou de repente
ate' dias para serem atendidos, dependendo do seu volume :-)). 



More information about the masoch-l mailing list