[GTER] O paraíso dos Megalomaníacos

Rodrigo Campos camposr at gmail.com
Tue Nov 7 12:27:23 -02 2006


IMHO, não existe uma única resposta, e cada serviço usa uma solução
diferente baseado em recur$o$ disponíveis e capacidade tecnológica.

A globo.com, por exemplo, que usa o serviço de hosting da tucows (que
comprou o hosting da critical path), deve realmente se basear em
capacidade contratada versus capacidade utilizada.

Digo isso porque as implementações da CP são bem rígidas no que se
refere a arquitetura, variando entre NAS de alta capacidade (Netapp,
EMC, etc.) ou direct attach usando Veritas (filesystem
exigi^H^H^H^H^Hrecomendado pela CP), e não permitem grandes
mirabolâncias tecnologicas.

No GMail, com o seu GFS, que todo mundo fala mas ninguém sabe bem o
que é (alguns acham que é vapor) é usado um sistema de alocação por
blocos. Tem um paper sobre ele disponível em
http://labs.google.com/papers/gfs.html, no entanto não sei dizer se
ele é de fato usado no gmail.

Há quem diga que o GMail usa uma adaptação dos algoritmos do Google
para a compressão das mensagens, criando meta-mensagens que não tem
duplicidade para todo o conjunto de usuários, o que reduz bastante a
ocupação para uma massa de usuários como a do GMail; até onde eu sei
isso não é embasado em nenhum documento oficial do Google.

No Brasil a questão é bem mais complicada já que os preços de storage
são pornográficos, creio que o senso comum é projetar a ocupação média
de caixa postal por período aquisitivo de equipamento de storage e
seguir nessa linha, com eventuais adições pontuais de capacidade.

Em termos de tecnologia, acho que não existe nenhum santo graal, e
depende muito mais de legado e custo do que de outros fatores, e aí
teremos NAS, SAN, JBOD, etc...

Quanto aos limites de tamanho de mensagem, capacidade por pasta/caixa
e tempo de purga por inatividade, convenhamos que esses limites e
políticas sempre existiram, mesmo antes das caixas de grande capacide.

Obviamente que servem como "freio", mas "in the wild" não creio que
eles façam muita diferença. Estamos falando de universos de milhões de
usuários para os grande provedores, e oferecer caixas de múltiplos
Gigabytes sempre irá reprensentar um desafio, independente das
politicas aplicadas.

Além da questão de storage, tem também a questão da interface e
protocolo entre front-end e back-end, aposto que um webmail em php
dando um SELECT via IMAP4 em um folder com 10k mensagens vai gerar uma
carga considerável.


2 cents,


On 11/7/06, Marcelo Coelho <marcelo at tpn.com.br> wrote:
> colognostrus_3000 at hotmail.com wrote:
> > O que há por trás de redes de emails GIGA?
> >
> >
> >
>
> Olá!
>
> Se você olhar o contrato ou a política de uso destes serviços, a maioria
> deles têm alguma limitação que dificulta - e muito - que um usuário
> alcance o GIGA prometido.
>
> 1) Limitam o tamanho máximo de cada mensagem (bom isso todo mundo faz)
> 2) Quantidade de mensagens: 3000 mensagens
> 3) Limpeza automática das mensagens antigas (90 dias)
>
> --
> Marcelo Coelho
> marcelo at tpn.com.br
>
> --
> gter list    https://eng.registro.br/mailman/listinfo/gter
>


-- 
Rodrigo Campos
"What I cannot create, I do not understand" - Richard P. Feynman



More information about the gter mailing list