[GTER] Filtragem de servidores DNS?

Henrique de Moraes Holschuh henrique.holschuh at ima.sp.gov.br
Mon Jun 16 16:32:50 -03 2008


Marcelo Gardini do Amaral wrote:
>> Acho que uma solução dessa não ia adiantar muito, você precisa de algo
>> equivalente a balanceamento de carga ativo (com laço de controle fechado,
>> onde você leva em conta a velocidade de resposta de cada nó para definir a
>> carga no mesmo e não repassa pedidos novos se ele está lento).
> 
> Se estamos falando de um cluster DNS isso não faz muito sentido pra
> mim. Se todos os nós do cluster são iguais, não tem porque um "ficar
> mais lento" do que o outro. Um bom esquema de balanceamento vai

Veja abaixo.

> distribuir quase perfeitamente a carga entre os nós. Agora se a
> "lentidão" ocorrer por falha, acho que um alarme do Nagios seguido de
> uma intervenção humana (e tudo isso ocorrer em 5-10 minutos) já é
> muito melhor que muito serviço oferecido por aí.

5 a 10 minutos é tempo demais na minha opinião.  Mas deixa para lá, esta 
thread não está gerando mais nada alem de "achos".  Só lembre de 
calcular quantas queries você perderia no seu cluster caso um membro 
pare de responder por 5 minutos sem você o retirar do load-balancer.

>> 1 erro em 10 em um sistema de DNS desses é claramente inaceitável, ou não
>> teria tanta gritaria na lista com o que as operadoras já oferecem no
>> momento...  e acho que algo estilo nagios não conseguiria diminuir isso para
>> 1 em 100, a menos que sejam utilizadas uma quantidade absurda de nós no
>> cluster...
> 
> Bom, nós não sabemos exatamente qual o problema que as operadoras têm
> (ou qual problema elas não querem resolver). Mas, se for feito um
> estudo de quantas queries por segundo cada nó do cluster suporta com
> folga (de acordo com a carga, hardware e software utilizados) dá sim
> pra dimensionar um cluster corretamente. Logo, não é preciso nenhuma
> solução mágica pra resolver isso.

Bom, não concordo. Em minha experiência, não basta deixar o negócio 
quieto para ele ficar funcionando bem.  De uma hora para a outra a 
máquina começa a ficar lenta (por vazamento de memória no BIND, kernel, 
ou alguma outra coisa, tipo um cronjob de manutenção que resolve causar 
problema), etc...   Isso *altera* o ponto de trabalho da máquina e de 
repente o BIND que estava lá não tem mais os recursos que precisa para 
trabalhar "folgado".

-- 
Henrique de Moraes Holschuh <hmh at ima.sp.gov.br>
IM@ - Informática de Municípios Associados
Projetos Especiais
TEL +55-19-3739-6055/CEL +55-19-9293-9464



More information about the gter mailing list