[GTER] Problemas com Bind 9.5.0-p2
Ricardo Rodrigues
rcr.listas at ig.com.br
Mon Sep 8 02:29:31 -03 2008
Eduardo,
Estes timeouts são normais, significa que seu servidor DNS demorou
mais de 5s para responder (timeout padrão). Isso ocorre em alguns
casos onde o registro não está no servidor cache. Você pode alterar o
timeout do dnsperf usando a opção -t <timeout>, se quiser. Mas o
recomendado é usar o timeout padrão, simulando portanto o timeout de
aplicações como ftp, web, e-mail, etc.
O importante agora é analisar seu cenário de teste:
1. Qual a carga que seu servidor DNS precisa suportar? Provavelmente
você terá que refazer o teste aumentando o número de queries
simultâneas (opção -q). Creio que 25 qps não seja suficiente para sua
rede.
2. Os registros pesquisados (arquivo de queries) estão no cache do
servidor DNS? Ou o servidor DNS terá que buscar nos autoritativos?
3. Quais registros estão no arquivo de queries? Vale a pena fazer um
teste controlado "complementar" usando um arquivo contendo 10 domínios
conhecidos. Executando este teste controlado por 5 minutos (opção -l
300), não deverá haver perdas pois a informação estará toda no cache.
Em suma: nos testes você pode usar o arquivo com 10 domínios para
verificar que o servidor DNS está fazendo o que ele deve fazer
(cenário ideal/utópico) e o arquivo maior (100k ou 3M queries, ou um
próprio gerado a partir de seu tráfego de produção) para analisar o
comportamento em um cenário mais próximo da "realidade".
Abraços,
Ricardo
2008/9/8 Eduardo Schoedler <eschoedler at viavale.com.br>:
> Olá Ricardo.
>
> Estava justamente fazendo esse teste.
> Veja o que começou a acontecer:
>
> # dnsperf -s 200.xxx.xxx.2 -d ./queryfile-example-100thousand
>
> DNS Performance Testing Tool
>
> Nominum Version 1.0.1.0
>
> [Status] Processing input data
> [Status] Sending queries (to 200.xxx.xxx.2)
> [Timeout] Query timed out: msg id 1476
> [Timeout] Query timed out: msg id 1477
> [Timeout] Query timed out: msg id 1478
> Warning: Received a response with an unexpected (maybe timed out) id: 1476
> Warning: Received a response with an unexpected (maybe timed out) id: 1477
> Warning: Received a response with an unexpected (maybe timed out) id: 1478
> [Timeout] Query timed out: msg id 1847
> [Timeout] Query timed out: msg id 2935
> [Timeout] Query timed out: msg id 3137
> [Timeout] Query timed out: msg id 3169
> [Timeout] Query timed out: msg id 3186
> [Timeout] Query timed out: msg id 3197
> [Timeout] Query timed out: msg id 3210
> [Timeout] Query timed out: msg id 3215
> [Timeout] Query timed out: msg id 3225
> [Timeout] Query timed out: msg id 3228
> [Timeout] Query timed out: msg id 3230
> [Timeout] Query timed out: msg id 3234
> [Timeout] Query timed out: msg id 3249
> [Timeout] Query timed out: msg id 3251
> [Timeout] Query timed out: msg id 3254
> [Timeout] Query timed out: msg id 3255
> [Timeout] Query timed out: msg id 3258
> [Timeout] Query timed out: msg id 3273
> Warning: Received a response with an unexpected (maybe timed out) id: 1847
> [Timeout] Query timed out: msg id 3282
> [Timeout] Query timed out: msg id 3291
> [Timeout] Query timed out: msg id 3300
>
> [snip]
>
> [Interrupt] Query interrupted: msg id 4690
> [Interrupt] Query interrupted: msg id 4691
> [Interrupt] Query interrupted: msg id 4692
> [Interrupt] Query interrupted: msg id 4693 ^C
> [Status] Testing complete
>
> Statistics:
>
> Parse input file: once
> Ended due to: interruption
>
> Queries sent: 4694 queries
> Queries completed: 4369 queries
> Queries lost: 305 queries
> Queries interrupted: 20 queries
>
> Avg request size: 39 bytes
> Avg response size: 153 bytes
>
> Percentage completed: 93.50%
> Percentage lost: 6.50%
>
> Started at: Mon Sep 8 01:33:03 2008
> Finished at: Mon Sep 8 01:35:53 2008
> Ran for: 170.731505 seconds
>
> Queries per second: 25.589887 qps
>
>
> Vi muitos erros no log do named referente ao RFC 1918.
> Será que poderia ser esse os erros exibidos no teste ?
>
> Abraço!
>
>
> --------------------------------------------------
> From: "Ricardo Rodrigues" <rcr.listas at ig.com.br>
> Subject: Re: [GTER] Problemas com Bind 9.5.0-p2
>
> Muito bom, Eduardo.
>
> O ideal é rodar o dnsperf a partir de uma máquina distinta do servidor
> DNS que você está testando. Desta forma o teste fica mais parecido com
> o cenário real e pode ajudar a identificar possíveis problemas de rede
> (firewall/iptables, etc).
>
> Dependendo da carga que seu servidor DNS deva suportar, você pode
> aumentar o número de requisições simultaneas do dnsperf (opção -q). O
> valor default é 20, eu costumo testar com 10000. Mas use com cuidado,
> o consumo de CPU do servidor DNS pode aumentar bastante com esta
> carga.
>
> Abraços,
> Ricardo
>
> 2008/9/8 Eduardo Schoedler <eschoedler at viavale.com.br>:
>> Sobre o dnsperf do Nominum, fiz um teste com ele aqui.
>> Vejam o resultado:
>>
>> # dnsperf -d ./queryfile-example-100thousand
>>
>> DNS Performance Testing Tool
>>
>> Nominum Version 1.0.1.0
>>
>> [Status] Processing input data
>> [Status] Sending queries (to 127.0.0.1)
>> [Status] Testing complete
>>
>> Statistics:
>>
>> Parse input file: once
>> Ended due to: reaching end of file
>>
>> Queries sent: 100.000 queries
>> Queries completed: 100.000 queries
>> Queries lost: 0 queries
>>
>> Avg request size: 41 bytes
>> Avg response size: 41 bytes
>>
>> Percentage completed: 100.00%
>> Percentage lost: 0.00%
>>
>> Started at: Mon Sep 8 00:38:41 2008
>> Finished at: Mon Sep 8 00:38:51 2008
>> Ran for: 10.152553 seconds
>>
>> Queries per second: 9849.739272 qps
>>
>>
>>
>> Aproveitei e fiz o test com o arquivo de 3 milhões também! =)
>>
>> # dnsperf -d ./queryfile-example-3million
>>
>> DNS Performance Testing Tool
>>
>> Nominum Version 1.0.1.0
>>
>> [Status] Processing input data
>> [Status] Sending queries (to 127.0.0.1)
>> [Status] Testing complete
>>
>> Statistics:
>>
>> Parse input file: once
>> Ended due to: reaching end of file
>>
>> Queries sent: 3.000.000 queries
>> Queries completed: 3.000.000 queries
>> Queries lost: 0 queries
>>
>> Avg request size: 41 bytes
>> Avg response size: 41 bytes
>>
>> Percentage completed: 100.00%
>> Percentage lost: 0.00%
>>
>> Started at: Mon Sep 8 00:45:15 2008
>> Finished at: Mon Sep 8 00:50:41 2008
>> Ran for: 325.518862 seconds
>>
>> Queries per second: 9216.055812 qps
>>
>>
>> Conclusão até o momento: maldito hyperthread !!!
>>
>> Abraços a todos.
>>
>> Eduardo.
>>
>>
>> --------------------------------------------------
>> From: "Eduardo Schoedler" <eschoedler at viavale.com.br>
>> Subject: Re: [GTER] Problemas com Bind 9.5.0-p2
>>
>> Olá a todos !!!
>>
>> Primeiramente muito obrigado pela força.
>>
>> Bom, existe um firewall na frente dessa máquina sim.
>> Todas as saídas dos servidores DNS estão liberadas.
>> As portas de entradas estão liberadas acima de 1024 e também a porta 53,
>> tanto em TCP quanto em UDP.
>>
>> Utilizo os servers DNS em FreeBSD.
>> Os servidores são Pentium 4, com hyperthread.
>>
>> Eu fiz um alteração agora que pareceu que melhorou *MUITO*.
>> No rc.conf, setei o flag "-n 1", forçando a utilizando de 1 processador
>> cfe.
>> dica do Rubens.
>> Também aproveitei para setar o flag de ipv4 "-4".
>>
>> Ficou assim o rc.conf:
>> named_enable="YES"
>> named_flags="-4 -n 1"
>>
>> Vou ver como ele se comporta durante a segunda-feira, que é crítico para
>> nós.
>>
>> Muito Obrigado novamente !
>>
>> Abraços,
>> Eduardo Schoedler.
>>
>>
>>
>>
>> --------------------------------------------------
>> From: "Leandro Pereira de Lima e Silva" <leandro at limaesilva.com.br>
>> Subject: Re: [GTER] Problemas com Bind 9.5.0-p2
>>
>> Você não tem nenhuma regra no firewall controlando as saídas udp?
>>
>> []s Leandro
>>
>> 2008/9/5 Eduardo Schoedler <eschoedler at viavale.com.br>:
>>> Pessoal.
>>>
>>> Desde que atualizei o Bind para a versão 9.5.0-p2 para evitar o problema
>>> de
>>> cache poisoning, estou notando uma certa lentidão.
>>> Os domínios que estão em cache ele resolve bem.
>>> Porém os que não estão em cache, dá timeout de 2s... coisa que não
>>> acontecia
>>> na versão anterior.
>>> Vejam:
>>>
>>> C:\>nslookup
>>>> server 200.xxx.xxx.2
>>> Servidor padrão: dns.dominio.com.br
>>> Address: 200.xxx.xxx.2
>>>
>>>> dominio.com.br
>>> Servidor: dns.dominio.com.br
>>> Address: 200.xxx.xxx.2
>>>
>>> Nome = dominio.com.br
>>> Address: 200.143.116.11
>>>
>>>> terra.com.br
>>> Servidor: dns.dominio.com.br
>>> Address: 200.xxx.xxx.2
>>>
>>> Não é resposta de autorização:
>>> Nome = terra.com.br
>>> Address: 200.176.3.142
>>>
>>>> cnn.com
>>> Servidor: dns.dominio.com.br
>>> Address: 200.xxx.xxx.2
>>>
>>> DNS request timed out.
>>> timeout was 2 seconds.
>>> *** A requisição para dns.dominio.com.br esgotou o tempo limite
>>>
>>>> cnn.com
>>> Servidor: dns.dominio.com.br
>>> Address: 200.xxx.xxx.2
>>>
>>> Não é resposta de autorização:
>>> Nome = cnn.com
>>> Addresses: 64.236.16.20, 64.236.16.52, 64.236.24.12, 64.236.29.120
>>>
>>>
>>> Alguém passou por problema semelhante ?
>>>
>>> Abraço!
>>> Eduardo.
>>
>> --
>> Leandro Pereira de Lima e Silva
>>
>> --
>> gter list https://eng.registro.br/mailman/listinfo/gter
>>
> --
> gter list https://eng.registro.br/mailman/listinfo/gter
>
> --
> gter list https://eng.registro.br/mailman/listinfo/gter
>
More information about the gter
mailing list