[GTER] Problemas com Bind 9.5.0-p2

Ricardo Rodrigues rcr.listas at ig.com.br
Mon Sep 8 02:29:31 -03 2008


Eduardo,

Estes timeouts são normais, significa que seu servidor DNS demorou
mais de 5s para responder (timeout padrão). Isso ocorre em alguns
casos onde o registro não está no servidor cache. Você pode alterar o
timeout do dnsperf usando a opção -t <timeout>, se quiser. Mas o
recomendado é usar o timeout padrão, simulando portanto o timeout de
aplicações como ftp, web, e-mail, etc.

O importante agora é analisar seu cenário de teste:

1. Qual a carga que seu servidor DNS precisa suportar? Provavelmente
você terá que refazer o teste aumentando o número de queries
simultâneas (opção -q). Creio que 25 qps não seja suficiente para sua
rede.

2. Os registros pesquisados (arquivo de queries) estão no cache do
servidor DNS? Ou o servidor DNS terá que buscar nos autoritativos?

3. Quais registros estão no arquivo de queries? Vale a pena fazer um
teste controlado "complementar" usando um arquivo contendo 10 domínios
conhecidos. Executando este teste controlado por 5 minutos (opção -l
300), não deverá haver perdas pois a informação estará toda no cache.

Em suma: nos testes você pode usar o arquivo com 10 domínios para
verificar que o servidor DNS está fazendo o que ele deve fazer
(cenário ideal/utópico) e o arquivo maior (100k ou 3M queries, ou um
próprio gerado a partir de seu tráfego de produção) para analisar o
comportamento em um cenário mais próximo da "realidade".

Abraços,
Ricardo


2008/9/8 Eduardo Schoedler <eschoedler at viavale.com.br>:
> Olá Ricardo.
>
> Estava justamente fazendo esse teste.
> Veja o que começou a acontecer:
>
> # dnsperf -s 200.xxx.xxx.2 -d ./queryfile-example-100thousand
>
> DNS Performance Testing Tool
>
> Nominum Version 1.0.1.0
>
> [Status] Processing input data
> [Status] Sending queries (to 200.xxx.xxx.2)
> [Timeout] Query timed out: msg id 1476
> [Timeout] Query timed out: msg id 1477
> [Timeout] Query timed out: msg id 1478
> Warning: Received a response with an unexpected (maybe timed out) id: 1476
> Warning: Received a response with an unexpected (maybe timed out) id: 1477
> Warning: Received a response with an unexpected (maybe timed out) id: 1478
> [Timeout] Query timed out: msg id 1847
> [Timeout] Query timed out: msg id 2935
> [Timeout] Query timed out: msg id 3137
> [Timeout] Query timed out: msg id 3169
> [Timeout] Query timed out: msg id 3186
> [Timeout] Query timed out: msg id 3197
> [Timeout] Query timed out: msg id 3210
> [Timeout] Query timed out: msg id 3215
> [Timeout] Query timed out: msg id 3225
> [Timeout] Query timed out: msg id 3228
> [Timeout] Query timed out: msg id 3230
> [Timeout] Query timed out: msg id 3234
> [Timeout] Query timed out: msg id 3249
> [Timeout] Query timed out: msg id 3251
> [Timeout] Query timed out: msg id 3254
> [Timeout] Query timed out: msg id 3255
> [Timeout] Query timed out: msg id 3258
> [Timeout] Query timed out: msg id 3273
> Warning: Received a response with an unexpected (maybe timed out) id: 1847
> [Timeout] Query timed out: msg id 3282
> [Timeout] Query timed out: msg id 3291
> [Timeout] Query timed out: msg id 3300
>
> [snip]
>
> [Interrupt] Query interrupted: msg id 4690
> [Interrupt] Query interrupted: msg id 4691
> [Interrupt] Query interrupted: msg id 4692
> [Interrupt] Query interrupted: msg id 4693   ^C
> [Status] Testing complete
>
> Statistics:
>
>  Parse input file:     once
>  Ended due to:         interruption
>
>  Queries sent:         4694 queries
>  Queries completed:    4369 queries
>  Queries lost:         305 queries
>  Queries interrupted:  20 queries
>
>  Avg request size:     39 bytes
>  Avg response size:    153 bytes
>
>  Percentage completed:  93.50%
>  Percentage lost:        6.50%
>
>  Started at:           Mon Sep  8 01:33:03 2008
>  Finished at:          Mon Sep  8 01:35:53 2008
>  Ran for:              170.731505 seconds
>
>  Queries per second:   25.589887 qps
>
>
> Vi muitos erros no log do named referente ao RFC 1918.
> Será que poderia ser esse os erros exibidos no teste ?
>
> Abraço!
>
>
> --------------------------------------------------
> From: "Ricardo Rodrigues" <rcr.listas at ig.com.br>
> Subject: Re: [GTER] Problemas com Bind 9.5.0-p2
>
> Muito bom, Eduardo.
>
> O ideal é rodar o dnsperf a partir de uma máquina distinta do servidor
> DNS que você está testando. Desta forma o teste fica mais parecido com
> o cenário real e pode ajudar a identificar possíveis problemas de rede
> (firewall/iptables, etc).
>
> Dependendo da carga que seu servidor DNS deva suportar, você pode
> aumentar o número de requisições simultaneas do dnsperf (opção -q). O
> valor default é 20, eu costumo testar com 10000. Mas use com cuidado,
> o consumo de CPU do servidor DNS pode aumentar bastante com esta
> carga.
>
> Abraços,
> Ricardo
>
> 2008/9/8 Eduardo Schoedler <eschoedler at viavale.com.br>:
>> Sobre o dnsperf do Nominum, fiz um teste com ele aqui.
>> Vejam o resultado:
>>
>> # dnsperf -d ./queryfile-example-100thousand
>>
>> DNS Performance Testing Tool
>>
>> Nominum Version 1.0.1.0
>>
>> [Status] Processing input data
>> [Status] Sending queries (to 127.0.0.1)
>> [Status] Testing complete
>>
>> Statistics:
>>
>>  Parse input file:     once
>>  Ended due to:         reaching end of file
>>
>>  Queries sent:         100.000 queries
>>  Queries completed:    100.000 queries
>>  Queries lost:         0 queries
>>
>>  Avg request size:     41 bytes
>>  Avg response size:    41 bytes
>>
>>  Percentage completed: 100.00%
>>  Percentage lost:        0.00%
>>
>>  Started at:           Mon Sep  8 00:38:41 2008
>>  Finished at:          Mon Sep  8 00:38:51 2008
>>  Ran for:              10.152553 seconds
>>
>>  Queries per second:   9849.739272 qps
>>
>>
>>
>> Aproveitei e fiz o test com o arquivo de 3 milhões também! =)
>>
>> # dnsperf -d ./queryfile-example-3million
>>
>> DNS Performance Testing Tool
>>
>> Nominum Version 1.0.1.0
>>
>> [Status] Processing input data
>> [Status] Sending queries (to 127.0.0.1)
>> [Status] Testing complete
>>
>> Statistics:
>>
>>  Parse input file:     once
>>  Ended due to:         reaching end of file
>>
>>  Queries sent:         3.000.000 queries
>>  Queries completed:    3.000.000 queries
>>  Queries lost:         0 queries
>>
>>  Avg request size:     41 bytes
>>  Avg response size:    41 bytes
>>
>>  Percentage completed: 100.00%
>>  Percentage lost:        0.00%
>>
>>  Started at:           Mon Sep  8 00:45:15 2008
>>  Finished at:          Mon Sep  8 00:50:41 2008
>>  Ran for:              325.518862 seconds
>>
>>  Queries per second:   9216.055812 qps
>>
>>
>> Conclusão até o momento: maldito hyperthread !!!
>>
>> Abraços a todos.
>>
>> Eduardo.
>>
>>
>> --------------------------------------------------
>> From: "Eduardo Schoedler" <eschoedler at viavale.com.br>
>> Subject: Re: [GTER] Problemas com Bind 9.5.0-p2
>>
>> Olá a todos !!!
>>
>> Primeiramente muito obrigado pela força.
>>
>> Bom, existe um firewall na frente dessa máquina sim.
>> Todas as saídas dos servidores DNS estão liberadas.
>> As portas de entradas estão liberadas acima de 1024 e também a porta 53,
>> tanto em TCP quanto em UDP.
>>
>> Utilizo os servers DNS em FreeBSD.
>> Os servidores são Pentium 4, com hyperthread.
>>
>> Eu fiz um alteração agora que pareceu que melhorou *MUITO*.
>> No rc.conf, setei o flag "-n 1", forçando a utilizando de 1 processador
>> cfe.
>> dica do Rubens.
>> Também aproveitei para setar o flag de ipv4 "-4".
>>
>> Ficou assim o rc.conf:
>> named_enable="YES"
>> named_flags="-4 -n 1"
>>
>> Vou ver como ele se comporta durante a segunda-feira, que é crítico para
>> nós.
>>
>> Muito Obrigado novamente !
>>
>> Abraços,
>> Eduardo Schoedler.
>>
>>
>>
>>
>> --------------------------------------------------
>> From: "Leandro Pereira de Lima e Silva" <leandro at limaesilva.com.br>
>> Subject: Re: [GTER] Problemas com Bind 9.5.0-p2
>>
>> Você não tem nenhuma regra no firewall controlando as saídas udp?
>>
>> []s Leandro
>>
>> 2008/9/5 Eduardo Schoedler <eschoedler at viavale.com.br>:
>>> Pessoal.
>>>
>>> Desde que atualizei o Bind para a versão 9.5.0-p2 para evitar o problema
>>> de
>>> cache poisoning, estou notando uma certa lentidão.
>>> Os domínios que estão em cache ele resolve bem.
>>> Porém os que não estão em cache, dá timeout de 2s... coisa que não
>>> acontecia
>>> na versão anterior.
>>> Vejam:
>>>
>>> C:\>nslookup
>>>> server 200.xxx.xxx.2
>>> Servidor padrão:  dns.dominio.com.br
>>> Address:  200.xxx.xxx.2
>>>
>>>> dominio.com.br
>>> Servidor:  dns.dominio.com.br
>>> Address:  200.xxx.xxx.2
>>>
>>> Nome =   dominio.com.br
>>> Address:  200.143.116.11
>>>
>>>> terra.com.br
>>> Servidor:  dns.dominio.com.br
>>> Address:  200.xxx.xxx.2
>>>
>>> Não é resposta de autorização:
>>> Nome =   terra.com.br
>>> Address:  200.176.3.142
>>>
>>>> cnn.com
>>> Servidor:  dns.dominio.com.br
>>> Address:  200.xxx.xxx.2
>>>
>>> DNS request timed out.
>>>    timeout was 2 seconds.
>>> *** A requisição para dns.dominio.com.br esgotou o tempo limite
>>>
>>>> cnn.com
>>> Servidor:  dns.dominio.com.br
>>> Address:  200.xxx.xxx.2
>>>
>>> Não é resposta de autorização:
>>> Nome =   cnn.com
>>> Addresses:  64.236.16.20, 64.236.16.52, 64.236.24.12, 64.236.29.120
>>>
>>>
>>> Alguém passou por problema semelhante ?
>>>
>>> Abraço!
>>> Eduardo.
>>
>> --
>> Leandro Pereira de Lima e Silva
>>
>> --
>> gter list    https://eng.registro.br/mailman/listinfo/gter
>>
> --
> gter list    https://eng.registro.br/mailman/listinfo/gter
>
> --
> gter list    https://eng.registro.br/mailman/listinfo/gter
>



More information about the gter mailing list