[MASOCH-L] Alto uso de software interrupts (%si + irqs/seq) ksoftirqd
"Tiago A. Peçanha"
tiago at symetric.com.br
Thu Nov 22 10:20:51 -03 2012
Essa realmente é o planejamento para o novo cenário. Mas estamos
precisando dar um ajuste para estender a vida útil um pouco mais até que
o novo cenário esteja resolvido.
Em 21/11/2012 17:43, Lucas Willian Bocchi escreveu:
> Como muito bem respondeu o Henrique, apenas complemento que borda é borda,
> firewall é firewall. Não é muito bom misturar as estações.
> Se puder dividir o trabalho da máquina, melhor.
>
>
> Em 21 de novembro de 2012 17:31, Henrique de Moraes Holschuh<
> henrique.holschuh at ima.sp.gov.br> escreveu:
>
>> On 21-11-2012 17:21, Tiago A. Pecanha wrote:
>>
>>> Boa tarde a todos,
>>> Estou com uma situação aqui bem estranha. De um tempo para cá um servidor
>>> DELL (16GB RAM) com quagga + iptables que está funcionando como borda
>>> começou a apresentar uma alta utilização de cpu pelo processo: ksoftirqd e
>>> isso gera aumento de latência e lentidão na rede.
>>>
>>> Investigando, percebi que quando desativo as regras de prerouting
>>> (mangle) o problema não ocorre, ou se ocorre, é raro.
>>>
>> ksoftirqd alto implica que o kernel está tendo que bicar o processamento
>> de pacote por excessiva latência.
>>
>>
>> Segue detalhes do pert top:
>>> PerfTop: 53248 irqs/sec kernel:99.1% [100000 cycles], (all, 4 CPUs)
>>> ------------------------------**------------------------------**
>>> ------------------
>>>
>>> samples pcnt kernel function
>>> _______ _____ _______________
>>>
>>> 69219.00 - 35.2% : __nf_conntrack_find [nf_conntrack]
>>> 35383.00 - 18.0% : nf_conntrack_tuple_taken
>>> [nf_conntrack]
>>> 12884.00 - 6.6% : ipt_do_table [ip_tables]
>>> 11483.00 - 5.8% : __nf_conntrack_confirm [nf_conntrack]
>>>
>> Precisa mesmo de conntrack na borda? Aqui marcamos tudo como NO_TRACK,
>> exceto o que for direcionado à caixa propriamente dita. Melhor ainda é
>> retirar do kernel o suporte (e tire o ebtables também).
>>
>>
>> NMI: 107596285 107592380 107599814 107591919 Non-maskable interrupts
>> Muita NMI. Descubra porquê, e resolva. Não é normal, nem é boa ideia. Se
>> for o NMI watchdog, você realmente precisa dele com uma frequência tão alta
>> assim?
>>
>> Tente utilizar o irqbalance para ver se o comportamento geral das
>> interrupções melhora um pouco, você está com tudo em round-robin, o que nem
>> sempre é bom devido a efeitos de cache.
>>
>>
>> PMI: 107596280 107592379 107599813 107591912 Performance monitoring
>>> interrupts
>>> PND: 107569857 107566488 107574071 107566157 Performance pending
>>> work
>>>
>> Pare de rodar perf se não estiver precisando dele. Isso não sai de graça,
>> perturba o cache e gasta tempo de CPU.
>>
>> De resto, faça o tunning da NAPI via ethtool e parâmetros dos drivers da
>> placa de rede, para ter certeza que não está entrando em modo de polling
>> por excesso de interrupções.
>>
>> --
>> Henrique de Moraes Holschuh<hmh at ima.sp.gov.br>
>> IM@ - Informática de Municípios Associados
>> Engenharia de Telecomunicações
>> TEL +55-19-3755-6555/CEL +55-19-9293-9464
>>
>> Antes de imprimir, lembre-se de seu compromisso com o Meio Ambiente
>> e do custo que você pode evitar.
>>
>>
>> __
>> masoch-l list
>> https://eng.registro.br/**mailman/listinfo/masoch-l<https://eng.registro.br/mailman/listinfo/masoch-l>
>>
> __
> masoch-l list
> https://eng.registro.br/mailman/listinfo/masoch-l
More information about the masoch-l
mailing list