[GTER] Linux + ksoftirqd

Kalil de A. Carvalho kalilac at gmail.com
Wed Jul 29 08:20:16 -03 2015


Bom dia senhores.

Respondendo a pergunta do Marcelo: A rigor o problema ainda existe.

Eu tenho um RHEL 7 rodando Quagga (0.99.22.4 da própria distribuição)
instalado em um ServerU L-800 com 16GB de RAM e um disco de 60GB SSD
(informações desnecessárias mas estou colocando para entenderem que a
maquina, para meu caso, deveria funcionar sem problemas) usando interfaces
de rede Intel chipset Intel i210AT nas portas 0 e 1 e Intel 88E1543 nas
portas 2-5

Pois bem esta maquina, literalmente, do nada começou a apresentar este
comportamento ksoftirq. Passamos três messes sem ter qualquer problema e em
um dado dia os nossos clientes começaram a ligar reclamando. Até demorarmos
para perceber que tinha um núcleo em 100$, por que afinal temos oito...
qual a diferença que um faria? O que importa que o "dito cujo ksoftirq"
fique requisitando... desde que o load fica em até 8 ta tudo beleza...
pensávamos... Depois de ficar rodando feito cachorro atras do rabo mudamos
para nossa maquina secundarai (igual a esta que estou descrevendo) e tudo
normalizou. Após umas quatro horas o ksoftirq acabou o seu trabalho e
liberou o processador.

Verifiquei o pude sessão BGP caindo, inundação ARP, ataque, instalação
indevida, falha em cabeamento, falha nos swithcs, erro de configuração
nossa, problema de filtros com as operadoras, mandinga, mal olhado, mandei
benze....

A minha ultima ação foi atualizar o sistema onde foi corrigido algumas
coisas do kernel. Misteriosamente estamos a oito dias sem problemas, o que
erra uma situação diária. Não acredito que tenha sido resolvido dada a
característica do inicio, novamente foi do nada.

O processo de passar o roteamento de borda para FreeBSD esta ganhado força,
como entusiasta de desafios vejo isso com bons olhos mas tem o caso de ser
uma mudança grande e ter pouca (ou quase nenhuma) experiência em suporta
este S.O. porem a credibilidade esta abalada com a atual situação.

Busquei em vários fóruns e não existe uma explicação unica, uma razão
precisa (tendo em vista que cada um rodava uma coisa diferente na
distribuição que usava) que cria uma linha de solução para isso. Fora que
as discussões não são novas, já relatei aqui a ultima com resposta data de
2012 sendo assim acreditava que tinha uma solução ou orientação.

Bem senhores é essa a minha realidade, em resumo eu estou passando pelo
problema.

2015-07-28 20:11 GMT-03:00 Bruno Cabral <bruno at openline.com.br>:

> No caso da CCR nao é intel com slot PCI pra consumir IRQs. outra
> arquitetura, funciona diferente
>
> !3runo
>
> --
> Cursos e Consultoria BGP
> http://f2link.f2b.com.br/impressora3d
>
>
> > Tudo bem, talvez não tenha dito e especificado da melhor forma. A
> > CRR1036 em laboratório passa (ok, é diferente da vida real), mas por
> > outro lado leve-se em conta que é certificado pelo fabricante passar
> > pelo menos 4Gbps até 15Gbps de Routing (12 a 15 a  em fast path) e em
> > alguns modelos até 27Gbps.
> >
> > Mas o ponto principal dessa questão é o que fizeram com o ksoftirqd
> > nesses casos (se fizeram algo) e porque nesses casos afeta menos ?
> >
> > Abraços
> > Fernando
> >
> > On 28/07/2015 15:59, Bruno Cabral wrote:
> > > Quem está passando 10G em CCR?? O maior que conheço tem 2,5Gbps
> > >
> > >> Dois produtos comerciais bastante utilizados por muitas pessoas aqui
> na
> > >> lista, RouterOS (Mikrotik) e ExtremeXOS (Extreme Networks) tem Linux
> > >> como base e passam multiplos Gigabits de tráfego numa boa
> (desconsidere
> > >> problemas não relacionados como as rotas presas no RouterOS). Digo 10+
> > >> Gbps em uma caixa de 1U.
> > >>
> > >> Sabido disso que tipo de técnica será que eles usam para lhe dar com o
> > >> ksoftirqd quando é o caso, ou será que todos desenvolveram uma técnica
> > >> proprietária só sua ?
>
> --
> gter list    https://eng.registro.br/mailman/listinfo/gter
>



-- 
Atenciosamente,
Kalil de A. Carvalho



More information about the gter mailing list