[GTER] Hold Time - BGP

Klaus Schneider klausps at gmail.com
Sat Mar 16 05:30:12 -03 2013


2013/3/16 Eduardo Fontinelle <eduardo at gerencianet.com.br>

> *Fábio,*
>
> As duas configurações que você falou existem no mikrotik também. Eu só me
> confundo com as duas eventualmente.
>
> *Douglas,*
>
> Sua memória está boa! Aqui é um rádio Ericsson, fornecido pela Embratel
> mesmo. Mas uma coisa interessante que aconteceu aqui: eu derrubei as 3
> sessões estabelecidas (A EBT usa 2, uma nacional e outra internacional) e
> conectei novamente. O CPU ficou em torno dos 50%. Vou fazer depois um teste
> de vazão no momento em que uma sessão é estabelecida e aviso o que
> acontece.
>
>
Quanto ao valor, bom, colocar um valor baixo(como uptream) pode levar os
prefixos do cliente a ter um flap dampening em caso de uma falha temporária
no seu transporte. Tome cuidado com esses valores.



Esse problema que você exemplificou pode explicar o porque que as sessões
> estão caindo todos os dias. É bem comum acontecer isso no interior!
>
>
> *Lend e Rubens,*
>
> Eu estava com o Hold Time de 20 segundos e o keepalive padrão (Não sei
> quanto é). Também gostei dos seus números e coloquei algo próximo: Hold
> Time em 40 e Keepalive em 20.
> Com o Hold Time em 20, percebi que a sessão caía, pelo menos, 1 vez por
> dia, em todas as sessões estabelecidas. Vou ver se ainda vai continuar.
>

O padrão é 3 keep para formar um hold time.


>
> *Gustavo, Rodrigo,*
>
> Se eu for aprender tudo o que eu preciso e tudo o que eu gostaria, preciso
> de mais umas 28 pessoas! Não conheço das tecnologias que os senhores estão
> falando, mas já coloquei aqui no meu "kanban" de coisas para aprender! :)
>
> *Bruno,*
>
> Você falou uma coisa que eu não tinha me atentado ainda. O descarregamento
> e carregamento. Quando todas caem e voltam, demora aproximadamente 50
> segundos até o CPU voltar ao normal. Porém, acho que este tempo não vai me
> prejudicar. Eu deixo todas as sessões estabelecidas. Quando uma dá pala, a
> outra já está na agulha!
>
> Ele falou em um hardware de certa forma robusto, que leva 30s para
carregar as rotas na RIB, isso não quer dizer que o routeros vai instalar
essas rotas na FIB em 30s, muito menos DESINSTALAR e INSTALAR novamente,
além do velho conhecido problema de stuck routes no routeros. Colocar tempo
baixo demais pode piorar ainda mais essa situação.

Eu diria para verificar também o tempo do scan time do BGP no routeros, eu
já pesquisei, mas não há documentação aparentemente. O scan time é tão
quanto o hold time.


> Valeu pela ajuda pessoal. Vou deixar o Hold Time em 40 e o Keepalive em 20
> e vê no que dá!
>

Eu considero esses valores baixos demais, no dia que você tomar um
dampening de 30min, vai se arrepender de ter usado esses valores =)

IMHO, o mínimo deve ser 30 para keep e 90 para hold, eu pessoalmente uso o
padrão.

Eduardo, não se esqueça que os valores que você configura valem apenas para
o seu lado, portanto os seus anúncios vão continuar na operadora até que o
BGP dela desative a sessão por falta de keep alives.

Já tive vários problemas com clientes que usavam ROS e colocavam holdtime
muito baixo e o meu cisco ficava flapando a sessão diariamente. Tome
cuidado com esses valores, muito cuidado.

Abraço.


>
> *Eduardo Fontinelle*
> Analista de Sistemas
> +55 (31) 3603-0800
> +55 (31) 3603-0829 - Ramal: 309
>
>
> Em 15 de março de 2013 11:31, Rafael Ganascim <rganascim at gmail.com
> >escreveu:
>
> > Em 15 de março de 2013 11:22, Rubens Kuhl <rubensk at gmail.com> escreveu:
> >
> > > 2013/3/15 Eduardo Fontinelle <eduardo at gerencianet.com.br>
> > >
> > > > Hum, muito obrigado pela informação Rubens.
> > > >
> > > > Eu coloquei 20 segundos mas notei que uma ou duas vezes no dia a
> > mensagem
> > > > não chega. Eu gostaria que as rotas fossem "migradas" do link com
> > > problemas
> > > > para o link funcionando no menor tempo possível, porém, só conheço
> este
> > > > parâmetro.
> > > > O que vocês recomendam?
> > > >
> > > >
> > > 60s de hold-time e 20s de keep-alive, como já citaram, são números que
> me
> > > agradavam. Link com problema x link funcionando é algo que é às vezes é
> > > difícil de avaliar, não é sempre algo tão digital, às vezes é aumento
> de
> > > índice de perdas, latência ou ambos.
> > >
> > > Este artigo contém ótimas de convergência BGP:
> > > http://blog.ine.com/2010/11/22/understanding-bgp-convergence/
> > >
> > > Mas eu não acredito que a maior parte dessas técnicas de convergência
> > > esteja implementada em RouterOS, apenas em IOS e JunOS.
> > >
> > >
> > > Rubens
> > > --
> > > gter list    https://eng.registro.br/mailman/listinfo/gter
> > >
> >
> >
> > Aproveitando o assunto, como já citaram o BFD para melhorar a
> convergência
> > do BGP.
> >
> > Alguém está utilizando aqui no BR com as operadoras? Como tem sido os
> > falso/positivos? E os timers?
> >
> >
> >
> > Rafael
> > --
> > gter list    https://eng.registro.br/mailman/listinfo/gter
> >
> --
> gter list    https://eng.registro.br/mailman/listinfo/gter
>



-- 
/*
 * Klaus Schneider
*/



More information about the gter mailing list