[caiu] Severa degradação PTT-SP

Douglas Fischer fischerdouglas em gmail.com
Terça Fevereiro 4 12:18:12 -03 2025


Fala Lucas! Bão?

Sim, tem havidos casos de intermitências e indisponibilidades no IX.BR-SP.
Ser ou não generalizada é alvo de discussões acaloradas, e que a
metodologia da proteção por obscuridade tem sido um enorme desafio.
(Daqui de onde eu posso ver, a coisa é bem mais generalizada do que querem
fazer parecer.)

Sobre a "severa" degradação:
Bah... Foi-se o tempo que dizer IX.BR-SP (ou PTT-SP como estamos
acostumados) dava para delimitar um escopo de 200 ou 300 "coisas".

Temos quase 40 PIX.
Temos quase 4 mil IPs, e uns 2 mil participantes. E praticamente todo
participante que tem conexão física trás mais uns 4-5 participantes em modo
CIX.

Temos o que oficialmente é um único PIX, mas que sabemos que hoje está
dividido em pelo menos 2 PIX(um de cada vendor que só se encontrar numa
camada de P.Router(ou spine) acima deles.
E esse único PIX significa quase 50% do todo do IX.BR-SP.

Temos muito uso de Vlans Bilaterais.
Temos muitos casos de operação sobre ATM(MLPA) que não usam os
route-servers.
E temos o caso mais comum, de ATM + Route-Server.

Além disso tudo, sabidamente existe uma inflamação crônica nas glândulas
Supra-ARPeanas e Supra-NDanas.
Que anda fazendo um balaio de gato na hora de diagnosticar os problemas de
comunicação inter-participantes.

Hoje dá tranquilamente para afirmar que 100% do tempo temos pelo menos um
tipo de falha acontecendo no IX.BR-SP.
O ponto é a gente ser assertivo para não deixar espaço para que se possa
deixar fazer parecer que problemas do IXP em si sejam confundidos com
problemas dos participantes do IXP.

Diante disso tudo, peço e sugiro que traga questionamentos e colocações
mais ricas em detalhes. Mencionando por exemplo:
- Em que PIX está?
- A porta física é sua ou é CIX de alguém, de quem?
- Se a porta física é sua, qual é o vendo do equipamento do outro lado do
seu equipamento? (display ether-trunk ou show lacp detailed)
- Problema foi notada na Vlan de ATM(MLPA) ou em Vlan Bilateral?
- Acontece no IPv4 ou no IPv6?
- O problema é com um(alguns) participante(s) ou com um número grande de
participantes?
- O que as validações de resolução de ARP e Neighbor discovery apontam?

Isso torna mais assertiva a análise e diminui as frestas por onde nossos
problemas escapolem.


Em ter., 4 de fev. de 2025 às 10:43, Lucas Willian Bocchi via caiu <
caiu em eng.registro.br> escreveu:

> Bom dia senhores.
> Estamos percebendo em vários clientes uma séria degradação por quem está
> passando pelo PTT-SP. Alguém mais está com esse mesmo problema?
> _______________________________________________
> caiu mailing list
> caiu em eng.registro.br
> https://eng.registro.br/mailman/listinfo/caiu
>
>
> --> PARA SAIR DA LISTA SIGA AS INSTRUÇÕES em:
>
> https://eng.registro.br/mailman/options/caiu
>


-- 
Douglas Fernando Fischer
Engº de Controle e Automação


Mais detalhes sobre a lista de discussão caiu