[GTER] RES: Juniper MX104 - afeb0 MQCHIP(0) WO Packet error

Alexandre Giovaneli - Via Real Telecom alexandregiovaneli.ti at viareal.com.br
Mon Sep 5 17:25:11 -03 2016


Boa tarde

	Passei pelo mesmo problema mas com um MX5, a Juniper fez o acesso remoto e constatou um defeito no próprio chassi, e estão me um outro chassi para substituição. O engraçado que quando você limpa a caixa e instala o sistema operacional novamente ela fica estável por 1 mês e volta a dar problema aparentando ser a memória rom.

Um abração


-----Mensagem original-----
De: gter [mailto:gter-bounces at eng.registro.br] Em nome de Alexandre Guimaraes
Enviada em: segunda-feira, 5 de setembro de 2016 16:23
Para: Grupo de Trabalho de Engenharia e Operacao de Redes <gter at eng.registro.br>
Assunto: Re: [GTER] Juniper MX104 - afeb0 MQCHIP(0) WO Packet error

Josivan,
         Descobriu qual foi o problema?

2016-08-31 11:47 GMT-03:00 Josivan Barbosa <josivan.barbosa01 at gmail.com>:

> Obrigado Diogo,
>
> Abri outro chamado para investigar o caso. Pense numa sorte... Um MX5 
> chegou a passar 600 dias sem desligar. Só desligou pq deu problema no 
> ar condicionado, a temperatura aumentou e o junos desativou a caixa 
> por segurança. O MX104 não tem nem 2 meses...
>
>
>
>
> Em 30 de agosto de 2016 17:21, Diogo Montagner 
> <diogo.montagner at gmail.com>
> escreveu:
>
> > Josivan,
> >
> > eu recomendo voce trabalhar com o JTAC para investigar se eh 
> > necessario a substituicao do HW.
> >
> > Os logs abaixo parecem indicar problemas em um banco de memoria.
> >
> > Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) DDRIF FO0 Checksum Error 
> > Information Quantum 0 bank num 4, ddrio[0].dmcN[0].bank[4] Error 
> > bcount
> 32,
> > error addr 0x3000fa => cell addr 0x3000f => row:col 0c00:0f
> >
> > []s
> > ./dmontagner
> >
> > ./diogo -montagner
> > JNCIE-SP 0x41A
> >
> > 2016-08-31 5:21 GMT+10:00 Josivan Barbosa <josivan.barbosa01 at gmail.com>:
> >
> > > Versão 13.3R9.13.
> > >
> > > Cheguei a abrir chamado na Juniper, enviei todos os logs 
> > > requisitados,
> > mas,
> > >  logo depois que abri, passou 15 dias sem apresentar nenhum erro. 
> > > A
> única
> > > mudança tinha sido a troca de um gbic e a juniper considerou que 
> > > esse
> > teria
> > > sido o problema. Porém, o problema voltou a acontecer sem que 
> > > nenhuma alteração tivesse sido feita.
> > >
> > >
> > >
> > >
> > > Em 30 de agosto de 2016 15:56, Alexandre Guimaraes < 
> > > alexandre.fguimaraes at gmail.com> escreveu:
> > >
> > > > Abre chamado na Juniper para trocar a RE.... ou comuta para RE 
> > > > de
> > backup
> > > e
> > > > veja como se comporta.
> > > >
> > > > Gerou DUMP?
> > > >
> > > > 2016-08-30 11:28 GMT-03:00 Josivan Barbosa <
> > josivan.barbosa01 at gmail.com
> > > >:
> > > >
> > > > > Bom dia senhores,
> > > > >
> > > > > Há alguns dias estamos enfrentando problemas em nosso mx104 
> > > > > que
> fazem
> > > > > perder grande volume de tráfego, sendo necessário reiniciar 
> > > > > para
> > voltar
> > > > ao
> > > > > normal. O problema é intermitente. As vezes ocorre 3 vezes no 
> > > > > dia
> ou
> > > fica
> > > > > 15 dias sem acontecer. Ainda não identifiquei o "gatilho" do
> > problema.
> > > > > No log aparecem as seguintes mensagens:
> > > > >
> > > > > Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) FO half 0 packet 
> > > > > error Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) WO Packet 
> > > > > error Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) HBIT Error
> DDRIO[0].DMC[0]
> > > E0
> > > > E1
> > > > > O0 O1, DDRIF FO0 Checksum Error Aug 30 08:00:01  R2-CGE-PB 
> > > > > afeb0 MQCHIP(0) DDRIF FO0 Checksum Error Information Quantum 0 
> > > > > bank num 4, ddrio[0].dmcN[0].bank[4] Error
> > bcount
> > > > 32,
> > > > > error addr 0x3000fa => cell addr 0x3000f => row:col 0c00:0f 
> > > > > Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) DDRIF WO Checksum 
> > > > > Error Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) DDRIF Chksum 
> > > > > Cnts
> Current
> > > > 255,
> > > > > Total 283050
> > > > > Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) FO half 0 packet 
> > > > > error Aug 30 08:00:01  R2-CGE-PB afeb0 MQCHIP(0) WO Packet 
> > > > > error Aug 30 08:00:02  R2-CGE-PB afeb0 MQCHIP(0) HBIT Error
> DDRIO[0].DMC[0]
> > > E0
> > > > E1
> > > > > O0 O1, DDRIF FO0 Checksum Error Aug 30 08:00:02  R2-CGE-PB 
> > > > > afeb0 MQCHIP(0) DDRIF WO Checksum Error Aug 30 08:00:02  
> > > > > R2-CGE-PB afeb0 MQCHIP(0) DDRIF WO Checksum Error Information 
> > > > > Quantum 0 bank num 0, ddrio[0].dmcN[0].bank[0] Error
> > bcount
> > > > 6,
> > > > > error addr 0x6000e2 => cell addr 0x6000e => row:col 1800:0e 
> > > > > Aug 30 08:00:02  R2-CGE-PB afeb0 MQCHIP(0) DDRIF Chksum Cnts
> Current
> > > > 255,
> > > > > Total 283305
> > > > > Aug 30 08:00:02  R2-CGE-PB afeb0 MQCHIP(0) FO half 0 packet 
> > > > > error Aug 30 08:00:02  R2-CGE-PB afeb0 MQCHIP(0) WO Packet 
> > > > > error Aug 30 08:00:03  R2-CGE-PB afeb0 MQCHIP(0) HBIT Error
> DDRIO[0].DMC[0]
> > > E0
> > > > E1
> > > > > O0 O1, DDRIF FO0 Checksum Error Aug 30 08:00:03  R2-CGE-PB 
> > > > > afeb0 MQCHIP(0) DDRIF WO Checksum Error
> > > > >
> > > > > Alguns dos colegas já passou por algo parecido?
> > > > >
> > > > > --
> > > > > Att
> > > > >
> > > > > Josivan Barbosa
> > > > > --
> > > > > gter list    https://eng.registro.br/mailman/listinfo/gter
> > > > --
> > > > gter list    https://eng.registro.br/mailman/listinfo/gter
> > > >
> > >
> > >
> > >
> > > --
> > > Att
> > >
> > > Josivan Barbosa
> > > --
> > > gter list    https://eng.registro.br/mailman/listinfo/gter
> > >
> > --
> > gter list    https://eng.registro.br/mailman/listinfo/gter
> >
>
>
>
> --
> Att
>
> Josivan Barbosa
> --
> gter list    https://eng.registro.br/mailman/listinfo/gter
>
--
gter list    https://eng.registro.br/mailman/listinfo/gter




More information about the gter mailing list