[GTER] Re: [GTER] Questões sobre a medição de parâmetros de qualidade ( Latência , perda de pacotes, disponibilidade)

Claus Rugani Topke claus at kerntec.net
Tue May 14 10:34:00 -03 2002


Oi Carlos,

Boa iniciativa em levantar as questões de SLA.
A última vez que fiz isso em uma reunião do IETF eles queriam me bater !
;-)

Lembrar que SLA - Service Level Agreement (~ Nível de serviço acordado)
estabelece regras de um acordo entre o fornecedor e o cliente.
Este acordo pode ser diferente entre um provedor e outro....

Apenas para enriquecer o texto...
"Numa amostra sempre é importante guardar outras características, como
a média, a variância (ou desvio padrão), máximo, mínimo, 90-95th percentile e
talvez a moda, 2 derivada, 3 derivada ?..."

Lembrando sempre que boas referências para as medidas de latência e perda
de pacotes são as RFCs 2330, 2679, 2680 e 2681.
Em http://www.advanced.org/IPPM/docs.html tem mais...
Outro texto interessante é a tese 
http://www.ravel.ufrj.br/publicacoes/teseClaus.pdf   :-)

segue os meus comentários...



At 07:29 14/5/2002 -0300, Carlos Ribeiro wrote:
>Mais um tema para discussão...
>
>Ao estabelecer um SLA, os critérios mais frequentemente lembrados (no caso de
>redes IP) são os seguintes:
>
>- latência, normalmente medida por meio de 'ping'
>- perda de pacotes
>- disponibilidade
>
>Na teoria, estes três parâmetros são úteis para determinar o nível de
>qualidade de serviço obtido. A maioria dos contratos de banda assinados hoje
>já determina alguma forma de medir estes parâmetros. O problema está na forma
>de medir e comparar os números obtidos. Por exemplo:
>
>Suponhamos que um ISP estabeleça uma perda máxima de pacotes de 1%. Parece
>bom, mas pode ser muito ruim: falta dizer qual o intervalo de medição. Em dez
>minutos, isso pode significar que rodamos por 9 minutos com 0% de perda, e
>por um minuto com 10% de perda - já é muito ruim, mas ainda seria tolerável.
>Ao longo de dez dias, pode ser que tenhamos tido 9 3/4 dias com 0% de perda,
>para ter toda a perda concentrada em seis horas (um quarto de dia), com 40%
>de perda durante esse período - o que é claramente intolerável.

É importante interpretar os valores representativos da amostra.
Sempre queremos chegar no final do mês e ter apenas 1 valor representativo 
da amostra.
A amostra pode ser melhor representada utilizando outras características 
estatísticas
além da média (max, min, 95th percent, etc...)
Lembro-me do meu professor sobre a história do homem que morreu quando
queria atravessar um lago com profundidade média de 1,5 metros, esquecendo que
em alguns momentos o lago chegava a 5 metros de profundidade...


>O exemplo acima é artificial, mas mostra claramente a importância de definir
>corretamente as condições em que os parâmetros de qualidade são medidos. É
>muito comum ver na prática acordos de SLA formais (estabelecidos em contrato)
>que deixam várias dessas questões em aberto. Podemos listar algumas outras
>condições similares:
>
>1. Latência:
>
>1.1. qual seria a latência máxima tipicamente tolerável?
>1.2. qual seria o intervalo de tempo considerado para fins de cálculo do
>percentual?

Talvez neste caso o percentual nao fosse a questão.

>1.3. qual é o trecho da rede onde a latência é medida?
>1.4. é possível garantir que a rota utilizada para medir latência é a mesma
>que o tráfego utiliza para passar?
>1.5. qual a metodologia de medição? (medições diárias, aleatórias, etc.)

O que voce quer dizer é o período de amostragem ?

>1.6. qual o efeito da distribuição do tamanho de pacotes sobre a medida?

Para efeitos de medida de latência, o tamanho do pacote deveria ter tamanho 
único...

>1.7. os dados podem ser auditados por terceiros, ou só podem ser medidos
>dentro da rede do provedor, por ele mesmo?
>
>2. Perda de pacotes
>
>2.1. qual seria a perda máxima tipicamente tolerável?
>2.2. qual seria o intervalo considerado para fins de cálculo de percentual?

Período de amostragem, e quantidade da amostra. No caso seria pacotes recebidos
e pacotes enviados...

>2.3. qual é o trecho da rede onde a perda é medida?
>2.4. qual a origem dos dados:
>2.4.1. estimativa indireta por meio de 'ping'

Talvez utilizando probes TCP fosse mais realista pois afinal 90% do tráfego 
é TCP.
Como escrito na RFC2330 o pacote ICMP tem pouca prioridade nos roteadores,
se a perda de pacotes for alta, pode ser uma estimativa razoável...

>2.4.2. medição da capacidade de entregar o tráfego real ofertado pelo cliente
>(upstream)

Ao meu ver a interpretação da perda de pacotes deve ser levada apenas em 
consideração
para a avaliação do caminho... Ou seja, o quanto do caminho está 
engargalado, ou com erros de
CRC e similares.
A capacidade deveria ser outro parâmetro.

>2.4.3. medição da capacidade de entregar o tráfego real destinado para o
>cliente (downstream); neste caso, basta mostrar que todos pacotes chegam ao
>edge router onde o cliente está ligado, pois pode haver congestionamento no
>link do cliente propriamente dito.
>2.5. qual a periodicidade da medição? (contínua, amostras diárias, etc.)
>2.6. os dados podem ser auditados por terceiros, ou só podem ser medidos
>dentro da rede do provedor, por ele mesmo?
>
>3. Disponibilidade
>
>3.1. A disponibilidade se refere ao link de acesso, ou ao serviço como um
>todo?
>3.2. Como podemos caracterizar e medir indisponibilidade parcial, como por
>exemplo:
>- perda de parte da capacidade de upstream do ISP
>- perda de parte da tabela de roteamento



No que eu sei, no Brasil apenas a Embratel tem dados (consolidades) 
públicos das variáveis SLA medidas...
http://www-sla.embratel.net.br/sla_pub/evolucaomensal.html
Alguém sabe de outra operadora que tenha estes dados públicos ?





Abraços,
Claus




>Carlos Ribeiro
>CTBC Telecom
>--
>GTER list    http://eng.registro.br/mailman/listinfo/gter





More information about the gter mailing list