[GTER] Re: [GTER] Questões sobre a medição de parâmetros de qualidade ( Latência , perda de pacotes, disponibilidade)
Claus Rugani Topke
claus at kerntec.net
Tue May 14 10:34:00 -03 2002
Oi Carlos,
Boa iniciativa em levantar as questões de SLA.
A última vez que fiz isso em uma reunião do IETF eles queriam me bater !
;-)
Lembrar que SLA - Service Level Agreement (~ Nível de serviço acordado)
estabelece regras de um acordo entre o fornecedor e o cliente.
Este acordo pode ser diferente entre um provedor e outro....
Apenas para enriquecer o texto...
"Numa amostra sempre é importante guardar outras características, como
a média, a variância (ou desvio padrão), máximo, mínimo, 90-95th percentile e
talvez a moda, 2 derivada, 3 derivada ?..."
Lembrando sempre que boas referências para as medidas de latência e perda
de pacotes são as RFCs 2330, 2679, 2680 e 2681.
Em http://www.advanced.org/IPPM/docs.html tem mais...
Outro texto interessante é a tese
http://www.ravel.ufrj.br/publicacoes/teseClaus.pdf :-)
segue os meus comentários...
At 07:29 14/5/2002 -0300, Carlos Ribeiro wrote:
>Mais um tema para discussão...
>
>Ao estabelecer um SLA, os critérios mais frequentemente lembrados (no caso de
>redes IP) são os seguintes:
>
>- latência, normalmente medida por meio de 'ping'
>- perda de pacotes
>- disponibilidade
>
>Na teoria, estes três parâmetros são úteis para determinar o nível de
>qualidade de serviço obtido. A maioria dos contratos de banda assinados hoje
>já determina alguma forma de medir estes parâmetros. O problema está na forma
>de medir e comparar os números obtidos. Por exemplo:
>
>Suponhamos que um ISP estabeleça uma perda máxima de pacotes de 1%. Parece
>bom, mas pode ser muito ruim: falta dizer qual o intervalo de medição. Em dez
>minutos, isso pode significar que rodamos por 9 minutos com 0% de perda, e
>por um minuto com 10% de perda - já é muito ruim, mas ainda seria tolerável.
>Ao longo de dez dias, pode ser que tenhamos tido 9 3/4 dias com 0% de perda,
>para ter toda a perda concentrada em seis horas (um quarto de dia), com 40%
>de perda durante esse período - o que é claramente intolerável.
É importante interpretar os valores representativos da amostra.
Sempre queremos chegar no final do mês e ter apenas 1 valor representativo
da amostra.
A amostra pode ser melhor representada utilizando outras características
estatísticas
além da média (max, min, 95th percent, etc...)
Lembro-me do meu professor sobre a história do homem que morreu quando
queria atravessar um lago com profundidade média de 1,5 metros, esquecendo que
em alguns momentos o lago chegava a 5 metros de profundidade...
>O exemplo acima é artificial, mas mostra claramente a importância de definir
>corretamente as condições em que os parâmetros de qualidade são medidos. É
>muito comum ver na prática acordos de SLA formais (estabelecidos em contrato)
>que deixam várias dessas questões em aberto. Podemos listar algumas outras
>condições similares:
>
>1. Latência:
>
>1.1. qual seria a latência máxima tipicamente tolerável?
>1.2. qual seria o intervalo de tempo considerado para fins de cálculo do
>percentual?
Talvez neste caso o percentual nao fosse a questão.
>1.3. qual é o trecho da rede onde a latência é medida?
>1.4. é possível garantir que a rota utilizada para medir latência é a mesma
>que o tráfego utiliza para passar?
>1.5. qual a metodologia de medição? (medições diárias, aleatórias, etc.)
O que voce quer dizer é o período de amostragem ?
>1.6. qual o efeito da distribuição do tamanho de pacotes sobre a medida?
Para efeitos de medida de latência, o tamanho do pacote deveria ter tamanho
único...
>1.7. os dados podem ser auditados por terceiros, ou só podem ser medidos
>dentro da rede do provedor, por ele mesmo?
>
>2. Perda de pacotes
>
>2.1. qual seria a perda máxima tipicamente tolerável?
>2.2. qual seria o intervalo considerado para fins de cálculo de percentual?
Período de amostragem, e quantidade da amostra. No caso seria pacotes recebidos
e pacotes enviados...
>2.3. qual é o trecho da rede onde a perda é medida?
>2.4. qual a origem dos dados:
>2.4.1. estimativa indireta por meio de 'ping'
Talvez utilizando probes TCP fosse mais realista pois afinal 90% do tráfego
é TCP.
Como escrito na RFC2330 o pacote ICMP tem pouca prioridade nos roteadores,
se a perda de pacotes for alta, pode ser uma estimativa razoável...
>2.4.2. medição da capacidade de entregar o tráfego real ofertado pelo cliente
>(upstream)
Ao meu ver a interpretação da perda de pacotes deve ser levada apenas em
consideração
para a avaliação do caminho... Ou seja, o quanto do caminho está
engargalado, ou com erros de
CRC e similares.
A capacidade deveria ser outro parâmetro.
>2.4.3. medição da capacidade de entregar o tráfego real destinado para o
>cliente (downstream); neste caso, basta mostrar que todos pacotes chegam ao
>edge router onde o cliente está ligado, pois pode haver congestionamento no
>link do cliente propriamente dito.
>2.5. qual a periodicidade da medição? (contínua, amostras diárias, etc.)
>2.6. os dados podem ser auditados por terceiros, ou só podem ser medidos
>dentro da rede do provedor, por ele mesmo?
>
>3. Disponibilidade
>
>3.1. A disponibilidade se refere ao link de acesso, ou ao serviço como um
>todo?
>3.2. Como podemos caracterizar e medir indisponibilidade parcial, como por
>exemplo:
>- perda de parte da capacidade de upstream do ISP
>- perda de parte da tabela de roteamento
No que eu sei, no Brasil apenas a Embratel tem dados (consolidades)
públicos das variáveis SLA medidas...
http://www-sla.embratel.net.br/sla_pub/evolucaomensal.html
Alguém sabe de outra operadora que tenha estes dados públicos ?
Abraços,
Claus
>Carlos Ribeiro
>CTBC Telecom
>--
>GTER list http://eng.registro.br/mailman/listinfo/gter
More information about the gter
mailing list