quarta-feira, 23 de março de 2016

Monitoramento - 95 percentil - Método de faturamento do percentil 95 explicado

Método de faturamento do percentil 95 explicado


Há muita confusão em torno da medição da largura de banda do percentil 95. Portanto, este blog destina-se a fornecer informações detalhadas sobre o percentil 95 e como ele se comporta em comparação com outros métodos de medição de largura de banda.
O percentil 95 é um método de medição do uso da largura da banda que permite aos clientes estourarem um pouco sua taxa comprometida, dando ao portador uma capacidade de escalar seu faturamento com o custo da infra-estrutura e de trânsito comprometida. É uma alternativa tanto para os dados fixos ou reais de transferência de métodos de pagamento, que são comumente vistos fora do Centro de Dados onde o estouro errático ou é proibido ou multado com contas maiores. O percentil 95 permite que um cliente experimente uma pequena explosão no tráfego sem cobrança adicional. Este método estabelece que em 95% das vezes, o uso é em torno ou abaixo do valor especificado. Por outro lado, 5% do tempo, o uso pode ser estourado além desta taxa. Um fator importante de mal-entendido é a semelhança do percentil 95 com a média de uso de largura de banda. O percentil 95 não é uma média. O percentil 95 representa o valor que sua largura de banda está acima ou abaixo 95% do tempo.
O relatório é simples. A cada 5 minutos, seu circuito é amostrado pela quantidade total de bytes transferidos. Esta quantidade de dados é em média mais de 300 segundos para estimar a taxa de transferência média para o período de tempo mencionado por segundo. Estas médias são recolhidas a cada 5 minutos e são armazenadas numa base de dados. Quando o mês é longo, os dados são organizados de cima para baixo com o top 5% de pontos de dados sendo ignorado. Os dados mais altos subsequentes mostrados depois disso tornam-se o percentil 95 médio. Assim, 5% mais rápido do seu tráfego ou 36 horas mais velozes do mês são anuladas.
CIR - Taxa de Informação Entregue
CIR ou Taxa de Informação Entregue é um método de cobrança que garante que, mesmo que sua empresa compartilha um conjunto de largura de banda com um número de outros usuários, você obterá, pelo menos uma parte dela, independentemente de quão ocupada a ligação fica. Então, dependendo da velocidade que você escolher, você a obtêm em uma base constante, independentemente de quantos usuários estejam inscritos para o transportador. Sua conexão torna-se independente, no entanto, você definitivamente vai ter que pagar por esse benefício.
Vantagens do percentil 95 sobre o CIR
Com o 95, as empresas podem pagar por aquilo que elas utilizam (até certo ponto) ao invés de ter um limite de largura de banda utilizada. É muito importante com o modelo CIR calcular com precisão a quantidade de largura de banda que a empresa usará, pois não será capaz de ir além dessa taxa sem atualizar a velocidade de conexão da empresa, o que não é o caso com a flexibilidade do percentil 95. Não há nenhuma necessidade para as transportadoras definirem limites e aplicarem várias políticas para manter o tráfego abaixo da taxa comprometida do cliente. Portanto, a medição do percentil 95 reduz a infra-estrutura do provedor e os gastos de gestão.
Uso Efetivo
O método de Uso Efetivo é calculado pela medição da taxa de transferência real. É algo semelhante ao método percentil 95. Apesar de, em vez de medir a taxa, o operador pode registar a quantidade de dados transferida ao longo do circuito para o intervalo de tempo especificado.
Vantagens do percentil 95 sobre o Uso Efetivo
Quando comparado com a medição do Uso Efetivo, o percentil 95 parece ser muito menos volátil. As empresas obtêm a largura de banda mínima garantida que os comprometem a escalar um melhor fluxo de capacidades. Clientes são muito mais cobrados do que para a mesma quantidade de dados quando se aplica o método de faturamento de Uso Efetivo, considerando-se que o efeito de um tráfego rompido é maior e é mais problemático para se preparar.
O percentil 95 tem como objetivo encontrar um meio termo entre a escalabilidade, volatilidade e o custo para o transportador e o cliente, lidando com essa tarefa muito bem. No entanto, nenhum método é perfeito. O percentil 95 é mais volátil do que a Taxa de Informação Entregue nos meses predominantemente rompidos e as demonstrações mensais podem diferir dramaticamente. Percentil 95 pode fazer você pagar por uma grande quantidade de largura de banda ociosa.
Fornecedores de Serviços Multi-homed e Empresas enfrentam o desafio de manter o seu uso de tráfego abaixo do nível comprometido com cada um de seus provedores. O recurso da PRI da Noction de Controle Comprometido aborda isso, incorporando estruturas de faturamento em seus modelos políticos. Ele permite manter o nível de comprometimento em um valor pré-configurado.
Hoje em dia o percentil 95 é um dos métodos de cobrança mais comuns utilizados pelos ISPs. Plataformas de Roteamento Inteligente como a PRI ajudam os Provedores de Serviço a fim de evitar gastos desnecessários, que ocorre cada vez que seu tráfego tenta ultrapassar o percentil 95

fonte: http://www.noction.com.br/blog/95th_percentile_explained

outras referencias:
www3.uma.pt/bento/ppt/Medidas.ppt
http://best.advicebase.net/pt/informatica/20130912164530.html
https://pt.wikipedia.org/wiki/Percentil
https://www.eecis.udel.edu/~portnoi/classroom/prob_estatistica/2007_1/lecture_slides/aula02.pdf
http://www.webhostingtalk.com.br/forums/showthread.php/3094-95th-percentile-Bandwidth-Usage

Segunda explicação:

Primeiramente, porque a metodologia existe: ela é uma forma de se contrabalancear o custo entre a disponibilidade de link e o seu uso real. A operadora que te vende link as vezes tem de fazer investimentos significativos para poder te atender (comprar um switch, ou porta de switch; passar fibra, quebrar chão - fazer obra, etc. Aí digamos, você tem uma porta de 10Gbps (cujo roteador ou linecard custou entre 15000 e 30000 dolares, mais talvez o switch que tenha custado uns 3000), mas só usa correntemente 100Mbps a um custo de, digamos, $3 por Mbps (tipo, pagando no taxímetro). Ou seja, a renda deles é mínima e você não é lucrativo. Aí você fecha um CDR (commited data rate) que é um contrato de mínimo de Mbps para ter aquele preço (o minimo que a operadora quer lucrar por uma porta do switch/roteador). Para ele ter o resto do circuito a sua disponibilidade (e em tese eles terem isso reservado sem overselling em todo o planejamento de capacidade de rede deles) e você poder chegar ao pico da porta quando quiser, é cobrado no modelo de 95%. Imagine o táxi, que te cobra por Km efetivamente rodado E MAIS um tanto por hora (parada à disposição ou andando mesmo), é uma combinação disso. O modelo de 95% inclui a "taxa de hora parada" análoga ao taxi sendo que obviamente o taxi tem 3-4 lugares, e no caso da banda, o numero de assentos disponiveis varia conforme o tamanho do taxi (tamanho da porta) e quanto vc quer ter sempre reservado pra vc.

Quem usa este tipo de procedimento são as operadoras de telecom (carriers). As operadoras SÒ FUNCIONAM ASSIM. Elas não cobram por média de uso ou por quantidade de dados trafegados. As empresas de hosting inventaram uma fórmula para vender o taxímetro por GB de dados transferidos (utilização), ao invés de por Mbps (capacidade), mas isso só funciona em escala e em modelos fechados. Se seu tráfego fizer o 95th % das empresas de hosting junto às operadoras delas se modificar, provavelmente você será convidado a pagar pelo modelo de 95% ou se retirar, pois aí estará dando prejuízo.

Dada a explicação do porque, vamos ao como:
A medida de circuitos em xth % (a maioria cobra 95%, outros como a Cogent fazem 90%) é feita de N em N minutos em contrato (normal é de 5 em 5).
Ou seja, em 30 dias, são feitas 2250 medidas de como o tráfego está naquele momento (quantos Mbps estão em uso). Formula simples: (60 min * 24h * 30d)/5 min.
Destas 2250 medidas, elas são ordenadas então em ordem crescente, e as 100-x%, ou seja, 5% maiores (ou 10% no caso da Cogent) são descartadas (113 maiores no caso dos 95%), são picos de banda "gratuitos". A maior medida então (a 114ª maior no caso dos 95%) é a cobrada como sendo sua utilização real nos 95%.
Em termos de horas, isso significa que você pode ter picos de banda de 36h por mês que não serão cobrados, já se o pico insistir na hora 36h05min ele será cobrado.

Existem algumas pouquissimas empresas de hosting que cobram pela média da sua utilização (gráfico). Em geral é a mesma coisa que cobrar por GB trafegado, a diferença básica é que, enquanto a do GB trafegado utiliza os contadores da porta do switch de maneira absoluta (entrou tanto saiu tanto de bytes), a de média de utilização utiliza as leituras de 5 em 5 minutos do uso de banda atual (por Mbps) e depois fazem uma média estatística disso, e calculam quanto de dados foram transferidos, baseado na média de Mbps usados (que é aproximada e não exata). Mas aí nesse caso TODOS os picos são considerados e não há descarte dos 5% maiores.