Como entender as estatísticas de ping do Linux

Resumo

  • O tempo médio de ping revela a duração típica da viagem de ida e volta.
  • O desvio padrão indica quanto os tempos de ping variam em relação à média.
  • Mais pings podem significar resultados mais precisos, mas a distribuição dos tempos de ping pode ser distorcida. As redes com fio podem ter tempos de ping mais baixos.


Se você executar o comando ping no Linux, poderá notar algumas estatísticas quando ele terminar. O que eles significam e como podem ajudá-lo a resolver seus problemas de rede?



Tempo médio de ping, explicado

O comando ping do Linux relata o tempo médio de ida e volta em milissegundos ou a média. Esta é a soma de todos os tempos de ping dividida pelo número de pings. Os estatísticos chamam isso de “média aritmética”.

A média é uma medida de tendência central. Ao executar ping em um endereço remoto várias vezes e calcular a média dos tempos de viagem de retorno, podemos ter uma ideia de quanto tempo os tempos de retorno normalmente levariam. Teríamos um tempo de ping “médio”.

Vamos usar o Google como exemplo e executar ping no site quatro vezes:

ping -c 4 google.com

Na parte inferior, você verá as estatísticas dos tempos de ida e volta na linha “rtt”. A média é o segundo valor separado pelo caractere ” (barra). Nesse caso, é 26,819 milissegundos.

Resultados de ping do google.com com o tempo médio de ida e volta destacado em uma caixa vermelha.

Desvio padrão de ping

Outra estatística relatada pelo ping é o desvio padrão, listado em “mdev”.


Desvio padrão do ping do google.com destacado em uma caixa vermelha.

O desvio padrão é a raiz quadrada da variância, ou a soma da média subtraída de cada ponto de dados, dividida pelo número de pontos de dados.

Há uma diferença entre um desvio padrão amostral e um desvio padrão populacional, onde o número de pontos de dados menos 1 é usado no primeiro. O comando ping do Linux, de acordo com a página do manual, informa o desvio padrão da população.

Então, o que significa o desvio padrão? O desvio padrão é uma medida de dispersão. Ele informa a distribuição dos valores em torno da média. Um valor mais baixo significa que os tempos de ping se agrupam em torno da média, enquanto um valor mais alto indica que os pontos de dados estão mais afastados da média. Se você observar os tempos de ping, verá frequentemente alguns valores discrepantes com tempos de viagem de retorno mais longos, o que aumenta o desvio padrão.


Se você notar problemas de desempenho em uma conexão, tente executar um ping em um servidor remoto. Se você observar um desvio padrão alto, significa que você ou o administrador do servidor remoto têm um mistério para resolver. Pode ser um problema com o servidor remoto ou com a sua conexão. Acho que o desvio padrão é maior em conexões sem fio do que em conexões com fio. Isso pode ser devido a coisas como interferência no sinal Wi-Fi. Se o desempenho da rede é importante, veja por que as estatísticas básicas provam que você deve usar uma conexão com fio, como jogar jogos online.

Mais Pings = Resultados Mais Precisos?

A dificuldade de avaliar os tempos reais de ping pode ser que as amostras de ping tendem a ser pequenas. Um tamanho de amostra ideal seria maior que 30, mas é comum fazer ping em máquinas por muito menos do que isso.

A principal razão para isso é que pings excessivos podem ser interpretados como uma tentativa de invasão de uma máquina remota. Portanto, quando os administradores precisam fazer ping em uma máquina, eles geralmente usam uma contagem baixa.


Seguindo o teorema do limite central, a média da amostra se aproximará de uma média de distribuição normal à medida que o número de pontos de dados aumenta. Minha experimentação questionaria se os tempos de ping seriam normalmente distribuídos, com uma curva em forma de sino.

Abaixo está um gráfico de um histograma dos tempos de ping que fiz de alguns tempos de ping na minha rede Wi-Fi para o Google usando uma amostra maior em Python e Seaborn. Você pode ver que o pico está à esquerda enquanto a cauda está à direita.

Gráfico de distribuição dos tempos de ping, mostrando inclinação à direita.

Com uma distribuição normal, você esperaria ver a famosa curva em forma de sino que é simétrica no meio. Dado o quão distorcida é a distribuição dos tempos de ping, a mediana pode ser uma medida melhor da tendência central do que a média. A mediana é o valor médio de um conjunto classificado de números e é fácil de calcular em uma planilha como Excel ou LibreOffice e em certas bibliotecas Python como NumPy. A mediana pode ser uma estimativa melhor da média porque é menos sensível a valores discrepantes do que a média.


Os tempos de ping não são tudo

Os tempos de ping parecem variar bastante nas conexões sem fio, mas isso é um problema? Pode ser para coisas como streaming e jogos online, mas esses são usos especializados. A maioria das pessoas comuns pode não perceber esse problema, exceto por alguns soluços intermitentes. Eu uso Wi-Fi com fio na maioria das vezes porque é muito mais conveniente do que conectar um cabo Ethernet ao meu laptop.

Muitas pessoas estão felizes em usar seus telefones no mundo real. A lição pode ser que os tempos de ping são importantes, mas são apenas uma pequena parte do quadro geral.

Rolar para cima