Taxa de amostragem x profundidade de bits x taxa de bits: o que são?

Tempo de leitura: 9 minutos

Você está querendo mergulhar no mundo da audiofilia e é instantaneamente bombardeado com termos que não conhece. Ei, isso acontece com todos nós! A melhor coisa a fazer é começar devagar e molhar os dedos dos pés com alguns dos princípios básicos. Em sua jornada para se tornar um audiófilo, você encontrará frequentemente estes termos: taxa de amostragem, profundidade de bits e taxa de bits. O que eles significam e por que você deveria conhecê-los? Vamos mergulhar!

Antes de partirmos, a vida do audiófilo pode esgotar uma carteira num piscar de olhos. Em primeiro lugar, uma configuração de áudio simples pode consistir em um pré-amplificador, amplificador, DAC, streamer e às vezes mais. Parece que você precisa de muitos dispositivos, e eles podem ser bastante caros! Não deixe que isso o assuste, no entanto. Ser um audiófilo não significa pagar US$ 3.500 por equipamentos sofisticados.

Temos um guia para ler antes de você pagar muito dinheiro por dispositivos de áudio caros. Ele educa você sobre algumas coisas que você deve saber antes de passar o cartão. Não deixe de conferir.

O que é taxa de amostragem?

Ser um audiófilo significa prestar atenção a mais números aparentemente aleatórios em caixas de equipamentos de áudio e sites. Entre esses números, você provavelmente notou números como 44,1kHz, 48kHz, 96kHz e 192kHz. Estes são chamados Taxas de amostragem. Este termo é bastante simples de entender se você pensar em um arquivo de áudio como uma imagem.

Quando uma câmera digital tira uma foto, a luz incide sobre o sensor da câmera por uma fração de segundo. O sensor divide a luz em pequenos pacotes de dados, e cada pacote é diferente. Esses pequenos pacotes de dados são mais conhecidos como pixels. O número de pixels por polegada quadrada em uma imagem é chamado de resolução.

Bem, pense na taxa de amostragem como a resolução de um arquivo de áudio. As ondas sonoras são divididas em pequenos pacotes, cada um com seus próprios dados exclusivos. Somente esses pacotes são chamados de Amostras. As regras de pixels e amostras são semelhantes. Quanto mais pixels compactados em uma polegada quadrada, maior será a resolução e mais nítida será a imagem. Bem, quanto mais amostras comprimidas em um segundo, maior será a taxa de amostragem e mais nítido será o áudio.

Quando você grava áudio, seu microfone converte as ondas sonoras em um sinal elétrico. Esse sinal viaja para o ADC (Conversor Analógico para Digital) do seu dispositivo, que é o oposto de um DAC (Conversor Digital para Analógico). O ADC coleta amostras desse sinal elétrico e depois o converte em uma sequência de 1s e 0s. Esses então se tornam seu arquivo de áudio.

Taxas de amostragem padrão

Existem diferentes taxas de amostragem padrão e elas estão listadas acima. Você já viu frequentemente 44,1kHz, é isso que é usado em “música com qualidade de CD”. Isso significa que cada segundo de áudio foi dividido em 44.100 amostras. 44,1kHz é uma taxa de amostragem bastante padrão em toda a indústria de áudio. Pense nisso como o equivalente de áudio a 1080p. É bastante nítido para ouvintes comuns, e grande parte da música que você ouve tem taxa de amostragem. Se você ouve arquivos MP3, provavelmente está ouvindo música com essa taxa de amostragem.

Em seguida, há 48kHz um pouco mais alto. Assim como 44,1kHz, 48kHz é bastante padrão em todos os aspectos. É uma taxa de amostragem um pouco mais alta, o que significa que o áudio soará um pouco mais claro. 48kHZ é outro padrão usado pela maior parte da indústria. Quando compositores e engenheiros de áudio estão fazendo música, eles querem ter certeza de que não estão sobrecarregando demais seus computadores. Usar taxas de amostragem mais altas sobrecarrega mais o processador do computador, e é por isso que algumas pessoas optam por 44,1kHz e 48kHz.

Além disso, se você é um usuário do Android, deve estar familiarizado com essa taxa de amostragem. O sistema converte tudo automaticamente para uma taxa de amostragem de 48kHz, ao contrário dos iPhones que atingem 192kHz. Mesmo que o áudio tenha uma taxa de amostragem mais alta, como 96kHz, o sistema reduzirá a resolução para 48kHz. Existem apenas alguns aplicativos que contornam essa limitação, e Tidal e QOBUZ.

O próximo padrão é 96kHz. Tem o dobro da velocidade de 48kHz, por isso é duas vezes mais nítido. Você verá que alguns dos equipamentos de áudio de alta qualidade podem enviar áudio nessa taxa de amostragem. Se você é um audiófilo, provavelmente perceberá a diferença entre 96kHz e outras taxas de amostragem.

Por último, temos 192kHz. Novamente, é o dobro de 96kHz e você não encontrará nenhuma música gravada em uma taxa de amostragem mais alta. Isto é para pessoas que desejam a taxa de amostragem mais alta que a indústria pode oferecer.

Por que 44,1kHz é especial?

De todas as taxas de amostragem padrão, 44,1kHz parece se destacar. Não é divisível por 48 e é o único com vírgula decimal. Então, por que é o padrão definitivo de qualidade de CD? Bem, tem tudo a ver com o teorema de Nyquist-Shannon. Agora, aprofundar-se muito nisso transformaria isso em um ensaio universitário completo, então vamos mantê-lo básico.

O teorema de Nyquist-Shannon afirma que, para que um sinal seja reconstruído com precisão, ele deve ser amostrado em pelo menos duas vezes a sua frequência mais alta. O teorema não se aplica apenas ao áudio, mas não vamos nos aprofundar muito com este.

O ouvido humano pode ouvir tons tão altos quanto 20kHz (20.000Hz). De acordo com o teorema de Nyquist-Shannon, para reconstruir adequadamente um som para o ouvido humano, esse som deve ser amostrado a uma taxa duas vezes maior que a frequência mais alta que um ser humano pode ouvir. Como o ouvido humano pode ouvir frequências tão altas quanto 20.000 Hz, o som precisa ser amostrado em pelo menos 40 kHz (40.000 Hz).

Qualquer valor inferior a isso e o ouvido humano será capaz de ouvir degradação na qualidade. Existem taxas de amostragem abaixo de 44,1kHz, como 36kHz, 24Hz e assim por diante. Obviamente, você não gostaria de ouvir nenhuma música com essas taxas de amostragem.

Quanto ao motivo pelo qual o padrão é 44,1kHz e não 40kHz, existem várias teorias e explicações que tentam explicá-lo. No entanto, nenhum deles parece chegar a uma explicação sólida.

O que é profundidade de bits?

Na maioria das vezes, quando você vê uma taxa de amostragem, ela é acompanhada por outro número. Normalmente você veria números como 16 bits, 24 bits e 32 bits. Este número é o Profundidade de bitse as pessoas normalmente confundem esse número com a taxa de bits. No entanto, esses números são completamente diferentes.

As pessoas também confundem profundidade de bits e taxa de amostragem, dizendo que uma profundidade de bits maior leva a áudio de maior resolução. Embora isso não seja tecnicamente verdade, uma profundidade de bits maior leva a um áudio com melhor som. Por que é que?

Vamos dar uma olhada no ADC (Conversor Analógico para Digital). Como você pode imaginar, o ADC coleta amostras de uma onda de áudio e converte cada uma delas em um sinal digital. Cada amostra representa uma parte da onda sonora e é distinta de outras amostras. O problema é que a qualidade do ADC determina a precisão de cada amostra.

Exemplo simplificado

Portanto, uma boa maneira de analisar a profundidade de bits é observar um exemplo simplificado. Usaremos uma onda sonora simples, uma taxa de amostragem de apenas 16 Hz, um ACD com apenas quatro pinos (dois de cada lado, portanto este é um ADC de 2 bits) e um ADC com oito pinos (quatro de cada lado) .

Como observação lateral, o número de pinos em cada lado nem sempre determina a profundidade de bits. Diferentes fabricantes desenvolveram diferentes tipos de ADCs com diferentes números de pinos à medida que a profundidade de bits aumenta. No entanto, para fins deste artigo, manteremos as coisas simples e faremos com que o número de bits corresponda às pontas.

Observando o gráfico abaixo, o eixo X é a taxa de amostragem e o eixo Y é o bit. Vemos a onda simples representada no gráfico. Você notará que este sinal de 2 bits possui quatro linhas no eixo X. Explicaremos o porquê daqui a pouco.

Gráfico de profundidade de bits 1
Gráfico #1

Observe o gráfico nº 2 e observe que há pontos que representam a forma aproximada da onda. Cada ponto fica onde a onda cruza o eixo X e o eixo Y. Se a onda não atingir exatamente uma interseção, o ponto será colocado na interseção mais próxima da onda.

Gráfico de profundidade de bits 2
Gráfico #2

Os gráficos 3 e 4 desenharão uma linha entre os pontos. Você percebe como, como o espaço entre os bits é tão grande, é difícil representar graficamente a onda corretamente? Não estamos vendo uma representação adequada da onda. Por que é assim?

Bem, vamos dar uma olhada em um gráfico do nosso ADC. Vemos que o chip possui apenas dois pinos. Como afirmado anteriormente, o microfone converte ondas de áudio em um sinal elétrico, e esse sinal viaja para o ADC para ser dividido em amostras. Cada amostra será uma sequência de até dois dígitos binários (1s e 0s) porque existem apenas duas pontas.

ADC de 2 bits

Digamos, por exemplo, que a primeira amostra será 10, a segunda será 01 e assim por diante. Existem quatro sequências possíveis diferentes que um ADC de 2 bits pode produzir (11, 00, 10 e 01). É por isso que existem quatro linhas no eixo X.

À medida que a profundidade de bits aumenta, também aumenta o número de dígitos binários possíveis. Um 4-ADC pode produzir 16 combinações diferentes porque cada sequência pode ter até quatro dígitos (0000, 0001, 0011…). Um ADC de 8 bits pode produzir 256 combinações. Para encontrar o número de combinações possíveis, basta pegar 2 e elevá-lo à potência da profundidade de bits. Portanto, 2² = 4, 2⁴ = 16, 2⁸ = 256 e assim por diante.

Agora, vamos dar uma olhada em um ADC de 4 bits.

ADC de 4 bits

O eixo X será mais denso. Isso significa que os pontos serão capazes de traçar a onda com mais fidelidade. Um ACD de 4 bits ainda tem alguns problemas para traçar a onda, mas você pode ver que o gráfico é um pouco mais fiel.

Ninguém gravaria realisticamente uma música com um ACD de 4 ou mesmo 8 bits. O mínimo da indústria é áudio de 16 bits. Um ADC de 16 bits pode produzir até 65.536 combinações, o que seria muito difícil de colocar em um gráfico. No entanto, um gráfico como esse seria capaz de representar adequadamente a onda. Temos que levar em conta também que a taxa de amostragem seria muito maior em um ADC profissional.

Como a profundidade de bits afeta o áudio?

Como você pode imaginar, um ADC de 2 bits não consegue reproduzir o sinal corretamente porque precisa arredondá-lo constantemente para cima ou para baixo. Isso é chamado de quantização. Quanto mais extrema a quantização, mais ruído você obtém no sinal. A amplitude do sinal continua caindo ligeiramente acima e abaixo da onda real. Isso causa ruídos aleatórios. À medida que o áudio é reproduzido, você ouve esses pedaços aleatórios de áudio se acumulando e se transformando em ruído branco.

Esta pode não ser uma comparação individual, mas pense no ruído digital em um vídeo. Você vê pequenos pedaços de cor em todo o vídeo entrando e saindo. Isso pode ser semelhante ao ruído branco em um arquivo de áudio.

O que é taxa de bits?

Como afirmado antes, as pessoas normalmente confundem profundidade de bits e taxa de bits. A taxa de bits é um pouco mais fácil de explicar; não requer tantos gráficos; na verdade, é apenas uma equação.

Para obter a taxa de bits, você pega a taxa de amostragem e multiplica-a pela profundidade de bits. Você então pega esse produto e multiplica-o pelo número de canais de áudio (normalmente 2). Por último, pegue esse número grande e divida-o por 1.000.

Então, vamos dar um exemplo típico: 16 bits/44,1kHz. Em primeiro lugar, não multiplique 16 por 44,1. Como 44,1kHz representa 44.100 amostras por segundo, você deve multiplicar 16 por 44.100. (44.100 × 16 = 705.600).

Pegue esse número e multiplique por 2, pois seu áudio possui dois canais. (705.600 × 2 = 1.411.200).

O grande número que você obtém é o número de bits por segundo. Para obter um número mais limpo, divida-o por 1.000 e você obterá o número de kilobits por segundo. (1.411.200 ÷ 1.000 = 1.411,2). Portanto, a taxa de bits é 1.411,2 kbps. Você pode perceber isso ao observar as especificações de áudio de um CD ou de uma música com qualidade de CD.

Outras taxas de bits típicas que você verá são 128kbps, 196kbps e 320kbps. Com maior profundidade de bits e taxas de amostragem, você obterá taxas de bits mais altas.

Fique de olho nesses termos

A melhor coisa que você pode fazer é se familiarizar com a linguagem. Tornar-se um audiófilo pode ser um processo bastante caro e complicado. No entanto, conhecer esses termos pode ajudar muito! Por exemplo, se você está procurando um par de fones de ouvido/fones de ouvido Bluetooth, você vai querer saber com quais codecs eles são compatíveis. Codecs como o aptX HD da Qualcomm atingem 24 bits/48kHz. Se você deseja uma experiência auditiva de alta qualidade, você deseja obter um par que seja compatível com esse codec, em vez de um codec com limite de 16 bits/44,1kHz.

Além disso, você sabia que o Android tem um limite que impede que a qualidade do áudio ultrapasse 48kHz? Isso é importante saber se você é um usuário do Android. Por último, você deseja montar uma configuração de áudio? Bem, você vai querer saber as especificações do seu DAC, amplificador, pré-amplificador e outros dispositivos, e a taxa de amostragem, profundidade de bits e taxa de bits estão entre essas especificações.

Saber mais sobre o áudio que chega aos seus ouvidos é o primeiro passo na sua jornada para se tornar um audiófilo.

Rolar para cima
Pular para o conteúdo