O Som
O som corresponde à variação de pressão do ar resultante duma vibração: a vibração das cordas vocais (voz), a vibração das cordas de um violino, a vibração das cordas de um piano, a vibração de um tambor, a vibração da palheta de uma corneta, a vibração de um altifalante, etc.
Tem que haver então uma fonte produtora de som. E esse som é audível por nós humanos, devido à constituição do nosso ouvido, que é conforme o gráfico apresentado na Figura 1:
- O ouvido externo, constituído pela orelha e por um canal interno, que tem por função captar e conduzir por esse canal as variações de pressão do ar.
- O ouvido médio, tendo por função converter essas diferenças de pressão do ar em vibrações através da membrana do tímpano que se encontra ligada a um conjunto de 3 pequenos ossos, o martelo, a bigorna e o estribo aos quais transmite essas vibrações. Este conjunto de ossos amplia o efeito das vibrações do tímpano e transmite-as ao ouvido interno.
- O ouvido interno, constituído por uma estrutura óssea, a cóclea, em forma de caracol e cheia de líquido, à qual o estribo transmite as vibrações ampliadas. Essa cavidade, por sua vez, está envolvida por milhares de terminais nervosos que transmitem ao cérebro, cada um, informações sobre frequências específicas.
É no cérebro que essa informação é transformada no som que nós ouvimos, e que tanto pode ser um irritante ruído, como uma melodiosa música.
Essas alterações de pressão do ar são captadas pelos microfones, que as convertem numa onda eletromagnética, conforme a Figura 2. Aparelhos como o microfone, que convertem formas de energia noutras, neste caso acústica em eletromagnética, têm o nome de transdutores.
Por enquanto ainda só tivemos a conversão de um valor analógico noutro valor analógico. É agora, com a nova forma desta onda, que vamos passar a ter a conversão analógica/digital. Vejamos então a nossa onda.
Analógico para Digital
Na representação de uma onda de som simples e uniforme, evidenciam-se as suas características principais, que são a intensidade e a frequência, conforme o gráfico da Figura 3.
- A intensidade é o valor da diferença entre o pico mais alto e o mais baixo da onda.
- A frequência é o número de ciclos que se repetem por segundo. Mede-se em Hz ou ciclos/segundo
- O ciclo é a diferença entre dois pontos em que a forma da onda se repete.
Evidentemente, uma onda de som é de muito maior complexidade do que as que temos mostrado, mas não convém esquecer que não estamos a fazer um trabalho sobre som, mas sim sobre a sua digitalização.
Continuando com a nossa onda simples, vamos agora representar a sua digitalização a 4 bits (0 a 15) e com uma reduzida amostragem, tal como se pretende ilustrar no gráfico da Figura 4. A azul vê-se o formato da onda digital que resulta da amostragem recolhida.
As linhas e as colunas correspondem aos valores dos 4 bits de 0000 (0) a 1111 (15) crescendo a partir da origem nos eixos das abcissas e das ordenadas.
A linha azul (a onda digital) representa, em cada ponto, o valor binário mais próximo no eixo das ordenadas para a interceção da onda analógica com a coluna de cada valor binário do eixo das abcissas. O resultado binário, em cada ponto da onda digital, é representado junto a esse ponto a azul.
A representação em binário deste simples pedacinho de onda com esta curta amostragem, e com tão poucos bits, seria:
0111 1011 1101 1110 1111 1111 1110 1011 1000 0100 0001 0000 0000 0001 0100 0111
Mas, tanto o número de bits usado para representar os diferentes valores da onda, como a taxa de amostragem, são bem diferentes destes, se se considerar a complexidade de uma onda de som, e a necessidade de a representar de uma forma fidedigna.
Se escutássemos uma música gravada nestas condições, o que ouviríamos seria uma sucessão de sons (partes do que se pretendia gravar) que, com muito boa vontade e imaginação, poderiam parecer-se vagamente com aquilo que queríamos gravar.
A conversão é feita por dispositivos designados por ADC (Analog Digital Converter), que têm definido para cada caso as frequências de amostragem e os bits de representação.
Um ADC que converta para áudio CD (ficheiro tipo WAV, diminutivo de WAVE – Waveform Audio File Format) usará uma frequência de amostragem de 44,1 KHz, isto é, recolherá 44.100 amostras por segundo e cada amostra será representada por 16 bits, ou seja, por 65.536 valores diferentes.
Estes valores são para cada canal estéreo, portanto, deverão ser multiplicados por 2.
Assim sendo, uma música com 3 minutos de duração terá uma dimensão de
[44.100 amostras/s] x [16 bits x (3 x 60) s] x [2 canais] = 254.016.000 bits = 31.732.000 Bytes ≈ 30 MB
o que efetivamente corresponde à dimensão de uma música no formato WAV, num CD, como se pode facilmente verificar.
É como se, no gráfico da Figura 4, tivéssemos para o mesmo segundo, em lugar das 16 linhas e das 16 colunas, 44.100 colunas e 65.536 linhas.
Bom, neste momento já temos a nossa música gravada num CD, no formato WAV, sob a forma de números. Muitos zeros e uns seguidos.
O formato WAV é um formato não comprimido. Como exemplo de formatos comprimidos indicamos o MP3 (MPEG Áudio Layer 3) que, com uma razoável taxa de amostragem (128 Kb/s), consegue reduzir o tamanho dos ficheiros para cerca de 10% do original, com qualidade razoável. Maiores ou menores taxas de amostragem resultarão em melhor ou pior qualidade no som final. Este é o formato standard por excelência (entenda-se standard como sendo o formato dominante, resultante da utilização e aceitação nos mercados comerciais) na compressão áudio para transferências e reprodução de música em leitores de áudio digital.
Mas voltemos ao ficheiro WAV que gravámos em números. Nós não conseguimos ouvir números, só sons, ou antes, diferentes compressões do ar. Como é que fazemos?
Digital para Analógico
Pois, há que converter os números em diferentes compressões de ar, audíveis para o nosso ouvido. Para isso, vamos ter que utilizar um dispositivo com o nome de DAC (Digital Analog Converter) que converterá os números em ondas eletromagnéticas, e novamente um Transdutor, que vai converter as ondas eletromagnéticas em vibrações que produzirão as diferentes pressões do ar.
Vamos lá então, por partes, tentar acompanhar o processo. Comecemos pelo DAC.
O DAC, através de um processo inverso ao do ADC, faz a conversão dos sinais digitais numa onda eletromagnética. Só que agora, a tradução pode ser feita à letra, ou então utilizando termos e expressões idiomáticas próprias da língua, tornando-se muito mais legível. Pois é, a tradução do som vai funcionar mais ou menos assim.
Para soluções em que se pretende uma melhor qualidade, podem-se fazer amostragens por interpolação para as zonas entre duas amostras (como nos pontos verdes do gráfico da Figura 5), por forma a dar à onda o formato mais exato, relativamente ao original. Em vez de ficar às escadinhas, fica quase lisa.
A este processo chama-se sobre amostragem (oversampling) e é tanto mais rigoroso, quanto mais sofisticado e caro for o DAC. Vamos simplificar e passar a chamar o DAC pelo nome do nosso velho conhecido, o leitor de CD. Os leitores de CD atingiram preços de saldo, mas um bom leitor de CD de alta-fidelidade, para reproduzir som para aparelhagens de alto rigor de reprodução destinadas a audiófilos muito exigentes, ainda não está em saldo.
Para além de um rigoroso critério na escolha da qualidade dos componentes, a principal diferença reside em altas taxas de sobre amostragem, conseguidas através de algoritmos proprietários de enorme complexidade, que dão ao som lido de uma fonte digital uma incrível semelhança com o som analógico original.
O problema é que essa diferença custa dinheiro, muito dinheiro, e esta é a principal razão porque muitas pessoas dizem que não gostam do som digital. Quando compram um leitor de CD, escolhem o mais económico. Na realidade, os números gravados no CD até são iguais para qualquer leitor e lidos da mesma maneira. Espero que tenham entendido onde está a diferença. Avancemos.
Uma vez obtida a onda original, a mesma é dirigida para um altifalante, onde a atuação do eletromagnete do núcleo, devido aos impulsos elétricos, faz vibrar o diafragma, que por sua vez vai criar variações na pressão do ar, as quais produzem o som que nós ouvimos. (Figura 6)
E cá está. Chegámos ao ponto de partida