Duração e formato de áudio

Assim como no mundo dos livros impressos, o limite para a duração de um audiolivro está no bom senso e diretamente ligado à quantidade de palavras ou caracteres do livro em papel: em geral, um audiolivro dura de 1 hora a 25 horas. Menos do que 1 hora, só para infantojuvenis específicos. Mais do que 25 horas, só para romances históricos caudalosos ou compêndios religiosos.

Quanto ao formato do arquivo de áudio, a tendência no mercado é recorrer a arquivos mais leves, como o MP3. O tradicional padrão wave, usado na produção do CD comum, o chamado “CD de áudio”, é muito pesado para transferência via internet. Para se ter uma ideia, um arquivo wave estéreo com 1 minuto de duração tem cerca de 10,4 kilobytes (Kb), enquanto esse mesmo conteúdo alocado em um arquivo MP3 (a 192 Kb por segundo, ou Kbps) tem 1,4 Kb. No caso da reprodução da voz humana, a conversão para MP3 não causa “estragos”, como pode acontecer com a música, porque o espectro de frequências alcançadas pela voz humana é mais limitado do que o utilizado na música. A voz funciona entre frequências de 50 a 3.400 hertz, enquanto um piano, por exemplo, vai de 40 a 4.000 hertz. Assim, não há grandes perdas quando se convertem os arquivos de áudio de voz humana para MP3. Para se entender os principais aspectos técnicos do áudio digital, condição indispensável para quem vai trabalhar na área de audiolivros, há dois conceitos básicos. No som digitalizado, o sinal captado de forma elétrica é transformado em informação binária (0 e 1) para ser compreendida pelo computador. Ou seja, é como se o sinal fosse “fotografado” várias vezes. Assim como um vídeo é uma sequência de imagens que vão se modificando (uma sequência de fotos que formam o quadro a quadro), também a onda sonora digitalizada compõe-se de várias amostras do som. Essas amostras são organizadas com base em dois parâmetros: a taxa de amostragem (sample rate), que é a quantidade de vezes que uma onda é “fotografada” ou medida, e a taxa de profundidade (bit depth), que indica o número de bits ou a quantidade de informação digital presente em cada amostragem.

Quanto maior a taxa de amostragem, maior a quantidade de “fotos” do áudio e, portanto, maior a qualidade e mais fidelidade ao som original. Porém, naturalmente, uma taxa de amostragem muito alta pode sobrecarregar o sistema do computador e comprometer seu funcionamento. Depois de alguns estudos, percebeu-se que 40.000 amostras por segundo é o suficiente para capturar toda a informação que o ouvido humano necessita para ter uma ótima percepção sonora. Nos programas de gravação e edição de áudio, a taxa mais próxima de 40.000 aparece fixada em 44.100 amostras por segundo, ou 44.1 Khz. Assim, essa taxa é mais do que suficiente para se ter uma ótima qualidade de áudio digital e costuma ser padrão em meio aos produtores de áudio de voz.

Para a bit depth, quanto mais alta a taxa, mais bits 0 e 1 estarão presentes na amostra e mais qualidade ela terá. As principais opções incluem 16, 24 e 32 bits. Se você fizer gravações em 16 bits, pode acabar com uma amostra barulhenta. Para gravação de voz, 24 bits é bem razoável e não sobrecarrega o sistema.

Há ainda o conceito de bit rate, usado principalmente nos arquivos de MP3. A medida de bit rate expressa a quantidade de bits presentes em um segundo de áudio. Os principais valores para os arquivos de MP3 vão de 98 a 320 Kbps (kilobites por segundo). A qualidade mais aceitável para os arquivos digitais de voz hoje é de 192 Kbps. A taxa de 320 Kbps se equipara à qualidade do CD de áudio, o que pode ser desejável no caso da música, mas é dispensável quando se trabalha com gravação de voz humana.

Além dos arquivos wave e dos compactados em MP3, há outros formatos de áudio no mercado. A Apple privilegia o AIFF como um arquivo de trabalho em seus softwares. Entre os compactados, existe o AAC. E, no caso das plataformas distribuidoras de audiolivros e seus aplicativos (apps), em geral, cada uma utiliza um tipo específico de arquivo.

A maioria dos softwares reconhece os diferentes tipos de arquivo de trabalho. Já quanto aos formatos de distribuição, o objetivo é mesmo que os áudios não possam ser lidos nem copiados para ambientes externos ao da plataforma de comercialização, de forma a proteger os direitos comerciais da distribuidora e os direitos autorais das obras. A facilidade de transferência dos arquivos de MP3 tem a desvantagem de facilitar a pirataria.



Categorias:Técnica

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s

%d blogueiros gostam disto: