Um pouco de teoria
Com o intuito de entendermos como o áudio é transmitido juntamente com o vídeo em uma conexão HDMI, vamos investigar um pouco como é formado o sinal transmitido pelo HDMI.
O HDMI usa Sinalização Diferencial Minimizada na Transição (TMDS – Transition Minimized Differential Signaling) para enviar o sinal de um equipamento para outro.
O TMDS é uma tecnologia para transmitir dados seriais em altíssima velocidade, utilizada na indústria de computadores, no padrão DVI e em outros protocolos digitais de transmissão. O TMDS codifica o sinal para evitar dois problemas em relação ao cabo: a degradação produzida pelo sinal quando ele o atravessa e as interferências eletromagnéticas que podem entrar no sinal através de acoplamento ao sinal.
Ambos causam degradação do sinal, que passa a ser entendido erroneamente pelo receptor e, portanto, fazem com que a taxa de erros de bit aumente, provocando falhas na imagem e, em casos extremos, a famosa tela escura. Do lado do receptor, este é projetado para ter uma tolerância maior às deformações do sinal introduzidas por cabos longos ou de baixa qualidade.
Os sinais de vídeo, áudio e dados são transmitidos por meio de três canais TMDS. O sinal de clock, que está sincronizado com a taxa de pixels da tela, é transmitido no canal de clock TMDS e é usado pelo receptor como uma referência de frequência para a recuperação dos dados seriais dos três canais TMDS.
O sinal é balanceado para eliminar problemas de captação de ruído e as transições minimizadas ajudam a melhorar a decodificação na presença de deformação do sinal, reduzindo a taxa de erros de bit.
O sinal digital de vídeo pode ter seus pixels representados por 24, 30, 36 ou 48 bits, sendo padrão o valor de 24 bits. Para que se possa transmitir áudio e dados nos canais TMDS, o padrão HDMI usa o padrão de transmissão de pacotes de áudio e dados. Para que se atinja a alta confiabilidade necessária para os dados enviados, estes são protegidos com códigos de correção de erros.
A partir da especificação 2.1, o TMDS foi substituído pelo padrão FRS (Fixed Rate Link), que é uma tecnologia de sinalização necessária para que sejam atingidas as altas resoluções sem compressão acima de 4K/60Hz, como também as taxas de transferência de dados de até 48Gbps. Essa especificação, normalmente, exigirá novos equipamento, não sendo usualmente obtida por atualização de firmware.
Os dados de áudio trafegam juntamente com os dados de vídeo, e, como vimos, o clock de todo o sistema está atrelado à taxa de pixels de vídeo, que pode não ter relação com a taxa de amostragem do sinal de áudio.
Vemos então que a informação original de clock para a reconstrução do sinal de áudio é perdida, e a tarefa de recriar esse clock no receptor é chamada de regeneração de clock de áudio.