- A Meta oferece suporte a comunicação em tempo real (RTC) para bilhões de pessoas por meio de apps como WhatsApp, Instagram e Messenger.
- A empresa está trabalhando para oferecer uma experiência de alta qualidade mesmo para usuários sem conexão rápida ou celulares mais novos.
- A Meta desenvolveu o codec Meta Low Bitrate (MLow) para melhorar a qualidade do áudio mesmo em conexões lentas.
Motivação para desenvolver um novo codec
- O uso de RTC em larga escala nos produtos da Meta permitiu observar o desempenho de codecs em diversos cenários de rede.
- Muitas chamadas acontecem em situações de conectividade de rede ruim.
- O codec Opus não consegue oferecer qualidade de áudio suficiente em taxas de bits baixas.
- Novos codecs de áudio baseados em ML oferecem boa qualidade em baixas taxas de bits, mas o alto custo computacional é um problema.
- Como muitos usuários usam dispositivos de baixo custo, há necessidade de um codec de áudio de alta qualidade com baixa exigência computacional.
Codec MLow
- O codec MLow oferece qualidade duas vezes melhor que o Opus, com complexidade computacional 10% menor.
- O MLow já foi totalmente implantado no Instagram e no Messenger, e está sendo adotado ativamente no WhatsApp.
- Ele consegue codificar áudio de alta qualidade mesmo em baixas taxas de bits, melhorando bastante a qualidade do áudio em cenários com perda de pacotes.
Estrutura interna do MLow
- O MLow usa tecnologia avançada baseada nos conceitos do codec CELP (Code Excited Linear Prediction).
- O sinal de entrada é dividido em bandas de baixa e alta frequência, e cada uma é codificada separadamente.
- A banda de alta frequência é codificada com poucos bits, permitindo oferecer SuperWideBand (amostragem de 32 kHz) com baixa taxa de bits.
Planos futuros
- O MLow melhora significativamente a qualidade do áudio mesmo em dispositivos de baixo custo.
- Há planos para fornecer mais áudio redundante de forma eficiente, a fim de melhorar a recuperação de áudio em redes com muita perda de pacotes.
Opinião do GN⁺
- Vantagens do MLow: oferece alta qualidade de áudio mesmo em conexões lentas, melhorando bastante a experiência do usuário.
- Desafio técnico: manter alta qualidade com baixa complexidade computacional é um desafio técnico muito difícil.
- Produtos concorrentes: além do Opus, existem vários outros codecs de áudio, mas o MLow oferece excelente desempenho mesmo em dispositivos de baixo custo.
- Pontos a considerar na adoção: ao introduzir um novo codec, a compatibilidade com sistemas existentes e os testes de desempenho são importantes.
- Impacto para o usuário: pode trazer grandes benefícios para muitos usuários que utilizam dispositivos de baixo custo.
1 comentários
Comentários do Hacker News
Novos codecs de baixo bitrate: em comunicação em tempo real, a taxa de pacotes precisa ser alta para reduzir a latência, e por isso o overhead pode acabar sendo maior que a carga útil real. Ainda assim, pode ser útil em comunicação por comutação de circuito ou em sistemas VoIP que usam compressão de cabeçalho.
Compartilhamento de pesquisa da Meta: parece que a Meta está voltando a ganhar popularidade ao compartilhar muitas pesquisas e trabalhos open source. A reputação do Facebook era ruim, mas parece que conseguiu se recuperar disso.
Ausência de comparação com o Codec2: a falta de comparação com o Codec2 faz surgir dúvidas sobre o valor real e a motivação deste trabalho. Não há necessidade de mais um codec de áudio preso a uma nova propriedade intelectual.
Comparação com o Google Meet: o Google Meet lida bem com chamadas de áudio mesmo em internet lenta, então fica a dúvida se este codec é melhor que o Google Meet. A tecnologia do Google Meet não é pública.
Qualidade das chamadas telefônicas: fica a dúvida de por que as chamadas telefônicas hoje em dia são menos claras do que o μ-law ADPCM de 8 kHz e 8 bits dos anos 90.
Ausência de comparação com o Pied Piper: não há comparação com o Pied Piper.
Lançamento ou não: fica a dúvida se este codec será lançado ou se é apenas uma demonstração técnica. A Meta AI Research é inovadora, mas não é possível encontrar outras referências a este codec.
Licença: não há informação sobre a licença.
Ausência de menção ao NoLACE: como o NoLACE não é mencionado, as amostras de comparação acabam sendo menos úteis.
Comparação com o Opus: o Opus soa mais suave a 6 kbps, enquanto as amostras do MLow têm artefatos ásperos e artificiais. Em bitrates mais altos, a escolha provavelmente ficaria mais clara.