2 pontos por GN⁺ 2024-06-14 | 1 comentários | Compartilhar no WhatsApp
  • A Meta oferece suporte a comunicação em tempo real (RTC) para bilhões de pessoas por meio de apps como WhatsApp, Instagram e Messenger.
  • A empresa está trabalhando para oferecer uma experiência de alta qualidade mesmo para usuários sem conexão rápida ou celulares mais novos.
  • A Meta desenvolveu o codec Meta Low Bitrate (MLow) para melhorar a qualidade do áudio mesmo em conexões lentas.

Motivação para desenvolver um novo codec

  • O uso de RTC em larga escala nos produtos da Meta permitiu observar o desempenho de codecs em diversos cenários de rede.
  • Muitas chamadas acontecem em situações de conectividade de rede ruim.
  • O codec Opus não consegue oferecer qualidade de áudio suficiente em taxas de bits baixas.
  • Novos codecs de áudio baseados em ML oferecem boa qualidade em baixas taxas de bits, mas o alto custo computacional é um problema.
  • Como muitos usuários usam dispositivos de baixo custo, há necessidade de um codec de áudio de alta qualidade com baixa exigência computacional.

Codec MLow

  • O codec MLow oferece qualidade duas vezes melhor que o Opus, com complexidade computacional 10% menor.
  • O MLow já foi totalmente implantado no Instagram e no Messenger, e está sendo adotado ativamente no WhatsApp.
  • Ele consegue codificar áudio de alta qualidade mesmo em baixas taxas de bits, melhorando bastante a qualidade do áudio em cenários com perda de pacotes.

Estrutura interna do MLow

  • O MLow usa tecnologia avançada baseada nos conceitos do codec CELP (Code Excited Linear Prediction).
  • O sinal de entrada é dividido em bandas de baixa e alta frequência, e cada uma é codificada separadamente.
  • A banda de alta frequência é codificada com poucos bits, permitindo oferecer SuperWideBand (amostragem de 32 kHz) com baixa taxa de bits.

Planos futuros

  • O MLow melhora significativamente a qualidade do áudio mesmo em dispositivos de baixo custo.
  • Há planos para fornecer mais áudio redundante de forma eficiente, a fim de melhorar a recuperação de áudio em redes com muita perda de pacotes.

Opinião do GN⁺

  • Vantagens do MLow: oferece alta qualidade de áudio mesmo em conexões lentas, melhorando bastante a experiência do usuário.
  • Desafio técnico: manter alta qualidade com baixa complexidade computacional é um desafio técnico muito difícil.
  • Produtos concorrentes: além do Opus, existem vários outros codecs de áudio, mas o MLow oferece excelente desempenho mesmo em dispositivos de baixo custo.
  • Pontos a considerar na adoção: ao introduzir um novo codec, a compatibilidade com sistemas existentes e os testes de desempenho são importantes.
  • Impacto para o usuário: pode trazer grandes benefícios para muitos usuários que utilizam dispositivos de baixo custo.

1 comentários

 
GN⁺ 2024-06-14
Comentários do Hacker News
  • Novos codecs de baixo bitrate: em comunicação em tempo real, a taxa de pacotes precisa ser alta para reduzir a latência, e por isso o overhead pode acabar sendo maior que a carga útil real. Ainda assim, pode ser útil em comunicação por comutação de circuito ou em sistemas VoIP que usam compressão de cabeçalho.

  • Compartilhamento de pesquisa da Meta: parece que a Meta está voltando a ganhar popularidade ao compartilhar muitas pesquisas e trabalhos open source. A reputação do Facebook era ruim, mas parece que conseguiu se recuperar disso.

  • Ausência de comparação com o Codec2: a falta de comparação com o Codec2 faz surgir dúvidas sobre o valor real e a motivação deste trabalho. Não há necessidade de mais um codec de áudio preso a uma nova propriedade intelectual.

  • Comparação com o Google Meet: o Google Meet lida bem com chamadas de áudio mesmo em internet lenta, então fica a dúvida se este codec é melhor que o Google Meet. A tecnologia do Google Meet não é pública.

  • Qualidade das chamadas telefônicas: fica a dúvida de por que as chamadas telefônicas hoje em dia são menos claras do que o μ-law ADPCM de 8 kHz e 8 bits dos anos 90.

  • Ausência de comparação com o Pied Piper: não há comparação com o Pied Piper.

  • Lançamento ou não: fica a dúvida se este codec será lançado ou se é apenas uma demonstração técnica. A Meta AI Research é inovadora, mas não é possível encontrar outras referências a este codec.

  • Licença: não há informação sobre a licença.

  • Ausência de menção ao NoLACE: como o NoLACE não é mencionado, as amostras de comparação acabam sendo menos úteis.

  • Comparação com o Opus: o Opus soa mais suave a 6 kbps, enquanto as amostras do MLow têm artefatos ásperos e artificiais. Em bitrates mais altos, a escolha provavelmente ficaria mais clara.