Google revela o SoundStream, codec neural de áudio end-to-end
(ai.googleblog.com)- Primeiro codec de rede neural aplicável tanto à voz quanto à música
→ Pode ser executado em tempo real na CPU de smartphones
→ Codifica diversos tipos de som, incluindo áudio de alta qualidade e voz limpa, voz com muito ruído e reverberação, música e sons ambientes
- Treinado com redes neurais em ambas as pontas, realiza simultaneamente compressão e melhoria da qualidade sonora para oferecer áudio de alta qualidade
→ O SoundStream supera o Opus a 12 kbps em 3 kbps e oferece qualidade próxima à do EVS em 9,6 kbps
→ Como usa de 3,2x a 4x menos bits, pode reduzir drasticamente o volume de transmissão
→ Oferece excelente nível de remoção de ruído
- Integração planejada ao Lyra, codec de voz de baixa taxa de bits revelado no início deste ano
1 comentários
O Opus também é famoso por ser bastante bom
Impressionante