- Suporte a 31 idiomas, incluindo coreano
- Novo suporte a tags de emoção: é possível inserir 10 tipos de tags no texto, como
<laugh>, <breath> e <scream>, para expressar emoções
- Melhorias de qualidade: maior precisão de pronúncia, redução de falhas de repetição/omissão de palavras e melhoria no desempenho de clonagem de voz
- Tamanho do modelo: 99M Parameters
- TTS on-device: privacidade totalmente garantida, sem latência de rede
- Facilidade de implantação: pode ser executado em navegador, PC, celular, Raspberry Pi etc.
- Fornece 10 vozes predefinidas
- Modelo aberto: uso comercial permitido (OpenRAIL-M)
3 comentários
Parece bem estável em comparação com outros modelos leves.
Ah, vou ter que testar no Pi 5.
Eu estava usando o supertonic no Home Agent, e a versão anterior também não era ruim, mas pelo visto houve uma atualização. Vou testar.