Supertonic 3 - lançamento de TTS ultraleve on-device, com suporte a 31 idiomas e tags de emoção
(github.com/supertone-inc)- Suporte a 31 idiomas, incluindo coreano
- Novo suporte a tags de emoção: é possível inserir 10 tipos de tags no texto, como
<laugh>,<breath>e<scream>, para expressar emoções - Melhorias de qualidade: maior precisão de pronúncia, redução de falhas de repetição/omissão de palavras e melhoria no desempenho de clonagem de voz
- Tamanho do modelo: 99M Parameters
- TTS on-device: privacidade totalmente garantida, sem latência de rede
- Facilidade de implantação: pode ser executado em navegador, PC, celular, Raspberry Pi etc.
- Fornece 10 vozes predefinidas
- Modelo aberto: uso comercial permitido (OpenRAIL-M)
4 comentários
Fico curioso para saber se não é difícil criar a minha própria voz, em vez de usar apenas os 10 presets.
Parece bem estável em comparação com outros modelos leves.
Ah, vou ter que testar no Pi 5.
Eu estava usando o supertonic no Home Agent, e a versão anterior também não era ruim, mas pelo visto houve uma atualização. Vou testar.