ppaso-tts: TTS coreano leve para dispositivos de borda
(huggingface.co)Tenho interesse em IA standalone para dispositivos de borda.
O chipset RK3576 tem uma NPU de 6 TOPS, e embora modelos leves de TTS em inglês apareçam com certa frequência, quase não há modelos de TTS em coreano.
No caso do MeloTTS-ko, foi possível usar coreano por meio de conversão direta para RKNN, mas o Encoder não podia ser convertido para RKNN e a velocidade também não era das mais rápidas.
Por isso, criei um modelo leve de TTS em coreano focado em velocidade em vez de qualidade, para que também pudesse ser usado em dispositivos de borda.
Embora a fala soe como uma voz mecânica pouco natural, é possível gerar áudio em nível de tempo real. (com base no RK3576)
Como foi publicado sob Apache 2.0, estou compartilhando caso isso possa ajudar quem estiver procurando um TTS em coreano para dispositivos de borda, em que a velocidade seja mais importante do que a qualidade.
Ainda não há comentários.