Voice-Pro – WebUI em Gradio com suporte a reconhecimento de voz, tradução e síntese de voz
(github.com/abus-aikorea)Voice-Pro é uma WebUI em Gradio com suporte a reconhecimento de voz, tradução e síntese de voz.
Principais recursos:
- Clonagem de voz zero-shot. Basta ter uma amostra de voz de 15 segundos. Inclui vozes de mais de 50 celebridades
- Download de áudio do YouTube
- Separação vocal
- Conversão de texto em fala multilíngue (Edge-TTS, F5-TTS)
- Tradução multilíngue
- Suporte a vários motores Whisper (Whisper, Faster-Whisper, Whisper-Timestamped)
Demos em vídeo:
-
Tutorial de uso do Voice-Pro: https://youtu.be/z8g8LMhoh_o
-
Demo de produção de podcast com clonagem de voz: https://youtu.be/Wfo7vQCD4no
-
Demo e vídeos de exemplo: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 comentários
Parece que foi feito por um coreano.