9 pontos por vulcanidic 2024-12-08 | 1 comentários | Compartilhar no WhatsApp

Voice-Pro é uma WebUI em Gradio com suporte a reconhecimento de voz, tradução e síntese de voz.

Principais recursos:

  • Clonagem de voz zero-shot. Basta ter uma amostra de voz de 15 segundos. Inclui vozes de mais de 50 celebridades
  • Download de áudio do YouTube
  • Separação vocal
  • Conversão de texto em fala multilíngue (Edge-TTS, F5-TTS)
  • Tradução multilíngue
  • Suporte a vários motores Whisper (Whisper, Faster-Whisper, Whisper-Timestamped)

Demos em vídeo:

GitHub:
https://github.com/abus-aikorea/voice-pro

1 comentários

 
yangeok 2024-12-16

Parece que foi feito por um coreano.