Open source que clona voz em tempo real usando apenas 5 segundos da voz de uma pessoa específica
(github.com)Implementação do artigo Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS).
Implementação do artigo Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS).
2 comentários
Se as tecnologias de síntese de rosto e de voz continuarem avançando, acho que, no fim das contas, o significado da aparência e da voz pode mudar. Não será mais possível identificar uma pessoa apenas por características externas ou materiais. Parece que virá uma era em que haverá mais foco na mente humana e na essência.
Vídeo de demonstração no YouTube: https://www.youtube.com/watch?v=-O_hYhToKoA