- Gera clipes de áudio de alta qualidade em vários estilos, como as IAs de geração de imagem/texto
- Também permite modificar uma amostra de áudio fornecida
- Além de sintetizar fala em 6 idiomas, também faz remoção de ruído, edição de conteúdo, transferência de estilo e geração de diversas amostras
- As IAs generativas de voz existentes exigiam dados de treinamento cuidadosamente preparados para cada tarefa. O Voicebox foi treinado com áudio bruto e dados de transcrição usando um novo método
- Treinado com mais de 50 mil horas de audiolivros em domínio público em inglês, francês, espanhol, alemão, polonês e português
2 comentários
Não sei se isso poderia ser usado para remover apenas os vocais de uma música e criar um MR de alta qualidade.
Já existe um open source bem utilizável para isso:
https://github.com/Anjok07/ultimatevocalremovergui