- Com o lançamento da v2, oferece melhor qualidade de áudio, suporte multilíngue incluindo coreano e uso comercial gratuito
- É possível clonar uma voz a partir de apenas um pequeno clipe de áudio do falante e gerar fala em vários idiomas
- Além de copiar o timbre do falante de referência, também permite controlar com precisão o estilo da fala, como emoção, entonação, ritmo, pausas e inflexão
- Realiza clonagem de voz cruzada entre idiomas em zero-shot para idiomas que não estão incluídos no conjunto de treinamento
- Oferece excelente desempenho com custo computacional dezenas de vezes menor do que APIs comercialmente disponíveis
- Mudanças da V2, que inclui todos os recursos da V1 (lançada em 2024/04)
- Melhor qualidade de áudio: a V2 adota uma estratégia de treinamento diferente para oferecer melhor qualidade de áudio
- Suporte multilíngue nativo: inglês, espanhol, francês, chinês, japonês e coreano são suportados nativamente no OpenVoice V2
- Uso comercial gratuito: desde abril de 2024, tanto a V2 quanto a V1 são lançadas sob a licença MIT, permitindo uso comercial sem custo
1 comentários
GN⁺: OpenVoice: tecnologia versátil de clonagem instantânea de voz
GN⁺: OpenVoice - tecnologia versátil de clonagem instantânea de voz
Já apareceu algumas vezes no GN+, e agora, com o lançamento da V2, passou a oferecer suporte a vários idiomas, incluindo o coreano.