34 pontos por xguru 2024-04-29 | 1 comentários | Compartilhar no WhatsApp
  • Com o lançamento da v2, oferece melhor qualidade de áudio, suporte multilíngue incluindo coreano e uso comercial gratuito
  • É possível clonar uma voz a partir de apenas um pequeno clipe de áudio do falante e gerar fala em vários idiomas
  • Além de copiar o timbre do falante de referência, também permite controlar com precisão o estilo da fala, como emoção, entonação, ritmo, pausas e inflexão
  • Realiza clonagem de voz cruzada entre idiomas em zero-shot para idiomas que não estão incluídos no conjunto de treinamento
  • Oferece excelente desempenho com custo computacional dezenas de vezes menor do que APIs comercialmente disponíveis
  • Mudanças da V2, que inclui todos os recursos da V1 (lançada em 2024/04)
    • Melhor qualidade de áudio: a V2 adota uma estratégia de treinamento diferente para oferecer melhor qualidade de áudio
    • Suporte multilíngue nativo: inglês, espanhol, francês, chinês, japonês e coreano são suportados nativamente no OpenVoice V2
    • Uso comercial gratuito: desde abril de 2024, tanto a V2 quanto a V1 são lançadas sob a licença MIT, permitindo uso comercial sem custo

1 comentários

 
xguru 2024-04-29

GN⁺: OpenVoice: tecnologia versátil de clonagem instantânea de voz
GN⁺: OpenVoice - tecnologia versátil de clonagem instantânea de voz

Já apareceu algumas vezes no GN+, e agora, com o lançamento da V2, passou a oferecer suporte a vários idiomas, incluindo o coreano.