24 pontos por xguru 2023-04-24 | 2 comentários | Compartilhar no WhatsApp
  • Permite gerar vozes multilíngues muito realistas
  • Inclui música, ruído de fundo e efeitos sonoros simples
  • Também consegue reproduzir comunicação não verbal, como risadas, suspiros e choro
  • Suporta inglês/coreano e também alemão/francês/japonês/chinês etc.
  • Usa o codec EnCodec, do Facebook
  • O Bark está sob a licença CC-BY 4.0 NC, e o próprio modelo da Suno pode ser usado comercialmente

2 comentários

 
dlehals2 2023-04-24

As gerações do Bark às vezes diferem dos meus prompts. O que está acontecendo?
O Bark é um modelo no estilo GPT. Por isso, ele pode tomar algumas liberdades criativas em suas gerações, resultando em saídas do modelo com maior variabilidade do que as abordagens tradicionais de conversão de texto em fala.

Essa parte dá medo rsrs. Então o motivo de às vezes gerar diferente do prompt é para a tal liberdade criativa do modelo...

 
kuroneko 2023-04-24

É surpreendente como ele gera coreano muito bem.