7 pontos por xguru 2024-06-08 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Permite gerar até 47 segundos de dados de áudio de alta qualidade a partir de prompts de texto simples
  • Graças ao treinamento especializado, é ideal para criar batidas de bateria, riffs de instrumentos, sons ambientes, gravações de foley e outras amostras de áudio para produção musical e sound design
  • A principal vantagem deste lançamento open source é que os usuários podem fazer o ajuste fino do modelo com seus próprios dados de áudio personalizados
    • Por exemplo, um baterista pode ajustá-lo com suas próprias amostras de gravações de bateria para gerar novas batidas
  • Como ele é diferente do Stable Audio?
    • O Stable Audio, produto comercial, oferece faixas completas de alta qualidade com até 3 minutos de duração e estrutura musical consistente, além de recursos avançados como geração de áudio para áudio e composição musical consistente com múltiplas partes
    • Já o Stable Audio Open é especializado em amostras de áudio, efeitos sonoros e elementos de produção
      • Ele pode gerar clipes musicais curtos, mas não é otimizado para músicas completas, melodias ou vocais
      • Este modelo aberto oferece insights sobre IA generativa para sound design, ao mesmo tempo em que prioriza o desenvolvimento responsável junto à comunidade criativa
  • Os pesos do modelo Stable Audio Open estão disponíveis no Hugging Face
    • Sound designers, músicos, desenvolvedores e entusiastas de áudio são incentivados a baixar o modelo, explorar seus recursos e enviar feedback

Ainda não há comentários.

Ainda não há comentários.