- Permite gerar até 47 segundos de dados de áudio de alta qualidade a partir de prompts de texto simples
- Graças ao treinamento especializado, é ideal para criar batidas de bateria, riffs de instrumentos, sons ambientes, gravações de foley e outras amostras de áudio para produção musical e sound design
- A principal vantagem deste lançamento open source é que os usuários podem fazer o ajuste fino do modelo com seus próprios dados de áudio personalizados
- Por exemplo, um baterista pode ajustá-lo com suas próprias amostras de gravações de bateria para gerar novas batidas
- Como ele é diferente do Stable Audio?
- O Stable Audio, produto comercial, oferece faixas completas de alta qualidade com até 3 minutos de duração e estrutura musical consistente, além de recursos avançados como geração de áudio para áudio e composição musical consistente com múltiplas partes
- Já o Stable Audio Open é especializado em amostras de áudio, efeitos sonoros e elementos de produção
- Ele pode gerar clipes musicais curtos, mas não é otimizado para músicas completas, melodias ou vocais
- Este modelo aberto oferece insights sobre IA generativa para sound design, ao mesmo tempo em que prioriza o desenvolvimento responsável junto à comunidade criativa
- Os pesos do modelo Stable Audio Open estão disponíveis no Hugging Face
- Sound designers, músicos, desenvolvedores e entusiastas de áudio são incentivados a baixar o modelo, explorar seus recursos e enviar feedback
Ainda não há comentários.