- Modelo open source de geração musical que entrega qualidade de geração musical em nível comercial, como o Suno, mesmo em hardware comum de consumidores
- Geração rápida de uma música completa em menos de 10 segundos (RTX 3090)
- Pode rodar localmente até em ambientes com menos de 4 GB de VRAM e oferece suporte para refletir o estilo musical do usuário com treinamento de personalização baseado em LoRA
- Suporte a geração de covers, repaint (regeneração parcial), conversão de vocal → BGM, separação de faixas e composição multifaixa
- Controle de estrutura e estilo por meio de prompts de letras em mais de 50 idiomas
- Características de desempenho e qualidade
- Oferece qualidade sonora e variedade de estilos acima de modelos comerciais (nível Suno v4.5~v5)
- Suporte a mais de 1000 instrumentos e gêneros, com controle detalhado de timbre
- Suporte à geração de áudio com até 10 minutos (600 segundos) de duração e geração em lote simultânea de 8 músicas
- Função de treinamento LoRA integrada
- Anotação e treinamento com um clique na interface Gradio
- No RTX 3090 (12GB), treinamento concluído em até 1 hora para 8 músicas
- Suporte a ajuste fino avançado de LoRA/LoKR e otimização de VRAM por meio do módulo Side-Step
- Compatibilidade multiplataforma: oferece suporte a Mac (MLX), AMD ROCm, Intel XPU, CUDA GPU e CPU, com detecção automática de ambiente e scripts de configuração
- Diversas interfaces disponíveis
- Gradio Web UI: interface intuitiva de geração musical baseada na web
- Studio UI: ambiente avançado de edição semelhante a uma DAW
- Python API / REST API / CLI: suporte à integração em serviços e automação
- Conjunto de documentação multilíngue disponível em inglês, chinês, japonês e coreano
- MIT License: recomenda uso para criação, educação e entretenimento, com respeito a direitos autorais e sensibilidade cultural
- Site oficial: acemusic.ai
- Relatório técnico: arXiv:2602.00744
- Ouça amostras
3 comentários
Recentemente assinei o Suno para gerar uma trilha sonora,
mas em casos de uso simples talvez dê para economizar na assinatura.
Acho que vou testar hoje.
Entre os samples tem até k-pop, e se um modelo local consegue gerar algo nesse nível, está bem bom. Parece que agora trilha de fundo para jogos ou vídeos feitos por uma pessoa vai ficar realmente bem simples.