1. Apresentação
Olá.
Sou o desenvolvedor solo que apresentou o eBook reader (Folio) da última vez.
Ao editar vídeos, às vezes queremos remover o fundo sem chroma key,
ou extrair apenas os vocais ou somente um instrumento específico de uma música,
então acabei criando esta ferramenta com a ideia de resolver tanto a remoção de fundo quanto a separação de áudio em uma única ferramenta.
2. Resumo do serviço em uma frase
AlphaClip é um app de desktop que remove automaticamente o fundo de vídeos com IA e pode separar o áudio em faixas individuais (vocais, bateria, baixo, guitarra etc.).
3. Apresentação do serviço
AlphaClip (Habom) é uma ferramenta de IA focada em pós-processamento de vídeo.
- Remove automaticamente o fundo de vídeos com IA (recomendado usar fundo branco ou preto)
- Separa o áudio em faixas individuais (vocais, bateria, baixo, guitarra etc.)
- Permite remoção de fundo limpa mesmo sem equipamento de chroma key
- Automatiza de forma mais simples o recurso de remoção de fundo do After Effects
Pode ser usado para criação de vídeos de personagens, edição musical e pós-processamento de vídeo.
4. Principais recursos
🎬 Remoção de fundo de vídeo
- Remoção automática de fundo com IA
- Extrai apenas o objeto sem chroma key
- Suporte a aceleração por GPU (CUDA) para melhorar a velocidade de processamento
🎵 Separação de áudio
- Extração de faixas individuais como vocais / bateria / baixo / guitarra
- Permite separar apenas o instrumento desejado da música
🎞️ Geração de vídeo de personagem
- Geração do vídeo final do personagem usando IA
5. Stack técnica
- Python (desenvolvimento baseado em vibe coding)
- CUDA (aceleração por GPU)
- Modelos de IA (remoção de fundo / separação de áudio)
6. Dificuldades durante o desenvolvimento
- Otimização do uso da GPU por meio da configuração de CUDA
- Equilíbrio entre qualidade da remoção de fundo e velocidade de processamento
- Correção de erros remanescentes por ser um desenvolvimento com apenas 1 semana de vibe coding
7. Estado atual
- Desenvolvimento em andamento há cerca de 1 semana com vibe coding
- O trabalho está focado principalmente na implementação das funções, e ainda restam alguns erros
- Pretendo manter gratuito por enquanto e continuar melhorando
- No futuro, planejo usar isso para criar personagens animados e fundos (78 cartas) para um app de tarô
- O objetivo final é reunir pequenos projetos e criar um pipeline de automação único
Como estou tocando de 2 a 4 frentes ao mesmo tempo, acho que vou precisar de um pouco mais de foco e priorização!
Falando de forma simples,
- RVC, em termos simples, mudança de voz de personagem usando treinamento/inferência de speech-to-speech
- A página de market abaixo também levou cerca de 1 mês até concluir o pagamento, mas pretendo continuar melhorando
- Ferramenta de gerenciamento de notificações do app (APNs/FCM), ferramenta de análise de funil (igual ao Google Analytics)
Além disso, há mais coisas, mas mesmo que leve tempo, vou apresentando uma por uma com calma!!
8. O que eu gostaria
- Feedback de usuários reais (relatos de bugs são super bem-vindos!! Podem mandar por vídeo ou SNS a qualquer momento!)
- Opiniões sobre o workflow de edição de vídeo
Se tiverem pontos fracos ou ideias de melhoria, fiquem à vontade para comentar!
Espero que assistam ao vídeo e se divirtam!
Usei este programa para criar o vídeo abaixo, então assistam e aproveitem(?) :)
Vídeo de demonstração
https://www.youtube.com/watch?v=lZhiMreW94Q
- Também coloquei no market a ferramenta de monitoramento de CPU/GPU que aparece no vídeo!!
(Fiz em 30 minutos a 1 hora quando estava descansando(?) enquanto criava as tools do AlphaClip Habom!!)
⬇️ Link para download
📥 Download: https://market.habom.kr
Ainda não há comentários.