2 pontos por kmelon 2026-02-02 | Ainda não há comentários. | Compartilhar no WhatsApp

1. Apresentação

Olá.
Sou o desenvolvedor solo que apresentou o eBook reader (Folio) da última vez.

Ao editar vídeos, às vezes queremos remover o fundo sem chroma key,
ou extrair apenas os vocais ou somente um instrumento específico de uma música,
então acabei criando esta ferramenta com a ideia de resolver tanto a remoção de fundo quanto a separação de áudio em uma única ferramenta.


2. Resumo do serviço em uma frase

AlphaClip é um app de desktop que remove automaticamente o fundo de vídeos com IA e pode separar o áudio em faixas individuais (vocais, bateria, baixo, guitarra etc.).


3. Apresentação do serviço

AlphaClip (Habom) é uma ferramenta de IA focada em pós-processamento de vídeo.

  • Remove automaticamente o fundo de vídeos com IA (recomendado usar fundo branco ou preto)
  • Separa o áudio em faixas individuais (vocais, bateria, baixo, guitarra etc.)
  • Permite remoção de fundo limpa mesmo sem equipamento de chroma key
  • Automatiza de forma mais simples o recurso de remoção de fundo do After Effects

Pode ser usado para criação de vídeos de personagens, edição musical e pós-processamento de vídeo.


4. Principais recursos

🎬 Remoção de fundo de vídeo

  • Remoção automática de fundo com IA
  • Extrai apenas o objeto sem chroma key
  • Suporte a aceleração por GPU (CUDA) para melhorar a velocidade de processamento

🎵 Separação de áudio

  • Extração de faixas individuais como vocais / bateria / baixo / guitarra
  • Permite separar apenas o instrumento desejado da música

🎞️ Geração de vídeo de personagem

  • Geração do vídeo final do personagem usando IA

5. Stack técnica

  • Python (desenvolvimento baseado em vibe coding)
  • CUDA (aceleração por GPU)
  • Modelos de IA (remoção de fundo / separação de áudio)

6. Dificuldades durante o desenvolvimento

  • Otimização do uso da GPU por meio da configuração de CUDA
  • Equilíbrio entre qualidade da remoção de fundo e velocidade de processamento
  • Correção de erros remanescentes por ser um desenvolvimento com apenas 1 semana de vibe coding

7. Estado atual

  • Desenvolvimento em andamento há cerca de 1 semana com vibe coding
  • O trabalho está focado principalmente na implementação das funções, e ainda restam alguns erros
  • Pretendo manter gratuito por enquanto e continuar melhorando
  • No futuro, planejo usar isso para criar personagens animados e fundos (78 cartas) para um app de tarô
  • O objetivo final é reunir pequenos projetos e criar um pipeline de automação único

Como estou tocando de 2 a 4 frentes ao mesmo tempo, acho que vou precisar de um pouco mais de foco e priorização!
Falando de forma simples,

  1. RVC, em termos simples, mudança de voz de personagem usando treinamento/inferência de speech-to-speech
  2. A página de market abaixo também levou cerca de 1 mês até concluir o pagamento, mas pretendo continuar melhorando
  3. Ferramenta de gerenciamento de notificações do app (APNs/FCM), ferramenta de análise de funil (igual ao Google Analytics)

Além disso, há mais coisas, mas mesmo que leve tempo, vou apresentando uma por uma com calma!!


8. O que eu gostaria

  • Feedback de usuários reais (relatos de bugs são super bem-vindos!! Podem mandar por vídeo ou SNS a qualquer momento!)
  • Opiniões sobre o workflow de edição de vídeo

Se tiverem pontos fracos ou ideias de melhoria, fiquem à vontade para comentar!
Espero que assistam ao vídeo e se divirtam!


Usei este programa para criar o vídeo abaixo, então assistam e aproveitem(?) :)

Vídeo de demonstração

https://www.youtube.com/watch?v=lZhiMreW94Q

  • Também coloquei no market a ferramenta de monitoramento de CPU/GPU que aparece no vídeo!!
    (Fiz em 30 minutos a 1 hora quando estava descansando(?) enquanto criava as tools do AlphaClip Habom!!)

⬇️ Link para download
📥 Download: https://market.habom.kr

Ainda não há comentários.

Ainda não há comentários.