- Suporta troca de rosto em tempo real com um clique usando tecnologia de IA de ponta a partir de uma única imagem (vídeo deepfake)
- Multiplataforma: suporte a CPU, NVIDIA CUDA e Apple Silicon (M1/M2)
- Recurso de verificação integrado para evitar o processamento de conteúdo inadequado e garantir uso legal e ético
- Open source em Python
- Etapas de uso
- Configurar o ambiente necessário (
python, pip, ffmpeg)
- Clonar o repositório no GitHub
- Baixar os modelos necessários (
GFPGANv1.4, inswapper_128_fp16.onnx)
- Instalar as dependências (usando
venv: CUDA, CoreML, DirectML, OpenVINO)
- Executar o programa
- Selecionar a imagem de origem e o alvo
- Iniciar o processamento de troca de rosto
Principais recursos do Deep Live Cam
- Troca de rosto em tempo real: permite trocar rostos em tempo real usando uma única imagem e oferece função de pré-visualização imediata
- Deepfake em vídeo com um clique: permite criar vídeos deepfake de alta qualidade de forma rápida e fácil com uma operação simples
- Suporte multiplataforma: pode ser executado em várias configurações de hardware, incluindo CPU, NVIDIA CUDA e Apple Silicon
- Proteções para uso ético: garante uso legal e ético por meio de um recurso de checagem integrado que evita o processamento de conteúdo inadequado
- Desempenho otimizado: usa algoritmos otimizados para melhorar significativamente a velocidade de processamento, especialmente em GPUs NVIDIA com suporte a CUDA
# Resumo do GN⁺
- Deep Live Cam é uma ferramenta de IA de ponta para troca de rosto em tempo real e deepfake em vídeo, podendo ser executada em várias plataformas
- Ela inclui proteções integradas para garantir uso ético e recebe suporte contínuo da comunidade open source
- A ferramenta é útil para projetos criativos e produção de vídeo, especialmente para obter rapidamente resultados visuais de alta qualidade
- Outros projetos com funções semelhantes incluem DeepFaceLab e FaceSwap
4 comentários
Eu mesmo implementei e testei; não é algo impossível de distinguir, mas fiquei pensando: dá para chegar a esse nível com apenas uma imagem real...? Dá a sensação de que pessoas mais velhas cairiam facilmente de verdade, então parece que estamos entrando em um mundo em que nem sei mais no que acreditar.
Considerando que foi feito com apenas uma imagem, o resultado é excelente. Agora parece que realmente não vai dar mais para confiar em vídeos
Comentários do Hacker News
As "salvaguardas para uso ético" supostamente impedem o processamento de conteúdo impróprio
Tecnicamente, a qualidade é impressionante
Este projeto é baseado em "GFPGAN v1.4" e "FaceSwap Extension - Automatic 1111 - Proof of Concept"
Este projeto parece ser um fork do roop, que foi descontinuado, com melhorias principalmente na UI
Embora seja tecnicamente impressionante, é difícil encontrar bons casos de uso que não estejam ligados a propaganda ou fraude
Se adicionarem aprimoramento de voz, as contas bancárias de todos os avôs e avós podem ser saqueadas
Fica a dúvida se existe algum caso de uso legítimo para essa tecnologia
"A função de verificação integrada impede o processamento de conteúdo impróprio, garantindo uso legal e ético"
Chegamos a um ponto em que só se deve confiar em multimídia cruzada com validação de fontes confiáveis
A sensação é de que o momento de lançamento desta ferramenta é extremamente inadequado
"Os engenheiros de software esperam que a arma não pule da mesa e atire em alguém" kkkkk