Deep Live Cam - ferramenta de deepfake em vídeo com troca de rosto em tempo real e um clique

(deeplive.cam)

30 pontos por GN⁺ 2024-08-11 | 4 comentários | Compartilhar no WhatsApp

Suporta troca de rosto em tempo real com um clique usando tecnologia de IA de ponta a partir de uma única imagem (vídeo deepfake)
Multiplataforma: suporte a CPU, NVIDIA CUDA e Apple Silicon (M1/M2)
Recurso de verificação integrado para evitar o processamento de conteúdo inadequado e garantir uso legal e ético
Open source em Python
Etapas de uso
1. Configurar o ambiente necessário (python, pip, ffmpeg)
2. Clonar o repositório no GitHub
3. Baixar os modelos necessários (GFPGANv1.4, inswapper_128_fp16.onnx)
4. Instalar as dependências (usando venv: CUDA, CoreML, DirectML, OpenVINO)
5. Executar o programa
6. Selecionar a imagem de origem e o alvo
7. Iniciar o processamento de troca de rosto

Principais recursos do Deep Live Cam

Troca de rosto em tempo real: permite trocar rostos em tempo real usando uma única imagem e oferece função de pré-visualização imediata
Deepfake em vídeo com um clique: permite criar vídeos deepfake de alta qualidade de forma rápida e fácil com uma operação simples
Suporte multiplataforma: pode ser executado em várias configurações de hardware, incluindo CPU, NVIDIA CUDA e Apple Silicon
Proteções para uso ético: garante uso legal e ético por meio de um recurso de checagem integrado que evita o processamento de conteúdo inadequado
Desempenho otimizado: usa algoritmos otimizados para melhorar significativamente a velocidade de processamento, especialmente em GPUs NVIDIA com suporte a CUDA

# Resumo do GN⁺

Deep Live Cam é uma ferramenta de IA de ponta para troca de rosto em tempo real e deepfake em vídeo, podendo ser executada em várias plataformas
Ela inclui proteções integradas para garantir uso ético e recebe suporte contínuo da comunidade open source
A ferramenta é útil para projetos criativos e produção de vídeo, especialmente para obter rapidamente resultados visuais de alta qualidade
Outros projetos com funções semelhantes incluem DeepFaceLab e FaceSwap

4 comentários

dongwon 2024-08-13

Eu mesmo implementei e testei; não é algo impossível de distinguir, mas fiquei pensando: dá para chegar a esse nível com apenas uma imagem real...? Dá a sensação de que pessoas mais velhas cairiam facilmente de verdade, então parece que estamos entrando em um mundo em que nem sei mais no que acreditar.

xguru 2024-08-12

Considerando que foi feito com apenas uma imagem, o resultado é excelente. Agora parece que realmente não vai dar mais para confiar em vídeos

GN⁺ 2024-08-11

Comentários do Hacker News

As "salvaguardas para uso ético" supostamente impedem o processamento de conteúdo impróprio
- Há exemplos de imitação de celebridades e políticos, incluindo JD Vance
- A definição de deepfake "ético" é vaga
- Fica a dúvida de por que escolheram fazer isso entre tantas coisas que a IA pode criar
Tecnicamente, a qualidade é impressionante
- Agora, praticamente qualquer script kiddie pode fazer deepfake de rosto em tempo real em chamadas de vídeo
- Já não dá mais para confiar no que se vê em videochamadas
- Estamos vivendo tempos interessantes
Este projeto é baseado em "GFPGAN v1.4" e "FaceSwap Extension - Automatic 1111 - Proof of Concept"
- O projeto GFPGAN se baseia no artigo de Wang et al., "GFP-GAN: Towards Real-World Blind Face Restoration with Generative Facial Prior"
Este projeto parece ser um fork do roop, que foi descontinuado, com melhorias principalmente na UI
- Um dos principais desenvolvedores do roop está desenvolvendo o facefusion, que oferece suporte à troca de rosto em webcam em tempo real
Embora seja tecnicamente impressionante, é difícil encontrar bons casos de uso que não estejam ligados a propaganda ou fraude
- Nem o site apresenta casos de uso claros
Se adicionarem aprimoramento de voz, as contas bancárias de todos os avôs e avós podem ser saqueadas
- É preciso alertar as pessoas agora mesmo
Fica a dúvida se existe algum caso de uso legítimo para essa tecnologia
- Dá curiosidade de saber qual persona/mercado vertical eles tinham em mente ao idealizar o produto
"A função de verificação integrada impede o processamento de conteúdo impróprio, garantindo uso legal e ético"
- Engenheiros de software torcem para que a arma não pule da mesa e atire em alguém
Chegamos a um ponto em que só se deve confiar em multimídia cruzada com validação de fontes confiáveis
- Fico pensando se seria possível a câmera adicionar uma assinatura digital para indicar que um vídeo/foto é real
- Etiquetas para fotos/vídeos não gerados por IA parecem mais viáveis do que etiquetas para fotos/vídeos gerados por IA
A sensação é de que o momento de lançamento desta ferramenta é extremamente inadequado
- Há potencial para atrapalhar a eleição dos EUA este ano
- Só de considerar o impacto dessa tecnologia nas eleições, já parece uma má ideia
- Muitos problemas podem surgir, como pornografia infantil, terrorismo, desestabilização de governos e guerra civil/guerra mundial etc.

cosine20 2024-08-13

"Os engenheiros de software esperam que a arma não pule da mesa e atire em alguém" kkkkk