30 pontos por GN⁺ 2024-08-11 | 4 comentários | Compartilhar no WhatsApp
  • Suporta troca de rosto em tempo real com um clique usando tecnologia de IA de ponta a partir de uma única imagem (vídeo deepfake)
  • Multiplataforma: suporte a CPU, NVIDIA CUDA e Apple Silicon (M1/M2)
  • Recurso de verificação integrado para evitar o processamento de conteúdo inadequado e garantir uso legal e ético
  • Open source em Python
  • Etapas de uso
    1. Configurar o ambiente necessário (python, pip, ffmpeg)
    2. Clonar o repositório no GitHub
    3. Baixar os modelos necessários (GFPGANv1.4, inswapper_128_fp16.onnx)
    4. Instalar as dependências (usando venv: CUDA, CoreML, DirectML, OpenVINO)
    5. Executar o programa
    6. Selecionar a imagem de origem e o alvo
    7. Iniciar o processamento de troca de rosto

Principais recursos do Deep Live Cam

  • Troca de rosto em tempo real: permite trocar rostos em tempo real usando uma única imagem e oferece função de pré-visualização imediata
  • Deepfake em vídeo com um clique: permite criar vídeos deepfake de alta qualidade de forma rápida e fácil com uma operação simples
  • Suporte multiplataforma: pode ser executado em várias configurações de hardware, incluindo CPU, NVIDIA CUDA e Apple Silicon
  • Proteções para uso ético: garante uso legal e ético por meio de um recurso de checagem integrado que evita o processamento de conteúdo inadequado
  • Desempenho otimizado: usa algoritmos otimizados para melhorar significativamente a velocidade de processamento, especialmente em GPUs NVIDIA com suporte a CUDA

# Resumo do GN⁺

  • Deep Live Cam é uma ferramenta de IA de ponta para troca de rosto em tempo real e deepfake em vídeo, podendo ser executada em várias plataformas
  • Ela inclui proteções integradas para garantir uso ético e recebe suporte contínuo da comunidade open source
  • A ferramenta é útil para projetos criativos e produção de vídeo, especialmente para obter rapidamente resultados visuais de alta qualidade
  • Outros projetos com funções semelhantes incluem DeepFaceLab e FaceSwap

4 comentários

 
dongwon 2024-08-13

Eu mesmo implementei e testei; não é algo impossível de distinguir, mas fiquei pensando: dá para chegar a esse nível com apenas uma imagem real...? Dá a sensação de que pessoas mais velhas cairiam facilmente de verdade, então parece que estamos entrando em um mundo em que nem sei mais no que acreditar.

 
xguru 2024-08-12

Considerando que foi feito com apenas uma imagem, o resultado é excelente. Agora parece que realmente não vai dar mais para confiar em vídeos

 
GN⁺ 2024-08-11
Comentários do Hacker News
  • As "salvaguardas para uso ético" supostamente impedem o processamento de conteúdo impróprio

    • Há exemplos de imitação de celebridades e políticos, incluindo JD Vance
    • A definição de deepfake "ético" é vaga
    • Fica a dúvida de por que escolheram fazer isso entre tantas coisas que a IA pode criar
  • Tecnicamente, a qualidade é impressionante

    • Agora, praticamente qualquer script kiddie pode fazer deepfake de rosto em tempo real em chamadas de vídeo
    • Já não dá mais para confiar no que se vê em videochamadas
    • Estamos vivendo tempos interessantes
  • Este projeto é baseado em "GFPGAN v1.4" e "FaceSwap Extension - Automatic 1111 - Proof of Concept"

    • O projeto GFPGAN se baseia no artigo de Wang et al., "GFP-GAN: Towards Real-World Blind Face Restoration with Generative Facial Prior"
  • Este projeto parece ser um fork do roop, que foi descontinuado, com melhorias principalmente na UI

    • Um dos principais desenvolvedores do roop está desenvolvendo o facefusion, que oferece suporte à troca de rosto em webcam em tempo real
  • Embora seja tecnicamente impressionante, é difícil encontrar bons casos de uso que não estejam ligados a propaganda ou fraude

    • Nem o site apresenta casos de uso claros
  • Se adicionarem aprimoramento de voz, as contas bancárias de todos os avôs e avós podem ser saqueadas

    • É preciso alertar as pessoas agora mesmo
  • Fica a dúvida se existe algum caso de uso legítimo para essa tecnologia

    • Dá curiosidade de saber qual persona/mercado vertical eles tinham em mente ao idealizar o produto
  • "A função de verificação integrada impede o processamento de conteúdo impróprio, garantindo uso legal e ético"

    • Engenheiros de software torcem para que a arma não pule da mesa e atire em alguém
  • Chegamos a um ponto em que só se deve confiar em multimídia cruzada com validação de fontes confiáveis

    • Fico pensando se seria possível a câmera adicionar uma assinatura digital para indicar que um vídeo/foto é real
    • Etiquetas para fotos/vídeos não gerados por IA parecem mais viáveis do que etiquetas para fotos/vídeos gerados por IA
  • A sensação é de que o momento de lançamento desta ferramenta é extremamente inadequado

    • Há potencial para atrapalhar a eleição dos EUA este ano
    • Só de considerar o impacto dessa tecnologia nas eleições, já parece uma má ideia
    • Muitos problemas podem surgir, como pornografia infantil, terrorismo, desestabilização de governos e guerra civil/guerra mundial etc.
 
cosine20 2024-08-13

"Os engenheiros de software esperam que a arma não pule da mesa e atire em alguém" kkkkk