Transformando a memória de um gato de estimação que partiu em uma lembrança eterna com IA: treinando um "modelo de geração de imagens" com fotos do meu gato
(fantaxy-flxloraexp.hf.space)Deixar partir um ser amado traz, para qualquer pessoa, uma grande sensação de perda e uma tristeza profunda que aperta o coração.
Especialmente quando esse ser partiu por um caminho sem volta, rumo à eternidade, isso se torna ainda mais doloroso.
Foi algo que aconteceu há poucos dias.
O gato de estimação 'Eric' (também chamado de 'Eric Go'), que fazia parte da família há mais de 10 anos, nos deu uma despedida que jamais poderíamos imaginar, sem que tivéssemos qualquer preparo emocional.
Pensando em recordar 'Eric' e em criar a sensação realista de que ele está sempre ao nosso lado, para mim e para a família mergulhados na tristeza, decidi usar 'IA' para encontrar uma forma de fazer com que 'Eric' permaneça para sempre com a nossa família.
Como primeiro passo, decidi usar fotos tiradas de 'Eric'.
Meu objetivo inicial era permitir que qualquer pessoa da família pudesse reencontrar Eric em 'fotos e vídeos' sempre que sentisse saudade dele.
Ou seja, primeiro ensinei à IA as fotos tiradas de 'Eric' quando ele ainda estava vivo.
Depois, quando quisermos ver 'Eric', basta inserir um pedido em texto ou por voz para a IA. Algo como: "Mostre um gato (com a aparência de 'Eric' em vida), na praia do Havaí, usando óculos escuros e adereços de flores, com uma expressão feliz enquanto exibe a frase 'Papai, eu te amo'."
Então, pouco depois, a IA gera e me mostra uma imagem ou vídeo de 'Eric' com a mesma aparência que tinha em vida, do jeito que eu desejar.
Para isso, organizei alguns procedimentos, preparativos (desenvolvimento) e estratégias.
Vale lembrar que, como tenho capacidade profissional de desenvolvimento especializado em IA e possuo várias GPUs NVIDIA H100, este era um desafio e experimento plenamente viável para mim.
-
Primeiro, selecionei cerca de 45 fotos de 'Eric'.
-
Para aumentar a qualidade do treinamento, desenvolvi um processo automatizado de pré-processamento e o apliquei.
O objetivo era tornar o "objeto" mais nítido e claro, além de melhorar a eficiência do aprendizado supervisionado da IA.
Uma das etapas foi separar automaticamente apenas o "objeto" (o gato) da 'foto original' (que incluía o fundo), fazendo pré-processamentos como upscale.
- Após concluir o pré-processamento, treinei as 45 fotos usando o método LoRA.
O treinamento seguiu as configurações padrão e, com base em uma GPU A100, levou cerca de 2 horas.
-
O treinamento foi executado e, ao final, um 'modelo' dedicado para 'Eric' foi registrado no 'Hugging Face'.
-
Em seguida, conectei o modelo treinado ao modelo FLUX para preparar a geração de imagens com a melhor qualidade possível.
Programei o modelo FLUX básico para aceitar prompts em coreano, e então pude verificar os resultados do treinamento.
Era impressionante, igual à aparência que ele tinha em vida.
Fiquei orgulhoso ao ver toda a família admirada, encantada e feliz com o resultado.
E espero que, ao registrar e tornar público esse processo, ele possa permanecer como referência e ajudar alguém.
Se alguém quiser fazer algo assim com seu próprio gato ou cachorro de estimação, ficarei feliz em ajudar se me enviar uma mensagem.
1 comentários
Deixei mais detalhes e imagens publicados no Brunch.
Referência: https://brunch.co.kr/@seawolf/16