- O objetivo é criar um modelo de síntese de imagens que qualquer pessoa possa entender
- O código de amostragem tem apenas 12 linhas, então qualquer pessoa consegue entendê-lo em poucos minutos
- Para reduzir o poder computacional, ele opera em um Quantized Latent Space, como o StableDiffusion
1 comentários
Sempre acho incrível ver uma IA funcionando com tão poucas linhas de código.