DeepFloyd IF - modelo open source de Text-to-Image
(github.com/deep-floyd)- Novo modelo de imagem da Stability AI
- Tem compreensão de linguagem superior à dos modelos anteriores e gera imagens fotorrealistas
- Combinação de um codificador de texto Frozen baseado em T5 Transformer com um módulo de difusão de pixels em 3 estágios
- 64x64, 256x256, 1024x1024px
- Pontuação Zero-shot FID de 6,66 (dataset COCO)
Ainda não há comentários.