Imagen - o modelo de difusão text-to-image do Google
(imagen.research.google)- Um modelo de IA que gera imagens realistas a partir de uma compreensão profunda da linguagem
- Em avaliações com pessoas, gerou imagens preferidas em relação ao DALL-E 2 da OpenAI
→ tanto em qualidade quanto em alinhamento entre imagem e texto - Apenas o artigo de pesquisa e imagens de exemplo foram divulgados
→ uma versão demo utilizável externamente não será lançada devido a questões éticas e afins
2 comentários
Ontem, numa livraria, vi um livro de Alice no País das Maravilhas com stills de animações da Disney inseridos como ilustrações, e fiquei curioso para saber que tipo de resultado sairia se cada cena de Alice no País das Maravilhas fosse dada como entrada para um modelo desses.
Divulgação do DALL·E 2
Como o DALL-E 2 funciona?