Stability AI anuncia o modelo Stable Diffusion XL 1.0
(techcrunch.com)- O modelo de texto-para-imagem mais avançado
- Em comparação com a versão anterior, traz imagens mais vívidas, cores mais precisas e melhor contraste, sombras e iluminação
- 3,5 bilhões de parâmetros
- Capaz de gerar imagens em resolução de 1 megapixel em poucos segundos
- Pode ser personalizado e ajustado com fine-tuning para conceitos e estilos
- A geração de texto também foi aprimorada, com geração de texto avançada e melhor legibilidade
- Suporta inpainting, outpainting e prompts de image-to-image
2 comentários
Gerei automaticamente uma explicação detalhada do anúncio oficial com o GPT-4.
Anúncio do SDXL 1.0 (ANNOUNCING SDXL 1.0)
Introdução
A equipe da Stability AI tem orgulho de lançar o SDXL 1.0 como um modelo aberto, representando a próxima etapa na evolução dos modelos de geração de texto para imagem. Dando continuidade ao lançamento limitado e voltado para pesquisa do SDXL 0.9, a versão completa do SDXL foi aprimorada para se tornar o melhor modelo aberto de geração de imagens do mundo.
Resumo
O SDXL 1.0 é o principal modelo de imagem da Stability AI e o melhor modelo aberto para geração de imagens. Nós o comparamos com vários outros modelos e concluímos que, no fim, as pessoas preferem as imagens geradas pelo SDXL 1.0 às geradas por outros modelos abertos. Esses resultados de pesquisa vieram de várias semanas de dados de preferência coletados a partir das gerações de modelos experimentais em nosso Discord e de testes externos.
O SDXL gera imagens de alta qualidade em praticamente todos os estilos artísticos e é o melhor modelo aberto para fotorrealismo. Imagens únicas podem ser solicitadas sem uma "sensação" específica imposta pelo modelo, garantindo liberdade absoluta de estilo. O SDXL 1.0 foi especialmente ajustado para nitidez e precisão de cores, além de oferecer contraste, iluminação e sombras melhores do que seu antecessor. Além disso, o SDXL consegue gerar conceitos com os quais modelos de imagem costumam ter dificuldade na renderização, como mãos e texto, ou composições organizadas espacialmente (por exemplo, uma mulher perseguindo um cachorro ao fundo).
O SDXL precisa de apenas algumas palavras para gerar imagens complexas, detalhadas e esteticamente agradáveis. Os usuários não precisam mais usar termos qualificadores como "obra-prima" para obter imagens de alta qualidade. Além disso, o SDXL consegue entender a diferença entre conceitos como "The Red Square" (um lugar famoso) e "red square" (uma forma).
O SDXL 1.0 tem o maior número de parâmetros entre os modelos abertos de imagem com acesso aberto e é baseado em uma nova arquitetura inovadora composta por um modelo base de 3.5B parâmetros e um refiner de 6.6B parâmetros. O modelo completo consiste em um pipeline mixture-of-experts para difusão latente: na primeira etapa, o modelo base gera os latentes (com ruído), que depois são processados por um modelo de refinamento especializado na etapa final de remoção de ruído. Como referência, o modelo base também pode ser usado como um módulo independente. Essa arquitetura em duas etapas oferece uma abordagem robusta para geração de imagens e entrega resultados ainda melhores.
Referências
Stability AI Blog: O blog da Stability AI fornece informações detalhadas sobre as pesquisas e os anúncios mais recentes da empresa. Por meio dele, é possível obter informações adicionais sobre modelos recentes como o SDXL 1.0.
https://stability.ai/blog
Stable Diffusion: Este site fornece informações detalhadas sobre a tecnologia Stable Diffusion da Stability AI. Essa tecnologia é um componente central do SDXL 1.0, e por meio deste site é possível obter uma compreensão mais profunda dela.
https://stability.ai/stable-diffusion
Discord Community: Esta comunidade no Discord é um espaço onde pesquisadores e usuários da Stability AI se reúnem para compartilhar e discutir seus trabalhos. Por meio dela, é possível conhecer a experiência de outras pessoas que usam modelos como o SDXL 1.0.
https://discord.gg/stablediffusion
Há um pouco mais de detalhes no post oficial de anúncio da Stability AI, então deixo o link aqui. :)
https://stability.ai/blog/stable-diffusion-sdxl-1-announcement