- O Stable Diffusion 3 é o modelo de texto para imagem mais avançado, com desempenho significativamente melhorado em prompts de múltiplos assuntos, qualidade de imagem e capacidade de ortografia
- Ainda não está amplamente disponível, mas começamos a registrar interessados na prévia antecipada
- Esta etapa de prévia é importante para obter insights para melhorar desempenho e segurança, como nos modelos anteriores
Escopo e tecnologia do modelo
- A suíte Stable Diffusion 3 tem uma faixa de 800M a 8B de parâmetros
- Essa abordagem está alinhada com os valores essenciais e com o objetivo de torná-lo acessível para todos, oferecendo várias opções com escalabilidade e qualidade que melhor atendem às necessidades criativas dos usuários
- O SD3 combina arquitetura Diffusion Transformer com Flow Matching
- Um relatório técnico detalhado será lançado em breve
Práticas de IA responsável e segura
- Colocamos grande importância em praticar uma IA responsável e segura
- Tomamos medidas razoáveis para evitar o mau uso do Stable Diffusion 3, e isso se estende desde os testes e avaliações nos estágios iniciais do treinamento do modelo até a implantação
- Ao preparar a prévia inicial, introduzimos várias camadas de segurança
- Esperamos continuar inovando ao nos aproximarmos da disponibilização pública do modelo por meio de colaboração contínua com pesquisadores, especialistas e a comunidade
Compromisso e ativação da criatividade
- Nosso compromisso com uma IA generativa que seja aberta, segura e amplamente acessível é firme
- Com o Stable Diffusion 3, esperamos oferecer uma solução adaptável para que pessoas físicas, desenvolvedores e empresas possam explorar sua criatividade
- Se quiser usar comercialmente modelos de imagem antes do lançamento do Stable Diffusion 3, acesse a página de assinatura da Stability AI ou use a API através da plataforma de desenvolvedores
1 comentários
Comentários do Hacker News
Usa um novo tipo de transformador de difusão, combinando 83 687 matching e outras melhorias.
A preocupa por seguran3 parece ser uma oportunidade de marketing perdida, considerando o recente incidente do Gemini.
Dado o contexto atual de censura, vai ser interessante ver o que essa "seguran" significa desta vez.
Metade do comunicado de lan�e1mento � dizer "somos realmente responsáveis e seguros".
Todas as imagens de demonstra s�eo 'artwork'.
A parte de texto e ortografia teve um grande avan�a.
Reescrevem a parte de "seguran" substituindo uma ferramenta de IA por uma faca imagin�eria chamada 'Big Knife'.