Anúncio do Stable Diffusion 3

xguru · 2024-02-23T09:16:02+09:00

O Stable Diffusion 3 é o modelo de texto para imagem mais avançado, com desempenho significativamente melhorado em prompts de múltiplos assuntos, qualidade de imagem e capacidade de ortografia Ainda não está amplamente disponível, mas começamos a registrar interessados na prévia antecipada Esta etapa de prévia é importante para obter insights para melhorar desempenho e segurança, como nos modelos anteriores Escopo e tecnologia do modelo A suíte Stable Diffusion 3 tem uma faixa de 800M a 8B de parâmetros Essa abordagem está alinhada com os valores essenciais e com o objetivo de torná-lo acessível para todos, oferecendo várias opções com escalabilidade e qualidade que melhor atendem às necessidades criativas dos usuários O SD3 combina arquitetura Diffusion Transformer com Flow Matching Um relatório técnico detalhado será lançado em breve Práticas de IA responsável e segura Colocamos grande importância em praticar uma IA responsável e segura Tomamos medidas razoáveis para evitar o mau uso do Stable Diffusion 3, e isso se estende desde os testes e avaliações nos estágios iniciais do treinamento do modelo até a implantação Ao preparar a prévia inicial, introduzimos várias camadas de segurança Esperamos continuar inovando ao nos aproximarmos da disponibilização pública do modelo por meio de colaboração contínua com pesquisadores, especialistas e a comunidade Compromisso e ativação da criatividade Nosso compromisso com uma IA generativa que seja aberta, segura e amplamente acessível é firme Com o Stable Diffusion 3, esperamos oferecer uma solução adaptável para que pessoas físicas, desenvolvedores e empresas possam explorar sua criatividade Se quiser usar comercialmente modelos de imagem antes do lançamento do Stable Diffusion 3, acesse a página de assinatura da Stability AI ou use a API através da plataforma de desenvolvedores

(stability.ai)

9 pontos por xguru 2024-02-23 | 1 comentários | Compartilhar no WhatsApp

O Stable Diffusion 3 é o modelo de texto para imagem mais avançado, com desempenho significativamente melhorado em prompts de múltiplos assuntos, qualidade de imagem e capacidade de ortografia
Ainda não está amplamente disponível, mas começamos a registrar interessados na prévia antecipada
Esta etapa de prévia é importante para obter insights para melhorar desempenho e segurança, como nos modelos anteriores

Escopo e tecnologia do modelo

A suíte Stable Diffusion 3 tem uma faixa de 800M a 8B de parâmetros
Essa abordagem está alinhada com os valores essenciais e com o objetivo de torná-lo acessível para todos, oferecendo várias opções com escalabilidade e qualidade que melhor atendem às necessidades criativas dos usuários
O SD3 combina arquitetura Diffusion Transformer com Flow Matching
Um relatório técnico detalhado será lançado em breve

Práticas de IA responsável e segura

Colocamos grande importância em praticar uma IA responsável e segura
Tomamos medidas razoáveis para evitar o mau uso do Stable Diffusion 3, e isso se estende desde os testes e avaliações nos estágios iniciais do treinamento do modelo até a implantação
Ao preparar a prévia inicial, introduzimos várias camadas de segurança
Esperamos continuar inovando ao nos aproximarmos da disponibilização pública do modelo por meio de colaboração contínua com pesquisadores, especialistas e a comunidade

Compromisso e ativação da criatividade

Nosso compromisso com uma IA generativa que seja aberta, segura e amplamente acessível é firme
Com o Stable Diffusion 3, esperamos oferecer uma solução adaptável para que pessoas físicas, desenvolvedores e empresas possam explorar sua criatividade
Se quiser usar comercialmente modelos de imagem antes do lançamento do Stable Diffusion 3, acesse a página de assinatura da Stability AI ou use a API através da plataforma de desenvolvedores

1 comentários

xguru 2024-02-23

Comentários do Hacker News

Usa um novo tipo de transformador de difusão, combinando 83 687 matching e outras melhorias.
- A melhoria no transformador permite escalar mais e aceitar entrada multimodal.
- Est pronto para ser liberado visando aumentar a qualidade e a segurane3, e ser lançado junto com todo o ecossistema de ferramentas.
- Uma nova base que aproveita hardware de ponta, disponibilizada em todos os tamanhos.
- Permite video, 3D etc.
- Exige mais GPUs.
- Os detalhes tcnicos sero divulgados em breve.
- Com GPUs e dados suficientes, pode gerar videos semelhantes ao Sora.
- Est dispondivel em diferentes tamanhos, de 8 milh?es de 8 bilhões de pare1metros, para funcionar em todos os tipos de GPU.
A preocupa por seguran3 parece ser uma oportunidade de marketing perdida, considerando o recente incidente do Gemini.
- O excesso de seguran faz com que a maioria das imagens fique muito borrada, e prompts que funcionavam na vers3o anterior ficam desfocados no SDXL.
- Se a prf1ima vers3o for assim, vou parar de usar a Stability API.
- Estou curioso para ver se existe outro servi0 de texto-imagem que entregue valor e qualidade semelhantes ao Stable Diffusion sem tanto borramento.
Dado o contexto atual de censura, vai ser interessante ver o que essa "seguran" significa desta vez.
- Tive bastante dificuldade ao tentar gerar uma imagem de arma para ativos de jogo usando o DALL·E.
Metade do comunicado de lane1mento dizer "somos realmente responsáveis e seguros".
Todas as imagens de demonstra seo 'artwork'.
- Fico curioso para ver se o modelo tambe n fotos, desenhos tcnicos e outros tipos de meddia gr?fica.
A parte de texto e ortografia teve um grande avana.
Reescrevem a parte de "seguran" substituindo uma ferramenta de IA por uma faca imagineria chamada 'Big Knife'.
- "Acreditamos em um uso seguro e responsvel de facas. Isso significa que tomamos medidas razoe1veis para impedir o mau uso do Big Knife por atores mal-intencionados."