9 pontos por xguru 2024-02-23 | 1 comentários | Compartilhar no WhatsApp
  • O Stable Diffusion 3 é o modelo de texto para imagem mais avançado, com desempenho significativamente melhorado em prompts de múltiplos assuntos, qualidade de imagem e capacidade de ortografia
  • Ainda não está amplamente disponível, mas começamos a registrar interessados na prévia antecipada
  • Esta etapa de prévia é importante para obter insights para melhorar desempenho e segurança, como nos modelos anteriores

Escopo e tecnologia do modelo

  • A suíte Stable Diffusion 3 tem uma faixa de 800M a 8B de parâmetros
  • Essa abordagem está alinhada com os valores essenciais e com o objetivo de torná-lo acessível para todos, oferecendo várias opções com escalabilidade e qualidade que melhor atendem às necessidades criativas dos usuários
  • O SD3 combina arquitetura Diffusion Transformer com Flow Matching
  • Um relatório técnico detalhado será lançado em breve

Práticas de IA responsável e segura

  • Colocamos grande importância em praticar uma IA responsável e segura
  • Tomamos medidas razoáveis para evitar o mau uso do Stable Diffusion 3, e isso se estende desde os testes e avaliações nos estágios iniciais do treinamento do modelo até a implantação
  • Ao preparar a prévia inicial, introduzimos várias camadas de segurança
  • Esperamos continuar inovando ao nos aproximarmos da disponibilização pública do modelo por meio de colaboração contínua com pesquisadores, especialistas e a comunidade

Compromisso e ativação da criatividade

  • Nosso compromisso com uma IA generativa que seja aberta, segura e amplamente acessível é firme
  • Com o Stable Diffusion 3, esperamos oferecer uma solução adaptável para que pessoas físicas, desenvolvedores e empresas possam explorar sua criatividade
  • Se quiser usar comercialmente modelos de imagem antes do lançamento do Stable Diffusion 3, acesse a página de assinatura da Stability AI ou use a API através da plataforma de desenvolvedores

1 comentários

 
xguru 2024-02-23

Comentários do Hacker News

  • Usa um novo tipo de transformador de difusão, combinando 83 687 matching e outras melhorias.

    • A melhoria no transformador permite escalar mais e aceitar entrada multimodal.
    • Est pronto para ser liberado visando aumentar a qualidade e a seguran�e3, e ser lançado junto com todo o ecossistema de ferramentas.
    • �Uma nova base que aproveita hardware de ponta, disponibilizada em todos os tamanhos.
    • Permite v�ideo, 3D etc.
    • Exige mais GPUs.
    • Os detalhes tcnicos sero divulgados em breve.
    • Com GPUs e dados suficientes, pode gerar v�ideos semelhantes ao Sora.
    • Est dispondivel em diferentes tamanhos, de 8 milh?es de 8 bilhões de par�e1metros, para funcionar em todos os tipos de GPU.
  • A preocupa por seguran3 parece ser uma oportunidade de marketing perdida, considerando o recente incidente do Gemini.

    • O excesso de seguran faz com que a maioria das imagens fique muito borrada, e prompts que funcionavam na vers3o anterior ficam desfocados no SDXL.
    • Se a pr�f1ima vers3o for assim, vou parar de usar a Stability API.
    • Estou curioso para ver se existe outro servi0 de texto-imagem que entregue valor e qualidade semelhantes ao Stable Diffusion sem tanto borramento.
  • Dado o contexto atual de censura, vai ser interessante ver o que essa "seguran" significa desta vez.

    • Tive bastante dificuldade ao tentar gerar uma imagem de arma para ativos de jogo usando o DALL·E.
  • Metade do comunicado de lan�e1mento � dizer "somos realmente responsáveis e seguros".

  • Todas as imagens de demonstra s�eo 'artwork'.

    • Fico curioso para ver se o modelo tamb�e n fotos, desenhos tcnicos e outros tipos de m�eddia gr?fica.
  • A parte de texto e ortografia teve um grande avan�a.

  • Reescrevem a parte de "seguran" substituindo uma ferramenta de IA por uma faca imagin�eria chamada 'Big Knife'.

    • "Acreditamos em um uso seguro e responsvel de facas. Isso significa que tomamos medidas razo�e1veis para impedir o mau uso do Big Knife por atores mal-intencionados."