3 pontos por GN⁺ 2023-08-21 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Stable Diffusion implementado em C/C++ puro, com um artigo sobre o modelo de machine learning
  • Implementação baseada em ggml, com funcionamento semelhante ao do llama.cpp
  • Suporte a quantização em float de 16 e 32 bits, e inteiros de 4, 5 e 8 bits
  • Implementação eficiente em memória e otimizada para inferência em CPU; requer cerca de 2,3 GB para gerar imagens 512x512 usando txt2img
  • Suporte a AVX, AVX2 e AVX512 para arquitetura x86
  • Implementação dos modos originais txt2img e img2img, incluindo um tokenizador no estilo stable-diffusion-webui
  • O método de amostragem utilizado é Euler A
  • Implementação compatível com as plataformas Linux, Mac OS e Windows
  • Melhorias futuras incluem mais métodos de amostragem, suporte a GPU, inferência mais rápida, menor uso de memória, suporte a LoRA, suporte a k-quants e reprodutibilidade entre plataformas
  • Artigo com instruções detalhadas sobre como obter o código, converter os pesos, compilar e executar a implementação
  • Implementação com suporte a vários formatos de modelo de saída, incluindo ponto flutuante de 16 bits, ponto flutuante de 32 bits e diversas quantizações inteiras
  • Artigo com exemplos de uso da implementação para os modos txt2img e img2img
  • Os requisitos de memória e disco variam conforme a precisão utilizada, mas para imagens 512x512 o requisito de memória fica entre cerca de 2,0 GB e 2,8 GB
  • Implementação baseada em várias referências, incluindo ggml, stable-diffusion, stable-diffusion-webui e k-diffusion

Ainda não há comentários.

Ainda não há comentários.