- O maior modelo open source SOTA de texto-para-imagem desenvolvido pela Black Forest Labs
- A equipe original que desenvolveu o Stable Diffusion
- Com 12B de parâmetros, expande os limites da criatividade e do desempenho, oferecendo recursos de geração de imagem semelhantes ao Midjourney
Disponível em 3 modelos
- FLUX.1 [dev]: modelo base disponibilizado como open source sob licença não comercial. A comunidade pode construir sobre ele
- FLUX.1 [schnell]: versão destilada do modelo base, operando até 10 vezes mais rápido. Licença Apache 2.
- FLUX.1 [pro]: versão proprietária disponível apenas via API
Principais características
- Qualidade de imagem aprimorada: capaz de gerar visuais impressionantes em alta resolução
- Anatomia humana avançada e fotorrealismo: capaz de gerar imagens muito realistas e anatomicamente precisas
- Melhor aderência ao prompt: capaz de gerar imagens mais precisas e relevantes com base na entrada
- Velocidade excepcional: a velocidade e eficiência do Flux Schnell o tornam ideal para aplicações de alta demanda
Integração com a fal
- Ao integrar o mecanismo de inferência de ponta da fal, os modelos Flux podem rodar até 2 vezes mais rápido do que com eager torch
- Tempo de processamento rápido com manutenção de qualidade e detalhes excelentes
Resumo do GN⁺
- Flux é o mais recente modelo de texto-para-imagem desenvolvido pela Black Forest Labs e estabelece um novo padrão de criatividade e desempenho
- Por meio de diferentes variantes do modelo, oferece soluções sob medida para diversos casos de uso
- Com qualidade de imagem aprimorada e expressividade realista, é adequado para aplicações de alta demanda
- Com o mecanismo de inferência da fal, é possível executar o modelo de forma ainda mais rápida e eficiente
- Outros projetos com funcionalidades semelhantes incluem DALL-E e Midjourney
1 comentários
Comentários no Hacker News
burkay from fal.ai: o modelo não foi criado pela fal, e sim pela Black Forest Labs
Outro usuário: a maioria das comparações não testa corretamente o novo modelo
Outro usuário: testou usando prompts do ideogram, e o Flux gera imagens muito boas
Outro usuário: sempre que vê um novo modelo, verifica se ele consegue criar diagramas de engenharia
Outro usuário: o processo de cadastro é incômodo
Outro usuário: startups financiadas por capital de risco continuam lançando modelos gratuitos sem ter um modelo de negócios
Outro usuário: qualidade impressionante
Outro usuário: não lida bem com relações espaciais