- FLUX.1 Kontext [dev] é a versão de pesos abertos de um modelo de edição de imagens generativas que antes era exclusivo, agora disponibilizada gratuitamente
- Com 12B parâmetros, pode rodar em hardware de consumo e é distribuído gratuitamente para pesquisa e uso não comercial
- Oferece desempenho de edição de imagens de alta qualidade em nível comercial, com edição local/global detalhada, manutenção da consistência de personagens e revisões iterativas, além de integração imediata com frameworks populares como ComfyUI, Hugging Face Diffusers e TensorRT
- Em avaliações de desempenho, mostrou resultados superiores aos de modelos abertos e fechados existentes (ex.: Google's Gemini-Flash Image)
- Também são fornecidas variantes TensorRT otimizadas para a arquitetura NVIDIA Blackwell (BF16, FP8, FP4), entregando ganhos significativos de velocidade e eficiência no hardware mais recente
- Com uma licença comercial e um portal self-service, também pode ser facilmente integrado e utilizado em negócios
Introdução e importância
- FLUX.1 Kontext [dev] é o mais recente modelo de edição de imagens generativas lançado pela Black Forest Labs
- Até agora, a maioria dos bons modelos de geração/edição de imagens era oferecida de forma proprietária, mas agora houve a transição para pesos abertos, permitindo que qualquer pessoa os use para pesquisa e fins não comerciais
- O modelo é composto por 12B parâmetros e apresenta ótimo desempenho, ao mesmo tempo em que mantém eficiência suficiente para funcionar em hardware de consumo comum
Lançamento e acessibilidade
- FLUX.1 Kontext [dev] foi lançado sob a licença não comercial FLUX.1, sendo oferecido gratuitamente a usuários de pesquisa e objetivos não comerciais
- Os pesos do modelo podem ser baixados facilmente no HuggingFace e são compatíveis com os principais frameworks de IA, como ComfyUI, HuggingFace Diffusers e TensorRT
- Parceiros como FAL, Replicate, Runware, DataCrunch e TogetherAI fornecem endpoints de API e código prontos para uso imediato em ambientes de nuvem e locais
Um novo padrão em edição de imagens
- FLUX.1 Kontext [dev] é especializado em tarefas de edição de imagens
- Excelente em preservação de personagens em edições iterativas e em diversos cenários e ambientes
- Suporta edição local e global precisa
- A Black Forest Labs tem como objetivo oferecer uma ferramenta aberta comparável a modelos proprietários
- Em benchmarks de grande escala (como o KontextBench), demonstrou desempenho superior em relação a modelos abertos existentes, como ByteDance Bagel e HiDream-E1-Full, além de modelos comerciais como Google Gemini-Flash Image
- Avaliações independentes de organizações externas, como a Artificial Analysis, também confirmaram resultados consistentes
Otimização de hardware e várias opções
- Em colaboração com a NVIDIA, são fornecidos pesos TensorRT otimizados para a mais recente arquitetura Blackwell (versões BF16, FP8 e FP4 otimizadas para energia e velocidade)
- Os desenvolvedores podem escolher facilmente o equilíbrio entre velocidade, eficiência e qualidade conforme a necessidade
Licença e portal para uso comercial
- A Black Forest Labs abriu um portal de licenciamento self-service com condições transparentes, simplificando o acesso comercial e não comercial a todos os seus modelos de pesos abertos
- As empresas podem comprar licenças facilmente pelo portal e integrar rapidamente os modelos da linha FLUX.1 aos seus serviços de negócios
Atualizações de licença
- A definição de finalidade não comercial foi esclarecida, apresentando de forma concreta o escopo permitido e as restrições
- Foi adicionada uma cláusula de filtro de conteúdo para evitar a geração de conteúdo ilegal ou que infrinja direitos, além de reforçar as cláusulas de isenção de responsabilidade
- O gerenciamento da origem do conteúdo e do histórico de geração passa a ser regido em conformidade com a legislação aplicável
- Também foram adicionados exemplos claros e restrições sobre casos de uso não permitidos
Materiais de referência e suporte
- Modelo/código/documentação
- O relatório técnico sobre o lançamento do FLUX.1 Kontext [dev] pode ser consultado no arxiv
- Usuários e empresas podem acessar várias APIs, guias e dados de benchmark
1 comentários
Comentários do Hacker News
É muito legal que a BFL tenha liberado os pesos, e acho que, na realidade em que a sustentabilidade financeira do open source é difícil, oferecer gratuitamente para a academia e cobrar uma taxa de licença razoável das startups é um modelo que permite que a BFL e outras empresas continuem lançando modelos de pesos abertos
Um aspecto interessante de liberar pesos abertos é a possibilidade de adicionar novas capacidades (tarefas) a esses modelos de edição
Estou torcendo para que o modelo Dev destilado mantenha desempenho suficiente mesmo em comparação com os modelos Pro/Max maiores
Usei esse sistema pessoalmente em um hackathon realizado em San Francisco na semana passada e fiquei bastante impressionado
A intenção da licença parece funcionar como uma espécie de filtro prévio, restringindo quem pode sequer se aproximar
A nova licença de uso não comercial aplicada é uma regra bastante complicada; vale consultar o texto completo da licença
Gostaria de usar um modelo como o Kontext para finalizar imagens colaborando com a IA em tempo real sobre uma tela
Fico curioso para saber com quanta VRAM esse sistema roda
É uma pena que a licença seja restritiva