8 pontos por GN⁺ 2025-06-29 | 1 comentários | Compartilhar no WhatsApp
  • FLUX.1 Kontext [dev] é a versão de pesos abertos de um modelo de edição de imagens generativas que antes era exclusivo, agora disponibilizada gratuitamente
  • Com 12B parâmetros, pode rodar em hardware de consumo e é distribuído gratuitamente para pesquisa e uso não comercial
  • Oferece desempenho de edição de imagens de alta qualidade em nível comercial, com edição local/global detalhada, manutenção da consistência de personagens e revisões iterativas, além de integração imediata com frameworks populares como ComfyUI, Hugging Face Diffusers e TensorRT
  • Em avaliações de desempenho, mostrou resultados superiores aos de modelos abertos e fechados existentes (ex.: Google's Gemini-Flash Image)
  • Também são fornecidas variantes TensorRT otimizadas para a arquitetura NVIDIA Blackwell (BF16, FP8, FP4), entregando ganhos significativos de velocidade e eficiência no hardware mais recente
  • Com uma licença comercial e um portal self-service, também pode ser facilmente integrado e utilizado em negócios

Introdução e importância

  • FLUX.1 Kontext [dev] é o mais recente modelo de edição de imagens generativas lançado pela Black Forest Labs
  • Até agora, a maioria dos bons modelos de geração/edição de imagens era oferecida de forma proprietária, mas agora houve a transição para pesos abertos, permitindo que qualquer pessoa os use para pesquisa e fins não comerciais
  • O modelo é composto por 12B parâmetros e apresenta ótimo desempenho, ao mesmo tempo em que mantém eficiência suficiente para funcionar em hardware de consumo comum

Lançamento e acessibilidade

  • FLUX.1 Kontext [dev] foi lançado sob a licença não comercial FLUX.1, sendo oferecido gratuitamente a usuários de pesquisa e objetivos não comerciais
  • Os pesos do modelo podem ser baixados facilmente no HuggingFace e são compatíveis com os principais frameworks de IA, como ComfyUI, HuggingFace Diffusers e TensorRT
  • Parceiros como FAL, Replicate, Runware, DataCrunch e TogetherAI fornecem endpoints de API e código prontos para uso imediato em ambientes de nuvem e locais

Um novo padrão em edição de imagens

  • FLUX.1 Kontext [dev] é especializado em tarefas de edição de imagens
    • Excelente em preservação de personagens em edições iterativas e em diversos cenários e ambientes
    • Suporta edição local e global precisa
  • A Black Forest Labs tem como objetivo oferecer uma ferramenta aberta comparável a modelos proprietários
  • Em benchmarks de grande escala (como o KontextBench), demonstrou desempenho superior em relação a modelos abertos existentes, como ByteDance Bagel e HiDream-E1-Full, além de modelos comerciais como Google Gemini-Flash Image
  • Avaliações independentes de organizações externas, como a Artificial Analysis, também confirmaram resultados consistentes

Otimização de hardware e várias opções

  • Em colaboração com a NVIDIA, são fornecidos pesos TensorRT otimizados para a mais recente arquitetura Blackwell (versões BF16, FP8 e FP4 otimizadas para energia e velocidade)
  • Os desenvolvedores podem escolher facilmente o equilíbrio entre velocidade, eficiência e qualidade conforme a necessidade

Licença e portal para uso comercial

  • A Black Forest Labs abriu um portal de licenciamento self-service com condições transparentes, simplificando o acesso comercial e não comercial a todos os seus modelos de pesos abertos
  • As empresas podem comprar licenças facilmente pelo portal e integrar rapidamente os modelos da linha FLUX.1 aos seus serviços de negócios

Atualizações de licença

  • A definição de finalidade não comercial foi esclarecida, apresentando de forma concreta o escopo permitido e as restrições
  • Foi adicionada uma cláusula de filtro de conteúdo para evitar a geração de conteúdo ilegal ou que infrinja direitos, além de reforçar as cláusulas de isenção de responsabilidade
  • O gerenciamento da origem do conteúdo e do histórico de geração passa a ser regido em conformidade com a legislação aplicável
  • Também foram adicionados exemplos claros e restrições sobre casos de uso não permitidos

Materiais de referência e suporte

1 comentários

 
GN⁺ 2025-06-29
Comentários do Hacker News
  • É muito legal que a BFL tenha liberado os pesos, e acho que, na realidade em que a sustentabilidade financeira do open source é difícil, oferecer gratuitamente para a academia e cobrar uma taxa de licença razoável das startups é um modelo que permite que a BFL e outras empresas continuem lançando modelos de pesos abertos

    • Se a BFL tivesse que pagar antecipadamente taxas de autorização explícita de uso para todo o conteúdo baseado em imagens e vídeos que utiliza, acho que isso seria financeiramente insustentável
  • Um aspecto interessante de liberar pesos abertos é a possibilidade de adicionar novas capacidades (tarefas) a esses modelos de edição

    • Parece generalizar bem mesmo com poucas amostras (cerca de 30), e isso foi compartilhado no blog
      • Esta versão do Kontext é a que todo mundo estava esperando e parece muito mais prática
      • É o primeiro caso entre a nova geração de modelos de geração de imagem que podem ser treinados, algo que não era possível em grandes modelos existentes como Gemini, GPT e MJ
  • Estou torcendo para que o modelo Dev destilado mantenha desempenho suficiente mesmo em comparação com os modelos Pro/Max maiores

    • Espero que esse modelo consiga substituir completamente, em vários aspectos, técnicas antigas de inpainting como Stable Diffusion
    • Dá para ver experimentos de antes e depois de edição de imagem com o Kontext aqui
  • Usei esse sistema pessoalmente em um hackathon realizado em San Francisco na semana passada e fiquei bastante impressionado

    • Fico curioso sobre que tipos de projetos as pessoas fizeram nesse hackathon
  • A intenção da licença parece funcionar como uma espécie de filtro prévio, restringindo quem pode sequer se aproximar

    • Mesmo que formalmente seja aberta, na prática o escopo de aplicação fica mais estreito, e esse tipo de configuração acaba moldando quem pode tentar
    • Há a vantagem de evitar abusos, mas usos úteis também podem ser barrados, e no fim isso tende até a alterar sutilmente os critérios para novas experimentações
  • A nova licença de uso não comercial aplicada é uma regra bastante complicada; vale consultar o texto completo da licença

    • Se interpretar essa licença ao pé da letra, ela não pode ser usada em ambientes comerciais nem mesmo quando o objetivo não é criar derivados, mas apenas gerar resultados
    • Fico em dúvida sobre a que exatamente essa licença se aplica; provavelmente, fora algum código Python fácil de reimplementar, acho que não haveria copyright
    • A posição é que os pesos do modelo não são uma obra criativa à qual se possa atribuir copyright tanto quanto as empresas gostariam, e também não se enquadram na definição legal de copyright
    • Diferentemente de bancos de dados ou software, enfatiza-se que os pesos do modelo não atendem aos requisitos de copyright e, independentemente de quanta criatividade tenha sido envolvida, não são objeto de proteção autoral
  • Gostaria de usar um modelo como o Kontext para finalizar imagens colaborando com a IA em tempo real sobre uma tela

    • Espero muito que surja uma experiência de “parceiro de pintura em tempo real”, combinando inovações em previsão de séries temporais no campo de LLM com algo como o dataset Google Quick Draw, permitindo conversar com o pincel enquanto a imagem é concluída
      • Ao testar o modelo Kontext da Fal.ai, o slider de transformação antes/depois e a possibilidade de continuar ajustando com a imagem editada são recursos impressionantes
      • Já que a BFL liberou até o modelo dev, espero mesmo que saia um plugin do Kontext para o Krita, que já tem plugin existente para Stable Diffusion
      • Link de referência do plugin do Krita
  • Fico curioso para saber com quanta VRAM esse sistema roda

    • No momento, parece precisar de cerca de 18~20GB de VRAM, mas amanhã ou em um futuro próximo talvez rode até com 4GB de VRAM, desde que se tenha cerca de 1 hora de sobra
  • É uma pena que a licença seja restritiva