12 pontos por xguru 4 일 전 | 1 comentários | Compartilhar no WhatsApp
  • Agente minimalista de IA para código desenvolvido pela equipe de Princeton e Stanford que criou o SWE-bench e o SWE-agent
  • Agente ultraleve de engenharia de software com IA, composto por cerca de 100 linhas de código Python, que funciona sem arquivos gigantes de configuração ou monorepo
  • Usa apenas bash como ferramenta e é compatível com qualquer modelo mesmo sem a interface de tool-calling de LLMs
  • Alcançou mais de 74% no benchmark SWE-bench verified, registrando o mesmo nível também com o Gemini 3 Pro
  • Executa cada ação de forma independente com subprocess.run, eliminando a necessidade de uma sessão shell com estado persistente e mantendo a simplicidade de trocar para docker exec ao migrar para Docker
  • Estrutura de histórico totalmente linear, em que a trajetória e as mensagens enviadas ao LLM são idênticas, ideal para depuração e fine-tuning
  • Suporte para implantação em vários ambientes de sandbox, como local, Docker/Podman, Singularity/Apptainer, Bubblewrap e Contree
  • Suporta todos os modelos por meio de litellm, openrouter e portkey, com compatibilidade com endpoints /completion e /response e interleaved thinking
  • Adotado por Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale e Princeton e Stanford
  • Em comparação com o Claude Code, inicia muito mais rápido e também pode ser usado como baseline para avaliar o desempenho do próprio LLM sem overfitting ao scaffold do agente
  • Oferece CLI (mini), inferência em lote, navegador de trajetórias e bindings em Python (DefaultAgent, LitellmModel, LocalEnvironment)
  • Licença MIT

1 comentários

 
ragingwind 3 일 전

Agora está ficando mais fácil desenvolver agentes diretamente.