mini-swe-agent - agente de IA de 100 linhas para resolver issues no GitHub e dar suporte via linha de comando

xguru · 2026-04-26T09:31:02+09:00

Agente minimalista de IA para código desenvolvido pela equipe de Princeton e Stanford que criou o SWE-bench e o SWE-agent Agente ultraleve de engenharia de software com IA, composto por cerca de 100 linhas de código Python, que funciona sem arquivos gigantes de configuração ou monorepo Usa apenas bash como ferramenta e é compatível com qualquer modelo mesmo sem a interface de tool-calling de LLMs Alcançou mais de 74% no benchmark SWE-bench verified, registrando o mesmo nível também com o Gemini 3 Pro Executa cada ação de forma independente com subprocess.run, eliminando a necessidade de uma sessão shell com estado persistente e mantendo a simplicidade de trocar para docker exec ao migrar para Docker Estrutura de histórico totalmente linear, em que a trajetória e as mensagens enviadas ao LLM são idênticas, ideal para depuração e fine-tuning Suporte para implantação em vários ambientes de sandbox, como local, Docker/Podman, Singularity/Apptainer, Bubblewrap e Contree Suporta todos os modelos por meio de litellm, openrouter e portkey, com compatibilidade com endpoints /completion e /response e interleaved thinking Adotado por Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale e Princeton e Stanford Em comparação com o Claude Code, inicia muito mais rápido e também pode ser usado como baseline para avaliar o desempenho do próprio LLM sem overfitting ao scaffold do agente Oferece CLI (mini), inferência em lote, navegador de trajetórias e bindings em Python (DefaultAgent, LitellmModel, LocalEnvironment) Licença MIT

(github.com/SWE-agent)

12 pontos por xguru 2026-04-26 | 1 comentários | Compartilhar no WhatsApp

Agente minimalista de IA para código desenvolvido pela equipe de Princeton e Stanford que criou o SWE-bench e o SWE-agent
Agente ultraleve de engenharia de software com IA, composto por cerca de 100 linhas de código Python, que funciona sem arquivos gigantes de configuração ou monorepo
Usa apenas bash como ferramenta e é compatível com qualquer modelo mesmo sem a interface de tool-calling de LLMs
Alcançou mais de 74% no benchmark SWE-bench verified, registrando o mesmo nível também com o Gemini 3 Pro
Executa cada ação de forma independente com subprocess.run, eliminando a necessidade de uma sessão shell com estado persistente e mantendo a simplicidade de trocar para docker exec ao migrar para Docker
Estrutura de histórico totalmente linear, em que a trajetória e as mensagens enviadas ao LLM são idênticas, ideal para depuração e fine-tuning
Suporte para implantação em vários ambientes de sandbox, como local, Docker/Podman, Singularity/Apptainer, Bubblewrap e Contree
Suporta todos os modelos por meio de litellm, openrouter e portkey, com compatibilidade com endpoints /completion e /response e interleaved thinking
Adotado por Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale e Princeton e Stanford
Em comparação com o Claude Code, inicia muito mais rápido e também pode ser usado como baseline para avaliar o desempenho do próprio LLM sem overfitting ao scaffold do agente
Oferece CLI (mini), inferência em lote, navegador de trajetórias e bindings em Python (DefaultAgent, LitellmModel, LocalEnvironment)
Licença MIT

1 comentários

ragingwind 2026-04-26

Agora está ficando mais fácil desenvolver agentes diretamente.

mini-swe-agent - agente de IA de 100 linhas para resolver issues no GitHub e dar suporte via linha de comando

Leituras relacionadas

1 comentários