NambaAI - ferramenta de CLI que organiza o trabalho com Codex em um fluxo de SPEC, validação e handoff de PR
(github.com/Nam-Cheol)Ao usar o Codex, eu achava incômodo o fluxo em que pedidos ambíguos levavam diretamente a alterações de código, então estou criando uma ferramenta de CLI para organizar isso em um processo de desenvolvimento mais estruturado.
O NambaAI não é uma ferramenta para substituir o Codex, mas algo mais próximo de uma camada de workflow que funciona ao redor do Codex.
A ideia básica é a seguinte.
request → SPEC → execution → validation → PR handoff
Ou seja, em vez de enviar a solicitação do usuário direto para a implementação, ele ajuda a organizar primeiro objetivos, escopo, restrições e critérios de aceitação, registrar isso em um arquivo SPEC e só então seguir com o trabalho.
No momento, ele está estruturado principalmente em torno do seguinte fluxo.
namba project
namba plan "solicitação de trabalho"
namba run SPEC-XXX
namba sync
namba pr
namba land
Também estou experimentando um fluxo de queue para processar vários SPECs em sequência.
O motivo de eu ter criado essa ferramenta é que, quanto mais conveniente a programação com IA se torna, mais frequentes são os casos em que o processo de mudança não fica rastreável, ou em que depois é difícil verificar com base em quais critérios algo foi implementado. Em especial, ao usar o Codex repetidamente, senti que pode ficar nebuloso “o que foi decidido fazer”, “até onde ia o escopo”, “como a validação foi feita” e “o que deve ser observado no PR”.
O NambaAI é uma tentativa de reduzir esse problema das seguintes formas.
- organizar primeiro o objetivo e o escopo antes do trabalho
- gerar um arquivo SPEC antes da implementação
- registrar os resultados da execução e as evidências de validação
- gerar um documento de handoff para o PR
- organizar as mudanças feitas pelo Codex de forma que seja fácil para uma pessoa revisar
- gerenciar isso não como um prompt pontual, mas como um processo de desenvolvimento repetível
Não é uma proposta de criar um agente autônomo genérico como os frameworks de agentes de IA existentes. No momento, o foco está no Codex como centro do fluxo, dividindo o trabalho em unidades que o desenvolvedor possa revisar e registrando esse processo.
Como ainda está em estágio inicial, há muitas partes faltando.
- falta de exemplos reais de uso
- necessidade de melhorar a documentação de onboarding
- falta de eval pack
- necessidade de revisão de segurança do installer/hook
- necessidade de testes cruzados em macOS, Linux e Windows
- falta de comparação com harnesses existentes de AI coding
- falta de validação em projetos reais
É um projeto open source inicial que eu mesmo criei, e neste momento está mais na fase de validar a direção do que de ser um produto com alto nível de acabamento.
Quero especialmente receber feedback das pessoas que usam Codex no trabalho ou em projetos pessoais sobre os pontos abaixo.
- se esse workflow de Codex baseado em SPEC parece realmente útil no processo de desenvolvimento
- quais partes parecem excessivamente projetadas
- que mecanismos adicionais de confiança seriam necessários para aplicar isso em projetos reais
- se existem ferramentas ou padrões já existentes com os quais valha a pena comparar
- se há partes do fluxo de instalação/uso que parecem incômodas ou arriscadas
Opiniões críticas também são bem-vindas. Como ainda está em estágio inicial, neste momento é mais útil saber onde estão de fato os pontos fracos do que ouvir elogios.
1 comentários
Eu pretendia fazer como uma CLI, mas ultimamente estou usando no Codex desktop! Fiquei preocupado se haveria conflito com o harness embutido do Codex desktop, mas felizmente a compatibilidade é bem tranquila haha
Além disso, também preciso refletir o conteúdo desta atualização 0.131.0 do Codex, e como estou usando só este harness, continuo vendo pontos em que ele ainda falta um pouco, mas o que mais falta mesmo sou eu...