69 pontos por GN⁺ 2026-03-19 | 3 comentários | Compartilhar no WhatsApp
  • Vídeo de webinar (58 min) do curso sobre Codex para desenvolvedores, apresentado pela própria OpenAI
  • Codex é uma plataforma de agentes de programação projetada para ir além da conclusão de código e do pair programming, permitindo que engenheiros deleguem tarefas de grande porte a agentes
  • O app do Codex, a CLI, extensões de IDE e outras interfaces diversas compartilham o mesmo backend, com capacidade de executar várias tarefas em paralelo
  • Cobre todo o ciclo de vida de desenvolvimento de software (SDLC), de planejamento (Plan), design (Design), build (Build), testes (Test), revisão (Review) e documentação (Document) até deploy e manutenção (Deploy & Maintenance)
  • Com o arquivo agents.md, é possível definir instruções de comportamento do agente por repositório, e empacotar workflows repetitivos com Skills e Automations para execução automática
  • Suporta trabalho contínuo por 25 horas e manutenção de contexto de longa duração por meio de 13 a 14 compactions no lado do servidor, com segurança garantida por sandbox em nível de sistema operacional

A evolução da programação com IA: da conclusão de código à delegação para agentes

  • Nos últimos anos, a programação com IA evoluiu de conclusão de código (cerca de 10% de ganho na velocidade de digitação) para pair programming (planejamento entre arquivos, execução de testes, alterações no repositório)
  • As duas abordagens tinham foco em criar “um colaborador melhor”, mas a Codex começou a ser desenvolvida há um ano com o objetivo de construir agentes aos quais fosse possível delegar
  • Em dezembro de 2025, o modelo GT 5.2 Codex superou a principal barreira para a “verdadeira delegação a agentes” ao alcançar trabalho contínuo de longa duração e alta steerability
  • Depois vieram o GT 5.3, mais rápido e eficiente, e o mais recente GT 5.4, com melhorias contínuas de desempenho
  • Os avanços centrais foram navegar com estabilidade em grandes codebases corporativas e manter alinhamento por longos períodos de acordo com a intenção do usuário

Interfaces disponíveis para usar o Codex

  • O Codex permite usar um mesmo agente em várias superfícies, como CLI, extensão de IDE e app do Codex, todas compartilhando o mesmo backend
  • O app do Codex é a interface mais visual para execução paralela de tarefas, otimizada para rodar vários agentes ao mesmo tempo e revisar suas saídas
  • Caso de Peter Steinberger (criador do OpenClaw): ele trocou um fluxo antigo com mais de 10 janelas de CLI pelo app do Codex, melhorando a eficiência no gerenciamento de agentes em paralelo
  • Há suporte para macOS e Windows, com download disponível em openai.com/codex; no Windows, também pela Microsoft Store
  • Na CLI, o login inicial é feito com o comando codex login, e a sessão começa com codex

UI e configurações do app do Codex

  • É possível escolher o modelo (como GPT 5.4) e ajustar o nível de esforço de raciocínio (reasoning effort): low, medium, high, extra high
    • medium é o padrão e oferece o melhor equilíbrio entre velocidade e profundidade de raciocínio
    • Para perguntas simples, low; para raciocínio profundo por longos períodos, high ou extra high
  • O modo Speed (fast/standard) permite ajustar a velocidade de resposta
  • Além do trabalho local, há opções de modo Git worktree e inicialização de contêiner em nuvem remoto
  • Configuração de permissões: é possível escolher entre permissões padrão (ler/editar arquivos do projeto e pedir aprovação para comandos perigosos) ou acesso total (todos os arquivos do computador, acesso à rede e execução sem aprovação)
    • Para novos usuários, as permissões padrão são recomendadas
  • É possível adicionar e alternar projetos (pastas) pela barra lateral esquerda

Uso do Codex em todas as etapas do SDLC

  • A OpenAI publicou o guia “Building an AI Native Engineering Team”, que organiza como agentes de programação aceleram as 7 etapas do SDLC (planejamento, design, build, testes, revisão, documentação e deploy/manutenção)
  • Em especial, as etapas de testes e revisão se tornam ainda mais importantes à medida que a capacidade de gerar código melhora
  • O Codex vem sendo especialmente bem avaliado por seu raciocínio em codebases complexas e por escrever código em nível de produção

Etapa de planejamento (Plan)

  • Ao ativar o modo Plan (/plan ou Shift+Tab), o Codex elabora primeiro um plano antes da implementação
  • Na demo, ao ser solicitado um plano para um app companion de iOS em SwiftUI, o Codex explorou a codebase e então apresentou perguntas de acompanhamento (método de autenticação, escopo do primeiro release etc.)
  • O agente pode ser ajustado aceitando opções sugeridas ou digitando instruções diretamente
  • As premissas do plano são explicitadas para que o usuário possa verificar e corrigir

Etapa de design (Design) — integração com MCP

  • Por meio do MCP (Model Context Protocol), é possível conectar diretamente ao Codex o contexto de ferramentas externas como Figma e Linear
    • Há suporte em todas as interfaces: CLI, extensão de IDE e app do Codex
  • Com a integração Figma MCP, ao colar um link de design, o Codex traz o contexto do design e o converte em código
    • Se o MCP não estiver configurado, o Codex exibe automaticamente instruções de instalação
  • A integração com o app do ChatGPT também pode ser usada diretamente no Codex por meio de conectores criados por terceiros
  • Isso permite que engenheiros foquem na lógica principal, enquanto designers ganham mais tempo para explorar conceitos de design

Etapa de build (Build)

  • É a etapa do SDLC em que o impacto dos agentes de programação é maior
  • Na demo, foram executadas em paralelo tarefas como correção de ineficiência de consulta N+1 com testes de regressão adicionais, auditoria de autenticação ausente em rotas de API e migração de NextAuth v4 para Auth.js v5
  • Resultado da geração de código com base em design do Figma: alteração em 10 arquivos, 320 linhas de código escritas, sem necessidade de ajustar CSS manualmente
  • O recurso Worktree cria automaticamente cópias do projeto local para evitar conflitos entre tarefas paralelas, sem precisar duplicar o repositório manualmente
  • O Codex executa automaticamente comandos de validação, build e lint definidos em agents.md, como npx tsc e npm test, para verificar conformidade com as convenções da equipe
  • O build em si já não é mais o gargalo; em ambientes corporativos, o essencial é validar se o código segue as normas do time
  • O terminal pode ser aberto diretamente dentro do app com Command+J
  • Mesmo para apps iOS, é possível executar xcode build no app do Codex sem abrir o Xcode diretamente

Comandos com barra (Slash Commands)

  • CLI, extensão de IDE e app do Codex oferecem suporte a comandos com barra: modo plan, menção a arquivos, verificação do estado da sessão, mudança de permissões etc.
  • O comando /experimental permite ativar recursos experimentais
    • Inclui criação de multi-agentes (sub-agents)
    • A CLI costuma receber novos recursos um pouco antes das outras interfaces
  • Como todas as interfaces compartilham o mesmo backend, qualquer configuração ativada em uma delas é refletida em todas

Etapa de revisão (Review)

  • O comando /review executa revisão de código com base na branch base ou nas alterações locais ainda não commitadas
  • Os agentes do Codex são treinados especificamente para identificar bugs de nível P0/P1, entregando feedback de alto sinal com pouco ruído
  • Isso permite descobrir problemas localmente mais cedo, antes de o PR chegar ao pipeline de CI/CD
  • Integração nativa com GitHub Cloud: o Codex faz revisão automática de código em PRs de forma proativa ou reativa
    • Foi apresentado um caso em que capturou um problema P1 em regra de regex que humanos poderiam deixar passar
  • Outros SCMs, como GitLab e Bitbucket, podem ser integrados diretamente por meio do Codex SDK
  • Se comentários de revisão forem adicionados diretamente no painel de diff, eles passam a ser incorporados automaticamente ao contexto da conversa seguinte

Skills — empacotando workflows reutilizáveis

  • Skill é um padrão aberto para empacotar instruções de workflow reutilizáveis que o Codex pode executar
    • Estruturalmente, é uma pasta, e o arquivo obrigatório é o skill.md (metadados + instruções para o agente)
    • Opcionalmente, podem ser adicionados scripts de execução, documentação e templates
  • Também é possível embutir MCP dentro de uma skill para integração com ferramentas externas
  • Exemplos da demo: tratamento de comentários de PR, correção automática de falhas de build no BuildKite e detecção de código morto
  • Skill Creator (skill de sistema): ao pedir algo como “create a skill to find dead code paths” durante a conversa, ele gera automaticamente o esqueleto de skill.md
  • Skill Installer (skill de sistema): instala imediatamente a skill criada no diretório local de skills do Codex
  • Se um workflow recorrente surgir após uma conversa longa, transformá-lo em skill permite executar todo o fluxo com uma única chamada na próxima vez
  • Exemplo de GitHub Issue Plan PR skill: com um único prompt, executa triagem de issue no GitHub → planejamento → edição → documentação → criação de PR em rascunho, cobrindo de uma vez as etapas do SDLC

Etapa de documentação (Documentation)

  • É uma das áreas de uso do Codex mais subestimadas
  • Dá suporte à geração de diagramas de sistema e à atualização automática de documentação durante a implementação de funcionalidades
  • Foi mostrada uma demo em que, integrado ao Linear MCP, o Codex documenta automaticamente em um board do Linear as alterações de um ticket específico, os resultados de testes de regressão e os itens validados

Etapa de deploy e manutenção (Deploy & Maintenance)

  • No app do Codex, é possível fazer Commit, Push e criação de PR diretamente com cliques de botão (baseado em Git)
  • Ao colar um stack trace, o Codex raciocina sobre toda a codebase para identificar a causa do problema
  • Triage Page skill: ao informar um ID de incidente, ela coleta detalhes, confirma o incidente, verifica métricas e logs e faz o processamento até o patch, em um fluxo único
    • Isso muda a resposta a pager duty de uma análise manual de logs para delegação ao agente
  • PR Babysitter skill: monitora continuamente o andamento do pipeline de CI/CD de um PR e, se houver problemas, corrige automaticamente até concluir o merge final
    • Já está em uso real no grande ambiente de monorepo da OpenAI
    • Pode ser baixada em um repositório open source de skills

Automations — execução automática baseada em agenda

  • Depois de se acostumar com o uso de skills, é possível configurar a execução automática de tarefas em horários específicos com o recurso Automations
  • Automação da Sentry skill: toda quinta-feira (ou todos os dias), encontra issues em um repositório específico e sugere correções ou corrige automaticamente
  • Automação “What is everyone up to?”: todos os dias às 9h, gera um resumo do que os membros da equipe estão fazendo no repositório
  • Mesmo sem digitar prompts manualmente, o Codex continua trabalhando em segundo plano

Como os agentes do Codex funcionam

  • Os agentes do Codex funcionam em loop: o usuário fornece um objetivo claro e direção inicial → o agente repete raciocínio, chamada de ferramentas, leitura de arquivos, busca no repositório, escrita de código e execução de comandos
  • O resultado de cada ferramenta é realimentado na chamada seguinte do modelo, permitindo construção gradual de entendimento e progresso
  • O contexto é a variável mais importante para o desempenho do agente: é essencial orientar na direção certa com a quantidade adequada de entrada
  • Sandbox em nível de sistema operacional: em vez de restrições leves em nível de harness, o acesso à rede e aos arquivos é controlado no nível do sistema operacional
    • O design leva em conta a possibilidade de que modelos mais avançados consigam contornar proteções leves
    • Há suporte a sandbox em todos os sistemas (Mac, Windows), e no Windows foi implementado um sandbox nativo do Windows mais seguro que WSL
  • O arquivo TOML de configuração permite ajustar em detalhe o approval mode (momento da aprovação) e o sandbox mode (escopo de acesso)
    • O padrão é “on request”: roda normalmente e pausa quando precisa de elevação de permissão

Compaction — gerenciamento de threads longas

  • Quando a conversa se aproxima do limite de contexto do modelo, o Codex faz compaction para comprimir as partes iniciais
  • A compaction é feita no lado do servidor, com base na cadeia de pensamento bruta, preservando melhor o conteúdo real do trabalho do que uma abordagem client-side
  • Caso real: durante 25 horas de trabalho contínuo, foram realizadas 13 a 14 compactions com manutenção bem-sucedida do contexto

Boas práticas de prompting para delegação eficaz

  • Em um prompt mínimo, inclua um objetivo claro, restrições e o critério do que significa “concluído”
  • Incorpore condições de validação ao prompt: critérios de sucesso e comandos de teste/build que devem ser executados
  • Use prompts abertos: pergunte ao Codex sobre ideias de melhoria de desempenho, áreas com cobertura de testes insuficiente etc., usando-o como parceiro de raciocínio

agents.md — arquivo de instruções de comportamento do agente

  • É um formato aberto, semelhante às Rules do Cursor e às configurações do Windsurf, não exclusivo da OpenAI
  • É carregado automaticamente em todas as sessões do Codex, ajudando a produzir resultados consistentes
  • Sistema de prioridade em 3 níveis:
    • Global (~/.codex/agents.md): preferências pessoais padrão (independentes da equipe)
    • Raiz do repositório (agents.md): convenções de todo o repositório
    • Subdiretório (agents.md): instruções detalhadas por microsserviço/subpasta
    • O Codex concatena os arquivos agents.md ao longo do caminho da raiz do projeto até o diretório atual, dando prioridade aos mais específicos
  • Itens recomendados: visão geral do repositório, comandos de execução, expectativas de teste, localização dos módulos principais, diretrizes de commit/PR
  • O comando /init (CLI) pode gerar automaticamente o primeiro agents.md, resolvendo o problema de cold start
  • Recomenda-se manter o arquivo conciso, com menos de 100 linhas (segundo o padrão do agents.md de monorepo interno da OpenAI)
  • Se o conteúdo crescer, a recomendação é separar em arquivos Markdown por tarefa (planning.md, code-review.md, architecture.md etc.) e referenciá-los em agents.md
  • Foi apresentado um padrão de automação em que o Codex analisa os logs locais da sessão (com caminho de armazenamento fornecido) e propõe automaticamente melhorias semanais para o agents.md
  • Outra forma de uso é pedir ao Codex uma retrospectiva da conversa para refletir automaticamente observações e gotchas no agents.md

Encerramento — 3 ações principais para adotar o Codex

  • Criar um agents.md e configurar ajustes personalizados
  • Atribuir tarefas reais de trabalho ao Codex e conectá-lo às ferramentas (MCP) usadas no dia a dia
  • Rodar o Codex não só na etapa de build, mas em todo o loop de desenvolvimento, do design ao deploy e à manutenção, de forma contínua

3 comentários

 
xguru 2026-03-19

A OpenAI Academy já está no ar há quase um ano, então já acumulou bastante conteúdo de qualidade.
(Mas é uma pena que só tenha legendas em inglês geradas automaticamente)

 
mindok 2026-03-20

Uma pena, eu gostaria que tivesse legendas em coreano..

 
j2sus91 2026-03-19

Alguém já ouviu isso?
Vale a pena a ponto de investir 1 hora?

Na era da IA de dar um clique, o tempo é precioso, rs