- Vídeo de webinar (58 min) do curso sobre Codex para desenvolvedores, apresentado pela própria OpenAI
- Codex é uma plataforma de agentes de programação projetada para ir além da conclusão de código e do pair programming, permitindo que engenheiros deleguem tarefas de grande porte a agentes
- O app do Codex, a CLI, extensões de IDE e outras interfaces diversas compartilham o mesmo backend, com capacidade de executar várias tarefas em paralelo
- Cobre todo o ciclo de vida de desenvolvimento de software (SDLC), de planejamento (Plan), design (Design), build (Build), testes (Test), revisão (Review) e documentação (Document) até deploy e manutenção (Deploy & Maintenance)
- Com o arquivo agents.md, é possível definir instruções de comportamento do agente por repositório, e empacotar workflows repetitivos com Skills e Automations para execução automática
- Suporta trabalho contínuo por 25 horas e manutenção de contexto de longa duração por meio de 13 a 14 compactions no lado do servidor, com segurança garantida por sandbox em nível de sistema operacional
A evolução da programação com IA: da conclusão de código à delegação para agentes
- Nos últimos anos, a programação com IA evoluiu de conclusão de código (cerca de 10% de ganho na velocidade de digitação) para pair programming (planejamento entre arquivos, execução de testes, alterações no repositório)
- As duas abordagens tinham foco em criar “um colaborador melhor”, mas a Codex começou a ser desenvolvida há um ano com o objetivo de construir agentes aos quais fosse possível delegar
- Em dezembro de 2025, o modelo GT 5.2 Codex superou a principal barreira para a “verdadeira delegação a agentes” ao alcançar trabalho contínuo de longa duração e alta steerability
- Depois vieram o GT 5.3, mais rápido e eficiente, e o mais recente GT 5.4, com melhorias contínuas de desempenho
- Os avanços centrais foram navegar com estabilidade em grandes codebases corporativas e manter alinhamento por longos períodos de acordo com a intenção do usuário
Interfaces disponíveis para usar o Codex
- O Codex permite usar um mesmo agente em várias superfícies, como CLI, extensão de IDE e app do Codex, todas compartilhando o mesmo backend
- O app do Codex é a interface mais visual para execução paralela de tarefas, otimizada para rodar vários agentes ao mesmo tempo e revisar suas saídas
- Caso de Peter Steinberger (criador do OpenClaw): ele trocou um fluxo antigo com mais de 10 janelas de CLI pelo app do Codex, melhorando a eficiência no gerenciamento de agentes em paralelo
- Há suporte para macOS e Windows, com download disponível em openai.com/codex; no Windows, também pela Microsoft Store
- Na CLI, o login inicial é feito com o comando
codex login, e a sessão começa com codex
UI e configurações do app do Codex
- É possível escolher o modelo (como GPT 5.4) e ajustar o nível de esforço de raciocínio (reasoning effort): low, medium, high, extra high
medium é o padrão e oferece o melhor equilíbrio entre velocidade e profundidade de raciocínio
- Para perguntas simples,
low; para raciocínio profundo por longos períodos, high ou extra high
- O modo Speed (fast/standard) permite ajustar a velocidade de resposta
- Além do trabalho local, há opções de modo Git worktree e inicialização de contêiner em nuvem remoto
- Configuração de permissões: é possível escolher entre permissões padrão (ler/editar arquivos do projeto e pedir aprovação para comandos perigosos) ou acesso total (todos os arquivos do computador, acesso à rede e execução sem aprovação)
- Para novos usuários, as permissões padrão são recomendadas
- É possível adicionar e alternar projetos (pastas) pela barra lateral esquerda
Uso do Codex em todas as etapas do SDLC
- A OpenAI publicou o guia “Building an AI Native Engineering Team”, que organiza como agentes de programação aceleram as 7 etapas do SDLC (planejamento, design, build, testes, revisão, documentação e deploy/manutenção)
- Em especial, as etapas de testes e revisão se tornam ainda mais importantes à medida que a capacidade de gerar código melhora
- O Codex vem sendo especialmente bem avaliado por seu raciocínio em codebases complexas e por escrever código em nível de produção
Etapa de planejamento (Plan)
- Ao ativar o modo Plan (
/plan ou Shift+Tab), o Codex elabora primeiro um plano antes da implementação
- Na demo, ao ser solicitado um plano para um app companion de iOS em SwiftUI, o Codex explorou a codebase e então apresentou perguntas de acompanhamento (método de autenticação, escopo do primeiro release etc.)
- O agente pode ser ajustado aceitando opções sugeridas ou digitando instruções diretamente
- As premissas do plano são explicitadas para que o usuário possa verificar e corrigir
Etapa de design (Design) — integração com MCP
- Por meio do MCP (Model Context Protocol), é possível conectar diretamente ao Codex o contexto de ferramentas externas como Figma e Linear
- Há suporte em todas as interfaces: CLI, extensão de IDE e app do Codex
- Com a integração Figma MCP, ao colar um link de design, o Codex traz o contexto do design e o converte em código
- Se o MCP não estiver configurado, o Codex exibe automaticamente instruções de instalação
- A integração com o app do ChatGPT também pode ser usada diretamente no Codex por meio de conectores criados por terceiros
- Isso permite que engenheiros foquem na lógica principal, enquanto designers ganham mais tempo para explorar conceitos de design
Etapa de build (Build)
- É a etapa do SDLC em que o impacto dos agentes de programação é maior
- Na demo, foram executadas em paralelo tarefas como correção de ineficiência de consulta N+1 com testes de regressão adicionais, auditoria de autenticação ausente em rotas de API e migração de NextAuth v4 para Auth.js v5
- Resultado da geração de código com base em design do Figma: alteração em 10 arquivos, 320 linhas de código escritas, sem necessidade de ajustar CSS manualmente
- O recurso Worktree cria automaticamente cópias do projeto local para evitar conflitos entre tarefas paralelas, sem precisar duplicar o repositório manualmente
- O Codex executa automaticamente comandos de validação, build e lint definidos em
agents.md, como npx tsc e npm test, para verificar conformidade com as convenções da equipe
- O build em si já não é mais o gargalo; em ambientes corporativos, o essencial é validar se o código segue as normas do time
- O terminal pode ser aberto diretamente dentro do app com Command+J
- Mesmo para apps iOS, é possível executar
xcode build no app do Codex sem abrir o Xcode diretamente
Comandos com barra (Slash Commands)
- CLI, extensão de IDE e app do Codex oferecem suporte a comandos com barra: modo plan, menção a arquivos, verificação do estado da sessão, mudança de permissões etc.
- O comando
/experimental permite ativar recursos experimentais
- Inclui criação de multi-agentes (sub-agents)
- A CLI costuma receber novos recursos um pouco antes das outras interfaces
- Como todas as interfaces compartilham o mesmo backend, qualquer configuração ativada em uma delas é refletida em todas
Etapa de revisão (Review)
- O comando
/review executa revisão de código com base na branch base ou nas alterações locais ainda não commitadas
- Os agentes do Codex são treinados especificamente para identificar bugs de nível P0/P1, entregando feedback de alto sinal com pouco ruído
- Isso permite descobrir problemas localmente mais cedo, antes de o PR chegar ao pipeline de CI/CD
- Integração nativa com GitHub Cloud: o Codex faz revisão automática de código em PRs de forma proativa ou reativa
- Foi apresentado um caso em que capturou um problema P1 em regra de regex que humanos poderiam deixar passar
- Outros SCMs, como GitLab e Bitbucket, podem ser integrados diretamente por meio do Codex SDK
- Se comentários de revisão forem adicionados diretamente no painel de diff, eles passam a ser incorporados automaticamente ao contexto da conversa seguinte
Skills — empacotando workflows reutilizáveis
- Skill é um padrão aberto para empacotar instruções de workflow reutilizáveis que o Codex pode executar
- Estruturalmente, é uma pasta, e o arquivo obrigatório é o skill.md (metadados + instruções para o agente)
- Opcionalmente, podem ser adicionados scripts de execução, documentação e templates
- Também é possível embutir MCP dentro de uma skill para integração com ferramentas externas
- Exemplos da demo: tratamento de comentários de PR, correção automática de falhas de build no BuildKite e detecção de código morto
- Skill Creator (skill de sistema): ao pedir algo como “create a skill to find dead code paths” durante a conversa, ele gera automaticamente o esqueleto de
skill.md
- Skill Installer (skill de sistema): instala imediatamente a skill criada no diretório local de skills do Codex
- Se um workflow recorrente surgir após uma conversa longa, transformá-lo em skill permite executar todo o fluxo com uma única chamada na próxima vez
- Exemplo de GitHub Issue Plan PR skill: com um único prompt, executa triagem de issue no GitHub → planejamento → edição → documentação → criação de PR em rascunho, cobrindo de uma vez as etapas do SDLC
Etapa de documentação (Documentation)
- É uma das áreas de uso do Codex mais subestimadas
- Dá suporte à geração de diagramas de sistema e à atualização automática de documentação durante a implementação de funcionalidades
- Foi mostrada uma demo em que, integrado ao Linear MCP, o Codex documenta automaticamente em um board do Linear as alterações de um ticket específico, os resultados de testes de regressão e os itens validados
Etapa de deploy e manutenção (Deploy & Maintenance)
- No app do Codex, é possível fazer Commit, Push e criação de PR diretamente com cliques de botão (baseado em Git)
- Ao colar um stack trace, o Codex raciocina sobre toda a codebase para identificar a causa do problema
- Triage Page skill: ao informar um ID de incidente, ela coleta detalhes, confirma o incidente, verifica métricas e logs e faz o processamento até o patch, em um fluxo único
- Isso muda a resposta a pager duty de uma análise manual de logs para delegação ao agente
- PR Babysitter skill: monitora continuamente o andamento do pipeline de CI/CD de um PR e, se houver problemas, corrige automaticamente até concluir o merge final
- Já está em uso real no grande ambiente de monorepo da OpenAI
- Pode ser baixada em um repositório open source de skills
Automations — execução automática baseada em agenda
- Depois de se acostumar com o uso de skills, é possível configurar a execução automática de tarefas em horários específicos com o recurso Automations
- Automação da Sentry skill: toda quinta-feira (ou todos os dias), encontra issues em um repositório específico e sugere correções ou corrige automaticamente
- Automação “What is everyone up to?”: todos os dias às 9h, gera um resumo do que os membros da equipe estão fazendo no repositório
- Mesmo sem digitar prompts manualmente, o Codex continua trabalhando em segundo plano
Como os agentes do Codex funcionam
- Os agentes do Codex funcionam em loop: o usuário fornece um objetivo claro e direção inicial → o agente repete raciocínio, chamada de ferramentas, leitura de arquivos, busca no repositório, escrita de código e execução de comandos
- O resultado de cada ferramenta é realimentado na chamada seguinte do modelo, permitindo construção gradual de entendimento e progresso
- O contexto é a variável mais importante para o desempenho do agente: é essencial orientar na direção certa com a quantidade adequada de entrada
- Sandbox em nível de sistema operacional: em vez de restrições leves em nível de harness, o acesso à rede e aos arquivos é controlado no nível do sistema operacional
- O design leva em conta a possibilidade de que modelos mais avançados consigam contornar proteções leves
- Há suporte a sandbox em todos os sistemas (Mac, Windows), e no Windows foi implementado um sandbox nativo do Windows mais seguro que WSL
- O arquivo TOML de configuração permite ajustar em detalhe o approval mode (momento da aprovação) e o sandbox mode (escopo de acesso)
- O padrão é “on request”: roda normalmente e pausa quando precisa de elevação de permissão
Compaction — gerenciamento de threads longas
- Quando a conversa se aproxima do limite de contexto do modelo, o Codex faz compaction para comprimir as partes iniciais
- A compaction é feita no lado do servidor, com base na cadeia de pensamento bruta, preservando melhor o conteúdo real do trabalho do que uma abordagem client-side
- Caso real: durante 25 horas de trabalho contínuo, foram realizadas 13 a 14 compactions com manutenção bem-sucedida do contexto
Boas práticas de prompting para delegação eficaz
- Em um prompt mínimo, inclua um objetivo claro, restrições e o critério do que significa “concluído”
- Incorpore condições de validação ao prompt: critérios de sucesso e comandos de teste/build que devem ser executados
- Use prompts abertos: pergunte ao Codex sobre ideias de melhoria de desempenho, áreas com cobertura de testes insuficiente etc., usando-o como parceiro de raciocínio
agents.md — arquivo de instruções de comportamento do agente
- É um formato aberto, semelhante às Rules do Cursor e às configurações do Windsurf, não exclusivo da OpenAI
- É carregado automaticamente em todas as sessões do Codex, ajudando a produzir resultados consistentes
- Sistema de prioridade em 3 níveis:
- Global (
~/.codex/agents.md): preferências pessoais padrão (independentes da equipe)
- Raiz do repositório (
agents.md): convenções de todo o repositório
- Subdiretório (
agents.md): instruções detalhadas por microsserviço/subpasta
- O Codex concatena os arquivos
agents.md ao longo do caminho da raiz do projeto até o diretório atual, dando prioridade aos mais específicos
- Itens recomendados: visão geral do repositório, comandos de execução, expectativas de teste, localização dos módulos principais, diretrizes de commit/PR
- O comando
/init (CLI) pode gerar automaticamente o primeiro agents.md, resolvendo o problema de cold start
- Recomenda-se manter o arquivo conciso, com menos de 100 linhas (segundo o padrão do
agents.md de monorepo interno da OpenAI)
- Se o conteúdo crescer, a recomendação é separar em arquivos Markdown por tarefa (
planning.md, code-review.md, architecture.md etc.) e referenciá-los em agents.md
- Foi apresentado um padrão de automação em que o Codex analisa os logs locais da sessão (com caminho de armazenamento fornecido) e propõe automaticamente melhorias semanais para o
agents.md
- Outra forma de uso é pedir ao Codex uma retrospectiva da conversa para refletir automaticamente observações e gotchas no
agents.md
Encerramento — 3 ações principais para adotar o Codex
- Criar um
agents.md e configurar ajustes personalizados
- Atribuir tarefas reais de trabalho ao Codex e conectá-lo às ferramentas (MCP) usadas no dia a dia
- Rodar o Codex não só na etapa de build, mas em todo o loop de desenvolvimento, do design ao deploy e à manutenção, de forma contínua
3 comentários
A OpenAI Academy já está no ar há quase um ano, então já acumulou bastante conteúdo de qualidade.
(Mas é uma pena que só tenha legendas em inglês geradas automaticamente)
Uma pena, eu gostaria que tivesse legendas em coreano..
Alguém já ouviu isso?
Vale a pena a ponto de investir 1 hora?
Na era da IA de dar um clique, o tempo é precioso, rs