Codex para engenheiros de software

(academy.openai.com)

69 pontos por GN⁺ 2026-03-19 | 3 comentários | Compartilhar no WhatsApp

Vídeo de webinar (58 min) do curso sobre Codex para desenvolvedores, apresentado pela própria OpenAI
Codex é uma plataforma de agentes de programação projetada para ir além da conclusão de código e do pair programming, permitindo que engenheiros deleguem tarefas de grande porte a agentes
O app do Codex, a CLI, extensões de IDE e outras interfaces diversas compartilham o mesmo backend, com capacidade de executar várias tarefas em paralelo
Cobre todo o ciclo de vida de desenvolvimento de software (SDLC), de planejamento (Plan), design (Design), build (Build), testes (Test), revisão (Review) e documentação (Document) até deploy e manutenção (Deploy & Maintenance)
Com o arquivo agents.md, é possível definir instruções de comportamento do agente por repositório, e empacotar workflows repetitivos com Skills e Automations para execução automática
Suporta trabalho contínuo por 25 horas e manutenção de contexto de longa duração por meio de 13 a 14 compactions no lado do servidor, com segurança garantida por sandbox em nível de sistema operacional

A evolução da programação com IA: da conclusão de código à delegação para agentes

Nos últimos anos, a programação com IA evoluiu de conclusão de código (cerca de 10% de ganho na velocidade de digitação) para pair programming (planejamento entre arquivos, execução de testes, alterações no repositório)
As duas abordagens tinham foco em criar “um colaborador melhor”, mas a Codex começou a ser desenvolvida há um ano com o objetivo de construir agentes aos quais fosse possível delegar
Em dezembro de 2025, o modelo GT 5.2 Codex superou a principal barreira para a “verdadeira delegação a agentes” ao alcançar trabalho contínuo de longa duração e alta steerability
Depois vieram o GT 5.3, mais rápido e eficiente, e o mais recente GT 5.4, com melhorias contínuas de desempenho
Os avanços centrais foram navegar com estabilidade em grandes codebases corporativas e manter alinhamento por longos períodos de acordo com a intenção do usuário

Interfaces disponíveis para usar o Codex

O Codex permite usar um mesmo agente em várias superfícies, como CLI, extensão de IDE e app do Codex, todas compartilhando o mesmo backend
O app do Codex é a interface mais visual para execução paralela de tarefas, otimizada para rodar vários agentes ao mesmo tempo e revisar suas saídas
Caso de Peter Steinberger (criador do OpenClaw): ele trocou um fluxo antigo com mais de 10 janelas de CLI pelo app do Codex, melhorando a eficiência no gerenciamento de agentes em paralelo
Há suporte para macOS e Windows, com download disponível em openai.com/codex; no Windows, também pela Microsoft Store
Na CLI, o login inicial é feito com o comando codex login, e a sessão começa com codex

UI e configurações do app do Codex

É possível escolher o modelo (como GPT 5.4) e ajustar o nível de esforço de raciocínio (reasoning effort): low, medium, high, extra high
- medium é o padrão e oferece o melhor equilíbrio entre velocidade e profundidade de raciocínio
- Para perguntas simples, low; para raciocínio profundo por longos períodos, high ou extra high
O modo Speed (fast/standard) permite ajustar a velocidade de resposta
Além do trabalho local, há opções de modo Git worktree e inicialização de contêiner em nuvem remoto
Configuração de permissões: é possível escolher entre permissões padrão (ler/editar arquivos do projeto e pedir aprovação para comandos perigosos) ou acesso total (todos os arquivos do computador, acesso à rede e execução sem aprovação)
- Para novos usuários, as permissões padrão são recomendadas
É possível adicionar e alternar projetos (pastas) pela barra lateral esquerda

Uso do Codex em todas as etapas do SDLC

A OpenAI publicou o guia “Building an AI Native Engineering Team”, que organiza como agentes de programação aceleram as 7 etapas do SDLC (planejamento, design, build, testes, revisão, documentação e deploy/manutenção)
Em especial, as etapas de testes e revisão se tornam ainda mais importantes à medida que a capacidade de gerar código melhora
O Codex vem sendo especialmente bem avaliado por seu raciocínio em codebases complexas e por escrever código em nível de produção

Etapa de planejamento (Plan)

Ao ativar o modo Plan (/plan ou Shift+Tab), o Codex elabora primeiro um plano antes da implementação
Na demo, ao ser solicitado um plano para um app companion de iOS em SwiftUI, o Codex explorou a codebase e então apresentou perguntas de acompanhamento (método de autenticação, escopo do primeiro release etc.)
O agente pode ser ajustado aceitando opções sugeridas ou digitando instruções diretamente
As premissas do plano são explicitadas para que o usuário possa verificar e corrigir

Etapa de design (Design) — integração com MCP

Por meio do MCP (Model Context Protocol), é possível conectar diretamente ao Codex o contexto de ferramentas externas como Figma e Linear
- Há suporte em todas as interfaces: CLI, extensão de IDE e app do Codex
Com a integração Figma MCP, ao colar um link de design, o Codex traz o contexto do design e o converte em código
- Se o MCP não estiver configurado, o Codex exibe automaticamente instruções de instalação
A integração com o app do ChatGPT também pode ser usada diretamente no Codex por meio de conectores criados por terceiros
Isso permite que engenheiros foquem na lógica principal, enquanto designers ganham mais tempo para explorar conceitos de design

Etapa de build (Build)

É a etapa do SDLC em que o impacto dos agentes de programação é maior
Na demo, foram executadas em paralelo tarefas como correção de ineficiência de consulta N+1 com testes de regressão adicionais, auditoria de autenticação ausente em rotas de API e migração de NextAuth v4 para Auth.js v5
Resultado da geração de código com base em design do Figma: alteração em 10 arquivos, 320 linhas de código escritas, sem necessidade de ajustar CSS manualmente
O recurso Worktree cria automaticamente cópias do projeto local para evitar conflitos entre tarefas paralelas, sem precisar duplicar o repositório manualmente
O Codex executa automaticamente comandos de validação, build e lint definidos em agents.md, como npx tsc e npm test, para verificar conformidade com as convenções da equipe
O build em si já não é mais o gargalo; em ambientes corporativos, o essencial é validar se o código segue as normas do time
O terminal pode ser aberto diretamente dentro do app com Command+J
Mesmo para apps iOS, é possível executar xcode build no app do Codex sem abrir o Xcode diretamente

Comandos com barra (Slash Commands)

CLI, extensão de IDE e app do Codex oferecem suporte a comandos com barra: modo plan, menção a arquivos, verificação do estado da sessão, mudança de permissões etc.
O comando /experimental permite ativar recursos experimentais
- Inclui criação de multi-agentes (sub-agents)
- A CLI costuma receber novos recursos um pouco antes das outras interfaces
Como todas as interfaces compartilham o mesmo backend, qualquer configuração ativada em uma delas é refletida em todas

Etapa de revisão (Review)

O comando /review executa revisão de código com base na branch base ou nas alterações locais ainda não commitadas
Os agentes do Codex são treinados especificamente para identificar bugs de nível P0/P1, entregando feedback de alto sinal com pouco ruído
Isso permite descobrir problemas localmente mais cedo, antes de o PR chegar ao pipeline de CI/CD
Integração nativa com GitHub Cloud: o Codex faz revisão automática de código em PRs de forma proativa ou reativa
- Foi apresentado um caso em que capturou um problema P1 em regra de regex que humanos poderiam deixar passar
Outros SCMs, como GitLab e Bitbucket, podem ser integrados diretamente por meio do Codex SDK
Se comentários de revisão forem adicionados diretamente no painel de diff, eles passam a ser incorporados automaticamente ao contexto da conversa seguinte

Skills — empacotando workflows reutilizáveis

Skill é um padrão aberto para empacotar instruções de workflow reutilizáveis que o Codex pode executar
- Estruturalmente, é uma pasta, e o arquivo obrigatório é o skill.md (metadados + instruções para o agente)
- Opcionalmente, podem ser adicionados scripts de execução, documentação e templates
Também é possível embutir MCP dentro de uma skill para integração com ferramentas externas
Exemplos da demo: tratamento de comentários de PR, correção automática de falhas de build no BuildKite e detecção de código morto
Skill Creator (skill de sistema): ao pedir algo como “create a skill to find dead code paths” durante a conversa, ele gera automaticamente o esqueleto de skill.md
Skill Installer (skill de sistema): instala imediatamente a skill criada no diretório local de skills do Codex
Se um workflow recorrente surgir após uma conversa longa, transformá-lo em skill permite executar todo o fluxo com uma única chamada na próxima vez
Exemplo de GitHub Issue Plan PR skill: com um único prompt, executa triagem de issue no GitHub → planejamento → edição → documentação → criação de PR em rascunho, cobrindo de uma vez as etapas do SDLC

Etapa de documentação (Documentation)

É uma das áreas de uso do Codex mais subestimadas
Dá suporte à geração de diagramas de sistema e à atualização automática de documentação durante a implementação de funcionalidades
Foi mostrada uma demo em que, integrado ao Linear MCP, o Codex documenta automaticamente em um board do Linear as alterações de um ticket específico, os resultados de testes de regressão e os itens validados

Etapa de deploy e manutenção (Deploy & Maintenance)

No app do Codex, é possível fazer Commit, Push e criação de PR diretamente com cliques de botão (baseado em Git)
Ao colar um stack trace, o Codex raciocina sobre toda a codebase para identificar a causa do problema
Triage Page skill: ao informar um ID de incidente, ela coleta detalhes, confirma o incidente, verifica métricas e logs e faz o processamento até o patch, em um fluxo único
- Isso muda a resposta a pager duty de uma análise manual de logs para delegação ao agente
PR Babysitter skill: monitora continuamente o andamento do pipeline de CI/CD de um PR e, se houver problemas, corrige automaticamente até concluir o merge final
- Já está em uso real no grande ambiente de monorepo da OpenAI
- Pode ser baixada em um repositório open source de skills

Automations — execução automática baseada em agenda

Depois de se acostumar com o uso de skills, é possível configurar a execução automática de tarefas em horários específicos com o recurso Automations
Automação da Sentry skill: toda quinta-feira (ou todos os dias), encontra issues em um repositório específico e sugere correções ou corrige automaticamente
Automação “What is everyone up to?”: todos os dias às 9h, gera um resumo do que os membros da equipe estão fazendo no repositório
Mesmo sem digitar prompts manualmente, o Codex continua trabalhando em segundo plano

Como os agentes do Codex funcionam

Os agentes do Codex funcionam em loop: o usuário fornece um objetivo claro e direção inicial → o agente repete raciocínio, chamada de ferramentas, leitura de arquivos, busca no repositório, escrita de código e execução de comandos
O resultado de cada ferramenta é realimentado na chamada seguinte do modelo, permitindo construção gradual de entendimento e progresso
O contexto é a variável mais importante para o desempenho do agente: é essencial orientar na direção certa com a quantidade adequada de entrada
Sandbox em nível de sistema operacional: em vez de restrições leves em nível de harness, o acesso à rede e aos arquivos é controlado no nível do sistema operacional
- O design leva em conta a possibilidade de que modelos mais avançados consigam contornar proteções leves
- Há suporte a sandbox em todos os sistemas (Mac, Windows), e no Windows foi implementado um sandbox nativo do Windows mais seguro que WSL
O arquivo TOML de configuração permite ajustar em detalhe o approval mode (momento da aprovação) e o sandbox mode (escopo de acesso)
- O padrão é “on request”: roda normalmente e pausa quando precisa de elevação de permissão

Compaction — gerenciamento de threads longas

Quando a conversa se aproxima do limite de contexto do modelo, o Codex faz compaction para comprimir as partes iniciais
A compaction é feita no lado do servidor, com base na cadeia de pensamento bruta, preservando melhor o conteúdo real do trabalho do que uma abordagem client-side
Caso real: durante 25 horas de trabalho contínuo, foram realizadas 13 a 14 compactions com manutenção bem-sucedida do contexto

Boas práticas de prompting para delegação eficaz

Em um prompt mínimo, inclua um objetivo claro, restrições e o critério do que significa “concluído”
Incorpore condições de validação ao prompt: critérios de sucesso e comandos de teste/build que devem ser executados
Use prompts abertos: pergunte ao Codex sobre ideias de melhoria de desempenho, áreas com cobertura de testes insuficiente etc., usando-o como parceiro de raciocínio

agents.md — arquivo de instruções de comportamento do agente

É um formato aberto, semelhante às Rules do Cursor e às configurações do Windsurf, não exclusivo da OpenAI
É carregado automaticamente em todas as sessões do Codex, ajudando a produzir resultados consistentes
Sistema de prioridade em 3 níveis:
- Global (~/.codex/agents.md): preferências pessoais padrão (independentes da equipe)
- Raiz do repositório (agents.md): convenções de todo o repositório
- Subdiretório (agents.md): instruções detalhadas por microsserviço/subpasta
- O Codex concatena os arquivos agents.md ao longo do caminho da raiz do projeto até o diretório atual, dando prioridade aos mais específicos
Itens recomendados: visão geral do repositório, comandos de execução, expectativas de teste, localização dos módulos principais, diretrizes de commit/PR
O comando /init (CLI) pode gerar automaticamente o primeiro agents.md, resolvendo o problema de cold start
Recomenda-se manter o arquivo conciso, com menos de 100 linhas (segundo o padrão do agents.md de monorepo interno da OpenAI)
Se o conteúdo crescer, a recomendação é separar em arquivos Markdown por tarefa (planning.md, code-review.md, architecture.md etc.) e referenciá-los em agents.md
Foi apresentado um padrão de automação em que o Codex analisa os logs locais da sessão (com caminho de armazenamento fornecido) e propõe automaticamente melhorias semanais para o agents.md
Outra forma de uso é pedir ao Codex uma retrospectiva da conversa para refletir automaticamente observações e gotchas no agents.md

Encerramento — 3 ações principais para adotar o Codex

Criar um agents.md e configurar ajustes personalizados
Atribuir tarefas reais de trabalho ao Codex e conectá-lo às ferramentas (MCP) usadas no dia a dia
Rodar o Codex não só na etapa de build, mas em todo o loop de desenvolvimento, do design ao deploy e à manutenção, de forma contínua

3 comentários

xguru 2026-03-19

A OpenAI Academy já está no ar há quase um ano, então já acumulou bastante conteúdo de qualidade.
(Mas é uma pena que só tenha legendas em inglês geradas automaticamente)

mindok 2026-03-20

Uma pena, eu gostaria que tivesse legendas em coreano..

j2sus91 2026-03-19

Alguém já ouviu isso?
Vale a pena a ponto de investir 1 hora?

Na era da IA de dar um clique, o tempo é precioso, rs