- Ambiente de desenvolvimento integrado com IA que permite gerenciar vários agentes de IA ao mesmo tempo e oferece suporte a trabalho em paralelo e colaboração de longo prazo
- Cada agente roda em uma thread independente, permitindo multitarefa por projeto, além de revisão de código, comentários em diff e edições manuais
- Com o recurso Skills, vai além da escrita de código e se expande para coleta de informações, resolução de problemas, geração de imagens, criação de documentos, implantação em nuvem e outras tarefas
- Com o recurso Automations, é possível executar tarefas repetitivas automaticamente em segundo plano de acordo com uma agenda definida
- A segurança em sandbox é aplicada por padrão, e comandos que exigem privilégios elevados, como acesso à rede, precisam de aprovação do usuário
- O Codex também será disponibilizado temporariamente para usuários do ChatGPT Free e Go, e os planos pagos terão limite de uso 2x maior
Visão geral do app Codex: um centro de comando para agentes
- Desde o lançamento do Codex em abril de 2025, a forma como os desenvolvedores usam agentes mudou de forma fundamental
- Os modelos passaram a conseguir executar tarefas complexas e de longo prazo do início ao fim
- Agora, os desenvolvedores coordenam vários agentes ao longo de projetos inteiros, delegando trabalho e executando-o em paralelo
- O desafio central mudou de "o que os agentes conseguem fazer" para "como as pessoas podem comandar, supervisionar e colaborar com agentes em larga escala"
- IDEs tradicionais e ferramentas baseadas em terminal não foram projetadas para esse modo de trabalho, tornando necessária uma nova ferramenta
- O app Codex para macOS permite gerenciar vários agentes de IA simultaneamente e executar tarefas em paralelo
- Ele oferece suporte a tarefas de longa duração e, por meio da colaboração entre agentes, gerencia todo o processo de design, desenvolvimento, implantação e manutenção de software
Trabalho paralelo com múltiplos agentes
- O app Codex oferece um espaço focado para multitarefa com agentes
- Os agentes rodam em threads separadas organizadas por projeto, permitindo alternar entre tarefas sem perder contexto
- Dentro das threads, é possível revisar as alterações feitas pelos agentes, comentar no diff ou editar diretamente no editor
- Com suporte nativo a worktrees, vários agentes podem trabalhar no mesmo repositório sem conflitos
- Cada agente trabalha em uma cópia isolada do código, podendo explorar diferentes caminhos sem afetar o estado local do git
- Durante o trabalho do agente, é possível fazer checkout das mudanças localmente ou continuar sem alterar o estado local do git
- O histórico de sessões e as configurações do Codex CLI e da extensão de IDE são importados automaticamente, permitindo uso imediato em projetos existentes
Skills: expansão além da geração de código
- O Codex está evoluindo de um agente que escreve código para um agente que usa código para executar tarefas no computador
- Com Skills, ele pode se expandir para tarefas além da geração de código, como coleta e síntese de informações, resolução de problemas e escrita
- Instruções, recursos e scripts podem ser agrupados em bundles para que o Codex se conecte a ferramentas e execute workflows
- As tarefas podem ser concluídas de forma confiável de acordo com as preferências da equipe
- O app Codex inclui uma interface dedicada para criar e gerenciar Skills
- É possível solicitar explicitamente o uso de uma Skill específica ou configurar o uso automático conforme a tarefa
-
Exemplo de uso de Skills: criação de jogo de corrida
- Foi solicitado ao Codex que criasse um jogo de corrida com vários pilotos, 8 mapas e itens utilizáveis com a barra de espaço
- Foram usadas uma Skill de geração de imagens (baseada em GPT Image) e uma Skill de desenvolvimento de jogos web
- Com um único prompt inicial, trabalhou de forma independente com mais de 7 milhões de tokens até concluir o jogo
- Atuou como designer, desenvolvedor de jogos e testador de QA, chegando a jogar o game para validá-lo
- Nome do jogo: Voxel Velocity, um kart racer voxel 3D feito com Three.js
- Modo corrida solo (sempre 3 voltas, 1 humano vs 7 CPUs, 8 pistas disponíveis imediatamente)
- Modelo de direção arcade, sistema de carga de drift, níveis de boost (Tier 1 0,7 s, Tier 2 1,1 s, Tier 3 1,5 s)
- 8 personagens, 8 itens, presets de dificuldade da CPU, implementação de spline para IA
-
Principais Skills oferecidas
- Implement designs: importa contexto de design, assets e screenshots do Figma e os converte em código de UI de produção com fidelidade visual 1:1
- Manage projects: classifica bugs, acompanha releases e gerencia a carga de trabalho da equipe no Linear
- Deploy to the cloud: implanta apps web em principais hosts de nuvem como Cloudflare, Netlify, Render e Vercel
- Generate images: gera e edita imagens para sites, mockups de UI, visuais de produtos e assets de jogos com uma Skill baseada em GPT Image
- Build with OpenAI APIs: ao desenvolver com a API da OpenAI, consulta a documentação mais recente
- Create documents: lê, cria e edita arquivos PDF, planilhas e docx (com suporte a formatação e layout profissionais)
- Ao criar uma nova Skill no app, ela pode ser usada no app, no CLI e na extensão de IDE
- As Skills podem ser versionadas no repositório para serem compartilhadas com toda a equipe
Automations: automação de tarefas repetitivas
- Com o recurso Automations, o Codex executa tarefas automaticamente em segundo plano de acordo com uma agenda definida
- A configuração combina instruções com Skills opcionais
- Ao concluir, os resultados são salvos na fila de revisão, permitindo retomar o trabalho quando necessário
- Exemplos de uso interno na OpenAI
- Classificação diária de issues
- Encontrar e resumir falhas de CI
- Geração de briefing diário de release
- Verificação de bugs
Personality: ajuste do estilo de trabalho
- Cada desenvolvedor tem preferências diferentes na forma de trabalhar com agentes
- Para quem quer um parceiro conciso e focado em execução
- Para quem prefere uma interação mais conversacional e empática
- No Codex, é possível escolher entre duas personalidades: um estilo conciso e prático ou um estilo conversacional e empático
- Sem mudança de funcionalidade, apenas adaptando ao modo preferido
- Pode ser configurado no app, no CLI e na extensão de IDE com o comando /personality
Segurança: aplicada por padrão e configurável
- A segurança foi integrada desde a fase de design em toda a stack de agentes do Codex
- Assim como no Codex CLI, ele usa sandboxing nativo, open source e configurável em nível de sistema
- Configuração padrão
- Os agentes só podem editar arquivos da pasta ou branch em que estão trabalhando e fazer buscas web em cache
- Ao executar comandos que exigem privilégios elevados, como acesso à rede, será solicitada aprovação do usuário
- É possível configurar regras para o projeto ou para a equipe para que determinados comandos sejam executados automaticamente com privilégios elevados
Disponibilidade e preços
- O app Codex está disponível para macOS a partir de hoje
- Assinantes do ChatGPT Plus, Pro, Business, Enterprise e Edu podem usar o Codex no CLI, web, extensão de IDE e app com login do ChatGPT
- O uso está incluído na assinatura do ChatGPT, com opção de compra de créditos adicionais se necessário
- O Codex também será oferecido temporariamente para usuários do ChatGPT Free e Go
- Durante esse período, usuários atuais do Codex em todos os planos pagos terão limite de uso 2x maior
Próximos planos
- Desde o lançamento do GPT-5.2-Codex em meados de dezembro de 2024, o uso total do Codex dobrou
- No último mês, mais de 1 milhão de desenvolvedores usaram o Codex
- Planos futuros
- Lançamento de um app para Windows
- Expansão da fronteira das capacidades do modelo
- Oferta de inferência mais rápida
- Melhorias no app
- Aprimoramento contínuo do workflow com múltiplos agentes com base em feedback real
- Maior facilidade para gerenciar trabalho em paralelo e manter contexto ao alternar entre agentes
- Expansão de Automations
- Suporte a gatilhos baseados em nuvem em desenvolvimento
- O Codex poderá continuar rodando em segundo plano mesmo quando o computador não estiver ligado
Premissa central do Codex
- Baseia-se na premissa simples de que tudo pode ser controlado por código
- Quanto melhor os agentes forem em raciocinar sobre código e gerá-lo, mais competentes se tornam em todos os tipos de trabalho técnico e intelectual
- O desafio central atual: a lacuna entre as capacidades dos modelos de fronteira e o grau de facilidade com que as pessoas conseguem realmente usá-los
- O Codex foi projetado para fechar essa lacuna, facilitando comandar, supervisionar e aplicar a inteligência completa do modelo em trabalho real
- A OpenAI está focada em criar o melhor agente de programação, o que servirá de base para agentes poderosos voltados a uma ampla gama de trabalho intelectual
9 comentários
Para mim também, o Codex tem sido o principal ultimamente, e é muito bom. Tomara que a versão para Windows saia logo.
Quando você inicia pela primeira vez, ele importa de uma vez os projetos em que você já estava trabalhando no Codex e os mostra em sequência à esquerda por projeto/thread, então é perfeito para tocar vários trabalhos ao mesmo tempo.
Há algum motivo para o Codex ser o principal, e não o Claude Code?
Eu costumo jogar o trabalho lá pedindo para fazer documentos de planejamento longos, e o Codex combina melhor com esse tipo de uso. E realmente quase não esbarra em rate limit. Mesmo quando rodo vários projetos ao mesmo tempo em uma conta barata.
Haha, obrigado pelo comentário.
Também tem o fato de o criador do OpenClaw usar o Codex,
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”
E o Codex também não parece estar sendo mal avaliado, mas, vendo os comentários no Hacker News, às vezes também parece que não é bem assim...
2222 Windows/Linux, por favor :(
Eu também queria experimentar o Atlas, que é um navegador do ChatGPT, mas anunciaram que a versão para Windows chegaria em breve e já faz um tempão que não sai nenhuma novidade
Usei hoje e é bom demais, viu?
Acho que os forks do VSCode vão ter que se preparar para a extinção.
Claro, também pode ser que os empregos dos desenvolvedores diminuam.
No Windows, sem tecnologia de sandbox, parece difícil fazer muita coisa.
Me dá WSL ou Windows...
Comentários do Hacker News
A maioria está no nível de uma simples UI de chat, mas com Electron é difícil chamar diretamente APIs do sistema operacional (ex.: Win32), então uma integração profunda fica inviável
Softwares complexos como Blender, Godot, Unity e UE5 rodam nativamente, então é frustrante ver essas empresas só dando desculpas
No Windows, Electron é o padrão de fato, e até a própria Microsoft usa com frequência
O macOS é bem melhor, mas no fim a equipe acaba ficando presa ao Mac ou escolhendo Electron para ter compatibilidade multiplataforma
Até a UI do UE5 quase não tem cara de nativa, e nem dá para dizer que seja melhor que Electron
Também é possível chamar APIs nativas a partir do Electron
A maioria dos usuários não liga se o app é nativo ou não, e para as empresas é uma grande vantagem poder reaproveitar desenvolvedores web para desenvolvimento de apps desktop
TUI ou GUI são camadas de abstração desnecessárias que dificultam a automação
O essencial é chamada simples de comandos e registro de logs. [Modo headless e logs de sessão] vão mais nessa direção
A maioria das pessoas não liga se o app foi feito com tecnologias web
O Electron também facilita o port para Linux. Se insistissem só em nativo, isso não seria possível
Não é perfeito, mas entrega de forma consistente resultados de nível de um engenheiro intermediário
Só que o app trava em “Loading projects…”
O link da documentação também estava quebrado, mas este link funciona agora
Como eu uso vários ambientes de VM com VS Code Remote, acho que vou precisar ajustar um pouco a configuração de offset de portas
O Codex costuma entrar em loop ao resolver problemas, e o Claude é bom em finalizar essas partes
Alternar entre os dois modelos é surpreendentemente eficiente
Mesmo assim, está melhorando de forma constante, então sigo otimista
O Cowork chama o Claude Code em uma VM, enquanto o Codex executa a CLI em um sandbox do sistema operacional
A stack técnica inclui Electron 40, React 19, TypeScript, Node.js, SQLite e Vite
No macOS, ele usa Sparkle, Squirrel e Sentry
Não seguia instruções, travava no meio ou jogava código sem sentido
Como não tinha dados recentes sobre Nuxt 4+, continuava errando
A função de desfazer também não funcionava direito e não havia feedback
O Claude Code fez a mesma tarefa de uma vez, enquanto o Codex demorou e entregou uma bagunça
Isso me lembrou quando usei o Nokia N800: havia potencial, mas o acabamento era tão ruim que me fez questionar a direção da OpenAI
Fico curioso se a Anthropic também vai lançar um app multiagente do Claude Code parecido
Se houver contratos claros (como definição de API), é mais eficiente trabalhar em paralelo com sessões independentes
Quase cheguei a fazer algo parecido eu mesmo
O ponto central do artigo Recursive Language Models é gerenciar requisitos, design e planejamento como objetos imutáveis, e não como contexto
Eu gerencio cada etapa (spec, analysis, plan etc.) em arquivos
.mde opero isso com um processo kanban com etapa de aprovaçãoAssim funciona bem mesmo sem UI, a qualidade do código se mantém e, no longo prazo, a velocidade de desenvolvimento fica 10 vezes maior
Com
.claude/commandse.claude/agents, dá para rodar várias tarefas ao mesmo tempoO Codex pega bem coisas que o Claude deixa passar, então usar os dois de forma complementar é eficiente
O Codex tem como vantagem ser barato e quase ilimitado em uso, enquanto o Claude tem qualidade melhor
Ele organiza o processo com base em
plan.mde permite adicionar etapas ou hooks dinamicamenteÉ prático poder controlar a automação de workflow com base em documentos
Eu já pago pelos três principais modelos, então acho difícil esse tipo de serviço durar muito
Disseram que usaram 7 milhões de tokens, então é surpreendente que não tenham detectado esse erro de QA
Esses problemas sutis são difíceis de capturar com test harnesses ou agentes de QA
Com mais tokens, só melhorou o acabamento; a jogabilidade é a mesma. Fico curioso para saber no que aqueles tokens extras foram usados
Fico curioso se a versão CLI terá suporte às mesmas funções
Seria bom ter uma função de cluster gerenciado que funcionasse apenas na rede interna
Também seria ideal permitir compartilhar o andamento do trabalho com a equipe
Se esse tipo de função fosse suportado pela ferramenta, seria muito melhor
A qualidade recente do GPT-5.x também caiu, e foi decepcionante que neste anúncio tenham feito lançamento só para Mac
O artigo também tem muitos erros de digitação, e incomoda não terem divulgado os prompts realmente usados
Mesmo assim, eu tentaria de novo se melhorarem
Provavelmente porque muita gente já se acostumou com a velocidade do Sonnet ou do Gemini 3.0 Flash
O ChatGPT de US$ 20 é mais eficiente que o Claude de US$ 200