OpenAI lança app Codex para macOS

(openai.com)

12 pontos por GN⁺ 2026-02-03 | 9 comentários | Compartilhar no WhatsApp

Ambiente de desenvolvimento integrado com IA que permite gerenciar vários agentes de IA ao mesmo tempo e oferece suporte a trabalho em paralelo e colaboração de longo prazo
Cada agente roda em uma thread independente, permitindo multitarefa por projeto, além de revisão de código, comentários em diff e edições manuais
Com o recurso Skills, vai além da escrita de código e se expande para coleta de informações, resolução de problemas, geração de imagens, criação de documentos, implantação em nuvem e outras tarefas
Com o recurso Automations, é possível executar tarefas repetitivas automaticamente em segundo plano de acordo com uma agenda definida
A segurança em sandbox é aplicada por padrão, e comandos que exigem privilégios elevados, como acesso à rede, precisam de aprovação do usuário
O Codex também será disponibilizado temporariamente para usuários do ChatGPT Free e Go, e os planos pagos terão limite de uso 2x maior

Visão geral do app Codex: um centro de comando para agentes

Desde o lançamento do Codex em abril de 2025, a forma como os desenvolvedores usam agentes mudou de forma fundamental
- Os modelos passaram a conseguir executar tarefas complexas e de longo prazo do início ao fim
- Agora, os desenvolvedores coordenam vários agentes ao longo de projetos inteiros, delegando trabalho e executando-o em paralelo
O desafio central mudou de "o que os agentes conseguem fazer" para "como as pessoas podem comandar, supervisionar e colaborar com agentes em larga escala"
IDEs tradicionais e ferramentas baseadas em terminal não foram projetadas para esse modo de trabalho, tornando necessária uma nova ferramenta
O app Codex para macOS permite gerenciar vários agentes de IA simultaneamente e executar tarefas em paralelo
Ele oferece suporte a tarefas de longa duração e, por meio da colaboração entre agentes, gerencia todo o processo de design, desenvolvimento, implantação e manutenção de software

Trabalho paralelo com múltiplos agentes

O app Codex oferece um espaço focado para multitarefa com agentes
- Os agentes rodam em threads separadas organizadas por projeto, permitindo alternar entre tarefas sem perder contexto
- Dentro das threads, é possível revisar as alterações feitas pelos agentes, comentar no diff ou editar diretamente no editor
Com suporte nativo a worktrees, vários agentes podem trabalhar no mesmo repositório sem conflitos
- Cada agente trabalha em uma cópia isolada do código, podendo explorar diferentes caminhos sem afetar o estado local do git
- Durante o trabalho do agente, é possível fazer checkout das mudanças localmente ou continuar sem alterar o estado local do git
O histórico de sessões e as configurações do Codex CLI e da extensão de IDE são importados automaticamente, permitindo uso imediato em projetos existentes

Skills: expansão além da geração de código

O Codex está evoluindo de um agente que escreve código para um agente que usa código para executar tarefas no computador
Com Skills, ele pode se expandir para tarefas além da geração de código, como coleta e síntese de informações, resolução de problemas e escrita
- Instruções, recursos e scripts podem ser agrupados em bundles para que o Codex se conecte a ferramentas e execute workflows
- As tarefas podem ser concluídas de forma confiável de acordo com as preferências da equipe
O app Codex inclui uma interface dedicada para criar e gerenciar Skills
- É possível solicitar explicitamente o uso de uma Skill específica ou configurar o uso automático conforme a tarefa
Exemplo de uso de Skills: criação de jogo de corrida
- Foi solicitado ao Codex que criasse um jogo de corrida com vários pilotos, 8 mapas e itens utilizáveis com a barra de espaço
  - Foram usadas uma Skill de geração de imagens (baseada em GPT Image) e uma Skill de desenvolvimento de jogos web
  - Com um único prompt inicial, trabalhou de forma independente com mais de 7 milhões de tokens até concluir o jogo
  - Atuou como designer, desenvolvedor de jogos e testador de QA, chegando a jogar o game para validá-lo
- Nome do jogo: Voxel Velocity, um kart racer voxel 3D feito com Three.js
  - Modo corrida solo (sempre 3 voltas, 1 humano vs 7 CPUs, 8 pistas disponíveis imediatamente)
  - Modelo de direção arcade, sistema de carga de drift, níveis de boost (Tier 1 0,7 s, Tier 2 1,1 s, Tier 3 1,5 s)
  - 8 personagens, 8 itens, presets de dificuldade da CPU, implementação de spline para IA
Principais Skills oferecidas
- Implement designs: importa contexto de design, assets e screenshots do Figma e os converte em código de UI de produção com fidelidade visual 1:1
- Manage projects: classifica bugs, acompanha releases e gerencia a carga de trabalho da equipe no Linear
- Deploy to the cloud: implanta apps web em principais hosts de nuvem como Cloudflare, Netlify, Render e Vercel
- Generate images: gera e edita imagens para sites, mockups de UI, visuais de produtos e assets de jogos com uma Skill baseada em GPT Image
- Build with OpenAI APIs: ao desenvolver com a API da OpenAI, consulta a documentação mais recente
- Create documents: lê, cria e edita arquivos PDF, planilhas e docx (com suporte a formatação e layout profissionais)
- Ao criar uma nova Skill no app, ela pode ser usada no app, no CLI e na extensão de IDE
- As Skills podem ser versionadas no repositório para serem compartilhadas com toda a equipe

Automations: automação de tarefas repetitivas

Com o recurso Automations, o Codex executa tarefas automaticamente em segundo plano de acordo com uma agenda definida
- A configuração combina instruções com Skills opcionais
- Ao concluir, os resultados são salvos na fila de revisão, permitindo retomar o trabalho quando necessário
Exemplos de uso interno na OpenAI
- Classificação diária de issues
- Encontrar e resumir falhas de CI
- Geração de briefing diário de release
- Verificação de bugs

Personality: ajuste do estilo de trabalho

Cada desenvolvedor tem preferências diferentes na forma de trabalhar com agentes
- Para quem quer um parceiro conciso e focado em execução
- Para quem prefere uma interação mais conversacional e empática
No Codex, é possível escolher entre duas personalidades: um estilo conciso e prático ou um estilo conversacional e empático
- Sem mudança de funcionalidade, apenas adaptando ao modo preferido
- Pode ser configurado no app, no CLI e na extensão de IDE com o comando /personality

Segurança: aplicada por padrão e configurável

A segurança foi integrada desde a fase de design em toda a stack de agentes do Codex
Assim como no Codex CLI, ele usa sandboxing nativo, open source e configurável em nível de sistema
Configuração padrão
- Os agentes só podem editar arquivos da pasta ou branch em que estão trabalhando e fazer buscas web em cache
- Ao executar comandos que exigem privilégios elevados, como acesso à rede, será solicitada aprovação do usuário
É possível configurar regras para o projeto ou para a equipe para que determinados comandos sejam executados automaticamente com privilégios elevados

Disponibilidade e preços

O app Codex está disponível para macOS a partir de hoje
Assinantes do ChatGPT Plus, Pro, Business, Enterprise e Edu podem usar o Codex no CLI, web, extensão de IDE e app com login do ChatGPT
O uso está incluído na assinatura do ChatGPT, com opção de compra de créditos adicionais se necessário
O Codex também será oferecido temporariamente para usuários do ChatGPT Free e Go
Durante esse período, usuários atuais do Codex em todos os planos pagos terão limite de uso 2x maior

Próximos planos

Desde o lançamento do GPT-5.2-Codex em meados de dezembro de 2024, o uso total do Codex dobrou
No último mês, mais de 1 milhão de desenvolvedores usaram o Codex
Planos futuros
- Lançamento de um app para Windows
- Expansão da fronteira das capacidades do modelo
- Oferta de inferência mais rápida
Melhorias no app
- Aprimoramento contínuo do workflow com múltiplos agentes com base em feedback real
- Maior facilidade para gerenciar trabalho em paralelo e manter contexto ao alternar entre agentes
Expansão de Automations
- Suporte a gatilhos baseados em nuvem em desenvolvimento
- O Codex poderá continuar rodando em segundo plano mesmo quando o computador não estiver ligado

Premissa central do Codex

Baseia-se na premissa simples de que tudo pode ser controlado por código
Quanto melhor os agentes forem em raciocinar sobre código e gerá-lo, mais competentes se tornam em todos os tipos de trabalho técnico e intelectual
O desafio central atual: a lacuna entre as capacidades dos modelos de fronteira e o grau de facilidade com que as pessoas conseguem realmente usá-los
O Codex foi projetado para fechar essa lacuna, facilitando comandar, supervisionar e aplicar a inteligência completa do modelo em trabalho real
A OpenAI está focada em criar o melhor agente de programação, o que servirá de base para agentes poderosos voltados a uma ampla gama de trabalho intelectual

9 comentários

xguru 2026-02-03

Para mim também, o Codex tem sido o principal ultimamente, e é muito bom. Tomara que a versão para Windows saia logo.

Quando você inicia pela primeira vez, ele importa de uma vez os projetos em que você já estava trabalhando no Codex e os mostra em sequência à esquerda por projeto/thread, então é perfeito para tocar vários trabalhos ao mesmo tempo.

tested 2026-02-03

Há algum motivo para o Codex ser o principal, e não o Claude Code?

xguru 2026-02-03

Eu costumo jogar o trabalho lá pedindo para fazer documentos de planejamento longos, e o Codex combina melhor com esse tipo de uso. E realmente quase não esbarra em rate limit. Mesmo quando rodo vários projetos ao mesmo tempo em uma conta barata.

tested 2026-02-03

Haha, obrigado pelo comentário.

Também tem o fato de o criador do OpenClaw usar o Codex,
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

E o Codex também não parece estar sendo mal avaliado, mas, vendo os comentários no Hacker News, às vezes também parece que não é bem assim...

unknowncyder 2026-02-03

2222 Windows/Linux, por favor :(
Eu também queria experimentar o Atlas, que é um navegador do ChatGPT, mas anunciaram que a versão para Windows chegaria em breve e já faz um tempão que não sai nenhuma novidade

treestae 2026-02-03

Usei hoje e é bom demais, viu?
Acho que os forks do VSCode vão ter que se preparar para a extinção.
Claro, também pode ser que os empregos dos desenvolvedores diminuam.

m00nlygreat 2026-02-03

No Windows, sem tecnologia de sandbox, parece difícil fazer muita coisa.

cshj55 2026-02-03

Me dá WSL ou Windows...

GN⁺ 2026-02-03

Comentários do Hacker News

Não entendo por que empresas de IA com bilhões de dólares ainda não conseguem fazer apps nativos
A maioria está no nível de uma simples UI de chat, mas com Electron é difícil chamar diretamente APIs do sistema operacional (ex.: Win32), então uma integração profunda fica inviável
Softwares complexos como Blender, Godot, Unity e UE5 rodam nativamente, então é frustrante ver essas empresas só dando desculpas
- O ambiente de desenvolvimento desktop é uma bagunça. A Microsoft lançou frameworks pela metade demais, então ninguém sabe o que usar
  No Windows, Electron é o padrão de fato, e até a própria Microsoft usa com frequência
  O macOS é bem melhor, mas no fim a equipe acaba ficando presa ao Mac ou escolhendo Electron para ter compatibilidade multiplataforma
- Hoje em dia, muita UI de videogame também é baseada em HTML/JS
  Até a UI do UE5 quase não tem cara de nativa, e nem dá para dizer que seja melhor que Electron
  Também é possível chamar APIs nativas a partir do Electron
  A maioria dos usuários não liga se o app é nativo ou não, e para as empresas é uma grande vantagem poder reaproveitar desenvolvedores web para desenvolvimento de apps desktop
- Eu penso justamente o contrário. Se tudo for feito como interface de texto, o modelo pode aprender as ferramentas de forma natural
  TUI ou GUI são camadas de abstração desnecessárias que dificultam a automação
  O essencial é chamada simples de comandos e registro de logs. [Modo headless e logs de sessão] vão mais nessa direção
- No fim, o resultado feito com IA é um app Electron com um único campo de entrada
- Não vejo que funcionalidades oferecidas por um app nativo seriam tão importantes assim
  A maioria das pessoas não liga se o app foi feito com tecnologias web
  O Electron também facilita o port para Linux. Se insistissem só em nativo, isso não seria possível
Usei bastante o Codex nos últimos dois meses e achei bem impressionante
Não é perfeito, mas entrega de forma consistente resultados de nível de um engenheiro intermediário
Só que o app trava em “Loading projects…”
O link da documentação também estava quebrado, mas este link funciona agora
Como eu uso vários ambientes de VM com VS Code Remote, acho que vou precisar ajustar um pouco a configuração de offset de portas
- Eu uso ChatGPT (US$ 20/mês) junto com Claude (US$ 200/ano), e o Codex ainda nunca bateu em limite de uso
  O Codex costuma entrar em loop ao resolver problemas, e o Claude é bom em finalizar essas partes
  Alternar entre os dois modelos é surpreendentemente eficiente
- Recebi uma resposta agradecendo por avisar sobre o problema do link. Disseram também que estão melhorando a velocidade de carregamento
- O Codex é forte em backend e tarefas lógicas, mas erra com frequência em tarefas simples de UI de frontend
  Mesmo assim, está melhorando de forma constante, então sigo otimista
- Vou continuar usando Cursor. A OpenAI deveria focar mais em corrigir bugs dos apps existentes do que lançar um app novo
O Codex parece um concorrente do tipo Claude Cowork
O Cowork chama o Claude Code em uma VM, enquanto o Codex executa a CLI em um sandbox do sistema operacional
A stack técnica inclui Electron 40, React 19, TypeScript, Node.js, SQLite e Vite
No macOS, ele usa Sparkle, Squirrel e Sentry
- Pelo nome e pelo design centrado em diff/worktree, parece claramente voltado para desenvolvedores
- É uma stack em nível de bootcamp, então foi meio decepcionante
- Fico curioso para saber se a integração com o Sentry é nativa ou via MCP
- Ter visualização de git e terminal é uma grande vantagem para usuários de CLI. Também estou curioso com a função de skills
Testei o Codex e fiquei irritado com o quão lento e burro ele era
Não seguia instruções, travava no meio ou jogava código sem sentido
Como não tinha dados recentes sobre Nuxt 4+, continuava errando
A função de desfazer também não funcionava direito e não havia feedback
O Claude Code fez a mesma tarefa de uma vez, enquanto o Codex demorou e entregou uma bagunça
Isso me lembrou quando usei o Nokia N800: havia potencial, mas o acabamento era tão ruim que me fez questionar a direção da OpenAI
O Codex da OpenAI é basicamente uma versão oficial de produtos como Emdash e Conductor
Fico curioso se a Anthropic também vai lançar um app multiagente do Claude Code parecido
- Já existe o Claude Code Desktop
- Acho que a abordagem multiagente está sendo superestimada
  Se houver contratos claros (como definição de API), é mais eficiente trabalhar em paralelo com sessões independentes
- Ao usar o Claude Code via GUI, fico curioso se usam o harness completo do Claude Code ou só o modelo em si
- Nunca tinha ouvido falar do Emdash, mas existem ferramentas demais desse tipo, então é difícil se divulgar e o mercado está barulhento
  Quase cheguei a fazer algo parecido eu mesmo
- A versão web do Claude Code foi lançada como prévia de pesquisa
A função de agente não me interessa muito
O ponto central do artigo Recursive Language Models é gerenciar requisitos, design e planejamento como objetos imutáveis, e não como contexto
Eu gerencio cada etapa (spec, analysis, plan etc.) em arquivos .md e opero isso com um processo kanban com etapa de aprovação
Assim funciona bem mesmo sem UI, a qualidade do código se mantém e, no longo prazo, a velocidade de desenvolvimento fica 10 vezes maior
Parece que a principal função do Codex é a execução paralela de agentes, mas eu já uso isso há 9 meses no Claude Code
Com .claude/commands e .claude/agents, dá para rodar várias tarefas ao mesmo tempo
O Codex pega bem coisas que o Claude deixa passar, então usar os dois de forma complementar é eficiente
O Codex tem como vantagem ser barato e quase ilimitado em uso, enquanto o Claude tem qualidade melhor
Eu uso principalmente o Claude Code, mas o melhor orquestrador para mim foi o Zenflow da Zencoder.ai
Ele organiza o processo com base em plan.md e permite adicionar etapas ou hooks dinamicamente
É prático poder controlar a automação de workflow com base em documentos
- Mas, quando você pesquisa, muitas vezes acaba sendo só mais um “app que vende pacote de créditos de IA”
  Eu já pago pelos três principais modelos, então acho difícil esse tipo de serviço durar muito
- Já existem mais de 500 serviços de integração de IA
No rodapé do jogo-demo “Voxel Velocity” está escrito “Enter start”, mas na prática o Enter só troca a seleção
Disseram que usaram 7 milhões de tokens, então é surpreendente que não tenham detectado esse erro de QA
- O jogo em si é impressionante, mas falta controle de qualidade nos detalhes
  Esses problemas sutis são difíceis de capturar com test harnesses ou agentes de QA
- Quase não há diferença nas funcionalidades do jogo entre as versões de 60 mil, 800 mil e 7 milhões de tokens
  Com mais tokens, só melhorou o acabamento; a jogabilidade é a mesma. Fico curioso para saber no que aqueles tokens extras foram usados
Sou usuário de Linux, então é uma pena que o Codex seja exclusivo para Mac
Fico curioso se a versão CLI terá suporte às mesmas funções
- O próprio Romain, da OpenAI, respondeu. Como é baseado em Electron, o suporte a Windows e Linux deve chegar em breve
- No momento, mesmo no Mac ele não roda em chips Intel
- O macOS é adequado para experimentação. Como a configuração de hardware é mais uniforme, há menos bugs de casos extremos
É uma pena que tudo rode só localmente
Seria bom ter uma função de cluster gerenciado que funcionasse apenas na rede interna
Também seria ideal permitir compartilhar o andamento do trabalho com a equipe
- Eu uso algo parecido com ssh e tmux
  Se esse tipo de função fosse suportado pela ferramenta, seria muito melhor
A OpenAI e o Codex lideraram a inovação no começo, mas agora Claude e Gemini estão mais à frente
A qualidade recente do GPT-5.x também caiu, e foi decepcionante que neste anúncio tenham feito lançamento só para Mac
O artigo também tem muitos erros de digitação, e incomoda não terem divulgado os prompts realmente usados
Mesmo assim, eu tentaria de novo se melhorarem
- No vídeo, chamou atenção como a parte de geração de código foi editada em velocidade 5x ou mais
  Provavelmente porque muita gente já se acostumou com a velocidade do Sonnet ou do Gemini 3.0 Flash
- Eu tive a sensação contrária: o Codex é mais estável que Claude Code ou Gemini para lidar com tarefas complexas
  O ChatGPT de US$ 20 é mais eficiente que o Claude de US$ 200
- A OpenAI já tinha essa política de priorizar lançamentos para macOS antes