Codex para quase tudo
(openai.com)- O app Codex recebeu uma grande atualização e agora permite realizar todo o processo de desenvolvimento de software em um único workspace
- Ao controlar diretamente o computador, usar ferramentas e apps do dia a dia em conjunto e adicionar geração de imagens, aprendizado de ações passadas e execução de tarefas repetitivas, ele automatiza e expande o workflow de desenvolvimento
- O app para desktop agora inclui revisão de PR, visualização de múltiplos arquivos/terminais, conexão SSH com devbox remoto e navegador integrado, acelerando design de frontend e iteração de apps/jogos
- Mais de 90 plugins e o modelo gpt-image-1.5 foram integrados, oferecendo um ambiente conectado que vai da escrita de código a design, testes e colaboração
- Reutilização de threads de conversa existentes, agendamento automático de tarefas de longo prazo e prévia de memória garantem continuidade de trabalho ao longo de dias ou semanas
Principais atualizações do Codex
- O app Codex recebeu uma grande atualização para macOS e Windows e foi ampliado para atender todo o processo de desenvolvimento de software para mais de 3 milhões de usuários desenvolvedores semanais
- A nova versão adiciona controle do computador, geração de imagens, memória, plugins e navegador integrado, acelerando o workflow dos desenvolvedores
- Recursos voltados ao desenvolvimento foram reforçados, como revisão de PR, visualização de múltiplos arquivos e terminais, e conexão com devbox remoto via SSH
- Todas as melhorias foram integradas para permitir escrever código, verificar saídas, revisar mudanças e colaborar em um único workspace
-
Controle do computador e trabalho em paralelo
- Com o recurso de controle do computador em segundo plano, é possível clicar, digitar e navegar diretamente no computador do usuário
- Ele usa seu próprio cursor para operar apps, permitindo testes ou tarefas repetitivas mesmo em aplicativos sem API
- Vários agentes podem trabalhar em paralelo no Mac ao mesmo tempo, sem interferir no uso de outros apps pelo usuário
- É útil para iteração de mudanças no frontend, testes de apps e trabalho em ambientes sem API
- Com o recurso de controle do computador em segundo plano, é possível clicar, digitar e navegar diretamente no computador do usuário
-
Integração com web e navegador
- Integra-se nativamente com a web e, por meio do navegador integrado, permite fazer anotações diretamente sobre páginas para dar instruções específicas ao Codex
- No momento, é útil para desenvolvimento de frontend e jogos, e no futuro deve evoluir além de apps web em localhost até o controle completo do navegador
-
Geração de imagens e workflow visual
- Usa o modelo gpt-image-1.5 para gerar imagens e executar iterações
- Combinado com screenshots e código, permite criar conceitos de produto, designs de frontend, mockups e visuais de jogos dentro do mesmo workflow
-
Expansão com plugins
- Foram adicionados mais de 90 novos plugins, com suporte à integração com vários apps e servidores MCP
- Principais plugins: Atlassian Rovo (gestão de JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
- Os plugins permitem que o Codex colete mais contexto e execute mais tarefas automaticamente
-
Reforço do workflow para desenvolvedores
- Suporte a processamento de comentários de revisão no GitHub, execução de múltiplas abas de terminal e conexão com devbox remoto via SSH (em fase alfa)
- É possível abrir arquivos diretamente pela barra lateral, com pré-visualização rica de PDFs, planilhas, slides e documentos
- Há um novo painel de resumo (summary pane) para acompanhar planos do agente, fontes e entregáveis
- Como é possível passar por escrita de código, verificação de saídas, revisão de mudanças e colaboração entre agentes dentro de um único workspace, a transição entre etapas do ciclo de vida de desenvolvimento fica mais rápida
-
Automação e tarefas de longo prazo
- O recurso de automação foi ampliado para reutilizar threads de conversa existentes e manter o contexto acumulado
- O Codex pode agendar sozinho trabalhos futuros e retomá-los automaticamente, permitindo continuidade de tarefas de longo prazo ao longo de dias ou semanas
- Casos de uso em equipes: merge de PRs abertos, acompanhamento de tarefas e rastreamento rápido de conversas em ferramentas como Slack, Gmail e Notion
-
Memória e personalização
- Com a prévia de memória (preview of memory), o Codex passa a lembrar de contextos úteis do passado, como preferências pessoais, correções e informações coletadas
- Isso permite atingir em trabalhos futuros um nível de qualidade e velocidade que antes só era possível com instruções personalizadas extensas
- O Codex passa a sugerir proativamente retomar de onde parou, usando projeto, plugins conectados e contexto de memória para gerar automaticamente sugestões de tarefas e lista de prioridades
- Exemplo: identificar comentários em um Google Docs que precisam de confirmação → coletar contexto relacionado em Slack, Notion e codebase → fornecer uma lista de ações priorizada
- Com a prévia de memória (preview of memory), o Codex passa a lembrar de contextos úteis do passado, como preferências pessoais, correções e informações coletadas
-
Plano de lançamento e disponibilidade
- O recurso está sendo liberado gradualmente para usuários do app desktop do Codex conectados com conta ChatGPT
- Recursos de personalização (sugestões com reconhecimento de contexto, memória) chegarão em breve para usuários Enterprise, Edu, EU e UK
- O recurso de controle do computador será disponibilizado primeiro no macOS e depois expandido para as regiões EU e UK
A evolução e o objetivo do Codex
- Em um ano desde o lançamento, o Codex ampliou seu escopo de uso para além de escrever código, passando a abranger entendimento de sistemas, coleta de contexto, revisão, depuração, colaboração e gestão de tarefas de longo prazo
- A OpenAI tem como objetivo fazer com que a AGI beneficie toda a humanidade, e esta atualização foi projetada para reduzir a distância entre o que as pessoas imaginam e o que de fato conseguem construir
- No futuro, o Codex deve se integrar ainda mais profundamente a ferramentas, workflows e decisões do processo de criação de software
6 comentários
É a versão paga do Opecnclaw…
Ainda não tem para Windows, certo? É uma atualização para Mac, né?
Quando peço um design para web, ele sempre implementa no estilo de cartões; quando será que vão corrigir isso? Se arrumarem só isso, acho que vou parar de usar o Claude de vez.
Eu só usei conectado pelo VSCode, então acho que vou ter que experimentar pelo app.
Como tenho usado bastante o Codex ultimamente como principal, esta é uma atualização muito bem-vinda.
openai-oauth - Use a API da OpenAI gratuitamente com uma conta do ChatGPT
Usando isso, agora acho que até a geração de imagens vai ser possível
Opiniões do Hacker News
Lendo os comentários, parece que muita gente não sabe que Claude Desktop e Cowork já oferecem esse tipo de recurso
O Codex passa mais a sensação de estar correndo atrás do que de ser uma inovação
A OpenAI tem menos clientes enterprise, então consegue subsidiar mais recursos computacionais para usuários individuais
No fim, quando a base de usuários crescer, vai acabar ficando como a Anthropic. Por enquanto, isso é só estratégia de PR
O Codex consegue clicar em apps, digitar em segundo plano e permitir que vários agentes trabalhem ao mesmo tempo
Como eu disse no post do meu blog, a IA precisa trabalhar de forma mais proativa
Coisas como resumo do Slack, integração de atas de reunião e geração automática de notas de preparação para reuniões já são possíveis, mas ninguém está fazendo isso
No fim, o que importa é gerenciar a atenção, e a IA deveria nos ajudar a decidir no que focar
Quando olho as UIs de hoje em dia, vejo uma forte tendência de esconder o código
O prompt vira a fonte real, e o código é tratado como um produto intermediário incômodo
Assim fica mais rápido e o resultado sai como se fosse código escrito por mim
Nós já sabemos automatizar as coisas, mas a maioria das pessoas não
Hoje linguagens de alto nível parecem estranhas para alguns, mas no fim isso é só o aumento das camadas de abstração
Engenharia de prompt também é, no fim das contas, outro sistema de linguagem artificial
Muita gente olha com ceticismo, mas eu acho que isso vai se popularizar em massa
Uso CLI há 25 anos, mas hoje deixo o Codex fazer tarefas de terminal no meu lugar
Se a versão GUI ficar bem feita, usuários comuns também vão se acostumar rápido
Configurações que antes levavam horas agora terminam em segundos
Tirando apps que exigem GUI, a maioria das tarefas pode ser feita só com IA baseada em texto
Fico em dúvida se eu realmente quero que o Codex controle diretamente meu computador e meus apps
Eu ainda valorizo bastante a segurança de sandbox
Parece que a OpenAI deixa preparados lançamentos privados para coincidirem com anúncios de concorrentes
A agenda de imprensa e influenciadores é alinhada com antecedência
O prompt do segundo vídeo era “reduza o tamanho da fonte e do tagline”
Dá a sensação de que agora estão usando LLM até para ajustar tamanho de fonte
No terceiro vídeo, o pedido era “gere a imagem da hero section”,
e usar imagem gerada por IA na descrição de produto parece muito falso
Sinceramente, não sei onde eu deveria usar isso
Como ajuda de programação é útil, mas eu não quero que mexa diretamente no meu computador
Talvez para resumir Slack faça sentido, mas no momento parece uma solução procurando um problema que não existe
Acho que agentes especializados como Cowork/Codex vão ser a categoria que mais cresce para não desenvolvedores
Esses agentes vão passar a operar software no lugar de humanos
Como expliquei neste texto relacionado,
no fim a própria estrutura do mercado de software vai mudar
E isso amplia também a ameaça de segurança
Ele lê e-mails e atas de reunião, planeja e executa tarefas, e depois ainda envia um resumo
Isso é possível porque a maior parte do trabalho do conhecimento acaba sendo expressa em forma de código
Se a conexão com os dados for bem feita, o mercado de B2B SaaS vai se abrir
Ainda fico curioso se o Codex continua lendo arquivos sensíveis sem consentimento do usuário
Há uma issue sobre isso no GitHub
O mais seguro é rodar isso em uma máquina separada, sem dados sensíveis
O nome Codex é confuso
Um é uma ferramenta de programação em formato de agente, o outro é um app GUI para Mac/Windows, mas os dois têm o mesmo nome