14 pontos por GN⁺ 13 일 전 | 6 comentários | Compartilhar no WhatsApp
  • O app Codex recebeu uma grande atualização e agora permite realizar todo o processo de desenvolvimento de software em um único workspace
  • Ao controlar diretamente o computador, usar ferramentas e apps do dia a dia em conjunto e adicionar geração de imagens, aprendizado de ações passadas e execução de tarefas repetitivas, ele automatiza e expande o workflow de desenvolvimento
  • O app para desktop agora inclui revisão de PR, visualização de múltiplos arquivos/terminais, conexão SSH com devbox remoto e navegador integrado, acelerando design de frontend e iteração de apps/jogos
  • Mais de 90 plugins e o modelo gpt-image-1.5 foram integrados, oferecendo um ambiente conectado que vai da escrita de código a design, testes e colaboração
  • Reutilização de threads de conversa existentes, agendamento automático de tarefas de longo prazo e prévia de memória garantem continuidade de trabalho ao longo de dias ou semanas

Principais atualizações do Codex

  • O app Codex recebeu uma grande atualização para macOS e Windows e foi ampliado para atender todo o processo de desenvolvimento de software para mais de 3 milhões de usuários desenvolvedores semanais
  • A nova versão adiciona controle do computador, geração de imagens, memória, plugins e navegador integrado, acelerando o workflow dos desenvolvedores
  • Recursos voltados ao desenvolvimento foram reforçados, como revisão de PR, visualização de múltiplos arquivos e terminais, e conexão com devbox remoto via SSH
  • Todas as melhorias foram integradas para permitir escrever código, verificar saídas, revisar mudanças e colaborar em um único workspace
  • Controle do computador e trabalho em paralelo

    • Com o recurso de controle do computador em segundo plano, é possível clicar, digitar e navegar diretamente no computador do usuário
      • Ele usa seu próprio cursor para operar apps, permitindo testes ou tarefas repetitivas mesmo em aplicativos sem API
      • Vários agentes podem trabalhar em paralelo no Mac ao mesmo tempo, sem interferir no uso de outros apps pelo usuário
    • É útil para iteração de mudanças no frontend, testes de apps e trabalho em ambientes sem API
  • Integração com web e navegador

    • Integra-se nativamente com a web e, por meio do navegador integrado, permite fazer anotações diretamente sobre páginas para dar instruções específicas ao Codex
    • No momento, é útil para desenvolvimento de frontend e jogos, e no futuro deve evoluir além de apps web em localhost até o controle completo do navegador
  • Geração de imagens e workflow visual

    • Usa o modelo gpt-image-1.5 para gerar imagens e executar iterações
    • Combinado com screenshots e código, permite criar conceitos de produto, designs de frontend, mockups e visuais de jogos dentro do mesmo workflow
  • Expansão com plugins

    • Foram adicionados mais de 90 novos plugins, com suporte à integração com vários apps e servidores MCP
    • Principais plugins: Atlassian Rovo (gestão de JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
    • Os plugins permitem que o Codex colete mais contexto e execute mais tarefas automaticamente
  • Reforço do workflow para desenvolvedores

    • Suporte a processamento de comentários de revisão no GitHub, execução de múltiplas abas de terminal e conexão com devbox remoto via SSH (em fase alfa)
    • É possível abrir arquivos diretamente pela barra lateral, com pré-visualização rica de PDFs, planilhas, slides e documentos
    • Há um novo painel de resumo (summary pane) para acompanhar planos do agente, fontes e entregáveis
    • Como é possível passar por escrita de código, verificação de saídas, revisão de mudanças e colaboração entre agentes dentro de um único workspace, a transição entre etapas do ciclo de vida de desenvolvimento fica mais rápida
  • Automação e tarefas de longo prazo

    • O recurso de automação foi ampliado para reutilizar threads de conversa existentes e manter o contexto acumulado
    • O Codex pode agendar sozinho trabalhos futuros e retomá-los automaticamente, permitindo continuidade de tarefas de longo prazo ao longo de dias ou semanas
    • Casos de uso em equipes: merge de PRs abertos, acompanhamento de tarefas e rastreamento rápido de conversas em ferramentas como Slack, Gmail e Notion
  • Memória e personalização

    • Com a prévia de memória (preview of memory), o Codex passa a lembrar de contextos úteis do passado, como preferências pessoais, correções e informações coletadas
      • Isso permite atingir em trabalhos futuros um nível de qualidade e velocidade que antes só era possível com instruções personalizadas extensas
    • O Codex passa a sugerir proativamente retomar de onde parou, usando projeto, plugins conectados e contexto de memória para gerar automaticamente sugestões de tarefas e lista de prioridades
    • Exemplo: identificar comentários em um Google Docs que precisam de confirmação → coletar contexto relacionado em Slack, Notion e codebase → fornecer uma lista de ações priorizada
  • Plano de lançamento e disponibilidade

    • O recurso está sendo liberado gradualmente para usuários do app desktop do Codex conectados com conta ChatGPT
    • Recursos de personalização (sugestões com reconhecimento de contexto, memória) chegarão em breve para usuários Enterprise, Edu, EU e UK
    • O recurso de controle do computador será disponibilizado primeiro no macOS e depois expandido para as regiões EU e UK

A evolução e o objetivo do Codex

  • Em um ano desde o lançamento, o Codex ampliou seu escopo de uso para além de escrever código, passando a abranger entendimento de sistemas, coleta de contexto, revisão, depuração, colaboração e gestão de tarefas de longo prazo
  • A OpenAI tem como objetivo fazer com que a AGI beneficie toda a humanidade, e esta atualização foi projetada para reduzir a distância entre o que as pessoas imaginam e o que de fato conseguem construir
  • No futuro, o Codex deve se integrar ainda mais profundamente a ferramentas, workflows e decisões do processo de criação de software

6 comentários

 
iolothebard 12 일 전

É a versão paga do Opecnclaw…

 
cshj55 13 일 전

Ainda não tem para Windows, certo? É uma atualização para Mac, né?

 
slowandsnow 13 일 전

Quando peço um design para web, ele sempre implementa no estilo de cartões; quando será que vão corrigir isso? Se arrumarem só isso, acho que vou parar de usar o Claude de vez.

 
bluenyx 13 일 전

Eu só usei conectado pelo VSCode, então acho que vou ter que experimentar pelo app.

 
xguru 13 일 전

Como tenho usado bastante o Codex ultimamente como principal, esta é uma atualização muito bem-vinda.

openai-oauth - Use a API da OpenAI gratuitamente com uma conta do ChatGPT

Usando isso, agora acho que até a geração de imagens vai ser possível

 
GN⁺ 13 일 전
Opiniões do Hacker News
  • Lendo os comentários, parece que muita gente não sabe que Claude Desktop e Cowork já oferecem esse tipo de recurso
    O Codex passa mais a sensação de estar correndo atrás do que de ser uma inovação

    • O motivo de o Codex estar fazendo sucesso no HN ultimamente é que a Anthropic reduziu o rate limit para usuários individuais
      A OpenAI tem menos clientes enterprise, então consegue subsidiar mais recursos computacionais para usuários individuais
      No fim, quando a base de usuários crescer, vai acabar ficando como a Anthropic. Por enquanto, isso é só estratégia de PR
    • O Codex tem mais recursos que o Claude Cowork. Por exemplo, consegue operar diretamente o computador em segundo plano
    • O Claude ainda não tem esse tipo de recurso
      O Codex consegue clicar em apps, digitar em segundo plano e permitir que vários agentes trabalhem ao mesmo tempo
    • Dá a sensação de que os dois produtos estão convergindo. Recentemente, a UI do app do Claude para Mac mudou e ficou quase igual à do Codex
    • Na real, neste momento nenhum dos dois está fazendo uma inovação de verdade
      Como eu disse no post do meu blog, a IA precisa trabalhar de forma mais proativa
      Coisas como resumo do Slack, integração de atas de reunião e geração automática de notas de preparação para reuniões já são possíveis, mas ninguém está fazendo isso
      No fim, o que importa é gerenciar a atenção, e a IA deveria nos ajudar a decidir no que focar
  • Quando olho as UIs de hoje em dia, vejo uma forte tendência de esconder o código
    O prompt vira a fonte real, e o código é tratado como um produto intermediário incômodo

    • Eu sigo o caminho oposto. Mantenho a estrutura do código na cabeça e converso com a IA como se estivesse fazendo pair programming
      Assim fica mais rápido e o resultado sai como se fosse código escrito por mim
    • O fato de o app do Codex ainda não funcionar em Linux sugere que o público-alvo são pessoas que não entendem muito de código
    • Na prática, esse tipo de ferramenta beneficia mais os não desenvolvedores
      Nós já sabemos automatizar as coisas, mas a maioria das pessoas não
    • Se você quer a verdadeira estética de desenvolvedor, é só trabalhar comparando tudo com git diff no vim
    • Houve uma época em que se acreditava que só assembly era código de verdade
      Hoje linguagens de alto nível parecem estranhas para alguns, mas no fim isso é só o aumento das camadas de abstração
      Engenharia de prompt também é, no fim das contas, outro sistema de linguagem artificial
  • Muita gente olha com ceticismo, mas eu acho que isso vai se popularizar em massa
    Uso CLI há 25 anos, mas hoje deixo o Codex fazer tarefas de terminal no meu lugar
    Se a versão GUI ficar bem feita, usuários comuns também vão se acostumar rápido

    • Eu também, como usuário de Linux, acho muito prazeroso controlar o OS por linguagem natural
      Configurações que antes levavam horas agora terminam em segundos
    • Nos próximos 3 a 5 anos, acho que a ideia de qualidade de código vai mudar e o uso de IDEs vai cair bastante
    • Esse tipo de abordagem é que é o verdadeiro uso do computador
      Tirando apps que exigem GUI, a maioria das tarefas pode ser feita só com IA baseada em texto
    • Especialmente para resolver erro de Docker-compose, isso parece mágica de verdade
    • Mas essa abordagem é mais lenta, consome mais recursos computacionais e traz o risco de os dados serem registrados fora da máquina
  • Fico em dúvida se eu realmente quero que o Codex controle diretamente meu computador e meus apps
    Eu ainda valorizo bastante a segurança de sandbox

    • Programadores em geral não querem isso, mas usuários comuns querem comandos de voz estilo Star Trek
    • No Mac, clicar em botão não me assusta tanto. Mais perigoso é deixar rodando um programa com aprovação automática
    • Eu, na verdade, quero que a IA clique por mim. Tarefas repetitivas são chatas demais
    • Tem gente que roda coisas como OpenClaw por conta própria. Eu, no mínimo, isolo tudo com Docker
    • De fato, já teve caso em que o Codex corrigiu automaticamente um problema de permissões no meu Mac
  • Parece que a OpenAI deixa preparados lançamentos privados para coincidirem com anúncios de concorrentes

    • (Funcionário da OpenAI) Na prática, não é algo tão calculado assim. O desenvolvimento acontece internamente e a divulgação externa segue o cronograma
      A agenda de imprensa e influenciadores é alinhada com antecedência
    • Mesmo assim, olhando o timing dos lançamentos recentes, há quem ache difícil acreditar que seja coincidência
    • Também há quem diga que a empresa opera muito em torno de hype
    • No fim, concordam que é uma disputa pelo controle da narrativa na mídia
    • Eles já demonstraram ter faro para mídia com a aquisição da TBPN
  • O prompt do segundo vídeo era “reduza o tamanho da fonte e do tagline”
    Dá a sensação de que agora estão usando LLM até para ajustar tamanho de fonte
    No terceiro vídeo, o pedido era “gere a imagem da hero section”,
    e usar imagem gerada por IA na descrição de produto parece muito falso

  • Sinceramente, não sei onde eu deveria usar isso
    Como ajuda de programação é útil, mas eu não quero que mexa diretamente no meu computador
    Talvez para resumir Slack faça sentido, mas no momento parece uma solução procurando um problema que não existe

  • Acho que agentes especializados como Cowork/Codex vão ser a categoria que mais cresce para não desenvolvedores
    Esses agentes vão passar a operar software no lugar de humanos
    Como expliquei neste texto relacionado,
    no fim a própria estrutura do mercado de software vai mudar

    • Mas, para esses agentes terem sucesso, eles precisam de acesso total
      E isso amplia também a ameaça de segurança
    • Sou CEO com formação em engenharia mecânica e uso o Claude Code para automatizar campanhas sociais inteiras
      Ele lê e-mails e atas de reunião, planeja e executa tarefas, e depois ainda envia um resumo
      Isso é possível porque a maior parte do trabalho do conhecimento acaba sendo expressa em forma de código
    • A maioria dos trabalhadores do conhecimento não vai tentar aprender esse tipo de ferramenta
    • O LLM é a melhor UI/UX possível. Não é preciso desenhar uma interface separada
      Se a conexão com os dados for bem feita, o mercado de B2B SaaS vai se abrir
    • Eu também uso bastante o Codex para tarefas que não envolvem código, mas ele funciona melhor quando você tem uma mentalidade de programador
  • Ainda fico curioso se o Codex continua lendo arquivos sensíveis sem consentimento do usuário
    Há uma issue sobre isso no GitHub

    • Com esta atualização adicionando controle do computador, o modelo de permissões fica ainda mais importante
    • Como há busca de arquivos, acesso ao navegador e outras funções, os limites ficam pouco claros, então é difícil saber exatamente quais permissões estão abertas
    • Como no caso do Reddit, já houve situação em que o Claude criticou a segurança do usuário
      O mais seguro é rodar isso em uma máquina separada, sem dados sensíveis
    • Eu mesmo passei por isso ontem. Esse problema ainda existe
  • O nome Codex é confuso
    Um é uma ferramenta de programação em formato de agente, o outro é um app GUI para Mac/Windows, mas os dois têm o mesmo nome

    • Ainda assim, acho que é um pouco melhor que os nomes da Microsoft