- O ambiente de execução em contêiner do ChatGPT foi expandido em grande escala e agora permite executar comandos Bash, instalar pacotes com pip/npm e baixar arquivos
- O ambiente, antes centrado em Python, passou a oferecer suporte à execução de código em várias linguagens com a adição de mais de 10 linguagens, como Node.js, Ruby, Go, Java, Swift, Kotlin, C e C++
- O acesso à rede externa continua restrito, mas foi configurado para que
pip install e npm install funcionem por meio de um proxy interno da OpenAI
- A nova ferramenta
container.download pode obter arquivos de URLs públicas e salvá-los dentro do contêiner, passando por procedimentos de validação de segurança
- Esse upgrade amplia bastante as capacidades de execução de código e processamento de dados do ChatGPT, reforçando a necessidade de documentação oficial
Principais recursos expandidos dos contêineres do ChatGPT
- O ChatGPT agora pode executar comandos Bash diretamente, enquanto antes só era possível executar código Python
- Isso substitui a execução indireta via módulo
subprocess do Python e permite controle em nível de linha de comando
- Foi adicionado um ambiente Node.js, permitindo executar JavaScript, e também houve testes bem-sucedidos com Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C e C++
- Rust ainda não é suportado
- O contêiner ainda não consegue fazer requisições diretas à rede externa, mas
pip install e npm install funcionam via proxy
- Com a ferramenta
container.download, é possível baixar arquivos da web para um caminho especificado
- O ChatGPT identifica a URL, salva o arquivo no ambiente sandbox e depois pode processá-lo
Recurso container.download
container.download é uma ferramenta para obter arquivos de URLs com acesso público e salvá-los no sistema de arquivos do contêiner
- Depois de baixados, os arquivos podem passar por pós-processamento dentro do contêiner, como descompactação, parsing e conversão
- Nos testes, os cabeçalhos da requisição incluíam
User-Agent: ChatGPT-User/1.0, e o IP foi identificado como Microsoft Azure Cloud (Des Moines, Iowa)
Validação de segurança: possibilidade de exfiltração de dados
- Foi realizado um experimento para verificar se
container.download poderia se tornar uma vulnerabilidade de exfiltração de dados
- Ao chamar URLs com query string, ocorreu o erro “url not viewed in conversation before”
- Isso funciona como uma proteção de restrição de acesso a URL, semelhante ao Web Fetch do Claude, permitindo acesso apenas a URLs previamente confirmadas por entrada do usuário ou resultados de busca
- Foi possível passar algumas query strings via
web.run, mas strings longas contendo histórico anterior da conversa foram bloqueadas pelo filtro
- Até agora, os experimentos indicam baixo risco de vazamento de dados, embora haja menção à necessidade de mais pesquisas de segurança
Execução de Bash e múltiplas linguagens
- Com o suporte à execução de Bash, o ChatGPT passou a conseguir executar comandos em nível de sistema
- Ex.: é possível executar
npm install e verificar o resultado
- A execução real dos comandos pode ser validada por meio dos logs de execução no painel Activity (console em preto e branco)
- Os testes de execução de “Hello World” foram bem-sucedidos em várias linguagens, confirmando um ambiente de execução de código multilíngue
Mecanismo de instalação de pacotes com pip e npm
- Mesmo com a rede externa bloqueada, o contêiner realiza instalação de pacotes por meio de um proxy interno da OpenAI (
applied-caas-gateway1.internal.api.openai.org)
- Variáveis de ambiente como
PIP_INDEX_URL e NPM_CONFIG_REGISTRY apontam para esse proxy
- Gerenciadores de pacotes importantes, como
pip, uv e npm, funcionam por esse proxy
- As variáveis de ambiente incluem vários caminhos de registro com o prefixo CAAS_ARTIFACTORY_*
- Há caminhos de repositórios internos para PyPI, npm, Go, Maven, Gradle, Cargo, Docker e outros
- Rust e Docker ainda não estão instalados, mas isso sugere possibilidade de expansão futura
Uso integrado e desafios futuros
- O ChatGPT agora pode instalar pacotes Python e Node.js e aplicá-los a arquivos enviados ou baixados
- Ele passou a oferecer funcionalidades em nível de ambiente completo de desenvolvimento, incluindo escrita de código, execução, processamento de dados e entrada/saída de arquivos
- O maior ponto fraco é a ausência de documentação oficial, o que reforça a necessidade de release notes e divulgação detalhada das limitações
- A OpenAI deveria dar um nome apropriado a esse conjunto de recursos; por enquanto, ele está sendo chamado provisoriamente de “ChatGPT Containers”
Resumo da lista completa de ferramentas do ChatGPT
- Foi divulgada a lista de ferramentas disponíveis no ambiente GPT-5.2
- Inclui python.exec, web.run, container.exec, container.download, image_gen.text2im e outras
- Cada ferramenta possui uma descrição (description) e uma assinatura (signature) claras
container.exec executa comandos, container.feed_chars recebe entrada para sessões interativas e container.open_image exibe imagens
- Também inclui recursos personalizados para o usuário, como
bio.update, personal_context.search e user_settings.set_setting
- No geral, o ChatGPT está evoluindo para um ambiente de IA composto que integra execução de código, acesso à web, processamento de arquivos e gerenciamento de contexto do usuário
1 comentários
Opiniões do Hacker News
Trabalho em suporte técnico e sou familiarizado com Python, mas não sou desenvolvedor
Nas últimas semanas, Gemini e Claude me perguntaram: “você pode usar um computador?”
Eu respondi: “que computador? O meu? Ou um computador que vocês têm?”
Como eu estava usando a versão gratuita no navegador, não imaginei que eles pudessem usar meu computador diretamente, mas descobri que estavam executando scripts Python no ambiente deles
Isso me fez pensar quem foi o primeiro a ter a ideia de dar um computador de verdade para um LLM resolver problemas de cálculo
Quando usei o Nano Banana em um prompt, o Gemini também se referiu ao gerador de imagens na terceira pessoa, e isso me deu uma sensação de “tartarugas sobre tartarugas”
Pela nossa experiência, dar um ambiente Linux a um agente traz vantagens complexas
Ele consegue resolver sozinho situações estranhas que ferramentas normais têm dificuldade para tratar
Por exemplo, quando um arquivo com nome .png na verdade é um jpeg, ele lê os magic bytes e processa corretamente
Tentei usar um modelo de visão para verificar perfil ICC ou densidade de tinta, mas ele frequentemente falava bobagem
No fim, dei ao agente acesso ao ImageMagick para ele analisar diretamente, e esse foi o único método confiável
Caso contrário, eu teria que arcar com o custo das impressões que dessem errado
A maioria dos visualizadores ou editores de imagem no Linux já identifica o formato do arquivo pelos magic bytes em vez da extensão
Acho que o design dependente de extensão da Microsoft é uma das causas desse problema
Para uma pessoa, isso é algo que dá para fazer em segundos com ferramentas Unix comuns
O ChatGPT padrão agora também consegue executar código em Node.js, Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ e outras linguagens
Não aparece nas notas oficiais de lançamento, mas também foi confirmado em contas gratuitas
Link compartilhado
Fiquei surpreso ao ver itens como “gmail (read-only)”
O app Android do ChatGPT diz que não tem esse tipo de permissão, então fiquei curioso em que contexto o acesso de leitura ao Gmail é possível
No app do iPhone também apareceram recursos gmail. e gcal.
Exemplo compartilhado
Provavelmente é o recurso mencionado neste artigo da Mashable
Parece ser ativado só quando o usuário faz opt-in manualmente
Hoje em dia parece que todas as empresas estão competindo para prender o recurso de tool calling dentro das próprias plataformas
No fim, quando os modelos puderem executar quase todo tipo de trabalho em ambiente local, a discussão sobre sandbox talvez perca relevância
Fico curioso para saber quando vão oferecer um ambiente virtual de desenvolvimento persistente
e ainda acho valioso tentar operar ferramentas de programação com IA ou agentes em um ambiente isolado
A maioria dos desenvolvedores provavelmente vai usar esse tipo de ferramenta de programação especializada em vez da UI web genérica do GPT
Você inicia uma sessão, trabalha e, quando volta um dia depois, o estado do sistema de arquivos continua igual
Imagino que a arquitetura use object storage para reduzir custos
Aliás, o texto de design do Fly sobre Sprites.dev também é interessante
Em vez de hardware local, fica só um cliente leve, enquanto a carga de trabalho real é entregue a empresas como a Microsoft
Pessoalmente, ficar sem ambiente de desenvolvimento local parece um inferno, mas a tendência parece estar indo para esse lado
Esse recurso vai economizar uma quantidade enorme de tempo, ou então criar uma indisponibilidade educacional
A descoberta estilo detetive do Simon é muito legal
Esse tipo de “post de descoberta” é bem mais interessante do que um anúncio oficial
Isso inspira muito mais do que um simples press release
Em breve, parece que o ChatGPT vai conseguir criar um app descartável (single-use app) na hora
A ideia seria gerar um app sandbox na nuvem dentro do navegador para cumprir um objetivo e descartá-lo logo em seguida