ZCode: harness oficial para GLM-5.2

(zcode.z.ai)

1 pontos por GN⁺ 5 시간 전 | 1 comentários | Compartilhar no WhatsApp

ZCode é o harness oficial do GLM-5.2 que busca reunir ferramentas de desenvolvimento e agentes de IA para executar planejamento, programação, revisão e deploy em um único fluxo
O ZCode 3.0 destaca a otimização para GLM-5.2 e melhorias na colaboração com múltiplos agentes, enfatizando a integração com o GLM em tarefas de raciocínio e programação como um todo
O trabalho de exemplo cria do zero um jogo de Gomoku AI baseado em navegador e, após gerar index.html, app.js e styles.css, também passa na verificação com node --check app.js
Os planos são apresentados como Lite US$ 16,2/mês, Pro US$ 64,8/mês e Max US$ 144/mês, e o preço final e os benefícios devem ser verificados em z.ai
Há instaladores para macOS, Windows e Linux, e o Linux aparece como Beta com .deb e AppImage para x64 e ARM64

Harness de desenvolvimento voltado ao GLM-5.2

ZCode é uma ferramenta que combina agentes de IA e ferramentas de desenvolvimento tradicionais para ajudar a conduzir planejamento, programação, revisão e deploy com menos interrupções
O posicionamento do produto é “Simple, Fast, Vibe‑Ready” e ele é apresentado como o harness oficial do GLM-5.2
O ZCode 3.0 foi otimizado para o GLM-5.2, e destaca como principal mudança as melhorias na colaboração com múltiplos agentes

Exemplo de fluxo de trabalho

A lista de tarefas de exemplo inclui gomoku-ai, zcode-website, zcode-desktop e release-bot
gomoku-ai é a tarefa de criar um Gomoku inteligente, ou seja, o jogo de cinco em linha
- O jogador enfrenta um algoritmo inteligente
- O objetivo é realizar jogadas estratégicas e detectar com precisão as condições de vitória
Pelos logs da tarefa, o repositório existente estava vazio ou quase vazio, então o fluxo seguiu com a criação do app do zero
- A execução de git status --short retorna um erro informando que o diretório atual não é um repositório Git
- Em seguida, são criados os arquivos index.html, app.js e styles.css

Resultado da implementação do Gomoku

O exemplo concluído é um jogo de Gomoku independente para navegador
- Renderiza um tabuleiro 15×15
- O jogador pode colocar pedras pretas
- Detecta vitória em quatro direções
- Destaca a linha vencedora
- Rastreia turnos e número de jogadas
- Suporta reinício da partida
A IA escolhe jogadas por um método heurístico, e não aleatório
- Explora jogadas candidatas nas proximidades
- Pontua padrões ofensivos vantajosos para si mesma
- Pontua jogadas defensivas para bloquear ameaças do jogador
- Adiciona preferência pela região central
- Seleciona a jogada mais forte
Opcionalmente, é possível ativar a sobreposição AI focus area para ver os pontos candidatos mais fortes considerados pela IA
Na etapa de validação, node --check app.js é aprovado
A execução interativa no navegador não foi realizada, e a etapa restante é abrir index.html no navegador para jogar

Trabalhos longos e controle externo

O ZCode oferece o recurso Goals para trabalhos de longa duração
- Ele gerencia planejamento contínuo, execução e validação em tarefas complexas
Com o recurso Bot control, é possível iniciar e ajustar o ZCode por WeChat, Feishu e Telegram
A integração com o GLM-5.2 é otimizada para raciocínio, programação e colaboração com múltiplos agentes como um todo

Planos e download

GLM Coding Plan apresenta três planos
- Lite: para tarefas leves, US$ 16,2/mês, com uso básico incluído
- Pro: para trabalho profissional, US$ 64,8/mês, com 5 vezes o uso do Lite incluído
- Max: para uso intenso, US$ 144/mês, com 20 vezes o uso do Lite incluído
Os preços e benefícios dos planos podem mudar, e os detalhes finais devem ser confirmados em z.ai
All Downloads oferece instaladores por plataforma
- macOS: Apple Silicon .dmg v3.2.2, Intel .dmg v3.2.2
- Windows: 64-bit .exe v3.2.2, ARM64 .exe v3.2.2
- Linux: x64 .deb, x64 AppImage, ARM64 .deb e ARM64 AppImage v3.2.2, marcados como Beta

1 comentários

GN⁺ 5 시간 전

Opiniões do Hacker News

Fiquei um pouco surpreso por aparentemente não ser open source. Dá para comparar com o Mimo Code https://github.com/XiaomiMiMo/MiMo-Code. A diferença é que o Mimo é uma CLI, e isto aqui é um app de desktop
- Nem sei o que se deveria fazer com um app de desktop. Essas coisas eu rodo em uma VM headless e, se necessário, permito passar opções como --dangerously-skip-permissions. Mesmo sem essa flag, eu não confiaria nisso no meu desktop/notebook
- O fato de ser CLI é porque extraíram o código de desktop do opencode. O provedor do modelo Go/Zen do opencode também saiu junto
  Meu palpite é que fizeram muita substituição de strings para parecer rapidamente um provedor de primeira classe. Ainda assim, poderiam ter adicionado o opencode de volta como provedor genérico
- Não acho que seja surpreendente. O harness está ficando tão importante quanto o modelo-base. Já houve casos em que só o harness melhorou resultados de benchmark em quase 2x
  Vejo o harness rapidamente se tornando um componente central do próprio “modelo”. Não há nada de estranho em uma empresa que enxergou uma oportunidade de receita manter o harness fechado
- Eles podem estar enviando algumas solicitações de usuários para a Anthropic para coletar dados de transação para o próprio modelo. Se for isso, talvez precisem incluir rastreadores de requisições que queiram esconder
- Se a Anthropic está manifestando fortes preocupações com a destilação do Claude, e se ainda existe a ideia de que o harness é um fosso defensivo, não é tão surpreendente que o outro lado queira evitar expor o quanto está indo bem e qual é sua abordagem
A Z.ai documentou integrações com quase todos os agentes baseados em CLI populares: https://docs.z.ai/devpack/tool/others
Se você já está acostumado com agentes de programação com UI de terminal, não precisa de um agente de desktop. Ainda assim, para quem prefere a abordagem de UI do Codex App/Claude App, é bom que exista
- O atrativo aqui parece ser mais tokens. Pelo que lembro, usando o harness próprio, os limites eram mais generosos
- Estou usando o GLM 5.2 no OpenCode e rodando com o CodeNomad como GUI baseada na web dentro de um contêiner Docker. Posso acessar de qualquer lugar e, exceto pelo modelo de assinatura da Anthropic, todos os modelos rodam bem
- A equipe da Z.ai merece elogios por ter incluído suporte a Linux desde o primeiro dia
Parece bem bonito. Não sei se eu gostaria de usar no lugar do OpenCode. O OpenCode também tem um app de desktop e, pessoalmente, gosto mais da UI de terminal dele. Sinceramente, acho até melhor que a UI de terminal do Claude Code. A versão desktop é mais básica, mas é boa o suficiente: https://opencode.ai/download
Dito isso, é interessante ver que eles estão lançando muita coisa de uma vez, como ZCode, OCR.z.ai, Image.z.ai, Audio.z.ai, AutoClaw etc., todos acessíveis por https://chat.z.ai/. É bastante coisa para uma única organização entregar
Também testei o plano Pro de codificação, e considerando o número de tokens necessários para concluir certas tarefas, a cota não parece absurdamente maior que a do Opus. Ainda assim, o GLM 5.2 em si é bem decente, como um Sonnet mais forte
- A UI de terminal deles é bem pesada em comparação com o Claude Code e trava com frequência
É impressionante como empresas conseguem passar batido usando expressões como “uso base incluído” [1] ou “limites padrão” [2], e então empilham os planos superiores como múltiplos desse “base”, mas não divulgam qual é o valor base
Parece que o valor base é definido conforme a margem de lucro deste mês
[1]: https://zcode.z.ai/en#:~:text=Base%20usage%20allowance%20inc...
[2]: https://support.google.com/gemini/answer/16275805?hl=en#:~:t...
- Ao abrir o app, ele informa o uso base real. Só que os nomes dos planos são diferentes dos da página web
  Plano Start: 5 milhões de tokens por dia (GLM-5.2 3 milhões, GLM-5 Turbo 2 milhões)
  For individuals: cota +150%, US$ 18,00+, cota dedicada do Coding Plan para desenvolvedores individuais
- Isso é realmente péssimo. Tentamos ser o mais transparentes possível e colocamos aqui: https://synthetic.new/rate-limits
- É por isso que gosto da ACCC da Austrália. Se fosse uma empresa australiana, não teriam deixado passar algo assim
- É uma estratégia que pode sair pela culatra. Uma ferramenta imprevisível é pior que uma ferramenta ruim
Como alguém que usa GPT-5.5/Codex todos os dias, estou curioso para saber como GLM-5.2/ZCode se compara em uma base de código que já foi preparada para programação com agentes
- O GLM 5.2 fica em um vale meio ambíguo. É grande demais para rodar em casa e, comparado a modelos de desempenho semelhante, é caro e lento. Há um bom gráfico aqui: https://deepswe.datacurve.ai/
  Isso compara apenas preços de API. Quando você inclui os produtos por assinatura da Anthropic e da OpenAI, não tem comparação. Com a assinatura Codex de US$ 200, é fácil usar até 1 bilhão de tokens por semana no GPT 5.5 high/xhigh
  É interessante do ponto de vista de ser o modelo de pesos abertos com melhor desempenho, mas não parece ter um lugar claro no mercado atual
- Em resumo, o GLM fará as tarefas levarem muito mais tempo e, dependendo da complexidade, pode usar mais tokens também
  Ainda assim, é muito mais barato, então para mim vale a pena. Tenho mais experiência com Claude, mas acho que ele fica quase no mesmo nível do Opus 4.1
Do ponto de vista de UI, parece muito mais próximo do Codex do que do Claude Code. Na prática, é uma cópia exata do Codex
- Concordo totalmente. O ícone de mão, a forma de usar o campo de texto e até o estilo da barra lateral são idênticos, 1:1, ao Codex. O título induz a erro. Não é algo próximo do Claude Code
- Por isso parece ainda mais ridículo manter o Codex fechado. Software já não é mais o fosso defensivo de ninguém. Podiam simplesmente deixar aberto
Fico curioso se há gente usando uma UI de terminal neutra em relação a provedores, ou um harness, que permita trocar de provedor quase sem atrito para trabalho de desenvolvimento
Quero um contexto local do tipo “aqui estão 3 provedores de IA; use este para tarefas de programação, este para escrever prosa e este para geração de imagens”
- https://opencode.ai/
  O OpenCode foi o primeiro harness de agente que usei e continuo gostando dele. Dá para configurar vários provedores, é open source e tem vários contribuidores principais
  Outra opção é o Pi (harness de agente Pi). É uma ótima alternativa leve e oferece suporte a vários provedores. Também dá para usar servidores de modelos locais
- Nos últimos 6 meses usei tanto o Pi quanto o OpenCode e, nesse mesmo período, não abri os harnesses proprietários Claude Code, Codex e Cursor nenhuma vez. Hoje uso o Pi e consigo trocar, no meio da sessão, para qualquer modelo de qualquer provedor que eu queira, de forma transparente. Também posso apontar para um modelo rodando localmente
  Acho que as pessoas não percebem o quanto esse caminho é mais conveniente. Na minha visão, Claude Code e Codex dependem inteiramente de aprisionamento ao fornecedor
- Dá para fazer isso com o role-model, um roteador de modelos que eu criei. Ele roteia com base em papéis, tarefas etc. Há uma extensão para Pi que permite ao agente de programação especificar metadados da solicitação, como papel e capacidades
  https://github.com/try-works/role-model
- Se ainda não experimentou, vale dar uma olhada em https://pi.dev
  Estou usando só o Pi há meses e também estendendo-o: https://a.l3x.in/ai. Uso principalmente GLM-4.7, depois 5.1, e agora 5.2, e quase não tenho mais o que pedir
  Ainda estou refinando um fluxo de trabalho baseado em “Github/Forgejo primeiro”, mas já estou bem satisfeito. A maioria das sessões roda como tarefas de CI/CD e é acionada por comentários "/pi", criando PRs ou enviando commits para PRs: https://github.com/shaftoe/pi-coding-agent-action
- Escrevi uma skill para Codex e Claude Code. A ideia é designar um orquestrador na árvore de trabalho principal e tornar irrelevante que tipo de trabalhador de IA exista em N árvores de trabalho auxiliares
  Como o orquestrador sabe qual cliente de IA está rodando em cada árvore de trabalho, fica bem fácil definir qual tarefa enviar para qual IA
  Executo Claude ou Codex em cada aba de árvore de trabalho. Também há algumas instruções específicas para cada UI de terminal de IA; por exemplo, como o monitoramento do Codex é rudimentar em comparação com o Claude Code, deixei instruções adicionais para o trabalhador Codex vigiar corretamente novos “e-mails”
  Ao trabalhar com o orquestrador na árvore de trabalho principal, faço com que ele delegue tarefas aos trabalhadores e responda a pequenas perguntas. Ele consolida os resultados e, se necessário, também ajuda a limpar o contexto
  O orquestrador e os trabalhadores se comunicam por meio de um sistema de arquivos compartilhado simples em tmp/* e, juntos, conseguem lidar com uma carga de trabalho grande e variada
  Como uso iTerm2, também adicionei um Python específico para iTerm2 que permite ao orquestrador “acordar” trabalhadores, modificando e enviando a entrada, ou fazê-los executar ações bloqueadas pela UI de terminal, como /clear
Gosto dos modelos de pesos abertos chineses que oferecem tokens baratos, mas só os uso em projetos pessoais
A China tem histórico de roubo de propriedade intelectual e segredos comerciais, e os tribunais chineses têm favorecido empresas nacionais. Já os EUA têm tribunais fortes capazes de fazer valer direitos de propriedade intelectual. Se você quiser expor a propriedade intelectual, os segredos comerciais e os dados da sua empresa a riscos por causa de alguns tokens baratos, use os serviços da Z.ai
- Para referência, os modelos da Z.AI também podem ser usados em infraestrutura fora da China
- Os EUA também são assim
A separação entre modelo e ferramenta é tão importante quanto a separação entre Legislativo e Judiciário. Ferramentas ou harnesses que não sejam realmente open source devem simplesmente ser ignorados. Eles vão se infiltrando aos poucos na sua vida e acabam sufocando você com aprisionamento ao fornecedor
Acho difícil confiar em sistemas de agentes chineses de código fechado
Na prática, é uma caixa-preta com permissões totais de usuário, o que equivale a entregar o sistema inteiro a servidores de propriedade chinesa. Usando o OpenCode e o provedor GLM, pelo menos dá para monitorar quais arquivos foram lidos, quais foram editados e quais comandos foram executados
Além disso, a Lei de Segurança Nacional da China obriga legalmente as empresas a cooperarem com os órgãos de inteligência nacional e atividades de contrainteligência [0]. Se você instalou isso em uma workstation corporativa e a empresa for grande o suficiente, a possibilidade de ser monitorado não é apenas um risco, é algo quase certo
[0]: https://en.wikipedia.org/wiki/National_Intelligence_Law_of_t...
- Concordo. Concorrentes dos EUA são igualmente difíceis de confiar. Aqui, acho que open source é a resposta
- Pelo menos os pesos do modelo são públicos. Como não sou americano, isso é muito mais confiável para mim em todos os aspectos possíveis
  Você fala como se as agências de inteligência dos EUA estivessem do lado do bem, mas, pelo menos para mim, isso definitivamente não é verdade
- Provedores dos EUA são exatamente iguais
- É só executar em um contêiner sob o Opencode. Funciona muito bem, e eu até fiz upgrade para o plano Pro (cerca de US$ 60/mês). Se quiser usar em contêiner, há informações no projeto no meu perfil. Esse código é todo open source, e eu o criei porque precisava dele para o meu trabalho. Deve haver inúmeras outras maneiras também
  Mas, independentemente do país em que a empresa esteja, sou fortemente contra executar qualquer agente em bare metal. No meu artigo, trato esse ponto de forma direta e repetida
  Recentemente, alguém me questionou sobre por que eu executaria um software com poucas estrelas, mas não tenho muito a dizer sobre esse tipo de lógica. Já projetei e construí sistemas que atenderam dezenas de milhares de usuários. Não estou brincando. A forma como eu faço as coisas não é comum e não recomendo que outros a sigam, mas funciona bem para mim e combina com meu modo de pensar ao lidar com sistemas complexos
  Você é livre para usar ou não, mas, se for implicar sem uma base adequada, precisa estar pronto para receber resposta. Cometi muitos erros ao longo da carreira, e acho que assumir responsabilidade é importante para crescer. Se alguém trouxer críticas válidas e substanciais, fico feliz em trabalhar junto para que usem meu código
- É por isso que gosto de usar Reasonix com o Deepseek. Quando acerta o cache, a solicitação fica praticamente gratuita, e esse caminho também passa por provedores americanos sem subsídios, como Digital Ocean ou Cloudflare

ZCode: harness oficial para GLM-5.2

Harness de desenvolvimento voltado ao GLM-5.2

Exemplo de fluxo de trabalho

Resultado da implementação do Gomoku

Trabalhos longos e controle externo

Planos e download

Leituras relacionadas

1 comentários

Opiniões do Hacker News