Lançamento do GLM 5.2
(twitter.com/jietang)- O GLM-5.2 é um modelo open source com contexto de 1M utilizável na prática e suporte à execução independente de tarefas de longo prazo, oferecendo uma base para a construção de aplicações de agente complexas
- Em situações em que o acesso a modelos de fronteira é subitamente bloqueado por motivos não técnicos, a ciência deve ser global e o caminho até a AGI não deve ficar preso atrás de barreiras elevadas
- A AGI não deve ser um privilégio monopolizado por regras de poucos e que possa ser retirado a qualquer momento, mas sim uma base compartilhada para a humanidade explorar em conjunto os limites da inteligência e resolver tarefas complexas
- O GLM-5.2 é o modelo open source mais poderoso da Zhipu até agora e continua atuando como motor principal para criar o modelo de código mais forte do país
- Será disponibilizado primeiro para usuários Lite / Pro / Max do GLM Coding Plan, e a API será aberta na próxima semana, aproximando mais um passo o acesso à inteligência de fronteira
Mensagens principais
- A restrição repentina de determinados modelos de fronteira é apresentada como algo profundamente lamentável, e, justamente quando o acesso é interrompido por motivos não técnicos, reforça-se a posição de que a ciência deve ser global
- O caminho até a AGI não deve ser cercado por barreiras elevadas, e a AGI deve ser a pedra fundamental para que a humanidade explore junta os limites da inteligência e resolva desafios complexos
- A AGI não deve ser um privilégio monopolizado por regras de poucos e que possa ser retirado a qualquer momento; diante de bloqueios e restrições externas, é necessária uma abertura radical
- A inteligência de fronteira deve permanecer open source, acessível e passível de construção, devendo ser oferecida a todos os desenvolvedores dedicados
Divulgação do GLM-5.2 e cronograma de uso
- O GLM-5.2 é o modelo open source mais poderoso já divulgado pela Zhipu até agora
- Este modelo oferece suporte a uma janela de contexto de 1M utilizável na prática e mantém vantagem consistente na conclusão autônoma de tarefas de longo prazo
- Ele fornece uma base sólida para criar aplicações de agente complexas e continua atuando como motor principal para desenvolver o modelo de código mais forte do país
- O GLM-5.2 será oficialmente disponibilizado às 5:21 para os usuários do GLM Coding Plan, incluindo todos os usuários Lite / Pro / Max
- A API está prevista para ser divulgada na próxima semana, e a ModelKey é
GLM-5.2
1 comentários
Comentários do Hacker News
Segundo o anúncio do fundador da Z.ai, o GLM-5.2 é um modelo “totalmente aberto”, e a inteligência de ponta deveria estar aberta a todos, em um momento em que o acesso a alguns modelos de fronteira está sendo repentinamente restringido por motivos não técnicos
O GLM-5.2 é o modelo open source mais forte da Zhipu até agora, e destaca uma janela de contexto de 1M realmente utilizável e a capacidade de executar tarefas longas de forma independente
Foi dito que ele será disponibilizado primeiro para usuários do GLM Coding Plan Lite / Pro / Max, e que a API deve ser aberta na próxima semana
https://x.com/jietang/status/2065784751345287314
Parece ser diferente de outros modelos chineses com pesos abertos, como o Qwen
Ainda não parece haver um post oficial no blog com resultados de benchmark, mas dá para sentir novamente gratidão pelo fato de laboratórios chineses de IA divulgarem esse tipo de trabalho e contribuírem com o mundo sob uma licença permissiva
O caso do Fable mostra mais uma vez o quanto esses modelos abertos são valiosos
Mesmo assim, é bastante impressionante e plenamente utilizável
Em arquitetura ou problemas complexos ele parece visivelmente mais fraco, mas provavelmente não era isso que muita gente esperava
Especialmente em design e interface de usuário, parece ir além do que seu porte sugeriria, embora isso possa ser gosto pessoal
Nos últimos dias, laboratórios chineses lançaram MiniMaxM3, KimiK2.7 e GLM5.2, enquanto isso os EUA estão censurando modelos
Parece quase ficção
No caso atual da Anthropic, até dá para dizer que os EUA estão censurando modelos, mas parece combinar mais com a corrupção, retaliação, extorsão e incompetência geral do governo Trump
Pelo visto não é a biblioteca C++ OpenGL Mathematics que eu estava esperando
Vendo a ação mais recente do governo dos EUA no caso Fable, essa tendência parece cada vez mais o futuro
Não dá para depender de um produto estratégico quando um agente volúvel pode simplesmente trancar a porta
Modelos com pesos abertos são, por natureza, quase imunes a esse tipo de situação
O governo dos EUA pode tornar ilegal negociar, baixar ou usar modelos estrangeiros com pesos abertos
Seria difícil aplicar isso contra indivíduos, mas as empresas basicamente obedeceriam, e se vier em forma de sanções, pode até acabar removido de hospedagens baseadas nos EUA, como o GitHub
Além disso, já estamos avançando rapidamente para um nível assustador de vigilância em massa, o que também pode ajudar na aplicação
A situação do Fable está criando um precedente muito perigoso, e tenho medo do futuro porque parece que estamos perdendo a luta pela liberdade de informação e de computação
É a Anthropic que está incentivando esse absurdo
Ela piora a qualidade dos resultados sem avisar e recusa pedidos em nome da “segurança”
Mesmo que o governo não tivesse mandado tirar o modelo do ar para estrangeiros, a própria Anthropic já seria um problema sério
A divulgação aconteceu exatamente no mesmo horário, 17h21 no horário da China, em que a Anthropic recebeu do governo a carta proibindo o Fable, e menciona explicitamente a situação em que outros modelos ficam indisponíveis
Parece bem estranho
Será que não editaram a postagem depois?
Esse lançamento parece ter sido antecipado às pressas para aproveitar o drama do Mythos
Algo na linha de “que pena que você não pode usar o Fable, então experimente o nosso durante o fim de semana”, e talvez o plano original fosse lançar só na semana que vem, por isso os benchmarks ainda não parecem prontos
Estou esperando o lançamento do 5.2 flash
Já faz um tempo, mas ainda acho o 4.7 flash um dos modelos locais de coding mais fortes
Entre os modelos locais, o Qwen-3.5 ainda é o melhor
O 3.6 passa um pouco de 24 GB de uso de VRAM, e a partir daí já deixa de ser algo para GPU de consumidor
Queria que escrevessem um post no blog cobrindo a capacidade do novo modelo, o que dá para esperar dele, se é mais barato, mais rápido, se a qualidade de saída é melhor etc.
Mesmo assim, agradeço por terem lançado
Queria saber de quanto recurso computacional ele realmente precisa e os requisitos em suas várias formas
Também gostaria de saber se otimizações do Google, como TurboQuant e MTP, ou inovações próprias, conseguiram tornar a qualidade de fronteira realisticamente acessível para usuários locais
Não é um modelo local em nenhum sentido razoável, mas como é um modelo aberto, quando os pesos saírem daqui a uma semana provavelmente vão aparecer vários provedores terceirizados de inferência competindo no preço por token
Não existe modelo local que funcione de forma eficaz em hardware de consumidor, e quem diz isso está mentindo ou delirando