1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • O GLM-5.2 é um modelo open source com contexto de 1M utilizável na prática e suporte à execução independente de tarefas de longo prazo, oferecendo uma base para a construção de aplicações de agente complexas
  • Em situações em que o acesso a modelos de fronteira é subitamente bloqueado por motivos não técnicos, a ciência deve ser global e o caminho até a AGI não deve ficar preso atrás de barreiras elevadas
  • A AGI não deve ser um privilégio monopolizado por regras de poucos e que possa ser retirado a qualquer momento, mas sim uma base compartilhada para a humanidade explorar em conjunto os limites da inteligência e resolver tarefas complexas
  • O GLM-5.2 é o modelo open source mais poderoso da Zhipu até agora e continua atuando como motor principal para criar o modelo de código mais forte do país
  • Será disponibilizado primeiro para usuários Lite / Pro / Max do GLM Coding Plan, e a API será aberta na próxima semana, aproximando mais um passo o acesso à inteligência de fronteira

Mensagens principais

  • A restrição repentina de determinados modelos de fronteira é apresentada como algo profundamente lamentável, e, justamente quando o acesso é interrompido por motivos não técnicos, reforça-se a posição de que a ciência deve ser global
  • O caminho até a AGI não deve ser cercado por barreiras elevadas, e a AGI deve ser a pedra fundamental para que a humanidade explore junta os limites da inteligência e resolva desafios complexos
  • A AGI não deve ser um privilégio monopolizado por regras de poucos e que possa ser retirado a qualquer momento; diante de bloqueios e restrições externas, é necessária uma abertura radical
  • A inteligência de fronteira deve permanecer open source, acessível e passível de construção, devendo ser oferecida a todos os desenvolvedores dedicados

Divulgação do GLM-5.2 e cronograma de uso

  • O GLM-5.2 é o modelo open source mais poderoso já divulgado pela Zhipu até agora
  • Este modelo oferece suporte a uma janela de contexto de 1M utilizável na prática e mantém vantagem consistente na conclusão autônoma de tarefas de longo prazo
  • Ele fornece uma base sólida para criar aplicações de agente complexas e continua atuando como motor principal para desenvolver o modelo de código mais forte do país
  • O GLM-5.2 será oficialmente disponibilizado às 5:21 para os usuários do GLM Coding Plan, incluindo todos os usuários Lite / Pro / Max
  • A API está prevista para ser divulgada na próxima semana, e a ModelKey é GLM-5.2

1 comentários

 
GN⁺ 4 시간 전
Comentários do Hacker News
  • Segundo o anúncio do fundador da Z.ai, o GLM-5.2 é um modelo “totalmente aberto”, e a inteligência de ponta deveria estar aberta a todos, em um momento em que o acesso a alguns modelos de fronteira está sendo repentinamente restringido por motivos não técnicos
    O GLM-5.2 é o modelo open source mais forte da Zhipu até agora, e destaca uma janela de contexto de 1M realmente utilizável e a capacidade de executar tarefas longas de forma independente
    Foi dito que ele será disponibilizado primeiro para usuários do GLM Coding Plan Lite / Pro / Max, e que a API deve ser aberta na próxima semana
    https://x.com/jietang/status/2065784751345287314

    • Uma coisa boa do GLM é que, ao usá-lo no OpenRouter, dá para filtrar por provedores baseados nos EUA e pela condição de sem retenção de dados
      Parece ser diferente de outros modelos chineses com pesos abertos, como o Qwen
    • Fico curioso se “GLM-5.2 is Fully Open” quer dizer apenas pesos abertos, ou se também significa que o código-fonte e os dados serão divulgados
  • Ainda não parece haver um post oficial no blog com resultados de benchmark, mas dá para sentir novamente gratidão pelo fato de laboratórios chineses de IA divulgarem esse tipo de trabalho e contribuírem com o mundo sob uma licença permissiva
    O caso do Fable mostra mais uma vez o quanto esses modelos abertos são valiosos

    • A primeira impressão é que ele parece estar cerca de 6 meses atrás dos laboratórios de fronteira, algo parecido com o Opus de janeiro
      Mesmo assim, é bastante impressionante e plenamente utilizável
      Em arquitetura ou problemas complexos ele parece visivelmente mais fraco, mas provavelmente não era isso que muita gente esperava
      Especialmente em design e interface de usuário, parece ir além do que seu porte sugeriria, embora isso possa ser gosto pessoal
    • Lançar um modelo sem benchmarks parece um sinal de que o modelo provavelmente não é lá grande coisa
  • Nos últimos dias, laboratórios chineses lançaram MiniMaxM3, KimiK2.7 e GLM5.2, enquanto isso os EUA estão censurando modelos
    Parece quase ficção

    • Queria saber como o kimi2.7 se compara ao GLM5.2
    • Os modelos chineses também são censurados
      No caso atual da Anthropic, até dá para dizer que os EUA estão censurando modelos, mas parece combinar mais com a corrupção, retaliação, extorsão e incompetência geral do governo Trump
  • Pelo visto não é a biblioteca C++ OpenGL Mathematics que eu estava esperando

  • Vendo a ação mais recente do governo dos EUA no caso Fable, essa tendência parece cada vez mais o futuro
    Não dá para depender de um produto estratégico quando um agente volúvel pode simplesmente trancar a porta
    Modelos com pesos abertos são, por natureza, quase imunes a esse tipo de situação

    • Isso está certo só até certo ponto
      O governo dos EUA pode tornar ilegal negociar, baixar ou usar modelos estrangeiros com pesos abertos
      Seria difícil aplicar isso contra indivíduos, mas as empresas basicamente obedeceriam, e se vier em forma de sanções, pode até acabar removido de hospedagens baseadas nos EUA, como o GitHub
      Além disso, já estamos avançando rapidamente para um nível assustador de vigilância em massa, o que também pode ajudar na aplicação
      A situação do Fable está criando um precedente muito perigoso, e tenho medo do futuro porque parece que estamos perdendo a luta pela liberdade de informação e de computação
    • É bem provável que a China também feche tudo quando estiver no mesmo nível ou à frente
    • Criticar o governo provavelmente é justo, mas a Anthropic não pode sair ilesa
      É a Anthropic que está incentivando esse absurdo
      Ela piora a qualidade dos resultados sem avisar e recusa pedidos em nome da “segurança”
      Mesmo que o governo não tivesse mandado tirar o modelo do ar para estrangeiros, a própria Anthropic já seria um problema sério
  • A divulgação aconteceu exatamente no mesmo horário, 17h21 no horário da China, em que a Anthropic recebeu do governo a carta proibindo o Fable, e menciona explicitamente a situação em que outros modelos ficam indisponíveis

    • Sério mesmo? Não tenho certeza sobre o fuso horário
      Parece bem estranho
      Será que não editaram a postagem depois?
  • Esse lançamento parece ter sido antecipado às pressas para aproveitar o drama do Mythos
    Algo na linha de “que pena que você não pode usar o Fable, então experimente o nosso durante o fim de semana”, e talvez o plano original fosse lançar só na semana que vem, por isso os benchmarks ainda não parecem prontos

  • Estou esperando o lançamento do 5.2 flash
    Já faz um tempo, mas ainda acho o 4.7 flash um dos modelos locais de coding mais fortes

    • Acho que vi alguém dizer que não vai ter flash
    • Sério? O 4.7-flash foi bem horrível para mim
      Entre os modelos locais, o Qwen-3.5 ainda é o melhor
      O 3.6 passa um pouco de 24 GB de uso de VRAM, e a partir daí já deixa de ser algo para GPU de consumidor
  • Queria que escrevessem um post no blog cobrindo a capacidade do novo modelo, o que dá para esperar dele, se é mais barato, mais rápido, se a qualidade de saída é melhor etc.
    Mesmo assim, agradeço por terem lançado

    • Talvez seja melhor esperar até segunda-feira
  • Queria saber de quanto recurso computacional ele realmente precisa e os requisitos em suas várias formas
    Também gostaria de saber se otimizações do Google, como TurboQuant e MTP, ou inovações próprias, conseguiram tornar a qualidade de fronteira realisticamente acessível para usuários locais

    • A série GLM-5 é 744B-A40B
      Não é um modelo local em nenhum sentido razoável, mas como é um modelo aberto, quando os pesos saírem daqui a uma semana provavelmente vão aparecer vários provedores terceirizados de inferência competindo no preço por token
    • Se você gastar 80 mil dólares em hardware, dá para rodar
      Não existe modelo local que funcione de forma eficaz em hardware de consumidor, e quem diz isso está mentindo ou delirando