1 pontos por recast7838 4 시간 전 | 1 comentários | Compartilhar no WhatsApp

A Moonshot AI lançou o 'Kimi K2.7-Code', um modelo de código de pesos abertos centrado em agentes que melhora significativamente o desempenho de programação em relação ao modelo anterior e reduz o consumo de tokens de raciocínio em 30%.


Tradução completa

Nesta semana, a Moonshot AI lançou o Kimi K2.7-Code, um modelo centrado em agentes especializado em programação. Os pesos do modelo são distribuídos no Hugging Face sob uma licença MIT modificada. Ele também pode ser usado pela Kimi API e pelo Kimi Code. O K2.7-Code foi projetado para tarefas de engenharia de software de longo prazo, e não para conversas gerais. O modelo planeja em várias etapas, modifica código, executa ferramentas e faz depuração. A Moonshot AI o oferece em conjunto com sua plataforma de programação por assinatura.

Especificações do Kimi K2.7-Code

O K2.7-Code é um modelo MoE (Mixture-of-Experts). Ele possui 1 trilhão (1T) de parâmetros no total, com 32 bilhões (32B) de parâmetros ativados por token. Essa arquitetura usa 8 especialistas selecionados por token entre 384 especialistas no total, com 1 especialista compartilhado. O modelo é composto por 61 camadas no total, incluindo 1 camada densa.

O mecanismo de atenção usa MLA, e o caminho feedforward aplica SwiGLU. O codificador de visão MoonViT adiciona 400 milhões (400M) de parâmetros para entradas de imagem e vídeo. O modelo é fornecido com quantização INT4 nativa. A janela de contexto é de 256K tokens (262.144). Há duas limitações. O modo de pensamento (Thinking mode) é obrigatório, e desativá-lo retorna um erro de API. Os parâmetros de amostragem são fixos em temperatura 1.0, top_p 0.95, n 1 e penalidade 0.0. A saída máxima padrão é de 32.768 tokens. Ele pode ser hospedado localmente usando vLLM, SGLang e KTransformers. O repositório no Hugging Face é muito grande, com cerca de 595GB em disco. O alvo não é um modelo para notebook, mas uma implantação de nível servidor.

Pontuações de benchmark

A equipe da Moonshot publicou resultados de 6 benchmarks. Eles compararam o K2.7-Code com o K2.6, GPT-5.5 e Claude Opus 4.8. O K2.7-Code superou o K2.6 em todos os itens. O maior avanço na área de programação apareceu no Kimi Code Bench v2, subindo de 50,9% para 62,0%.

O K2.7-Code registrou 81,1% no benchmark MCP Mark Verified, superando os 76,4% do Opus 4.8. Ele também apresentou números próximos aos do GPT-5.5 no MLS Bench Lite. O K2.7-Code foi executado no Kimi Code CLI, enquanto o GPT-5.5 foi testado com Codex xhigh e o Opus 4.8 no ambiente Claude Code xhigh.

1 comentários

 
cnaa97 1 시간 전

Realmente impressionante