1 pontos por GN⁺ 22 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Kimi K2.7 Code foi adicionado ao GitHub Copilot, tornando-se o primeiro modelo de pesos abertos disponível para seleção no seletor de modelos
  • Hospedado pelo GitHub no Microsoft Azure, oferece mais opções de modelos e alternativas de menor custo para fluxos de trabalho de codificação
  • A cobrança é aplicada com base no preço de tabela do provedor dentro do modelo de cobrança por uso; os custos reais devem ser verificados na documentação de preços de modelos e solicitações do Copilot
  • Será distribuído gradualmente a partir dos planos Copilot Pro, Pro+ e Max, e estará disponível no seletor de modelos do Visual Studio Code
  • No Copilot Business e Enterprise, o padrão é ficar desativado, portanto, antes do uso pela organização, é necessário que um administrador habilite a política e revise segurança, compliance e governança de dados

Primeiro modelo de pesos abertos adicionado ao Copilot

  • Kimi K2.7 Code é um modelo de pesos abertos disponibilizado oficialmente no GitHub Copilot
  • Foi adicionado como o primeiro modelo de pesos abertos selecionável no seletor de modelos do Copilot
  • Oferece mais opções de modelos e alternativas de menor custo em fluxos de trabalho de codificação
  • O GitHub hospeda o modelo no Microsoft Azure

Cobrança por uso

Disponibilidade dentro do Copilot

  • O Kimi K2.7 Code será distribuído primeiro, de forma gradual, para os planos Copilot Pro, Pro+ e Max
  • Os usuários podem escolher esse modelo no seletor de modelos do Visual Studio Code
  • A distribuição ocorrerá em etapas, e o GitHub continuará monitorando a qualidade e o desempenho do modelo
  • Nas próximas semanas, a disponibilidade será expandida para Copilot Business, Enterprise e outras interfaces de uso

Clientes e interfaces compatíveis

  • O seletor de modelos está disponível nos seguintes ambientes
    • Visual Studio Code 1.127.0 ou superior
    • Visual Studio 17.14.6 ou superior
    • Copilot CLI
    • GitHub Copilot cloud agent
    • GitHub Copilot App
    • github.com
    • GitHub Mobile para iOS e Android
    • JetBrains 1.9.1-251 ou superior
    • Xcode
    • Eclipse

Configurações de administrador para Business e Enterprise

  • O Kimi K2.7 Code vem desativado por padrão no Copilot Business e no Copilot Enterprise
  • Para que membros da organização possam selecionar o modelo, um administrador do plano deve habilitar a política do Kimi K2.7 Code nas configurações do Copilot
  • Se a política permanecer desativada, o modelo não poderá ser usado nessa organização
  • Recomenda-se que os administradores verifiquem, antes da ativação, se o modelo de pesos abertos atende aos seus próprios requisitos de segurança, compliance e governança de dados

Documentação e canais de feedback

1 comentários

 
Opiniões do Hacker News
  • Já perdi quase todo o interesse em produtos de IA baseados na nuvem
    Estou cansado de ver recursos e fluxos de trabalho legais que eu esperava um dia usar se tornarem inviáveis por tantos motivos diferentes: aumento de preços, sensação de queda de desempenho, encerramento de serviços, substituições etc.
    Montei um equipamento pequeno e praticamente me estabeleci no Qwen3.6, e estou adicionando aos poucos, por conta própria, os recursos de que preciso. Não sei se está no nível de competir com o Claude, e também parei de verificar. Ele já me entrega muito valor e continua melhorando, e gosto do fato de que, mesmo que a grama possa ser mais verde em algum lugar, ela não muda debaixo dos meus pés.

    • Fico feliz que este seja o comentário mais votado. Eu também uso tudo totalmente local
      Quero deixar registrado que, para quem não tem memória suficiente para rodar modelos grandes na faixa de 32 GB, os modelos podados também têm desempenho bem bom. Se você tem uma máquina pequena, vale experimentar o modelo quantizado Q4 pruned unsloth do GLM 4.7 Flash, que cabe em 14 GB: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
      Normalmente uso o LM Studio para esse tipo de coisa, mas a unsloth também tem seu próprio app de estúdio, que pode se ajustar melhor a esses modelos quantizados. Usei o GLM 4.7 Flash como modelo principal por alguns meses; ele foi muito persistente e muito rápido, e parece uma boa opção para hardware limitado.
    • O Qwen3.6-35B-A3B-UD-Q4_K_M roda na minha velha 1060 a cerca de 11 tokens por segundo. É realmente absurdo termos chegado até aqui.
    • Hoje em dia, a evolução da IA me parece, em grande parte, empurrar diferenças de ajuste fino
      Por exemplo, o novo Claude foi ajustado para coding agentic e pode até ser prejudicial para coding não agentic; o Fable 5 parece bom, mas o custo de inferência é alto, e há grande chance de queda de desempenho ou mudanças de limites e preços depois do lançamento. O Gemini 3.5 tem limites mais generosos, mas o desempenho é um pouco inferior.
      Novas versões saem e os números sobem, mas fico me perguntando se todas as mudanças são realmente avanços ou se é só uma tunagem diferente em uma performance por dólar parecida com a do início do ano. As mudanças reais aparecem mais em modelos pequenos como Qwen ou Gemma 4 31B, e, considerando especialmente a capacidade multilíngue, é algo bem mágico.
      Acabei de ver, enquanto postava, uma comparação antes/depois do Fable: na versão reintroduzida, como ainda estão mexendo no modelo, o desempenho no BridgeBench despencou de forma desastrosa: https://x.com/Hesamation/status/2072692225100612032
    • Parece bem atraente, mas que configuração de Mac mini seria necessária para fazer algo desse nível?
    • Também coloquei o Qwen3.6 em um MBP antigo e estou usando com satisfação
      Não é tão rápido quanto o Claude que uso no trabalho, mas roda suficientemente bem localmente, e não preciso me preocupar com coisas como créditos ou recursos desaparecendo de repente.
  • Gosto muito do Copilot CLI. Ele me parece mais lógico e com menos atrito que o Claude Code
    Também gosto de poder alternar livremente entre vários modelos. Por exemplo: “planejar com o Opus 4.6, validar esse plano e receber feedback com o GPT 5.4, depois implementar com o Sonnet 4.6”.
    Mas, por causa da mudança de preços do Copilot em junho, tanto eu pessoalmente quanto todo o departamento da empresa tivemos que migrar para o Claude Code. Em abril e maio, eu passava um pouco dos créditos incluídos e gastava alguns dólares a mais; a partir de junho, o orçamento mensal passou a acabar a cada 2 ou 3 dias.
    Do ponto de vista do cliente, foi um aumento de preço completamente insano, e não faço ideia do que a Microsoft estava pensando. Mesmo que esse fosse o preço necessário para a sustentabilidade, eles deveriam ter esperado até que os concorrentes mudassem seus preços primeiro. Eu não ficaria surpreso se eles tivessem perdido mais de 50% dos clientes do Copilot no mês passado.
    Se, no fim, todos os grandes players convergirem para esse nível de preço, talvez o Estado precise operar uma IA de acesso público, como faz com a TV. Algo como usar modelos abertos gratuitos e manter alguns datacenters com dinheiro de impostos, com restrições regionais e throttling rigoroso, mas liberando o uso para estudantes e cidadãos.
    Se, daqui a alguns anos, todos os preços de IA ficarem no nível do Copilot, só empresas unicórnio conseguirão usar, e o restante não terá chance de competir com empresas que usam IA.

    • Você disse que eles deveriam ter esperado até os concorrentes mudarem os preços, mas, na prática, isso já aconteceu
      Literalmente é repasse de custos: https://platform.claude.com/docs/en/about-claude/pricing
      A Anthropic também oferece assinatura, mas empresas geralmente não querem usar isso. Porque o conteúdo enviado por esse caminho pode ser usado no treinamento ou virar parte do modelo.
      Se você usar sem autorização explícita do empregador, pode estar violando o contrato e, se houver um processo, as consequências podem ser graves.
    • O aumento de preços foi insano. A empresa do meu trabalho principal também está migrando do Copilot para assinaturas do Claude Code
      Ao mesmo tempo, estamos testando AWS Bedrock e Deepinfra para modelos com pesos abertos, nos preparando para quando o Claude Code inevitavelmente deixar de ser um bom negócio por passar a refletir o custo real dos tokens.
    • Pela primeira vez em meses, esgotei meus créditos do Claude no trabalho e voltei para o Copilot; surpreendentemente, foi ok
      O Claude está muito à frente em termos de ferramentas, mas a definição de modelo por subagente e o acesso a todos os modelos são recursos melhores do que tudo que o Claude oferece hoje somado.
      Na empresa, o único limite para a quantidade de IA que posso consumir em um mês é dinheiro, então aquilo que reduz custo é, para mim, o melhor modelo e ambiente de execução. O Copilot também era melhor em atribuir automaticamente modelos mais adequados aos subagentes, enquanto o Claude frequentemente usa modelos mais caros.
    • Pergunta sincera: você poderia explicar melhor em que pontos sente que o Copilot CLI é melhor que o Claude Code? Quando tenho escolha, uso o OpenCode, mas fiquei curioso para saber o que faz você preferir o Copilot CLI.
    • Deixar o modelo ser escolhido automaticamente já não é mais sustentável
      Ainda assim, existem modelos eficientes capazes de executar planos criados por modelos melhores. É meio constrangedor pensar que a seleção automática de modelos da Microsoft, naquela estrutura de preços antiga e deficitária, escolhia modelos de raciocínio de ponta para tarefas como resolver conflitos de dependência.
  • Usei o GitHub Copilot no desenvolvimento do VS 2026, alternando entre ChatGPT e Claude, e isso foi antes de eu conhecer o Claude Code e o app Codex
    O Copilot era bom o bastante para o meu uso, e US$ 10 por mês bastavam
    Mas, quando o novo modelo de preços foi introduzido no mês passado, os US$ 10 acabaram em poucos dias. Eu sei que o preço antigo não era sustentável, mas isso me fez migrar para o Claude Code e o Codex, e não olhei para trás. Os tokens do Claude Code e do Codex também têm preços bastante subsidiados, mas é só aproveitar enquanto a coisa boa durar
    Dá para sentir uma diferença entre usar o Claude via Copilot e usar o Claude diretamente no Claude Code. Não sei o que a Microsoft está fazendo por trás

    • O ambiente de execução é muito importante. As ferramentas disponíveis e o prompt de sistema variam conforme o ambiente de execução
      A Anthropic está um pouco à frente tanto no ambiente de execução quanto no modelo, então tem o melhor dos dois mundos
      Do lado da Microsoft, provavelmente é o mesmo modelo, mas as ferramentas ao redor e os prompts parecem piores, então os resultados também acabam piores
    • Foi parecido quando deixei o Copilot dentro do Zed
      Agora estou usando o ambiente de execução reasonix para DeepSeek, e quando há acerto de cache o custo fica quase gratuito. Mesmo usando provedores dos EUA sem subsídio, como Digital Ocean ou Cloudflare
    • Eu também migrei para o Cursor. Depois que expliquei como chamar o msbuild, ele edita por conta própria mesmo sem um plugin nativo do Visual Studio
      A linguagem-alvo é C++ e não há problema
    • Nas últimas semanas, o custo do GitHub Copilot cresceu bastante; algo que antes custava US$ 100 agora exige US$ 300
      Gosto da forma de usar o Claude no VS Code via Copilot, e sinto que ele entrega código melhor porque consigo controlar melhor a qualidade do código. É muito mais transparente do que o Claude Code, é open source, e a interface de IDE dá mais recursos de controle de contexto e de artefatos gerados
      O aumento de custo não se deve apenas ao reajuste de preço; também há o efeito de o agente do modelo Opus usar mais tokens. Por isso migrei para o Claude Code e ainda estou usando o Opus 4.6 com satisfação. Fable e 4.7 fazem tarefas em unidades maiores, mas desviam com mais frequência e inventam suposições, deixando o resultado bagunçado
    • Com o Claude 4.8 Opus, a cota do Copilot provavelmente acabou em apenas 2 ou 3 prompts. Eu esperava que fosse ruim, mas não tanto. Foi bom enquanto durou
  • Finalmente apareceu uma alternativa de grande fornecedor que empresas podem usar
    As pessoas queriam uma forma de executar modelos chineses por meio de um provedor confiável, e o GitHub está oferecendo isso
    Se acreditarmos nos benchmarks, o desempenho fica no nível do Sonnet 4.6. Resta ver se vale a pena pelo preço do GitHub

    • Como a Microsoft mudou para cobrança baseada em tokens, precisa oferecer opções mais baratas
      O GPT-5.4 era 1x para assinantes anuais, mas agora virou 6x. As requisições premium acabam em poucos prompts. O GitHub Copilot de US$ 10 por mês antes era o melhor custo-benefício, porque permitia usar modelos de laboratórios de IA dos EUA por pouco dinheiro
    • Não acredito em benchmarks. Testei o Kimi K2.7 várias vezes e fiquei decepcionado
      Ele ficou dando voltas em algo que o Claude resolveria de uma vez. Dito isso, meu caminho de uso foi o Ollama Cloud, e não sei se eles oferecem o modelo real ou uma versão quantizada; a quantização pode ter prejudicado o desempenho
      Ainda assim, a boa notícia é que isso cria um precedente. Se a Microsoft agora oferece o Kimi K2.7, em breve também pode oferecer o GLM 5.2, que é de fato um modelo muito competitivo
    • Talvez eu seja chamado de marqueteiro de novo, mas é relevante, então não me importo
      A Synthetic opera seus próprios modelos a preços razoáveis, incluindo GLM5.2 e Kimi K2.7-Code
      Link de indicação: https://synthetic.new/?referral=kwjqga9QYoUgpZV
  • Entrada: US$ 0,95, acerto de cache: US$ 0,19, saída: US$ 4,00
    É o mesmo preço que a Moonshot cobra e fica mais ou menos na faixa do GPT 5.4 mini, então não é uma opção ruim
    Como exemplo de um prompt idiota que desperdiça tokens com contexto: “Jogue jogo da velha sozinho em um tabuleiro 5x5. Você vence ao colocar 5 em linha.”
    No Kimi K2.7, custa US$ 0,006 e é possível ver todo o rastro bruto de raciocínio. No GPT-5.4 mini, custa US$ 0,016 e vem resumido
    Se estiver curioso, os dois jogam de um jeito inacreditavelmente burro
    Kimi:

    A B C D E
    1 . . . . .
    2 . . . . .
    3 X X X X X
    4 . O O O O
    5 . . . . .

    GPT 5.4 mini:

    1: X X X X X
    2: O O . . .
    3: . . O . .
    4: . . . O .
    5: . . . . O

    • Para referência, a quem tiver curiosidade: o GPT 5.5 também joga o mesmo lixo que o 5.4 mini, mas custa 4 vezes mais
      O Fable produz uma partida plausível por 40 centavos

      X X O O O
      O O X X X
      X X X O O
      X O O X O
      X O X X O

    • Boa ideia. Testei pedir a mesma coisa ao Haiku no Claude Chat do iOS, e ele criou um jogo interativo em React, implementou as regras e então me fez jogar
      Entrada a US$ 1, saída a US$ 5; jogada inteligente, Anthropic!

    • Grandes modelos de linguagem são fracos em jogos, mas é perfeitamente possível escrever um agente de aprendizado por reforço que aprenda o jogo em si

    • Se eu ficar extremamente entediado, penso em fazer dois modelos jogarem xadrez um contra o outro
      Imagino que já exista algum benchmark de xadrez ou torneio de grandes modelos de linguagem por aí

  • É estranho que o AWS Bedrock ofereça suporte tão fraco a modelos desse tipo
    Só há Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 e similares, sem modelos mais recentes

  • O custo de execução é claramente muito mais barato do que o de outros modelos, e usei por cerca de uma hora ontem; os resultados pareceram promissores
    Vi em uma discussão no Reddit que a equipe está avaliando o glm5.2, então espero que adicionem mais modelos

  • Será que o GitHub Copilot está na melhor posição como plataforma para empresas?
    Ele oferece suporte a Claude, GPT, Gemini e agora até a modelos com pesos abertos. Organizações grandes acabam pagando algo no nível de tarifas de API de qualquer forma, então o custo é parecido onde quer que usem
    Tem uma CLI e um SDK de agentes bastante bons, e agora também tem app de desktop. Há agentes hospedados e também é possível executar “Agentic Workflows” no CI
    Será que a reputação caiu tanto que só as alternativas chamam atenção? Ou usuários fora de empresas acabam afastados pelo custo de uso, impedindo o marketing gratuito?

    • O rug pull de mudar os preços sem aviso prévio não foi bem recebido no meio corporativo
    • Cancelamos os planos de todos e implantamos liteLLM internamente
      Mantivemos o Copilot porque os tokens eram ridiculamente baratos, mas, depois da nova precificação, virou um serviço parecido com o openrouter e com muito menos modelos
    • Antes era assim, mas não desde que decidiram matar o próprio serviço
    • Por algum motivo, o Copilot parece mais burro do que o Claude no VS Code ou o Codex no VS Code
      Não sei exatamente por quê, mas a sensação não foi boa
    • O ambiente de execução do Copilot é péssimo em comparação com outros ambientes baseados em CLI que testo. Surpreendentemente ruim
      Esse assunto aparece com frequência na empresa, porque as pessoas responsáveis pela gestão de fornecedores não entendem o ecossistema de grandes modelos de linguagem e acham que usar Claude via Copilot é o mesmo que usar Claude via Claude Code
      Sempre que me pedem para explicar a diferença, uma comparação simples lado a lado revela um desempenho dramaticamente inferior em 3 ou 4 de cada 5 tentativas
  • Se você faz parte de uma equipe pequena pensando em testar o Copilot, fica o aviso: pode perder horas tentando configurar cobrança seguindo documentação desatualizada
    Em resumo, acabamos recebendo um e-mail do GitHub dizendo que o “Copilot Business é oferecido a equipes que compram 10 ou mais licenças”. Isso não está documentado, mas outras pessoas estão passando pela mesma coisa: https://github.com/orgs/community/discussions/199346
    Por enquanto vamos continuar com o Cursor, usando o Kimi como principal sob o nome “Composer”

  • Finalmente saiu. Este é o primeiro LLM de pesos abertos do Copilot? A porta se abriu