- Kimi K2.7 Code foi adicionado ao GitHub Copilot, tornando-se o primeiro modelo de pesos abertos disponível para seleção no seletor de modelos
- Hospedado pelo GitHub no Microsoft Azure, oferece mais opções de modelos e alternativas de menor custo para fluxos de trabalho de codificação
- A cobrança é aplicada com base no preço de tabela do provedor dentro do modelo de cobrança por uso; os custos reais devem ser verificados na documentação de preços de modelos e solicitações do Copilot
- Será distribuído gradualmente a partir dos planos Copilot Pro, Pro+ e Max, e estará disponível no seletor de modelos do Visual Studio Code
- No Copilot Business e Enterprise, o padrão é ficar desativado, portanto, antes do uso pela organização, é necessário que um administrador habilite a política e revise segurança, compliance e governança de dados
Primeiro modelo de pesos abertos adicionado ao Copilot
- Kimi K2.7 Code é um modelo de pesos abertos disponibilizado oficialmente no GitHub Copilot
- Foi adicionado como o primeiro modelo de pesos abertos selecionável no seletor de modelos do Copilot
- Oferece mais opções de modelos e alternativas de menor custo em fluxos de trabalho de codificação
- O GitHub hospeda o modelo no Microsoft Azure
Cobrança por uso
- O Kimi K2.7 Code é cobrado com base no preço de tabela do provedor dentro da cobrança por uso
- Os critérios detalhados de cobrança podem ser consultados na documentação GitHub Copilot’s pricing for models and requests
Disponibilidade dentro do Copilot
- O Kimi K2.7 Code será distribuído primeiro, de forma gradual, para os planos Copilot Pro, Pro+ e Max
- Os usuários podem escolher esse modelo no seletor de modelos do Visual Studio Code
- A distribuição ocorrerá em etapas, e o GitHub continuará monitorando a qualidade e o desempenho do modelo
- Nas próximas semanas, a disponibilidade será expandida para Copilot Business, Enterprise e outras interfaces de uso
Clientes e interfaces compatíveis
- O seletor de modelos está disponível nos seguintes ambientes
- Visual Studio Code 1.127.0 ou superior
- Visual Studio 17.14.6 ou superior
- Copilot CLI
- GitHub Copilot cloud agent
- GitHub Copilot App
- github.com
- GitHub Mobile para iOS e Android
- JetBrains 1.9.1-251 ou superior
- Xcode
- Eclipse
Configurações de administrador para Business e Enterprise
- O Kimi K2.7 Code vem desativado por padrão no Copilot Business e no Copilot Enterprise
- Para que membros da organização possam selecionar o modelo, um administrador do plano deve habilitar a política do Kimi K2.7 Code nas configurações do Copilot
- Se a política permanecer desativada, o modelo não poderá ser usado nessa organização
- Recomenda-se que os administradores verifiquem, antes da ativação, se o modelo de pesos abertos atende aos seus próprios requisitos de segurança, compliance e governança de dados
Documentação e canais de feedback
- A lista completa de modelos disponíveis no GitHub Copilot pode ser consultada na documentação supported models
- A escolha do modelo adequado para cada tarefa pode ser consultada na documentação choosing the right AI model for your task
- Feedback pode ser compartilhado na discussão da GitHub Community
1 comentários
Opiniões do Hacker News
Já perdi quase todo o interesse em produtos de IA baseados na nuvem
Estou cansado de ver recursos e fluxos de trabalho legais que eu esperava um dia usar se tornarem inviáveis por tantos motivos diferentes: aumento de preços, sensação de queda de desempenho, encerramento de serviços, substituições etc.
Montei um equipamento pequeno e praticamente me estabeleci no Qwen3.6, e estou adicionando aos poucos, por conta própria, os recursos de que preciso. Não sei se está no nível de competir com o Claude, e também parei de verificar. Ele já me entrega muito valor e continua melhorando, e gosto do fato de que, mesmo que a grama possa ser mais verde em algum lugar, ela não muda debaixo dos meus pés.
Quero deixar registrado que, para quem não tem memória suficiente para rodar modelos grandes na faixa de 32 GB, os modelos podados também têm desempenho bem bom. Se você tem uma máquina pequena, vale experimentar o modelo quantizado Q4 pruned unsloth do GLM 4.7 Flash, que cabe em 14 GB: https://huggingface.co/unsloth/GLM-4.7-Flash-REAP-23B-A3B-GG...
Normalmente uso o LM Studio para esse tipo de coisa, mas a unsloth também tem seu próprio app de estúdio, que pode se ajustar melhor a esses modelos quantizados. Usei o GLM 4.7 Flash como modelo principal por alguns meses; ele foi muito persistente e muito rápido, e parece uma boa opção para hardware limitado.
Por exemplo, o novo Claude foi ajustado para coding agentic e pode até ser prejudicial para coding não agentic; o Fable 5 parece bom, mas o custo de inferência é alto, e há grande chance de queda de desempenho ou mudanças de limites e preços depois do lançamento. O Gemini 3.5 tem limites mais generosos, mas o desempenho é um pouco inferior.
Novas versões saem e os números sobem, mas fico me perguntando se todas as mudanças são realmente avanços ou se é só uma tunagem diferente em uma performance por dólar parecida com a do início do ano. As mudanças reais aparecem mais em modelos pequenos como Qwen ou Gemma 4 31B, e, considerando especialmente a capacidade multilíngue, é algo bem mágico.
Acabei de ver, enquanto postava, uma comparação antes/depois do Fable: na versão reintroduzida, como ainda estão mexendo no modelo, o desempenho no BridgeBench despencou de forma desastrosa: https://x.com/Hesamation/status/2072692225100612032
Não é tão rápido quanto o Claude que uso no trabalho, mas roda suficientemente bem localmente, e não preciso me preocupar com coisas como créditos ou recursos desaparecendo de repente.
Gosto muito do Copilot CLI. Ele me parece mais lógico e com menos atrito que o Claude Code
Também gosto de poder alternar livremente entre vários modelos. Por exemplo: “planejar com o Opus 4.6, validar esse plano e receber feedback com o GPT 5.4, depois implementar com o Sonnet 4.6”.
Mas, por causa da mudança de preços do Copilot em junho, tanto eu pessoalmente quanto todo o departamento da empresa tivemos que migrar para o Claude Code. Em abril e maio, eu passava um pouco dos créditos incluídos e gastava alguns dólares a mais; a partir de junho, o orçamento mensal passou a acabar a cada 2 ou 3 dias.
Do ponto de vista do cliente, foi um aumento de preço completamente insano, e não faço ideia do que a Microsoft estava pensando. Mesmo que esse fosse o preço necessário para a sustentabilidade, eles deveriam ter esperado até que os concorrentes mudassem seus preços primeiro. Eu não ficaria surpreso se eles tivessem perdido mais de 50% dos clientes do Copilot no mês passado.
Se, no fim, todos os grandes players convergirem para esse nível de preço, talvez o Estado precise operar uma IA de acesso público, como faz com a TV. Algo como usar modelos abertos gratuitos e manter alguns datacenters com dinheiro de impostos, com restrições regionais e throttling rigoroso, mas liberando o uso para estudantes e cidadãos.
Se, daqui a alguns anos, todos os preços de IA ficarem no nível do Copilot, só empresas unicórnio conseguirão usar, e o restante não terá chance de competir com empresas que usam IA.
Literalmente é repasse de custos: https://platform.claude.com/docs/en/about-claude/pricing
A Anthropic também oferece assinatura, mas empresas geralmente não querem usar isso. Porque o conteúdo enviado por esse caminho pode ser usado no treinamento ou virar parte do modelo.
Se você usar sem autorização explícita do empregador, pode estar violando o contrato e, se houver um processo, as consequências podem ser graves.
Ao mesmo tempo, estamos testando AWS Bedrock e Deepinfra para modelos com pesos abertos, nos preparando para quando o Claude Code inevitavelmente deixar de ser um bom negócio por passar a refletir o custo real dos tokens.
O Claude está muito à frente em termos de ferramentas, mas a definição de modelo por subagente e o acesso a todos os modelos são recursos melhores do que tudo que o Claude oferece hoje somado.
Na empresa, o único limite para a quantidade de IA que posso consumir em um mês é dinheiro, então aquilo que reduz custo é, para mim, o melhor modelo e ambiente de execução. O Copilot também era melhor em atribuir automaticamente modelos mais adequados aos subagentes, enquanto o Claude frequentemente usa modelos mais caros.
Ainda assim, existem modelos eficientes capazes de executar planos criados por modelos melhores. É meio constrangedor pensar que a seleção automática de modelos da Microsoft, naquela estrutura de preços antiga e deficitária, escolhia modelos de raciocínio de ponta para tarefas como resolver conflitos de dependência.
Usei o GitHub Copilot no desenvolvimento do VS 2026, alternando entre ChatGPT e Claude, e isso foi antes de eu conhecer o Claude Code e o app Codex
O Copilot era bom o bastante para o meu uso, e US$ 10 por mês bastavam
Mas, quando o novo modelo de preços foi introduzido no mês passado, os US$ 10 acabaram em poucos dias. Eu sei que o preço antigo não era sustentável, mas isso me fez migrar para o Claude Code e o Codex, e não olhei para trás. Os tokens do Claude Code e do Codex também têm preços bastante subsidiados, mas é só aproveitar enquanto a coisa boa durar
Dá para sentir uma diferença entre usar o Claude via Copilot e usar o Claude diretamente no Claude Code. Não sei o que a Microsoft está fazendo por trás
A Anthropic está um pouco à frente tanto no ambiente de execução quanto no modelo, então tem o melhor dos dois mundos
Do lado da Microsoft, provavelmente é o mesmo modelo, mas as ferramentas ao redor e os prompts parecem piores, então os resultados também acabam piores
Agora estou usando o ambiente de execução reasonix para DeepSeek, e quando há acerto de cache o custo fica quase gratuito. Mesmo usando provedores dos EUA sem subsídio, como Digital Ocean ou Cloudflare
A linguagem-alvo é C++ e não há problema
Gosto da forma de usar o Claude no VS Code via Copilot, e sinto que ele entrega código melhor porque consigo controlar melhor a qualidade do código. É muito mais transparente do que o Claude Code, é open source, e a interface de IDE dá mais recursos de controle de contexto e de artefatos gerados
O aumento de custo não se deve apenas ao reajuste de preço; também há o efeito de o agente do modelo Opus usar mais tokens. Por isso migrei para o Claude Code e ainda estou usando o Opus 4.6 com satisfação. Fable e 4.7 fazem tarefas em unidades maiores, mas desviam com mais frequência e inventam suposições, deixando o resultado bagunçado
Finalmente apareceu uma alternativa de grande fornecedor que empresas podem usar
As pessoas queriam uma forma de executar modelos chineses por meio de um provedor confiável, e o GitHub está oferecendo isso
Se acreditarmos nos benchmarks, o desempenho fica no nível do Sonnet 4.6. Resta ver se vale a pena pelo preço do GitHub
O GPT-5.4 era 1x para assinantes anuais, mas agora virou 6x. As requisições premium acabam em poucos prompts. O GitHub Copilot de US$ 10 por mês antes era o melhor custo-benefício, porque permitia usar modelos de laboratórios de IA dos EUA por pouco dinheiro
Ele ficou dando voltas em algo que o Claude resolveria de uma vez. Dito isso, meu caminho de uso foi o Ollama Cloud, e não sei se eles oferecem o modelo real ou uma versão quantizada; a quantização pode ter prejudicado o desempenho
Ainda assim, a boa notícia é que isso cria um precedente. Se a Microsoft agora oferece o Kimi K2.7, em breve também pode oferecer o GLM 5.2, que é de fato um modelo muito competitivo
A Synthetic opera seus próprios modelos a preços razoáveis, incluindo GLM5.2 e Kimi K2.7-Code
Link de indicação: https://synthetic.new/?referral=kwjqga9QYoUgpZV
Entrada: US$ 0,95, acerto de cache: US$ 0,19, saída: US$ 4,00
É o mesmo preço que a Moonshot cobra e fica mais ou menos na faixa do GPT 5.4 mini, então não é uma opção ruim
Como exemplo de um prompt idiota que desperdiça tokens com contexto: “Jogue jogo da velha sozinho em um tabuleiro 5x5. Você vence ao colocar 5 em linha.”
No Kimi K2.7, custa US$ 0,006 e é possível ver todo o rastro bruto de raciocínio. No GPT-5.4 mini, custa US$ 0,016 e vem resumido
Se estiver curioso, os dois jogam de um jeito inacreditavelmente burro
Kimi:
A B C D E
1 . . . . .
2 . . . . .
3 X X X X X
4 . O O O O
5 . . . . .
GPT 5.4 mini:
1: X X X X X
2: O O . . .
3: . . O . .
4: . . . O .
5: . . . . O
Para referência, a quem tiver curiosidade: o GPT 5.5 também joga o mesmo lixo que o 5.4 mini, mas custa 4 vezes mais
O Fable produz uma partida plausível por 40 centavos
X X O O O
O O X X X
X X X O O
X O O X O
X O X X O
Boa ideia. Testei pedir a mesma coisa ao Haiku no Claude Chat do iOS, e ele criou um jogo interativo em React, implementou as regras e então me fez jogar
Entrada a US$ 1, saída a US$ 5; jogada inteligente, Anthropic!
Grandes modelos de linguagem são fracos em jogos, mas é perfeitamente possível escrever um agente de aprendizado por reforço que aprenda o jogo em si
Se eu ficar extremamente entediado, penso em fazer dois modelos jogarem xadrez um contra o outro
Imagino que já exista algum benchmark de xadrez ou torneio de grandes modelos de linguagem por aí
É estranho que o AWS Bedrock ofereça suporte tão fraco a modelos desse tipo
Só há Kimi 2.5, qwen 3 coder, DeepSeek V3.2, GLM 5 e similares, sem modelos mais recentes
Instâncias Inf2 exigem AWS Neuron [1]. Talvez portar o modelo para rodar nesse hardware esteja demorando demais
[1] https://aws.amazon.com/ai/machine-learning/neuron/
O custo de execução é claramente muito mais barato do que o de outros modelos, e usei por cerca de uma hora ontem; os resultados pareceram promissores
Vi em uma discussão no Reddit que a equipe está avaliando o glm5.2, então espero que adicionem mais modelos
Será que o GitHub Copilot está na melhor posição como plataforma para empresas?
Ele oferece suporte a Claude, GPT, Gemini e agora até a modelos com pesos abertos. Organizações grandes acabam pagando algo no nível de tarifas de API de qualquer forma, então o custo é parecido onde quer que usem
Tem uma CLI e um SDK de agentes bastante bons, e agora também tem app de desktop. Há agentes hospedados e também é possível executar “Agentic Workflows” no CI
Será que a reputação caiu tanto que só as alternativas chamam atenção? Ou usuários fora de empresas acabam afastados pelo custo de uso, impedindo o marketing gratuito?
Mantivemos o Copilot porque os tokens eram ridiculamente baratos, mas, depois da nova precificação, virou um serviço parecido com o openrouter e com muito menos modelos
Não sei exatamente por quê, mas a sensação não foi boa
Esse assunto aparece com frequência na empresa, porque as pessoas responsáveis pela gestão de fornecedores não entendem o ecossistema de grandes modelos de linguagem e acham que usar Claude via Copilot é o mesmo que usar Claude via Claude Code
Sempre que me pedem para explicar a diferença, uma comparação simples lado a lado revela um desempenho dramaticamente inferior em 3 ou 4 de cada 5 tentativas
Se você faz parte de uma equipe pequena pensando em testar o Copilot, fica o aviso: pode perder horas tentando configurar cobrança seguindo documentação desatualizada
Em resumo, acabamos recebendo um e-mail do GitHub dizendo que o “Copilot Business é oferecido a equipes que compram 10 ou mais licenças”. Isso não está documentado, mas outras pessoas estão passando pela mesma coisa: https://github.com/orgs/community/discussions/199346
Por enquanto vamos continuar com o Cursor, usando o Kimi como principal sob o nome “Composer”
Finalmente saiu. Este é o primeiro LLM de pesos abertos do Copilot? A porta se abriu