Microsoft começa a cancelar licenças do Claude Code
(theverge.com)- Microsoft abriu, em dezembro, o acesso ao Claude Code para milhares de desenvolvedores internos, mas está revertendo essa expansão após 6 meses
- O Claude Code ganhou popularidade ao ser usado também em experimentos de programação por gerentes de projeto, designers e outros funcionários, mas passou a competir com o GitHub Copilot CLI
- A Microsoft pretende remover a maior parte das licenças do Claude Code e migrar muitos desenvolvedores para o Copilot CLI, consolidando-o como a principal ferramenta de linha de comando com agentes
- A equipe de Experiences + Devices está reduzindo o uso até o fim de junho, incluindo engenheiros responsáveis por Windows, Microsoft 365, Outlook, Teams e Surface
- A decisão coincide com o encerramento do ano fiscal em 30 de junho, e o cancelamento das licenças ajuda a reduzir despesas operacionais no início do novo ano fiscal, em julho
Redução das licenças do Claude Code
- A Microsoft abriu, em dezembro, o acesso ao Claude Code para milhares de desenvolvedores internos, para que usassem diariamente a ferramenta de programação com IA da Anthropic
- Isso fazia parte de um esforço para permitir que gerentes de projeto, designers e outros funcionários experimentassem programação pela primeira vez
- O Claude Code ganhou popularidade dentro da Microsoft nos últimos 6 meses, mas a empresa está se preparando para reverter essa expansão
Transição para o Copilot CLI
- A Microsoft pretende remover a maior parte das licenças do Claude Code e migrar muitos desenvolvedores para o GitHub Copilot CLI
- A popularidade do Claude Code entrou em conflito com o GitHub Copilot CLI, a versão de linha de comando do GitHub Copilot que roda fora de aplicativos de desenvolvimento como o Visual Studio Code
- A equipe de Experiences + Devices está reduzindo o uso do Claude Code até o fim de junho
- Isso inclui engenheiros responsáveis por Windows, Microsoft 365, Outlook, Microsoft Teams e Surface
- Os engenheiros estão sendo incentivados a migrar seus fluxos de trabalho para o GitHub Copilot CLI nas próximas semanas, antes da interrupção
Motivos e cronograma da decisão
- A Microsoft quer consolidar o Copilot CLI como a principal ferramenta de interface de linha de comando com agentes em toda a área de Experiences + Devices
- Há também motivos financeiros envolvidos
- 30 de junho é o último dia do atual ano fiscal da Microsoft
- Cancelar as licenças do Claude Code facilita a redução de despesas operacionais no início do novo ano fiscal, em julho
- Em um memorando interno, Rajesh Jha, vice-presidente executivo do grupo Experiences and Devices da Microsoft, afirmou que o objetivo de oferecer Copilot CLI e Claude Code em conjunto era aprender e comparar rapidamente as ferramentas em fluxos reais de engenharia, entendendo qual delas se encaixa melhor em cada equipe
1 comentários
Comentários do Hacker News
Mais detalhes estão no artigo da Fortune Microsoft reports are exposing AI's real cost problem: Using the tech is more expensive than paying human employees - https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tok...
O conselho de usar modelos mais baratos de forma seletiva não bate com a realidade vivida no setor. Existe uma pressão constante de que, se você não produzir código rápido o suficiente, pode ser demitido, então é difícil apostar o sustento usando um modelo menos eficaz
Economizar custo de token dificilmente é recompensado na avaliação de desempenho, e também é difícil quantificar quanto foi economizado em comparação com usar um modelo caro
O problema de produzir código útil rapidamente não se resolve gastando mais tokens por hora. Até executivos não técnicos conseguem entender isso, e talvez tenham mais interesse na estrutura estratégica de teoria dos jogos em que uma expectativa implícita de consumo de tokens força competição entre desenvolvedores
Se só o pacote de remuneração importa e você quer aguentar o máximo possível, precisa pelo menos se ajustar a esse novo jogo. É melhor manter um uso de tokens moderado entre os extremos já formados, para ficar no centro estatístico em todos os relatórios de IA que a gerência puder criar
No fim, as empresas vão pagar um alto custo de choque de realidade, porque criatividade e qualidade não podem ser forçadas nem com IA. A inteligência real está conosco agora e continuará assim no futuro previsível
Mas quando tudo arrebentar, os executivos no máximo vão cair para cima com bônus milionários de saída e uma “lista de contribuições” pela qual ainda deveríamos agradecer, e a dor da próxima grande onda de demissões vai cair sobre nós
Em custo por linha de código, confirmei que isso é sempre um erro, a menos que tempo humano não seja mais caro que máquina. Quase nunca é o caso, a não ser que você trate seu próprio tempo como se custasse zero em vez de uma taxa horária
O pior para a produtividade foi quando Claude Code ou Claude Cowork pegavam um problema complexo, escreviam instruções ruins para agentes de modelos burrinhos e juntavam as respostas burras numa orquestra de resultados ruins
A melhor forma de melhorar resultado em relação ao custo total é fazer o modelo ler o contexto completo e pensar sobre ele, e deixar o modelo mais inteligente pensar, não um agente
Agente tem que fazer trabalho repetitivo. Agente não deve pensar, nem decidir o que pensar, porque isso em si já é pensar
Se um agente tiver de “pensar”, deve pensar como formiga, abelha ou castor. Pensamento parecido com o humano, especialmente algo próximo de intuição, deve ficar com o melhor modelo possível
Ninguém deveria “despejar” código. Na hierarquia entre o codificador que traduz especificações detalhadas para alguma linguagem de computador, o desenvolvedor que escreve software entregue dentro do cronograma do projeto e o engenheiro que alcança objetivos de negócio, o engenheiro precisa construir a estrutura do motor para os resultados de negócio
Vendo por esse lado, a máquina vira uma alavanca para reduzir vários custos. Ao mesmo tempo, como a maior parte dos dados de treinamento não entende isso, a máquina também não entende, então o humano precisa dar forma a esse trabalho repetitivo
Daria para fazer isso na faixa de centavos por dólar, e a Microsoft poderia reduzir custo com GPUs de baixa utilização ou acumular computação ociosa de GPU. Afinal, serverless também nasceu em algum lugar de recursos não usados de servidores web
Pensando que até o antigo datacenter da xAI já poderia recolocar a Anthropic na frente, parece que a Microsoft poderia fazer self-hosting em GPUs de geração anterior que só estão lá ocupando espaço no servidor
Lendo o artigo, a Microsoft ofereceu aos desenvolvedores Claude Code e Copilot
O que queria era que experimentassem os dois e dessem feedback sobre qual era melhor
Os desenvolvedores votaram com os pés e não usaram o Copilot
Imagino que era exatamente o oposto do que a Microsoft queria
Diferentemente do Claude Code ou Cowork “de verdade”, ele só acessa arquivos em uma pasta específica do OneDrive dentro do contêiner pessoal do SharePoint, então se encaixa muito melhor em conformidade com regras como a NIS2
Tecnicamente usamos o Copilot e pagamos com licença da Microsoft, mas por dentro estamos usando Opus 4.7. Antes disso, a maioria dos agentes customizados dentro do m365 copilot também era um dos modelos GPT
Ou então pode ser que queiram mesmo fazer os desenvolvedores usarem os modelos do Copilot
Ainda não há restrição na escolha do modelo-base. Opus 4.6 é de longe o mais popular, e muito dinheiro continua indo para a Anthropic
Sinceramente, acho o GitHub Copilot CLI e o novo app do GitHub Copilot bem bons. Uso principalmente Opus 4.7 e, raramente, GPT-5.5. A extensão do VSCode é ok, mas acho a experiência no CLI ou no app melhor
Claro que ela também conhece outras opções do mercado e deve usar a ferramenta certa para o trabalho, mas se existe um produto concorrente direto, é natural querer que a telemetria e as sugestões da organização ajudem a melhorar o próprio software, e não o da concorrência
Com certeza existe forma de usar Claude Code com consciência de tokens
Já tentei um fluxo de fábrica de software agentic sem supervisão, e ele queimou tokens demais sem produzir muita coisa
Já um processo supervisionado por humanos, com intervenção no meio, foi muito mais produtivo e consumiu bem menos. Talvez por isso todo mundo esteja empurrando tanto essa abordagem agentic
Então resolvi isso criando uma skill de code review paralela no estilo agentic. Na prática é um gerador de TODOs infinito. Agora tenho certeza de que uso 100% do que pago
Queima muitos tokens, mas no processo pega muitos problemas. Toda semana repito esse ciclo de revisão/correção, e a quantidade que humanos precisam revisar caiu bastante
Em comparação, uma assinatura da Mistral custa uns 20 euros por mês e, quando testamos tarefas parecidas, ela foi razoável e usou algo como 10% do limite mensal por dia. O plano Max 5x da Anthropic também oferece muito mais tokens de uso livre
O ponto ótimo parece ser usar assinatura mensal, seja de qual provedor for. É fortemente subsidiado. Mas se eu tiver que pagar por token, agora eu primeiro veria o que dá para fazer com DeepSeek. Infelizmente, provavelmente não serviria para o caso acima, mas para startup pode ser diferente
Por outro lado, isso parece um pouco hipócrita. Parte disso era um esforço para fazer gerentes de projeto, designers e outros funcionários experimentarem programação pela primeira vez, e o texto diz que o Claude Code ficou muito popular dentro da Microsoft nos últimos 6 meses
Dizem que o futuro é todo IA, mas quando a fatura chega a postura muda
Em parte do artigo, diz que a Microsoft quer remover a maior parte das licenças do Claude Code e mover muitos desenvolvedores para o Copilot CLI
O Claude Code era popular, mas também enfraquecia a nova ferramenta de codificação GitHub Copilot CLI da Microsoft, uma versão de linha de comando do GitHub Copilot que roda fora de apps de desenvolvimento como o Visual Studio Code
Mas aqui isso está sendo interpretado principalmente como um problema de o Claude queimar tokens rápido demais, e se sugere que a Microsoft deveria usar SomeOtherLLM©
Não sei se isso aqui é o Hacker News ou um campo de batalha de marketing
[1] Internet Rule #48
Nossa organização é obrigada a usar Copilot na nuvem governamental, mas ele é tão inútil que normalmente a gente só codifica direto
A sintaxe é bagunçada, ele junta linhas aleatoriamente, inverte a ordem, joga saídas de poucos tokens no meio da linha e, estranhamente, continua omitindo a última linha de todos os blocos de código. Parece internamente alguma versão antiga de GPT
Ainda assim, isso me fez sentir que os modelos do último ano mais ou menos cruzaram o limiar entre “interessante” e realmente aumentar produtividade
Entre Copilot, Claude e Gemini, ainda prefiro de fato o Gemini. Além de código, escrevo bastante texto científico, e o Gemini é o único modelo em que consigo confiar que “simplesmente acerta”. Essa confiança se estende ao código também
No geral, parece certo
No mesmo dia lançamos internamente Claude Code e DeepSeek para demonstração. O Claude consumiu toda a cota mensal em pouco mais de uma semana, e mais da metade desse orçamento foi embora em um único dia. O DeepSeek, por outro lado, não consegue nem de longe gastar esse mesmo dinheiro em um mês, mesmo que as pessoas tentem
Então o Claude parece um brinquedo caro, enquanto o DeepSeek parece uma pá, porque os desenvolvedores conseguem usar sem sentir que estão corroendo um recurso precioso
A diferença de capacidade entre Claude e DS-pro nem parece tão grande. A diferença entre DS-pro e flash parece sonnet/opus versus haiku, mas o flash ainda é muito competente
Nas últimas duas semanas o Claude foi ficando cada vez pior, e hoje foi o limite final
Não importa se tem app no celular ou não. Depois que eles acham que já te “fisgaram” com tempo suficiente de assinatura, o modelo vira lixo completo
Se o modelo vai na direção oposta ao que disse e age contra as instruções, não dá para programar no celular. Se eu quisesse piorar o código, era só dar commit em qualquer porcaria. Não preciso de app móvel para isso
Isso me lembra quando Steve Ballmer proibiu os filhos dele de usarem iPod e mandou usarem Zune no lugar
Estou bem satisfeito com o plano de 10 dólares por mês do CoPilot. Ele ainda oferece acesso aos modelos Claude e os tokens são limitados, mas não há limite por tempo como no plano de 20 dólares do Claude, então meu fluxo de trabalho não é interrompido
Para tarefas comuns uso um dos modelos gratuitos, e para problemas especialmente difíceis aciono o Claude. Para mim funciona muito bem
O GitHub Copilot provavelmente era o melhor custo-benefício e, na minha opinião, foi subestimado por muito tempo. Sou assinante anual desde o primeiro dia
As mudanças anunciadas há poucos dias destruíram completamente essa proposta de valor, e não sei se vou continuar assinando
O novo modelo de preços mudou isso. Mesmo assim, acho que vou continuar usando para autocomplete. Para quando eu abrir o editor de vez em quando
Se desenvolvedores estão sendo demitidos com a justificativa de que IA é melhor, mais rápida, mais barata ou transforma pessoas em 10x, fico me perguntando o que acontece quando as ferramentas necessárias acabam ficando ainda mais caras
Do ponto de vista do investidor, o que pesa mais: custo de pessoal ou uma linha de despesa inflada?
Se o mercado de ações fosse racional, isso não funcionaria, mas o mercado de ações nunca é racional
A evidência de destruição do trabalho aparece só na contratação de juniores. Não porque pessoas estejam sendo demitidas, mas porque vagas de entrada estão sendo comidas
Além disso, grandes modelos de linguagem trabalham 24 horas por dia, 365 dias por ano, e podem escalar para cima ou para baixo conforme necessário. Especialmente na Europa, desligar um grande modelo de linguagem é mais rápido do que demitir funcionários
Então, mesmo que IA fique mais cara que desenvolvedores, do ponto de vista de custo total de propriedade e retorno sobre investimento ela ainda pode fazer sentido para o negócio
Esse tipo de tecnologia normalmente termina, na melhor das hipóteses, em oligopólio, e nessa altura os players já terão fossos competitivos enormes. E o que esses modelos produzirem será ajustado para que outros modelos ou humanos não consigam trabalhar nisso de forma realista; depois disso, poderão aumentar os preços empurrando todo mundo até o limite da rentabilidade
Somando benefícios além do salário, férias pagas e outros custos indiretos de contratação, o custo total dá algo como 1,5 desenvolvedor. Ou seja, você paga por 1,5 e recebe o equivalente a 2
Numa empresa grande, escalando isso para 500 desenvolvedores, a economia em salários vira muito dinheiro
Comparado a manter quadro ou contratar gente em vez disso, a IA só começaria a ficar mais cara quando passasse de uns 15 mil dólares por mês por desenvolvedor. Para um humano atingir o ponto de equilíbrio ou ficar mais barato, seria preciso algo perto de 4 bilhões de tokens por mês