1 pontos por GN⁺ 3 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Microsoft abriu, em dezembro, o acesso ao Claude Code para milhares de desenvolvedores internos, mas está revertendo essa expansão após 6 meses
  • O Claude Code ganhou popularidade ao ser usado também em experimentos de programação por gerentes de projeto, designers e outros funcionários, mas passou a competir com o GitHub Copilot CLI
  • A Microsoft pretende remover a maior parte das licenças do Claude Code e migrar muitos desenvolvedores para o Copilot CLI, consolidando-o como a principal ferramenta de linha de comando com agentes
  • A equipe de Experiences + Devices está reduzindo o uso até o fim de junho, incluindo engenheiros responsáveis por Windows, Microsoft 365, Outlook, Teams e Surface
  • A decisão coincide com o encerramento do ano fiscal em 30 de junho, e o cancelamento das licenças ajuda a reduzir despesas operacionais no início do novo ano fiscal, em julho

Redução das licenças do Claude Code

  • A Microsoft abriu, em dezembro, o acesso ao Claude Code para milhares de desenvolvedores internos, para que usassem diariamente a ferramenta de programação com IA da Anthropic
  • Isso fazia parte de um esforço para permitir que gerentes de projeto, designers e outros funcionários experimentassem programação pela primeira vez
  • O Claude Code ganhou popularidade dentro da Microsoft nos últimos 6 meses, mas a empresa está se preparando para reverter essa expansão

Transição para o Copilot CLI

  • A Microsoft pretende remover a maior parte das licenças do Claude Code e migrar muitos desenvolvedores para o GitHub Copilot CLI
  • A popularidade do Claude Code entrou em conflito com o GitHub Copilot CLI, a versão de linha de comando do GitHub Copilot que roda fora de aplicativos de desenvolvimento como o Visual Studio Code
  • A equipe de Experiences + Devices está reduzindo o uso do Claude Code até o fim de junho
    • Isso inclui engenheiros responsáveis por Windows, Microsoft 365, Outlook, Microsoft Teams e Surface
    • Os engenheiros estão sendo incentivados a migrar seus fluxos de trabalho para o GitHub Copilot CLI nas próximas semanas, antes da interrupção

Motivos e cronograma da decisão

  • A Microsoft quer consolidar o Copilot CLI como a principal ferramenta de interface de linha de comando com agentes em toda a área de Experiences + Devices
  • Há também motivos financeiros envolvidos
    • 30 de junho é o último dia do atual ano fiscal da Microsoft
    • Cancelar as licenças do Claude Code facilita a redução de despesas operacionais no início do novo ano fiscal, em julho
  • Em um memorando interno, Rajesh Jha, vice-presidente executivo do grupo Experiences and Devices da Microsoft, afirmou que o objetivo de oferecer Copilot CLI e Claude Code em conjunto era aprender e comparar rapidamente as ferramentas em fluxos reais de engenharia, entendendo qual delas se encaixa melhor em cada equipe

1 comentários

 
GN⁺ 3 시간 전
Comentários do Hacker News
  • Mais detalhes estão no artigo da Fortune Microsoft reports are exposing AI's real cost problem: Using the tech is more expensive than paying human employees - https://fortune.com/2026/05/22/microsoft-ai-cost-problem-tok...

  • O conselho de usar modelos mais baratos de forma seletiva não bate com a realidade vivida no setor. Existe uma pressão constante de que, se você não produzir código rápido o suficiente, pode ser demitido, então é difícil apostar o sustento usando um modelo menos eficaz
    Economizar custo de token dificilmente é recompensado na avaliação de desempenho, e também é difícil quantificar quanto foi economizado em comparação com usar um modelo caro

    • Medir uso de token me parece parecido com medir a quantidade de serragem num canteiro de obras
      O problema de produzir código útil rapidamente não se resolve gastando mais tokens por hora. Até executivos não técnicos conseguem entender isso, e talvez tenham mais interesse na estrutura estratégica de teoria dos jogos em que uma expectativa implícita de consumo de tokens força competição entre desenvolvedores
      Se só o pacote de remuneração importa e você quer aguentar o máximo possível, precisa pelo menos se ajustar a esse novo jogo. É melhor manter um uso de tokens moderado entre os extremos já formados, para ficar no centro estatístico em todos os relatórios de IA que a gerência puder criar
    • A tragédia da pressão para despejar código rápido é que isso não é sustentável. Todo mundo profundamente envolvido com tecnologia sabe disso
      No fim, as empresas vão pagar um alto custo de choque de realidade, porque criatividade e qualidade não podem ser forçadas nem com IA. A inteligência real está conosco agora e continuará assim no futuro previsível
      Mas quando tudo arrebentar, os executivos no máximo vão cair para cima com bônus milionários de saída e uma “lista de contribuições” pela qual ainda deveríamos agradecer, e a dor da próxima grande onda de demissões vai cair sobre nós
    • Recomendar “usar modelos mais baratos seletivamente”, inclusive a ANTHROP\C, é um mau negócio, porque isso significa gastar um tempo humano cada vez mais caro para consertar máquinas que ficam mais baratas com o tempo
      Em custo por linha de código, confirmei que isso é sempre um erro, a menos que tempo humano não seja mais caro que máquina. Quase nunca é o caso, a não ser que você trate seu próprio tempo como se custasse zero em vez de uma taxa horária
      O pior para a produtividade foi quando Claude Code ou Claude Cowork pegavam um problema complexo, escreviam instruções ruins para agentes de modelos burrinhos e juntavam as respostas burras numa orquestra de resultados ruins
      A melhor forma de melhorar resultado em relação ao custo total é fazer o modelo ler o contexto completo e pensar sobre ele, e deixar o modelo mais inteligente pensar, não um agente
      Agente tem que fazer trabalho repetitivo. Agente não deve pensar, nem decidir o que pensar, porque isso em si já é pensar
      Se um agente tiver de “pensar”, deve pensar como formiga, abelha ou castor. Pensamento parecido com o humano, especialmente algo próximo de intuição, deve ficar com o melhor modelo possível
      Ninguém deveria “despejar” código. Na hierarquia entre o codificador que traduz especificações detalhadas para alguma linguagem de computador, o desenvolvedor que escreve software entregue dentro do cronograma do projeto e o engenheiro que alcança objetivos de negócio, o engenheiro precisa construir a estrutura do motor para os resultados de negócio
      Vendo por esse lado, a máquina vira uma alavanca para reduzir vários custos. Ao mesmo tempo, como a maior parte dos dados de treinamento não entende isso, a máquina também não entende, então o humano precisa dar forma a esse trabalho repetitivo
    • Eu também usei de bom grado o Opus 4.6 fast mode num projeto e gastei algo em torno de 5 mil dólares. A entrega do projeto justificou esses 5 mil dólares, e teria sido bem complicado gastar só 500 dólares e entregar com um mês de atraso
    • O que realmente me deixa curioso é por que não usaram uma cópia self-hosted. Se usar no Azure, paga de novo para a Anthropic? Poderiam ter negociado para usar os modelos da Anthropic por muito menos, e a Anthropic poderia ter feito o Claude Code integrar diretamente com Azure para funcionários da Microsoft
      Daria para fazer isso na faixa de centavos por dólar, e a Microsoft poderia reduzir custo com GPUs de baixa utilização ou acumular computação ociosa de GPU. Afinal, serverless também nasceu em algum lugar de recursos não usados de servidores web
      Pensando que até o antigo datacenter da xAI já poderia recolocar a Anthropic na frente, parece que a Microsoft poderia fazer self-hosting em GPUs de geração anterior que só estão lá ocupando espaço no servidor
  • Lendo o artigo, a Microsoft ofereceu aos desenvolvedores Claude Code e Copilot
    O que queria era que experimentassem os dois e dessem feedback sobre qual era melhor
    Os desenvolvedores votaram com os pés e não usaram o Copilot
    Imagino que era exatamente o oposto do que a Microsoft queria

    • Pode ser que a Microsoft esteja migrando o Copilot para uma tecnologia menos dependente de modelo. Recentemente a empresa adicionou o Cowork rodando em Opus 4.7 e começou a usar o Microsoft 365 Copilot, e foi melhor que as alternativas que tínhamos
      Diferentemente do Claude Code ou Cowork “de verdade”, ele só acessa arquivos em uma pasta específica do OneDrive dentro do contêiner pessoal do SharePoint, então se encaixa muito melhor em conformidade com regras como a NIS2
      Tecnicamente usamos o Copilot e pagamos com licença da Microsoft, mas por dentro estamos usando Opus 4.7. Antes disso, a maioria dos agentes customizados dentro do m365 copilot também era um dos modelos GPT
      Ou então pode ser que queiram mesmo fazer os desenvolvedores usarem os modelos do Copilot
    • Por alguns meses os funcionários puderam escolher entre Claude Code ou Copilot, mas agora não mais
      Ainda não há restrição na escolha do modelo-base. Opus 4.6 é de longe o mais popular, e muito dinheiro continua indo para a Anthropic
    • A maioria de nós não tinha a opção de usar Claude Code às custas da empresa; só algumas organizações internas tinham isso. Eu, porém, assinei Claude Code por conta própria por um tempo
      Sinceramente, acho o GitHub Copilot CLI e o novo app do GitHub Copilot bem bons. Uso principalmente Opus 4.7 e, raramente, GPT-5.5. A extensão do VSCode é ok, mas acho a experiência no CLI ou no app melhor
    • Queria entender o apelo de usar Claude Code dentro do VSCode em vez do Copilot. Tenho a sensação de estar deixando passar algo óbvio
    • Historicamente, a Microsoft tende a usar internamente os próprios produtos
      Claro que ela também conhece outras opções do mercado e deve usar a ferramenta certa para o trabalho, mas se existe um produto concorrente direto, é natural querer que a telemetria e as sugestões da organização ajudem a melhorar o próprio software, e não o da concorrência
  • Com certeza existe forma de usar Claude Code com consciência de tokens
    Já tentei um fluxo de fábrica de software agentic sem supervisão, e ele queimou tokens demais sem produzir muita coisa
    Já um processo supervisionado por humanos, com intervenção no meio, foi muito mais produtivo e consumiu bem menos. Talvez por isso todo mundo esteja empurrando tanto essa abordagem agentic

    • Sim. O Claude trabalha bem, mas revisar tudo direito leva bastante tempo. Chegou um ponto em que ficou difícil até gastar toda a cota semanal
      Então resolvi isso criando uma skill de code review paralela no estilo agentic. Na prática é um gerador de TODOs infinito. Agora tenho certeza de que uso 100% do que pago
      Queima muitos tokens, mas no processo pega muitos problemas. Toda semana repito esse ciclo de revisão/correção, e a quantidade que humanos precisam revisar caiu bastante
    • A visão atual do setor é que agentes automatizados vão transformar esse mercado de algo na casa de dezenas de bilhões em algo de trilhões de dólares. Você entendeu certo. Agentes estimulam demanda pelo que essas empresas construíram
    • Acho bom no sentido de que pessoas em larga escala passam a experimentar gestão de recursos diretamente. Comparado a aprender isso gerenciando gente, é um jeito bem barato, e todos podem se beneficiar dessa transferência de habilidade
    • Em nível corporativo, deve ser difícil querer usar um serviço com custo imprevisível e que ainda exige treinamento dos funcionários para controlar esse custo
    • Um colega fez um trabalho de coding agentic bem comum com Sonnet 4.6 via AWS Bedrock para manter os dados na UE, e gastou 100 euros em um único dia
      Em comparação, uma assinatura da Mistral custa uns 20 euros por mês e, quando testamos tarefas parecidas, ela foi razoável e usou algo como 10% do limite mensal por dia. O plano Max 5x da Anthropic também oferece muito mais tokens de uso livre
      O ponto ótimo parece ser usar assinatura mensal, seja de qual provedor for. É fortemente subsidiado. Mas se eu tiver que pagar por token, agora eu primeiro veria o que dá para fazer com DeepSeek. Infelizmente, provavelmente não serviria para o caso acima, mas para startup pode ser diferente
      Por outro lado, isso parece um pouco hipócrita. Parte disso era um esforço para fazer gerentes de projeto, designers e outros funcionários experimentarem programação pela primeira vez, e o texto diz que o Claude Code ficou muito popular dentro da Microsoft nos últimos 6 meses
      Dizem que o futuro é todo IA, mas quando a fatura chega a postura muda
  • Em parte do artigo, diz que a Microsoft quer remover a maior parte das licenças do Claude Code e mover muitos desenvolvedores para o Copilot CLI
    O Claude Code era popular, mas também enfraquecia a nova ferramenta de codificação GitHub Copilot CLI da Microsoft, uma versão de linha de comando do GitHub Copilot que roda fora de apps de desenvolvimento como o Visual Studio Code
    Mas aqui isso está sendo interpretado principalmente como um problema de o Claude queimar tokens rápido demais, e se sugere que a Microsoft deveria usar SomeOtherLLM©
    Não sei se isso aqui é o Hacker News ou um campo de batalha de marketing

    • Nenhum fórum público tem imunidade natural contra a disseminação de marketing de guerrilha. [1]
      [1] Internet Rule #48
    • Um título mais preciso seria “Microsoft decidiu comer a própria ração”
    • O fórum chamado Hacker News foi hackeado e discretamente refatorado para Marketing Wars. Afinal, o objetivo principal desde o começo é criar um lugar que atraia projetos de marketing e startups
    • Acho que muita gente não leu o artigo. Eu também não tinha lido até ver este comentário. Sinceramente, o artigo me pareceu clickbait
  • Nossa organização é obrigada a usar Copilot na nuvem governamental, mas ele é tão inútil que normalmente a gente só codifica direto
    A sintaxe é bagunçada, ele junta linhas aleatoriamente, inverte a ordem, joga saídas de poucos tokens no meio da linha e, estranhamente, continua omitindo a última linha de todos os blocos de código. Parece internamente alguma versão antiga de GPT
    Ainda assim, isso me fez sentir que os modelos do último ano mais ou menos cruzaram o limiar entre “interessante” e realmente aumentar produtividade
    Entre Copilot, Claude e Gemini, ainda prefiro de fato o Gemini. Além de código, escrevo bastante texto científico, e o Gemini é o único modelo em que consigo confiar que “simplesmente acerta”. Essa confiança se estende ao código também

    • Se você está falando do Copilot embutido no VS Code, minha experiência recente não é nada disso. Desde o lançamento do gpt 5.4, ele ficou muito competente no modo agente
  • No geral, parece certo
    No mesmo dia lançamos internamente Claude Code e DeepSeek para demonstração. O Claude consumiu toda a cota mensal em pouco mais de uma semana, e mais da metade desse orçamento foi embora em um único dia. O DeepSeek, por outro lado, não consegue nem de longe gastar esse mesmo dinheiro em um mês, mesmo que as pessoas tentem
    Então o Claude parece um brinquedo caro, enquanto o DeepSeek parece uma , porque os desenvolvedores conseguem usar sem sentir que estão corroendo um recurso precioso
    A diferença de capacidade entre Claude e DS-pro nem parece tão grande. A diferença entre DS-pro e flash parece sonnet/opus versus haiku, mas o flash ainda é muito competente

    • Cancelei o Claude hoje com raiva
      Nas últimas duas semanas o Claude foi ficando cada vez pior, e hoje foi o limite final
      Não importa se tem app no celular ou não. Depois que eles acham que já te “fisgaram” com tempo suficiente de assinatura, o modelo vira lixo completo
      Se o modelo vai na direção oposta ao que disse e age contra as instruções, não dá para programar no celular. Se eu quisesse piorar o código, era só dar commit em qualquer porcaria. Não preciso de app móvel para isso
    • Já considerou o Gemini?
  • Isso me lembra quando Steve Ballmer proibiu os filhos dele de usarem iPod e mandou usarem Zune no lugar

  • Estou bem satisfeito com o plano de 10 dólares por mês do CoPilot. Ele ainda oferece acesso aos modelos Claude e os tokens são limitados, mas não há limite por tempo como no plano de 20 dólares do Claude, então meu fluxo de trabalho não é interrompido
    Para tarefas comuns uso um dos modelos gratuitos, e para problemas especialmente difíceis aciono o Claude. Para mim funciona muito bem

    • Não sei se você está falando do plano antigo ou do novo
      O GitHub Copilot provavelmente era o melhor custo-benefício e, na minha opinião, foi subestimado por muito tempo. Sou assinante anual desde o primeiro dia
      As mudanças anunciadas há poucos dias destruíram completamente essa proposta de valor, e não sei se vou continuar assinando
    • O Copilot foi o melhor negócio entre as ferramentas de IA por algumas semanas
      O novo modelo de preços mudou isso. Mesmo assim, acho que vou continuar usando para autocomplete. Para quando eu abrir o editor de vez em quando
    • Também dá para comprar mais tokens premium para usar mais Claude, e eu inclusive fiz isso uma vez. Mas na maior parte dos casos os tokens incluídos no plano são suficientes
  • Se desenvolvedores estão sendo demitidos com a justificativa de que IA é melhor, mais rápida, mais barata ou transforma pessoas em 10x, fico me perguntando o que acontece quando as ferramentas necessárias acabam ficando ainda mais caras
    Do ponto de vista do investidor, o que pesa mais: custo de pessoal ou uma linha de despesa inflada?

    • Demite gente e fica bonito diante dos investidores. Depois contrata gente de novo, fala em “crescimento” e fica bonito diante dos investidores outra vez
      Se o mercado de ações fosse racional, isso não funcionaria, mas o mercado de ações nunca é racional
    • Essa ideia de que desenvolvedores estão sendo demitidos porque IA é melhor, mais rápida e mais barata me parece besteira. Engenheiros de software estão sendo demitidos por causa de contratação excessiva no pós-Covid
      A evidência de destruição do trabalho aparece só na contratação de juniores. Não porque pessoas estejam sendo demitidas, mas porque vagas de entrada estão sendo comidas
    • Se fica mais caro é difícil calcular. Se for mais rápido e permitir antecipar o lançamento no mercado, o custo maior pode ser justificado
      Além disso, grandes modelos de linguagem trabalham 24 horas por dia, 365 dias por ano, e podem escalar para cima ou para baixo conforme necessário. Especialmente na Europa, desligar um grande modelo de linguagem é mais rápido do que demitir funcionários
      Então, mesmo que IA fique mais cara que desenvolvedores, do ponto de vista de custo total de propriedade e retorno sobre investimento ela ainda pode fazer sentido para o negócio
    • Se tudo sair como planejado, no fim os modelos provavelmente vão ficar muito mais caros do que os funcionários que substituíram
      Esse tipo de tecnologia normalmente termina, na melhor das hipóteses, em oligopólio, e nessa altura os players já terão fossos competitivos enormes. E o que esses modelos produzirem será ajustado para que outros modelos ou humanos não consigam trabalhar nisso de forma realista; depois disso, poderão aumentar os preços empurrando todo mundo até o limite da rentabilidade
    • Até a IA ficar drasticamente mais cara, parece difícil ela parecer pior que salário. Se um desenvolvedor usando Claude Code consegue, na prática, substituir dois desenvolvedores, então isso já fecha a conta mesmo com bastante uso nos preços atuais de API
      Somando benefícios além do salário, férias pagas e outros custos indiretos de contratação, o custo total dá algo como 1,5 desenvolvedor. Ou seja, você paga por 1,5 e recebe o equivalente a 2
      Numa empresa grande, escalando isso para 500 desenvolvedores, a economia em salários vira muito dinheiro
      Comparado a manter quadro ou contratar gente em vez disso, a IA só começaria a ficar mais cara quando passasse de uns 15 mil dólares por mês por desenvolvedor. Para um humano atingir o ponto de equilíbrio ou ficar mais barato, seria preciso algo perto de 4 bilhões de tokens por mês