Relatório da Microsoft afirma que a IA sai mais cara do que contratar funcionários humanos
(fortune.com)- A Microsoft está reduzindo os custos de ferramentas internas de IA ao cancelar a maioria das licenças diretas do Claude Code e migrar engenheiros para o GitHub Copilot CLI
- O Claude Code foi oferecido a milhares de funcionários para experimentos de programação e rapidamente ganhou popularidade, mas, à medida que o uso aumentou, o peso dos custos também cresceu
- A Uber já esgotou todo o orçamento de ferramentas de programação com IA de 2026 em apenas quatro meses e incentiva o uso das ferramentas com um ranking interno entre equipes
- À medida que as empresas aumentam o uso de tokens para elevar a produtividade, a conta total pode crescer mesmo que o preço por token caia
- O Goldman Sachs estima que a IA agentiva pode aumentar o consumo de tokens em 24 vezes até 2030, e o Gartner também avalia que o crescimento do consumo pode superar a queda no preço unitário
Expansão do uso interno de IA nas empresas e pressão de custos
- A Microsoft começou a cancelar a maior parte das licenças diretas do Claude Code após reportagem do The Verge e está migrando engenheiros para o GitHub Copilot CLI
- O acesso ao Claude Code foi oferecido há seis meses a milhares de funcionários, incluindo desenvolvedores, gerentes de projeto e designers, para experimentos de programação, e rapidamente se tornou popular, mas, com a ampliação do uso, a questão dos custos ganhou destaque
- O cancelamento das licenças do Claude Code não afeta o acordo Foundry da Microsoft
- O acordo inclui um investimento de até US$ 5 bilhões na Anthropic, acesso dos clientes do Foundry aos modelos Claude e o compromisso da Anthropic de comprar US$ 30 bilhões em capacidade de computação da Azure
- O CTO da Uber, Praveen Neppalli Naga, disse ao The Information que a Uber já consumiu todo o orçamento de ferramentas de programação com IA de 2026 em apenas quatro meses
- A Uber incentiva ativamente a adoção com um ranking interno que classifica o uso de ferramentas de IA por equipe
- O vice-presidente de deep learning aplicado da Nvidia, Bryan Catanzaro, disse em entrevista à Axios: “No meu time, os custos de computação superam em muito os custos com funcionários”
- A Anthropic não respondeu imediatamente ao pedido de comentário da Fortune, e a Microsoft também não se manifestou
Como tokens mais baratos podem gerar contas maiores
- As empresas estão pressionando pela expansão do uso de IA entre os funcionários para aumentar a produtividade, mas, em um modelo de cobrança baseado em tokens, quanto maior o uso, maior o custo total
- Um funcionário da Meta criou um ranking chamado “Claudeonomics”, em referência ao modelo da Anthropic, para acompanhar o uso de IA por funcionário
- A Amazon está incentivando os funcionários a praticar “tokenmaxxing”, que significa usar o máximo possível de tokens, a unidade básica de computação de IA
- O Goldman Sachs projeta que, com a adoção de agentes de IA por consumidores e empresas, a IA agentiva poderá aumentar o consumo de tokens em 24 vezes até 2030, chegando a 120 sextilhões de tokens por mês
- O Gartner estima que, até 2030, o custo de inferência de um LLM de 1 trilhão de parâmetros será quase 90% menor do que em 2025, mas prevê que tokens mais baratos não levarão automaticamente à redução dos custos corporativos com IA
- Modelos agentivos exigem muito mais tokens por tarefa do que modelos padrão
- O crescimento do consumo pode superar a queda no preço unitário
- Provedores de IA podem não repassar integralmente a redução de custos aos consumidores
- Will Sommer, analista diretor sênior do Gartner, alertou: “Os CPOs não devem confundir a deflação dos tokens de uso geral com a democratização da inferência de fronteira”
- O CEO da Nvidia, Jensen Huang, disse que um dia 100 agentes de IA trabalharão junto com cada funcionário, mas, se o consumo de tokens crescer mais rápido do que a queda no preço unitário, esse futuro com agentes poderá trazer custos muito mais pesados do que os executivos imaginam
1 comentários
Opiniões no Hacker News
A discussão ativa baseada no texto original está aqui: https://news.ycombinator.com/item?id=48238896
O artigo diz: “The Verge informou que a Microsoft começou a cancelar a maior parte das licenças diretas do Claude Code”
A parte que diz “na cobrança baseada em tokens, quanto mais você usa e quanto mais eficiente fica, mais caro sai” também é estranha. Não entendo por que ficar mais eficiente aumentaria o custo
O título parece enganoso, e isso fica ainda mais claro ao ler o artigo. Essas empresas têm OKRs e metas absurdas do tipo queimar o máximo possível de tokens
Se você transforma uso de tokens em métrica, o resultado naturalmente fica caríssimo
O custo de inferência em si está num nível administrável, e também não é como se fosse obrigatório usar os modelos proprietários mais recentes para aplicar essa tecnologia de forma útil. Engenheiros humanos ainda vão ser necessários por bastante tempo, mas não concordo que “alguns humanos + LLM” vá ser mais caro do que simplesmente contratar mais humanos, nem que continue sendo mais caro
Neste momento, parece que o problema é mais liderança no feeling do que vibe coding, e liderança no feeling não tem relação intrínseca com IA. São pessoas que se agarram a uma intuição vaga e empurram conclusões ilógicas sem se importar com custo ou resultado
A premissa deste artigo está errada. A Microsoft cancelar o uso interno do Claude Code não é porque o custo da IA é alto demais, e sim porque ela possui o produto concorrente, o GitHub Copilot, e quer que os funcionários usem o produto da própria empresa
Foi pela mesma razão que o Teams recebeu tanta atenção durante o lockdown
Mas aquela equipe não usa LLM para desenvolvimento de software; ela é literalmente uma equipe de deep learning, que queima computação do jeito que equipes de deep learning fazem
Basta fazer uma continha rápida para ver que a Microsoft não pode estar pagando mais por IA do que por desenvolvedores. Há cerca de 80 mil funcionários em cargos de desenvolvimento de produto, e o custo total de um desenvolvedor sênior deve ficar em algo como US$ 400 mil
Será que a Microsoft tem uma fatura de Claude de US$ 32 bilhões? Acho que não
Só não entendo muito bem como o caso de o Teams ter recebido atenção durante o lockdown seria paralelo ao argumento anterior
Em nenhum lugar do artigo consta que a Microsoft teria relatado que a IA é mais cara do que funcionários humanos
Mesmo que a Microsoft não tenha dito isso explicitamente, o fato de a IA ser mais cara em si fica evidente
A moda do tokenmaxxing parece uma das ideias mais idiotas surgidas nesta onda de IA. Vai na direção oposta de maximizar eficiência e produtividade, e mesmo assim foi amplamente aceita
http://archive.today/l3EEo
A Microsoft cancelou o Claude porque o Copilot não é grande coisa e precisa ser usado diretamente. Isso é algo reconhecido internamente e não é segredo
Como os tokens da Anthropic estavam subsidiados até agora, pode até ser que, para a Microsoft, isso tenha ficado mais caro
Para analisar o custo do uso de IA, é preciso olhar o contexto de uso
Muita gente usa IA para polir documentos, conversas no Slack e e-mails, ou para gerar documentos desnecessariamente grandes a partir de prompts curtos. Não havia motivo para precisar de IA para mandar mensagens no Slack ou e-mails dentro da empresa. É desperdício de recursos e tempo para fazer algo parecer mais sofisticado sem mudar muito o significado
Queimar tokens é tão fácil quanto jogar dinheiro na fornalha
Uso de tokens não é uma boa métrica de produtividade. O problema é que ninguém ainda descobriu de verdade como medir uso produtivo de IA. É difícil distinguir se os desenvolvedores estão maximizando produtividade, só queimando tokens ou resistindo à mudança
IA não é mais cara do que pagar salários para funcionários humanos. A premissa do título está errada, porque a IA ainda não consegue substituir funcionários humanos