1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • A Microsoft está reduzindo os custos de ferramentas internas de IA ao cancelar a maioria das licenças diretas do Claude Code e migrar engenheiros para o GitHub Copilot CLI
  • O Claude Code foi oferecido a milhares de funcionários para experimentos de programação e rapidamente ganhou popularidade, mas, à medida que o uso aumentou, o peso dos custos também cresceu
  • A Uber já esgotou todo o orçamento de ferramentas de programação com IA de 2026 em apenas quatro meses e incentiva o uso das ferramentas com um ranking interno entre equipes
  • À medida que as empresas aumentam o uso de tokens para elevar a produtividade, a conta total pode crescer mesmo que o preço por token caia
  • O Goldman Sachs estima que a IA agentiva pode aumentar o consumo de tokens em 24 vezes até 2030, e o Gartner também avalia que o crescimento do consumo pode superar a queda no preço unitário

Expansão do uso interno de IA nas empresas e pressão de custos

  • A Microsoft começou a cancelar a maior parte das licenças diretas do Claude Code após reportagem do The Verge e está migrando engenheiros para o GitHub Copilot CLI
  • O acesso ao Claude Code foi oferecido há seis meses a milhares de funcionários, incluindo desenvolvedores, gerentes de projeto e designers, para experimentos de programação, e rapidamente se tornou popular, mas, com a ampliação do uso, a questão dos custos ganhou destaque
  • O cancelamento das licenças do Claude Code não afeta o acordo Foundry da Microsoft
    • O acordo inclui um investimento de até US$ 5 bilhões na Anthropic, acesso dos clientes do Foundry aos modelos Claude e o compromisso da Anthropic de comprar US$ 30 bilhões em capacidade de computação da Azure
  • O CTO da Uber, Praveen Neppalli Naga, disse ao The Information que a Uber já consumiu todo o orçamento de ferramentas de programação com IA de 2026 em apenas quatro meses
  • A Uber incentiva ativamente a adoção com um ranking interno que classifica o uso de ferramentas de IA por equipe
  • O vice-presidente de deep learning aplicado da Nvidia, Bryan Catanzaro, disse em entrevista à Axios: “No meu time, os custos de computação superam em muito os custos com funcionários”
  • A Anthropic não respondeu imediatamente ao pedido de comentário da Fortune, e a Microsoft também não se manifestou

Como tokens mais baratos podem gerar contas maiores

  • As empresas estão pressionando pela expansão do uso de IA entre os funcionários para aumentar a produtividade, mas, em um modelo de cobrança baseado em tokens, quanto maior o uso, maior o custo total
  • Um funcionário da Meta criou um ranking chamado “Claudeonomics”, em referência ao modelo da Anthropic, para acompanhar o uso de IA por funcionário
  • A Amazon está incentivando os funcionários a praticar “tokenmaxxing”, que significa usar o máximo possível de tokens, a unidade básica de computação de IA
  • O Goldman Sachs projeta que, com a adoção de agentes de IA por consumidores e empresas, a IA agentiva poderá aumentar o consumo de tokens em 24 vezes até 2030, chegando a 120 sextilhões de tokens por mês
  • O Gartner estima que, até 2030, o custo de inferência de um LLM de 1 trilhão de parâmetros será quase 90% menor do que em 2025, mas prevê que tokens mais baratos não levarão automaticamente à redução dos custos corporativos com IA
    • Modelos agentivos exigem muito mais tokens por tarefa do que modelos padrão
    • O crescimento do consumo pode superar a queda no preço unitário
    • Provedores de IA podem não repassar integralmente a redução de custos aos consumidores
  • Will Sommer, analista diretor sênior do Gartner, alertou: “Os CPOs não devem confundir a deflação dos tokens de uso geral com a democratização da inferência de fronteira”
  • O CEO da Nvidia, Jensen Huang, disse que um dia 100 agentes de IA trabalharão junto com cada funcionário, mas, se o consumo de tokens crescer mais rápido do que a queda no preço unitário, esse futuro com agentes poderá trazer custos muito mais pesados do que os executivos imaginam

1 comentários

 
GN⁺ 4 시간 전
Opiniões no Hacker News
  • A discussão ativa baseada no texto original está aqui: https://news.ycombinator.com/item?id=48238896
    O artigo diz: “The Verge informou que a Microsoft começou a cancelar a maior parte das licenças diretas do Claude Code”

    • Parece que este artigo foi escrito de forma bem descuidada
      1. Não há nenhuma citação em que a Microsoft diga que a IA é mais cara do que funcionários
      2. Dizem que a equipe de deep learning da Nvidia gasta mais com IA do que com funcionários, mas isso faz sentido, porque o objetivo dessa equipe não é codificação agentic, e sim uso pesado e profundo de IA
        A parte que diz “na cobrança baseada em tokens, quanto mais você usa e quanto mais eficiente fica, mais caro sai” também é estranha. Não entendo por que ficar mais eficiente aumentaria o custo
  • O título parece enganoso, e isso fica ainda mais claro ao ler o artigo. Essas empresas têm OKRs e metas absurdas do tipo queimar o máximo possível de tokens
    Se você transforma uso de tokens em métrica, o resultado naturalmente fica caríssimo
    O custo de inferência em si está num nível administrável, e também não é como se fosse obrigatório usar os modelos proprietários mais recentes para aplicar essa tecnologia de forma útil. Engenheiros humanos ainda vão ser necessários por bastante tempo, mas não concordo que “alguns humanos + LLM” vá ser mais caro do que simplesmente contratar mais humanos, nem que continue sendo mais caro

    • Daria para dizer simplesmente assim: a empresa adotou um OKR para o departamento de TI gastar mais de US$ 1.000 por dia por desenvolvedor. A empresa se surpreende ao ver que os custos de TI ficaram muito maiores do que antes. E então aumenta isso para US$ 1.500 por dia por desenvolvedor, dizendo que vai criar um sistema para descobrir por que isso está acontecendo
      Neste momento, parece que o problema é mais liderança no feeling do que vibe coding, e liderança no feeling não tem relação intrínseca com IA. São pessoas que se agarram a uma intuição vaga e empurram conclusões ilógicas sem se importar com custo ou resultado
    • Pelo artigo, parece mais que não desistiram de “IA”, e sim trocaram o LLM do Claude Code para o GitHub Copilot
    • Lei de Goodhart: quando uma métrica vira a meta, ela deixa de ser uma boa métrica
    • Fico pensando se os números de receita que empolgam os investidores não se baseiam justamente nesse mundo em que token é métrica. Não dá para ser, ao mesmo tempo, um negócio de crescimento explosivo e algo em que o ROI só aparece se você passar a gastar com muito mais rigor
    • A imprensa parece decidida a detonar a IA. O feed de notícias só traz artigos sobre o mal dos datacenters, a inutilidade da IA e como todo mundo odeia IA
  • A premissa deste artigo está errada. A Microsoft cancelar o uso interno do Claude Code não é porque o custo da IA é alto demais, e sim porque ela possui o produto concorrente, o GitHub Copilot, e quer que os funcionários usem o produto da própria empresa
    Foi pela mesma razão que o Teams recebeu tanta atenção durante o lockdown

    • Sim. O artigo misturou as ações da Microsoft com uma questão de custo, quando na verdade não é por custo. E ainda anexou uma citação aleatória de um “vice-presidente de deep learning aplicado da Nvidia”, fazendo parecer que ele dizia que, na equipe dele, o custo de computação é maior do que o custo com pessoal
      Mas aquela equipe não usa LLM para desenvolvimento de software; ela é literalmente uma equipe de deep learning, que queima computação do jeito que equipes de deep learning fazem
      Basta fazer uma continha rápida para ver que a Microsoft não pode estar pagando mais por IA do que por desenvolvedores. Há cerca de 80 mil funcionários em cargos de desenvolvimento de produto, e o custo total de um desenvolvedor sênior deve ficar em algo como US$ 400 mil
      Será que a Microsoft tem uma fatura de Claude de US$ 32 bilhões? Acho que não
    • As duas coisas podem ser verdade. O Claude pode ser caro demais e, ao mesmo tempo, eles podem querer migrar os funcionários para o Copilot. Por ser produto próprio, o custo cai e, com isso, podem esperar mais uso e mais feedback
      Só não entendo muito bem como o caso de o Teams ter recebido atenção durante o lockdown seria paralelo ao argumento anterior
  • Em nenhum lugar do artigo consta que a Microsoft teria relatado que a IA é mais cara do que funcionários humanos

    • Uau... o que aconteceu com a Fortune? Eu achava que era um veículo muito melhor do que esse tipo de clickbait
    • Talvez tenha faltado uma palavra no título da postagem. Deveria ser algo como “Microsoft reports show AI is more expensive...”
      Mesmo que a Microsoft não tenha dito isso explicitamente, o fato de a IA ser mais cara em si fica evidente
  • A moda do tokenmaxxing parece uma das ideias mais idiotas surgidas nesta onda de IA. Vai na direção oposta de maximizar eficiência e produtividade, e mesmo assim foi amplamente aceita

  • http://archive.today/l3EEo

  • A Microsoft cancelou o Claude porque o Copilot não é grande coisa e precisa ser usado diretamente. Isso é algo reconhecido internamente e não é segredo
    Como os tokens da Anthropic estavam subsidiados até agora, pode até ser que, para a Microsoft, isso tenha ficado mais caro

  • Para analisar o custo do uso de IA, é preciso olhar o contexto de uso
    Muita gente usa IA para polir documentos, conversas no Slack e e-mails, ou para gerar documentos desnecessariamente grandes a partir de prompts curtos. Não havia motivo para precisar de IA para mandar mensagens no Slack ou e-mails dentro da empresa. É desperdício de recursos e tempo para fazer algo parecer mais sofisticado sem mudar muito o significado

    • Para esse tipo de uso, o custo costuma ser bem baixo
  • Queimar tokens é tão fácil quanto jogar dinheiro na fornalha
    Uso de tokens não é uma boa métrica de produtividade. O problema é que ninguém ainda descobriu de verdade como medir uso produtivo de IA. É difícil distinguir se os desenvolvedores estão maximizando produtividade, só queimando tokens ou resistindo à mudança

    • É a nova métrica de linhas de código
  • IA não é mais cara do que pagar salários para funcionários humanos. A premissa do título está errada, porque a IA ainda não consegue substituir funcionários humanos