Acho que Anthropic e OpenAI encontraram o product-market fit

(simonwillison.net)

9 pontos por GN⁺ 2026-05-28 | 1 comentários | Compartilhar no WhatsApp

Os agentes de programação e de uso geral da Anthropic e da OpenAI estão mostrando maior potencial de receita em cobrança por uso para empresas do que em assinaturas para consumidores
Usuários avançados de Claude Code e Codex consomem, com uma assinatura mensal de US$ 200, o equivalente a US$ 2.180,16 em tokens pelos preços de API, mas clientes corporativos ficam de fora de descontos parecidos
Em abril de 2026, as duas empresas alinharam o custo Enterprise de Codex e Claude Code/Cowork aos preços públicos de API e também lançaram modelos de fronteira mais caros
Das 703 vagas da OpenAI, 229, e das 390 vagas da Anthropic, 105, podem ser classificadas como de vendas e suporte enterprise, indicando uma mudança clara para vendas diretas
As controvérsias de custo na Uber e na Microsoft podem ser interpretadas menos como fracasso da IA e mais como um sinal de precificação adequada, em que o cliente sente o peso do preço, mas ainda assim usa o produto

Clientes enterprise começaram a pagar preço de API

O plano Max de US$ 100/mês da Anthropic e o plano Pro de US$ 100/mês da OpenAI têm preço extremamente vantajoso para usuários intensivos de agentes de programação
Convertendo o uso dos últimos 30 dias para preço de tokens de API com ccusage, o Claude Code da Anthropic equivale a US$ 1.199,79 e o Codex da OpenAI a US$ 980,37
- Somados, isso significa usar US$ 2.180,16 em tokens por US$ 200
- A diferença é grande mesmo para o perfil de “usuário que usa bastante”, e não apenas para quem roda agentes o dia inteiro
A suposição de que empresas teriam descontos parecidos ao usar agentes em larga escala não se confirmou
A Anthropic aparentemente mudou, nos últimos 6 meses, seu plano Enterprise da estrutura anterior de “uso suficiente incluído para um dia típico de trabalho” para US$ 20 por assento por mês + cobrança de API por uso
- Em agosto de 2025, a empresa informava “Claude seats include enough usage for a typical workday”
- A reportagem do The Information é de 14 de abril de 2026, mas um porta-voz da Anthropic afirmou que a mudança de preços ocorreu em novembro de 2025
- Clientes antigos estão descobrindo a mudança no momento da renovação de contrato
A OpenAI também aplicou uma mudança de preços semelhante em abril de 2026
- De acordo com o Codex rate card, em 2 de abril de 2026 o preço do Codex deixou de ser por mensagem e passou a seguir o uso de tokens de API
- A mudança de 2 de abril valeu para planos novos e existentes Plus, Pro, ChatGPT Business e novos planos ChatGPT Enterprise
- Em 23 de abril, passou a valer também para todos os planos ChatGPT Enterprise existentes, incluindo Edu, Health, Gov e ChatGPT for Teachers
- Os preços aparecem como “créditos”, mas parecem corresponder ao custo de tokens de API por modelo
Em abril de 2026, o custo Enterprise do OpenAI Codex e do Anthropic Claude Code/Cowork passou a ser igual ao preço público de API
No mesmo mês, as duas empresas líderes em modelos também lançaram modelos de fronteira mais caros
- O GPT-5.5, lançado em 23 de abril, custa o dobro da API do GPT-5.4
- O Opus 4.7, lançado em 16 de abril, é cerca de 1,4x mais caro que o Opus 4.6 quando se leva em conta o novo tokenizador
Em abril de 2026, aconteceram ao mesmo tempo o lançamento de modelos de fronteira mais caros e a mudança para cobrar clientes enterprise com base em preço de API, em vez de manter grandes descontos anteriores

A avaliação de que chegaram ao product-market fit

A ofensiva repentina de preços da Anthropic e da OpenAI pode até estar ligada à preparação para IPO, mas o fator mais importante parece ser que produtos de agentes de programação e de uso geral como Claude Code/Cowork e Codex encontraram product-market fit
O ChatGPT conquistou enorme popularidade, mas foi difícil transformar essa popularidade em receita
- Em fevereiro, a OpenAI disse que o ChatGPT tinha mais de 900 milhões de usuários ativos semanais
- Havia 50 milhões de assinantes pagos no segmento consumidor, ou 5,6% do total
Cobrar US$ 10 a US$ 20 por usuário por mês é um negócio razoável, mas para sustentar um custo de infraestrutura de $1 trilhão, seria preciso manter entre 1 bilhão e 2 bilhões de assinantes por 4 anos
Já uma estrutura em que empresas gastam mais de US$ 200 por usuário por mês pode levar muito mais rápido a uma receita grande
- No perfil de power user, o uso já equivale a cerca de US$ 1.000 por mês em custo de API por fornecedor
Agentes de programação consomem muito mais tokens, mas estão se tornando ferramenta cotidiana de profissionais altamente remunerados
- Hoje, principalmente engenheiros de software
- Como podem automatizar tarefas executadas ao digitar comandos em um computador, também podem se aplicar a um grupo mais amplo de trabalhadores qualificados do conhecimento
Os modelos lançados em novembro de 2025 elevaram os agentes a um nível realmente útil, e nos 6 meses seguintes as empresas se adaptaram à tecnologia e começaram a aumentar os gastos reais
Dá para dizer que o ChatGPT alcançou product-market fit em fevereiro de 2023, quando se tornou o aplicativo de consumo com crescimento mais rápido da história, mas naquela época isso ainda não gerava receita substancial
A combinação de agentes de programação com a política de preços enterprise parece marcar o ponto em que essas empresas começaram a gerar receita muito concreta

Foco em enterprise aparece na expansão de contratações

Os anúncios públicos de vagas da OpenAI e da Anthropic também mostram sinais de que agentes enterprise atingiram product-market fit
A OpenAI tem atualmente 703 vagas abertas, das quais 229, ou 32,6%, se enquadram em vendas e suporte enterprise
- Isso inclui account executives, “Go To Market” e “Forward Deployed Engineers”
A Anthropic tem 390 vagas abertas, das quais 105, ou 26,9%, parecem ter perfil enterprise
É irônico que laboratórios de IA tenham escolhido um modelo de vendas enterprise intensivo em trabalho humano
- Fechar contratos enterprise exige a participação de muita gente
A análise de vagas foi feita raspando os sites de carreiras com Claude Code e usando a JSON API do Datasette, Datasette Cloud e Datasette Agent; o resultado foi publicado em um gist

Controvérsias de custo tratadas como fracasso da IA têm base fraca

Têm aumentado os relatos de que grandes empresas estão soando o alarme por causa da explosão de custos de uso de IA, mas os casos mais citados parecem exagerados
Caso Uber
- O caso mais discutido é a reportagem do The Information, segundo a qual o CTO da Uber, Praveen Neppalli Naga, disse que a empresa “consumiu todo o orçamento anual de IA em poucos meses de 2026”
- Grande parte do aumento de custo foi atribuída ao Claude Code
- Como o Claude Code só ficou realmente muito melhor em novembro de 2025, não surpreende que um orçamento montado em 2025 não tenha previsto a demanda de 2026
- Comentários de Andrew Macdonald, COO da Uber, no podcast Rapid Response também alimentaram a controvérsia, mas o trecho em questão é limitado
- Andrew Macdonald disse que 25% dos commits de código do trimestre anterior passaram pelo Claude Code, mas que é difícil ligar esse ganho de produtividade ao retorno efetivo, como ressuscitar projetos cancelados ou entregar 25% mais funcionalidades úteis aos consumidores
- Essa fala gerou manchetes como a do Business Insider, “está ficando mais difícil justificar gastos de AI tokenmaxxing”
Caso Microsoft
- Outro caso popular é a história de que a Microsoft começou a cancelar licenças do Claude Code
- Na superfície, a medida serviria para incentivar engenheiros a usar diretamente o agente próprio Copilot CLI
- Tom Warren, do The Verge, citou fontes dizendo que a decisão também teve motivos financeiros e estaria ligada ao encerramento do ano fiscal da Microsoft em 30 de junho
- Os dois casos podem ser lidos menos como fracasso da IA e mais como sinais de precificação adequada, em que o preço pesa para o cliente, mas o produto ainda é escolhido
- Isso se alinha à visão de que o bom preço de um produto é aquele que faz o cliente puxar o ar por um instante e ainda assim dizer “sim”
- O estouro de orçamento da Uber e o cancelamento de assentos na Microsoft parecem mostrar esse efeito no mundo real

O tamanho do gasto dos laboratórios de IA também é enorme

Grandes laboratórios de IA estão gastando bilhões de dólares tanto em treinamento quanto em inferência
Números exatos e confiáveis são raros, mas um SpaceX S-1 recente trouxe uma pista importante ligada à Anthropic
A SpaceX informou que, em maio de 2026, firmou Cloud Services Agreements com a Anthropic PBC para fornecer acesso à capacidade computacional do COLOSSUS e do COLOSSUS II
- A Anthropic concordou em pagar à SpaceX US$ 1,25 bilhão por mês até maio de 2029
O anúncio da Anthropic diz que esse acordo permite “aumentar os limites de uso do Claude Code e da Claude API”
- Isso sugere fortemente que o Colossus está sendo usado para inferência, e não para treinamento de modelos
A Anthropic já garantiu enorme capacidade computacional com outros fornecedores
- Estar disposta a gastar US$ 1,25 bilhão por mês apenas em capacidade adicional de um único fornecedor mostra o tamanho que o orçamento de inferência atingiu

Queda da importância relativa da receita de API

Nos últimos 2 anos, a OpenAI parecia ter maior peso de receita de assinaturas, enquanto a Anthropic parecia depender mais de receita de API
Historicamente, a receita de API da Anthropic dependia fortemente de um pequeno número de grandes clientes
- Segundo uma reportagem da VentureBeat de agosto de 2025, dois clientes — Cursor e GitHub Copilot — respondiam por US$ 1,2 bilhão dos US$ 4 bilhões de receita na época
Agora há rumores de que a Anthropic vai atingir $10,9 bilhões de receita no 2º trimestre e poderá registrar lucro operacional pela primeira vez
A virada para enterprise sugere que os laboratórios concluíram que há mais dinheiro em reduzir intermediários e vender diretamente ao cliente
O Claude Code da Anthropic concorre diretamente com Cursor e Copilot
- Também faz sentido, nesse contexto, que o Cursor esteja investindo em modelos próprios

Abril de 2026 é um novo ponto de inflexão

Novembro de 2025 pode ser visto como um November inflection point: foi quando GPT-5.1 e Opus 4.5, combinados com seus respectivos harnesses de agentes de programação, passaram a ser realmente utilizáveis
Nos 6 meses seguintes, as empresas vieram se adaptando a sistemas de agentes capazes de realizar tarefas úteis de forma estável
Abril de 2026 parece ser um novo ponto de inflexão em que o efeito sobre a receita dessa mudança tecnológica começou a aparecer de fato
- Em uma direção lucrativa para os laboratórios de IA de fronteira
- Em uma direção de impacto real para os orçamentos das grandes empresas
Quando os documentos S-1 de IPO da Anthropic e da OpenAI forem divulgados, será possível confirmar a substância desse momento com números auditados

1 comentários

GN⁺ 2026-05-28

Comentários do Hacker News

Nos próximos 5 anos, será preciso recuperar US$ 5 trilhões a US$ 10 trilhões e, se isso não acontecer, começarão a depreciar a expansão de hardware
Isso significa que seria necessário mais de US$ 1 trilhão por ano em gasto com tokens. Tomando como base 200 milhões de trabalhadores do conhecimento no mundo e 30 milhões de desenvolvedores, seria um mundo em que 5% de todos os salários dos trabalhadores do conhecimento, ou 20% no caso dos desenvolvedores, teriam de ir para tokens
Ao meu redor, dizem que essas ferramentas aumentam a velocidade em 20% a 40% em tarefas com as quais as empresas realmente se importam. Se for um aumento de 20% no gasto para um ganho de 20% em velocidade, é difícil justificar um gasto anual de US$ 1 trilhão
Ainda não chegamos lá. Agora estamos na fase ascendente do ciclo de hype, e, se isso não fizer os desenvolvedores ficarem 2x, 5x ou 10x mais produtivos em trabalho importante, parece improvável que termine bem
- Tenho algumas reflexões. Pelo que é público, a relação entre custo de inferência e custo de treinamento parece contraditória
  Engenheiros elétricos envolvidos com datacenters falam dos picos de consumo de energia durante execuções de treinamento como se fossem um fator central de projeto, mas artigos que tratam de scaling com custo ótimo tratam com bastante confiança o volume de computação na inferência como um fator importante
  Um argumento a favor da ideia de que o treinamento, mesmo depois de amortizado, é muito mais intensivo em computação do que a inferência é que provedores chineses, fortemente limitados no acesso a recursos computacionais, oferecem tokens quase ilimitados a preços mais baixos, mas com desempenho de modelo inferior. Faz sentido se a interpretação for que empresas americanas estão inflando os custos de inferência em 20 a 30 vezes por causa de custos amortizados de treinamento que concorrentes estrangeiros não conseguiram bancar
  Se o custo de treinamento for muito maior que o de inferência, eles estão em um dilema do prisioneiro muito mais severo do que no modelo competitivo normal de custo marginal zero. Por outro lado, se o custo de inferência for maior, então pode estar certa a análise de que isso é um negócio parecido com utility, como alguns pensadores dizem. Os CEOs têm um incentivo enorme para falar assim. Se a alternativa, o dilema do prisioneiro, ficar evidente, o investimento pode parar muito rapidamente
  O que chega minimamente perto dos fatos são apenas rumores de engenheiros de infraestrutura; o resto se parece mais com análise de alto nível e administração de poltrona sobre um negócio secreto. Isso mostra o nível atual de compreensão
  Se nem sabemos a proporção entre capex amortizado e custos operacionais, análise de investidor externo é impossível. Não adianta detalhar ao máximo a contabilidade de vasinhos de escritório e plantas de interior se a maior parte do negócio está escondida por segredo comercial
- Trabalho em uma empresa minúscula, com receita anual de US$ 150 milhões e margem líquida de 9%, e já estamos considerando gastar US$ 100 mil em hardware para rodar modelos locais, porque para nós isso já é bom o suficiente
  A projeção de gasto com AI-as-a-service deve ultrapassar esse custo em menos de um ano
  Parece que, em poucos anos, até empresas muito pequenas terão hardware a um preço viável para rodar modelos de ponta bons o bastante para a maior parte das tarefas
- Cada um observa coisas diferentes, mas minha observação também não é tão diferente. Só que essa é uma visão de baixo para cima. A esta altura, não deveríamos também estar vendo de cima para baixo?
  Se já passamos da fase de potencial e entramos em ganhos reais de produtividade, por que isso não aparece nos números do lado dos clientes?
  Por que a Delta Airlines não melhorou significativamente sua eficiência operacional nos últimos 3 meses por causa da adoção de software melhor?
  Pergunta sincera. Vejo uma desconexão
- Lembro com clareza de algo que um professor de econometria disse quando eu estava na faculdade no fim dos anos 1990 e início dos anos 2000
  Quando surgiram a TV a cabo e o Pay Per View, houve estudos sobre quanto as pessoas assistiriam a filmes se tivessem acesso ilimitado, e os resultados circulavam como se provassem a necessidade de instalar toda a infraestrutura que sustentaria esse negócio. Mas, quando os estatísticos analisaram melhor os dados, concluíram que as pessoas respondiam que veriam filmes todos os dias, 7 dias por semana, 10 a 12 horas por dia. Eram números impossíveis
  Agora sinto que estamos em um barco parecido. Parte das pessoas assume que todo mundo usará o máximo possível de tokens e que, mesmo com melhorias em hardware, software, projeto e pressão de mercado, o preço dos tokens nunca vai cair
- Um fator a considerar é que a população de referência não vai ficar a mesma nos próximos 5 anos
  Cada geração de ferramentas para desenvolvedores aumentou o throughput absoluto de código ao mesmo tempo em que criou novas camadas de desenvolvedores e usuários
  Foi assim desde os primeiros compiladores, passando pela era dos frameworks, até agora, e o nível de habilidade necessário para se tornar desenvolvedor foi caindo. No fim dos anos 1980, eram cientistas da computação com mestrado ou doutorado que conseguiam escrever aplicações; depois isso desceu para estudantes de graduação e engenheiros de TI, a teoria da computação em grande parte virou opcional, depois desceu para graduados com algum treinamento, e depois de ferramentas no-code/low-code como retool antes de 2022, agora está descendo ainda mais com serviços de geração de código por agentes como v0/Replit
  A próxima geração de desenvolvedores não vai construir aplicações e arquiteturas como a geração anterior. A maioria aqui também não construiria este próprio sistema no nível de qualidade em que o pg construiu esta plataforma, mas isso não importa se os usuários encontrarem valor. A enorme quantidade de aplicações corporativas de qualidade mediana já prova isso
  No fim, a lógica desses negócios é que os números de 200 milhões/30 milhões não vão ficar parados. Também acho que talvez essa mudança não seja grande nem rápida o bastante para justificar o capex. Mas também não é totalmente irrealista, já que Web 1, Web 2.0, SaaS e a revolução mobile também criaram novas camadas de usuários e desenvolvedores com bastante rapidez
  [1] O HN é um outlier forte por ser uma implementação Lisp customizada, mas em eras anteriores havia muitos exemplos, com escolhas menos extremas, de arquitetura sólida em produção, e talvez esse nível de habilidade seja difícil de encontrar na geração atual de fundadores
Esta análise é confusa. No lado de programação, o product-market fit (PMF) provavelmente já pode ter sido alcançado no ano passado. Rentabilidade é outra questão, e ainda não sabemos.
O texto mistura as duas coisas e ainda assim não apresenta um argumento econômico forte nem números convincentes. Também não entendo por que o caso da Uber seria relevante. O COO da Uber também disse claramente que, pelo menos do ponto de vista de retorno sobre investimento, os resultados não aparecem.
Na minha opinião, o produto já era muito útil para programação há alguns meses. Mas isso não significa, de forma alguma, que seja útil a qualquer custo.
- O ponto confuso é que as pessoas parecem estar ignorando a trajetória. Talvez essa seja a parte mais importante, mas está sendo soterrada.
  Como Simon disse, faz apenas 6 meses que surgiram agentes de programação “bons o suficiente”, e isso é um piscar de olhos. Mesmo assim, no nosso trabalho a minha função mudou completamente, e isso parece quase um sonho.
  E esse é apenas um ponto de inflexão. Já houve vários outros, e há mais pela frente. Posso até aceitar o argumento de que, com os gastos corporativos absurdos de hoje, o retorno sobre investimento talvez não seja positivo, mas preparar o caminho agora para o que vem em alguns meses — e ainda mais em alguns anos — é algo totalmente razoável.
- PMF é um conceito estranhamente definido como “se você não tem certeza de que existe, então não existe”.
  Para quem dedicou tempo para usar e entender, isso já era claramente útil há alguns meses, mas agora esse conhecimento se espalhou até chegar a quem controla o orçamento, que passou a se convencer de que não é só moda ou hype; por isso parece que agora dá para “afirmar” o PMF.
  Ainda assim, concordo que é estranho dizer “essas pessoas têm PMF”. Normalmente é um conceito definido em relação ao próprio produto.
- Sim. Custo também faz parte da viabilidade econômica.
  Por isso, muita gente aqui talvez fosse melhor nem entrar na discussão. Ficam apenas repetindo os benefícios, sem identificar nem explicar os custos e que impacto esses custos têm na saúde financeira da empresa.
- O texto coloca peso demais na palavra “bom”, o que me faz desconfiar da análise.
  “Chamamos novembro de 2025 de ponto de inflexão de novembro porque o GPT-5.1 e o Opus 4.5, combinados cada um com seu respectivo harness de agente de programação, ficaram melhores. Ficaram bons o suficiente para realizar trabalho útil com consistência, e por isso estivemos nos adaptando a sistemas de agentes nos últimos 6 meses.”
- Não precisa ser um texto lógico. Está mais para um blog de evangelização de LLM, e quase não há análise crítica que não seja favorável ao setor.
  Mesmo lendo outros textos, quase não se vê ceticismo; há muito mais conteúdo promovendo o quanto isso seria incrível.
Este texto tem um certo ar de psicose de IA.
“Essas ferramentas queimam muito mais tokens, mas estão rapidamente se tornando ferramentas cotidianas para trabalhos realizados por profissionais muito bem remunerados.”
“Por algum motivo, esse trecho acabou virando algo como a manchete ‘COO da Uber disse que está ficando mais difícil justificar os gastos excessivos com tokens de IA’, porque o mercado para histórias de fracasso da IA continua enorme.”
Sim, claro, é só um desejo de ver a IA fracassar. Não deve ter nada a ver com custos saindo do controle, receita recorde e demissões em massa. Também não deve existir a possibilidade de que pessoas já muito bem pagas estejam torrando dinheiro com essas ferramentas sem gerar nenhum aumento de “valor”. Reconheço que o volume produzido é 100 vezes maior, mas os resultados continuam estagnados em todas as métricas.
[1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
[2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...
- O que exatamente significa psicose?
Se o GLM-5.1 for parecido em qualidade, open source e muito mais barato, como OpenAI e Anthropic planejam reter clientes?
Não parece que o modelo de negócios vai funcionar. Um amigo muito próximo trabalha de fato com software de automação para grandes empresas e não usa nem Claude nem OpenAI
Ele usa principalmente o gpt 120b e o GLM-5.1 sobre a Cerebras para tarefas de raciocínio pesado, e outros modelos menores para várias outras tarefas. Tudo é open source
Esses sistemas são muito úteis para empresas e conseguem rodar pipelines totalmente automáticos muito estáveis e rápidos
Falamos disso com frequência, e nós dois achamos que as empresas que fazem trabalho pesado com agentes usando Claude e OpenAI talvez não saibam exatamente o quanto o open source melhorou e ficou mais barato no último ano
Então, quando as empresas e os desenvolvedores existentes alcançarem isso, Claude e OpenAI não vão conseguir recuperar os custos?
- O GLM-5.1 não está no mesmo nível. Não chega nem perto do Opus do Claude Code. É só testar você mesmo. Os modelos open source estão pelo menos 1 ano atrasados
- Concordo que o modelo de negócios não é visível. Pela ótica das 5 forças de Porter, é um pesadelo
  Vai haver uma quantidade enorme de empresas competindo nesse espaço e, embora exista algum fosso por ser intensivo em capital, na prática ainda haverá concorrentes quase infinitos
  Isso é bom para o consumidor
- Para programação, você sempre deve usar o melhor modelo da área naquele momento, não um modelo que teria sido o melhor um ano atrás. O GLM 5.1 está exatamente nessa posição
  Digo isso como um grande fã de usar o GLM em sites de tradução porque a relação custo-benefício dele é suficiente
  Hoje a maior parte do dinheiro está em programação. Se OpenAI e Anthropic estiverem só 6 meses à frente dos modelos open source de ponta, elas podem ficar com a maior parte do mercado corporativo e de desenvolvedores
- Para assistência de programação, já testei vários grandes modelos abertos no OpenCode via OpenRouter, e todos foram bem piores que o Claude Opus
  Você poderia dar alguma dica de como lidar com os modelos abertos para extrair mais valor deles?
  Concordo com a fala comum de que os modelos abertos estão cerca de 1 ano atrasados. Só que, cerca de 1 ano atrás, aconteceu aquela virada quase mágica em que os modelos de ponta ficaram extremamente úteis. Por essa lógica, os modelos abertos também deveriam funcionar bem em breve, mas fico preocupado que exista algo além de simplesmente esperar a Terra dar mais uma volta
  Para referência, meu caso de uso é assistência de programação. Para outros objetivos, os modelos abertos podem ser excelentes
- Para rodar esses modelos que supostamente são “tão bons quanto os de fronteira”, não seria preciso gastar US$ 5 mil a US$ 10 mil?
  Nunca vi uma análise convincente sobre o retorno sobre investimento de rodar um modelo de programação por conta própria, especialmente em comparação com planos de US$ 20 ou US$ 200 por mês
A expressão “US$ 2.180,16 em tokens por US$ 200” é estranha
Tokens não têm custo nem valor intrínseco. Dizer que usou US$ 2.180,16 em tokens é parecido com acreditar num vendedor dizendo que um jogo de panelas de US$ 19,99 vale US$ 1 bilhão
É engraçado ver as pessoas jogarem o pensamento crítico pela janela ao avaliar uma fonte enviesada
- Não entendi bem o que está sendo contestado aqui
  Eu gastei US$ 200. Se tivesse pago o preço de API, teria sido US$ 2.180,16. O texto diz que clientes corporativos pagam preço de API, então, se eu estivesse empregado numa empresa dessas, eu teria gerado um custo de US$ 2.180,16 para a empresa
  O que foi que eu deixei passar?
- Tokens claramente têm um custo intrínseco calculável. Existe o custo marginal de produção, ou seja, o custo de inferência, além do custo amortizado de P&D do modelo que gera esses tokens
  É difícil calcular o valor, mas felizmente o mecanismo de preços de mercado existe justamente para isso. Não há número melhor do que o preço que as pessoas estão dispostas a pagar
  Portanto, em um plano corporativo, isso acaba custando US$ 2.180,16. A pessoa em si não paga isso, mas a empresa paga
- Pelos cálculos aproximados dos meus projetos, pagar por token no OpenRouter pode ser competitivo ou até mais barato do que rodar os mesmos modelos com pesos abertos em GPUs alugadas
  O preço por token tanto para modelos fechados de fronteira quanto para modelos com pesos abertos fica em uma faixa parecida, de centavos a dólares por milhão de tokens. Para mim, isso sinaliza que esse preço tem algum lastro na realidade
- Com um mínimo de pensamento crítico, essa frase se lê como “tokens no valor de US$ 2.180 pelos preços atuais de API”
- Claro que existe custo intrínseco. O piso é a conta de luz. É realmente engraçado ver as pessoas abandonarem o pensamento crítico ao avaliar uma fonte enviesada
O timing real está no fato de que agora falta demanda forte por novos negócios e já foi acumulado capital técnico suficiente, então o trabalho está se tornando cada vez mais incremental
Isso significa que dá para construir funcionalidades estáveis sobre uma enorme base de trabalho passado, e é exatamente aí que a IA brilha. Então, com IA ou sem IA, se a maior parte do trabalho é incremental — adicionar uma funcionalidade, corrigir um bug, ajustar um pouco uma configuração — as empresas já teriam contratado menos engenheiros de software. A IA só acelerou essa pressão
Por outro lado, se imaginarmos a mesma IA 20 anos atrás, seria diferente. Na época em que as pessoas ainda tentavam entender JAX-RS, a IA teria realmente conseguido usar Jersey? Quando o React acabou de ser inventado, ela teria conseguido responder a todas as perguntas sobre React? Teria conseguido reduzir para um décimo o número de pessoas necessário para construir toda a infraestrutura de nuvem pública ou as chamadas plataformas de big data? Naquela época tudo evoluía rápido, então teria sido necessário um grande número de engenheiros para explorar inúmeras possibilidades. Também é muito duvidoso que a IA pudesse construir o ecossistema de machine learning com um décimo da força de trabalho. Há 20 anos, o padrão era R e o ecossistema Python não era nem de longe maduro. O mesmo vale para computação móvel: a IA teria reduzido para um décimo o número de pessoas construindo todos os apps móveis e a infraestrutura por trás deles?
- Sobre “a IA teria conseguido responder a todas as perguntas sobre React?”, acho que sim por causa do aprendizado em contexto (ICL)
  Sobre “teria conseguido construir infraestrutura de nuvem pública ou plataformas de big data com um décimo da equipe?”, acho que não. Ela não resolve os problemas centrais e, em escala, vira uma bagunça
  Quanto ao trabalho incremental, concordo. Mas historicamente a maior parte do trabalho sempre foi incremental, e os cargos de P&D eram minoria, na minha opinião
Temos que reconhecer o que é fato. Isso tudo é o maior golpe da história
A IA tem casos de uso úteis, mas não com os preços atuais. Uso IA desde a época do GPT-2 junto com bastante gente que usa pesado. Todos os usuários contam a mesma história: curiosidade, surpresa, hype, repulsa, percepção. As empresas geralmente chegam um pouco atrasadas e agora estamos no ciclo de hype. É exatamente nesse ponto que se vende todo tipo de contrato e se faz IPO
Um movimento bem típico de manual de VC
O que não se deve entender errado é que existem casos úteis para IA. Só que não do jeito que eles querem. É bem parecido com blockchain. A ideia de moeda descentralizada merece existir. Os outros 99% das moedas, não
A IA é um mecanismo de busca mais rápido, mas ainda menos preciso. É excelente para encontrar bugs e também é boa para rubber duck debugging
Chamo isso de golpe porque, junto com o marketing, passa para inúmeras pessoas no mundo a impressão de que agora elas podem criar startups, jogos, infraestrutura etc. sem precisar aprender por conta própria. O resultado são milhões de projetos e produtos abandonados e de baixa qualidade. A maioria nunca formou os modelos mentais necessários para resolver um problema de ponta a ponta. No fim, desperdiçam meses e dinheiro e só queimam tokens. É por isso que chamo de golpe
Todos os early adopters que eu conheço reduziram bastante o uso, não por causa do dinheiro, mas porque não surgiram novos casos de uso. Ao explorar um projeto novo, dá para fazer onboarding rápido, aprender bastante e depois passar para documentação e testes reais. Meu uso está no nível mais baixo dos últimos dois anos
Não vou deixar a IA mexer no meu código. Fico apreensivo de ela voltar rastejando. Em vez disso, deixo que ela leia meu código e me diga o que eu fiz de errado para eu me aprimorar
Centenas de empresas, incluindo soluções open source, conseguem oferecer isso
Meus amigos não técnicos estão todos no ciclo de hype agora e compartilham comigo a empolgação atual e a frustração previsível que vem depois
Em certo sentido, é impressionante que a IA tenha sido usada de forma tão completamente orientada por VC, de modo consciente ou inconsciente, para criar empresas gigantescas diante dos olhos do mundo inteiro
- Pode me ajudar a organizar o argumento original?
  Quer dizer que modelos de programação que consomem tokens são um golpe porque o retorno sobre o investimento não é positivo? Por exemplo, que não geram valor suficiente para justificar cobrar US$ 100 por mês?
  Quer dizer que os clientes corporativos não são inteligentes o bastante para perceber isso?
  Em última instância, quer dizer que é uma ilusão ao estilo blockchain e que vão fazer IPO para maximizar o ganho dos CEOs?
  Entendi direito, ou estou colocando palavras na sua boca?
  A parte de “passa para as pessoas a impressão de que agora elas podem criar sua própria startup, jogo, infraestrutura sem precisar aprender por conta própria” não seria um espantalho, já que não dá para afirmar as crenças e motivações das pessoas? A IA é uma ferramenta poderosa de amplificação humana. Você não pode simplesmente digitar um prompt como “crie um app enterprise SaaS avaliado em US$ 1 bilhão” ou “faça GTA6 sem alucinar”. Mas a impressão é que isso realmente está acontecendo? Dario e Sam estão dizendo “compre nossa assinatura do agente de programação e você poderá criar um jogo de uma vez só sem conhecimento técnico e ficar rico”?
  Não sentir valor em agentes de IA hoje é totalmente possível. Também pode simplesmente dar uma sensação ruim. Mas chamar isso de um golpe do mesmo nível de blockchain me parece contradizer sinais enormes, conversas reais sobre o que esses sistemas conseguem fazer hoje e o que se espera que façam até o fim deste ano
Pelo que li, a Anthropic na verdade não é lucrativa, e parece que só ficou com cara de lucrativa por um tempo por causa de descontos. Este texto defende bem essa tese: https://www.wheresyoured.at/anthropics-profitability-swindle...
Também sou cético quanto a se os aumentos de preço atuais já são suficientes e quanto a se a maioria dos usuários e empresas aceitará os aumentos de preço ainda maiores que serão necessários no futuro. Especialmente para usuários individuais, US$ 200 por mês já é caríssimo, e não acho que a maioria vá pagar algo como US$ 1.000 por mês
Acho que dá para simplesmente ignorar as notícias sobre LLM até depois que essas empresas fizerem IPO. Tem muito bot fabricando opinião positiva
US$ 200 por mês por assento não é nada
Um único pacote de licença de CAD 3D usado pelo pessoal do nosso grupo de P&D custa milhares de dólares por mês por assento
Já passou da hora de as licenças de software receberem mais amor
- AutoCAD custa US$ 175 por mês por usuário [1]
  [1] https://www.autodesk.com/products/autocad/buy
- Sim, não é nada, mas também não é o que as empresas realmente pagam. Como o texto diz, o preço é US$ 20 por mês por assento, com cobrança adicional de uso da API por token
  As empresas não estão pagando um “buffet livre” de plano fixo, e sim cobrança baseada em uso
- Mesmo a licença de CATIA mais cara que já vi custa cerca de US$ 600 por mês por usuário. Onde você viu “milhares de dólares” por assento?
- Se você somar agora o salário do engenheiro, vai ver que o assento de software já sai mais caro do que esse assento de P&D
- CAD vai virar uma ferramenta que todo trabalhador usa?

Acho que Anthropic e OpenAI encontraram o product-market fit

Clientes enterprise começaram a pagar preço de API

A avaliação de que chegaram ao product-market fit

Foco em enterprise aparece na expansão de contratações

Controvérsias de custo tratadas como fracasso da IA têm base fraca

Caso Uber

Caso Microsoft

O tamanho do gasto dos laboratórios de IA também é enorme

Queda da importância relativa da receita de API

Abril de 2026 é um novo ponto de inflexão

Leituras relacionadas

1 comentários

Comentários do Hacker News