1 pontos por GN⁺ 2026-04-23 | 1 comentários | Compartilhar no WhatsApp
  • Com o investimento adicional da Amazon, as empresas concordaram que a Anthropic gastará mais de US$ 100 bilhões na AWS ao longo dos próximos 10 anos, em uma estrutura de negócio que combina infraestrutura de nuvem e capital
  • Em troca, a Anthropic garantiu até 5 GW de nova capacidade computacional para treinar e operar o Claude; além do investimento em dinheiro, o direito de uso de infraestrutura real é um elemento central do acordo
  • O investimento total da Amazon subiu para US$ 13 bilhões, e esta estrutura é semelhante ao acordo de investimento fechado com a OpenAI dois meses atrás
  • No centro do acordo estão os chips customizados da Amazon, com escopo cobrindo do Trainium2 ao Trainium4, além da família Graviton
  • A Anthropic também garantiu opções de compra de capacidade para chips que serão lançados no futuro, e o anúncio alimentou especulações sobre uma nova captação da empresa e uma avaliação acima de US$ 800 bilhões

Visão geral do acordo

  • A Amazon concordou com um investimento adicional de US$ 5 bilhões, elevando seu investimento total na Anthropic para US$ 13 bilhões
  • O acordo inclui um compromisso de gastos na AWS por parte da Anthropic, que concordou em gastar mais de US$ 100 bilhões na AWS ao longo dos próximos 10 anos
    • Em troca, garantiu até 5 GW de nova capacidade computacional para treinar e operar o Claude
  • O acordo tem formato semelhante ao de outro investimento recente em IA feito pela Amazon
    • Não se trata apenas de investimento em dinheiro; serviços de infraestrutura de nuvem também fazem parte da estrutura do negócio

Comparação com o acordo da OpenAI

  • semelhança estrutural com o acordo que a Amazon fechou com a OpenAI há dois meses
    • A Amazon participou de uma rodada de captação de US$ 110 bilhões
    • Desse total, aportou US$ 50 bilhões
    • Nessa rodada, a avaliação pré-money da desenvolvedora do ChatGPT foi de US$ 730 bilhões
  • O acordo com a OpenAI também incluía, em parte, fornecimento de infraestrutura além do aporte direto em dinheiro

Infraestrutura e chips centrais

  • No centro deste acordo estão os chips customizados da Amazon
    • Graviton é uma CPU de baixo consumo de energia
    • Trainium é um chip acelerador de IA que compete com a Nvidia
  • O escopo do acordo com a Anthropic inclui do Trainium2 ao Trainium4
    • O Trainium4 ainda não está disponível
    • O chip mais recente, o Trainium3, será lançado em dezembro
  • A Anthropic também garantiu opções de compra de capacidade para futuros chips da Amazon
    • Quando novos chips forem disponibilizados, a empresa terá a opção de adquirir essa capacidade

Possibilidade de nova captação

  • Há menção de que este anúncio pode ser um indicativo de uma nova rodada de captação da Anthropic
  • Há reportagens de que fundos de venture capital propuseram aportar capital na Anthropic
    • Segundo essas reportagens, a avaliação da empresa nesse acordo pode ficar acima de US$ 800 bilhões

1 comentários

 
GN⁺ 2026-04-23
Comentários do Hacker News
  • Olhando para a situação atual, parece que a ilusão de rentabilidade está quase chegando ao fim. Fico em dúvida se o lucro está correspondendo às expectativas dos investidores, e até os movimentos de Anthropic e OpenAI em direção ao IPO parecem mais uma forma de ganhar tempo. O custo real dos tokens está começando a aparecer, e o gargalo de compute também é severo. Ver a tarifa de tokens 7,5 vezes maior do Opus 4.7 aumentou bastante a sensação de peso no custo, e como os modelos abertos são muito mais baratos, parece que, quanto mais as empresas ficarem sensíveis a custo, mais vulneráveis os dois grandes vão ficar. Fico pensando se datacenters e fornecimento de energia vão conseguir crescer rápido o suficiente, ou se isso tudo é um gigantesco all-in para chegar antes à AGI. Acima de tudo, o desempenho dos modelos parece estar estagnado, e em tarefas complexas chego até a sentir queda de produtividade
    • Acho que muitas empresas, desde o início, nunca precisaram estar no mercado aberto. Essa cultura de repetir demissões em massa para sinalizar que vai estancar a sangria quando o resultado trimestral vem ruim parece muito nociva e até ridícula. As empresas em que trabalhei também viveram sua era de ouro quando eram privadas, e no fim acabavam vendidas para companhias abertas maiores ao bater em barreiras econômicas. Acho que seria mais saudável existir um mercado alternativo em que só fossem possíveis investimentos de longo prazo e em que o dinheiro ficasse travado por alguns anos
    • Do ponto de vista de desenvolvimento de software, sinto que os modelos atuais justificam suficientemente o custo por token. Esse movimento me parece menos um sinal de excesso e mais uma decisão de garantir oferta com antecedência, já prevendo a demanda. Entendo isso como algo parecido com companhias aéreas comprando combustível futuro antecipadamente ou a Apple garantindo lotes de DRAM antes dos outros
    • Não sei o quanto esse pessimismo está conectado com a realidade. As empresas da Fortune 500 já foram além da fase de experimentar com companhias como a Anthropic e agora estão correndo para organizar como vão implantar isso em toda a organização e como estruturar a governança. Houve exagero, sem dúvida, mas a proposta de valor parece estar ficando cada vez mais concreta. Algumas empresas de IA podem ter prometido gastos excessivos, mas a Anthropic me parecia estar caminhando para a rentabilidade com relativa rapidez
    • Não discordo totalmente, mas tenho algumas contraposições. Primeiro, acho convincente a tese de que os provedores de modelos já são rentáveis se você olhar apenas o custo de servir tokens de inferência. O prejuízo parece vir da estrutura de treinamento da próxima geração de modelos. Os modelos abertos ainda têm uma diferença grande de desempenho, então, como os tokens ainda são relativamente baratos e o custo da alucinação é caro, não senti uma grande adoção de modelos abertos em agentes de código. Também não tenho convicção sobre a economia geral da IA, mas o valor de empresas como Meta e Microsoft já caiu um pouco, e os investidores também parecem estar mais atentos a sobreavaliação. Os sinais de alerta não são totalmente claros, mas os lucros corporativos ainda parecem saudáveis. Consultei esta análise do custo de tokens da Anthropic e esta matéria da Economist sobre lucros corporativos
    • Também sinto que essa direção está certa. Na prática, parece que os serviços já começaram a apertar os limites de uso. Eu uso Gemini Pro por causa do plano Google 5TB, e do lado de IDE também uso Github Copilot Pro, mas ultimamente o Gemini está batendo no limite muito mais rápido, a ponto de eu ver mensagens dizendo que já gastei meus tokens Pro por algumas horas. Antes eu conseguia usar ao longo da maior parte do dia, mas agora às vezes travo ainda pela manhã. Por isso estou considerando seriamente comprar ainda este ano um PC com GPU grande e migrar para execução local. Pelo rumo atual, parece mais provável que os custos subam bastante do que caiam
  • Se a situação é de precisar gastar US$ 100 bi, fico em dúvida se faz sentido continuar usando cloud de terceiros. Por melhor que seja a oferta da Amazon, numa escala dessas parece inevitável querer possuir a própria stack. Especialmente num setor tão competitivo, em que a margem deve se tornar importante em breve. Hoje os hyperscalers me passam a impressão de estar puxando o máximo possível de capital com projeções excessivamente otimistas, e acho que o pico desse ciclo está próximo ou talvez já tenha chegado
    • O problema é que a alternativa acaba sendo construir datacenters por conta própria. Pode ser que sejam necessários 2 nos EUA, 2 na Europa, 2 na Ásia, 1 na África e 1 na LATAM, e mais da metade deles teria de ficar pronta a tempo. Só que esse “a tempo” já é a parte difícil. Licenciamento com governos locais, negociação com concessionárias de energia, variáveis políticas, contratos militares, tudo isso pode fazer uma autorização cair por terra. Além disso, seria preciso comprar CPU, GPU, memória e equipamentos de rede, e o prazo de entrega de transformadores de energia industrial já passa de 5 anos. Instalações de tratamento de água também não avançam sem licença. E, no meio disso tudo, AWS ou Google não vão dar tratamento preferencial a um cliente se perceberem que ele pode sair. IA e LLM já são um ambiente competitivo complexo e frágil; tocar a construção de datacenters em paralelo parece menos diversificação e mais uma sentença de morte
    • Uma empresa sem nenhuma experiência em construir datacenters passar direto para operar compute na escala de US$ 100 bi parece um objetivo de altíssimo risco para várias décadas
    • Vejo esse tipo de compromisso como uma forma de empurrar parte do risco para operadores de infraestrutura como Amazon ou Oracle. Mesmo que Anthropic ou OpenAI errem a previsão, a empresa de infraestrutura ainda pode vender esses ativos para outros clientes ou usá-los internamente. Por outro lado, se a demanda vier acima do esperado, mais capital de VC pode entrar e expulsar concorrentes mesmo a um custo maior. Se a empresa construir tudo sozinha e errar a demanda, o erro sai muito mais caro; no fim, entendo isso como compartilhamento de risco
    • Acho que a resposta já está no artigo. O contrato da Anthropic inclui até o Trainium4, que ainda nem foi lançado, e também garante a opção de comprar capacidade nas próximas gerações de chips da Amazon quando elas saírem. Ou seja, parece menos sobre o agora e mais sobre reservar com antecedência o direito de oferta ao longo de todo o roadmap futuro de chips
    • Vi uma vez no Facebook um gráfico mostrando o dinheiro circulando entre algumas poucas empresas no topo da IA, e foi realmente chocante. Parecia quase um giro de dinheiro, a ponto de passar uma impressão próxima de fraude
  • Fico curioso sobre qual é exatamente a expectativa em torno dos labs de IA. Aos meus olhos, os produtos deles já parecem quase totalmente comoditizados, e há muitos concorrentes open source fortes. No fim, parece que vai ficar cada vez mais difícil justificar o prêmio cobrado por esses modelos
    • Tenho a sensação de que a tal situação Mythos, seja real ou exagerada, aponta para o fim de jogo. Se surgir um modelo forte o bastante para impactar profundamente o mundo, talvez a preocupação deixe de ser vendê-lo para consumidores e passe a ser usá-lo para dominar a economia por conta própria, ou então o risco de ele ser estatizado por algum Estado. Se você tem uma máquina capaz de automatizar tudo, por que vender acesso a ela?
    • Acho bem provável que os modelos open source alcancem totalmente os fechados em 1 a 2 anos. O produto é commodity e o modelo também é commodity. Hoje o gargalo é só a dificuldade de garantir núcleos de GPU para inferência em larga escala. No fim, o que vai importar é uma plataforma capaz de gerar lock-in, e não vejo por que ela não poderia ser baseada em modelos open source
    • Acho que agentes de código já estão sendo colocados em produção em praticamente todas as grandes empresas de tecnologia. Em algumas, quase sem limite de tokens: se você consegue explicar o resultado, pode usar à vontade. As empresas estão incorporando esses tools aos fluxos de trabalho e começando a documentar processos internos em torno de ferramentas específicas. Quando isso começa a rodar, a replicação para o resto da organização acontece rápido. Se a Anthropic já chegou a US$ 30 bi em receita e isso ainda for só o começo da implantação em massa de coding, fica difícil ignorar esse número
    • Esses modelos são commodity, mas ao mesmo tempo também são armas cibernéticas. Países em competição militar vão querer IA melhor para ter capacidades cibernéticas e de inteligência mais fortes, e por isso talvez não escolham um único laboratório, mas coloquem várias empresas de defesa em IA para competir entre si. Assim como os EUA venderam armas para vários países no passado, no futuro China, EUA e França talvez acabem vendendo capacidade cibernética baseada em IA. E, como cada país também não vai confiar completamente na cloud de outro em questões de segurança, pode surgir a necessidade de datacenters próprios para rodar clusters dos fornecedores preferidos
    • Não acho que nenhuma empresa tenha fosso competitivo. Sinto que a OpenAI já perdeu a liderança, e hoje ninguém está claramente vencendo. No fim, isso parece um jogo de galinha queimando GPUs que provavelmente nem vão durar tanto assim. Como referência, vi esta imagem comparativa
  • Tenho a sensação de que a captação de dinheiro está acelerando antes que modelos locais para consumidor fiquem bons o bastante em poucos anos. Hoje a demanda está explodindo, mas quando a inferência on-device se firmar, a demanda pode despencar de repente, e tudo isso passa uma impressão de castelo de cartas
    • Sinto que já vivo parcialmente nesse futuro. Se você tiver um framework de execução decente com gerenciamento de contexto, memória baseada em unix e mecanismos de busca e acesso à web, um modelo local já pode ser usado de forma praticamente equivalente aos modelos de fronteira. Às vezes a velocidade é até melhor. Enquanto as empresas de IA ainda oferecerem preços subsidiados e continuarem na liderança, eu pago; mas no fim dá para usar os serviços delas para bootstrapar a própria queda delas. Sempre vou preferir rodar meu software no meu próprio computador por muito tempo
    • Também estou esperando esse momento. Talvez a combinação de um motor de LLM para código em hardware customizado de alto desempenho como o taalas com um agente de código open source seja a saída. Se o preço ficar na faixa de uma placa de vídeo topo de linha, com o tempo pode compensar bem. Parece uma repetição da transição dos mainframes da IBM para os PCs
    • Os modelos para consumidor já são bem bons, e o verdadeiro gargalo da inferência local é o hardware. Modelos pequenos rodam em praticamente qualquer dispositivo, mas, quanto mais conhecimento e contexto maior você quiser, mais os requisitos crescem de forma abrupta
  • Fiquei me perguntando se isso não é, no fundo, algo mais próximo de uma circulação de dinheiro e dívida, como pareceu acontecer entre Nvidia e OpenAI
    • No caso da Nvidia com a OpenAI, o que circulou de fato foram placas de vídeo, e financiamento por parte do fornecedor em si é algo comum, parecido com concessionária de carro que embute crédito para vender o veículo
    • Lembro que a Oracle também entrou nisso e depois acabou levando uma pancada
    • Para desenvolvimento de chips, chegar à fronteira exige economia de escala no fim das contas. Então sustentar a demanda via estrutura financeira para criar essa escala me parece menos um esquema Ponzi e mais um arranjo racional. A Anthropic garante acesso a compute escasso, e a Amazon ganha demanda e feedback de campo para justificar mais P&D e capex
  • Não sou especialista em economia, mas fiquei curioso sobre como funciona uma estrutura em que a Amazon dá US$ 5 bi e depois recebe esse dinheiro de volta multiplicado por 20
    • Entendo que os US$ 5 bi não são simplesmente dados, mas sim um investimento em participação, combinado com um compromisso de gasto. Se forem US$ 100 bi em uso contratados ao longo de 10 anos, esses US$ 5 bi podem ser consumidos em menos de 3 anos, talvez até antes disso. Na minha leitura, a Amazon concede créditos de uso e recebe participação acionária; se a Anthropic der certo, é um ótimo negócio para a Amazon. Se der errado, pode haver perda no investimento, mas ela ainda garante algo como US$ 5 bi de receita operacional e justificativa para expandir capacidade. Para a Anthropic, é uma estrutura que compra mais tempo de sobrevivência mesmo sem bater os números imediatamente. No fim, parece uma aposta de que aumentar capacidade na Amazon com dinheiro da própria Amazon pode ser mais rápido do que construir capacidade própria com dinheiro de terceiros
    • O ponto central é a necessidade de compute em grande escala agora. A Amazon disse que está investindo US$ 5 bi hoje e pode adicionar até US$ 20 bi depois, além dos US$ 8 bi já investidos antes. Com este acordo, dizem que haverá aumento relevante de capacidade em 3 meses e quase 1 GW no total antes do fim do ano. Vi isso no anúncio da Anthropic
    • No fim, dá para entender isso mais facilmente como receber US$ 5 bi agora e, em troca, gastar algo como US$ 10 bi por ano em compute que de qualquer forma já teria de ser pago
    • Isso não é lucro puro de US$ 100 bi para a Amazon, porque há um serviço com custo operacional envolvido. E a Anthropic já precisaria gastar esse dinheiro para operar o negócio; então parece menos um desconto futuro e mais uma espécie de desconto antecipado: recebe caixa agora e paga preço normal depois
    • Entendi de forma parecida. Como o gasto com infraestrutura já aconteceria de qualquer jeito, isso me parece um contrato para a Amazon amarrar esse gasto à AWS em troca dos US$ 5 bi
  • No fim, me veio a piada de que a Anthropic basicamente conseguiu um cashback de 5% da Prime Visa em escala empresarial. Dá até a sensação de que as empresas de IA, no fundo, não são tão diferentes da gente
  • Olhando para a situação geopolítica atual, imagino que a capacidade de produção de chips de memória e de vários CPUs e GPUs possa diminuir. Algumas notícias que vi sobre Japão, Coreia do Sul e Singapura reforçaram essa preocupação. Se essa previsão estiver certa, o custo de construir novos datacenters pode subir fortemente, o que preocupa
  • Quando essa loucura acabar, fico preocupado se no fim os contribuintes vão ter de socorrer empresas assim
    • Isso só acontece se a gente deixar. No fim, a resposta é votar mesmo