1 pontos por GN⁺ 2026-01-07 | 1 comentários | Compartilhar no WhatsApp
  • A AWS aumentou em cerca de 15% os preços das instâncias de GPU do EC2 Capacity Blocks for ML, com as tarifas horárias das instâncias p5e.48xlarge e p5en.48xlarge subindo, na maioria das regiões, de $34.61 para $39.80 e de $36.18 para $41.61, respectivamente
  • Na região US West (Northern California), houve um aumento ainda maior, de $43.26 para $49.75
  • Em um e-mail, a AWS explicou que “este ajuste reflete os padrões de oferta e demanda
  • O aumento veio depois do anúncio anterior de corte de até 45% nos preços de instâncias de GPU (há 7 meses) e é um caso raro em que a AWS elevou preços diretamente
  • O episódio quebra a regra não escrita de redução de preços no setor de nuvem e pode influenciar outros serviços de recursos no futuro

Visão geral do aumento de preços de GPU da AWS

  • A AWS elevou em cerca de 15% os preços do EC2 Capacity Blocks for ML em um sábado, no fim de semana
    • A instância p5e.48xlarge passou de $34.61 para $39.80 por hora, e a p5en.48xlarge de $36.18 para $41.61
    • Na região US West (Northern California), o aumento foi maior, de $43.26 para $49.75
  • Na página oficial de preços da AWS havia a mensagem de que “os preços seriam atualizados em janeiro de 2026”, mas sem indicar que a mudança seria para cima
  • Em e-mail, a AWS explicou que “os preços variam de acordo com os padrões de oferta e demanda, e este ajuste reflete os padrões esperados para o trimestre”

Natureza do Capacity Blocks e perfil dos usuários

  • Capacity Blocks é um serviço para reservar e garantir recursos de GPU em um momento específico, permitindo executar cargas de treinamento de ML com mais estabilidade
    • É possível reservar instâncias de GPU para um período específico, de um dia até várias semanas depois, pagando uma tarifa fixa antecipadamente
  • Os clientes que usam esse serviço são, em sua maioria, equipes corporativas tocando grandes projetos de ML, com orçamentos na casa de milhões de dólares
  • Há 7 meses, a AWS reduziu em até 45% os preços on-demand e de Savings Plans para instâncias de GPU, mas este aumento se aplica apenas ao Capacity Blocks

Impacto no setor e nos clientes

  • A AWS já ajustou preços antes, mas um aumento direto de item de linha (line-item increase) é raro
    • Antes, o mais comum era alterar a estrutura de preços ou divulgar a mudança como tendo “efeito de redução para a maioria dos clientes”
  • Desta vez, o aumento cria um ponto de comparação favorável para Azure e GCP
    • As duas concorrentes estão tentando atrair cargas de trabalho de ML de forma agressiva, e o fato de que “a AWS aumentou os preços de GPU em 15%” pode virar argumento comercial
  • Clientes corporativos que usam o Enterprise Discount Program (EDP) manterão a taxa de desconto, mas ainda assim terão custo real maior por causa do aumento do preço-base

Situação do mercado e perspectivas

  • Com a oferta global de GPUs ainda limitada, o aumento é interpretado como um sinal de desequilíbrio entre oferta e demanda
  • Ao longo de 20 anos, a AWS consolidou a percepção de que “os preços sempre caem”, mas esta medida quebra essa premissa
  • Depois que um aumento é implementado e a reação do mercado é pequena, a probabilidade de novos reajustes sobe
  • Há menção à possibilidade de ajustes semelhantes no futuro em outros serviços, como instâncias Graviton ou custos de transferência de dados
  • O artigo afirma que “a crença de que os preços da nuvem só seguem uma direção desapareceu em um sábado de janeiro de 2026

Conclusão

  • Este aumento no preço de GPU é visto como um ponto de inflexão na política de preços da AWS
  • Ele abalou a confiança na estabilidade de custos no mercado de nuvem e
    levantou a possibilidade de novos aumentos em recursos com oferta restrita

1 comentários

 
GN⁺ 2026-01-07
Comentários do Hacker News
  • Ver os preços de GPU, RAM e disco rígido subindo faz imaginar um futuro em que computadores domésticos são substituídos por thin clients e toda a computação migra para serviços por assinatura
    Slogans como “você não precisa de armazenamento, use uma assinatura de nuvem” e “você não precisa de poder de processamento, faça streaming dos jogos” podem acabar virando realidade
    Como as empresas de jogos já estudam modelos de cobrança por hora, a estrutura de jogos como Call of Duty ou GTA pode mudar completamente
    A mídia física pode desaparecer, o armazenamento do iPhone pode encolher ainda mais, e tudo pode acabar sendo empurrado para o iCloud
    Isso também faz pensar num cenário com compartilhamento de carros autônomos em vez de propriedade de automóveis, e numa sociedade centrada em entregas por drone após o fechamento das lojas físicas

    • Os preços dos serviços por assinatura também estão subindo. Quem já comprou um computador talvez consiga aguentar por alguns anos, mas usuários de aluguel já estão sentindo o impacto imediato
    • O despertador que ganhei de Natal (Hatch.co) não funciona sem uma assinatura anual de 50 dólares. Os consumidores precisam entender melhor o custo total de propriedade (TCO). Talvez o governo devesse exigir um selo com o custo anual, como acontece com eletrodomésticos
    • A cadeia de suprimentos é tão frágil que, com a TSMC detendo 60% de participação de mercado, se a China invadir Taiwan, mais da metade da produção mundial de CPU e GPU pode desaparecer. Nesse caso, talvez o iPhone deixe de ser vendido e um PC passe a custar 5 mil dólares
    • MMORPGs já usam modelo de assinatura mensal há muito tempo. Mas a maioria dos jogos provavelmente arrecadaria menos se migrasse para cobrança por hora. As pessoas compram muitos jogos, mas na prática quase não jogam
    • Essa tendência já foi teorizada no conceito chamado Technofeudalism (tecnofeudalismo) (link da Wikipedia)
  • A frase “hopes you weren't paying attention” no título da matéria parece sensacionalista demais
    Parece apenas um caso de lei de mercado, com a demanda por GPU e RAM acima da oferta

    • É o tipo de manchete provocativa característico do The Register. A intenção é gerar clique, e dessa vez claramente funcionou
    • A oferta de GPU e RAM não muda de repente de um fim de semana para o outro. Não havia motivo para aumentar os preços justamente no sábado
    • É estranho anunciar aumento de preço num sábado, quando os clientes não estão trabalhando
    • Mesmo com economia de ensino médio já dá para apontar que empresas assim, até agora, só vêm gerando dívida e produtividade ruim
  • Sobre a matéria do aumento de preços da AWS, é confuso escreverem “atualização planejada” sem indicar a direção da mudança, se seria aumento ou redução
    Quem já é cliente não fica olhando a página de preços todos os dias, então esse tipo de aviso acaba sendo, na prática, uma comunicação pouco transparente

    • Entre os comentários, houve uma sátira ao jeito da AWS de comunicar isso, com a piada de O Guia do Mochileiro das Galáxias sobre “a placa estar numa gaveta trancada dentro de um banheiro fechado”
  • Houve críticas à ideia de estender a depreciação de GPUs de 3 para 5 anos, mas este aumento de preço parece, na verdade, mostrar que a vida útil econômica das GPUs está ficando mais longa

    • Não sou especialista, mas o aumento de preço também pode ser um sinal de vida útil mais curta. Tanto queda na oferta quanto alta na demanda são possibilidades. A demanda por GPU pode estar ficando inelástica, o que empurra ainda mais os preços para cima
    • Depende do quanto a NVIDIA exagerou nos ganhos de desempenho. Se recursos de RL, separação entre prefill/decode e melhorias estruturais como nvfp4 realmente aumentaram a eficiência, então chips antigos continuam bastante úteis
    • GPUs topo de linha podem de fato ser usadas por mais de 6 anos. Com boa refrigeração, talvez durem perto de 10 anos. Especialmente modelos com 80GB de VRAM ou mais têm alto valor de longo prazo
  • A IA em nuvem é, para a maioria das empresas, apenas um imposto de conveniência
    Documentos, previsões, monitoramento, suporte e sistemas de controle podem ser processados tranquilamente com modelos locais. Considerando gravidade dos dados, latência e privacidade, ter hardware de edge faz mais sentido

    • Eu também estou prototipando LLMs para vários usos, e o problema maior é confiabilidade, não custo. A diferença entre 99,95% e 99% pode gerar perdas maiores que o custo de mão de obra. Em áreas onde esse cálculo é possível, ainda acho que humanos são melhores
  • Parece que em breve haverá um choque de preços em toda a indústria de IA

    • Nossa equipe não tem plano nenhum para quando os custos de API e infraestrutura dispararem. Hoje estamos colocando recursos de IA quase de graça por marketing, mas quando o custo real aparecer talvez tenhamos que remover tudo
    • No fim, muito uso deve migrar para modelos open-weight chineses. Tirando os modelos topo de linha, para a maioria dos casos eles já estão em um nível suficientemente “good enough”
    • Esse choque não vai afetar só a indústria de IA, mas todos os setores
    • Como usuário do Claude, eu também me preocupo com esse aumento de preços
  • A IA está sugando todos os recursos e asfixiando outras indústrias

    • Philip K. Dick e Frank Herbert já previram com precisão essa estrutura imutável do capitalismo
  • Fico curioso se existe algum serviço que acompanhe a variação de preços de GPU em tempo real

    • Eu venho desenvolvendo o computeprices.com como projeto paralelo há um ano para isso
    • Foi incomum a AWS aumentar o preço de uma instância específica. Mas o problema maior é a falta de transparência ao subir preços sem aviso prévio. Do ponto de vista do cliente, isso destrói a confiança
  • Fiquei feliz em ver Corey Quinn aparecer no The Register

  • O forte aumento de gastos de capital com compras em massa de GPUs está elevando a demanda por outros componentes, como memória
    Mas fica a dúvida sobre quanto dessas GPUs está sendo realmente utilizado. Isso faz pensar se não somos nós que estamos pagando pela capacidade ociosa