- A AWS aumentou em cerca de 15% os preços das instâncias de GPU do EC2 Capacity Blocks for ML, com as tarifas horárias das instâncias p5e.48xlarge e p5en.48xlarge subindo, na maioria das regiões, de $34.61 para $39.80 e de $36.18 para $41.61, respectivamente
- Na região US West (Northern California), houve um aumento ainda maior, de $43.26 para $49.75
- Em um e-mail, a AWS explicou que “este ajuste reflete os padrões de oferta e demanda”
- O aumento veio depois do anúncio anterior de corte de até 45% nos preços de instâncias de GPU (há 7 meses) e é um caso raro em que a AWS elevou preços diretamente
- O episódio quebra a regra não escrita de redução de preços no setor de nuvem e pode influenciar outros serviços de recursos no futuro
Visão geral do aumento de preços de GPU da AWS
- A AWS elevou em cerca de 15% os preços do EC2 Capacity Blocks for ML em um sábado, no fim de semana
- A instância p5e.48xlarge passou de $34.61 para $39.80 por hora, e a p5en.48xlarge de $36.18 para $41.61
- Na região US West (Northern California), o aumento foi maior, de $43.26 para $49.75
- Na página oficial de preços da AWS havia a mensagem de que “os preços seriam atualizados em janeiro de 2026”, mas sem indicar que a mudança seria para cima
- Em e-mail, a AWS explicou que “os preços variam de acordo com os padrões de oferta e demanda, e este ajuste reflete os padrões esperados para o trimestre”
Natureza do Capacity Blocks e perfil dos usuários
- Capacity Blocks é um serviço para reservar e garantir recursos de GPU em um momento específico, permitindo executar cargas de treinamento de ML com mais estabilidade
- É possível reservar instâncias de GPU para um período específico, de um dia até várias semanas depois, pagando uma tarifa fixa antecipadamente
- Os clientes que usam esse serviço são, em sua maioria, equipes corporativas tocando grandes projetos de ML, com orçamentos na casa de milhões de dólares
- Há 7 meses, a AWS reduziu em até 45% os preços on-demand e de Savings Plans para instâncias de GPU, mas este aumento se aplica apenas ao Capacity Blocks
Impacto no setor e nos clientes
- A AWS já ajustou preços antes, mas um aumento direto de item de linha (line-item increase) é raro
- Antes, o mais comum era alterar a estrutura de preços ou divulgar a mudança como tendo “efeito de redução para a maioria dos clientes”
- Desta vez, o aumento cria um ponto de comparação favorável para Azure e GCP
- As duas concorrentes estão tentando atrair cargas de trabalho de ML de forma agressiva, e o fato de que “a AWS aumentou os preços de GPU em 15%” pode virar argumento comercial
- Clientes corporativos que usam o Enterprise Discount Program (EDP) manterão a taxa de desconto, mas ainda assim terão custo real maior por causa do aumento do preço-base
Situação do mercado e perspectivas
- Com a oferta global de GPUs ainda limitada, o aumento é interpretado como um sinal de desequilíbrio entre oferta e demanda
- Ao longo de 20 anos, a AWS consolidou a percepção de que “os preços sempre caem”, mas esta medida quebra essa premissa
- Depois que um aumento é implementado e a reação do mercado é pequena, a probabilidade de novos reajustes sobe
- Há menção à possibilidade de ajustes semelhantes no futuro em outros serviços, como instâncias Graviton ou custos de transferência de dados
- O artigo afirma que “a crença de que os preços da nuvem só seguem uma direção desapareceu em um sábado de janeiro de 2026”
Conclusão
- Este aumento no preço de GPU é visto como um ponto de inflexão na política de preços da AWS
- Ele abalou a confiança na estabilidade de custos no mercado de nuvem e
levantou a possibilidade de novos aumentos em recursos com oferta restrita
1 comentários
Comentários do Hacker News
Ver os preços de GPU, RAM e disco rígido subindo faz imaginar um futuro em que computadores domésticos são substituídos por thin clients e toda a computação migra para serviços por assinatura
Slogans como “você não precisa de armazenamento, use uma assinatura de nuvem” e “você não precisa de poder de processamento, faça streaming dos jogos” podem acabar virando realidade
Como as empresas de jogos já estudam modelos de cobrança por hora, a estrutura de jogos como Call of Duty ou GTA pode mudar completamente
A mídia física pode desaparecer, o armazenamento do iPhone pode encolher ainda mais, e tudo pode acabar sendo empurrado para o iCloud
Isso também faz pensar num cenário com compartilhamento de carros autônomos em vez de propriedade de automóveis, e numa sociedade centrada em entregas por drone após o fechamento das lojas físicas
A frase “hopes you weren't paying attention” no título da matéria parece sensacionalista demais
Parece apenas um caso de lei de mercado, com a demanda por GPU e RAM acima da oferta
Sobre a matéria do aumento de preços da AWS, é confuso escreverem “atualização planejada” sem indicar a direção da mudança, se seria aumento ou redução
Quem já é cliente não fica olhando a página de preços todos os dias, então esse tipo de aviso acaba sendo, na prática, uma comunicação pouco transparente
Houve críticas à ideia de estender a depreciação de GPUs de 3 para 5 anos, mas este aumento de preço parece, na verdade, mostrar que a vida útil econômica das GPUs está ficando mais longa
A IA em nuvem é, para a maioria das empresas, apenas um imposto de conveniência
Documentos, previsões, monitoramento, suporte e sistemas de controle podem ser processados tranquilamente com modelos locais. Considerando gravidade dos dados, latência e privacidade, ter hardware de edge faz mais sentido
Parece que em breve haverá um choque de preços em toda a indústria de IA
A IA está sugando todos os recursos e asfixiando outras indústrias
Fico curioso se existe algum serviço que acompanhe a variação de preços de GPU em tempo real
Fiquei feliz em ver Corey Quinn aparecer no The Register
O forte aumento de gastos de capital com compras em massa de GPUs está elevando a demanda por outros componentes, como memória
Mas fica a dúvida sobre quanto dessas GPUs está sendo realmente utilizado. Isso faz pensar se não somos nós que estamos pagando pela capacidade ociosa