Google divulga pela primeira vez o consumo de energia de prompts de IA
(technologyreview.com)- O Google divulgou o consumo de eletricidade, água e emissões de carbono do seu app Gemini ao processar prompts, apresentando pela primeira vez dados concretos sobre o uso de energia por IA
- Um prompt de texto médio consome 0,24 Wh de eletricidade, semelhante a usar um micro-ondas por 1 segundo, e gera 0,26 ml de água e 0,03 g de dióxido de carbono
- Esses números resultam de uma análise abrangente que inclui toda a infraestrutura, como chips de IA (58%), CPU e memória (25%), equipamentos de backup (10%) e operação do datacenter (8%)
- Em maio de 2025, em comparação com maio de 2024, a eficiência energética melhorou 33 vezes, e o Google atribuiu isso à otimização de software e a melhorias no modelo
- O anúncio é significativo por representar mais transparência das grandes empresas de IA, mas informações essenciais, como o número total de consultas, ainda não foram divulgadas, levantando a necessidade de um sistema padronizado de avaliação energética para IA
Divulgação do consumo de energia de prompts do Gemini pelo Google
- O Google é a primeira grande empresa de IA a divulgar o consumo de eletricidade, emissões de carbono e uso de água de modelos Gemini ao processar prompts de texto
- Um prompt médio gera 0,24 Wh de eletricidade, 0,26 ml de água e 0,03 g de CO₂, algo comparável a 1 segundo de funcionamento de um micro-ondas ou cinco gotas de água
- O anúncio detalhou os dados e a metodologia de cálculo em entrevista à MIT Technology Review
Estrutura detalhada do consumo de energia
- Do consumo total de energia, chips de IA (TPU) representam 58%, CPU e memória 25%, equipamentos de backup 10% e operação do datacenter (resfriamento e conversão de energia) 8%
- O Google explicou que a análise foi feita de forma abrangente, incluindo toda a infraestrutura de hardware
- Isso é visto como uma contribuição de pesquisa para o setor, por divulgar dados internos aos quais pesquisadores normalmente têm dificuldade de acessar
Diferenças entre prompts e limitações
- Os números divulgados são a mediana (median), então algumas consultas podem consumir muito mais energia
- Ex.: resumir dezenas de livros ou realizar operações complexas com modelos de reasoning
- Este relatório tratou apenas de prompts de texto e não incluiu geração de imagem ou vídeo
- Portanto, ainda há limitações para entender o volume total real de uso do Gemini
Melhoria de eficiência e estimativa de emissões de carbono
- O Google anunciou que, entre maio de 2024 e maio de 2025, o consumo de energia por prompt caiu 33 vezes
- Isso foi explicado como resultado de melhorias na arquitetura do modelo e de otimização de software
- A estimativa de emissões usou uma abordagem baseada em mercado que reflete a proporção de energia limpa comprada pelo Google, em vez da média da rede elétrica dos EUA, ficando em cerca de 1/3 do nível da rede elétrica comum
Reação de pesquisadores e do setor
- Integrantes do projeto ML.Energy da University of Michigan avaliaram o anúncio como a análise mais abrangente e importante até agora
- Pesquisadores da Hugging Face enfatizaram a necessidade de um sistema padronizado de classificação energética para IA, apontando que hoje as empresas ainda divulgam essas informações de forma seletiva
- O relatório ampliou a compreensão sobre o consumo real de recursos no uso de IA, mas a ausência de dados essenciais, como o número total de consultas, continua sendo uma grande limitação
1 comentários
Opiniões no Hacker News
Não consegui encontrar no artigo original links para o comunicado à imprensa e o relatório relacionados, então estou anexando eu mesmo
Quando vejo reportagens sobre sobrecarga da infraestrutura elétrica, parece uma estratégia de “dog whistle” para reforçar a ideia de que empresas de tecnologia fazem mal ao meio ambiente
Criticam o uso de água e eletricidade, mas há uma tendência de enfatizar isso de forma excessivamente sensacionalista
Um exemplo típico é a crítica ao consumo de água dos data centers em The Dalles
Esses prédios ficam ao lado do rio Columbia, e nas proximidades há a barragem de The Dalles, que gera em média 700 megawatts
Eles usam água do rio para resfriamento, aumentam um pouco a temperatura e a devolvem ao rio
Em certo sentido, estão devolvendo o calor que a água traria ao descer a corrente, então não é um desperdício completo
Artigo relacionado, informações sobre a barragem de The Dalles
O PDF do relatório técnico oficial do Google pode ser visto aqui
Fico me perguntando por que divulgaram o consumo de energia do prompt mediano em vez da média
A média mostraria de forma mais intuitiva o consumo médio real
Sobre EVs, a expectativa de que carros elétricos se tornariam predominantes até 2030 nunca foi realista
Não houve preparação nenhuma, nem da expansão da produção de baterias nem da infraestrutura
Data centers podem exigir de repente grandes quantidades de energia em pequenas regiões específicas
Outros itens, como carros elétricos e bombas de calor, são adotados gradualmente, então dá para responder com pequenos aumentos anuais de capacidade
Como data centers são difíceis de distribuir, a carga sobre a infraestrutura é maior
Fiquei surpreso ao ouvir recentemente gente da geração Z dizendo que a IA está “destruindo” água
Já trabalhei em data center, então sabia que usam água para resfriamento, mas nunca tive a sensação de que estivessem destruindo água em larga escala
A percepção sobre GenAI e água é mais profunda do que eu imaginava
Houve até quem dissesse algo como “por causa da IA vamos viver num inferno de seca no futuro”
Eu, por outro lado, fico mais curioso sobre qual seria o consumo de energia de um único vídeo no TikTok, mas esse tipo de comparação parece fugir do ponto
Quando pergunto por qual caminho a água realmente desapareceria, se seria vapor d’água, acho curioso que muita gente trate a simples evaporação como se a água tivesse “sumido para sempre”
As moléculas de água não são “destruídas”, mas muitas vezes acabam desaparecendo completamente de um lugar onde poderiam ser usadas de forma útil
O mar de Aral é um caso clássico de desaparecimento causado por irrigação agrícola
Vídeo no YouTube
O problema da escassez de água é extremamente local
Por exemplo, operar um data center no Arizona pode realmente gerar problemas de água, mas isso pode ser mitigado com reciclagem de água residual etc.
A usina de Palo Verde também usa água residual em trocadores de calor
Eu também fiquei surpreso por ter sido perguntado recentemente sobre o consumo de água da IA
Dei uma pesquisada rápida e os data centers consomem bem mais água do que eu imaginava: cerca de 1 litro por kWh de eletricidade
Já ouvi dizer que os hyperscalers têm desempenho melhor que isso e buscam ficar net-positive, mas quase não há material dizendo que esse valor em si é fictício
“1 litro/kWh” é difícil de sentir na prática, mas num grande data center seriam 278 L/s. Um chuveiro tem vazão de 0,16 L/s, e toda a indústria de amêndoas da Califórnia usa em média anual 200 mil L/s
Isso equivaleria a uma fazenda de amêndoas de 4 milhas quadradas, mas sinceramente não parece algo tão extremo assim, e os números dos hyperscalers provavelmente são melhores
Data centers usam resfriamento evaporativo
Não é simplesmente aquecer a água e devolvê-la; ela é totalmente evaporada pela atmosfera
(A molécula de água em si continua existindo, mas o vapor na atmosfera é uma forma difícil de reutilizar)
A alegação de que a IA destrói água começou como um argumento NIMBY e depois foi absorvida como discurso anti-IA por grupos da geração Z com forte inclinação anticapitalista
Em 2011, o Google disse que usava 0,3 Wh por consulta de busca, e no começo deste ano Sam Altman também disse que uma consulta da OpenAI fica em média em 0,3 Wh
É surpreendente como os dois números são parecidos
Eu achava que uma consulta a LLM seria mais intensiva em energia do que uma busca simples no Google, mas isso mostra como a própria busca do Google já é uma infraestrutura enorme
Por exemplo, para perguntas simples como o significado de uma palavra, se um pequeno LLM rodasse num iPhone, 0,03 Wh já bastaria, ou seja, 10 vezes menos que uma busca no Google
(Assumindo que o chip A16 opere a 5 watts por 20 segundos, dá 0,03 Wh)
O que eu queria saber é se o custo de treinamento, especialmente execuções de treinamento fracassadas, entra nesse tipo de estimativa
Post oficial do blog do Google
Vale lembrar que 14 anos de avanços em eficiência energética também fazem grande diferença
Por volta de 2008, o processo central da busca era basicamente fazer
grepem todos os documentosOs documentos ficavam carregados em RAM de forma distribuída, e o
grepera executado em 1.000 máquinasÍndices invertidos não eram muito usados porque não serviam bem para “consultas em que a ordem das palavras importa”
Processos como ranking eram mais complexos
0,3 Wh são 1080 joules. Como 1 litro de gasolina contém mais de 30 milhões de joules, isso equivale, na prática, a 0,034 mililitro de gasolina
Claro que eletricidade é muito mais eficiente do que motor a combustão interna
Sempre que mando uma consulta para meu LLM local, as luzes do escritório piscam e parece que ele consome mais energia do que ligar o forno por 1 segundo
Fico me perguntando se, por volta de 2008, o Google já usava busca baseada em deep learning
Parece provável que o consumo de energia por consulta tenha variado conforme recursos foram sendo adicionados
Senti falta de o relatório inteiro explicar qual prompt é considerado “mediano”
Gostaria de saber o número de tokens do prompt, como é a distribuição de comprimentos e se isso pode até variar de um ano para outro
Sem esse tipo de informação, simplesmente dizer a mediana tem pouca utilidade prática
Se fosse a média, pelo menos daria para multiplicar pelo número de consultas e estimar o consumo total
Sam Altman também publicou recentemente em seu blog o consumo médio de energia por consulta no ChatGPT
Em média, uma consulta no ChatGPT consome 0,34 Wh, o equivalente a 1,5 segundo de forno ou alguns minutos de uma lâmpada eficiente
O consumo de água é de 0,000085 galão por consulta (um décimo quinto de colher de chá)
Blog do Altman
Pessoalmente, acho que o que realmente importa não é inferência, mas treinamento, fine-tuning e raspagem de dados
A lógica de que “prompts estão destruindo o meio ambiente” me pareceu sensacionalista demais
Fico feliz que isso esteja sendo cada vez mais bem checado
Mas, na prática, o impacto de novos data centers sobre a rede de transmissão e distribuição também não é algo que dê para ignorar
Se a tecnologia fosse intrinsecamente tão eficiente em energia, as big techs não estariam chegando ao ponto de investir em usinas nucleares privadas ou competir por energia como agora
Para definir corretamente o critério, em vez de olhar apenas para o consumo total de água e energia, é preciso avaliar de forma relativa se a região em questão tem água e energia suficientes
O Google reporta oficialmente o uso total de água de seus data centers
Em 2024, foram cerca de 10 bilhões de galões (algo como 0,03% do uso total nos EUA, considerando que nem todos os data centers estão no país)
O número em si não parece gigantesco, mas só em Council Bluffs, IA, passou de 1 bilhão de galões, então é preciso verificar se o ecossistema local aguenta isso e se está sendo administrado de forma responsável
O Google admite que 28% do uso ocorre em “áreas com risco médio ou maior de esgotamento ou escassez de água”
Relatório ambiental 2025 do Google
Só de acessar um site, prompts acabam sendo enviados sem intenção para o servidor
É uma pena que, quanto mais barato o serviço é oferecido em escala, mais ele tenda a ser usado em excesso
Não concordo com a afirmação de que, se o consumo de energia fosse fundamentalmente baixo, não haveria essa disputa intensa por novos data centers e infraestrutura energética
A rede elétrica dos EUA já estava há muito tempo sem capacidade ociosa adicional
Isso aconteceu por causa de melhorias na eficiência energética e da desindustrialização
O problema maior não são os data centers em si, mas a infraestrutura de distribuição elétrica
Dá para gerar energia, mas há muitos problemas para distribuí-la onde ela é necessária
A polêmica das usinas privadas também tem mais a ver com distribuição do que com geração
Se um prompt mediano consome 0,24 Wh, então isso equivale à energia de:
Se minhas contas estiverem certas, com 1 kWh dá para fazer cerca de 4 mil consultas
Se considerarmos uma tarifa industrial de eletricidade de US$ 0,04/kWh, então US$ 1 permitiria 100 mil consultas
Considerando o custo de construir data centers etc., uma assinatura de US$ 20 por mês nem parece tão cara assim
Será que fiz a conta certo?
Está certo
O erro fundamental do pessimismo sobre energia e água na IA é que eletricidade, água e terreno viram custo, mas a IA está sendo oferecida como se fosse gratuita
Se a IA realmente estivesse consumindo toda a eletricidade e toda a água, as empresas não operariam isso só no prejuízo
Mas o custo de treinamento não deveria ser considerado separadamente?
Se quiser pular os artigos de terceiros,
você pode ver o post do blog do Google e o PDF do artigo oficial
Tenho mais curiosidade sobre o volume total, como o número total de consultas por dia no Gemini
Só o número do prompt mediano não permite estimar a demanda total de energia
Sem o total de consultas, a mediana em si não significa muita coisa
Talvez eles não divulguem porque a média é mais alta de propósito