Funcionários da Amazon inflacionam o consumo de tokens de IA com tarefas desnecessárias diante da pressão por uso de IA

(fastcompany.com)

5 pontos por GN⁺ 2026-05-17 | 4 comentários | Compartilhar no WhatsApp

À medida que a Amazon acompanha o consumo de tokens de IA dos funcionários, alguns deles estão aumentando artificialmente esse uso ao criar agentes de IA desnecessários com a ferramenta interna MeshClaw
Os funcionários dizem que o rastreamento do consumo de tokens de IA criou um ambiente que prioriza o volume de uso acima da qualidade, gerando uma estrutura de incentivos perversos
A Amazon negou que exista uma métrica corporativa de uso de IA ou um leaderboard interno, mas funcionários afirmam que há uma meta semanal de 80% dos desenvolvedores usando IA e um ranking de consumo de tokens
O MeshClaw é uma ferramenta inspirada no OpenClaw, executada de forma independente no hardware local do usuário e com alto grau de autonomia
O caso expõe um problema estrutural: quando a adoção de IA é imposta por métricas quantitativas, pode haver desperdício de recursos sem ganho real de produtividade

Pressão por uso de IA e uso do MeshClaw

Funcionários da Amazon estão sob pressão para incluir mais IA no fluxo de trabalho, mas não está claro exatamente em que ela deve ser usada, o que amplia a chance de recursos de IA serem gastos em tarefas desnecessárias
Segundo reportagem do Financial Times, alguns funcionários da Amazon estão usando a ferramenta interna de IA MeshClaw para criar agentes de IA desnecessários, com o objetivo de aumentar a atividade de IA mais do que a produtividade
Um funcionário afirmou que “há muita pressão para usar essas ferramentas” e disse que alguns recorrem ao MeshClaw para maximizar o uso de tokens

Divergências em torno das métricas de uso

Funcionários acreditam que, ao rastrear o consumo de tokens de IA, a Amazon fez com que alguns colegas passassem a priorizar a quantidade em vez da qualidade no uso da tecnologia
Vários funcionários anônimos da Amazon avaliam que o ambiente de trabalho está piorando à medida que as expectativas de uso de IA aumentam
A Amazon aparentemente informou aos funcionários que as estatísticas de uso de IA não entram na avaliação de desempenho, mas nem todos acreditam nisso
Outro funcionário considera que o rastreamento de uso cria incentivos perversos (perverse incentives), levando alguns colegas a agir de forma muito competitiva
Os funcionários entrevistados disseram que a empresa tem a meta de fazer com que 80% dos desenvolvedores usem IA toda semana, e que o consumo de tokens dos funcionários é acompanhado em um leaderboard interno
Um porta-voz da Amazon afirmou que não existe métrica corporativa para uso de IA, nem leaderboard interno em que funcionários sejam comparados entre si
- Em vez disso, explicou que os funcionários podem ver seu próprio uso de IA em um dashboard pessoal

OpenClaw e os riscos da execução local

O MeshClaw, usado por alguns funcionários da Amazon para inflar o uso de IA, é uma ferramenta inspirada em outra ferramenta de IA, o OpenClaw
Ao contrário de outros modelos de IA, OpenClaw e MeshClaw são executados localmente no próprio hardware do usuário, o que lhes dá maior independência
No início deste ano, a diretora de alinhamento da Meta Superintelligence Labs chamou atenção por um caso em que o OpenClaw quase apagou toda a caixa de entrada de e-mail dela, evidenciando os riscos de dar acesso excessivo à IA

4 comentários

happing94 2026-05-18

Antigamente, definiam métrica da habilidade dos desenvolvedores por quantas linhas de código eles escreviam kkk
Aí vivia aparecendo um monte de código lixo, escrito sem necessidade com centenas de milhares de linhas de uma vez, para no fim ter só uma ou duas funcionalidades

aucun 29 일 전

Isso também me lembra quando o desempenho é medido só pelo tempo de trabalho kkk
Mesmo sem resultado entregue, a situação em que se recebe uma avaliação alta só por fazer muita hora extra hehe

gulbi135 29 일 전

O efeito colateral da eficiência excessiva (2022)
A seleção aleatória é necessária para criar um sistema meritocrático estável

GN⁺ 2026-05-17

Comentários do Hacker News

Não é só a Amazon; parece que as grandes empresas de tecnologia em geral e até algumas menores enlouqueceram ao mesmo tempo
É parecido com uma situação em que o CEO chega um dia e diz: “Precisamos incentivar gastos com viagens, então reservem o máximo possível e gastem o máximo que puderem. Voem de primeira classe quando forem ao escritório satélite, peguem limusine em vez de Uber e comam em restaurantes caros. Se vocês não gastarem o suficiente em viagens, receberão uma nota baixa na avaliação de desempenho”
Estamos vivendo tempos completamente anormais agora
- Foi por isso que acabei criando a nova ferramenta CLI Burn, Baby, Burn: https://github.com/dtnewman/burn-baby-burn/tree/main
  Se eu fosse vice-presidente da Amazon, até consideraria uma oferta de aquisição, e também estou trabalhando em uma versão enterprise com recursos extras
  Show HN: https://news.ycombinator.com/item?id=48151287
- Disseram que uma pessoa instruída a usar mais IA no trabalho criou um agente que só queimava tokens e acabou usando cerca de 10 vezes mais do que o funcionário que mais usava depois dela
  Ela achou que levaria bronca, mas em vez disso recebeu elogios e ainda pediram que compartilhasse sua fórmula de sucesso em uma apresentação curta para os outros funcionários
- Na nossa empresa, gastos com IA entram na avaliação de desempenho, e ouvimos que a “singularidade” chegou
  Agora, 20% do gasto de infraestrutura são tokens, e o número semanal de pull requests por desenvolvedor subiu de 4,2 para 5,1
  Uma parte considerável disso são agentes mudando uma ou duas linhas em arquivos de configuração, então tudo parece pensamento mágico
- Meu pai trabalhou no começo dos anos 90 em uma empresa que tinha sua própria agência de viagens, e era comum reservarem voos mais caros porque a agência ganhava mais dinheiro assim
  Em outras companhias aéreas, dava até para ir de primeira classe mais barato, mas a política da empresa não permitia primeira classe
  Sempre vivemos em tempos anormais
- Algumas empresas podem ter caído no marketing de que a IA tornaria todos os funcionários 10.000 vezes mais produtivos e economizaria bilhões de dólares
  Como isso não aconteceu, parecem presumir que o problema é que os funcionários não estão usando a IA mágica com frequência suficiente
  Empresas que constroem seus próprios produtos de IA também podem querer que seus funcionários usem IA o máximo possível para obter dados de treinamento que acabem substituindo a maioria deles ou até todos
  Punir funcionários que se recusam a treinar sua própria substituição por IA pode fazer sentido para elas se enxergarem isso como um custo agora para uma economia muito maior depois
Há uns 6 meses ouvi de um funcionário da AWS uma apresentação de ferramentas de IA para o nosso caso de uso
No meio da apresentação, de repente ele compartilhou a tela e disse: “Vejam quantos tokens usei este mês. Eu rodo muito Opus”, e o número era ofensivamente alto
Na hora pensei: “Que estranho se gabar disso. Isso é tão caro que o simples fato de usar tanto já não é um sinal de alerta?”
Ele mostrou vários casos de uso do Claude Code administrando e ajustando infraestrutura da AWS, e para os meus olhos de sysadmin veterano, mais velho que a internet, tudo pareceu “usar IA para fazer algo que daria para resolver com um único comando”
Então essa história faz sentido. Quer dizer que já estavam incentivando o uso desenfreado desde 6 meses atrás
- Uma boa parte das sugestões do Cursor são coisas que o linter deveria corrigir automaticamente
  Só que, se você aperta tab, isso conta a linha como uma linha editada pela IA
  Grande parte do restante também seriam coisas que já dava para fazer quase na mesma velocidade se a pessoa tivesse aprendido multicursor, navegação em vim e macros
  Na prática, eu nunca aprendi porque nunca fui lento a ponto de a velocidade de colocar código na tela virar gargalo
- Ainda não sei como conciliar casos assim com as histórias de que desenvolvimento assistido por agentes de IA generativa agora é a única forma de trabalhar, especialmente em startups
  Provavelmente não é uma dicotomia e depende de vários fatores, mas é estranho ver relatos tão diferentes ao mesmo tempo
- É bem provável que muitos grandes investidores estejam profundamente expostos não só a várias empresas de tecnologia, mas também à OpenAI e Anthropic
  Aí começa a fechar a conta de onde vêm esse tipo de ordem e por que elas não parecem cautelosas nem equilibradas
- Com o tempo, à medida que camadas de abstração se acumulam, as gerações seguintes deixam de entender as camadas de baixo
  Isso é uma grande fraqueza no desenvolvimento de sistemas e pode se tornar uma enorme superfície de ataque para adversários
- “Usar IA para fazer algo que daria para resolver com um único comando” na verdade é uma coisa boa
  Uma parte significativa do valor da IA está justamente nisso
  Agora você não precisa conhecer esse comando, só precisa entender o contrato funcional para executar o trabalho necessário
  Isso é uma mudança enorme
Estão aparecendo muitas histórias de “precisávamos usar tokens, então torramos em coisas inúteis”, e isso é difícil de acreditar em uma situação de emergência climática
Se apertarem mais o acelerador, ainda chegamos aos 3 graus de aquecimento
Isso me lembra a história de que a União Soviética quase levou as baleias à extinção tentando cumprir cotas de carne de baleia que ninguém queria comer
- Quanto mais a economia se torna top-down, mais ela vai ficando ao estilo soviético
  Na prática já temos planejamento central, com todas as patologias do sistema; a diferença para a URSS é só que nosso GOSPLAN é administrado por alguns poucos que ficaram ricos por acaso ou subornaram a pessoa certa
- Será que é por isso que estão derrubando florestas inteiras para construir novos data centers?
  Nem é por ganho “real” de produtividade, é só para consumir tokens
- Não tem problema. Continuamos usando canudos de papel, porque isso sim é o que importa
  Se você não queimar tokens, não bate as métricas e ainda pode ganhar o rótulo de ludita e ser expulso antes mesmo de a IA tomar seu emprego
  Concordo que essa tendência e os belicistas estão destruindo o planeta
- A União Soviética representava só cerca de 15% da captura mundial de baleias, e o Japão era o número 1
  A afirmação de que “ninguém queria comer” também carece de base
- Mas parece que não há muito o que fazer. Eu também não quero ser punido no trabalho
  Felizmente trabalho com administração de aplicativos e descobri que só conseguem ver a data do último uso, então basta fazer uma consulta por dia e pronto
  Mas estou realmente cansado desse superaquecimento da IA
Trabalho em uma FAANG, mas não na Amazon, e ouvi muitas histórias desse tipo tanto interna quanto externamente
Só que nunca vi pessoas importantes, isto é, a liderança, dizerem isso oficialmente
Sempre começa como rumor ou com algum dashboard/métrica criado por alguém de dentro e vai crescendo
Também já ouvi líderes dizendo “não é isso que estamos observando e vocês não deveriam desperdiçar tokens caros”
Claro, no passado eles já admitiram usar métricas idiotas como número de linhas de código ou número de commits, mas não acredito que seja algo tão simples quanto quanto mais tokens, melhor
- Também estou em uma FAANG, e a liderança incentiva o aumento do uso de tokens nas reuniões semanais de gerentes
  Quando contestamos, a liderança reconhece que gasto com tokens não é uma boa métrica e que as pessoas provavelmente vão abusar dela, mas logo em seguida volta a nos dizer para aumentar o gasto com tokens da equipe
  Sei disso porque existe um dashboard de acompanhamento de tokens que a liderança vê e mostra diretamente nessas reuniões
  Pelo menos ainda não divulgaram isso para todo mundo em forma de ranking
  Circulam muitos rumores de que gasto com tokens vai entrar na avaliação de desempenho, e a liderança nega, mas logo depois marca mais reuniões sobre como é importante aumentar o gasto com tokens e discute as deficiências visíveis no dashboard
- Participo de um grande grupo de pares de gerentes de engenharia, e o uso excessivo de tokens de IA está virando um problema cada vez maior
  O problema explode em empresas que criam rankings de uso de tokens ou insinuam que podem demitir engenheiros que se recusem a usar ferramentas de IA
  Aí começa uma competição para gastar o máximo possível de tokens para sobreviver
  Isso é especialmente forte entre desenvolvedores que leem muita rede social
  No Twitter, Threads, Mastodon, LinkedIn e outros, circulam repetidamente histórias virais recicladas sobre ser AI-native e demitir quem não usa IA o suficiente, e desenvolvedores ansiosos passam a achar que precisam queimar tokens mais rápido que os colegas para escapar de cortes inevitáveis
- Saí recentemente de uma FAANG e, pouco antes de sair, o diretor da nossa organização levou bronca do VP da linha de reporte porque o uso de tokens da organização era baixo
  Depois disso, os colaboradores individuais da organização foram instruídos a usar IA em tudo, sob aviso de que isso poderia prejudicar suas carreiras se não o fizessem
- No lado de consultoria enterprise também está ficando cada vez mais ridículo
  Estão empurrando treinamentos obrigatórios, workshops e hackathons para “incentivar” o uso de IA no trabalho do dia a dia
  Até coisas que seriam fáceis com shell script viram pergunta do tipo “como podemos transformar isso em um agente?”
- Na nossa empresa isso realmente veio da liderança
  Gastaram muito dinheiro com Copilot e agora querem ver as pessoas usando
Pode ser que o próprio objetivo seja fazer as pessoas jogarem com a métrica
Se você pressiona as pessoas a usar mais IA, elas tentam, experimentam e “desperdiçam” tempo aprendendo
Esse é o objetivo final
Neste momento, estão gastando tokens em coisas inúteis para descobrir onde isso ajuda, e também é assim que aprendem onde não ajuda
Nossa empresa está fazendo a mesma coisa
- A conversa muda se você mandar instalar o meshclaw para gastar um monte de tokens
- Esse é exatamente o ponto
  Pode ser desperdiçador, mas é a forma mais rápida de explorar onde a IA realmente pode ser útil para o negócio
  Mesmo que 80% dos funcionários só desperdicem tokens, os outros 20% estão descobrindo como fazer funcionar
- Desculpa, mas isso é loucura
  Se você tem tanto dinheiro a ponto de poder queimá-lo, eu até consigo imaginar formas piores de gastar, mas falando sério isso é idiotice
  Em que outro caso empresas gastaram milhões de dólares e tempo de pessoas em uma ferramenta para “descobrir para que essa ferramenta pode servir de útil”?
  É uma solução em busca de um problema
  Se logo de início não está claro que problema essa ferramenta resolve, então tem que largar e seguir em frente
  É melhor dar esse dinheiro que sobra para os funcionários e acionistas
É lamentável que a IA agora tenha um programa de emprego universal básico, enquanto os humanos ainda não têm
As empresas estão pagando para uma IA cavar buracos e para outra IA preencher esses mesmos buracos
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
- Isso já aconteceu antes
  A União Soviética alcançou 100% de emprego há muito tempo[0], junto com a pobreza correspondente
  Isso não é igual, porque não é financiado por impostos
  Empresas privadas estão experimentando com o próprio dinheiro e assumindo o risco de elevar custos e depois ver clientes irem para outro lugar
  Ainda assim, é muito melhor do que dar dinheiro às pessoas via imposto obrigatório independentemente da produtividade
  [0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Dentro da Amazon, ao usar o Kiro, o uso de tokens é gamificado
Isso porque não funciona como na AWS, onde o custo é cobrado do time, nem como no sistema antigo, onde era preciso justificar capacidade
Antes mesmo de qualquer pessoa olhar rankings internos, ouvi relatos bastante críveis de gente manipulando essa métrica, e também há muitos usuários entusiasmados construindo e compartilhando projetos internos de todo tipo
É certo que gerentes sofrem pressão depois de ouvir em apresentações internas coisas como melhoria de produtividade de N00%, mas onde eu estou, se alguém criasse trabalho falso no lugar de trabalho real, perceberiam isso bem rápido
A pressão vem de prazos agressivos e da mudança, no processo anual de OP1, para um modo mais ágil
Ouvi histórias parecidas de funcionários da AWS e de outras FAANG que não são AWS
Todo ranking de tokens vem com um aviso de isenção dizendo “isto não entra na avaliação de desempenho”, mas com um implícito piscadela e aceno logo em seguida
Em uma organização sobre a qual ouvi falar, há uma pessoa rodando GasTown 24 horas por dia e devorando tokens
Ela pouco contribui, mas ocupa confortavelmente o primeiro lugar
- Também ouvi de várias pessoas, em várias organizações de porte pequeno e médio, que uso de tokens e adoção de IA viraram o núcleo da avaliação de desempenho
- Meu gerente na empresa de 400 pessoas em que trabalho é uma dessas pessoas
  Ele roda o GasTown e deixa agentes mexerem no código por todo lado, o que rende algo como 50 commits por dia
  São coisas como versões compatíveis e formatação
  Mas o problema não é a tecnologia, e sim ele
  Ele já era assim antes dos LLMs
  Costumava “refatorar” repositórios em repositórios menores para que, de repente, o nome dele aparecesse em todo o código, e para uma olhada superficial parecia que ele tinha criado grandes partes da base de código da empresa
  Ele recusava coisas que eu queria fazer e depois ia lá e fazia ele mesmo
  Ficava implicando infinitamente com meus pull requests ou dizia que o trabalho nem deveria ser feito, para depois virar as costas e implementar ele mesmo
  Ele não copia e cola meu código, mas depois que meu PR está aberto ele reimplementa a mesma ideia que antes havia rejeitado
  É muito inteligente, mas muito desonesto, e esconde bem essa desonestidade
  Se você perguntar, ele responde algo como “achei que esse jeito pareceria mais organizado”
  De fora, sempre existe margem para argumentar que um jeito é melhor do que o outro, então a desonestidade não fica claramente evidente, mas eu vejo 100% do que ele faz, então o padrão é completamente óbvio
  Além disso, uma vez eu disse que tiraria férias em uma certa semana; ele não recusou explicitamente, mas perguntou se eu poderia adiar porque havia muita pressão para entregar The Thing
  Quando respondi “não, não vou adiar”, ele aprovou, só que quando a semana chegou ele próprio também tirou férias na mesma semana
  Eu nem discuti isso. Já sabia suficientemente bem que ele não tem vergonha de exigir dos outros algo que ele jamais aceitaria para si mesmo
Se uma porta-voz da Amazon disse que não existe nenhuma métrica de uso de IA em nível de empresa, nem rankings internos comparando funcionários, e que em dashboards pessoais cada um só pode ver seu próprio uso, isso é mentira descarada
Existe um dashboard global que classifica funcionários por uso do Kiro/QuickSuite (antes Amazon Q) com base em tokens
O dashboard em si fica no QuickSight, que aliás agora também faz parte do QuickSuite
Os dados não só estão abertos para qualquer pessoa, como também podem ser ordenados por ranking, uso diário, semanal, mensal e anual
Incluem funcionários atuais e ex-funcionários, ambos por alias interno
Além disso, há um sistema interno de “premiações” exibido no perfil do PhoneTool, em que cada funcionário recebe títulos do Kiro/AmazonQ/Quicksuite como “Blaze” e “Thunderstorm”
E você pode ver com um clique outras pessoas que receberam o mesmo prêmio
Só para constar, o PhoneTool é o diretório interno de perfis para consultar outros funcionários
Enquanto isso, conheço várias pessoas que não conseguem escrever código decente por conta própria nem integrar algo diretamente em nada
Pessoas que precisam de ajuda o tempo todo estão produzindo quantidades enormes com Kiro/AmazonQ e atualmente aparecem acima de SDEs no ranking
Elas se parecem mais com SysDev, engenheiros de suporte ou TPM do que com SDEs
Isso em si não é necessariamente bom nem ruim, mas se você fizer stack ranking por uso de tokens, bons engenheiros que tentam escrever código “bom” provavelmente acabarão avaliados abaixo de pessoas que não se esforçam por soluções concisas
A qualidade vai cair no fim das contas, e quando a liderança perceber o que aconteceu, já vai ser tarde demais
Já vi incidentes relacionados a Amazon-Q/Kiro e, ainda assim, continuam negando
Essa tendência também está chegando ao meu trabalho
Todo dia recebo notificações irritadas se eu não usar o Copilot do MS Office, então estou simplesmente digitando Hello