- Funcionários da Amazon estão sob pressão para incluir mais IA no trabalho, mas como não está claro onde aplicá-la, isso vem gerando tarefas desnecessárias
- Alguns funcionários estão usando a ferramenta interna MeshClaw para criar agentes que aumentam o volume de atividade de IA, em vez de melhorar a produtividade
- Os funcionários veem o rastreamento do consumo de tokens de IA como algo que cria um ambiente em que o uso é priorizado acima da qualidade
- A Amazon afirmou que não há métricas corporativas de IA nem um ranking interno, mas funcionários dizem que existe uma meta de uso de 80% e acompanhamento
- OpenClaw e MeshClaw rodam localmente, o que lhes dá mais autonomia, mas os riscos podem aumentar quando recebem permissões excessivas
Pressão para usar IA e uso do MeshClaw
- Funcionários da Amazon estão sob pressão para incluir mais IA nos fluxos de trabalho, mas como não está claro onde ela deve ser aplicada, cresce a chance de recursos de IA serem usados em tarefas desnecessárias
- Segundo reportagem do Financial Times, alguns funcionários da Amazon estão usando a ferramenta interna de IA MeshClaw para criar agentes de IA desnecessários que aumentam o volume de atividade de IA, em vez de melhorar a produtividade
- Um funcionário disse: “Há muita pressão para usar essas ferramentas”, acrescentando que alguns usam o MeshClaw para maximizar o uso de tokens
Divergências em torno das métricas de uso
- Os funcionários acreditam que, ao rastrear o consumo de tokens de IA, a Amazon fez com que alguns colegas passassem a priorizar a quantidade de uso da tecnologia em vez da qualidade
- Vários funcionários anônimos da Amazon avaliam que o ambiente de trabalho está piorando à medida que as expectativas de uso de IA aumentam
- A Amazon aparentemente informou aos funcionários que as estatísticas de uso de IA não entram na avaliação de desempenho, mas nem todos acreditam nisso
- Outro funcionário considera que o rastreamento de uso cria incentivos distorcidos e leva alguns colegas a agir de forma muito competitiva
- Os funcionários entrevistados disseram que a empresa tem a meta de fazer com que 80% dos desenvolvedores usem IA toda semana e que o consumo de tokens dos funcionários é rastreado em um ranking interno
- Um porta-voz da Amazon afirmou que não existem métricas corporativas sobre uso de IA nem um ranking interno em que os funcionários sejam comparados entre si
- Segundo a Amazon, os funcionários podem ver seu próprio uso de IA em dashboards individuais
OpenClaw e os riscos da execução local
- O MeshClaw, que alguns funcionários da Amazon estariam usando para inflar o volume de uso de IA, é uma ferramenta inspirada em outra ferramenta de IA, a OpenClaw
- OpenClaw e MeshClaw, diferentemente de outros modelos de IA, fazem execução local no próprio hardware do usuário, o que lhes dá mais autonomia
- No início deste ano, a diretora de alinhamento do Meta Superintelligence Labs chamou atenção após o OpenClaw quase apagar toda a caixa de entrada de e-mails dela, expondo os riscos de dar permissões excessivas à IA
1 comentários
Comentários do Hacker News
Não é só a Amazon; parece que as grandes empresas de tecnologia em geral e até algumas menores enlouqueceram ao mesmo tempo
É parecido com uma situação em que o CEO chega um dia e diz: “Precisamos incentivar gastos com viagens, então reservem o máximo possível e gastem o máximo que puderem. Voem de primeira classe quando forem ao escritório satélite, peguem limusine em vez de Uber e comam em restaurantes caros. Se vocês não gastarem o suficiente em viagens, receberão uma nota baixa na avaliação de desempenho”
Estamos vivendo tempos completamente anormais agora
Se eu fosse vice-presidente da Amazon, até consideraria uma oferta de aquisição, e também estou trabalhando em uma versão enterprise com recursos extras
Show HN: https://news.ycombinator.com/item?id=48151287
Ela achou que levaria bronca, mas em vez disso recebeu elogios e ainda pediram que compartilhasse sua fórmula de sucesso em uma apresentação curta para os outros funcionários
Agora, 20% do gasto de infraestrutura são tokens, e o número semanal de pull requests por desenvolvedor subiu de 4,2 para 5,1
Uma parte considerável disso são agentes mudando uma ou duas linhas em arquivos de configuração, então tudo parece pensamento mágico
Em outras companhias aéreas, dava até para ir de primeira classe mais barato, mas a política da empresa não permitia primeira classe
Sempre vivemos em tempos anormais
Como isso não aconteceu, parecem presumir que o problema é que os funcionários não estão usando a IA mágica com frequência suficiente
Empresas que constroem seus próprios produtos de IA também podem querer que seus funcionários usem IA o máximo possível para obter dados de treinamento que acabem substituindo a maioria deles ou até todos
Punir funcionários que se recusam a treinar sua própria substituição por IA pode fazer sentido para elas se enxergarem isso como um custo agora para uma economia muito maior depois
Há uns 6 meses ouvi de um funcionário da AWS uma apresentação de ferramentas de IA para o nosso caso de uso
No meio da apresentação, de repente ele compartilhou a tela e disse: “Vejam quantos tokens usei este mês. Eu rodo muito Opus”, e o número era ofensivamente alto
Na hora pensei: “Que estranho se gabar disso. Isso é tão caro que o simples fato de usar tanto já não é um sinal de alerta?”
Ele mostrou vários casos de uso do Claude Code administrando e ajustando infraestrutura da AWS, e para os meus olhos de sysadmin veterano, mais velho que a internet, tudo pareceu “usar IA para fazer algo que daria para resolver com um único comando”
Então essa história faz sentido. Quer dizer que já estavam incentivando o uso desenfreado desde 6 meses atrás
Só que, se você aperta
tab, isso conta a linha como uma linha editada pela IAGrande parte do restante também seriam coisas que já dava para fazer quase na mesma velocidade se a pessoa tivesse aprendido multicursor, navegação em vim e macros
Na prática, eu nunca aprendi porque nunca fui lento a ponto de a velocidade de colocar código na tela virar gargalo
Provavelmente não é uma dicotomia e depende de vários fatores, mas é estranho ver relatos tão diferentes ao mesmo tempo
Aí começa a fechar a conta de onde vêm esse tipo de ordem e por que elas não parecem cautelosas nem equilibradas
Isso é uma grande fraqueza no desenvolvimento de sistemas e pode se tornar uma enorme superfície de ataque para adversários
Uma parte significativa do valor da IA está justamente nisso
Agora você não precisa conhecer esse comando, só precisa entender o contrato funcional para executar o trabalho necessário
Isso é uma mudança enorme
Estão aparecendo muitas histórias de “precisávamos usar tokens, então torramos em coisas inúteis”, e isso é difícil de acreditar em uma situação de emergência climática
Se apertarem mais o acelerador, ainda chegamos aos 3 graus de aquecimento
Isso me lembra a história de que a União Soviética quase levou as baleias à extinção tentando cumprir cotas de carne de baleia que ninguém queria comer
Na prática já temos planejamento central, com todas as patologias do sistema; a diferença para a URSS é só que nosso GOSPLAN é administrado por alguns poucos que ficaram ricos por acaso ou subornaram a pessoa certa
Nem é por ganho “real” de produtividade, é só para consumir tokens
Se você não queimar tokens, não bate as métricas e ainda pode ganhar o rótulo de ludita e ser expulso antes mesmo de a IA tomar seu emprego
Concordo que essa tendência e os belicistas estão destruindo o planeta
A afirmação de que “ninguém queria comer” também carece de base
Felizmente trabalho com administração de aplicativos e descobri que só conseguem ver a data do último uso, então basta fazer uma consulta por dia e pronto
Mas estou realmente cansado desse superaquecimento da IA
Trabalho em uma FAANG, mas não na Amazon, e ouvi muitas histórias desse tipo tanto interna quanto externamente
Só que nunca vi pessoas importantes, isto é, a liderança, dizerem isso oficialmente
Sempre começa como rumor ou com algum dashboard/métrica criado por alguém de dentro e vai crescendo
Também já ouvi líderes dizendo “não é isso que estamos observando e vocês não deveriam desperdiçar tokens caros”
Claro, no passado eles já admitiram usar métricas idiotas como número de linhas de código ou número de commits, mas não acredito que seja algo tão simples quanto quanto mais tokens, melhor
Quando contestamos, a liderança reconhece que gasto com tokens não é uma boa métrica e que as pessoas provavelmente vão abusar dela, mas logo em seguida volta a nos dizer para aumentar o gasto com tokens da equipe
Sei disso porque existe um dashboard de acompanhamento de tokens que a liderança vê e mostra diretamente nessas reuniões
Pelo menos ainda não divulgaram isso para todo mundo em forma de ranking
Circulam muitos rumores de que gasto com tokens vai entrar na avaliação de desempenho, e a liderança nega, mas logo depois marca mais reuniões sobre como é importante aumentar o gasto com tokens e discute as deficiências visíveis no dashboard
O problema explode em empresas que criam rankings de uso de tokens ou insinuam que podem demitir engenheiros que se recusem a usar ferramentas de IA
Aí começa uma competição para gastar o máximo possível de tokens para sobreviver
Isso é especialmente forte entre desenvolvedores que leem muita rede social
No Twitter, Threads, Mastodon, LinkedIn e outros, circulam repetidamente histórias virais recicladas sobre ser AI-native e demitir quem não usa IA o suficiente, e desenvolvedores ansiosos passam a achar que precisam queimar tokens mais rápido que os colegas para escapar de cortes inevitáveis
Depois disso, os colaboradores individuais da organização foram instruídos a usar IA em tudo, sob aviso de que isso poderia prejudicar suas carreiras se não o fizessem
Estão empurrando treinamentos obrigatórios, workshops e hackathons para “incentivar” o uso de IA no trabalho do dia a dia
Até coisas que seriam fáceis com shell script viram pergunta do tipo “como podemos transformar isso em um agente?”
Gastaram muito dinheiro com Copilot e agora querem ver as pessoas usando
Pode ser que o próprio objetivo seja fazer as pessoas jogarem com a métrica
Se você pressiona as pessoas a usar mais IA, elas tentam, experimentam e “desperdiçam” tempo aprendendo
Esse é o objetivo final
Neste momento, estão gastando tokens em coisas inúteis para descobrir onde isso ajuda, e também é assim que aprendem onde não ajuda
Nossa empresa está fazendo a mesma coisa
Pode ser desperdiçador, mas é a forma mais rápida de explorar onde a IA realmente pode ser útil para o negócio
Mesmo que 80% dos funcionários só desperdicem tokens, os outros 20% estão descobrindo como fazer funcionar
Se você tem tanto dinheiro a ponto de poder queimá-lo, eu até consigo imaginar formas piores de gastar, mas falando sério isso é idiotice
Em que outro caso empresas gastaram milhões de dólares e tempo de pessoas em uma ferramenta para “descobrir para que essa ferramenta pode servir de útil”?
É uma solução em busca de um problema
Se logo de início não está claro que problema essa ferramenta resolve, então tem que largar e seguir em frente
É melhor dar esse dinheiro que sobra para os funcionários e acionistas
É lamentável que a IA agora tenha um programa de emprego universal básico, enquanto os humanos ainda não têm
As empresas estão pagando para uma IA cavar buracos e para outra IA preencher esses mesmos buracos
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
A União Soviética alcançou 100% de emprego há muito tempo[0], junto com a pobreza correspondente
Isso não é igual, porque não é financiado por impostos
Empresas privadas estão experimentando com o próprio dinheiro e assumindo o risco de elevar custos e depois ver clientes irem para outro lugar
Ainda assim, é muito melhor do que dar dinheiro às pessoas via imposto obrigatório independentemente da produtividade
[0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Dentro da Amazon, ao usar o Kiro, o uso de tokens é gamificado
Isso porque não funciona como na AWS, onde o custo é cobrado do time, nem como no sistema antigo, onde era preciso justificar capacidade
Antes mesmo de qualquer pessoa olhar rankings internos, ouvi relatos bastante críveis de gente manipulando essa métrica, e também há muitos usuários entusiasmados construindo e compartilhando projetos internos de todo tipo
É certo que gerentes sofrem pressão depois de ouvir em apresentações internas coisas como melhoria de produtividade de N00%, mas onde eu estou, se alguém criasse trabalho falso no lugar de trabalho real, perceberiam isso bem rápido
A pressão vem de prazos agressivos e da mudança, no processo anual de OP1, para um modo mais ágil
Ouvi histórias parecidas de funcionários da AWS e de outras FAANG que não são AWS
Todo ranking de tokens vem com um aviso de isenção dizendo “isto não entra na avaliação de desempenho”, mas com um implícito piscadela e aceno logo em seguida
Em uma organização sobre a qual ouvi falar, há uma pessoa rodando GasTown 24 horas por dia e devorando tokens
Ela pouco contribui, mas ocupa confortavelmente o primeiro lugar
Ele roda o GasTown e deixa agentes mexerem no código por todo lado, o que rende algo como 50 commits por dia
São coisas como versões compatíveis e formatação
Mas o problema não é a tecnologia, e sim ele
Ele já era assim antes dos LLMs
Costumava “refatorar” repositórios em repositórios menores para que, de repente, o nome dele aparecesse em todo o código, e para uma olhada superficial parecia que ele tinha criado grandes partes da base de código da empresa
Ele recusava coisas que eu queria fazer e depois ia lá e fazia ele mesmo
Ficava implicando infinitamente com meus pull requests ou dizia que o trabalho nem deveria ser feito, para depois virar as costas e implementar ele mesmo
Ele não copia e cola meu código, mas depois que meu PR está aberto ele reimplementa a mesma ideia que antes havia rejeitado
É muito inteligente, mas muito desonesto, e esconde bem essa desonestidade
Se você perguntar, ele responde algo como “achei que esse jeito pareceria mais organizado”
De fora, sempre existe margem para argumentar que um jeito é melhor do que o outro, então a desonestidade não fica claramente evidente, mas eu vejo 100% do que ele faz, então o padrão é completamente óbvio
Além disso, uma vez eu disse que tiraria férias em uma certa semana; ele não recusou explicitamente, mas perguntou se eu poderia adiar porque havia muita pressão para entregar The Thing
Quando respondi “não, não vou adiar”, ele aprovou, só que quando a semana chegou ele próprio também tirou férias na mesma semana
Eu nem discuti isso. Já sabia suficientemente bem que ele não tem vergonha de exigir dos outros algo que ele jamais aceitaria para si mesmo
Se uma porta-voz da Amazon disse que não existe nenhuma métrica de uso de IA em nível de empresa, nem rankings internos comparando funcionários, e que em dashboards pessoais cada um só pode ver seu próprio uso, isso é mentira descarada
Existe um dashboard global que classifica funcionários por uso do Kiro/QuickSuite (antes Amazon Q) com base em tokens
O dashboard em si fica no QuickSight, que aliás agora também faz parte do QuickSuite
Os dados não só estão abertos para qualquer pessoa, como também podem ser ordenados por ranking, uso diário, semanal, mensal e anual
Incluem funcionários atuais e ex-funcionários, ambos por alias interno
Além disso, há um sistema interno de “premiações” exibido no perfil do PhoneTool, em que cada funcionário recebe títulos do Kiro/AmazonQ/Quicksuite como “Blaze” e “Thunderstorm”
E você pode ver com um clique outras pessoas que receberam o mesmo prêmio
Só para constar, o PhoneTool é o diretório interno de perfis para consultar outros funcionários
Enquanto isso, conheço várias pessoas que não conseguem escrever código decente por conta própria nem integrar algo diretamente em nada
Pessoas que precisam de ajuda o tempo todo estão produzindo quantidades enormes com Kiro/AmazonQ e atualmente aparecem acima de SDEs no ranking
Elas se parecem mais com SysDev, engenheiros de suporte ou TPM do que com SDEs
Isso em si não é necessariamente bom nem ruim, mas se você fizer stack ranking por uso de tokens, bons engenheiros que tentam escrever código “bom” provavelmente acabarão avaliados abaixo de pessoas que não se esforçam por soluções concisas
A qualidade vai cair no fim das contas, e quando a liderança perceber o que aconteceu, já vai ser tarde demais
Já vi incidentes relacionados a Amazon-Q/Kiro e, ainda assim, continuam negando
Essa tendência também está chegando ao meu trabalho
Todo dia recebo notificações irritadas se eu não usar o Copilot do MS Office, então estou simplesmente digitando Hello