O cansaço de conversar com ferramentas
(ohadravid.github.io)- LLMs não funcionam como boas ferramentas que se tornam naturais como um teclado ou um carro, mas como interlocutores que exigem pedidos e negociação, consumindo a energia social do usuário
- Boas ferramentas são assimiladas pelo cérebro como uma extensão do corpo graças à consistência e à velocidade, mas LLMs como Claude ou Cursor ainda não chegaram a esse nível
- Ao usar LLMs, as pessoas acabam pedindo, persuadindo e às vezes até se irritando, como fariam ao falar com outra pessoa, pagando assim um custo social
- Interagir com pessoas traz recompensas como aprendizado, desafio, inspiração e contraposição, mas LLMs em geral devolvem mais código, mais testes, desculpas e, às vezes, relatórios de bug
- Embora algumas tarefas tenham se tornado possíveis em um nível que seria difícil para uma única pessoa alcançar há 1 ano, ainda é incerto se, em todas elas, vale mais gastar energia social com LLMs do que com colegas reais
LLMs que deixam de ser ferramentas e viram interlocutores
- LLMs causam cansaço porque exigem energia social para funcionar
- Essa energia talvez fosse melhor empregada em interações com pessoas reais
- Quando usamos uma boa ferramenta, o cérebro a incorpora como se fosse parte do corpo
- dirigir um carro
- digitar no teclado
- executar tarefas pressionando combinações de teclas no Vim ou no VSCode
- Já ao conversar com pessoas, entramos em um estado de consciência social
- trocar ideias
- pedir ajuda
- colaborar para não deixar um ticket escorregar para o próximo trimestre
- Esse tipo de trabalho cognitivo social é mais difícil do que simplesmente usar uma ferramenta e exige mais energia
O que os LLMs devolvem e as recompensas que faltam
- LLMs não oferecem a mágica da ferramenta que um teclado ou um carro proporcionam
- quase ninguém diria que Claude ou Cursor parecem uma extensão do próprio corpo
- faltam consistência e velocidade suficientes para que o cérebro os aceite como ferramentas
- Em vez disso, o usuário paga um imposto social: conversa com o LLM, negocia, tenta persuadi-lo e às vezes até se irrita
- Gastar custo social com pessoas vale mais a pena porque elas devolvem mais recompensas
- é possível aprender algo novo ou ser desafiado
- é possível se inspirar
- se você disser bobagem, a outra pessoa pode recusar
- e, em contrapartida, você também pode ensinar, desafiar ou inspirar outras pessoas
- LLMs, na maior parte do tempo, devolvem mais código, mais testes e mais desculpas
- às vezes também devolvem mais relatórios de bug, o que pode ter valor
- Em algumas tarefas, LLMs permitem que uma pessoa faça coisas que, há 1 ano, seriam impossíveis
- Mas ainda não está claro se faz sentido gastar trabalho cognitivo social em conversas com LLMs em todo tipo de tarefa
- LLMs exigem que o usuário fale com eles, mas raramente entregam recompensas proporcionais a esse esforço
1 comentários
Opiniões no Lobste.rs
No meu caso, conversar com IA já virou quase uma segunda natureza. Hoje abro umas 10 conversas por dia com todo tipo de pergunta e quase nem percebo mais
O fluxo de escrever a pergunta, ler, responder e reler parece muito com pesquisar no Google. Assim como dirigir vira algo automático, como se as mãos se movessem sozinhas, conversar com IA também começou a ocupar esse mesmo lugar, pelo menos para mim
Porque ele faz coisa demais por você na hora de encontrar fontes e conectar conhecimentos. Claro, tudo bem quando você só quer uma resposta rápida para algo de pouca importância, mas no geral acho que a capacidade de investigar precisa continuar afiada
Às vezes também consulto a codebase quando tenho uma pergunta específica, mas isso para mim se parece mais com perguntar a um colega. Porque é preciso pensar em como formular, às vezes perguntar de novo de forma mais específica, e ocasionalmente vem uma resposta falsa, então é preciso reformular mais uma vez
Dependendo de como se usa, você praticamente terceiriza o pensamento, então também existe o risco de perda de capacidade. Em vez de depender mais de LLM, deveríamos tentar depender menos
Falando em “recompensa”, vi algo interessante alguns dias atrás. Estou trabalhando com dois programadores iniciantes, e para mim isso é um equilíbrio bem difícil. Gosto de incentivar as pessoas, mas ao orientar iniciantes preciso avaliar o trabalho de forma crítica
Então procuro ocasiões para elogiar, mas ao revisar trabalhos feitos com apoio de LLM percebi que o LLM acabou tirando de mim a chance de elogiar e ajudar no crescimento deles. Não dá para distinguir que parte foi gerada e que parte realmente veio do que a pessoa aprendeu
No fim, acabo criticando o trabalho que o LLM fez e dizendo coisas como “faça o LLM fazer mais/menos disso”, ou então a pessoa reage de forma defensiva com “mas o LLM disse para fazer assim”. Sinceramente, isso me fez repensar o próprio valor do code review. Agora que todo mundo tem seu próprio “amigo de programação” virtual, parece que diminuíram as oportunidades de compartilhar conhecimento por meio de revisão de código
As duas são áreas sobre as quais dá para dar feedback, mas na segunda ainda não existem especialistas, então ela se parece mais com colaboração. Ainda assim, a primeira regra é clara. Se a pessoa não consegue explicar o motivo e o conteúdo da mudança para além de “foi o que o LLM disse”, então deve ser rejeitada e refeita
Concordo que ficar conduzindo um LLM cansa, mas não chega nem perto de dirigir. Já faz mais de 30 anos que dirijo legalmente, mas se eu tivesse de dirigir durante todo o expediente, provavelmente precisaria folgar no dia seguinte
Não é só se preocupar com os próprios erros; a imprudência e a incompetência de outros motoristas podem até colocar sua vida em risco. Imagino que também importe onde você dirige 😅
Seguindo a definição de ferramenta do autor, para mim o Firefox talvez nem se qualifique como ferramenta, e por esse critério o Chromium é ativamente malicioso e hostil
Tenho a impressão de que a discussão sobre economizar/gastar energia mental em torno de LLM é extremamente multidimensional. Existe o grau em que alguém se sente imediatamente atraído por conversar como com uma pessoa versus lidar com algo sem mente persistente, e por cima disso entram traços de introversão/ambiversão/extroversão. Também importa o quanto o pensamento da pessoa é mais próximo ou mais distante de uma linguagem linear, então o LLM pode estar substituindo o pensamento ou pode estar substituindo o trabalho de traduzir o pensamento real para convenções irritantes de comunicação humana. Há também a diferença entre velocidade de leitura e velocidade de digitação
Sobre a persona social e a conversa de ida e volta tratadas no texto, eu não leio bem as pessoas e também não posso “desfazer” uma pessoa, então pedir algo a um LLM não é nada parecido com uma conversa humana. Posso olhar para os trechos prolixos antes da resposta e ver como a ambiguidade da minha frase foi interpretada, e também posso reescrever o último pedido mantendo o começo da conversa para evitar uma interpretação errada. Depois ainda posso até reescrever as próprias respostas do LLM no histórico para induzir a resposta seguinte
Um LLM hospedado talvez seja menos entusiasmado em deixar você reescrever completamente pensamentos ligados à segurança, mas isso é só mais um motivo para usar apenas modelos locais. Só o fato de ser um serviço hospedado por oligopólio, com mudanças de comportamento sem aviso e pesos ocultos, já basta para evitar
Claro, mesmo que desse para fazer esse tipo de manipulação com um ser humano, seria algo ruim. Humanos têm personalidade duradoura. Por isso, às vezes é menos cansativo conversar com uma ferramenta que não foi feita para ter uma mente persistente. Se eu falar de forma seca e excessivamente objetiva, a ferramenta não vai se incomodar
E a recomendação atual não é justamente que quase sempre vale mais a pena reescrever a consulta inicial para evitar o erro, em vez de deixar um erro de contexto como numa conversa humana e depois ter de explicar?
Gosto de conversar com o Claude, e como ele foi treinado para ser muito agradável de acordo com preferências humanas, acho que muita gente deve sentir algo parecido