A dívida cognitiva acumulada ao escrever ensaios com um assistente de IA

(arxiv.org)

1 pontos por GN⁺ 2025-06-17 | 1 comentários | Compartilhar no WhatsApp

Um preprint que mede o custo cognitivo do uso de LLMs no ensino de redação, testando se ferramentas de IA amplamente usadas em estudo e trabalho podem enfraquecer a capacidade de aprendizagem
Os participantes foram divididos em grupos LLM, Search Engine e Brain-only, escreveram ensaios em 3 rodadas e, na 4ª, parte do grupo LLM escreveu sem ferramenta, enquanto parte do grupo Brain-only usou LLM
54 pessoas participaram das rodadas 1 a 3, e 18 delas participaram da 4ª; o estudo combinou EEG, análise de NLP, entrevistas por sessão e avaliação por professores humanos e por um AI judge criado separadamente
Quanto maior o suporte externo, menor a conectividade cerebral; o grupo Brain-only mostrou a rede mais forte, o grupo Search Engine ficou no nível intermediário e o suporte de LLM apresentou o acoplamento geral mais fraco
Ao longo de 4 sessões em 4 meses, o grupo LLM teve desempenho inferior ao grupo Brain-only em níveis neural, linguístico e de pontuação, além de menor senso de autoria e menor capacidade de citação imediata

O custo cognitivo dos LLMs medido na escrita de ensaios

O foco está em verificar o custo que o uso de LLMs deixa nos processos cognitivos ao escrever ensaios em ambientes educacionais
LLMs permitem experiências de aprendizado personalizadas, feedback imediato e maior acesso a recursos educacionais, mas seu uso amplo pode reduzir o envolvimento com pensamento crítico e análise profunda
A escrita de ensaios é uma tarefa comum para avaliar a capacidade dos alunos em escolas e testes padronizados, e foi escolhida por ser um trabalho complexo que exige vários processos cognitivos ao mesmo tempo
O artigo está em estado de preprint, under review

Participantes e desenho das sessões

Os participantes foram divididos em três grupos
- Grupo LLM: escreveu ensaios com uma ferramenta LLM designada
- Grupo Search Engine: escreveu ensaios usando mecanismo de busca
- Grupo Brain-only: escreveu ensaios sem ferramentas externas
Nas rodadas 1 a 3, cada participante manteve a condição atribuída ao seu grupo
Na 4ª rodada, a condição de parte dos participantes foi alterada
- LLM-to-Brain: participantes que antes usavam LLM passaram a escrever sem ferramenta
- Brain-to-LLM: participantes que antes escreviam sem ferramenta passaram a usar LLM
Um total de 54 pessoas participou das rodadas 1 a 3, e 18 delas concluíram a 4ª rodada
Em cada sessão, os participantes escolhiam um tema do SAT para escrever um ensaio; nas rodadas 1 a 3, eram oferecidos 3 temas por sessão, totalizando 9 opções

Métodos de medição

EEG foi usado para medir a atividade cerebral
- A atividade cerebral dos participantes foi registrada para avaliar engajamento cognitivo e carga cognitiva
- O objetivo também incluía compreender com mais profundidade a ativação neural durante a escrita dos ensaios
Análise de NLP foi aplicada aos textos dos ensaios
- Named Entities Recognition (NER)
- n-gram
- ontologia de tópicos
- similaridade e distância com base em embeddings
Após cada sessão, foram realizadas entrevistas com os participantes
- conformidade com a estrutura do ensaio
- capacidade de citar o próprio ensaio
- precisão das citações
- senso de autoria sobre o ensaio
- satisfação, entre outros pontos
Na avaliação, foram usados professores humanos e também um AI judge criado separadamente

Resultados de EEG: quanto maior o suporte externo, menor a conectividade cerebral

Os três grupos mostraram padrões distintos de conectividade neural, refletindo estratégias cognitivas diferentes
A conectividade cerebral caiu de forma sistemática conforme aumentava a quantidade de suporte externo
- Grupo Brain-only: mostrou a rede mais forte e mais ampla
- Grupo Search Engine: apresentou um nível intermediário de engajamento
- Suporte de LLM: mostrou o acoplamento geral mais fraco
Na 4ª rodada, participantes LLM-to-Brain apresentaram conectividade neural mais fraca e menor engajamento das redes alpha e beta
Já os participantes Brain-to-LLM mostraram maior recuperação de memória e reengajamento amplo de nós occipito-parietal e prefrontal
- Esse padrão pode estar relacionado ao processamento visual e é semelhante ao que foi observado com frequência no grupo Search Engine

Características dos ensaios reveladas pela análise linguística

Dentro de cada grupo, foi encontrada homogeneidade consistente em NER, n-gram e ontologia de tópicos
Os ensaios do grupo LLM mostraram características linguísticas mais homogêneas dentro do próprio grupo
O grupo Search Engine apresentou, em alguns temas, uso de n-gramas que parece refletir influência de otimização para busca
- Ex.: no tema PHILANTHROPY, apareceu foco no n-grama homeless
A distância entre os ensaios do grupo Brain-only foi sempre significativamente maior do que nos grupos LLM ou Search Engine
Em alguns temas, surgiu uma diferença quase ortogonal entre o grupo LLM e o grupo Brain-only
- Ex.: temas HAPPINESS e PHILANTHROPY

Senso de autoria, memória e capacidade de citação

O grupo LLM mostrou menor senso de autoria sobre os próprios ensaios nas entrevistas
O grupo Search Engine também mostrou alto senso de autoria, mas ainda abaixo do grupo Brain-only
A capacidade de citar conteúdo do próprio ensaio escrito poucos minutos antes também foi menor no grupo LLM
O grupo Brain-only apresentou alto senso de autoria e alta capacidade de citação
Os participantes Brain-to-LLM da 4ª rodada usaram LLM, mas mostraram melhor integração de conteúdo em combinação com o efeito das sessões anteriores em Brain-only, enquanto o senso de autoria apareceu dividido

Diferenças no experimento de transição da 4ª rodada

Participantes Brain-to-LLM mostraram maior conectividade neural quando reescreveram com ferramenta de IA após terem escrito antes sem IA
- a conectividade direcionada nas bandas alpha, beta, theta e delta aumentou em toda a rede
- houve interação mais ampla entre redes cerebrais do que nas rodadas 1 a 3 com uso exclusivo de LLM
Participantes LLM-to-Brain mostraram esforço neural menos coordenado na maioria das bandas ao escrever sem ferramenta após experiência anterior com LLM
- também apareceu viés de vocabulário típico de LLM
- tanto o AI judge quanto os professores humanos deram notas altas, mas a distância no uso de NER e n-gram foi menos marcante do que em outros grupos e sessões
Quando o grupo Brain-only passou a usar LLM na 4ª rodada, a conectividade cerebral dessa rodada não voltou ao padrão inicial de iniciantes visto na 1ª rodada de Brain-only, nem chegou ao nível da 3ª rodada de Brain-only
- foi observado um estado intermediário de engajamento da rede

Conclusão e limitações

O uso de LLM teve efeito mensurável sobre os participantes e, embora as vantagens iniciais parecessem claras, ao longo das sessões em 4 meses o grupo LLM mostrou desempenho inferior ao grupo Brain-only em vários níveis
Esse desempenho inferior foi observado em conjunto na conectividade neural, nas características linguísticas e nos resultados de avaliação
Num momento em que o impacto educacional dos LLMs sobre o público geral está apenas começando a se consolidar, a possibilidade de queda na capacidade de aprendizagem continua sendo uma questão importante
O artigo pretende servir como guia preliminar para entender os impactos cognitivos e práticos da IA em ambientes de aprendizagem

1 comentários

GN⁺ 2025-06-17

Comentários do Hacker News

Em vez de chamar isso de “acúmulo de dívida cognitiva”, eu chamaria simplesmente de declínio cognitivo ou perda de capacidade cognitiva
É natural esquecer quando não se usa a linguagem, e o cérebro não fica retendo informações desnecessárias. Em estudos sobre o uso de navegação pelo Google Maps, houve resultados como “o uso habitual de GPS afeta negativamente a memória espacial durante a navegação autônoma” ou a observação de redução de massa cinzenta em usuários de mapas
Quem já construiu expertise em áreas científicas sabe que, para entender alguma coisa, é preciso ruminar sobre ela e explorar como cada ideia se conecta com as outras. Não dá para aprender matemática só folheando um livro-texto; é preciso parar e pensar. Os objetos mentais que depois podem ser usados no raciocínio são criados justamente pelo ato de pensar
- O mais importante em “não dá para aprender matemática só folheando um livro-texto; é preciso parar e pensar” é escrever
  É preciso escrever bastante. A escrita faz o cérebro estruturar o pensamento, permite uma conversa estruturada consigo mesmo e ajuda a explorar vários caminhos. Só pensar e refletir logo chega a um limite, mas a escrita permite explorar o pensamento quase sem fim
  Se o pensamento está tão intimamente ligado à escrita, e se a escrita pode ser qualquer coisa — prosa, desenho, equações, gráficos, diagramas — então é interessante pensar que impacto o fato de os LLMs assumirem cada vez mais da escrita terá sobre a capacidade cognitiva
- Eu chamaria isso de dívida cognitiva. Você já tentou escrever um grande relatório com um LLM?
  É muito tentador deixar o LLM escrever bastante, definir a estrutura e produzir argumentos e materiais visuais. Aos poucos, à medida que você delega mais, o resultado acaba não sendo mais seu
  Mas o relatório leva o meu nome, e esperam que eu seja capaz de explicá-lo e entendê-lo. Em princípio, um relatório deveria ser uma “projeção bidimensional” da “realidade de alta dimensão” que está na sua cabeça, mas um relatório cuspido em um décimo do tempo não é assim. No papel ele parece plausível, mas quando você tenta explicar os conceitos, trava
  No fim, você percebe que precisa fazer o trabalho diretamente, construir um modelo mental, expressá-lo, reexpressá-lo e reexpressá-lo de novo. E isso precisa ser feito de formas diferentes conforme o público-alvo
  Antes dos LLMs, para escrever um relatório você teria de construir um modelo mental; com LLMs, quase não precisa construir esse modelo. Acho que dívida cognitiva é um bom termo para descrever esse intervalo entre os dois
  No fim das contas, o relatório ou artigo leva o meu nome. O que se pode esperar de mim, como autor? Com o tempo, essa expectativa pode diminuir. Quando surgirem perguntas profundas, talvez passem por cima do autor e recorram ao modelo “mental” do LLM. Mas outros modelos, como os LLMs, podem ter “modelos” diferentes — ou seja, algoritmos de previsão — sobre a verdade fundamental e a realidade. Qual deles permite as previsões mais precisas? Isso exige certo grau de profundidade de entendimento, e, se você depender demais do LLM para escrever, essa profundidade não surge
  No longo prazo, isso pode realmente levar a um “declínio cognitivo, ou perda de capacidade cognitiva” em nível populacional, mas é preciso cautela antes de afirmar isso. A imprensa tipográfica não produziu esse resultado, embora as elites religiosas da época temessem que o público em geral não conseguisse interpretar textos corretamente
  Como também apareceu neste tópico, eu vejo “escrever como pensar”. Dito isso, talvez exista algo melhor que a escrita, só que ainda não foi inventado. Pensar é desenvolver modelos mentais detalhados que permitam prever o futuro com probabilidade maior do que o acaso. Nossa sobrevivência depende disso, e, do ponto de vista da teoria da informação, é isso que a evolução faz [0]. “Nada em biologia faz sentido sem a luz da informação”
  [0] https://www.youtube.com/watch?v=4PCHelnFKGc
- Se “o cérebro não retém informações desnecessárias”, então por que eu ainda sei configurar config.sys e autoexec.bat para otimizar a memória convencional do DOS?
  Faz 20 anos que não faço isso, e tenho bastante certeza de que nunca mais vou fazer
- Expressões como “declínio cognitivo” ou “apodrecimento do cérebro” podem soar sensacionalistas demais e, sendo justo, os autores também registraram as limitações de um tamanho de amostra pequeno
  Também parece um título estranho o fato de o artigo não fornecer referências ou citações para o termo “dívida cognitiva”. Pode ser que tenham mudado isso no fim
  É um estudo interessante vindo do MIT. Como toda pesquisa em psicologia, precisa de ceticismo saudável e verificação independente. Também passa um ar de mistura de tudo — com imageamento e avaliação psicométrica juntos — mas quem não gosta de uma imagem do tipo “este é o seu cérebro usando LLM”
- A frase “o cérebro não retém informações desnecessárias” soa plausível, mas como então explicar habilidades como andar de bicicleta, que muita gente diz que, depois de aprendidas, nunca desaparecem?
Cada vez mais sinto que os LLMs são mais uma tecnologia para a qual a sociedade vai acabar desenvolvendo uma imunidade
Na educação, isso já começou na forma de professores conversando com alunos, observando como aprendem e verificando o processo pelo qual demonstram uma habilidade. Nos negócios, em breve também se perceberá que a maior parte da comunicação valiosa precisa ser produzida diretamente pelas pessoas como autoras daquilo que querem dizer. O ato de escrever corresponde a algo como dois terços do essencial na maior parte da comunicação
Claro que, antes disso, provavelmente teremos de passar por um choque dramático de achatamento do pensamento para ganhar imunidade de fato aos efeitos colaterais. A rejeição dos LLMs por especialistas, em oposição aos entusiastas ingênuos devotos da “mediocridade”, parece uma experiência inicial de imunização: https://fly.io/blog/youre-all-nuts/
Sempre que uso LLMs de forma “macroscópica” nos meus projetos, meu pensamento se deteriora muito, minha capacidade de decisão me é tirada e minha prontidão de adaptação posterior piora. Em trabalho importante, LLM é estritamente uma ferramenta microscópica de preencher lacunas
Isso é diferente de uma calculadora. Não se trata de tirarem de você algoritmos de cálculo manual de que gostava. É um sistema que substitui o próprio pensamento por ausência de pensamento e prejudica gravemente prontidão, profundidade, adaptabilidade e senso de autoria em todas as áreas em que é usado
- Acredito que uma das capacidades mais subestimadas nos negócios é a de tecer uma narrativa coerente
  Participo de muitas reuniões com engenheiros brilhantes, mas muitas vezes eles não conseguem apresentar seus argumentos de um jeito que tanto pessoas técnicas quanto não técnicas consigam acompanhar. Há uma dimensão artística na escrita e na fala, e só agora, chegando ao fim dos 40 anos, começo a perceber de verdade seu valor. A linguagem é uma ferramenta poderosa, e a escolha de uma única palavra às vezes pode salvar ou arruinar um argumento
  Não vejo o que os LLMs poderiam fazer além de piorar muito essa situação no geral
- Isso já está acontecendo. Converso com engenheiros juniores em plataformas de chat sobre ideias recentes, e as respostas em tempo real começam a aparecer em uma página de texto estruturado em tópicos
  O assustador não é só que eles usam ChatGPT para evitar pensar, mas que acham que ninguém vai perceber, ou acreditam que é assim mesmo que adultos conversam
- Gosto desse otimismo de que é “mais uma tecnologia para a qual a sociedade vai desenvolver imunidade”. Ainda não desenvolvemos imunidade coletiva nem à tecnologia de mídia social dos anos 2010, mas aceito esse otimismo
- Se a maior parte da comunicação valiosa precisa vir das pessoas, também dá para perguntar quanto da comunicação de fato é valiosa
  Na prática, acho que há muita comunicação com pouco valor. Ainda assim ela continua sendo produzida, e, se ninguém vai ler, por que não automatizar sua geração?
  Claro que também há bastante coisa importante que precisa estar correta
- A questão central é quanto da comunicação é “valiosa”
  Estou na academia, que em teoria deveria ser uma das profissões que mais exigem pensamento. Ainda assim, mais da metade do que escrevo são relatórios de todo tipo, pedidos de verba de pesquisa, solicitações de ética e gestão de dados, cartas de recomendação e formulários administrativos. É difícil considerar isso “valioso” no sentido de exigir pensamento útil, e eu realmente não me importo se o texto soa como eu, desde que atenda a exigências estúpidas
  Para esse tipo de uso, os LLMs são uma bênção, e podem até ajudar a pensar, porque me permitem dedicar mais tempo à pesquisa de verdade e ao ensino presencial
A discussão aqui sobre dívida cognitiva está correta, mas acho que pode até ser conservadora demais
Não se trata apenas do nível de esquecer uma habilidade como linguagem ou perder memória espacial por usar GPS. Pode ser um problema de atrofia sistemática e irreversível das vias neurais responsáveis pelo raciocínio integrador
O risco central não é a “dívida” em si, com a nuance de que ela poderia ser paga com prática, mas sim ultrapassar um ponto de inflexão cognitivo. É o limiar em que função executiva, síntese e argumentação são transferidas demais para sistemas externos como LLMs, a ponto de o cérebro biológico não apenas podar conexões não usadas com eficiência impiedosa, mas também perder a meta-habilidade de reconstruí-las
Nosso hardware biológico úmido é um sistema de “se não usar, perde”, sem controle de versão. Quando funções cognitivas complexas atrofiam, o “código-fonte” é danificado. Não existe git revert para uma rede neural colapsada que antes sustentava pensamento profundo e estruturado
Este tópico do HN foca em escrever ensaios, mas, ampliando a escala, estamos fazendo um experimento gigantesco e incontrolável de terceirização da cognição coletiva. A consequência de longo prazo pode não ser apenas uma sociedade de pessoas menos habilidosas, mas uma sociedade de pessoas estruturalmente incapazes do tipo de pensamento que construiu nosso mundo
Portanto, a pergunta não é “como evitar a dívida cognitiva?”. A pergunta realmente assustadora é: “se o recipiente biológico da mente se otimiza para a preguiça de forma tão impiedosa, talvez irreversível, de que tipo de recipiente nossa mente vai precisar?”
https://github.com/dmf-archive/dmf-archive.github.io
- Cabe a cada um decidir para que usar LLMs. Para trabalhos com muita fricção e baixa vazão, como fazer pesquisa online com ferramentas de busca ruins, acho modelos de texto excelentes
  São bons para perguntar o que você não sabe ou pular as “partes chatas”. Em especial, não sinto nem um pouco que me torne mais inteligente ter de encontrar a solução para um problema técnico obscuro em várias páginas de fóruns ou redes sociais. De qualquer forma, a informação precisa ser verificada e assimilada com cuidado
  O StackExchange, se funcionasse como foi originalmente concebido, teria sido muito mais valioso do que modelos de texto. Mas as pessoas reais são imperfeitas e carregam todo tipo de viés cognitivo e bagagem, e LLMs não fecham sua pergunta como “ampla demais” logo depois de ela receber recomendações e interação
  Por outro lado, ainda considero a escrita com LLM muito inferior em temas que conheço bem. Por exemplo, se tento escrever um e-mail, acabo gastando um tempo parecido ajustando o prompt para manter a direção ou reescrevendo bastante o resultado. Em vez de revisar e fazer peer review de um modelo de texto, é melhor escrever eu mesmo no meu próprio fluxo
A IA é o oposto do Zettelkasten
Em vez de trabalhar ativamente em um tema e ganhar insights cada vez mais profundos, você fica iterando de forma rápida, mas superficial, sobre um corpus de conteúdo gerado por IA
Por exemplo, eu queria entender melhor a situação no Oriente Médio, então escrevi um ensaio de 10 páginas sobre as origens do Hamas e do Hizbulah tendo a OpenAI como coautora
Mas não me lembro de nada, e pior: não sei se as coisas de que me lembro são alucinações que corrigi ou fatos reais
- Pessoas inteligentes em geral sabem que escrever é tanto pensar quanto obter um resultado em forma de texto
  LLMs não são ferramentas para escrever no seu lugar, mas podem ser ótimos parceiros de sparring se usados para encontrar erros, apontar lacunas e falhas e ajudar a investigar perguntas gerais sobre o mundo. Claro, sempre com cuidado e conferindo as fontes
- Sou relativamente otimista quanto à utilidade dos LLMs, mas concordo com esse ponto
  Você desenvolve um senso de como conduzir o modelo e reduzir alucinações, mas isso não significa acumular conhecimento que consiga explicar com clareza nem praticar pensamento desafiador. Fica mais próximo de aprender reações de memória muscular como confiar mais ao ver certas formas de saída do LLM, tentar outra estratégia de prompt, ou decidir se limpa ou não o contexto
  Mesmo que isso possa ser chamado de habilidade, há uma grande chance de se tornar inútil em alguns anos à medida que os modelos melhorarem. Dá uma sensação de impotência que um trabalhador de linha de montagem talvez sentiria
- Como temos tendência a lembrar melhor das partes que deram problema do que do que correu bem, imagino que o que fica na memória são os trechos que você precisou corrigir pessoalmente
- Acho interessante essa visão de que a IA é o contrário de acessar conhecimento conectado, isto é, de um Zettelkasten
Pessoalmente, o resultado não me surpreende. Quando uso IA na minha escrita ou no meu trabalho de tradução, não sinto que estou mentalmente tão envolvido no processo quanto quando faço tudo sozinho
Mas também descobri que, se eu usar IA de outras formas, isso por si só pode ser muito envolvente mentalmente. Nas últimas 2 semanas, venho experimentando com o Claude Code para ver até que ponto dá para automatizar por completo o brainstorming, a pesquisa e a redação de ensaios e artigos acadêmicos. Fiquei tão profundamente envolvido quanto quando escrevo ou traduzo diretamente, mas o tipo de envolvimento é diferente
Até agora, os resultados do experimento têm sido muito bons. Ou seja, mesmo sabendo que foram escritos por um agente de IA, muitas vezes acho os ensaios e artigos produzidos interessantes. Claro, não tenho planos de publicar nem compartilhar
- Uso ferramentas de IA por diversão ou para perguntas aleatórias, mas quase nunca em trabalho de verdade
  Às vezes me pergunto se não vou acabar fazendo parte de um grupo cada vez mais raro, o das pessoas que ainda conseguem realmente fazer alguma coisa, enquanto o resto vai ficando cada vez mais incapaz
Não é surpreendente, mas é sombrio, que “os participantes do grupo LLM apresentaram desempenho inferior ao do grupo Brain-only em todos os níveis de atividade cerebral, linguagem e pontuação”
- Parece combinar com o velho paradoxo da automação [1]
  Quando a pessoa fica só no papel de revisar o resultado e carimbar, em geral faz isso muito mal
  Faz tempo que penso que a forma de participação é a chave para criar um fluxo de trabalho de ampliação de verdade. Revisar código escrito por LLM? Fraco. O LLM acompanhar minhas mudanças e me dar feedback? Aí é outra história completamente diferente. Pode ser difícil e talvez nem muito popular, mas se de algum jeito não continuarmos no banco do motorista, a coisa pode ficar bem sombria
  [1]: https://en.m.wikipedia.org/wiki/Ironies_of_Automation
- “Devemos negar as máquinas pensantes. Os humanos devem estabelecer suas próprias diretrizes. Isso não é algo que uma máquina possa fazer. O raciocínio depende não do hardware, mas da programação, e nós somos o programa supremo! Nossa jihad é o ‘programa de descarte’. É descartar as coisas que nos destroem como humanos!”
  https://dune.fandom.com/wiki/Butlerian_Jihad
Agora que faço a maior parte da programação com IA, um efeito colateral um pouco inesperado é que fico muito menos cansado e consigo me concentrar por mais tempo
Isso me permite continuar produzindo mesmo quando há outras distrações. Essencialmente, ao transferir parte da carga mental para a IA, sobra capacidade para outras coisas
- Comigo é exatamente o contrário. Fiquei muito mais produtivo, faço várias coisas em paralelo e, no fim do dia, fico exausto como se meu cérebro tivesse funcionado a 100% da capacidade
- Por um lado, isso reduz a fadiga no curto prazo, mas, se você não tomar cuidado, também existe um ponto de inflexão em que a fadiga aumenta numa escala de tempo mais longa
  Antes, erros inesperados ou a necessidade de consultar documentação funcionavam como “quebra-molas” que me faziam respirar, e normalmente era aí que eu percebia o quanto estava cansado e dava uma pausa
  Com IA, esses quebra-molas ainda existem, mas às vezes há um impulso extra que faz com que eu não desacelere o suficiente para refletir sobre o quanto estou cansado
  A IA nem precisa estar certa. Só de ler uma sugestão adaptada à situação atual, meu fluxo de pensamento pode ser ativado de um jeito que depois fica difícil de conter
- Gosto de pensar na IA como um carro
  Você até pode ir a pé até um Walmart fora da cidade, carregar as compras e voltar, mas de carro é muito mais rápido e menos cansativo. Aí sobra mais tempo de qualidade para gastar com o que você gosta
Na época em que GANs estavam na moda, eu treinava modelos gerador-discriminador para geração de imagens
Pensando bastante nisso, percebi que discriminar é muito mais fácil do que gerar
Por exemplo, consigo distinguir uma boa UI de uma UI ruim, mas não consigo criar uma boa UI nem sob ameaça. Sei na hora se um filme é bom, mas escrever um conto decente é um trabalho penoso
Consigo julgar o quão realista é uma imagem, mas não consigo desenhar nem uma bicicleta simples de um jeito que convença os outros
Em muitos casos, dá para julgar se o que um LLM gerou é bom ou ruim. Então você pode usar uma estratégia grosseira, descartar os resultados ruins e continuar gerando até atingir o objetivo. É justamente por essa lacuna entre discriminar e gerar que os LLMs são úteis
Essas duas habilidades são separadas. A capacidade de gerar é difícil de aprender e muito valiosa. Se você não continuar treinando, ela vai atrofiar
- Em casos muito simples, como distinguir um desenho obviamente ruim de um bom, acho que isso está certo
  Mas em tarefas mais complexas, especialmente em áreas que exigem avaliação profunda, isso não necessariamente vale. Por exemplo, revisar 5 PRs não triviais provavelmente é mais difícil e leva mais tempo do que escrevê-los você mesmo
  O motivo de isso funcionar bem com imagens ou histórias curtas é que o filtro aplicado não é “bom vs ruim”, mas sim gosto vs não gosto
Acho provável que aprendamos a construir uma relação mais saudável com esse tipo de tecnologia. Não sei qual é o prazo. Pode levar gerações, ou pode acontecer mais rápido do que parece
Está claro que os modelos de linguagem são um acelerador. Mas, se a pessoa média passar a se “expressar melhor”, então os sinais que indicam inteligência bruta também vão mudar com o tempo
Ninguém quer se relacionar com um modelo de linguagem. Mas os modelos de linguagem podem ajudar pessoas que não estão preparadas para lidar com grandes mudanças de vida e frustrações. É uma ferramenta; basta saber usar
Pegue como exemplo real os conselhos amorosos. Com o tempo, acho que os “relacionamentos orientados pelo ChatGPT” vão se dividir em dois grupos. Um é o tipo “copia e cola”, que só acrescenta complexidade a uma comunicação que já era fraca — o tipo “só copiei o que o ChatGPT disse”; o outro é o tipo “acelerado”, que usa o ChatGPT para analisar as motivações da própria pessoa e do parceiro e encontrar soluções melhores para problemas comuns
Para avaliar corretamente o segundo caso, ainda é preciso cérebro e empatia. O primeiro sempre vai terminar em decepção. Acredito que, no fim, as pessoas vão perceber essa diferença
- Não tenho tanta certeza sobre a ideia de que “ninguém quer se relacionar com um modelo de linguagem”
  Não tenho experiência direta nem indireta, mas já ouvi muitos casos de pessoas realmente entrando em algum tipo de relação com IA, e até entendo em certa medida o apelo disso. Você pode ter “alguém” que está sempre ao seu lado quando quer falar de si, que não o julga completamente e não exige nada de você. É algo totalmente diferente de uma relação real, mas objetivamente pode ser melhor do que os piores relacionamentos humanos e talvez faça melhor para a saúde mental do que a solidão
  Para o bem ou para o mal, acho que nos próximos 10 anos os relacionamentos humano-IA vão crescer rapidamente. De um lado, há melhorias em memória, capacidade de planejamento de longo prazo e talvez até em corpos robóticos; do outro, há a expansão da epidemia de solidão
Isso é chamado de offloading cognitivo. Quem já trabalhou tempo suficiente com ferramentas de assistência à programação provavelmente vai reconhecer
- Ou dá para perceber isso trabalhando como gerente de engenharia
  É uma consequência inevitável de trabalhar em um nível mais alto de abstração. Não é o fim do mundo. Minhas habilidades em assembly também enferrujaram

A dívida cognitiva acumulada ao escrever ensaios com um assistente de IA

O custo cognitivo dos LLMs medido na escrita de ensaios

Participantes e desenho das sessões

Métodos de medição

Resultados de EEG: quanto maior o suporte externo, menor a conectividade cerebral

Características dos ensaios reveladas pela análise linguística

Senso de autoria, memória e capacidade de citação

Diferenças no experimento de transição da 4ª rodada

Conclusão e limitações

Leituras relacionadas

1 comentários

Comentários do Hacker News