Learn Your Way: reimaginando livros didáticos com IA generativa

(research.google)

3 pontos por GN⁺ 2025-09-20 | 2 comentários | Compartilhar no WhatsApp

Os livros didáticos têm, em essência, a limitação de serem um meio uniforme; o Google está explorando como usar IA generativa para gerar automaticamente formas alternativas de apresentação e exemplos personalizados, aumentando a eficácia da aprendizagem e o engajamento
O experimento de pesquisa Learn Your Way reformula livros didáticos de acordo com o nível e os interesses do aluno e os converte em conteúdo com múltiplas representações (multimodal) para induzir uma aprendizagem ativa
O núcleo é um pipeline de personalização que reordena o conteúdo por nível escolar e substitui exemplos com base em interesses, criando a base para gerar várias formas de apresentação como slides, narração, áudio e mapas mentais
Com foco em LearnLM + Gemini 2.5 Pro, o sistema combina workflows de agentes e modelos especializados para produzir representações de aprendizagem de alta qualidade, como ilustrações educacionais, quizzes e narração
Os resultados do RCT confirmaram melhorias significativas, incluindo 11 p.p. de ganho na memória de longo prazo, sugerindo o potencial de evoluir materiais estáticos para experiências de aprendizagem interativas e conduzidas pelo próprio aluno

Contexto e problema

Os livros didáticos têm limitações estruturais: por restrições de custo e tempo de produção, carecem de perspectivas alternativas, formatos diversos e variações personalizadas
É apresentada uma abordagem que usa IA generativa (GenAI) para gerar automaticamente representações ajustadas ao interesse e nível do aluno, preservando ao mesmo tempo a integridade do texto original
O objetivo é oferecer um ambiente em que o aluno escolhe por conta própria o formato e o percurso, aumentando a eficácia da aprendizagem e a motivação

Visão geral da abordagem: dois pilares

Geração de múltiplas representações: aplicação de um design que promove conexões conceituais por meio de representações multimodais como texto, slides, áudio, mapas mentais e quizzes
- Com base na Dual Coding Theory e em estudos posteriores, as conexões entre diferentes formas de representação contribuem para o fortalecimento dos esquemas conceituais
Personalização: a meta é reforçar a motivação e a aprendizagem profunda por meio da reorganização do texto conforme a série escolar e os interesses, além da adaptação de quizzes com base nas respostas

Estrutura técnica: LearnLM + Gemini 2.5 Pro

Foi adotada uma arquitetura em camadas baseada no Gemini 2.5 Pro com LearnLM integrado
Etapa 1, pipeline de personalização: materiais originais como PDFs são readequados ao nível escolar, e exemplos genéricos são substituídos por exemplos ligados aos interesses do aluno, servindo depois como texto-base para a geração das representações
Etapa 2, geração de múltiplas representações:
- Para mapas mentais e linhas do tempo, são aproveitadas as capacidades gerais do modelo de base
- Para slides e narração, usa-se um workflow multiagente para otimizar a eficácia educacional
- Como ilustrações educacionais têm limites quando geradas apenas com modelos de imagem genéricos, foi adicionado um modelo de imagem dedicado com fine-tuning
Como resultado, a combinação de modelo de base poderoso + etapas com agentes + componentes especializados viabiliza a geração em massa de representações multimodais de aprendizagem de alta qualidade

Composição da experiência Learn Your Way

Immersive text: unidades de leitura segmentadas, imagens geradas e perguntas embutidas transformam a leitura passiva em uma experiência ativa
Section-level quizzes: promovem a aprendizagem ativa com feedback imediato e detecção de lacunas de conhecimento
Slides & narration: oferecem slides cobrindo todo o conteúdo, atividades de preencher lacunas e narração em estilo de aula gravada
Audio lesson: usa conversas simuladas entre professor de IA e aluno, com apoio visual, para refinar conceitos equivocados
Mind map: permite explorar com flexibilidade o panorama geral e os detalhes por meio de uma estruturação hierárquica do conhecimento
Todos os componentes aplicam personalização por série escolar e interesses, e quizzes interativos reajustam o percurso de aprendizagem conforme o desempenho em tempo real

Avaliação de design instrucional

Foram convertidos 10 livros didáticos originais da OpenStax em 3 condições de personalização, cobrindo várias disciplinas, de história a física
Na avaliação feita por 3 especialistas em educação com critérios como precisão, cobertura e princípios de ciência da aprendizagem (LearnLM), foram obtidas pontuações positivas com média acima de 0,85 em todos os itens
Mais detalhes da avaliação são apresentados no tech report correspondente

Estudo de eficácia (RCT)

60 jovens de 15 a 18 anos da região de Chicago, com níveis de leitura semelhantes, foram distribuídos aleatoriamente e estudaram por até 40 minutos
Comparação: Learn Your Way vs leitor de PDF comum
Desempenho imediato: o grupo Learn Your Way teve média 9 p.p. maior
Retenção de longo prazo (após 3–5 dias): o grupo Learn Your Way ficou 11 p.p. acima (78% vs 67%)
Avaliação subjetiva: conforto 100% vs 70%, intenção de reutilização 93% vs 67%, confirmando vantagem em satisfação
Para complementar os indicadores quantitativos, foram realizadas entrevistas em profundidade de 30 minutos, que trouxeram insights qualitativos e feedback positivo sobre valor de aprendizagem e imersão

Por que funcionou

O pipeline de personalização ajustou o nível do texto e os exemplos ao contexto do aluno, contribuindo para reduzir a carga cognitiva e aumentar a relevância
As múltiplas representações promoveram conexões entre conceitos, ampliando pistas de recuperação da memória e potencial de transferência
A adaptação dos quizzes e os loops de feedback apoiaram a regulação metacognitiva e a correção de concepções equivocadas

Limitações e próximos passos

Por enquanto, trata-se de uma pesquisa em estágio inicial, e ainda é necessária validação repetida com amostras, disciplinas e faixas etárias mais amplas
É proposta a expansão para um sistema adaptativo contínuo, capaz de ajustar constantemente representações e dificuldade conforme o progresso e o padrão de erros do aluno
No futuro, o plano é seguir combinando princípios pedagógicos, medição de eficácia e estratégias de localização adequadas a contextos regionais

Implicações e pontos de aplicação

O principal ativo é um pipeline operacional que transforma materiais estáticos em artefatos de aprendizagem interativos e orientados pelo próprio aluno
Escolas, editoras e edtechs podem escalar isso com um sistema padronizado de produção que combine readequação de conteúdo por nível, substituição de exemplos por interesse, desenvolvimento multimodal e adaptação de quizzes
Do ponto de vista de engenharia, os fatores-chave são o desenho de orquestração de agentes, pipelines modulares de geração e loops de verificação de qualidade/precisão

2 comentários

trr245 2025-09-22

Falando como alguém que já fez isso, para personalização é necessária uma quantidade de informação que pode passar de 2 gigabytes.

GN⁺ 2025-09-20

Opiniões no Hacker News

Tenho uma ferramenta que criei chamada asXiv. Ela permite fazer perguntas sobre artigos do arXiv.org e também oferece, na tela inicial, perguntas sugeridas que ajudam a entender ou explorar o artigo. Há até uma demonstração do popular artigo Attention Is All You Need. O código é totalmente open source e, para reduzir custos, usa o modelo Google 2.5 flash lite (atualmente totalmente gratuito). Se necessário, também dá para rodar localmente com outros modelos trocando via variável de ambiente.
- O asXiv é interessante. Adicionei o post Show HN ao second-chance pool. Com isso, ele será exibido aleatoriamente na página inicial do HN. Explicação do second-chance pool
- O asXiv também é bacana, mas algo parecido já dá para fazer no alphaxiv com a função assistant. Basta ir ao artigo e clicar em tools → assistant. Exemplo no alphaxiv
- Parece bom, então quero testar com certeza depois. Só fiquei com uma dúvida: por que você não transformou isso em um SaaS comercial?
- Parece uma ferramenta realmente fantástica. Eu também fiz um produto parecido para ler arXiv/epub/pdf, o Ruminate (www.tryruminate.com). Gostaria de ouvir opiniões
- Estou sinceramente curioso sobre o que isso tem de diferente de um RAG tradicional
Vi no exemplo de fundamentos de ciência da computação a situação de um aluno do 7º ano que gosta de comida. Apareciam explicações como “listas podem ser usadas em receitas”, “sets são bons para uma lista única de ingredientes da semana”, “maps podem ser usados em um livro de receitas”, “filas de prioridade são adequadas para gerenciar pedidos em uma cozinha movimentada” e “um grafo de harmonização de alimentos mostra ingredientes que combinam”. Acho que superestimaram o gosto de um aluno do 7º ano. Eu me cansaria bem rápido disso
- Sem dúvida, ciência da computação no ensino médio era bem entediante quando passei por isso há 20 anos. Na época, o clima era de que “você precisava aprender Microsoft Office de qualquer jeito”. Depois de muito tempo trabalhando como voluntário em educação, vi muitas crianças fazendo perguntas práticas como “onde eu realmente vou usar trigonometria?”. Os exemplos de aula e prova pareciam desconectados da vida real, então pareciam sem sentido. Mostrar como os conceitos realmente são usados no mundo real tem claramente valor pedagógico. A vantagem dos LLMs é poder converter esses exemplos reais para os interesses pessoais de cada um. Por exemplo, gosto muito de explicações de algoritmo de busca em grafos como o A* na série do Red Blob Games, porque apresentam isso por meio de um caso atraente como jogos
- Já usei a ferramenta de estudo com geração de quiz incluída no Gemini. Para coisas típicas de livros K-12, ela é bem útil. Até as primeiras 30 ou 40 questões de múltipla escolha são bastante aproveitáveis, mas depois disso começam a se repetir perguntas, alternativas erradas e explicações, e também aparecem respostas incorretas ou múltiplas respostas corretas. As explicações também ficam no nível esperado e parecem ter pouco QA. Ainda assim, pode ser útil se o usuário revisar por conta própria. Mas, se a pessoa aceitar tudo sem verificar, isso pode até ser prejudicial
- Sinceramente, nem entendi o que significa o exemplo “listas podem ser usadas em receitas”. Acho que isso só vai confundir mais os alunos do 7º ano
- Isso me lembra o Hawthorne effect (efeito novidade, novelty effect). Não está claro se os alunos dizem que esse tipo de conteúdo é mais interessante porque é realmente melhor ou simplesmente porque é diferente. Wiki do Hawthorne effect
- Especialmente o exemplo de set vai confundir alunos do 7º ano ainda mais se eles nem souberem o conceito básico de set. Dizer que “você coloca uma lista única de ingredientes em um set” é tecnicamente correto, mas na prática não ajuda muito para fazer compras, porque você precisa das quantidades. Também não ajuda a entender intuitivamente o que é um set e pode até atrapalhar quando for preciso explicar “a diferença entre lista e set”. Até a própria expressão “ingredientes únicos” pode não ser compreensível para crianças dessa idade
Sou ex-professor de física. A capacidade técnica é impressionante, mas acho que isso é uma inovação de pouca eficácia pedagógica. Ao ensinar as leis de movimento de Newton para adolescentes, a verdadeira dificuldade é o conceito de que o atrito nem sempre está presente. Os alunos chegam já tendo aprendido, pela observação do movimento dos objetos no mundo real, a 'teoria do ímpeto' (link da wiki). Uma IA que identificasse a concepção de cada aluno e fizesse perguntas para refutar a teoria do ímpeto seria realmente útil, mas o que o Google anunciou desta vez não passa de uma variação de aula expositiva em formato “slides + quiz”. O fato de a discussão em educação partir da premissa de que “todas as matérias podem ser ensinadas do mesmo jeito” foi um dos motivos que me fizeram sair da docência. Acho que já chegamos ao limite da abordagem neutra em relação à disciplina; daqui para frente, a chave para melhorar é focar na essência do que realmente ensinar e como ensinar
- “Um bom professor pode ensinar qualquer matéria.” Foi o coordenador de línguas que disse isso? Concordei muito com o que você falou, mas mesmo dentro dessa abordagem neutra entre disciplinas, práticas eficazes de aprendizagem que nem sequer são implementadas — como repetição espaçada e avaliação baseada em recuperação — ainda não chegaram aos 80% piores das aulas. Já sabemos muita coisa pela teoria da educação e da aprendizagem, mas isso ainda não foi incorporado ao sistema escolar
- Como aluno, me identifico muito. O motivo de eu ter dificuldade para aprender não é falta de personalização, mas simplesmente porque o volume é grande e difícil. O essencial é verificar se eu realmente entendi cada etapa do conteúdo — algo que eu chamaria de abordagem “em pequenos pedaços” — e explicar a linguagem matemática ou os termos técnicos em palavras mais simples. O Study mode do ChatGPT faz esse papel muito bem em certas matérias
- Cuidado ao falar de experiência em educação, porque o pessoal de Edutech fica bravo. Eles prometem uma revolução há 15 anos
- Na época você devia ter mandado o coordenador de línguas ensinar cálculo tensorial
- Fiquei curioso para saber por que o coordenador de línguas disse isso, se isso afetou também o departamento de ciências e se você realmente deixou de ensinar física por causa dessa fala
Quando vejo os serviços de IA atuais e as mudanças forçadas na política de preços do Copilot, tenho a sensação de que toda a indústria de IA está desesperadamente tentando fazer o público usar um brinquedo caro. Fico me perguntando por que ainda não apareceu o alerta típico do PG (Paul Graham) de “uma solução procurando um problema”
- Se o establishment já está envolvido nisso — grandes empresas, VCs etc. — então é natural que não queiram destacar as limitações ou fraquezas da tecnologia. O papel deles é difundir ativamente uma narrativa positiva sobre os produtos em que investiram, e essa postura “seletiva” é uma forma comum de falta de honestidade nas big techs
Acho que a IA ainda não é confiável o suficiente para ser usada ativamente no aprendizado. Pedi para ela organizar 100 citações de artigos, e ela apagou 10 e inventou outras 10 sem base nenhuma. Nessa situação, nem dá para imaginar substituir livros didáticos
- Concluir que “a IA não consegue resumir ou explicar um livro didático” só porque “ela foi mal ao lidar com citações” é um salto lógico. Muita gente não consegue organizar citações, mas sabe resumir e explicar um livro didático muito bem
- Já tive muitas experiências boas usando LLMs para me explicar conteúdo de livros didáticos. Quando colo uma parte que não entendi e faço perguntas, eles costumam responder bem
- Fiquei curioso para saber qual modelo você usou, qual foi o prompt e quando tentou isso
Eu gosto de aprender. Cheguei até a faculdade graças à Khan Academy e, ainda hoje, uso ChatGPT, Claude e outros ao estudar artigos. Mas o exemplo do Google me decepcionou rapidamente.
- O exemplo dizia: “Nascemos com traços genéticos e características biológicas, mas nossa identidade como seres humanos é cultivada por meio das interações na sociedade. Tanto a psicologia quanto a sociologia consideram importante o processo de self-development”
- Logo em seguida veio a pergunta: “Com base no texto dado, qual é a principal diferença entre psicologia e sociologia em relação ao self-development?”
  - A) A sociologia trata de características genéticas, e a psicologia de normas sociais
  - B) A psicologia trata da função social, e a sociologia da identidade individual
  - C) A psicologia se concentra em características genéticas, e a sociologia em interações sociais
  - D) Ambas estudam apenas características biológicas inatas
- Ao ler a questão, escolhi D porque pareceu a mais plausível, mas estava errada. Fiquei inseguro, pensando se eu tinha entendido tudo errado. Existe até um botão para ver o PDF completo, mas o objetivo desse serviço não seria justamente quebrar o texto em partes menores e reforçar os pontos principais? Quase não há função de feedback, então é extremamente frustrante. Se eu fosse aluno, isso me causaria uma sensação enorme de frustração
- A culpa não foi sua. Todas as alternativas estão erradas. A sociologia estuda sociedade, cultura, comportamento de grupo etc. Isso é alucinação de LLM
- O gabarito inteiro está errado. O sistema provavelmente queria “C) psicologia = genética, sociologia = interação”, mas não é verdade que a psicologia se concentra em genética
- O próprio texto também não define psicologia e sociologia, nem as coloca em contraste. A pergunta manda responder apenas com base no texto, mas você só conseguiria resolver recorrendo a conhecimento externo. Esse tipo de geração de questão acontece porque o LLM interpreta mal os dados de treino. O modelo não distingue entre modo reading comprehension e modo didactic, então isso não é um simples bug, mas uma limitação estrutural
- Pode parecer um bug pequeno, mas em educação a precisão é extremamente importante. Se esse tipo de erro básico é deixado de lado, fica difícil ultrapassar o limiar de confiança
Essa tecnologia parece ter um potencial considerável. Professores humanos não têm paciência infinita. No ensino médio, perguntei à minha professora de química “por que aquela reação acontecia”, e ela respondeu “apenas aceite e memorize, não tente entender”. Depois disso, não virei químico. Mas hoje a química me parece até interessante. Na época, aquela professora matou completamente minha curiosidade, e por isso, ao escolher uma graduação, eu evitava qualquer coisa ligada à química. Se eu tivesse tido uma ferramenta de IA como essa naquela época, minha vida poderia ter sido diferente. Por outro lado, a IA não chegaria aos pés das aulas cheias de personalidade do meu professor de história medieval, que trazia armaduras medievais e espadas de verdade para demonstrar esgrima. Dos 20 alunos da nossa turma, 2 viraram doutor em história e arqueólogo, então ele realmente era um professor incrível. Pessoas assim são raras
- Você disse que ficou frustrado com a resposta “apenas memorize”, mas talvez isso fosse um caso de 'lie-to-children' (explicação). Você queria uma compreensão profunda, mas antes de dominar conceitos avançados pode ser necessário algum nível de memorização básica
- Eu era do tipo que queria não só o resultado, mas também como se chegou até ele, quem descobriu aquilo e por quê, ou seja, uma explicação histórica mais profunda. Acho que a IA generativa tem potencial para oferecer o contexto e o pano de fundo histórico da informação em formato narrativo
Fico me perguntando como essa tecnologia vai atuar num contexto atual de queda de letramento, anti-intelectualismo e isolamento social. Por melhor que a tecnologia seja, talvez acabe sendo um retrocesso. Posso estar sendo pessimista, mas sinto que isso não vai na direção de auxiliar professores, e sim de substituí-los
- As previsões pessimistas sobre letramento — esse tipo de “obituário social” — quase sempre são prematuras. Pelo contrário, alguns leitores estão indo na direção de livros longos em inglês e conteúdos profundos, como uma forma de leitura intelectualmente resistente. Eu mesmo estou ampliando vocabulário e capacidade de expressão com 'Word Power Made Easy', de Norman Lewis, e 'The Well-Spoken Thesaurus', de Tom Heehler. Nesse processo, uso ChatGPT e Gemini como tutores pessoais. Quando dou instruções diretas, eles ajudam com sugestões de neologismos e clareza de frases. Tenho sentido, na prática, que a tecnologia fortalece minha expressão e minha comunicação. Eu, que antes só escrevia e-mails ou diário, passei a usar IA como colaboradora e apoio para reconstruir episódios da minha vida em contos curtos e até transformá-los no estilo de autores que admiro. Isso não é substituição de professores, mas sim a base de um renascimento da autoaprendizagem
- Se a preocupação é a queda de letramento, então o problema não é introduzir mais tecnologia ou não, mas sim os valores da sociedade como um todo. Uma sociedade que valoriza letramento não se deixa levar por demos ou propaganda em blog. Já uma sociedade que não valoriza compreensão, especialização e professores sempre vai procurar atalhos para substituir essas coisas
Não acho que essa abordagem seja a melhor possível, mas concordo muito com o diagnóstico do problema. Também lembro com sinceridade de professores do ensino fundamental e médio ignorando minhas perguntas com facilidade, sem muita explicação. Minha cabeça ficava presa a dúvidas incômodas e eu não conseguia me concentrar no principal, e os professores, no contexto da educação pública, talvez não tivessem tempo para acompanhar minhas perguntas ou talvez não estivessem preparados. O papel que eu gostaria que os LLMs tivessem é o de ferramenta auxiliar que guie com segurança o processo de exploração dos alunos para fora do currículo tradicional — distrações, curiosidades etc. — mas que no fim os conduza de volta ao objetivo de aprendizagem desejado.
- “Como e por que descobriram o spin do elétron?”
- “Por que aquela palavra em inglês é usada de forma diferente como exceção?”
- “Qual é a diferença de tamanho entre um dinossauro saurópode e uma baleia-azul?”
  Pela minha experiência, essas pequenas curiosidades levam a compreensões muito mais profundas.
  O TFA propõe: “E se o aluno pudesse desenhar a própria jornada de aprendizagem?”
  Na verdade, isso já é possível em áreas de não ficção e livros didáticos.
  Eu não conhecia o livro 'How to Read a Book'(wiki) até o ensino médio, e ele me abriu os olhos para a ideia de que “ler tudo em sequência não é necessariamente a única resposta”.
  Espero que, com IA, mais alunos aprendam que existem várias formas de estudar além do currículo fixo
- Outra história: na faculdade, cursei teoria de circuitos (1 e 2) antes de equações diferenciais (cálculo 4). Por causa disso, conteúdos como transformadas de Laplace e Fourier se conectavam imediatamente, em aula, a outra área (projeto de circuitos), e a matéria ficou muito mais interessante
Espero que no futuro a gente realmente chegue a uma tecnologia como 'A Young Lady's Illustrated Primer', de Diamond Age
- Será que o autor daquele romance já estava prevendo o futuro naquela época? É uma história sobre um mundo cheio de nanotecnologia e nanobôs
- Eu também pensava nesse futuro quando comprei um pinenote. Achei que seria divertido ter um dispositivo que ajudasse a estudar matemática, como o diário de Tom Riddle. Mas o desenvolvimento do lado Linux no pinenote anda devagar e eu também fiquei ocupado, então perdi o interesse