Uso de AI e queda na habilidade matemática fazem disparar notas de reprovação em aulas de CS de Berkeley

(dailycal.org)

1 pontos por GN⁺ 2026-06-05 | 1 comentários | Compartilhar no WhatsApp

A taxa de reprovação nas aulas de CS de Berkeley subiu muito na primavera de 2026: 35,3% em CS 10 e 10,6% em CS 61A, bem acima de semestres anteriores, saindo da diretriz da EECS de 7% para proporção de D e F em disciplinas introdutórias e de GPA médio entre 2,8 e 3,3
Dan Garcia apontou o aumento acentuado de fraude acadêmica com uso de LLMs como Claude, ChatGPT e Google Gemini como o “primary driver” das taxas anormais de reprovação, e quase 30 alunos foram flagrados colando em um take-home exam de CS 10
As duas disciplinas foram avaliadas com base em critérios de nota publicados, sem curva, então a nota dos alunos não dependia do desempenho dos colegas; Garcia considera que a curva esconde o problema
A EECS 127 de Gireeja Ranade também registrou taxa de F de 16,8%, em meio a falta de preparo matemático e escassez de pessoal; o projeto final tradicional foi removido por falta de TAs, e a participação em office hours também caiu
As disciplinas de CS e EECS de Berkeley na era da AI estão sendo repensadas para ensinar mais, e não menos, ajudando os alunos a suportar problemas difíceis e a confusão enquanto desenvolvem pensamento crítico e analítico

Disparada das reprovações e desvio das diretrizes de notas

Segundo o Berkeleytime, 35,3% dos alunos de CS 10 e 10,6% dos alunos de CS 61A receberam F na primavera de 2026
Na primavera de 2025 e na primavera de 2024, nenhuma das duas disciplinas passou de 10% de F
As diretrizes de notas do departamento de EECS indicam 7% como proporção de alunos com D e F em disciplinas introdutórias como CS 10 e CS 61A
Pelas diretrizes, a faixa típica de GPA em disciplinas introdutórias é de 2,8 a 3,3, mas a média das duas disciplinas na primavera de 2026 foi C+, equivalente a GPA 2,3

Dependência de LLMs e problema de fraude

Dan Garcia lecionou tanto CS 10 “The Beauty and Joy of Computing” quanto CS 61A “The Structure and Interpretation of Computer Programs” na primavera de 2026
Garcia considera o aumento da fraude acadêmica causado pelo uso de grandes modelos de linguagem como Claude, ChatGPT e Google Gemini o “primary driver” das taxas anormalmente altas de reprovação
Parte das notas de reprovação veio de alunos pegos colando e encaminhados para processo disciplinar; em outros casos, os alunos teriam dependido demais de LLMs e chegado despreparados às provas
Na primavera de 2026, quase 30 alunos de CS 10 foram flagrados colando em um take-home exam

Sistema de avaliação sem curva

As duas disciplinas de Garcia foram avaliadas não por curva, mas por critérios de pontuação para cada letter grade
Nesse sistema, a nota do aluno não depende do desempenho dos colegas
Garcia prefere divulgar os critérios de cada letter grade e dar aos alunos muitas oportunidades de atingir esses critérios
Garcia se opõe fortemente a sistemas como o de Harvard, em que só parte dos alunos pode receber A, e considera que a curva esconde os problemas reais

Preparo matemático e dificuldades em EECS 127

Garcia vê, além do excesso de dependência de AI, que muitos alunos não estavam matematicamente preparados, preocupação compartilhada por Gireeja Ranade
A EECS 127 de Ranade, “Optimization Models in Engineering”, teve taxa de F de 16,8% na primavera de 2026, muito acima dos 5% que o departamento de EECS apresenta como taxa “típica” de D e F em disciplinas avançadas
Esperava-se que os alunos de EECS 127 já tivessem cursado álgebra linear, cálculo vetorial e demonstrações matemáticas, mas Ranade constatou em office hours que muitos tinham dificuldade com álgebra linear
Um aluno disse a Ranade que a disciplina de álgebra linear que cursou na UC Berkeley tinha uma política de “open-internet, open-AI policy” para tarefas e provas
Garcia e Ranade estão entre mais de 1.300 docentes da UC que assinaram uma petição pedindo a reintrodução das notas de testes padronizados ACT e SAT na admissão a cursos STEM do sistema UC

Escassez de pessoal e queda no engajamento dos alunos

A EECS 127 costumava ter um projeto final orientado por professor e equipe de TAs, e Ranade considera que a maioria dos alunos obtinha notas altas nessa parte
Em 2026, Ranade retirou esse projeto final da disciplina por falta de pessoal
Segundo uma postagem no X do chefe do departamento de EECS, Jelani Nelson, o campus teve de reduzir tanto as matrículas de graduação em CS quanto o número de TAs de graduação em razão do alto valor da hora paga aos TAs de EECS
Os office hours de Ranade antes ficavam lotados, mas neste semestre a participação foi muito baixa, mesmo com incentivos frequentes aos alunos para comparecer
Garcia também enfrentou baixa presença nos office hours nos últimos dois semestres e, pela primeira vez, passou por office hours em que ninguém apareceu

Redesenho das disciplinas e postura de aprendizagem

Garcia planeja, daqui para frente, contar no primeiro dia de aula o que aconteceu na primavera de 2026 e buscar formas de identificar alunos que precisem de apoio complementar adicional
Ranade considera que, na era da AI, os professores precisam ensinar aos alunos “mais, não menos”
Ranade quer que os alunos desenvolvam o pensamento crítico e o pensamento analítico necessários para se tornarem líderes em um mundo competitivo
Ambos os professores acreditam que os alunos precisam se sentir mais confortáveis com problemas difíceis
Garcia citou a frase de um colega, “Confusion is the sweat of learning”, e acredita que muitos alunos não estão suando o suficiente esse “suor”

1 comentários

GN⁺ 2026-06-05

Comentários do Hacker News

Se LLMs existissem quando eu era estudante, acho que eu as teria usado para “terminar a lição de casa rapidamente” e teria ido mal em todas as provas, então tenho certa empatia pelos alunos de hoje
Hoje trabalho principalmente com doutores, mas até pessoas que sempre estiveram no topo parecem estar perdendo rapidamente a capacidade de pensar. Muita gente já não consegue fazer brainstorming, programar, pensar profundamente ou escrever sem que o LLM faça 90% do trabalho, e até ficar 30 minutos em silêncio pensando sozinho, algo necessário para ter ideias originais, está ficando difícil
Adultos não fazem provas, e como os LLMs ajudam a manter a produção, talvez esse declínio cognitivo não seja fácil de medir, mas acho que ele já está acontecendo por toda parte ao nosso redor. Eu queria negar isso, mas agora está claro demais para ignorar
- Não sinto que minha capacidade tenha piorado de forma especial depois de usar LLMs. Terminei a graduação há 20 anos, e minhas habilidades matemáticas, que já foram afiadas, caíram bastante em 5 a 10 anos após me formar
  Passei a depender de calculadora e planilhas até para aritmética simples e porcentagens que antes fazia rápido de cabeça, e deixei meus conhecimentos gerais na RAM da internet no bolso. A sensação de “ah, eu sabia isso antigamente, vou ter que procurar” já é familiar. Talvez eu já tivesse atingido o fundo da minha própria burrice antes mesmo dos LLMs
  Ainda assim, hoje o estado da comunicação parece uma carga mental enorme. Tenho que lidar ao mesmo tempo com inúmeros diálogos e threads em e-mail, correio de voz, chat, online, SMS, pessoal, trabalho, casa, filhos, família, amigos, Messages, Messenger, WhatsApp etc. E ainda assim sou muito menos conectado do que as pessoas ao meu redor. Não tenho capacidade para acompanhar, então larguei a maior parte das notícias e todos os esportes
  Meu cérebro se formou antes da internet, e parece que o processo de converter do analógico para o digital chegou ao limite. Pelo menos parece uma conversão com perda muito grande
- Não acho que minha capacidade cognitiva real tenha caído por causa do uso de IA, mas com certeza sinto que minha paciência e tempo de concentração diminuíram muito
  Estou aprendendo uma nova base de código em um emprego novo, e a IA é realmente uma faca de dois gumes. Por um lado, é extremamente útil quando faço perguntas sobre a base de código; por outro, se eu não tomar cuidado e deixar que ela aplique correções antes mesmo de eu investigar, nunca vou aprender a base de código de verdade. Para manter a compreensão, é preciso realmente escrever código novo com as próprias mãos e usar os músculos mentais necessários
  Ao mesmo tempo, essa base de código grande também mostra os limites da IA. Se você empurrar funcionalidades no feeling, sem entendimento, vai inevitavelmente criar muitos problemas. Até correções de bugs direcionadas têm muitas consequências não intencionais que o LLM não vê. Não é uma base de código ruim, mas é grande o bastante para desafiar até modelos de ponta. Por isso, não acho que faça sentido, no momento, a ideia de que “o problema da IA pode ser resolvido com mais IA, então não é preciso entender a base de código”
- Na faculdade, consegui passar em francês usando Google Translate sem realmente aprender francês. Felizmente a qualidade era ruim o bastante para eu ter que revisar a saída com cuidado, mas mesmo assim consegui passar dois semestres sem desenvolver nem as habilidades básicas do idioma
  É preciso alguma medida mais radical. No ensino médio ainda havia muitas restrições de “proibido calculadora” nas aulas de matemática, e eu odiava isso porque sentia que cálculos aritméticos longos atrapalhavam o aprendizado. Então entendo que os alunos possam resistir a um modelo de ensino só com papel, mas também não sei muito bem o que dá para aprender quando existe uma máquina de fazer lição de casa de alta qualidade bem ao lado deles
- Acho que, se houvesse LLMs, eu também estaria ferrado. Professores e universidades talvez precisem mudar a forma de ensinar e avaliar
  Os alunos deveriam poder usar as ferramentas de IA que quiserem, mas recebendo orientação sobre como usá-las profissionalmente, enquanto as habilidades e os conhecimentos que realmente precisam dominar deveriam ser avaliados com frequência desde cedo, offline e presencialmente. E, em vez de dar F por cola, acho que o certo seria suspender o aluno
  Alguns anos atrás li sobre um professor do ensino médio que colocava as aulas no YouTube para os alunos assistirem por conta própria, e usava o tempo em sala para interação, perguntas e provas
  Edit: Claude foi mais rápido que a busca. Era um caso de dois professores de química do ensino médio em 2007, e era a sala de aula invertida https://fltmag.com/the-flipped-classroom/
- Não tenho doutorado nem sou muito inteligente, mas desde cerca de um ano atrás passei a me forçar deliberadamente a fazer pequenas tarefas de programação e matemática à mão
  Não diria que parece “declínio cognitivo”, mas dá para ver que fiquei muito mais preguiçoso. Coisas que eram rotina quando comecei a programar hoje parecem pesadas
Ao contrário do que o título da matéria sugere, a causa real provavelmente está escondida em um parágrafo do texto. É a parte que diz: “Garcia e Ranade assinaram, junto com mais de 1.300 docentes da UC, uma petição pedindo a restauração das notas de testes padronizados ACT e SAT nas admissões STEM do sistema UC. A petição e a carta aberta detalham preocupações semelhantes sobre a preparação matemática dos alunos”
Antes e depois da COVID, muitas universidades de elite experimentaram eliminar a exigência de provas de admissão em nome da equidade, mas isso fracassou em quase todo lugar, e uma parte considerável delas já está voltando atrás. Yale chegou a dizer que, em “estudos antes e depois da pandemia, entre todos os elementos da candidatura, as notas em provas foram o indicador individual mais forte para prever o desempenho futuro em Yale, e isso continuou valendo mesmo após controlar renda familiar e variáveis demográficas, tanto no ACT/SAT quanto em provas baseadas em disciplina, como AP e IB” https://archive.is/8zxfo
Esse link é um arquivo porque a página original foi removida. Yale chegou a testar uma estratégia ‘test flexible’, em que o envio das notas era opcional, mas logo abandonou isso e voltou a exigir notas de prova
- O reitor de Berkeley pediu aos alunos que votassem na California Proposition 16 de 2020, que tentava reverter a Proposition 209 de 1996, a qual proibia admissão baseada em raça nas universidades públicas. A Prop 16 fracassou, e depois disso a Cal passou a ignorar as notas do SAT/ACT
  Só dá para ver isso como uma alternativa para admitir menos estudantes asiáticos, que tinham a maior média no SAT/ACT. Pouco tempo depois, recebi um e-mail do mesmo reitor elogiando a mudança porque a diversidade racial havia aumentado, e os números antes e depois mostravam queda na proporção de asiáticos e aumento de todos os demais grupos
- Se a eliminação dos testes padronizados em 2021 for mesmo a causa real, é preciso explicar por que esse salto na taxa de reprovação só está acontecendo agora
- Não sou americano, então talvez esteja perdendo o contexto, mas queria entender como funcionava a admissão sem notas de prova
- A exigência do SAT foi removida em 2021. O simples fato de não terem feito o SAT não explica por que a proporção de Fs passou de 10% em 2025 para 35% em 2026
Como professor de CS, literalmente ontem discuti projetos da disciplina de computação paralela, e um dos três grupos claramente seguiu a abordagem ChatGPT. Eles nem sequer entendiam as escolhas que o LLM fez sobre a arquitetura etc.
A forma de pegar esses alunos é parecida com a de antes, quando copiavam de outros estudantes. É um caso de “dar corda para se enforcar”: ao pedir explicações, eles acabam seguindo sem querer para um beco sem saída
Quando há suspeita, acho bom apelar para a honestidade com algo como “vamos falar francamente: quanto deste código é seu e quanto é do ChatGPT?”, e também oferecer alguma empatia, por exemplo reconhecendo que pode ter havido vários prazos na mesma semana. Ainda assim, não se deve perder a chance de passar a lição de que isso precisa ser feito da forma correta
Os outros dois grupos também usaram LLMs, mas como apoio de alto nível para design e arquitetura. Mesmo que não tenham escrito 100% do código à mão, claramente estavam no controle e conseguiam explicar o raciocínio e a estratégia que usaram para resolver o problema
Ainda preciso revisar muitos projetos com colegas, então pedi que contassem quantos casos assim havia; até agora, é 1 em 3, ou 33%
- No fim, todos os grupos não terceirizaram o pensamento para o LLM? Fico em dúvida se aprenderam algo que dê para aplicar a outros tipos de projeto no futuro
- Se “os outros dois grupos também usaram LLM de forma arquitetural e em alto nível”, então a nota parece estar mais perto de 3/3, 100%
  Você também aceitaria montar um projeto copiando e colando código de biblioteca? Se não, por que usar código gerado por LLM seria diferente?
- Do ponto de vista do professor, o que acha do método socrático com LLM? É melhor do que simplesmente usar um prompt do tipo “me dê a resposta certa”?
- Fiz computação paralela há 6 anos e ainda não entendo nada. Se eu tivesse usado um LLM como tutor particular, provavelmente teria entendido
- Fico curioso sobre como foram apresentadas aos alunos as políticas e diretrizes de uso de LLM
O ser humano é uma criatura estranha: entra sonâmbulo em toda crise, não consegue chegar a acordo sobre nada e, quando finalmente chega lá, também não consegue concordar sobre a causa
Quando chegarmos ao ponto em que já não conseguirmos mais fazer “engenharia” ou “ciência” de verdade, vamos passar os próximos 10 anos discutindo se o problema era mesmo a IA, se era inevitável mesmo sendo IA, e se a culpa é de ninguém ou de todo mundo. É sempre a mesma história. E, mesmo vendo esse futuro sombrio daqui de hoje, seguimos dando mais um passo adiante
Será que a suposição é que a sociedade se autorregula? Até certo ponto, eu acho que sim, mas o custo da autorregulação é realmente alto e doloroso. Será que aceitamos esse custo só porque existe a chance de não sermos os primeiros a sofrer?
- Vêm alertando sobre a chegada da IA há décadas. Para o bem ou para o mal, isso está profundamente entranhado na cultura popular, em livros e filmes de ficção científica. Mas descobrir o que fazer na prática é uma questão totalmente diferente
  Isso é evolução cultural, e o mercado também funciona assim. Você esperava planejamento central?
- O debate sobre mudança climática também seguiu esse mesmo padrão
- Nem todo mundo entra sonâmbulo nisso. Muita gente está gritando dos telhados, mas as massas são facilmente manipuladas
Os dados de notas vieram de https://berkeleytime.com/grades
Como fiquei preocupado se não teriam escolhido só disciplinas que sustentavam a narrativa desejada, peguei todas as disciplinas de CS ainda em oferta, tracei a proporção de F com uma linha vermelha e o número de notas atribuídas no semestre mais recente daquela disciplina com barras azul-claro, e ordenei tudo em ordem decrescente
A preocupação parecia válida. Olhando alguns dos gráficos do início, não há grandes aumentos na proporção de F nos últimos semestres
https://x.com/rahimnathwani/status/2062431813143019525?s=61
- O artigo diz que analisou CS 10 e 61A, que, se bem me lembro, são disciplinas introdutórias em Berkeley. Gostaria de entender por que isso seria cherry-picking e por que não seria um ponto de partida razoável para a análise, especialmente se, como a disciplina do professor citado, elas não usam avaliação por curva
- Por outro lado, pode ser que muitos professores estejam simplesmente ajustando a curva de notas para evitar reprovar alunos demais
  Há incentivos para que professores não deem muitas notas baixas. Notas baixas costumam piorar as avaliações da disciplina, o que pode afetar aumentos salariais e promoções, e muitas notas baixas também atraem atenção extra da administração, algo que nenhum professor quer
Em janeiro, minha filha estava com dificuldade nas aulas de matemática, então usei o Claude para criar uma ferramenta de geração de listas de exercícios bem direcionada. Ela gerava problemas para treinar repetidamente os conceitos com os quais minha filha tinha dificuldade
Funcionou, e teria sido muito mais difícil fazer isso de forma tradicional
A ferramenta gerava PDFs com gabarito e conjunto de soluções, e também resolvia os problemas por vários métodos, o que facilitava conferir o trabalho da minha filha e iterar rapidamente
É uma ferramenta poderosa. No fim, tudo volta a como você usa a ferramenta. Você a usa para melhorar, ou para pegar um atalho?
- Se a questão central é “usar para melhorar ou pegar um atalho”, então precisamos olhar quais incentivos, no nível da sociedade, fazem com que qualidade seja priorizada em vez de eficiência
  Se todo mundo fizesse isso do “jeito certo”, não haveria problema, mas os incentivos sociais são complexos e contraditórios, então para muita gente o atalho imediato parece mais atraente
  Isso é tanto uma questão tecnológica quanto um problema social
Parece uma notícia separada, mas “mais de 600 docentes da University of California, liderados por matemáticos da UC Berkeley, estão pedindo a restauração da exigência de testes padronizados para candidatos de STEM. O motivo é que seis anos de admissões sem provas não conseguiram avaliar a preparação de forma confiável, e ficou mais frequente que professores tenham de ensinar matemática de ensino fundamental II aos calouros”
https://archive.ph/18spS
- É difícil encontrar a carta em si, mas ela está aqui: https://ucstudentsuccess.org
- Afinal, quem toma a decisão de eliminar critérios padronizados para avaliar alunos?
  E que benefícios possíveis existem nisso?
Estou realmente muito preocupado com os LLMs
Tenho um filho de 15 anos e gerencio o uso do celular dele com o Google Family Link. No geral, sou bem aberto e basicamente só recebo alertas de instalação, mas o Gemini está fortemente proibido
Já conversamos bastante sobre os riscos
Meu filho diz que os amigos usam LLMs com frequência, e suspeita que essa seja a razão das notas nas provas. Enquanto alguns amigos ficam na faixa de 20% a 40% nas provas, meu filho estuda questões de provas anteriores e responde perguntas na revisão, tirando mais de 80%
Como é óbvio que os provedores de IA não vão se importar se alunos usam LLMs para resolver tarefas de casa, fico preocupado com o futuro
- É para isso que existem os testes padronizados. Eles permitem demonstrar capacidade ao suportar esforço e treino fora do horário de aula, além do tédio exigido em ambientes acadêmicos e de trabalho
  Em vez de ver a IA só como risco, você deveria pensar em como seu filho pode usá-la para acelerar e reforçar o aprendizado. O verdadeiro perigo, na verdade, é o ambiente político que quer acabar com os testes padronizados para esconder os dados de grupos que tradicionalmente fracassavam
- Fiquei curioso para saber o que seu filho fez para você instalar o Google Family Link, ou se você simplesmente instalou por padrão
- Dizer que o Gemini está fortemente proibido soa como se, se a internet tivesse surgido pela primeira vez há 5 anos, você também teria proibido a internet para o seu filho
“As diretrizes dizem que o GPA médio típico das disciplinas de divisão inferior deve ficar na faixa de 2,8 a 3,3. Segundo o Berkeleytime, na primavera de 2026 a nota média nas duas disciplinas foi C+, o que corresponde a GPA 2,3”
Como ex-aluno da Cal, fico muito feliz em ver alguém traçando um limite contra a inflação de notas. Eu trabalhei muito duro para conseguir o GPA que recebi, e odiaria ver esse esforço desvalorizado se a Cal passasse a distribuir A e A- como Yale faz, em 79% dos casos: https://yaledailynews.com/articles/professors-face-grading-dilemma-too-many-a-s-little-taste-for-limits
- Eu estava lendo o subreddit da UC onde estudei e, quando saíram os resultados de admissão deste ano, apareceram muitas perguntas de aprovados. Em algo entre 1/3 e 1/2 delas, perguntavam o quão severa era a deflação de notas e como isso se comparava a outros campi
- Isso não vai durar muito. Para conseguir emprego depois de se formar, é preciso ter boas notas, então, se começarem a distribuir notas baixas, no ano seguinte haverá menos candidatos
  Ainda assim, notas altas + formado há muito tempo continuam sendo um sinal
- Opinião impopular, mas transformar universidades públicas em uma espécie de Jogos Vorazes acadêmicos é o oposto completo do seu propósito. O objetivo de uma universidade pública é formar cidadãos instruídos
  Reduzir deliberadamente a qualidade das aulas e tentar pegar alunos em armadilhas nas provas não melhora o resultado educacional de ninguém. As pessoas que reclamam de inflação de notas esqueceram completamente por que a educação pública existe
Que pena. Recentemente comecei uma atividade divertida de revisar matemática, e, enquanto resolvia problemas, pedia ao modo Gemini Live para conferir, sugerir coisas e às vezes ir passo a passo
Foi bem divertido, como ter um professor extremamente paciente bem ao meu lado. Chegou perto de ser a melhor experiência de aprendizado de matemática que já tive, e também não preciso mandar suborno ou presentes para o Gemini para ele continuar gostando de mim
Por outro lado, se você deixa o LLM concluir todo o trabalho sem pensar por conta própria, isso soa como colar de si mesmo

Uso de AI e queda na habilidade matemática fazem disparar notas de reprovação em aulas de CS de Berkeley

Disparada das reprovações e desvio das diretrizes de notas

Dependência de LLMs e problema de fraude

Sistema de avaliação sem curva

Preparo matemático e dificuldades em EECS 127

Escassez de pessoal e queda no engajamento dos alunos

Redesenho das disciplinas e postura de aprendizagem

Leituras relacionadas

1 comentários

Comentários do Hacker News