"Você é mais inteligente do que um modelo de linguagem?"
Muitos benchmarks tentam avaliar quão bem os modelos de linguagem executam tarefas humanas.
Mas quão bem você conseguiria se sair na tarefa típica de um modelo de linguagem de prever a próxima palavra?
Resolva 15 questões
3 comentários
4 pontos... o resultado dá uma raiva, né
Nossa. Como eu resolvi isso como se fosse uma prova de inglês, minha pontuação ficou muito baixa 😭
Opiniões do Hacker News
Não é o que eu esperava pelo título "smart", mas é uma ideia interessante
Fizeram um jogo/quiz de adivinhar a próxima palavra com comentários do Hacker News
logit_biaspara escolher apenas uma das respostas permitidasA estratégia vencedora é escolher a palavra que o modelo de linguagem teria menor probabilidade de selecionar
Pelos resultados, prever exatamente a próxima palavra com as informações dadas é impossível
Este jogo é um bom teste para ver se você lê comentários do HN demais
Como o quiz é aleatório a cada vez, não dá para comparar resultados
Graças ao tempo que passei no HN, consegui fazer previsões um pouco melhores que as da IA
Para quem vai tentar o quiz de 100 perguntas: pelos critérios estatísticos tradicionais, acertar mais de um terço já conta como melhor que chute
Se as amostras vieram do HN, existe a possibilidade de o texto já fazer parte do dataset
Alguns trechos foram extraídos de um contexto maior, o que coloca o LLM em vantagem para fazer previsões