- Artigo sobre como extrair recomendações de livros de threads do Hacker News (HN) usando a API do ChatGPT
- O autor analisou quase 200 histórias do HN que continham a palavra "book" no título e não tinham link para outras páginas
- O autor usou a API do GPT para classificar os dados e gerar a saída das informações em formato JSON
- Os dados foram obtidos pela API do Hacker News, e o autor chamou a API de Chat Completions para extrair do texto o título do livro, autor e URL
- Foram listadas as 50 principais recomendações de livros, sendo "Structure and Interpretation of Computer Programs", de Abelson e Sussman, a mais recomendada
- Em alguns casos, a API não retornava JSON válido, especialmente quando o ChatGPT respondia a comentários como "thanks" ou fazia perguntas
- O autor projetou o prompt para descartar respostas sem título, porque o ChatGPT às vezes incluía menções ao autor sem o título do livro específico
- O processamento de 57 mil comentários custou cerca de US$ 40 usando a API GPT-3.5 Turbo
- O autor descobriu que, mesmo com temperatura 0, os resultados do GPT variavam entre chamadas e mostravam maior variabilidade do que os modelos GPT-3 anteriores
- O autor constatou que o GPT conseguia identificar links no texto, mas que era necessário remover as tags HTML para evitar que ele escolhesse texto de link truncado em vez da URL
- O autor compartilhou exemplos da saída em JSON gerada pelo ChatGPT e dos prompts usados na tarefa
- Os dados brutos gerados pelo GPT foram compartilhados, ordenados por título, para análise adicional
- Como exercício de aprendizado, o autor adicionou links de afiliado da Amazon às URLs da Amazon na tabela
1 comentários
Opiniões do Hacker News
Code, de Charles Petzold, e livros de Knuth, terem ficado de fora da lista dos 50 principaisHow to Win Friends and Influence PeopleeAtlas ShruggedMeditations, de Marcus Aurelius, pode ter sido confundido comMeditations on First Philosophy, de Descartes, o que pode ter causado erros na lista