- O ChatGPT baseado em GPT-5 (também chamado de Research Goblin) demonstra um nível muito alto de precisão e utilidade em buscas na web
- De perguntas triviais comuns a pesquisas complexas de informação, ele mostra forte capacidade de exploração e raciocínio em uma ampla variedade de temas
- Em exemplos reais, fornece respostas e materiais confiáveis por meio de processos extensos de busca e raciocínio em cadeia
- Mesmo em ambiente móvel, é possível ter excelente usabilidade e um fluxo de trabalho contínuo
- Graças à integração de tool calling e chain-of-thought, apresenta um novo padrão para buscas baseadas em LLM na perspectiva de desenvolvedores
GPT-5, Research Goblin e a inovação em busca
O paradigma de busca em transformação
- Antes, o conselho dominante era “não use chatbots como se fossem mecanismos de busca”, mas com o ChatGPT baseado em GPT-5 essa regra parece estar sendo quebrada
- Modelos baseados em GPT-5 vão além da simples integração com mecanismos como o Bing e chegam a um nível que substitui ou supera, na prática, a pesquisa na internet
- O apelido “Research Goblin” surgiu porque, diante de qualquer dúvida ou tarefa complexa, ele investiga com insistência quase anormal até chegar à melhor resposta possível
Casos reais de busca e resultados
Esteiras rolantes curiosas (Travelators)
- Ao ser perguntado sobre quando a esteira de borracha do aeroporto de Heathrow foi substituída por metal, estimou que isso ocorreu entre 2014 e 2018 e ainda encontrou uma reportagem interessante de 2024 relacionada ao tema
Identificação de edifício
- Quando perguntado sobre um prédio exótico visto pela janela do trem, identificou corretamente em 1 minuto e 4 segundos que era o The Blade (Reading) e forneceu links de fonte
Investigação sobre cake pops da Starbucks UK
- Investigou em profundidade por que não há cake pops em lojas da Starbucks no Reino Unido e encontrou que eles foram introduzidos em 2023, mas não são vendidos em certas lojas — especialmente em lojas de viagem
- Também reuniu materiais comprobatórios, incluindo PDF de nutrição e alergênicos, além de discussões no Reddit
Relação entre Wikipedia e Britannica
- Analisou em profundidade a veracidade e o contexto da alegação online de que a Wikipedia usou parte de fontes da Britannica de 1911 como dados iniciais, rastreando e fornecendo até documentos e explicações do projeto relacionado
Nome oficial da University of Cambridge
- Apresentou, com materiais de apoio, o nome legal oficial da Universidade de Cambridge: The Chancellor, Masters, and Scholars of the University of Cambridge
- Também mostrou o processo de raciocínio de forma transparente, permitindo verificar a confiabilidade da resposta correta
Histórico das cavernas e do restaurante no Exeter Quay
- Ao investigar a estrutura interna de um restaurante escavado no penhasco na região de Exeter Quay e sua história, esclareceu por meio de várias etapas de busca e análise de PDFs que ele foi criado em penhascos de arenito vermelho nas décadas de 1820 e 1830
- Mostrou um padrão ativo de exploração, buscando relatórios/desenhos em inglês e, quando não conseguia acessá-los, redigindo até um rascunho de e-mail para solicitação
Comparação entre Aldi e Lidl
- Fez uma análise extensa de presença no Reino Unido, imagem e ranking de mercado de Aldi e Lidl, incluindo números de participação de mercado e avaliação dos consumidores
- A pedido do usuário, reorganizou o ranking também com base no critério de “fanciness” (sofisticação/percepção premium)
Escaneamento de livros por laboratórios de IA
- Além do caso da Anthropic escanear grandes quantidades de livros para criar dados de treinamento, não foi possível confirmar se outros laboratórios de IA fazem algo semelhante, mas o sistema registrou detalhadamente a exploração dessa possibilidade
A superioridade prática das buscas com GPT-5
- Na busca do ChatGPT baseado em GPT-5, é possível obter coleta e avaliação de informações mais rápidas, sistemáticas e amplas do que no trabalho manual
- Especialmente em ambiente móvel, a usabilidade melhorou muito, tornando possível satisfazer curiosidades e realizar tarefas cotidianas de pesquisa a qualquer hora e lugar
- Tem capacidade de entregar resultados rápidos e ricos o bastante para substituir o recurso Deep Research da OpenAI
O significado disso do ponto de vista do desenvolvimento de LLMs
- Graças à combinação de tool calling e chain-of-thought, a busca, o raciocínio encadeado e a exploração adicional fluem naturalmente em uma única etapa de “pensamento”\n- A tecnologia RAG (busca + geração) também pode ser operada de forma muito mais poderosa por meio de chamadas flexíveis de ferramentas em múltiplas etapas e integração avançada com busca
- No termo usado pela Anthropic, isso é interleaved thinking; a OpenAI Responses API também oferece suporte a um fluxo semelhante
Dicas para usar buscas de forma eficaz
- É possível melhorar a qualidade da busca por meio de intuição empírica (usar dicas como “go deep”, por exemplo, induz uma investigação ainda mais minuciosa)
- Mesmo em perguntas interpretativas sem uma resposta claramente definida, ele produz resultados úteis e interessantes
- Como sugere a metáfora do “goblin”, o Research Goblin é uma IA de busca diferente dos humanos: trabalhadora, mas não totalmente confiável, o que ainda lhe dá alto valor de uso
Ainda não há comentários.