Prompts mais concisos geram resultados melhores ao usar GPT
- O GPT tende a se confundir quando o prompt explicita em excesso algo que ele já conhece como conhecimento comum
- Por exemplo, em uma tarefa de classificar o estado mencionado em um texto, pedir simplesmente o nome do estado produz resultados mais precisos do que fornecer uma lista com os 50 estados
Só a chat API da OpenAI já permite implementar recursos suficientemente diversos e poderosos
- Mesmo sem ferramentas adicionais como Langchain, é possível implementar de forma simples os recursos necessários, como extração de JSON, usando apenas a chat API
- Ao atualizar o modelo GPT, basta alterar uma única string no codebase
- Também é suficiente adicionar uma lógica simples para tratamento de erros da API da OpenAI e limites de tamanho de entrada
É difícil lidar com os casos em que o GPT não encontra nada
- Em prompts como "se não encontrar nada, retorne um valor vazio", o GPT frequentemente inventa algo ou demonstra falta de confiança
- A solução é não enviar um prompt ao GPT quando a entrada estiver vazia
O GPT só consegue gerar saídas com comprimento limitado
- O limite de entrada do GPT-4 é de 128k tokens, mas o limite de saída é de apenas 4k tokens
- Ao pedir uma lista de objetos JSON, o GPT tem dificuldade para gerar de forma estável mais de 10 itens
Bancos de dados vetoriais e RAG/embeddings não ajudam muito para usos gerais
- Fora da busca, o RAG não funciona bem
- Por razões como dificuldade para avaliar relevância, problemas de isolamento de dados e queda na satisfação do usuário, sua utilidade prática é limitada
- Para buscas gerais, é mais adequado usar busca facetada com GPT ou geração de consultas complexas
Na prática, o GPT quase não produz alucinações (hallucinations)
- Em tarefas de extração de informação a partir de um texto dado, o GPT fornece resultados bastante confiáveis
- No entanto, quando a informação não está no texto, ele pode inventar algo
- Por isso, é importante fornecer contexto suficiente e tratar corretamente as respostas do GPT
Opinião do GN⁺
- Parece difícil chegar à AGI apenas com modelos transformer, dados da web e infraestrutura em larga escala
- O GPT-4 é claramente útil, mas para avanços além disso, talvez seja necessária uma inovação na própria arquitetura do modelo
- As alternativas fora da OpenAI ainda parecem não alcançar o GPT, e no fim será preciso continuar atento às novas versões do GPT
- Espera-se que o desempenho do GPT-5 não seja revolucionário em relação ao GPT-4. A relação custo-benefício parece estar chegando ao limite
- Portanto, por enquanto, a escolha mais realista parece ser focar no uso do GPT-4 para projetar prompts ideais e aplicações práticas
1 comentários
Opiniões no Hacker News
sufficient information, ele pode formular uma hipótese, mas deve declarar isso claramente e apresentar evidências e base lógica — e depois pede para ele avaliar a própria resposta.null: