- Um guia que compartilha estratégias e técnicas para obter melhores resultados com grandes modelos de linguagem (também chamados de modelos GPT)
- Os métodos explicados aqui às vezes podem ser combinados para gerar um efeito ainda maior, e é recomendável experimentar para encontrar a abordagem mais adequada
- É possível explorar prompts de exemplo para aprender o que o modelo é capaz de fazer
Seis estratégias para obter melhores resultados
Escreva instruções claras
- Como o modelo não consegue ler pensamentos, é preciso pedir com clareza o que você deseja.
- Inclua detalhes para obter respostas mais relevantes, peça ao modelo para interpretar uma persona específica ou use delimitadores para indicar claramente partes distintas da entrada.
- Especifique as etapas necessárias para concluir a tarefa, forneça exemplos e defina o tamanho desejado da saída.
Forneça texto de referência
- Modelos de linguagem podem inventar respostas falsas com confiança, especialmente ao lidar com temas obscuros ou quando se pede citações e URLs.
- Instrua o modelo a responder usando um texto de referência ou a responder citando trechos do texto de referência.
Divida tarefas complexas em subtarefas simples
- Assim como decompor sistemas complexos em componentes modulares é uma boa prática em engenharia de software, o mesmo vale para tarefas submetidas a modelos de linguagem.
- Tarefas complexas têm taxas de erro mais altas e muitas vezes podem ser redefinidas como um fluxo de trabalho de tarefas simples.
- Use classificação de intenção para identificar as instruções mais relevantes para a consulta do usuário e, em aplicações conversacionais que exigem diálogos muito longos, resuma ou filtre conversas anteriores.
- Resuma documentos longos em partes e construa recursivamente um resumo geral.
Dê ao modelo "tempo para pensar"
- Em vez de apressar uma resposta, pedir uma "cadeia de pensamento" antes de formular a resposta pode levar a respostas mais confiáveis.
- Instrua o modelo a elaborar primeiro sua própria solução e use um monólogo interno ou uma série de consultas para ocultar o processo de raciocínio do modelo.
- Pergunte ao modelo se ele deixou passar algo na etapa anterior.
Use ferramentas externas
- Forneça ao modelo a saída de outras ferramentas para compensar suas limitações.
- Implemente recuperação eficiente de conhecimento com busca baseada em embeddings, faça cálculos mais precisos com execução de código ou chame APIs externas.
- Permita que o modelo tenha acesso a funções específicas.
Teste mudanças de forma sistemática
- Melhorias de desempenho são mais fáceis quando podem ser medidas.
- É necessário definir uma suíte de testes abrangente (ou "eval") para verificar se uma mudança tem impacto positivo no desempenho geral.
- Avalie comparando a saída do modelo com respostas de referência.
Opinião do GN⁺
- Ponto mais importante: engenharia de prompts é um método central para otimizar o desempenho de modelos de linguagem, oferecendo instruções concretas para compreender com precisão a intenção do usuário e obter os resultados desejados.
- Por que é interessante: essas estratégias tornam o uso de modelos de linguagem de IA mais eficaz e permitem desempenho ainda melhor, especialmente em modelos mais recentes como o GPT-4.
- O que chama atenção: este guia apresenta exemplos e estratégias concretas que ajudam a resolver problemas comuns que engenheiros de software iniciantes podem enfrentar ao usar modelos de linguagem, mostrando como aproveitá-los de forma mais eficaz em tarefas reais.
2 comentários
Boas práticas de GPT da OpenAI: visão geral. 6 estratégias para escrever prompts e obter respostas melhores
Opinião do Hacker News
Discussão sobre o prompt de sistema do ChatGPT
Relato de uma experiência ao pedir um cheeseburger em espanhol
Discussão sobre as características dos LLMs (Large Language Models)
Hesitação em investir no aprendizado de escrita de prompts
Comparação entre engenharia de prompt e consultas avançadas de busca no Google
Comparação entre prompts para busca no Google e prompts para LLMs
Falhas de comunicação entre humanos e os limites dos LLMs
Crítica ao termo "engenharia de prompt"
O papel dos LLMs em ensinar comunicação clara aos humanos
Facilidade de implementação de chat apps baseados em LLM