Como fornecer um conjunto de documentos personalizado a um LLM
- Discussão sobre a melhor forma de fornecer a um LLM (Large Language Models) um conjunto de documentos do usuário para obter respostas adequadas sem resultados irreais.
- Foco em como "ensinar" ao LLM um conjunto específico de documentos. Isso não significa necessariamente treinar um modelo próprio, e também inclui abordagens como RAG (Retrieval-Augmented Generation).
- Há um tópico de 5 meses atrás, mas são necessárias informações adequadas à situação atual em dezembro de 2023.
Opinião do GN⁺
- Extrair informações precisas de um conjunto específico de documentos usando LLMs está se tornando mais importante com o avanço da tecnologia.
- Essas técnicas ajudam a obter resultados personalizados conforme o que o usuário deseja, e podem ser aplicadas em várias áreas, como inteligência de negócios, pesquisa e educação.
- É importante aproveitar abordagens existentes, como RAG, ou buscar novos métodos, o que contribuirá para ampliar o uso de LLMs e obter resultados mais precisos e confiáveis.
1 comentários
Comentários do Hacker News
O treinamento com documentos, na prática, não acontece; embora muitas startups usem esse termo, na verdade elas usam RAG (Retrieval-Augmented Generation).
Dependendo da quantidade de documentos, vale considerar abordagens diferentes.
O AWS Bedrock é fácil de usar: é possível enviar documentos para o S3, sincronizá-los com um banco de dados vetorial e usá-los via API.
O h2oGPT é uma implementação de RAG completa, capaz de processar documentos em vários formatos e de oferecer suporte a diferentes implementações de hospedagem de modelos.
É possível comprar uma conta do ChatGPT e enviar seus próprios documentos, criando assim uma IA conversacional personalizada.
O GPT-4 Assistants atualmente já consegue lidar com RAG por padrão, e o PrivateGPT é uma das opções mais conhecidas para isso.
O Copilot Builder do Microsoft Office permite que o usuário crie um AI Copilot em segundos, especificando URL base, arquivos enviados e outros recursos.
O Cheshire Cat é um framework de assistente de IA que armazena documentos como "memórias" para recuperação posterior.
Há um guia em vídeo sobre como ajustar finamente o Mistral 7B com QLoRA, mencionando que técnicas de RAG podem ser mais desejáveis.