Ask HN: Como treinar uma LLM/ChatGPT customizada com meus documentos em dezembro de 2023?

(news.ycombinator.com)

4 pontos por GN⁺ 2023-12-26 | 1 comentários | Compartilhar no WhatsApp

Há um tópico relacionado de 5 meses atrás, mas ele já pode conter informações desatualizadas, então a ideia é buscar novamente a abordagem correta em dezembro de 2023
O ponto central da pergunta é qual é a melhor forma de fornecer um conjunto de documentos personalizados a uma LLM para obter respostas com menos alucinações e qualidade razoável
Não se limita apenas ao treinamento de um modelo próprio, mas abrange de forma geral os métodos para fazê-la responder com base em documentos, incluindo abordagens como RAG

1 comentários

GN⁺ 2023-12-26

Comentários do Hacker News

O treinamento com documentos, na prática, não acontece; embora muitas startups usem esse termo, na verdade elas usam RAG (Retrieval-Augmented Generation).
- O LlamaIndex é considerado a melhor opção.
- A maioria das startups que afirma treinar com documentos, na prática, usa RAG.
- É recomendado procurar scripts que gerem automaticamente pares de perguntas e respostas usando qLoRA.
- Há poucos casos de uso bem-sucedidos para bases de conhecimento com documentos pessoais; isso é usado principalmente para habilidades como matemática, raciocínio e Python.
- Foi demonstrado empiricamente que simplesmente jogar um conjunto de documentos em um ajuste fino não funciona.
Dependendo da quantidade de documentos, vale considerar abordagens diferentes.
- RAG funciona bem com conjuntos de dados pequenos, e o LlamaIndex fez bastante engenharia nessa área.
- A combinação de ajuste fino com RAG é eficaz para grandes conjuntos de dados com conhecimento que pode ser facilmente encontrado na internet.
- O pré-treinamento contínuo é necessário no caso de conjuntos de dados muito grandes e conhecimento proprietário.
O AWS Bedrock é fácil de usar: é possível enviar documentos para o S3, sincronizá-los com um banco de dados vetorial e usá-los via API.
- O Bedrock é um produto que oferece vários modelos e uma API comum.
O h2oGPT é uma implementação de RAG completa, capaz de processar documentos em vários formatos e de oferecer suporte a diferentes implementações de hospedagem de modelos.
É possível comprar uma conta do ChatGPT e enviar seus próprios documentos, criando assim uma IA conversacional personalizada.
O GPT-4 Assistants atualmente já consegue lidar com RAG por padrão, e o PrivateGPT é uma das opções mais conhecidas para isso.
O Copilot Builder do Microsoft Office permite que o usuário crie um AI Copilot em segundos, especificando URL base, arquivos enviados e outros recursos.
O Cheshire Cat é um framework de assistente de IA que armazena documentos como "memórias" para recuperação posterior.
Há um guia em vídeo sobre como ajustar finamente o Mistral 7B com QLoRA, mencionando que técnicas de RAG podem ser mais desejáveis.

Ask HN: Como treinar uma LLM/ChatGPT customizada com meus documentos em dezembro de 2023?

Leituras relacionadas

1 comentários

Comentários do Hacker News