R2R V2 - mecanismo RAG open source pronto para produção

(github.com/SciPhi-AI)

5 pontos por GN⁺ 2024-06-28 | 1 comentários | Compartilhar no WhatsApp

Projetado para preencher a lacuna entre experimentos locais com LLM e sistemas de Retrieval-Augmented Generation (RAG) em nível de produção
Fornece um sistema RAG abrangente e moderno, construído para ser fácil de usar por desenvolvedores com foco em API RESTful

Principais recursos

Suporte multimodal: suporte a vários formatos de arquivo, como .txt, .pdf, .json, .png, .mp3 e outros.
Busca híbrida: combina busca semântica e por palavras-chave para melhorar a relevância.
Graph RAG: extrai relações automaticamente e constrói um grafo de conhecimento.
Gerenciamento de apps: gerencia documentos e usuários com eficiência, oferecendo rica observabilidade e recursos de análise.
Cliente-servidor: suporte a API RESTful.
Configurável: permite provisionar aplicações usando arquivos de configuração intuitivos.
Extensível: permite expandir aplicações facilmente por meio do padrão builder + factory.
Dashboard: oferece o dashboard R2R, um app open source em React+Next.js para interação amigável ao usuário.

Dashboard R2R

É possível interagir com o R2R usando o dashboard open source em React+Next.js. Consulte o Cookbook do dashboard para começar.

1 comentários

GN⁺ 2024-06-28

Comentários do Hacker News

Precisão e eficiência da extração de dados: O processo de extração de dados é um desafio importante em sistemas RAG. Como as abordagens tradicionais de OCR são insuficientes, utiliza-se uma abordagem de LLM multimodal + OCR para aumentar a precisão e a consistência.
Experiência operando uma stack semelhante: Há 2 anos operando uma stack parecida, usando tecnologias como Pgvector, HyDe e busca na web + busca em documentos. Há um bom dashboard com logs e análises.
Dificuldades com o quickstart: O quickstart na prática não é tão rápido. Seria necessário fornecer uma configuração incluindo Docker Compose e uma imagem do Postgres. Também há o inconveniente de precisar clonar um repositório separado para usar o dashboard.
Complexidade do projeto: O projeto inclui muitos elementos, mas isso não torna o desenvolvimento mais fácil. Fica confuso se é um SDK ou uma coleção de apps. Deveria oferecer uma experiência de instalação com “1 clique” para permitir pré-visualizar todos os recursos.
Verificação de precisão: Há uma pergunta sobre como validar a precisão das respostas. Existe curiosidade sobre se há uma forma de rastrear o processo pelo qual a resposta foi gerada.
Dificuldades na coleta de dados: Em muitos projetos de RAG, a coleta de dados não é resolvida adequadamente. Há uma pergunta sobre como ingerir em lote grandes volumes de documentos HTML no sistema.
Coleta de dados multimodais: Solicita-se uma explicação mais detalhada do processo de coleta de dados multimodais. Há perguntas sobre quais tipos de dados o R2R consegue processar atualmente e como são feitos os embeddings de tipos de dados não textuais.
Otimização para equipes de desenvolvimento: Solicita-se uma explicação de como o processo ficou mais rápido e otimizado para a equipe de desenvolvimento. Há grande potencial para acelerar o tempo de desenvolvimento de um MVP.
Trabalho com código-fonte: Procura-se uma solução RAG capaz de entender código-fonte. Por exemplo, deseja-se uma funcionalidade que entenda “o evento de analytics chamado ao clicar no botão de envio”.
Contra o uso de Neo4j: Não se quer usar Neo4j, por consumir muitos recursos.
Integração com frontends de chat populares: Há uma pergunta sobre integração com frontends de chat populares, como o OpenWebUI.