5 pontos por GN⁺ 2024-06-28 | 1 comentários | Compartilhar no WhatsApp
  • Projetado para preencher a lacuna entre experimentos locais com LLM e sistemas de Retrieval-Augmented Generation (RAG) em nível de produção
  • Fornece um sistema RAG abrangente e moderno, construído para ser fácil de usar por desenvolvedores com foco em API RESTful

Principais recursos

  • Suporte multimodal: suporte a vários formatos de arquivo, como .txt, .pdf, .json, .png, .mp3 e outros.
  • Busca híbrida: combina busca semântica e por palavras-chave para melhorar a relevância.
  • Graph RAG: extrai relações automaticamente e constrói um grafo de conhecimento.
  • Gerenciamento de apps: gerencia documentos e usuários com eficiência, oferecendo rica observabilidade e recursos de análise.
  • Cliente-servidor: suporte a API RESTful.
  • Configurável: permite provisionar aplicações usando arquivos de configuração intuitivos.
  • Extensível: permite expandir aplicações facilmente por meio do padrão builder + factory.
  • Dashboard: oferece o dashboard R2R, um app open source em React+Next.js para interação amigável ao usuário.

Dashboard R2R

É possível interagir com o R2R usando o dashboard open source em React+Next.js. Consulte o Cookbook do dashboard para começar.

1 comentários

 
GN⁺ 2024-06-28
Comentários do Hacker News
  • Precisão e eficiência da extração de dados: O processo de extração de dados é um desafio importante em sistemas RAG. Como as abordagens tradicionais de OCR são insuficientes, utiliza-se uma abordagem de LLM multimodal + OCR para aumentar a precisão e a consistência.

  • Experiência operando uma stack semelhante: Há 2 anos operando uma stack parecida, usando tecnologias como Pgvector, HyDe e busca na web + busca em documentos. Há um bom dashboard com logs e análises.

  • Dificuldades com o quickstart: O quickstart na prática não é tão rápido. Seria necessário fornecer uma configuração incluindo Docker Compose e uma imagem do Postgres. Também há o inconveniente de precisar clonar um repositório separado para usar o dashboard.

  • Complexidade do projeto: O projeto inclui muitos elementos, mas isso não torna o desenvolvimento mais fácil. Fica confuso se é um SDK ou uma coleção de apps. Deveria oferecer uma experiência de instalação com “1 clique” para permitir pré-visualizar todos os recursos.

  • Verificação de precisão: Há uma pergunta sobre como validar a precisão das respostas. Existe curiosidade sobre se há uma forma de rastrear o processo pelo qual a resposta foi gerada.

  • Dificuldades na coleta de dados: Em muitos projetos de RAG, a coleta de dados não é resolvida adequadamente. Há uma pergunta sobre como ingerir em lote grandes volumes de documentos HTML no sistema.

  • Coleta de dados multimodais: Solicita-se uma explicação mais detalhada do processo de coleta de dados multimodais. Há perguntas sobre quais tipos de dados o R2R consegue processar atualmente e como são feitos os embeddings de tipos de dados não textuais.

  • Otimização para equipes de desenvolvimento: Solicita-se uma explicação de como o processo ficou mais rápido e otimizado para a equipe de desenvolvimento. Há grande potencial para acelerar o tempo de desenvolvimento de um MVP.

  • Trabalho com código-fonte: Procura-se uma solução RAG capaz de entender código-fonte. Por exemplo, deseja-se uma funcionalidade que entenda “o evento de analytics chamado ao clicar no botão de envio”.

  • Contra o uso de Neo4j: Não se quer usar Neo4j, por consumir muitos recursos.

  • Integração com frontends de chat populares: Há uma pergunta sobre integração com frontends de chat populares, como o OpenWebUI.