1 pontos por mansuiki 4 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp

Olá. Criei o turbo-graph, que adiciona uma camada de memória de grafo para RAG com restrições com base em turbovec/TurboQuant.

O turbovec já é bom quando há flat top-k ou uma allowlist barata. Mas, em RAG real, a consulta frequentemente fica assim.

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

Eu acabava repetindo código para montar essa combinação toda no Python/SQL/camada da aplicação, passá-la de novo para a busca vetorial, fazer rerank dos resultados com graph/BM25 e explicar por que aquele resultado saiu.

O turbo-graph é um experimento para manter o core compatível com turbovec e mover para a camada de índice o compilation de views de grafo/metadados ao redor dele, o reúso de cache, o graph rerank e a telemetria de explicação.

Ainda está em Alpha, então o objetivo não é dizer para usar direto em produção, e sim receber feedback sobre quais APIs são necessárias em rotas reais de RAG.

GitHub:
https://github.com/bigmacfive/turbo-graph

Ainda não há comentários.

Ainda não há comentários.