FLAMEHAVEN FileSearch v1.3.1 – remoção das dependências de ML e grande reformulação do mecanismo de busca semântica
(github.com/flamehaven01)O FLAMEHAVEN FileSearch é um projeto open source que começou com a pergunta:
👉 “Será que dá para tornar um RAG de busca de documentos leve, reproduzível e totalmente self-hosted?”
Atualmente, com ⭐ 81 stars / 🍴 11 forks, é um projeto pequeno, mas que vem mantendo melhorias claras a cada release.
Esta release v1.3.1 não é apenas um acréscimo de funcionalidades,
👉 é uma atualização que quebra a premissa de que “busca semântica = stack pesada de ML”.
🔍 Resumo do projeto em uma linha
-
Mecanismo de busca RAG self-hosted
-
Ao enviar documentos (PDF/DOCX/MD/TXT), oferece busca por palavra-chave + semântica + híbrida
-
Funciona localmente sem banco vetorial externo
-
Pode ser executado em menos de 3 minutos com uma única linha de Docker
✨ Principais atualizações da v1.3.1 (pontos que os desenvolvedores vão gostar)
1️⃣ Remoção completa das dependências de ML (a maior mudança)
-
Remoção completa de
sentence-transformers/torch -
Introdução do DSP v2.0 (Deterministic Semantic Projection), implementado internamente
-
✔️ geração de vetores < 1ms
-
✔️ sem atraso na inicialização (antes 2 minutos → agora imediato)
-
É busca semântica, mas opera de forma determinística sem frameworks de ML
2️⃣ Otimização de memória e desempenho
-
Quantização de vetores em int8
→ redução de 75% no uso de memória -
Mais de 30% de ganho de velocidade no cálculo de similaridade por cosseno
-
Mais de 90% de compressão de metadados (Gravitas-Pack)
-
Pode ser operado sem dificuldades até em servidor pessoal / VM interna da empresa
3️⃣ Expansão dos modos de busca
-
Suporte aos modos de busca keyword / semantic / hybrid
-
Inclui correção de typos + refinamento de query
-
Totalmente backward-compatible com a API existente
4️⃣ Estabilidade e confiabilidade
-
Migração do framework de testes de pytest → unittest
-
19/19 testes aprovados (0.33s)
-
Eliminação de timeouts e instabilidade no CI
🔐 Funcionalidades de produção que continuam mantidas
-
Autenticação baseada em API Key e gerenciamento de permissões
-
Rate limiting / Audit log
-
Batch search (1~100 queries)
-
Cache Redis opcional
-
Métricas do Prometheus
👀 Especialmente indicado para
-
Equipes que precisam de um RAG local para busca de documentos internos
-
Ambientes em que é difícil subir dados para um SaaS externo (como Pinecone)
-
Desenvolvedores na fase de “o PoC funcionou, mas como operar isso em produção?”
-
Engenheiros que priorizam reprodutibilidade / custo / controle
🔗 GitHub
👉 https://github.com/flamehaven01/Flamehaven-Filesearch
---Se você testar e isso ajudar, deixar uma ⭐ já é um grande apoio.
Opiniões, feedback e PRs são todos bem-vindos.
Ainda não há comentários.