2 pontos por flamehaven01 2025-12-19 | Ainda não há comentários. | Compartilhar no WhatsApp

O FLAMEHAVEN FileSearch é um projeto open source que começou com a pergunta:
👉 “Será que dá para tornar um RAG de busca de documentos leve, reproduzível e totalmente self-hosted?”

Atualmente, com ⭐ 81 stars / 🍴 11 forks, é um projeto pequeno, mas que vem mantendo melhorias claras a cada release.

Esta release v1.3.1 não é apenas um acréscimo de funcionalidades,
👉 é uma atualização que quebra a premissa de que “busca semântica = stack pesada de ML”.


🔍 Resumo do projeto em uma linha

  • Mecanismo de busca RAG self-hosted

  • Ao enviar documentos (PDF/DOCX/MD/TXT), oferece busca por palavra-chave + semântica + híbrida

  • Funciona localmente sem banco vetorial externo

  • Pode ser executado em menos de 3 minutos com uma única linha de Docker


✨ Principais atualizações da v1.3.1 (pontos que os desenvolvedores vão gostar)
1️⃣ Remoção completa das dependências de ML (a maior mudança)

  • Remoção completa de sentence-transformers / torch

  • Introdução do DSP v2.0 (Deterministic Semantic Projection), implementado internamente

  • ✔️ geração de vetores < 1ms

  • ✔️ sem atraso na inicialização (antes 2 minutos → agora imediato)

  • É busca semântica, mas opera de forma determinística sem frameworks de ML


2️⃣ Otimização de memória e desempenho

  • Quantização de vetores em int8
    → redução de 75% no uso de memória

  • Mais de 30% de ganho de velocidade no cálculo de similaridade por cosseno

  • Mais de 90% de compressão de metadados (Gravitas-Pack)

  • Pode ser operado sem dificuldades até em servidor pessoal / VM interna da empresa


3️⃣ Expansão dos modos de busca

  • Suporte aos modos de busca keyword / semantic / hybrid

  • Inclui correção de typos + refinamento de query

  • Totalmente backward-compatible com a API existente


4️⃣ Estabilidade e confiabilidade

  • Migração do framework de testes de pytest → unittest

  • 19/19 testes aprovados (0.33s)

  • Eliminação de timeouts e instabilidade no CI


🔐 Funcionalidades de produção que continuam mantidas

  • Autenticação baseada em API Key e gerenciamento de permissões

  • Rate limiting / Audit log

  • Batch search (1~100 queries)

  • Cache Redis opcional

  • Métricas do Prometheus


👀 Especialmente indicado para

  • Equipes que precisam de um RAG local para busca de documentos internos

  • Ambientes em que é difícil subir dados para um SaaS externo (como Pinecone)

  • Desenvolvedores na fase de “o PoC funcionou, mas como operar isso em produção?”

  • Engenheiros que priorizam reprodutibilidade / custo / controle


🔗 GitHub

👉 https://github.com/flamehaven01/Flamehaven-Filesearch

---Se você testar e isso ajudar, deixar uma ⭐ já é um grande apoio.
Opiniões, feedback e PRs são todos bem-vindos.

Ainda não há comentários.

Ainda não há comentários.