Platform Skeleton (Mini Palantir) alcançado: início de Graph-RAG local + middleware cognitivo + colaboração externa no JAMES v0.3.0 (open source, alpha)
(github.com/Hashevolution)Resumo em uma linha
Um motor de conhecimento Graph-RAG 100% local que trata segurança como princípio de design.
Ao alcançar o v0.3.0 Platform Skeleton (2026-05-17), a camada de middleware cognitivo
não está mais só no design, mas já entrou na branch principal como código.
- GitHub: https://github.com/Hashevolution/James-RAG-Evol
- Versão atual: v0.3.0 (Foundation Hardening aprovado em 6/6 eixos, gate liberado em 2026-05-13)
- Licença: MIT
- Validação externa: badge passing do OpenSSF Best Practices (Tiered 111%, project #12806)
- Apelido: "Mini Palantir" (Palantir é uma marca da Palantir Technologies, sem relação direta com JAMES — apenas uma analogia porque o padrão de typed-graph + preservação de trilhas de auditoria é parecido)
[IMG] Visualização de ontologia 3D do JAMES
v0.2 → v0.3: o que mudou em 9 dias
- A camada de middleware cognitivo Phase 2 se estabeleceu na branch principal
- verification engine (PR #290) / planner·task decomposition (PR #297) / tool router (PR #295)
- verificação, planejamento e roteamento de ferramentas deixaram de ser apenas design docs e viraram módulos importáveis
- Knowledge Cascade Phase A → E: migração para produção concluída com 213 entities / 656 relations
- Pipeline de segurança em 3 estágios mantido: entrada
pre_check→ busca ABAC → saídapost_filter+ máscara de PII - Log de auditoria de autoevolução: todos os patches possuem
approver_username, sem possibilidade de bypass - Senha com bcrypt + migração transparente para SHA-256 (PR #173), baseline ruff F-class + workflow de lint no GitHub Actions (PR #205)
O que aconteceu fora do projeto (prova de que não foi feito sozinho)
- Primeira colaboração externa em andamento com Ali Afana (fundador da Provia, dev.to Featured) — 6 trocas por DM no LinkedIn + thread de comentários no dev.to
- Trabalho conjunto: separação da suíte de regressão de injeção com 83 itens, benchmark das variantes Gemma 4 no v0.3 (E4B / 26B MoE / 31B Dense)
- Entrega conjunta: injection-fixtures schema v1.1 (PR #311 → #317 → #322, incorporando invariantes de normalização propostos por Ali,
expected_block_stageecatalog_context, todos com origem registrada no diff-log) - Registro prévio: plano de avaliação 3×3 (3 variantes × 3 temperaturas × 1 estrutura de prompt, 4 hipóteses + decision matrix, travado no PR #315 antes de qualquer célula rodar)
- Ponto de contato para implementadores externos: contrato de LLM Provider (PR #316, 6 comportamentos obrigatórios + kwargs/env vars reservados, incluindo um rascunho de backend da Gemini API com ~30 linhas)
- Segundo candidato a colaboração — Matija Fućek (@mfucek_, naumu.ai) respondeu ao tuíte da visualização 3D compartilhando o demo do próprio projeto (um app plug-and-play de cérebro corporativo), abrindo um canal de colaboração
- Envio concluído para 2 trilhas do Gemma 4 Challenge:
- Build with Gemma 4: Building a Mini Palantir on gemma4:e4b
- Write with Gemma 4: 5 empty responses from gemma4:e4b. 4 hypotheses. 0 root cause. — em formato fair-witness, relatando a falha sem maquiar os resultados
Limitações honestas (fase alpha, nada a esconder)
- O middleware cognitivo Phase 2 entrou na branch principal, mas a validação com múltiplos usuários e alta carga ficou para o gate do v0.4
- Multimodal já está integrado até LLaVA, Whisper e ffmpeg (working prototype). A integração com retrieval fica entre v0.3.x e v0.4
- O scaffold de autoevolução foi validado em ambiente de usuário único; workflow com múltiplos aprovadores ainda não foi validado
- O Gemma 4 E4B gerou 5 respostas vazias na etapa cognitiva, e nenhuma das 4 hipóteses conseguiu confirmar a root cause (isso está publicado exatamente assim no texto da trilha Write)
Onde isso pode ser usado
- Quando você quer lidar com wiki/notas internas apenas localmente, sem enviar para APIs externas
- Em demos/pesquisas de RAG onde o caminho de raciocínio (um typed
graph_pathno formatoA --[CAUSES]--> X --[REQUIRES]--> Y) precisa ser exposto como grafo junto com a resposta - Como referência de padrões de segurança em RAG (pipeline em 3 estágios, instruction isolation, migração para bcrypt, baseline de ruff — tudo aberto em nível de PR)
- Para quem precisa de ponto de entrada de plugin — o loader
JAMES_PLUGINSe o Backend Protocol estão sendo estabilizados no v0.3.x
Como começar
git clone https://github.com/Hashevolution/James-RAG-Evol
cp .env.example .env
pip install -r requirements.txt
ollama pull gemma2:2b # Se não tiver GPU, comece por este
python server_llmwiki.py # http://localhost:8000
1 comentários
Olá. Perguntas são sempre bem-vindas —
Abaixo está uma comparação em nível de design de sistema.
A arquitetura atual do JAMES (v0.3.0) é a seguinte.
Ausência de uma camada de formal query language — a busca híbrida em
core/retrieval_engine.pyusa fusão de pontuação em 4 vias de dense embedding + BM25 + keyword + name, e não converte consultas em NL para linguagens formais como SPARQL/RDF/SQL. As pontuações de embedding e BM25 são usadas diretamente na seleção dos nós candidatos.A resposta do LLM é em NL — em
core/reasoning/modes/chat.py, o LLM recebe prompts em NL e gera respostas em texto NL, sem uma etapa intermediária em linguagem formal.A atualização do KG é separada por um gate de aprovação humana — declarado na primeira frase da docstring do módulo
core/change_request.py: "Every write inside JAMES becomes a proposal in this module first; only a separate reviewer's approval turns the proposal into a real write." Ou seja, não existe no sistema um caminho para adicionar/modificar/remover automaticamente no KG com base na resposta do LLM. Owiki_edittambém tem um gate de permissão de admin e força o fluxo propose → review → apply dochange_request(veja também CLAUDE.md §3, ARCHITECTURE.md §5.6).Por favor, considerem que o JAMES ainda está em estágio alpha e não comercial.
Além disso, se quiserem uma análise mais profunda, seria ótimo discutir isso juntos em uma GitHub Issue.
Acredito que feedbacks diversos são o que há de mais valioso para permitir uma verificação honesta das escolhas de design do projeto. Obrigado.