37 pontos por GN⁺ 2026-03-06 | 11 comentários | Compartilhar no WhatsApp
  • Para resolver o problema de perda de contexto entre sessões no Claude Code, foi construído um sistema de memória que combina o mecanismo de busca local QMD com a skill /recall
  • O QMD é um mecanismo de busca local que indexa um vault do Obsidian e oferece três modos de busca: BM25, semântica e híbrida
  • A skill /recall restaura instantaneamente o contexto completo de sessões passadas em três modos: cronológico, por tópico e visualização em grafo
  • Foi implementado um pipeline automatizado que faz parsing e embedding automaticamente de registros de conversa em JSONL de 700 sessões e os reflete no índice do QMD
  • É apresentado um workflow centrado em contexto, no qual, mesmo que as ferramentas mudem, qualquer agente de IA pode ser usado desde que o contexto seja preservado

Problema: Claude Code reinicia a cada sessão

  • Todas as conversas no Claude Code começam do zero e, ao longo de 700 sessões em 3 semanas, ficou difícil acompanhar decisões passadas e o contexto dos projetos
  • Quando o limite de contexto chega a 60% no meio da sessão, é necessário fazer compact ou hand off, e nesse processo metade das decisões se perde
  • Ao tentar continuar o trabalho no dia seguinte, repete-se o incômodo de não lembrar o que foi feito
  • A abordagem tradicional de busca baseada em grep em arquivos não escala

QMD: mecanismo de busca local para vaults

  • O QMD é um mecanismo de busca local criado por Tobias Lutke, CEO da Shopify, que indexa vaults do Obsidian e retorna resultados em menos de 1 segundo
  • É possível mapear collections do QMD por pasta do vault (notas, registros diários, sessões, transcrições etc.) para realizar buscas focadas
  • Funciona com comandos simples, como qmd collection list, qmd search "video workflow" -c notes -n 3
  • A busca padrão do Claude Code usa um subagente Haiku que faz grep em todos os arquivos de forma bruta; nos testes, levou 3 minutos, retornou 300 arquivos e teve baixa qualidade nos resultados
  • A busca com QMD é imediata, mais precisa e consome menos tokens — sem necessidade de subagente

Grep vs BM25 vs busca semântica

  • BM25 (qmd search): busca full-text determinística que faz correspondência de palavras-chave como o grep, mas atribui pontuação a cada arquivo
    — Baseia-se na frequência de ocorrência das palavras e na raridade relativa no conjunto de documentos, usando apenas cálculo matemático, sem IA nem embeddings
    • Uma nota curta com 5 menções a "sleep" recebe pontuação maior do que um arquivo de 10.000 palavras com apenas 1 menção
  • Semântica (qmd vsearch): baseada em embeddings, permite buscar por significado mesmo sem as palavras exatas
  • Híbrida (qmd query): combina BM25 e busca semântica
  • Comparação de benchmark para a busca por "sleep":
    • grep: retorna 200 arquivos, com muito ruído, incluindo até o comando de programação sleep()
    • BM25: em menos de 2 segundos, retorna resultados relevantes como experimentos de qualidade do sono e registros de interrupção do sono
    • Porém, qmd search "insomnia" retorna 0 resultados se essa palavra não existir no vault
    • Semântica: ao buscar por "couldn't sleep, bad night", encontra até metas de hábitos de sono definidas anos antes — 4 dos 5 resultados não contêm a consulta
    • Híbrida: oferece o melhor ranqueamento, com sleep quality improvement 89%, sleep interrupted at 3am 51%, health sleep optimization 42%
  • Padrão de uso recomendado: 80% das buscas com BM25 (ideal para notas estruturadas) e adicionar busca semântica para transcrições e memos não estruturados

Casos reais de descoberta com busca semântica

  • Para consultas não estruturadas como "find the days when I was happy and what was the reason", o Claude combina automaticamente várias buscas:
    • executa múltiplas consultas como qmd vsearch "happy, grateful, excited", "energy, great day, feeling good", "satisfaction, accomplishment" etc.
  • A partir de notas diárias de vários meses, ele encontra ligações semânticas e extrai um padrão: "os dias mais felizes foram aqueles em que algo foi lançado e houve boa recuperação com sauna ou 9 horas de sono"

Skill /recall: carregar contexto antes de começar a trabalhar

  • O /recall é uma skill do Claude Code que roda sobre o QMD e carrega automaticamente o contexto antes do início do trabalho
  • Suporta três modos:
    • temporal: varredura do histórico de sessões por data (/recall yesterday, /recall last week)
    • topic: busca BM25 em collections do QMD (/recall topic graph)
    • graph: visualização interativa de sessões e arquivos (/recall graph last week)
  • No teste com /recall yesterday, foram reconstruídas em linha do tempo 39 sessões de um único dia — com horário, número de mensagens e conteúdo do trabalho de cada sessão
  • O resultado de /recall topic "QMD video" retorna em menos de 1 minuto arquivos relacionados como dashboard, plano de produção e lista de tarefas em sessões e notas — superior ao grep bruto em tempo, tokens e qualidade
  • O modo graph visualiza sessões como blobs coloridos, deixando as antigas esmaecidas e destacando as recentes em roxo — os arquivos são agrupados por tipo, como goals, research, voice, docs, content e skills
  • Exemplo: uma sessão de busca por lugar para almoçar foi reencontrada no grafo uma semana depois, e foi possível copiar o caminho do arquivo para o Claude Code e retomar o trabalho a partir da conversa anterior

Indexação automática de 700 sessões

  • O Claude Code salva todas as conversas localmente em arquivos JSONL — 700 sessões acumuladas em 3 semanas
  • Como os arquivos originais incluem tool uses, prompts de sistema, roles etc., eles são parseados e convertidos em Markdown limpo (mensagens reais do usuário e sinais relevantes) antes de serem embutidos e indexados no QMD
  • Ao fechar o terminal, um hook automático é executado para exportar e gerar embeddings da sessão no QMD — mantendo o índice sempre atualizado sem trabalho manual

Descobrindo ideias que nunca foram executadas

  • Na busca por "find the ideas that I have never acted on", o Claude sintetizou os resultados do QMD e encontrou:
    • 19 de outubro — havia um plano para construir um dashboard de escrita do PhD, mas ele não foi executado
    • Havia uma ideia de app baseado em ilustração, mas sem qualquer acompanhamento posterior
    • Havia uma ideia de gravação de tela do workflow no Obsidian, mas ela não foi executada
  • Conteúdos escritos meses antes e completamente esquecidos foram redescobertos
  • Todos os embeddings são armazenados localmente

Workflow centrado em contexto

  • As notas deixam de ficar presas no Obsidian e passam a ser contexto útil aplicado ao alcance de objetivos reais
  • As ferramentas mudam (novos modelos, novos agentes), mas se o contexto for mantido, tudo pode funcionar no Claude Code, Codex, Gemini CLI e outros
  • A camada de memória funciona em toda a stack na forma de skill
  • Configuração real: o Obsidian Sync sincroniza o vault entre um Mac e um Mac Mini sempre ligado, enquanto o OpenClaw roda 24/7 no Mac Mini — ao acessar o OpenClaw pelo celular, é possível usar o mesmo vault, índice do QMD e skills de qualquer lugar
  • Estrutura completa da stack:
    • base: Obsidian Vault
    • meio: QMD Search
    • topo: Claude Code / OpenClaw
    • o contexto flui de baixo para cima

11 comentários

 
mammal 2026-03-06

Por que tanta coisa anda morrendo ultimamente?

 
pjs102793 2026-03-06

kkkkkkkk

 
t7vonn 2026-03-06

grep morreu. Use ripgrep.

 
galadbran 2026-03-06

Pensei em experimentar o qmd, então pedi para a IA pesquisar, mas ela diz que, embora a parte de embeddings seja razoável, o suporte em coreano para BM25 e expansão de consulta não é bom, então não recomenda...

 
alstjr7375 2026-03-07

Isso vale para quase a maioria dos casos no BM25 também.
Por isso, é bom usar um analisador morfológico junto.
https://github.com/bab2min/Kiwi

 
cshj55 2026-03-07

Fui checar os fatos e parece que não há evidências precisas disso. Alguém mais teve essa experiência, por acaso?

 
dalinaum 2026-03-23

Como o BM25 é uma busca focada em palavras, a opinião do galadbran parece fazer sentido.

 
versionx 2026-03-10

Vendo de forma mais clássica, parece que técnicas clássicas de recuperação da informação estão simplesmente sendo reutilizadas em um nível mais local.

 
redmi 2026-03-07

~~ está morto 💀💀💀

 
ppj050 2026-03-06

É só RAG;

 
lkaybob 2026-03-06

Como a página de instalação pede um endereço de e-mail, achei que fosse um repositório privado, mas na verdade é um repositório público.
Você pode acessar pelo link abaixo.

https://github.com/ArtemXTech/personal-os-skills/…