Context Mode - servidor MCP que economiza 98% da janela de contexto de agentes de programação com IA
(github.com/mksglu)- Economiza os dados brutos despejados por chamadas de ferramentas MCP na janela de contexto e estende a duração da sessão de ~30 minutos para ~3 horas
- Economia de contexto: isola os dados brutos em sandbox para reduzir de 315KB para 5,4KB, uma queda de 98%
- Continuidade de sessão: armazena e indexa todos os eventos — como edição de arquivos, operações de git, tarefas, erros e decisões do usuário — em SQLite+FTS5 e depois faz busca com BM25 para rastreamento de eventos da sessão e recuperação após compactação
- Pensar com código: em vez de o LLM ler os dados diretamente, ele escreve scripts e retorna apenas os resultados (ao contar funções, por exemplo, escreve o código relacionado sem gastar contexto e obtém apenas o resultado real)
- Compressão de saída: redução de ~65-75% nos tokens de saída, mantendo a precisão técnica
- Suporte a 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity etc.
- Dependendo do nível de hooks de cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), há suporte diferenciado para níveis de continuidade de sessão
- Fornece 11 ferramentas MCP:
ctx_execute(runtime para 11 linguagens),ctx_batch_execute(execução em lote de múltiplos comandos + buscas),ctx_execute_file(processamento de arquivos em sandbox),ctx_index/ctx_search(indexação e busca em base de conhecimento com FTS5+BM25),ctx_fetch_and_index(fetch e indexação de URL com cache TTL de 24 horas),ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight - Segurança: aplica ao sandbox MCP as mesmas configurações de
permissionsdo Claude Code (padrões deny/allow), com verificação individual separada até para comandos encadeados - Execução totalmente local: sem telemetria, sincronização em nuvem ou rastreamento de uso; o banco SQLite é armazenado no diretório home
- Já é usado por equipes de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe e Datadog
- Elastic License 2.0 (código-fonte aberto, proibida a oferta como serviço hospedado)
8 comentários
Acho que estou percebendo isso na prática. Estou usando só MCP e deixando os hooks de fora.
Funciona bem..
Parece uma mistura de Claude mem com caveman.
Parece que, ultimamente, estão na moda produtos e prompts do tipo "economize tokens". Não sei se isso vai ser realmente eficaz na prática.
A economia de tokens e a economia de janela de contexto se sobrepõem, mas não são a mesma coisa.
Economizar tokens é uma questão de custo, enquanto economizar janela de contexto é uma questão da qualidade da memória de trabalho do modelo. Se você inserir grandes volumes de logs ou snapshots de DOM como estão, o custo aumenta, mas o problema maior é que cresce a chance de o modelo perder pistas importantes no meio do ruído ou fazer referências incorretas.
Parece mais correto entender o context-mode como uma ferramenta mais próxima de “controlar o que vai para o contexto” do que de “usar menos”.
É preciso distinguir entre economizar tokens e economizar a janela de contexto.
Como os dois costumam ser tratados juntos, é fácil confundir.
Pois é, não sei se isso é realmente prático... Tenho a impressão de que, se usar mais uma ou duas vezes, vai acabar consumindo ainda mais tokens...
Sério?