Context Mode - servidor MCP que economiza 98% da janela de contexto de agentes de programação com IA

xguru · 2026-05-03T09:31:02+09:00

Economiza os dados brutos despejados por chamadas de ferramentas MCP na janela de contexto e estende a duração da sessão de ~30 minutos para ~3 horas Economia de contexto: isola os dados brutos em sandbox para reduzir de 315KB para 5,4KB, uma queda de 98% Continuidade de sessão: armazena e indexa todos os eventos — como edição de arquivos, operações de git, tarefas, erros e decisões do usuário — em SQLite+FTS5 e depois faz busca com BM25 para rastreamento de eventos da sessão e recuperação após compactação Pensar com código: em vez de o LLM ler os dados diretamente, ele escreve scripts e retorna apenas os resultados (ao contar funções, por exemplo, escreve o código relacionado sem gastar contexto e obtém apenas o resultado real) Compressão de saída: redução de ~65-75% nos tokens de saída, mantendo a precisão técnica Suporte a 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity etc. Dependendo do nível de hooks de cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), há suporte diferenciado para níveis de continuidade de sessão Fornece 11 ferramentas MCP: ctx_execute (runtime para 11 linguagens), ctx_batch_execute (execução em lote de múltiplos comandos + buscas), ctx_execute_file (processamento de arquivos em sandbox), ctx_index/ctx_search (indexação e busca em base de conhecimento com FTS5+BM25), ctx_fetch_and_index (fetch e indexação de URL com cache TTL de 24 horas), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight Segurança: aplica ao sandbox MCP as mesmas configurações de permissions do Claude Code (padrões deny/allow), com verificação individual separada até para comandos encadeados Execução totalmente local: sem telemetria, sincronização em nuvem ou rastreamento de uso; o banco SQLite é armazenado no diretório home Já é usado por equipes de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe e Datadog Elastic License 2.0 (código-fonte aberto, proibida a oferta como serviço hospedado)

(github.com/mksglu)

23 pontos por xguru 2026-05-03 | 8 comentários | Compartilhar no WhatsApp

Economiza os dados brutos despejados por chamadas de ferramentas MCP na janela de contexto e estende a duração da sessão de ~30 minutos para ~3 horas
Economia de contexto: isola os dados brutos em sandbox para reduzir de 315KB para 5,4KB, uma queda de 98%
Continuidade de sessão: armazena e indexa todos os eventos — como edição de arquivos, operações de git, tarefas, erros e decisões do usuário — em SQLite+FTS5 e depois faz busca com BM25 para rastreamento de eventos da sessão e recuperação após compactação
Pensar com código: em vez de o LLM ler os dados diretamente, ele escreve scripts e retorna apenas os resultados (ao contar funções, por exemplo, escreve o código relacionado sem gastar contexto e obtém apenas o resultado real)
Compressão de saída: redução de ~65-75% nos tokens de saída, mantendo a precisão técnica
Suporte a 14 plataformas: Claude Code (marketplace de plugins), Codex CLI, Gemini CLI, Cursor, OpenCode, OpenClaw, Antigravity etc.
- Dependendo do nível de hooks de cada plataforma (PreToolUse, PostToolUse, SessionStart, PreCompact), há suporte diferenciado para níveis de continuidade de sessão
Fornece 11 ferramentas MCP: ctx_execute (runtime para 11 linguagens), ctx_batch_execute (execução em lote de múltiplos comandos + buscas), ctx_execute_file (processamento de arquivos em sandbox), ctx_index/ctx_search (indexação e busca em base de conhecimento com FTS5+BM25), ctx_fetch_and_index (fetch e indexação de URL com cache TTL de 24 horas), ctx_stats/ctx_doctor/ctx_upgrade/ctx_purge/ctx_insight
Segurança: aplica ao sandbox MCP as mesmas configurações de permissions do Claude Code (padrões deny/allow), com verificação individual separada até para comandos encadeados
Execução totalmente local: sem telemetria, sincronização em nuvem ou rastreamento de uso; o banco SQLite é armazenado no diretório home
Já é usado por equipes de grandes empresas como Microsoft, Google, Meta, Amazon, NVIDIA, Stripe e Datadog
Elastic License 2.0 (código-fonte aberto, proibida a oferta como serviço hospedado)

8 comentários

kirkyoon 2026-05-06

Acho que estou percebendo isso na prática. Estou usando só MCP e deixando os hooks de fora.

kaydash 2026-05-04

Funciona bem..

duse0001 2026-05-03

Parece uma mistura de Claude mem com caveman.

recast7838 2026-05-03

Parece que, ultimamente, estão na moda produtos e prompts do tipo "economize tokens". Não sei se isso vai ser realmente eficaz na prática.

kurthong 2026-05-04

A economia de tokens e a economia de janela de contexto se sobrepõem, mas não são a mesma coisa.

Economizar tokens é uma questão de custo, enquanto economizar janela de contexto é uma questão da qualidade da memória de trabalho do modelo. Se você inserir grandes volumes de logs ou snapshots de DOM como estão, o custo aumenta, mas o problema maior é que cresce a chance de o modelo perder pistas importantes no meio do ruído ou fazer referências incorretas.

Parece mais correto entender o context-mode como uma ferramenta mais próxima de “controlar o que vai para o contexto” do que de “usar menos”.

ehlegeth 2026-05-04

É preciso distinguir entre economizar tokens e economizar a janela de contexto.
Como os dois costumam ser tratados juntos, é fácil confundir.

shakespeares 2026-05-03

Pois é, não sei se isso é realmente prático... Tenho a impressão de que, se usar mais uma ou duas vezes, vai acabar consumindo ainda mais tokens...

kyg5474 2026-05-03

Sério?

Context Mode - servidor MCP que economiza 98% da janela de contexto de agentes de programação com IA

Leituras relacionadas

8 comentários