DeepSeek Reasonix - agente de programação nativo do DeepSeek com alto cache e baixo custo
(esengine.github.io)- Agente de programação de terminal open source projetado exclusivamente para a API do DeepSeek, comunicando-se diretamente com
api.deepseek.com - O loop append-only é otimizado para o byte-stable prefix cache do DeepSeek, mantendo mais de 90% de taxa de acerto de cache em sessões longas e reduzindo o custo de tokens de entrada para cerca de 1/5, ficando em torno de 1/3 do custo de ferramentas semelhantes
- Executa com uma única linha,
npx reasonix code, sem necessidade de instalação global (Node ≥ 22, compatível com macOS/Linux/Windows) - 3 pilares principais de design
- Cache-First Loop: estrutura append-only, sem dependência de marcadores, mantendo o prefix cache com ordem de chamadas determinística
- R1 Thought Harvest: coleta a cadeia de raciocínio de tool calls perdidas
- Tool-Call Repair: recuperação no estilo self-heal com reconhecimento de schema
- Princípio terminal-first, sem suporte a plugins de IDE, aproveitando diretamente ferramentas de terminal como
git diffels- Baseado em TypeScript + Ink TUI, com cliente desktop em Tauri oferecido separadamente (com runtime Node embutido)
- Operação em dois níveis de modelo no V4: V4-Flash como padrão para iterações de baixo custo, promoção de turno único para V4-Pro com
/pro, e execução de toda a sessão em Pro com/preset max - Suporte de primeira classe ao MCP (Model Context Protocol): conexão com servidores externos em uma linha com
--mcp "name=cmd args", com suporte a transportes stdio, SSE e Streamable HTTP - Sandbox + gate
/plan: todas as ferramentas embutidas ficam em sandbox no diretório de execução, e o modo/planfunciona como um gate de auditoria read-only, bloqueando escrita antes da aprovação- Edições SEARCH/REPLACE ficam em uma fila pendente e não são gravadas em disco até
/apply
- Edições SEARCH/REPLACE ficam em uma fila pendente e não são gravadas em disco até
- Composable Skills: coloque arquivos Markdown em
.reasonix/skills/<name>.md;runAs: subagenteallowed-toolsno frontmatter permitem execução isolada - Replay & Events: todos os eventos são registrados em disco, permitindo reproduzir sessões passadas, gerar estatísticas e auditoria com os comandos
reasonix replay / events / stats - Expansibilidade baseada em texto puro: todos os ajustes são gerenciados como texto simples rastreável por git por meio dos diretórios
/mcp,/skills,/memory,/confige/slash - Suporte a endpoints DeepSeek self-hosted: desde a versão 0.30, aceita prefixos de chave não padronizados; basta apontar
baseUrlpara um endereço interno para que loop, cache e protocolo de tools funcionem da mesma forma - Preços da API DeepSeek: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
- Licença MIT
1 comentários
Comentários do Hacker News
Não sei se é realmente necessário um agente de código dedicado ao DeepSeek para aproveitar o cache do DeepSeek
Como o problema de cota do Codex ainda não tinha sido resolvido ontem, fiz uma ponte bem pequena para usar o DeepSeek V4 Pro no Codex, e pareceu que quase tudo o que eu estava fazendo foi armazenado em cache: https://i.imgur.com/7eKn6wN.png
Em 2026-05-23, eu tinha 39.123.200 tokens com acerto no cache de entrada e 1.692.286 tokens sem acerto no cache; a ponte não faz nada de especial, só adapta o formato da API do DeepSeek para o formato que o Codex espera, então não há nenhum tratamento especial relacionado a cache
Fora o fato de o cache ficar melhor, não vejo muito qual seria a vantagem em relação a rodar o OpenCode diretamente com a API do DeepSeek. Isso também certamente teria cache de forma parecida e, se isso for importante, se comunica diretamente com
api.deepseek.com, além de oferecer um ambiente de execução muito mais maduroEla explica por que consideram isso uma solução melhor e por que têm uma filosofia de design tão forte
“O cache automático de prefixo só é ativado quando há correspondência exata do prefixo em bytes da solicitação anterior. A maioria dos loops de agentes reordena, reescreve ou injeta novos timestamps a cada turno — na prática, a taxa de acerto de cache fica abaixo de 20%”
Então a ideia é otimizar isso e outras técnicas para aumentar a taxa de acerto do cache e reduzir custos
Para quem tiver curiosidade: http://github.com/tontinton/maki
O DeepSeek v4 é excelente quando usado com claude-code ou opencode. No meu caso, o claude code saiu mais barato que o opencode, provavelmente por causa de um ambiente de execução melhor projetado
No fim, imagino que seja uma forma de inserir frases normais em inglês em vez de comandos
Este site parece ter sido feito pelo Codex. Pedi ao Codex para criar um HTML de visão geral de recursos para a equipe, e ele gerou um monstro exageradamente enfeitado, com grandes caixas de estatísticas quase sem informação útil, e tudo era muito parecido: a mesma fonte, cores, layout e até a seção hero
Também ficou horrível no mobile, como este site. No fim, pedi ao Claude para fazer um arquivo HTML de uma página só, e algo como 95% já estava pronto para uso imediato para comunicar claramente a intenção, exigindo só alguns ajustes
No mobile, os exemplos de código continuam empurrando o conteúdo para fora, então fica difícil até ler a maior parte da página. Claro, talvez isso seja crítico demais e a intenção fosse boa, mas um site mais simples teria sido suficiente
Afinal, como qualquer engenheiro de software sabe, tirar funcionalidades pode simplificar drasticamente qualquer projeto
O que eu gostaria que o autor entendesse é que algumas pessoas querem um binário único e autocontido que não consuma metade da memória do computador, e por isso preferem escrever em Rust ou Go
O valor e a conveniência de desenvolvimento que linguagens interpretadas lentas ofereciam estão desaparecendo aos poucos. As linguagens novas já vêm com muitas coisas boas por padrão, ou, para ser mais preciso, talvez os alertas de plantão às 1 da manhã tenham começado a nos irritar demais
O Go já tem muitas bibliotecas boas para terminal
Não gosto daquela página. Por causa da animação de digitação, o tamanho da área de exemplo muda o tempo todo, e o conteúdo abaixo fica sendo empurrado para cima e para baixo
É uma experiência de usuário realmente ruim
Mas isso parece estar se tornando uma habilidade perdida
Do ponto de vista de alguém que vem construindo ambientes de execução há 1 ano, o pessoal do opencode não quebra o cache de prefixo por burrice
Normalmente fazem isso de propósito, porque nos testes o resultado geral é melhor
Se você acha que o dsv4 se comporta de forma suficientemente diferente da média dos outros modelos, com base nisso envie um PR para o ambiente de execução que você quer com tratamento especial para esse caso. Assumir cegamente que “por causa do cache sempre tem que ser append-only” é desperdiçar o tempo de todo mundo
Como este não é um agente feito pela DeepSeek, o título é enganoso
Agora a marca DeepSeek ficou forte o bastante para que as pessoas queiram pegar carona nesse reconhecimento de marca
Bem interessante. Sou assinante do Claude de 200 dólares por mês, e até agora quase não precisei usar outra coisa
Mas, à medida que o Claude vai limitando cada vez mais meu fluxo de trabalho, especialmente depois das mudanças recentes no uso de IDE/-p, tenho vontade de migrar para outro lugar
Quero muito raciocínio de ponta, então isso me preocupa, mas ainda assim continuo interessado no DeepSeek
Eu fiz isso e percebi que só o Qwen-2.5-Max já basta. Para os trabalhos de brinquedo com que eu mexo, acho que até o Claude Sonnet 3.5 seria suficiente. Não estou tentando ganhar uma medalha Fields de matemática
Cerca de 6 horas depois, os dois falharam em concluir a engenharia reversa completa, mas a diferença foi grande
O DS parava a cada 30 minutos dizendo que tinha terminado a engenharia reversa completa e que agora tudo deveria funcionar, mas na prática não tinha concluído nem 1%. Mesmo com instruções fortes para não usar certos atalhos, ele continuava procurando atalhos, e foi um fracasso total
Já o GPT-5.5 foi realmente impressionante. Ele fez de fato o que precisava ser feito e não passou para a próxima etapa antes de concluir as camadas iniciais e ter certeza de que entendia completamente o que era necessário. Durante 6 horas, eu só inseri prompts quando vi que ele estava indo na direção certa e o orientei levemente para uma abordagem um pouco melhor. Não parecia que eu estava brigando com ele
Claro, depois da compressão às vezes ele soltava algo como “não posso ajudar com engenharia reversa”, mas numa sessão nova isso foi resolvido de forma limpa
Cancelei minha assinatura do Claude há um mês, então não posso comparar, mas o DeepSeek me lembrou bastante a sensação de trabalhar com o Opus 4.6/4.7. Para algumas pessoas isso pode ser um sinal positivo, mas ao ver o GPT-5.5 fica claro como o estilo de trabalho Claude/DS é irritante demais
A Anthropic precisa do seu dinheiro para sobreviver, e assim você vai dormir melhor achando que está usando o estado da arte
Mesmo com ferramentas diferentes, um plano em Markdown funciona muito bem. Se eu baixar da assinatura 5x Max para a Pro, pretendo fazer isso
Também estou criando um launcher que facilita usar provedores de terceiros no Claude Code: https://ccode.kronis.dev
O proxy local já funciona; só ainda não há troca dinâmica de modelo. Não parece difícil de adicionar e, dependendo da agenda, deve entrar em 1 ou 2 semanas
Não acho sensato abandonar totalmente a Anthropic. Os modelos são excelentes e, com a assinatura, você ainda ganha recursos que eu gosto, como o Remote Control. Mas parece possível mudar de tier e economizar um pouco. Por outro lado, é preciso manter uma linha de base de qualidade. Quando usei o GLM 4.6 na Cerebras no passado, havia bastante resultado meia-boca
Gostei do foco na eficiência de acerto de cache. Parabéns à equipe do DeepSeek por fazer um ótimo produto que maximiza a eficiência de custo para o usuário
Em faixas sensíveis a custo, ele é o vencedor, e se alguma startup empacotar isso direito pensando em retenção de dados, pode virar um excelente produto vendável para empresas. Porque, no caso de assistentes de programação, as questões centrais são retenção de dados e privacidade
“Projeto open source independente · sem afiliação com a DeepSeek”
Não entendo quais seriam as alavancas que dá para ajustar aqui
Testei e a área de entrada de texto estava com fundo preto e fonte escura
Consultei a documentação e pedi ajuda sobre fonte/estilo ao DeepSeek v4, Claude e Gemini, mas nada funcionou, a não ser executar isso em um terminal com tema escuro. É loucura. Nenhum desenvolvedor desse projeto usa tema claro?
Tema claro é bem raro