DeepSeek Reasonix - agente de programação nativo do DeepSeek com alto cache e baixo custo

(esengine.github.io)

3 pontos por GN⁺ 2026-05-25 | 2 comentários | Compartilhar no WhatsApp

Agente de programação de terminal open source projetado exclusivamente para a API do DeepSeek, comunicando-se diretamente com api.deepseek.com
O loop append-only é otimizado para o byte-stable prefix cache do DeepSeek, mantendo mais de 90% de taxa de acerto de cache em sessões longas e reduzindo o custo de tokens de entrada para cerca de 1/5, ficando em torno de 1/3 do custo de ferramentas semelhantes
Executa com uma única linha, npx reasonix code, sem necessidade de instalação global (Node ≥ 22, compatível com macOS/Linux/Windows)
3 pilares principais de design
- Cache-First Loop: estrutura append-only, sem dependência de marcadores, mantendo o prefix cache com ordem de chamadas determinística
- R1 Thought Harvest: coleta a cadeia de raciocínio de tool calls perdidas
- Tool-Call Repair: recuperação no estilo self-heal com reconhecimento de schema
Princípio terminal-first, sem suporte a plugins de IDE, aproveitando diretamente ferramentas de terminal como git diff e ls
- Baseado em TypeScript + Ink TUI, com cliente desktop em Tauri oferecido separadamente (com runtime Node embutido)
Operação em dois níveis de modelo no V4: V4-Flash como padrão para iterações de baixo custo, promoção de turno único para V4-Pro com /pro, e execução de toda a sessão em Pro com /preset max
Suporte de primeira classe ao MCP (Model Context Protocol): conexão com servidores externos em uma linha com --mcp "name=cmd args", com suporte a transportes stdio, SSE e Streamable HTTP
Sandbox + gate /plan: todas as ferramentas embutidas ficam em sandbox no diretório de execução, e o modo /plan funciona como um gate de auditoria read-only, bloqueando escrita antes da aprovação
- Edições SEARCH/REPLACE ficam em uma fila pendente e não são gravadas em disco até /apply
Composable Skills: coloque arquivos Markdown em .reasonix/skills/<name>.md; runAs: subagent e allowed-tools no frontmatter permitem execução isolada
Replay & Events: todos os eventos são registrados em disco, permitindo reproduzir sessões passadas, gerar estatísticas e auditoria com os comandos reasonix replay / events / stats
Expansibilidade baseada em texto puro: todos os ajustes são gerenciados como texto simples rastreável por git por meio dos diretórios /mcp, /skills, /memory, /config e /slash
Suporte a endpoints DeepSeek self-hosted: desde a versão 0.30, aceita prefixos de chave não padronizados; basta apontar baseUrl para um endereço interno para que loop, cache e protocolo de tools funcionem da mesma forma
Preços da API DeepSeek: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
Licença MIT

2 comentários

myoun 2026-05-25

Pensando bem, o fato de a DeepSeek tornar permanente o desconto no preço do V4 Pro faz parecer que usar a DeepSeek como agente de programação não é uma má ideia.

GN⁺ 2026-05-25

Comentários do Hacker News

Não sei se é realmente necessário um agente de código dedicado ao DeepSeek para aproveitar o cache do DeepSeek
Como o problema de cota do Codex ainda não tinha sido resolvido ontem, fiz uma ponte bem pequena para usar o DeepSeek V4 Pro no Codex, e pareceu que quase tudo o que eu estava fazendo foi armazenado em cache: https://i.imgur.com/7eKn6wN.png
Em 2026-05-23, eu tinha 39.123.200 tokens com acerto no cache de entrada e 1.692.286 tokens sem acerto no cache; a ponte não faz nada de especial, só adapta o formato da API do DeepSeek para o formato que o Codex espera, então não há nenhum tratamento especial relacionado a cache
Fora o fato de o cache ficar melhor, não vejo muito qual seria a vantagem em relação a rodar o OpenCode diretamente com a API do DeepSeek. Isso também certamente teria cache de forma parecida e, se isso for importante, se comunica diretamente com api.deepseek.com, além de oferecer um ambiente de execução muito mais maduro
- Parece melhor linkar esta página: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
  Ela explica por que consideram isso uma solução melhor e por que têm uma filosofia de design tão forte
  “O cache automático de prefixo só é ativado quando há correspondência exata do prefixo em bytes da solicitação anterior. A maioria dos loops de agentes reordena, reescreve ou injeta novos timestamps a cada turno — na prática, a taxa de acerto de cache fica abaixo de 20%”
  Então a ideia é otimizar isso e outras técnicas para aumentar a taxa de acerto do cache e reduzir custos
- O Opencode tem um problema bem sério de estabilidade de cache, e agora não parece haver muita vontade de corrigir isso
- Pensei exatamente a mesma coisa, e quando fui ver o código do provedor DeepSeek do agente de código que eu uso, quase tudo que o autor descreveu já estava implementado
  Para quem tiver curiosidade: http://github.com/tontinton/maki
- Se você “fez uma pequena ponte para usar o DeepSeek V4 Pro no Codex”, queria saber se poderia compartilhar essa ponte
  O DeepSeek v4 é excelente quando usado com claude-code ou opencode. No meu caso, o claude code saiu mais barato que o opencode, provavelmente por causa de um ambiente de execução melhor projetado
- Isso parece se conectar nativamente ao terminal. Ou seja, parece uma estrutura sem app separado para executar ou encapsular o agente dentro de uma TUI
  No fim, imagino que seja uma forma de inserir frases normais em inglês em vez de comandos
Este site parece ter sido feito pelo Codex. Pedi ao Codex para criar um HTML de visão geral de recursos para a equipe, e ele gerou um monstro exageradamente enfeitado, com grandes caixas de estatísticas quase sem informação útil, e tudo era muito parecido: a mesma fonte, cores, layout e até a seção hero
Também ficou horrível no mobile, como este site. No fim, pedi ao Claude para fazer um arquivo HTML de uma página só, e algo como 95% já estava pronto para uso imediato para comunicar claramente a intenção, exigindo só alguns ajustes
- Muito design baseado em LLM hoje em dia acaba parecendo assim. Não entendo por que as pessoas não acham feias essas combinações de fontes serifadas fortemente inclinadas
  No mobile, os exemplos de código continuam empurrando o conteúdo para fora, então fica difícil até ler a maior parte da página. Claro, talvez isso seja crítico demais e a intenção fosse boa, mas um site mais simples teria sido suficiente
- Só dizer que “o Claude fez um arquivo HTML de uma página e 95% já podia ser usado” não diz muita coisa sobre modelo nenhum
  Afinal, como qualquer engenheiro de software sabe, tirar funcionalidades pode simplificar drasticamente qualquer projeto
O que eu gostaria que o autor entendesse é que algumas pessoas querem um binário único e autocontido que não consuma metade da memória do computador, e por isso preferem escrever em Rust ou Go
- É realmente ótimo ver tanto software novo sendo feito em Rust, Go e Zig
  O valor e a conveniência de desenvolvimento que linguagens interpretadas lentas ofereciam estão desaparecendo aos poucos. As linguagens novas já vêm com muitas coisas boas por padrão, ou, para ser mais preciso, talvez os alertas de plantão às 1 da manhã tenham começado a nos irritar demais
- Mesmo considerando o uso de IA e todas essas alegações, por exemplo, queria saber se alguém consegue explicar por que não daria para ter um agente de código em Go puro
  O Go já tem muitas bibliotecas boas para terminal
- Se quiser testar um binário único e autocontido que consome mais da metade da memória do computador, também existe o ds4-agent
- Especialmente se você quer isso na era dos agentes de código, minha impressão é que bastaria fazer você mesmo
- Criar um bot de programação enquanto se economiza programação parece dizer alguma coisa
Não gosto daquela página. Por causa da animação de digitação, o tamanho da área de exemplo muda o tempo todo, e o conteúdo abaixo fica sendo empurrado para cima e para baixo
É uma experiência de usuário realmente ruim
- Com ou sem agente, as pessoas ainda precisam testar sites em várias resoluções ou pelo menos em diferentes larguras de janela
  Mas isso parece estar se tornando uma habilidade perdida
- Parece lixo de IA de design feito pelo Claude
Do ponto de vista de alguém que vem construindo ambientes de execução há 1 ano, o pessoal do opencode não quebra o cache de prefixo por burrice
Normalmente fazem isso de propósito, porque nos testes o resultado geral é melhor
Se você acha que o dsv4 se comporta de forma suficientemente diferente da média dos outros modelos, com base nisso envie um PR para o ambiente de execução que você quer com tratamento especial para esse caso. Assumir cegamente que “por causa do cache sempre tem que ser append-only” é desperdiçar o tempo de todo mundo
Como este não é um agente feito pela DeepSeek, o título é enganoso
Agora a marca DeepSeek ficou forte o bastante para que as pessoas queiram pegar carona nesse reconhecimento de marca
Bem interessante. Sou assinante do Claude de 200 dólares por mês, e até agora quase não precisei usar outra coisa
Mas, à medida que o Claude vai limitando cada vez mais meu fluxo de trabalho, especialmente depois das mudanças recentes no uso de IDE/-p, tenho vontade de migrar para outro lugar
Quero muito raciocínio de ponta, então isso me preocupa, mas ainda assim continuo interessado no DeepSeek
- Se você quer raciocínio de ponta, vale a pena testar outros modelos e ver por conta própria quanto eles diferem dos modelos de topo
  Eu fiz isso e percebi que só o Qwen-2.5-Max já basta. Para os trabalhos de brinquedo com que eu mexo, acho que até o Claude Sonnet 3.5 seria suficiente. Não estou tentando ganhar uma medalha Fields de matemática
- Hoje dei uma tarefa de engenharia reversa bastante complexa para o DS-4 xhigh e para o GPT-5.5 xhigh
  Cerca de 6 horas depois, os dois falharam em concluir a engenharia reversa completa, mas a diferença foi grande
  O DS parava a cada 30 minutos dizendo que tinha terminado a engenharia reversa completa e que agora tudo deveria funcionar, mas na prática não tinha concluído nem 1%. Mesmo com instruções fortes para não usar certos atalhos, ele continuava procurando atalhos, e foi um fracasso total
  Já o GPT-5.5 foi realmente impressionante. Ele fez de fato o que precisava ser feito e não passou para a próxima etapa antes de concluir as camadas iniciais e ter certeza de que entendia completamente o que era necessário. Durante 6 horas, eu só inseri prompts quando vi que ele estava indo na direção certa e o orientei levemente para uma abordagem um pouco melhor. Não parecia que eu estava brigando com ele
  Claro, depois da compressão às vezes ele soltava algo como “não posso ajudar com engenharia reversa”, mas numa sessão nova isso foi resolvido de forma limpa
  Cancelei minha assinatura do Claude há um mês, então não posso comparar, mas o DeepSeek me lembrou bastante a sensação de trabalhar com o Opus 4.6/4.7. Para algumas pessoas isso pode ser um sinal positivo, mas ao ver o GPT-5.5 fica claro como o estilo de trabalho Claude/DS é irritante demais
- É melhor manter o plano de 200 dólares por mês e não tentar o plano de programação de 10 dólares com modelos open weight e limites mais altos
  A Anthropic precisa do seu dinheiro para sobreviver, e assim você vai dormir melhor achando que está usando o estado da arte
- Em vez de abandonar completamente os modelos da Anthropic, outra opção é usá-los para certas tarefas, como planejamento, e deixar a implementação para algo como o DeepSeek
  Mesmo com ferramentas diferentes, um plano em Markdown funciona muito bem. Se eu baixar da assinatura 5x Max para a Pro, pretendo fazer isso
  Também estou criando um launcher que facilita usar provedores de terceiros no Claude Code: https://ccode.kronis.dev
  O proxy local já funciona; só ainda não há troca dinâmica de modelo. Não parece difícil de adicionar e, dependendo da agenda, deve entrar em 1 ou 2 semanas
  Não acho sensato abandonar totalmente a Anthropic. Os modelos são excelentes e, com a assinatura, você ainda ganha recursos que eu gosto, como o Remote Control. Mas parece possível mudar de tier e economizar um pouco. Por outro lado, é preciso manter uma linha de base de qualidade. Quando usei o GLM 4.6 na Cerebras no passado, havia bastante resultado meia-boca
- Se você quer raciocínio de ponta, precisa usar o GPT 5.5 Pro
Gostei do foco na eficiência de acerto de cache. Parabéns à equipe do DeepSeek por fazer um ótimo produto que maximiza a eficiência de custo para o usuário
- Usei por um tempo e concordo totalmente. Acho tão bom quanto o Codex ou o Claude que uso em paralelo
  Em faixas sensíveis a custo, ele é o vencedor, e se alguma startup empacotar isso direito pensando em retenção de dados, pode virar um excelente produto vendável para empresas. Porque, no caso de assistentes de programação, as questões centrais são retenção de dados e privacidade
- Para evitar confusão, este projeto é um side project de alguém
  “Projeto open source independente · sem afiliação com a DeepSeek”
- Somando com o custo já baixo da API, provavelmente daria para deixar a mesma tarefa rodando por dias
- Não entendo como essa eficiência de acerto de cache seria possível. Não é só uma questão de não alterar o contexto anterior?
  Não entendo quais seriam as alavancas que dá para ajustar aqui
Testei e a área de entrada de texto estava com fundo preto e fonte escura
Consultei a documentação e pedi ajuda sobre fonte/estilo ao DeepSeek v4, Claude e Gemini, mas nada funcionou, a não ser executar isso em um terminal com tema escuro. É loucura. Nenhum desenvolvedor desse projeto usa tema claro?
- Concordo que é um problema, mas provavelmente na prática quase ninguém usa mesmo
  Tema claro é bem raro

DeepSeek Reasonix - agente de programação nativo do DeepSeek com alto cache e baixo custo

Leituras relacionadas

2 comentários

Comentários do Hacker News