OpenDocuments – plataforma RAG open source para pesquisar documentos dispersos da organização em linguagem natural
(github.com/joungminsung)É uma plataforma RAG self-hosted criada para resolver o problema de documentos de equipe espalhados por GitHub, Notion, Drive, Confluence etc., que são difíceis de encontrar.
Ao conectar as fontes de documentos, ela faz parsing/chunking/embedding para indexação e, quando você faz perguntas em linguagem natural, responde com as respectivas fontes.
- Conectores: GitHub, Notion, GDrive, S3, Confluence, Swagger, crawler web, busca web Tavily
- Formatos de arquivo: 12 tipos, incluindo PDF, DOCX, XLSX, HTML, Jupyter, código-fonte e e-mail
- LLM: pode rodar localmente com Ollama (sem vazamento de dados). Também suporta OpenAI/Claude/Gemini/Grok
- Busca: híbrida de vetores + palavras-chave, reranking, proteção contra alucinação
- Busca cruzada coreano-inglês
- Integração com Claude Code/Cursor via servidor MCP
- Web UI, 17 comandos de CLI, SDK em TypeScript
- Sistema de plugins (parser/conector/modelo/middleware)
- Suporte a deploy com Docker
Stack: TypeScript, Hono, React, SQLite, LanceDB, Turborepo
51 suítes de teste / ~300 testes
Licença MIT.
3 comentários
Gostaria de informar a atualização v0.2.0.
O foco principal desta versão é remover barreiras de instalação e melhorar a usabilidade no mundo real.
Integração com Ollama em um toque - detecta automaticamente se está instalado → se não estiver, faz a instalação automática conforme o sistema operacional → e até faz o pulling automático do modelo de embeddings, tudo de uma vez. Com uma única linha,
docker compose up, toda a stack sobe, incluindo o LLM local.Conversas multi-turno - nas versões anteriores, só era possível fazer consultas isoladas; agora é possível manter o contexto em conversas contínuas.
Mais de 10 patches de segurança - corrigimos de uma só vez problemas identificados por feedback da comunidade + auditoria interna, como injeção de SQL no FTS5, path traversal, ataque de fixação de estado no OAuth, ReDoS e outros.
Além disso: carregamento automático de
.env, 3 tentativas automáticas em caso de falha na conexão com o modelo + mensagens de erro detalhadas, expansão completa da documentação da API de plugins.Notas da versão: https://github.com/joungminsung/OpenDocuments/releases/
Se houver algum
errorem uso ou qualquer inconveniente, agradecemos se vocês abrirem uma issue no GitHub.Responderemos assim que ela for enviada
A publicação do pacote npm havia sido omitida. Pedimos desculpas a quem não conseguiu instalar após clonar. Agora a publicação foi concluída normalmente, então agradecemos se puderem tentar novamente com o comando atualizado no Readme.