Local Deep Research - executando seu próprio assistente de pesquisa localmente

(github.com/LearningCircuit)

16 pontos por GN⁺ 2025-03-12 | 4 comentários | Compartilhar no WhatsApp

Ferramenta de pesquisa poderosa com IA, que realiza análises iterativas profundas usando vários LLMs e busca na web
- Integra recursos de busca do arXiv, Wikipedia, Google, PubMed, DuckDuckGo, SerpAPI, RAG local, The Guardian e outros
Pode ser executada localmente para reforçar a privacidade ou configurada com LLMs baseados em nuvem para melhorar o desempenho

Recursos avançados de pesquisa

Pesquisa profunda automatizada: geração inteligente de perguntas de acompanhamento
Rastreamento e verificação de fontes: rastreamento automático de citações e fontes
Análise iterativa: cobertura abrangente com análise iterativa em múltiplas etapas
Análise do conteúdo completo de páginas web: análise baseada no conteúdo integral, não apenas em snippets

Suporte flexível a LLMs

Suporte a modelos locais: processamento local de IA com base em Ollama
Suporte a modelos em nuvem: suporte a LLMs em nuvem como Claude e GPT
Compatibilidade com modelos Langchain: suporte a diversos modelos do Langchain
Seleção de modelo: امکان configurar o modelo conforme desempenho, velocidade de resposta etc.

Opções ricas de saída

Resultados detalhados de pesquisa: fornece relatórios detalhados com citações
Relatório de pesquisa abrangente: entrega resultados de pesquisa completos
Resumo rápido: permite resumir os pontos principais
Rastreamento e verificação de fontes: suporte a rastreamento e verificação de fontes

Design centrado em privacidade

Execução local disponível: ao usar modelos locais, todos os dados permanecem no dispositivo do usuário
Configuração de busca ajustável: reforça a proteção da privacidade
Processamento de dados transparente: divulga claramente como os dados são processados

Integração de busca aprimorada

Seleção automática do mecanismo de busca: escolhe automaticamente o mecanismo conforme o conteúdo da consulta
Integração com Wikipedia: busca confiável de fatos
Integração com arXiv: busca de artigos científicos e pesquisas acadêmicas
Integração com PubMed: busca de materiais de pesquisa médica e biomédica
Integração com DuckDuckGo: busca geral na web (pode haver limitação de taxa)
Integração com SerpAPI: fornece resultados de busca do Google (requer chave de API)
Google Programmable Search: configuração de busca personalizada (requer chave de API)
Integração com The Guardian: busca de notícias e conteúdo jornalístico (requer chave de API)
Busca RAG local: permite pesquisar documentos pessoais (usando embeddings vetoriais)
Busca no conteúdo completo de páginas web: permite pesquisar todo o conteúdo da página
Filtragem e verificação de fontes: permite filtrar por fontes confiáveis
Configuração de parâmetros de busca: permite definir escopo, período etc.

Busca de documentos locais (RAG)

Busca baseada em embeddings vetoriais: permite pesquisar conteúdo em documentos pessoais
Criação de coleções de documentos personalizadas: permite agrupar documentos por tema
Proteção de privacidade: todos os documentos são processados localmente
Chunking e busca inteligentes: faz chunking e busca do conteúdo dos documentos
Compatibilidade com vários formatos de documento: suporta PDF, texto, Markdown etc.
Aplicação automática de metabusca integrada: permite integrar buscas locais e na web

Interface web

Painel disponível: interface intuitiva
Atualizações de progresso em tempo real: mostra o andamento da pesquisa em tempo real
Gerenciamento do histórico de pesquisa: permite acessar e gerenciar pesquisas anteriores
Exportação de relatório em PDF: permite baixar relatórios de pesquisa em PDF
Gerenciamento de pesquisa: permite interromper ou excluir pesquisas em andamento

Opções de mecanismos de busca suportados

Auto: seleção automática do mecanismo conforme a consulta
Wikipedia: ideal para informações gerais e busca de fatos
arXiv: ideal para busca de artigos científicos e acadêmicos
PubMed: ideal para pesquisa biomédica e médica
DuckDuckGo: busca geral na web com foco em privacidade
The Guardian: busca de notícias e jornalismo (requer chave de API)
SerpAPI: fornece resultados de busca do Google (requer chave de API)
Google Programmable Search: busca personalizada (requer chave de API)

4 comentários

zxshinxz 2025-03-13

Como alguém que trabalha na área de ciências da vida, gostaria de compartilhar brevemente os resultados do uso.

O modo de pesquisa é oferecido em 2 opções.

Quick summary

O tempo necessário é de cerca de 5~6 minutos (com base em 4070 ti super, 16GB, Mistral e Gemma 3:12b)
Há alucinações, então ele gera as próprias referências, mas as refs com links no documento parecem ter fontes bem definidas.
Existe uma intenção de responder às perguntas com foco em novas tecnologias. Em especial, ele tenta relacionar tudo com IA.

Detailed Report

O tempo necessário é de cerca de 1 hora (4070 ti super 16GB, Gemma 3:12b)
É como se gerasse um único artigo de revisão. Porém, há o problema de a quantidade de referências cair bastante. Mesmo que o conteúdo esteja correto, fica difícil sustentá-lo sem evidências, então ainda precisa de alguma melhoria. (Parece que ele faz um processo de refinamento para melhorar a qualidade do texto, e nesse processo os links de Ref acabam se perdendo.)
Ainda assim, ele claramente fornece conteúdo de qualidade superior ao Quick summary.

No arquivo de configuração, é possível ajustar várias opções. Dá para limitar o banco de dados de busca apenas ao PubMed, elevando ainda mais a qualidade do material. Também é possível configurar quantos textos serão pesquisados de uma vez e quantos chunks serão criados ao usar RAG.

Considerando que ainda está na versão 0.01V, é muito impressionante que uma máquina local consiga gerar relatórios nesse nível. Especialmente na área de ciências biológicas, chatbots costumam usar descrições generalizadas, mas os relatórios gerados por esse programa usam uma redação extremamente científica.

No momento, esse programa não oferece suporte a coreano. Mesmo fazendo perguntas em coreano, o relatório é gerado em inglês.
Além disso, ao receber a resposta em PDF por meio da exportação para PDF, há o problema de o coreano não aparecer.

Se forem resolvidos apenas o problema de as refs desaparecerem durante a geração do relatório e o problema das alucinações, acho que será uma ferramenta realmente poderosa.

zxshinxz 2025-03-14

Depois de usar mais, parece que no Ollama, entre vários modelos, o Qwen2.5 é o que funciona melhor. O Deepseek-r1 cria consultas estranhas na hora de fazer Search, então acaba trazendo conteúdo-base errado, e os modelos da linha Gemma interpretam o prompt dado como exemplo como se fosse o prompt real e tentam enfiar à força conteúdo de tópicos relacionados.

GN⁺ 2025-03-12

Opiniões no Hacker News

Aplausos pelo esforço em prol de um espaço local e low-fi. Mas, ao ler os exemplos do documento, o resultado parece um pouco confuso
- Acho que falta uma ou mais etapas intermediárias. Por exemplo, usando um banco de dados em grafo, o LLM poderia armazenar informações, verificar interconectividade e fazer perguntas a si mesmo para gerar o relatório final
- O relatório final poderia ser um arquivo HTML interativo que o usuário pudesse consultar ou editar diretamente
- Existe uma ferramenta semelhante de deep research open source chamada Onyx, e o UI/UX parece melhor. O autor poderia considerar portar essa ferramenta para local
- Não é que este projeto seja ruim, mas me preocupa que muitos projetos abertos de deep research desapareçam. Seria melhor colaborar focando nas partes que mais interessam às pessoas
Este projeto é muito legal
- Se você quiser adicionar embeddings tendo a internet como fonte, recomendo experimentar o exa.ai. Inclui Wikipedia, milhares de feeds de notícias, Github e mais de 70 milhões de artigos
- Observação: sou um dos fundadores
Tentei usar, mas ocorreram muitos erros e não consegui gerar um relatório. Não há como retomar quando a geração falha, então, se uma chamada de API falhar, é preciso recomeçar do zero
Considere também as APIs da Kagi e da Tavily para busca na web
Parece muito legal. Fico curioso sobre como isso se compara ao recurso de RAG do open-webui
- Há métodos de busca na web e embeddings de documentos, mas os resultados são fracos porque os detalhes se perdem nos embeddings. Fico pensando se este método seria melhor
Fico curioso se alguém está usando LLMs (locais) para pesquisar diretamente materiais em um acervo, sem depender de busca vetorial
Bom trabalho
- Recentemente, venho pensando que uma coleção local pré-processada, com informações estruturadas e curadas para RAG, poderia ser um bom complemento para essa abordagem dinâmica de busca
- Vi que foi usado LangChain; talvez valha a pena dar uma olhada no txtai
Fico pensando se existe uma ferramenta que ofereça uma experiência de busca com IA e misture o conteúdo dos favoritos para gerar um relatório. No momento, meus favoritos estão inúteis. Isso poderia torná-los úteis
- Atualmente, um modo de falha frequente no deep research da OpenAI é buscar respostas em fontes de baixa autoridade e fornecer referências como se fossem periódicos científicos. Essas fontes quase não contêm conteúdo valioso e, mesmo que outras fontes sejam de alta qualidade, uma fonte ruim estraga tudo
- Dar ênfase ao conteúdo que você já curou (favoritos) pode melhorar bastante a relação sinal-ruído (SNR)
Acho que quem criar uma GUI tipo jogo 3D para LLMs será o próximo Jobs/Gates/Musk e vencedor do Nobel. Isso permitirá que milhões de pessoas vejam o interior dos LLMs e resolvam o problema de alinhamento. Os computadores só se popularizaram depois que surgiram sistemas operacionais com GUI, e os chatbots atuais são parecidos com linha de comando. Comecei um ASK HN para compartilhar ideias sobre segurança em IA

zhniee 2025-03-13

Não entendi. Nem de longe tem nível acadêmico, e nem chega ao nível de programação de uma criança do ensino fundamental — por que compartilhar isso...