16 pontos por GN⁺ 2025-03-12 | 4 comentários | Compartilhar no WhatsApp
  • Ferramenta de pesquisa poderosa com IA, que realiza análises iterativas profundas usando vários LLMs e busca na web
    • Integra recursos de busca do arXiv, Wikipedia, Google, PubMed, DuckDuckGo, SerpAPI, RAG local, The Guardian e outros
  • Pode ser executada localmente para reforçar a privacidade ou configurada com LLMs baseados em nuvem para melhorar o desempenho

Recursos avançados de pesquisa

  • Pesquisa profunda automatizada: geração inteligente de perguntas de acompanhamento
  • Rastreamento e verificação de fontes: rastreamento automático de citações e fontes
  • Análise iterativa: cobertura abrangente com análise iterativa em múltiplas etapas
  • Análise do conteúdo completo de páginas web: análise baseada no conteúdo integral, não apenas em snippets

Suporte flexível a LLMs

  • Suporte a modelos locais: processamento local de IA com base em Ollama
  • Suporte a modelos em nuvem: suporte a LLMs em nuvem como Claude e GPT
  • Compatibilidade com modelos Langchain: suporte a diversos modelos do Langchain
  • Seleção de modelo: امکان configurar o modelo conforme desempenho, velocidade de resposta etc.

Opções ricas de saída

  • Resultados detalhados de pesquisa: fornece relatórios detalhados com citações
  • Relatório de pesquisa abrangente: entrega resultados de pesquisa completos
  • Resumo rápido: permite resumir os pontos principais
  • Rastreamento e verificação de fontes: suporte a rastreamento e verificação de fontes

Design centrado em privacidade

  • Execução local disponível: ao usar modelos locais, todos os dados permanecem no dispositivo do usuário
  • Configuração de busca ajustável: reforça a proteção da privacidade
  • Processamento de dados transparente: divulga claramente como os dados são processados

Integração de busca aprimorada

  • Seleção automática do mecanismo de busca: escolhe automaticamente o mecanismo conforme o conteúdo da consulta
  • Integração com Wikipedia: busca confiável de fatos
  • Integração com arXiv: busca de artigos científicos e pesquisas acadêmicas
  • Integração com PubMed: busca de materiais de pesquisa médica e biomédica
  • Integração com DuckDuckGo: busca geral na web (pode haver limitação de taxa)
  • Integração com SerpAPI: fornece resultados de busca do Google (requer chave de API)
  • Google Programmable Search: configuração de busca personalizada (requer chave de API)
  • Integração com The Guardian: busca de notícias e conteúdo jornalístico (requer chave de API)
  • Busca RAG local: permite pesquisar documentos pessoais (usando embeddings vetoriais)
  • Busca no conteúdo completo de páginas web: permite pesquisar todo o conteúdo da página
  • Filtragem e verificação de fontes: permite filtrar por fontes confiáveis
  • Configuração de parâmetros de busca: permite definir escopo, período etc.

Busca de documentos locais (RAG)

  • Busca baseada em embeddings vetoriais: permite pesquisar conteúdo em documentos pessoais
  • Criação de coleções de documentos personalizadas: permite agrupar documentos por tema
  • Proteção de privacidade: todos os documentos são processados localmente
  • Chunking e busca inteligentes: faz chunking e busca do conteúdo dos documentos
  • Compatibilidade com vários formatos de documento: suporta PDF, texto, Markdown etc.
  • Aplicação automática de metabusca integrada: permite integrar buscas locais e na web

Interface web

  • Painel disponível: interface intuitiva
  • Atualizações de progresso em tempo real: mostra o andamento da pesquisa em tempo real
  • Gerenciamento do histórico de pesquisa: permite acessar e gerenciar pesquisas anteriores
  • Exportação de relatório em PDF: permite baixar relatórios de pesquisa em PDF
  • Gerenciamento de pesquisa: permite interromper ou excluir pesquisas em andamento

Opções de mecanismos de busca suportados

  • Auto: seleção automática do mecanismo conforme a consulta
  • Wikipedia: ideal para informações gerais e busca de fatos
  • arXiv: ideal para busca de artigos científicos e acadêmicos
  • PubMed: ideal para pesquisa biomédica e médica
  • DuckDuckGo: busca geral na web com foco em privacidade
  • The Guardian: busca de notícias e jornalismo (requer chave de API)
  • SerpAPI: fornece resultados de busca do Google (requer chave de API)
  • Google Programmable Search: busca personalizada (requer chave de API)

4 comentários

 
zxshinxz 2025-03-13
  • Como alguém que trabalha na área de ciências da vida, gostaria de compartilhar brevemente os resultados do uso.

> O modo de pesquisa é oferecido em 2 opções.

  1. Quick summary
  • O tempo necessário é de cerca de 5~6 minutos (com base em 4070 ti super, 16GB, Mistral e Gemma 3:12b)
  • Há alucinações, então ele gera as próprias referências, mas as refs com links no documento parecem ter fontes bem definidas.
  • Existe uma intenção de responder às perguntas com foco em novas tecnologias. Em especial, ele tenta relacionar tudo com IA.
  1. Detailed Report
  • O tempo necessário é de cerca de 1 hora (4070 ti super 16GB, Gemma 3:12b)
  • É como se gerasse um único artigo de revisão. Porém, há o problema de a quantidade de referências cair bastante. Mesmo que o conteúdo esteja correto, fica difícil sustentá-lo sem evidências, então ainda precisa de alguma melhoria. (Parece que ele faz um processo de refinamento para melhorar a qualidade do texto, e nesse processo os links de Ref acabam se perdendo.)
  • Ainda assim, ele claramente fornece conteúdo de qualidade superior ao Quick summary.

No arquivo de configuração, é possível ajustar várias opções. Dá para limitar o banco de dados de busca apenas ao PubMed, elevando ainda mais a qualidade do material. Também é possível configurar quantos textos serão pesquisados de uma vez e quantos chunks serão criados ao usar RAG.

Considerando que ainda está na versão 0.01V, é muito impressionante que uma máquina local consiga gerar relatórios nesse nível. Especialmente na área de ciências biológicas, chatbots costumam usar descrições generalizadas, mas os relatórios gerados por esse programa usam uma redação extremamente científica.

No momento, esse programa não oferece suporte a coreano. Mesmo fazendo perguntas em coreano, o relatório é gerado em inglês.
Além disso, ao receber a resposta em PDF por meio da exportação para PDF, há o problema de o coreano não aparecer.

Se forem resolvidos apenas o problema de as refs desaparecerem durante a geração do relatório e o problema das alucinações, acho que será uma ferramenta realmente poderosa.

 
zxshinxz 2025-03-14

Depois de usar mais, parece que no Ollama, entre vários modelos, o Qwen2.5 é o que funciona melhor. O Deepseek-r1 cria consultas estranhas na hora de fazer Search, então acaba trazendo conteúdo-base errado, e os modelos da linha Gemma interpretam o prompt dado como exemplo como se fosse o prompt real e tentam enfiar à força conteúdo de tópicos relacionados.

 
GN⁺ 2025-03-12
Opiniões no Hacker News
  • Aplausos pelo esforço em prol de um espaço local e low-fi. Mas, ao ler os exemplos do documento, o resultado parece um pouco confuso

    • Acho que falta uma ou mais etapas intermediárias. Por exemplo, usando um banco de dados em grafo, o LLM poderia armazenar informações, verificar interconectividade e fazer perguntas a si mesmo para gerar o relatório final
    • O relatório final poderia ser um arquivo HTML interativo que o usuário pudesse consultar ou editar diretamente
    • Existe uma ferramenta semelhante de deep research open source chamada Onyx, e o UI/UX parece melhor. O autor poderia considerar portar essa ferramenta para local
    • Não é que este projeto seja ruim, mas me preocupa que muitos projetos abertos de deep research desapareçam. Seria melhor colaborar focando nas partes que mais interessam às pessoas
  • Este projeto é muito legal

    • Se você quiser adicionar embeddings tendo a internet como fonte, recomendo experimentar o exa.ai. Inclui Wikipedia, milhares de feeds de notícias, Github e mais de 70 milhões de artigos
    • Observação: sou um dos fundadores
  • Tentei usar, mas ocorreram muitos erros e não consegui gerar um relatório. Não há como retomar quando a geração falha, então, se uma chamada de API falhar, é preciso recomeçar do zero

  • Considere também as APIs da Kagi e da Tavily para busca na web

  • Parece muito legal. Fico curioso sobre como isso se compara ao recurso de RAG do open-webui

    • Há métodos de busca na web e embeddings de documentos, mas os resultados são fracos porque os detalhes se perdem nos embeddings. Fico pensando se este método seria melhor
  • Fico curioso se alguém está usando LLMs (locais) para pesquisar diretamente materiais em um acervo, sem depender de busca vetorial

  • Bom trabalho

    • Recentemente, venho pensando que uma coleção local pré-processada, com informações estruturadas e curadas para RAG, poderia ser um bom complemento para essa abordagem dinâmica de busca
    • Vi que foi usado LangChain; talvez valha a pena dar uma olhada no txtai
  • Fico pensando se existe uma ferramenta que ofereça uma experiência de busca com IA e misture o conteúdo dos favoritos para gerar um relatório. No momento, meus favoritos estão inúteis. Isso poderia torná-los úteis

    • Atualmente, um modo de falha frequente no deep research da OpenAI é buscar respostas em fontes de baixa autoridade e fornecer referências como se fossem periódicos científicos. Essas fontes quase não contêm conteúdo valioso e, mesmo que outras fontes sejam de alta qualidade, uma fonte ruim estraga tudo
    • Dar ênfase ao conteúdo que você já curou (favoritos) pode melhorar bastante a relação sinal-ruído (SNR)
  • Acho que quem criar uma GUI tipo jogo 3D para LLMs será o próximo Jobs/Gates/Musk e vencedor do Nobel. Isso permitirá que milhões de pessoas vejam o interior dos LLMs e resolvam o problema de alinhamento. Os computadores só se popularizaram depois que surgiram sistemas operacionais com GUI, e os chatbots atuais são parecidos com linha de comando. Comecei um ASK HN para compartilhar ideias sobre segurança em IA

 
zhniee 2025-03-13

Não entendi. Nem de longe tem nível acadêmico, e nem chega ao nível de programação de uma criança do ensino fundamental — por que compartilhar isso...