Nxtscape - navegador agente de código aberto

(github.com/nxtscape)

6 pontos por GN⁺ 2025-06-21 | 1 comentários | Compartilhar no WhatsApp

Navegador de código aberto com recursos de agente baseados em IA
Prioriza a privacidade do usuário e oferece a vantagem de proteção de dados ao executar modelos de IA localmente
Destaca como principais vantagens a compatibilidade com extensões do Chrome e uma política transparente de código aberto
Em comparação com alternativas existentes como Arc, Dia, Perplexity Comet, diferencia-se pelo processamento local e pelo controle dos dados pelo usuário
Busca expandir continuamente os recursos e evoluir com base na comunidade, apoiando diversas formas de contribuição

O que é o Nxtscape

Nxtscape é um navegador agente de código aberto que executa recursos de IA em ambiente local
É uma alternativa a navegadores como Arc, Dia e Perplexity Comet, sendo uma boa opção para quem quer privacidade e controle sobre os próprios dados
O usuário pode usar sua própria chave de API ou integrar modelos locais como o Ollama, evitando que informações como o histórico de navegação vazem para fora

Principais recursos

Compatibilidade total com extensões do Chrome, permitindo manter o ambiente já familiar
O agente de IA funciona diretamente no navegador, sem passar pela nuvem
O usuário pode inserir sua própria chave de API ou optar por integrar um modelo local, garantindo alto nível de proteção de dados
O desenvolvimento é open source e guiado pela comunidade, garantindo transparência no código
No futuro, estão previstos vários recursos adicionais, como MCP Store e bloqueio de anúncios com IA

Demo e exemplos de uso

Oferece cenários de automação com agentes de IA
Integra recurso de chat com IA local, permitindo receber ajuda em formato conversacional
Demonstra várias possibilidades de automação de trabalho em integração com ferramentas de produtividade

Contexto de desenvolvimento

Parte da percepção de que a tecnologia dos navegadores ficou estagnada por muito tempo
O objetivo é construir um ambiente baseado em agentes de IA que aumente drasticamente a produtividade dos desenvolvedores
Ao automatizar tarefas repetitivas simples, por exemplo solicitações como "pedir Tide Pods no histórico de pedidos da Amazon", o navegador deve ajudar o usuário em vez de fazê-lo 'competir' com ele
Apresenta o princípio firme de que os agentes de IA devem funcionar com segurança em ambiente local

Comparação com os principais navegadores

Chrome: embora seja baseado no Chromium de código aberto, nos últimos 10 anos pouco avançou na adoção de recursos inovadores como IA, automação e MCP (Multi Capability Plug-in)
Brave: ampliou sua direção com criptomoedas, busca e VPN, mas o Nxtscape se concentra em ser centrado em IA
Arc/Dia: foram populares, mas são de código fechado e, se o serviço for encerrado, faltam alternativas. O Nxtscape é totalmente de código aberto
Perplexity Comet: como empresa de busca/publicidade, há o problema de dados como o histórico do navegador passarem a pertencer à empresa. O Nxtscape mantém todo o histórico do usuário restrito ao local

Participação da comunidade e contribuição

É possível contribuir de várias formas, como relatar bugs, sugerir recursos, participar do Discord e seguir no Twitter

Licença e referências técnicas

O código-fonte é disponibilizado sob a licença AGPL-3.0
Foi criado com inspiração em projetos de código aberto como Chromium, browser-use, Stagehand e Nanobrowser

1 comentários

GN⁺ 2025-06-21

Comentários no Hacker News

Acho que, pelos comentários até agora, a sensação é de que estão focando mais em detalhes do que na visão geral. Pessoalmente, imagino um valor enorme em um navegador que se conecte a LLMs locais, salve tudo o que o navegador vê em um banco de dados local com timestamp, faça parsing/resumo automático do que eu interajo, possa ser automatizado por scripts como o Puppeteer e suporte automações baseadas em prompts de código. Como meu próprio assistente digital, ele poderia me ajudar a encontrar facilmente informações esquecidas ou coisas de que eu preciso, filtrar ativamente busca, anúncios, spam e informações indesejadas, e até executar automaticamente tarefas na internet que eu quiser. Depois de 25 anos acumulando bookmarks, só bookmarks já não bastam mais. A situação de se perder tentando achar uma única informação em sites cheios de tranqueira poderia melhorar se um bot guarda-costas filtrasse o ruído e as inutilidades. Se isso realmente funcionar bem, poderia assumir de uma vez vários papéis no espaço digital — assistente pessoal, gerente de turnê, porteiro, governanta, mecânico — e, em 2025, quando o navegador virou o principal portal para a internet caótica, essa direção não parece uma má ideia. No fim, tudo depende da execução, mas estou muito curioso para ver como esse projeto evolui
- Muito obrigado pelo feedback sincero. Essa é exatamente a visão que tínhamos. Mesmo passando mais de 90% do dia no navegador, ele ainda é só uma “janela burra”. Se ele pudesse lembrar o histórico de navegação, recortar artigos importantes e salvar destaques como o Evernote web clipper, e tornar tudo pesquisável por significado, isso mudaria a vida. Todos os dados ficam salvos em um PostgresDB local, e perguntas como “qual era mesmo aquela comparação de preços do mês passado?” ou “encontre o destaque da automação do navegador” poderiam ser respondidas na hora. Também incluímos funções para bloquear sites que distraem quando você precisa se concentrar. Para além de buscar e lembrar, é a era em que o navegador realmente ajuda no meu trabalho. Por exemplo: agrupar abas automaticamente por tema, comparar preços de HDs por site, resumir posts novos em um servidor do Discord — tudo processado localmente. O navegador deveria nos ajudar no caos da internet, não torná-la ainda mais complicada. Em especial, eu adoraria ouvir quais workflows do dia a dia são mais incômodos para você e quaisquer casos de uso
- Na prática, isso é quase igual ao que a Microsoft queria fazer com o Recall. Eu estava animado porque o Recall parecia ser a única coisa na onda da IA que realmente melhoraria minha vida, mas, pensando bem, o que eu realmente quero não é IA, e sim que meu computador tenha um registro detalhado localmente e forneça busca avançada. Quero que ele se lembre incondicionalmente de tudo que fiz no computador. Os sites que visitei, quanto rolei em cada página, até pensamentos que digitei e apaguei — preciso de uma função de “total recall” que guarde tudo isso. O motivo é simples: meu cérebro falha na memória o tempo todo, então espero uma memória mais perfeita do computador. E quero que a busca funcione sempre de forma consistente e determinística. Precisa ter timestamps exatos, operadores booleanos, e NLP o Lucene já faz bem há 20 anos. Não preciso de resumos gerados automaticamente a partir de corpus externos; só quero que meu computador se lembre direito do que eu fiz nele. Não acho que LLMs agreguem muito valor à busca pessoal. Pela própria natureza dos LLMs, é difícil recuperar os dados reais com precisão, e no fim a busca só fica exata se for indexada do jeito tradicional. Acho que o motivo de LLMs estarem na moda agora é que ainda faltam boas formas de indexar “tudo” com eficiência e, na verdade, no caso de busca personalizada, não é preciso “tudo”: basta saber o texto exibido na minha tela e metadados como horário, posição do cursor, clipboard, URL etc. Só faria sentido indexar com LLM quando snapshots reais de texto fossem grandes demais para guardar em um índice tradicional; fora isso, busca conversacional vaga não é o meu objetivo. O objetivo real é total recall
- É uma visão realmente incrível. Eu queria que o navegador me lembrasse quando eu estivesse perdendo o foco e analisasse por conta própria o que eu fiz. Auto-reflexão vira uma arma poderosa nesse contexto
- Há muito tempo eu queria usar uma funcionalidade que fosse uma extensão de navegador capaz de salvar e indexar automaticamente o texto completo de páginas em que fiquei por mais de 30 segundos e permitir busca depois. Este projeto vai muito além disso
- Do meu ponto de vista, é um “bloqueador de anúncios nativo baseado em LLM”... a floresta é tão grande que só essa ideia já dá dor de cabeça (brincadeira)
Em vez de criar um navegador do zero, como o nanobrowser, não seria suficiente uma extensão robusta? O nanobrowser é bem-feito sem expor webdriver e não deixa a desejar em execução de JS/integração com LLM. Como ele já oferece até recursos agentic completos, fico curioso para saber por que seria realmente necessário um navegador novo
Talvez seja uma pergunta boba, mas queria entender exatamente o que é um “agentic browser”. Parece que todo mundo já sabe do que se trata, mas eu sinceramente não sei se esse termo é comum ou se só quer dizer “um navegador com recursos de IA”
- Obrigado por perguntar. Não é uma pergunta boba de forma alguma. “Agentic browser” significa um navegador em que um agente de IA navega pela web em seu lugar. É um navegador em que o agente pode executar diretamente ações como refazer um pedido na Amazon ou preencher formulários
- Um agente é uma estrutura em que um LLM opera junto com ferramentas, por exemplo calculate(expression). Quando é necessário para obter o resultado desejado, ele executa automaticamente essa ferramenta. Em workflows complexos, a entrada recebida pelo LLM pode ser uma combinação de várias ferramentas, como definir o user agent para uma determinada string. Por exemplo, executar um comando como set_user_agent(…), clicar na página ou injetar JS customizado quando a página abrir
- Ouvi o termo “agentic” pela primeira vez há um mês. Depois disso, ouvi a palavra repetida várias vezes até em town halls internos ao longo de 2 ou 3 dias. O resumo essencial é: é uma IA que toma decisões sozinha e age por conta própria
A ideia de um agentic browser parece muito legal. A possibilidade de automatizar coisas com um agente do lado do cliente é realmente poderosa. Mas, ao mesmo tempo, do ponto de vista de segurança, isso pode simplesmente “nunca ser seguro”. O navegador já está logado em praticamente todas as contas sensíveis e naturalmente fica exposto a entradas não confiáveis da internet. Com uma única prompt injection, sua vida pode desandar em segundos. O conceito é muito bom, mas, a menos que toda a cadeia de fornecimento tenha certificações como PCI/SOC2/ISO 27001 e até garantia assinada com sangue por analistas de segurança terceirizados, eu não chegaria nem perto
- Muito obrigado por levantar esse ponto. É uma preocupação totalmente válida. Por isso insistimos em ser local-first e open source. Com agentes na nuvem, como o Manus.im, você precisa entregar suas credenciais a uma caixa-preta impossível de verificar, mas com agentes locais o usuário mantém o controle. O agente só funciona quando você aciona explicitamente a execução, você acompanha o progresso em tempo real e pode parar a qualquer momento, ele pode rodar isolado em um perfil separado do Chrome e, mais importante, por ser open source, você mesmo pode inspecionar e verificar o código
Meu caso de uso é extrair CSVs/arquivos de dados de sites relacionados à água. Por exemplo, extrair dados de nível de reservatórios do sul da Austrália foi uma luta enorme, especialmente para alguém com pouca experiência em frontend. Se desse para automatizar esse tipo de tarefa com um agente, eu com certeza testaria
Acho que é um projeto realmente muito legal! E lançar no HN também é impressionante. Aqui vai um relato sincero da minha experiência inicial: quando executei o prompt do navegador para “agrupar todas as abas por tópico”, funcionou muito bem. Depois pedi para remover todos os grupos de abas e resetar tudo, e a resposta foi “isso é uma tarefa de automação do navegador, execute no Agent Mode”. Quando pedi no Agent Mode, recebi de volta “isso é uma tarefa de produtividade, execute no Chat Mode”. No fim, fiquei nesse vai e volta, e até consegui agrupar todas as abas em um único grupo novo, mas falhou completamente em remover os grupos em si. Imagino que essa API talvez nem exista por conta própria. No geral, seria ótimo se cada ação em nível de navegador tivesse um botão de undo. Se isso for difícil, pelo menos seria bom que ele conseguisse desfazer sozinho os grupos de abas que criou há alguns segundos. Vou continuar usando. edit1: ao usar a interface de chat em páginas internas do Chrome, como chrome://extensions, às vezes ele pula para google.com. edit2: confirmei que o modo de produtividade não tem ferramenta para desfazer grupos, só para criá-los
- Muito obrigado pelo feedback! Desculpe pelo transtorno. Ainda estamos em beta inicial. O agent mode e o chat mode foram projetados com ferramentas separadas. Sentimos que os prompts ainda estão fracos no estado atual e precisam melhorar. Sobre desfazer grupos, parece que a própria API do Chrome ainda não oferece isso, então talvez tenhamos que implementar diretamente. Várias pessoas estão pedindo uma função de undo, então estamos pensando em algo no estilo “restore checkpoint” do Cursor. Eu adoraria ouvir casos concretos de quão importantes você acha que são essas funções de produtividade no dia a dia :)
O nome “nxtscape” dá uma nostalgia do velho SCSI. Eu recomendaria um nome que dê para falar de uma vez só, como “GPT”. O produto é realmente excelente
- Pelo feedback de hoje, sinto que precisamos dedicar mais tempo ao nome e à marca. Vou pensar nisso :)
Esse mercado é totalmente winner-take-all. A tentativa é realmente admirável, mas fazer um navegador com uma equipe de duas ou três pessoas é trabalho grande demais. Além disso, o Google já mostrou um pouco da direção futura no I/O e, numa área dessas, eles provavelmente conseguem colocar isso no Chrome em breve e tomar participação de mercado bem rápido. Fundadores de deep tech já tentam conquistar o Chrome há anos e nunca conseguiram uma única vez. Realisticamente, acho que faz mais sentido começar por uma dor pequena com ICP bem definido. Seria uma pena desperdiçar tanta paixão e energia
- Obrigado pelo feedback sincero! A concorrência é realmente acirrada. Mas acreditamos que existe uma lacuna clara para um navegador de IA open source, orientado à comunidade e privacy-first, como foi o caso do Brave
Acho que há valor claro em recursos voltados ao usuário, especialmente em um navegador que processe e reformate automaticamente conteúdo web hostil ao usuário. Casos de uso concretos incluem, por exemplo: 1) ao comprar um sofá, filtrar apenas condições específicas em vez de propaganda exagerada de marketing; 2) receber notificação só quando amigos postarem no Facebook e filtrar o resto; 3) quando a comunidade do bairro usa Facebook ou nextdoor, esconder automaticamente apenas as postagens repetitivas das mesmas pessoas; 4) quando uma página de audiência pública do governo foi inflada desnecessariamente para 700 páginas, resumir automaticamente e extrair só o que realmente importa. Dá para aplicar isso em muitos domínios
- Em coisas como comprar um sofá, a capacidade de filtrar itens com base em critérios específicos ainda é fraca até em sites grandes, incluindo a Amazon. No passado, combinei scraping e ciência de dados para criar eu mesmo sites como o diskprices.com, e se os LLMs forem realmente úteis para esse tipo de uso, então no futuro veremos mais sites especializados em funções assim, em vez de as pessoas escreverem prompts diretamente no navegador. Quanto a bloquear posts repetitivos, o nextdoor já tem função de bloquear usuários, então pode servir de referência (guia para bloquear no nextdoor)
- É um exemplo excelente mesmo!
Respeita robots.txt?
- Ainda não. Mas, sinceramente, como o agente é usado apenas em nome de um “humano”, não sei se isso importa a ponto de ser scraping
- Este é claramente um agente voltado ao usuário. Se tivesse mesmo que respeitar robots.txt, sinceramente seria frustrante demais. O robots.txt foi concebido originalmente como uma cortesia para crawlers da web, não para impedir ferramentas que atuam em nome de solicitações individuais de usuários. Permitir que operadores de sites restrinjam as ferramentas pelas quais acesso meu site — seja terminal, navegador comum ou navegador com IA — enfraquece uma das forças da web. Sacrificar a diversidade da web por antipatia a ferramentas de IA também é perigoso para o futuro. Referência: FAQ do robots.txt

Nxtscape - navegador agente de código aberto

O que é o Nxtscape

Principais recursos

Demo e exemplos de uso

Contexto de desenvolvimento

Comparação com os principais navegadores

Participação da comunidade e contribuição

Licença e referências técnicas

Leituras relacionadas

1 comentários

Comentários no Hacker News