Nxtscape - navegador agente de código aberto
(github.com/nxtscape)- Navegador de código aberto com recursos de agente baseados em IA
- Prioriza a privacidade do usuário e oferece a vantagem de proteção de dados ao executar modelos de IA localmente
- Destaca como principais vantagens a compatibilidade com extensões do Chrome e uma política transparente de código aberto
- Em comparação com alternativas existentes como Arc, Dia, Perplexity Comet, diferencia-se pelo processamento local e pelo controle dos dados pelo usuário
- Busca expandir continuamente os recursos e evoluir com base na comunidade, apoiando diversas formas de contribuição
O que é o Nxtscape
- Nxtscape é um navegador agente de código aberto que executa recursos de IA em ambiente local
- É uma alternativa a navegadores como Arc, Dia e Perplexity Comet, sendo uma boa opção para quem quer privacidade e controle sobre os próprios dados
- O usuário pode usar sua própria chave de API ou integrar modelos locais como o Ollama, evitando que informações como o histórico de navegação vazem para fora
Principais recursos
- Compatibilidade total com extensões do Chrome, permitindo manter o ambiente já familiar
- O agente de IA funciona diretamente no navegador, sem passar pela nuvem
- O usuário pode inserir sua própria chave de API ou optar por integrar um modelo local, garantindo alto nível de proteção de dados
- O desenvolvimento é open source e guiado pela comunidade, garantindo transparência no código
- No futuro, estão previstos vários recursos adicionais, como MCP Store e bloqueio de anúncios com IA
Demo e exemplos de uso
- Oferece cenários de automação com agentes de IA
- Integra recurso de chat com IA local, permitindo receber ajuda em formato conversacional
- Demonstra várias possibilidades de automação de trabalho em integração com ferramentas de produtividade
Contexto de desenvolvimento
- Parte da percepção de que a tecnologia dos navegadores ficou estagnada por muito tempo
- O objetivo é construir um ambiente baseado em agentes de IA que aumente drasticamente a produtividade dos desenvolvedores
- Ao automatizar tarefas repetitivas simples, por exemplo solicitações como "pedir Tide Pods no histórico de pedidos da Amazon", o navegador deve ajudar o usuário em vez de fazê-lo 'competir' com ele
- Apresenta o princípio firme de que os agentes de IA devem funcionar com segurança em ambiente local
Comparação com os principais navegadores
- Chrome: embora seja baseado no Chromium de código aberto, nos últimos 10 anos pouco avançou na adoção de recursos inovadores como IA, automação e MCP (Multi Capability Plug-in)
- Brave: ampliou sua direção com criptomoedas, busca e VPN, mas o Nxtscape se concentra em ser centrado em IA
- Arc/Dia: foram populares, mas são de código fechado e, se o serviço for encerrado, faltam alternativas. O Nxtscape é totalmente de código aberto
- Perplexity Comet: como empresa de busca/publicidade, há o problema de dados como o histórico do navegador passarem a pertencer à empresa. O Nxtscape mantém todo o histórico do usuário restrito ao local
Participação da comunidade e contribuição
- É possível contribuir de várias formas, como relatar bugs, sugerir recursos, participar do Discord e seguir no Twitter
Licença e referências técnicas
- O código-fonte é disponibilizado sob a licença AGPL-3.0
- Foi criado com inspiração em projetos de código aberto como Chromium, browser-use, Stagehand e Nanobrowser
1 comentários
Comentários no Hacker News
Acho que, pelos comentários até agora, a sensação é de que estão focando mais em detalhes do que na visão geral. Pessoalmente, imagino um valor enorme em um navegador que se conecte a LLMs locais, salve tudo o que o navegador vê em um banco de dados local com timestamp, faça parsing/resumo automático do que eu interajo, possa ser automatizado por scripts como o Puppeteer e suporte automações baseadas em prompts de código. Como meu próprio assistente digital, ele poderia me ajudar a encontrar facilmente informações esquecidas ou coisas de que eu preciso, filtrar ativamente busca, anúncios, spam e informações indesejadas, e até executar automaticamente tarefas na internet que eu quiser. Depois de 25 anos acumulando bookmarks, só bookmarks já não bastam mais. A situação de se perder tentando achar uma única informação em sites cheios de tranqueira poderia melhorar se um bot guarda-costas filtrasse o ruído e as inutilidades. Se isso realmente funcionar bem, poderia assumir de uma vez vários papéis no espaço digital — assistente pessoal, gerente de turnê, porteiro, governanta, mecânico — e, em 2025, quando o navegador virou o principal portal para a internet caótica, essa direção não parece uma má ideia. No fim, tudo depende da execução, mas estou muito curioso para ver como esse projeto evolui
Muito obrigado pelo feedback sincero. Essa é exatamente a visão que tínhamos. Mesmo passando mais de 90% do dia no navegador, ele ainda é só uma “janela burra”. Se ele pudesse lembrar o histórico de navegação, recortar artigos importantes e salvar destaques como o Evernote web clipper, e tornar tudo pesquisável por significado, isso mudaria a vida. Todos os dados ficam salvos em um PostgresDB local, e perguntas como “qual era mesmo aquela comparação de preços do mês passado?” ou “encontre o destaque da automação do navegador” poderiam ser respondidas na hora. Também incluímos funções para bloquear sites que distraem quando você precisa se concentrar. Para além de buscar e lembrar, é a era em que o navegador realmente ajuda no meu trabalho. Por exemplo: agrupar abas automaticamente por tema, comparar preços de HDs por site, resumir posts novos em um servidor do Discord — tudo processado localmente. O navegador deveria nos ajudar no caos da internet, não torná-la ainda mais complicada. Em especial, eu adoraria ouvir quais workflows do dia a dia são mais incômodos para você e quaisquer casos de uso
Na prática, isso é quase igual ao que a Microsoft queria fazer com o Recall. Eu estava animado porque o Recall parecia ser a única coisa na onda da IA que realmente melhoraria minha vida, mas, pensando bem, o que eu realmente quero não é IA, e sim que meu computador tenha um registro detalhado localmente e forneça busca avançada. Quero que ele se lembre incondicionalmente de tudo que fiz no computador. Os sites que visitei, quanto rolei em cada página, até pensamentos que digitei e apaguei — preciso de uma função de “total recall” que guarde tudo isso. O motivo é simples: meu cérebro falha na memória o tempo todo, então espero uma memória mais perfeita do computador. E quero que a busca funcione sempre de forma consistente e determinística. Precisa ter timestamps exatos, operadores booleanos, e NLP o Lucene já faz bem há 20 anos. Não preciso de resumos gerados automaticamente a partir de corpus externos; só quero que meu computador se lembre direito do que eu fiz nele. Não acho que LLMs agreguem muito valor à busca pessoal. Pela própria natureza dos LLMs, é difícil recuperar os dados reais com precisão, e no fim a busca só fica exata se for indexada do jeito tradicional. Acho que o motivo de LLMs estarem na moda agora é que ainda faltam boas formas de indexar “tudo” com eficiência e, na verdade, no caso de busca personalizada, não é preciso “tudo”: basta saber o texto exibido na minha tela e metadados como horário, posição do cursor, clipboard, URL etc. Só faria sentido indexar com LLM quando snapshots reais de texto fossem grandes demais para guardar em um índice tradicional; fora isso, busca conversacional vaga não é o meu objetivo. O objetivo real é total recall
É uma visão realmente incrível. Eu queria que o navegador me lembrasse quando eu estivesse perdendo o foco e analisasse por conta própria o que eu fiz. Auto-reflexão vira uma arma poderosa nesse contexto
Há muito tempo eu queria usar uma funcionalidade que fosse uma extensão de navegador capaz de salvar e indexar automaticamente o texto completo de páginas em que fiquei por mais de 30 segundos e permitir busca depois. Este projeto vai muito além disso
Do meu ponto de vista, é um “bloqueador de anúncios nativo baseado em LLM”... a floresta é tão grande que só essa ideia já dá dor de cabeça (brincadeira)
Em vez de criar um navegador do zero, como o nanobrowser, não seria suficiente uma extensão robusta? O nanobrowser é bem-feito sem expor webdriver e não deixa a desejar em execução de JS/integração com LLM. Como ele já oferece até recursos agentic completos, fico curioso para saber por que seria realmente necessário um navegador novo
Talvez seja uma pergunta boba, mas queria entender exatamente o que é um “agentic browser”. Parece que todo mundo já sabe do que se trata, mas eu sinceramente não sei se esse termo é comum ou se só quer dizer “um navegador com recursos de IA”
Obrigado por perguntar. Não é uma pergunta boba de forma alguma. “Agentic browser” significa um navegador em que um agente de IA navega pela web em seu lugar. É um navegador em que o agente pode executar diretamente ações como refazer um pedido na Amazon ou preencher formulários
Um agente é uma estrutura em que um LLM opera junto com ferramentas, por exemplo
calculate(expression). Quando é necessário para obter o resultado desejado, ele executa automaticamente essa ferramenta. Em workflows complexos, a entrada recebida pelo LLM pode ser uma combinação de várias ferramentas, como definir o user agent para uma determinada string. Por exemplo, executar um comando comoset_user_agent(…), clicar na página ou injetar JS customizado quando a página abrirOuvi o termo “agentic” pela primeira vez há um mês. Depois disso, ouvi a palavra repetida várias vezes até em town halls internos ao longo de 2 ou 3 dias. O resumo essencial é: é uma IA que toma decisões sozinha e age por conta própria
A ideia de um agentic browser parece muito legal. A possibilidade de automatizar coisas com um agente do lado do cliente é realmente poderosa. Mas, ao mesmo tempo, do ponto de vista de segurança, isso pode simplesmente “nunca ser seguro”. O navegador já está logado em praticamente todas as contas sensíveis e naturalmente fica exposto a entradas não confiáveis da internet. Com uma única prompt injection, sua vida pode desandar em segundos. O conceito é muito bom, mas, a menos que toda a cadeia de fornecimento tenha certificações como PCI/SOC2/ISO 27001 e até garantia assinada com sangue por analistas de segurança terceirizados, eu não chegaria nem perto
Meu caso de uso é extrair CSVs/arquivos de dados de sites relacionados à água. Por exemplo, extrair dados de nível de reservatórios do sul da Austrália foi uma luta enorme, especialmente para alguém com pouca experiência em frontend. Se desse para automatizar esse tipo de tarefa com um agente, eu com certeza testaria
Acho que é um projeto realmente muito legal! E lançar no HN também é impressionante. Aqui vai um relato sincero da minha experiência inicial: quando executei o prompt do navegador para “agrupar todas as abas por tópico”, funcionou muito bem. Depois pedi para remover todos os grupos de abas e resetar tudo, e a resposta foi “isso é uma tarefa de automação do navegador, execute no Agent Mode”. Quando pedi no Agent Mode, recebi de volta “isso é uma tarefa de produtividade, execute no Chat Mode”. No fim, fiquei nesse vai e volta, e até consegui agrupar todas as abas em um único grupo novo, mas falhou completamente em remover os grupos em si. Imagino que essa API talvez nem exista por conta própria. No geral, seria ótimo se cada ação em nível de navegador tivesse um botão de
undo. Se isso for difícil, pelo menos seria bom que ele conseguisse desfazer sozinho os grupos de abas que criou há alguns segundos. Vou continuar usando. edit1: ao usar a interface de chat em páginas internas do Chrome, comochrome://extensions, às vezes ele pula paragoogle.com. edit2: confirmei que o modo de produtividade não tem ferramenta para desfazer grupos, só para criá-losundo, então estamos pensando em algo no estilo “restore checkpoint” do Cursor. Eu adoraria ouvir casos concretos de quão importantes você acha que são essas funções de produtividade no dia a dia :)O nome “nxtscape” dá uma nostalgia do velho SCSI. Eu recomendaria um nome que dê para falar de uma vez só, como “GPT”. O produto é realmente excelente
Esse mercado é totalmente winner-take-all. A tentativa é realmente admirável, mas fazer um navegador com uma equipe de duas ou três pessoas é trabalho grande demais. Além disso, o Google já mostrou um pouco da direção futura no I/O e, numa área dessas, eles provavelmente conseguem colocar isso no Chrome em breve e tomar participação de mercado bem rápido. Fundadores de deep tech já tentam conquistar o Chrome há anos e nunca conseguiram uma única vez. Realisticamente, acho que faz mais sentido começar por uma dor pequena com ICP bem definido. Seria uma pena desperdiçar tanta paixão e energia
Acho que há valor claro em recursos voltados ao usuário, especialmente em um navegador que processe e reformate automaticamente conteúdo web hostil ao usuário. Casos de uso concretos incluem, por exemplo: 1) ao comprar um sofá, filtrar apenas condições específicas em vez de propaganda exagerada de marketing; 2) receber notificação só quando amigos postarem no Facebook e filtrar o resto; 3) quando a comunidade do bairro usa Facebook ou nextdoor, esconder automaticamente apenas as postagens repetitivas das mesmas pessoas; 4) quando uma página de audiência pública do governo foi inflada desnecessariamente para 700 páginas, resumir automaticamente e extrair só o que realmente importa. Dá para aplicar isso em muitos domínios
Em coisas como comprar um sofá, a capacidade de filtrar itens com base em critérios específicos ainda é fraca até em sites grandes, incluindo a Amazon. No passado, combinei scraping e ciência de dados para criar eu mesmo sites como o diskprices.com, e se os LLMs forem realmente úteis para esse tipo de uso, então no futuro veremos mais sites especializados em funções assim, em vez de as pessoas escreverem prompts diretamente no navegador. Quanto a bloquear posts repetitivos, o nextdoor já tem função de bloquear usuários, então pode servir de referência (guia para bloquear no nextdoor)
É um exemplo excelente mesmo!
Respeita
robots.txt?Ainda não. Mas, sinceramente, como o agente é usado apenas em nome de um “humano”, não sei se isso importa a ponto de ser scraping
Este é claramente um agente voltado ao usuário. Se tivesse mesmo que respeitar
robots.txt, sinceramente seria frustrante demais. Orobots.txtfoi concebido originalmente como uma cortesia para crawlers da web, não para impedir ferramentas que atuam em nome de solicitações individuais de usuários. Permitir que operadores de sites restrinjam as ferramentas pelas quais acesso meu site — seja terminal, navegador comum ou navegador com IA — enfraquece uma das forças da web. Sacrificar a diversidade da web por antipatia a ferramentas de IA também é perigoso para o futuro. Referência: FAQ do robots.txt