BrowserOS – a alternativa open source ao Perplexity Comet

(browseros.com)

9 pontos por GN⁺ 2025-07-14 | 2 comentários | Compartilhar no WhatsApp

BrowserOS é uma alternativa open source, focada em privacidade, ao Perplexity Comet, um navegador agêntico que executa agentes de IA localmente
Baseado em um fork do Chromium, suporta todas as extensões existentes do Chrome, com o diferencial de que os dados do usuário ficam armazenados apenas localmente
Pode se integrar a vários provedores de IA, como OpenAI, Anthropic e Ollama, e permite usar chaves de API pessoais ou modelos locais
Inclui ferramentas modernas de produtividade, como realce nativo, favoritos com base no ChatGPT e busca semântica, e em breve também terá bloqueio de anúncios com IA
Diferente dos navegadores tradicionais, os dados não são repassados a empresas de busca/publicidade, e a IA executa fluxos de trabalho automatizados localmente

Visão geral do BrowserOS

BrowserOS é um navegador com agentes open source que oferece um ambiente em que agentes de IA operam diretamente no computador do usuário
Com uma filosofia privacy-first, usa chave de API ou modelos locais, como o Ollama, para evitar que os dados vazem para fora
Por ser baseado em um fork do Chromium, tem a mesma interface do Chrome e todas as extensões do Chrome funcionam

Principais recursos

Agentes de IA & execução local
- Dentro do navegador, agentes de IA rodam localmente e diretamente, lidando com tarefas repetitivas e fluxos de trabalho automatizados
- Com integração ao Ollama, é possível executar modelos de linguagem grandes no próprio computador em vez da nuvem, com privacidade de dados garantida
Ferramentas de produtividade
- Suporte a ferramentas de produtividade nativas do navegador, como realce e favoritos do ChatGPT
- Com busca semântica, é possível encontrar rapidamente dados do navegador, como histórico e favoritos
Bloqueio de anúncios e MCP Store (em breve)
- Bloqueio de anúncios com IA (em breve), previsto como alternativa após o bloqueio do uBlock Origin no Chrome
- Na MCP (Multi Command Package) Store (em breve), será possível instalar MCPs populares com um clique e usá-los imediatamente pela barra do navegador
Open source e orientado à comunidade
- 100% open source sob a licença AGPL-3.0, garantindo transparência do código e do funcionamento
- Incentiva ativamente a participação e as contribuições da comunidade

Casos de uso representativos

Automação de tarefas repetitivas e entediantes: a IA automatiza agendamento de reuniões, preenchimento de formulários e trabalhos repetitivos
Deep research: navega pela web e gera relatórios resumidos, permitindo coletar informações com eficiência sem gerenciar abas manualmente
Varredura de conteúdo em redes sociais: seleciona e organiza automaticamente postagens relevantes no LinkedIn, Twitter etc.

Comparação com outros navegadores

Chrome: sem grandes mudanças há 10 anos, e sem recursos de IA/automação/MCP
Brave: adota uma estratégia dispersa com criptomoedas/busca/VPN e não é focado em navegador com IA
Arc/Dia: são fechados, não são open source, e não há alternativa se o uso for descontinuado
Perplexity Comet: centrado em empresas de busca/publicidade, envia os dados do usuário para o servidor, enquanto o BrowserOS mantém todos os dados apenas localmente

Instalação e início

Download disponível para macOS e Windows
Importação de dados do Chrome (opcional)
Conexão com provedores de IA (OpenAI, Anthropic, Ollama etc.)
É possível começar imediatamente a automação com agentes

Licença

Aplicação da licença open source AGPL-3.0

2 comentários

luiseok 2025-07-14

https://pt.news.hada.io/topic?id=21581
Achei que isso me parecia familiar e, quando fui ver, era só o Nxtscape com outro nome.

GN⁺ 2025-07-14

Comentários no Hacker News

O exemplo de comprar pasta de dente mostrado na demo ilustra como essas tarefas são difíceis; “pasta de dente” por si só é algo muito ambíguo, então no fim ele escolhe aleatoriamente dentro de uma lista enorme. Em algumas tarefas, ações anteriores podem servir de guia, mas em outras não. Por exemplo, se a pasta de dente comprada antes estiver fora de estoque, não dá para saber o que fazer. No fim, fica a dúvida se esse tipo de exemplo realmente economiza tempo, e de qualquer forma você acaba trabalhando em dobro se precisar conferir o resultado. Acho que foi por isso que sistemas como a Alexa não conseguiram entregar a experiência de compra que a Amazon esperava no começo. Talvez fosse melhor mostrar um exemplo mais complexo, em que a economia de tempo fique claramente evidente e os casos de falha sejam mínimos, ou então focar em como se recuperar justamente dos casos de falha. A interface oferece uma UI específica para o problema ou resolve por chat? Acho que esse mundo inteiro está longe de ser algo simples. Boa sorte a todos.
- Faz sentido. Todo o campo de agentic browser ainda está bem no começo. Nós também estamos só começando e tentando encontrar nichos de uso valiosos. Há casos, entre tarefas repetitivas e tediosas, em que a economia de tempo é clara. Um exemplo é o de vendedores terceiros do Walmart que checam várias vezes por dia os preços dos concorrentes para ajustar o preço dos próprios produtos. Isso pode ser automatizado facilmente com um agentic browser.
- Acho que também deveria ser possível executar tarefas de acordo com o gosto estético de cada usuário, mas isso provavelmente viraria um pesadelo de segurança.
Eu já tinha instalado o Nxtscape, então não sabia que o nome do produto tinha mudado; quando rodei o BrowserOS, levei um susto ao ver a mesma UI e a mesma janela de chat, até com o mesmo emoji de raposa. Sinceramente, eu gostava mais do nome antigo. Suponho que a mudança tenha sido por motivos legais. Pedi para resumir os comentários de uma matéria da Arstechnica, mas no começo só recebi a resposta de que "não era possível resumir porque os comentários não estavam incluídos". Só depois de eu mandar clicar diretamente no link "comments" é que ele começou a ler os comentários de verdade. E, só para constar, a página de comentários tinha 3 páginas no total; depois de mais de 20 minutos e cerca de 100 ações, incluindo muitas rolagens extremamente específicas de 1074 pixels, ele ainda está no estado "Validating task completion..." e eu continuo esperando o resumo. Funcionalmente parece poderoso, mas exige intervenção demais e é lento demais para eu conseguir usar na prática. Aliás, como eu também tinha o Nxtscape instalado, fiz o mesmo experimento nele e ele terminou a tarefa mais rápido e com menos ações. Não sei se foi coincidência ou se internamente a lógica é diferente. E existe uma extensão do Chrome que permite usar senhas do iCloud no Chrome, mas ela não funciona no Nxtscape nem no BrowserOS. Se eu tiver que continuar abrindo o gerenciador de senhas manualmente, não pretendo usar esse tipo de navegador. E também não tenho planos de trocar de gerenciador de senhas.
- Mudamos o nome para evitar problemas, e o nome antigo também era difícil de pronunciar. Obrigado pelo feedback; seria ótimo continuar a conversa no Discord (https://discord.gg/YKwjt5vuKr)! Nossa equipe faz deploy todos os dias e está melhorando muito rápido, e o agente deve ficar muito melhor em poucos dias. Também vamos verificar a questão da extensão de senhas do iCloud. Nosso objetivo é tornar o onboarding e o gerenciamento de senhas muito mais fáceis.
Se isso é um navegador com foco em privacidade, fico me perguntando por que não usaram o Firefox. O Firefox combina muito melhor com esse objetivo e já é uma opção melhor por padrão. Tor Browser, Mullvad Browser, LibreWolf e outros navegadores voltados para segurança/privacidade são todos baseados no motor do Firefox. Também acho que precisamos, sim, de diversos "motores de navegador". Se acabarmos usando apenas motores das big techs, no fim isso é um enorme prejuízo para os consumidores e ainda bloqueia a inovação. Deveríamos apoiar mais navegadores independentes, como o Firefox.
- Foi uma decisão realmente difícil. Conversamos com pessoas que criaram navegadores em cima do WebKit, e elas disseram que levaram quase 2 anos só para corrigir bugs aleatórios e resolver problemas de compatibilidade com sites. O motor firefox/gecko pode até ser melhor que o WebKit, mas a conclusão é que, se você usar qualquer motor que não seja o Chromium, terá uma quantidade enorme de trabalho adicional com compatibilidade de sites e suporte a extensões. Também somos uma startup de apenas 2 pessoas, e escolhemos a base de código do Chromium porque é um ponto de partida muito mais fácil de compilar. E também existe o fato de que dá para criar um navegador bastante focado em privacidade mesmo em cima do Chromium, como o Brave. Especialmente na era dos agentic browsers, há muitas coisas ligadas à privacidade que podem ser melhoradas imediatamente — por exemplo, enviar dados sensíveis para algo como o Perplexity Comet para monetização via anúncios é realmente péssimo. É muito mais importante oferecer suporte a LLM local ou permitir que o usuário use a própria API key.
- Tive exatamente a mesma dúvida. Fico me perguntando por que alguém usaria Chromium se o objetivo é privacidade.
Li que "estamos aplicando patches diretamente no código-fonte em C++ do Chrome para obter a mesma segurança do Google Chrome".
- Boa pergunta. Até agora, continuamos fazendo builds com base nas versões de release do Chromium em que o Google Chrome se baseia.
Eu preferiria muito mais se isso fosse oferecido como uma extensão independente do navegador, e não como um navegador separado.
- Nós também queríamos fazer isso originalmente como uma extensão de navegador. Mas achamos que, para criar um bom agent copilot, várias mudanças no nível do C++ do Chromium são indispensáveis. Por exemplo, o Chromium possui a árvore de acessibilidade de todos os sites, mas você não consegue acessá-la pela API de extensões do Chrome. Ter acesso direto à árvore de acessibilidade melhora bastante o desempenho do agente. Além disso, estamos adicionando no nível de C++ várias funções para o agente interagir com sites, como ações de clique e indexação de elementos. Fazer isso em JS seria de 20 a 40 vezes mais lento.
- Pensamos exatamente a mesma coisa. Achamos que, para implementar funções agentic, não é obrigatório ter um navegador inteiro; dentro de permissões limitadas, isso pode ser implementado suficientemente bem só com uma extensão. O Google também distribui muitos patches zero-day diretamente, e claramente há recursos que o Google não coloca no Chromium. Por isso, eu não confiaria em um fork open source aleatório como meu navegador principal. Recomendo a extensão de navegador AI Web Agent rtrvr.ai (https://rtrvr.ai), que já foi feita para se encaixar no fluxo de trabalho do usuário.
- Quando o nanobrowser foi mencionado aqui, eu pensei a mesma coisa.
- Vale a pena testar: https://github.com/nanobrowser/nanobrowser
Este é um projeto parecido com o nanobrowser, que é uma extensão do Chrome: https://github.com/nanobrowser/nanobrowser
- Dando uma olhada rápida na página do projeto, parece que ele usa chaves de API de LLM externas. Já este projeto apresentado no post original aparentemente usa transformer.js para rodar o LLM localmente.
- Se esse tipo de funcionalidade já pode ser implementado como extensão, então fico curioso sobre por que seria necessário criar um fork de um software existente. Gostaria de entender se existe alguma funcionalidade claramente exclusiva do browserOS em relação ao nanobrowser, algo que funcione no browserOS e não exista no nanobrowser, e qual seria exatamente essa diferença importante.
- Obrigado por mencionar.
Há uma frase dizendo: "Também estamos criando um bloqueador de anúncios baseado em LLM depois que o Chrome bloqueou o uBlock Origin". Mas, se de qualquer forma é um fork do Chromium, não daria para simplesmente reutilizar o uBlock Origin?
- O Chromium pretende remover a API Manifest V2, e nenhum fork parece querer manter isso para sempre. Até o Brave cria o próprio bloqueador de anúncios embutido. A verdadeira pergunta é: “por que escolher o Chromium em vez de fazer um fork do Firefox, se o Firefox já entrega tudo isso?”
Queria saber qual é o roadmap para Linux; não tenho Mac nem Windows.
- Estamos cientes disso e devemos ter suporte no começo da próxima semana. Ainda somos uma equipe de 2 pessoas, então realmente há muita coisa para fazer.
Eu gostaria de ver a IA movendo o cursor do mouse de fato, clicando, e as teclas digitadas aparecendo na tela em tempo real, como se fosse um tutorial de software, com interações parecendo de uma pessoa real. Do jeito que está agora, quando a IA troca de página e a UI muda rapidamente, a sensação é meio truncada e fica difícil acompanhar o fluxo. Faltam pistas sobre em que exatamente eu deveria prestar atenção, então parece mais uma gravação de tela. Ainda assim, acho que pode haver casos de uso úteis em áreas como mcp/browser automation, então estou curioso para ver como isso vai evoluir.
- Feedback realmente útil, obrigado! Vamos analisar se dá para adicionar movimento de cursor. A digitação já aparece de forma parecida com a de uma pessoa real, mas talvez possamos fazê-la parecer mais lenta para melhorar.
- Acho que o que eu realmente quero é caretaker ai.
Parabéns! Tenho curiosidade sobre como vocês pretendem tornar este projeto sustentável do ponto de vista financeiro, de desenvolvimento e de manutenção.
- Obrigado! Basicamente, pretendemos seguir o mesmo caminho de outros projetos open source, vendendo licenças para a versão Enterprise do navegador.
- Meu palpite é que seja só um app em Electron ou um wrapper de Chromium com um wrapper de Ollama acoplado (há várias bibliotecas open source gratuitas para controlar o navegador).

BrowserOS – a alternativa open source ao Perplexity Comet

Visão geral do BrowserOS

Principais recursos

Agentes de IA & execução local

Ferramentas de produtividade

Bloqueio de anúncios e MCP Store (em breve)

Open source e orientado à comunidade