- O ChatGPT Atlas é um novo navegador web baseado em IA com o ChatGPT no centro, com o objetivo de se desenvolver em um “superassistente” ao integrar contexto, ferramentas e tarefas do usuário
- O Atlas oferece recursos para que, onde quer que o usuário esteja navegando na web, o ChatGPT acompanhe a experiência e auxilie na execução de tarefas sem sair da página e no entendimento de contexto
- Ele usa a memória do navegador para lembrar o contexto dos sites visitados e oferecer suporte para responder perguntas, resumir conteúdo, planejar agendas e outras tarefas
- Por meio do modo Agente (Agent Mode), o ChatGPT pode executar ações reais no ambiente de navegação do usuário, como abrir abas, buscar informações, fazer reservas e pedidos
- Foi lançado globalmente para macOS, com versões para Windows, iOS e Android previstas, e é visto como um novo estágio do browsing com IA
- O ChatGPT Atlas é uma ferramenta de navegador web baseado em IA que combina o ChatGPT com um navegador web
- Tem como objetivo criar um ambiente de navegador inteligente que entende o contexto do usuário e age, indo além da simples pesquisa
- Após a rápida adoção da funcionalidade de busca na web do ChatGPT, a OpenAI redesenhou o próprio navegador com foco em IA para suportar também automação de tarefas, pesquisa e planejamento de agenda
- O usuário pode obter ajuda diretamente na janela do Atlas sem precisar copiar e colar
Funcionalidade de memória do navegador
- O Atlas armazena a memória do navegador com base nas informações dos sites visitados e fornece conversas orientadas por contexto e suporte personalizado
- Ex.: processa automaticamente solicitações como “Resume a vaga de emprego que vi na semana passada”
- A memória é gerida sob controle total do usuário, que pode visualizar, salvar e excluir a qualquer momento
- Ao apagar o histórico do navegador, as memórias relacionadas também são apagadas, e é possível ajustar o escopo da memória por site
- Por padrão, o conteúdo de navegação não é usado para treinar o modelo; só é incluído nos dados de treinamento se o usuário optar explicitamente por isso (opt-in)
Modo Agente (Agent Mode)
- O Agent Mode integrado ao Atlas é um recurso em que o ChatGPT realiza tarefas reais dentro do navegador do usuário
- Ex.: adicionar ingredientes a um carrinho e fazer um pedido com base em uma receita ou ler documentos e realizar uma análise de concorrentes
- O agente abre abas e clica conforme as permissões do usuário, avançando nas tarefas
- É oferecido em versão preview para usuários Plus, Pro e Business, com melhoria contínua para torná-lo mais rápido e confiável
Segurança e privacidade
- O Atlas segue uma abordagem de segurança em primeiro lugar, com restrições como estas
- Não é possível executar código no navegador, baixar arquivos ou instalar extensões
- Não há acesso a arquivos locais ou a outros aplicativos
- Em sites sensíveis, como instituições financeiras, há pausa automática
- O agente também pode ser usado em modo de logout, reduzindo o risco de exposição de dados pessoais
- A equipe realizou milhares de horas de testes de Red Team para evitar ataques de comandos ocultos em páginas maliciosas ou e-mails, e mantém um sistema de patches rápidos para responder a novos tipos de ataque
- Usuários são orientados a considerar riscos de exposição ao usar o Atlas, fazendo monitoramento das tarefas e aproveitando o modo de logout
Dados e configurações de controle
- O usuário pode controlar quais sites o ChatGPT pode acessar com o toggle na barra de endereço, chamado visibilidade de site
- Quando desativado, o acesso ao conteúdo da página é bloqueado e a criação de memória é interrompida
- Se desejar para treinamento de dados, é possível incluir conteúdo web no aprendizado pela opção “include web browsing” nas configurações
- A função de controle parental também foi fortalecida, permitindo que pais desativem a memória do navegador ou o modo Agente
Plataformas suportadas e implantação
- O ChatGPT Atlas foi lançado imediatamente para macOS, com acesso para usuários Free, Plus, Pro e Go
- Usuários dos planos Business, Enterprise e Edu também podem usar quando o administrador habilita
- As versões para Windows, iOS e Android estão com lançamento próximo
- Usuários podem migrar facilmente importando favoritos, senhas e histórico do navegador anterior
Planos futuros
- A OpenAI planeja para as próximas fases do Atlas suporte a múltiplos perfis, melhorias nas ferramentas para desenvolvedores e maior escalabilidade de integração com o Apps SDK
- Operadores de sites podem melhorar a precisão do agente do ChatGPT em seus sites adicionando tags ARIA
- Este lançamento é visto como o primeiro passo para materializar uma experiência web interativa com IA dentro do navegador
1 comentários
Opinião do Hacker News
Pessoalmente, acho que focar só em privacidade é uma visão estreita. O ponto realmente importante é se essa tecnologia tem potencial para mudar de forma fundamental o jeito como navegamos na internet e se ela terá qualquer impacto na monetização do tráfego da web. Isso é uma diferença enorme entre ser uma V0.1 ou uma V1.0 de uma experiência realmente nova; se for nível V1.0, a migração para fora do navegador tradicional pode estar avançando rapidamente e causar um impacto econômico considerável, então o investimento em data centers de IA também me parece totalmente justificável.
Resumi as telas principais do instalador DMG do ChatGPT Atlas (captura de tela da instalação):
Desativei totalmente a função de memória do ChatGPT, pois a separação pessoal não ficou clara. Por exemplo, ao perguntar sobre pneus de inverno, respondiam coisa sem contexto como “como você trabalha com firmware, deve se importar mais com durabilidade”, o que foi estranho.
A funcionalidade mais esperada é buscar no histórico do navegador em linguagem natural. Tenho passado mais de 10 minutos várias vezes tentando achar links de 5 meses atrás, quando não lembrava o título, mas conseguia descrever o conteúdo.
Testei mudar para padrão por causa da função (4), mas o mais suspeito foi a solicitação de acesso ao Keychain; recusei.
Parece que é a primeira vez que vejo benefícios ao definir um navegador como padrão, então muita gente vai manter assim por causa desse bônus.
Fico em dúvida de como confiar em empresas que falam que “a privacidade é totalmente sob seu controle”, ainda mais uma empresa com histórico de invadir privacidade raspando a internet inteira.
Sinto que a resposta da OpenAI é parecida com o Comet da Perplexity, e isso me deixa preocupado com o futuro. Esses navegadores com IA realmente oferecem valor, mas no fim parece que vai surgir uma única Big Tech que controla tudo. Gostaria que navegadores open source (como o Firefox) trouxessem em breve funções alternativas próprias com LLM, seria ideal algo processado no dispositivo em vez de LLM em nuvem, mas o problema é que quase todos os bons engenheiros de ML já foram para as big techs.
Fico curioso sobre qual o valor real disso. Não testei pessoalmente, mas pelos reviews do YouTube parece bem instável e não tão útil, me lembrou o início do Siri; no fim, acabei usando só para timer, controle de música e funções pouco relevantes.
Claramente os recursos de agente de IA parecem tendência. A sensação é que o Gemini também vai acabar se integrando ao Chrome rápido; quando ele tiver um modo de agente próprio, pode engolir o mercado de navegadores.
O medo das pessoas é a versão com agente de IA de navegadores como o Chrome atual. Não é um medo irracional, mas sou cético quanto ao sucesso massivo. O ecossistema do navegador precisa mudar, porém, no geral, as pessoas continuam usando o que já conhecem e só mudam se houver grande incômodo ou obrigação. Talvez até essa mudança aconteça.
Pessoalmente, prefiro de longe um modelo de plug-in sandboxado do que gerenciar o navegador inteiro dessa forma; ainda assim, o Comet me agradou.
A ideia de surgir “uma única Big Tech que sabe tudo e gerencia tudo” me dá rejeição total. Não quero entregar mais minha vida e meus dados para empresas que já têm muito poder sobre mim. Ainda não vi casos em que IA realmente melhorou minha vida. Vou usar o Lynx. A IA bagunçando resultado de busca até páginas da web só me causa incômodo.
Testei o modo agent do Atlas e ele me trouxe comentários no HN que eu poderia acrescentar insights com base nas minhas experiências e interesses. O resultado foram 7 comentários sobre startup/cloud que conheço bem e 3 sobre Fine-tuning de LLM que não conheço. O conteúdo recomendado era exatamente o que eu diria, mas senti distância no modo como falava. Depois do teste, pensei que essa ferramenta pode transformar atividades que eu fazia com mais afinco em trabalho sem alma. A ferramenta é interessante, mas ainda não sei exatamente para que vou usá-la.
Fiquei curioso sobre por que o Atlas só suporta macOS; se tivesse suporte a Linux ou Windows, pareceria mais um lançamento completo.
Vejo claramente utilidade, mas me dá uma sensação forte de passar o dia inteiro para a empresa de IA. Se tenho dúvida, parece melhor abrir só o app do ChatGPT e perguntar. No meu critério, fica na mesma categoria do plug-in do Honey, mas acho que aqui o risco de perda de dados é bem mais sério. Não consigo confiar nem por um segundo que os dados sejam realmente privados.
O Atlas claramente é baseado em Chromium, mas não há menção ao Chromium, licenciamento ou crédito em nenhum lugar, e a página chrome:// está toda bloqueada. Se é um projeto open source, acho que deveria haver transparência mínima da base e da origem. Talvez no início possa ter falhas, mas esse tipo de transparência é básico. Fico curioso se isso é padrão ou se só eu acho estranho.
No
Help > ChatGPT Atlas Help, há documentos, e aparece uma frase dizendo: “Atlas é o navegador baseado no Chromium para Mac da OpenAI”, que parece ser a orientação oficial.Pelas exigências da licença oficial, a licença BSD do Chromium exige atribuição clara de derivativos; o conteúdo do arquivo NOTICE deve aparecer em algum ponto do artefato. Isso é obrigação legal, então foi uma surpresa o Atlas ter omitido isso: Chromium BSD License
Quando perguntei ao Atlas, ele indicou indiretamente que existe
atlas://credits, mas não há um caminho ou localização oficial de acesso/ exposição.A empresa conhecida por plágio agora parece também ser aquela que não reconhece open source; vejo certa consistência nisso.
Honestamente, sem complicar, dá a impressão de que houve tentativa de remover qualquer rastro do Chromium/Google. Não há menção em lugar nenhum, páginas chrome:// bloqueadas, a UI remove totalmente a cara open source. A falta de transparência pesa ainda mais porque já existe a obrigação legal de atribuição.
A OpenAI parece estar aproveitando o que a Apple Intelligence não resolve, e eu preferia que essas funções fossem integradas ao macOS. Seria ideal maximizar computação local/proteção de privacidade via FoundationLLM e acionar modelos de ponta no próprio servidor só quando necessário. O macOS precisa, a meu ver, fazer uma integração mais profunda da qualidade do assistente de IA no nível do SO. A Apple Intelligence é um bom ponto de partida, mas a potência de modelo local é insuficiente e funcionalidades realmente importantes acabam escondidas no stack.
Não uso extensões de LLM do Chrome porque não confio na coleta excessiva de dados do navegador; agora a preocupação é a mesma, só que de uma big tech que tem boa imagem de confiança. Também não sei se isso é melhor de verdade.
Se empresas com foco em privacidade como Private Internet Access ou NordVPN lançassem uma extensão ou um navegador com IA, haveria grande valor nisso. Se conseguissem anonimizar tráfego e rodar múltiplos modelos de LLM, poderiam atrair usuários de OpenAI e Perplexity pela imagem de privacidade.
O OpenAI já teve caso no app de desktop do ChatGPT para macOS com pinagem de certificado que dificultava fiscalização.
Acho que é um erro imaginar que um plug-in de LLM consegue acessar mais dados que o plug-in comum; parece um equívoco sobre a estrutura
manifestdas extensões Chrome.Eu acho que LLM pode ser muito poderoso no contexto certo, mas mesmo assim prefiro manter distância. Para o que eu preciso, é melhor ir diretamente ao que é útil; não quero a IA sempre me seguindo e observando.
Se essa tecnologia parecer útil, imagine o quanto regimes autoritários a desejariam. Se anúncios já me deram arrepios antes, o Atlas é um serviço de keylogger em nível root. Não sei por que deveria permitir que uma empresa de IA colete e registre todas as minhas interações de navegador. O Google já faz isso no Chrome; otimizar anúncios e procurar treinar modelos gerais de IA capturando o próprio processo cognitivo humano são coisas totalmente diferentes.
Dei uma olhada superficial na página do produto e não consigo achar base sólida para afirmar que Atlas registra/coleta mais informações que a combinação Chrome+Gemini. A maioria dos recursos já existe no Chrome, e se ambos registram tudo que você digita, o Google também poderia fazer. Na prática, os dois parecem ter o mesmo objetivo de modelagem preditiva do usuário.
Há semelhança com o Recall da Microsoft, e a diferença é que no Atlas o usuário libera explicitamente essa função; para a OpenAI, certamente surge uma nova oportunidade de segmentação publicitária.
O modelo de dados para publicidade por demografia/pagamento/localização/renda e medir o padrão de pensamento do usuário para treinar IA geral são coisas bem diferentes. Se o Atlas vencer, o Google certamente copiará; já existe Chrome+Gemini, e integrar o Gemini ao Chrome é rápido, com TPU dedicado vira praticamente igual ao Atlas.
Meu navegador roda como root? O Atlas roda em root? O Atlas é um keylogger de todas as teclas? Quero saber se isso realmente acontece.