Lançamento do navegador Atlas do ChatGPT
Na madrugada de 22 de outubro, a OpenAI lançou o novo navegador web ChatGPT chamado Atlas.
O Atlas é um navegador web baseado em IA construído sobre o ChatGPT, e a OpenAI disse que trabalhou nesse projeto por bastante tempo. A OpenAI acredita que a IA é uma chance que pode surgir apenas uma vez a cada dez anos e afirma que é uma oportunidade para repensar o que um navegador pode fazer, como usamos navegadores e como podemos usar a web da forma mais produtiva e agradável. Como o modelo de abas era excelente, mas há muito tempo não se via inovação significativa em navegadores, a OpenAI começou a repensar o potencial dessa ferramenta.
Embora no passado a barra de endereços e a busca fossem os elementos centrais da experiência online, a OpenAI afirmou que, no futuro, um navegador centrado na experiência de chat terá um papel importante, e por isso passou a projetar o navegador com esse tipo de experiência como foco. Já há muitas tarefas e partes da rotina que ocorrem no navegador, e a OpenAI acredita que, se o ChatGPT se tornar o principal assistente, será possível fazer muito mais: conversar com páginas, usar o ChatGPT para buscar informações e usar o modo agente do ChatGPT dentro do navegador. A empresa diz que mostrará mais recursos para que os usuários possam experimentar em primeira mão.
Funcionalidades centrais do Atlas
O Atlas surgiu da pergunta: "e se pudéssemos conversar com um navegador?".
Com base nessa ideia, o projeto foi reestruturado como uma experiência de chat que simplifica recursos complexos desenvolvidos ao longo de anos. O Atlas não é um navegador tradicional com um simples botão de chat; ele foi projetado tendo o ChatGPT no centro, e o ChatGPT permanece ao lado do usuário enquanto ele navega. Acreditamos que, ao usar o Atlas, as pessoas farão mais perguntas e aprenderão mais.
O Atlas foi projetado para ser rápido e flexível, para suportar experiências novas e surpreendentes.
Entre os principais recursos do Atlas estão o chat em qualquer lugar da web, a memória do navegador e o recurso de agente, no qual o ChatGPT pode executar tarefas em nome do usuário. Este é um novo tipo de navegador para uma nova era da web, e há grandes expectativas sobre seu potencial.
- Função de chat
- Função de memória do navegador
- Função de agente
Principais recursos do Atlas
Ao abrir o Atlas pela primeira vez ou criar uma nova aba, a página inicial é exibida.
Essa tela foi projetada para se parecer com um navegador tradicional, mas com todos os recursos do ChatGPT integrados. No centro da tela há um composer para fazer perguntas no chat, e é possível acessar a barra lateral com ferramentas, modelos e histórico de chat. Por ser um navegador, é possível realizar ainda mais tarefas, como ir a um site específico digitando uma URL ou abrir uma página específica a partir de um favorito. Também é possível usar a memória do navegador para procurar uma página que já foi vista antes, mas cuja localização exata não é lembrada.
A página inicial do Atlas inclui recomendações. Essas recomendações são geradas com base na atividade do usuário e podem sugerir notícias ou tarefas de agente que possam ser do interesse dele. Quanto mais você usar o Atlas, mais as recomendações ficam precisas. Em um exemplo do GitHub, ao trabalhar com código, é possível convidar o ChatGPT para a barra lateral para entender e editar o conteúdo da página da web. Isso transforma a ferramenta de algo que apenas exibe informação em uma ferramenta que pode entendê-la e editá-la.
Abrir nova aba
A página de nova aba é o ponto de partida do Atlas. Ao fazer uma pergunta ou inserir uma URL, você vê resultados mais rápidos e úteis em um único lugar. Fora do chat, para explorar tipos de resultado mais específicos, selecione links de busca, imagens, vídeos e notícias (se disponíveis) na aba.
Perguntar ao ChatGPT
Clique em "Pedir ao ChatGPT" para abrir a barra lateral do ChatGPT na página e tratar resumo, explicação ou tarefas imediatamente na própria janela. Como o ChatGPT consegue ver os detalhes da página em que você está, a resposta é mais útil e sempre com o contexto correto.
Usar o Cursor
O ChatGPT ajuda a fornecer edição inline e sugestões enquanto você escreve em qualquer tela de texto aberto.
Sugestões personalizadas
O ChatGPT lembra o que foi explorado e pode sugerir o que fazer a seguir: retornar a páginas anteriores, aprofundar em um tema, trazer ideias relacionadas ou automatizar tarefas cotidianas.
Perguntar
Se precisar de algo, pergunte a qualquer momento. Digite "Abrir novamente os sapatos que vi ontem" ou "Organizar abas", e o restante fica com o ChatGPT.
Outros
Ao ativar a memória do navegador, o ChatGPT passa a lembrar dos principais detalhes do conteúdo pesquisado para melhorar as respostas no chat e oferecer sugestões mais inteligentes, como montar uma lista de tarefas com base em atividades recentes ou continuar investigando presentes de fim de ano com base em produtos já verificados. A memória do navegador é armazenada de forma privada, sob controle da conta do ChatGPT e do usuário.
Nas configurações, é possível ver todas as memórias, manter apenas o que ainda é relevante e apagar o histórico de busca. Mesmo com a memória do navegador ativada, o toggle da barra de endereços permite decidir em quais sites o ChatGPT pode ou não ver; com a visibilidade desativada, o ChatGPT não consegue ver o conteúdo da página e, nesse site, nenhuma memória é gerada.
Por padrão, o conteúdo de navegação não é usado para treinar o modelo. Se você selecionar esse conteúdo, pode ativar "include web browsing" nas configurações de controle de dados; quando o treino de chat estiver ativado na conta do ChatGPT, também é possível ativá-lo no Atlas. Isso inclui o conteúdo de website anexado ao usar a barra lateral "Pedir ao ChatGPT" e a memória do navegador que fornece informações ao chat.
O controle parental também pode funcionar no Atlas. Se os pais configurarem o controle parental do ChatGPT, essas configurações serão repassadas para as conversas com o ChatGPT no Atlas, e a OpenAI está introduzindo no Atlas novos controles parentais, incluindo a opção de desligar a memória do navegador e o modo agente.
Ao construir a funcionalidade de agente do ChatGPT no Atlas, priorizamos segurança e adicionamos proteções para lidar com novos riscos ligados ao acesso e à busca em sites em que se faz login.
- Não é possível executar código no navegador, baixar arquivos ou instalar extensões.
- Não é possível acessar outros aplicativos do computador ou de outros sistemas de arquivos.
- Pode haver pausa para verificar se ações em sites sensíveis, como instituições financeiras, estão sob observação.
- Em modo de logout, é possível usar o agente para limitar o acesso a dados sensíveis e reduzir o risco de ele agir como um site.
A função de agente do ChatGPT ainda possui riscos. Além de erros ao agir em nome do usuário, o agente também é vulnerável a instruções maliciosas ocultas, que podem estar escondidas em páginas web, e-mails, etc., com intenção de fazer o agente ignorar o comportamento esperado do ChatGPT. Isso pode levar ao roubo de dados em sites com login ou à realização de ações não intencionais.
Como descrito no System Card do agente do ChatGPT, realizamos milhares de horas de red teaming intenso e focamos na proteção contra esses ataques, com ênfase em projetar defensas para que o ChatGPT se adapte rapidamente a novos ataques. Ainda assim, não é possível impedir todos os ataques que surgem com o crescimento da popularidade dos agentes de IA: é preciso que o usuário considere os trade-offs ao decidir quais informações compartilhar com o agente, use o ChatGPT agente no modo logout do Atlas ou monitore a atividade do agente para minimizar a exposição. Continuaremos monitorando e corrigindo vulnerabilidades encontradas.
Este lançamento é um passo em direção a um futuro em que a maior parte do uso da web será feita por meio de um sistema de agente, permitindo delegar rotinas e focar no que é mais importante.
Busca e chat do Cursor
O modo agente do Atlas é um recurso avançado que permite ao Atlas navegar pela web e realizar tarefas para o usuário.
Este recurso pode fazer tarefas que o usuário acha incômodas ou ajudar a aprender a usar um novo software. A OpenAI fica impressionada com o quanto esse agente pode se tornar poderoso quando tem acesso total ao navegador e à internet pessoal do usuário. O modo agente prioriza segurança e integra proteções em todas as camadas da pilha, desde o modelo até a experiência do produto.
Com o modo agente, o ChatGPT pode controlar o navegador do usuário e executar tarefas.
Por exemplo, ele pode verificar uma lista de tarefas no Google Docs, deixar lembretes para pessoas que ainda não atribuíram tarefas, ou mover todas as tarefas concluídas para o Linear, um software de gestão de tarefas. O usuário pode conferir em tempo real o que o agente está fazendo. O modo agente tem acesso à autenticação local e ao histórico do usuário e foi projetado para parecer uma extensão natural do usuário.
Exemplos de uso e considerações de segurança do modo agente
O modo agente também pode ser usado para uso pessoal.
Por exemplo, em uma página de receita culinária, você pode pedir para identificar os ingredientes necessários, calcular as quantidades e gerar uma lista de compras no mercado. O ChatGPT lembra o local de compras preferido do usuário e pode navegar até esse site e adicionar os itens necessários ao carrinho. O modo agente também ajuda o usuário a revisar a lista e adicionar ou remover itens, se necessário.
Compartilhar o agente do ChatGPT com o navegador do usuário pode trazer novos riscos.
Por isso, a OpenAI implementou proteções para que o agente do ChatGPT funcione apenas nas abas do usuário e não execute código no computador ou acesse outros arquivos. Além disso, o usuário pode decidir se o ChatGPT agente pode acessar sites e dados com login, e pode usar o modo secreto conforme necessário. O Atlas oferece várias opções para usar o modo agente com segurança, protegendo as informações pessoais.
Planos futuros
A OpenAI espera que o ChatGPT Atlas seja muito bem recebido pelos usuários.
Ele já começou a ser oferecido para usuários de todo o mundo, começando pela versão para macOS, e o modo agente é oferecido apenas para usuários Plus e Pro. As versões para Windows, iOS e Android também serão lançadas em breve, gradualmente.
A empresa planeja evoluir a ideia de instruções personalizadas que acompanham o usuário na web, com um agente que conhece melhor o usuário, executa tarefas para ele e entrega antecipadamente o que ele deseja.
A OpenAI afirmou que seguirá avançando o ChatGPT Atlas com base no feedback dos usuários no futuro.
3 comentários
Também baixei e usei no dia em que foi lançado, e confirmei o mesmo comportamento que os colegas acima. Como se trata de um erro, acho que vai haver uma correção.
Percebi que tem bastante gente que, ao digitar em coreano, acaba tendo a separação em jamo.
Acabei de instalar e testar e, para mim, a separação de jamo não funcionou. Estou usando a versão Tahoe (26.0.1).