Comet - o Web Agent e navegador da Perplexity
(perplexity.ai)Comet: o novo navegador criado pela Perplexity
Já faz um tempinho desde o lançamento, mas resolvi escrever depois de passar da lista de espera e testar.
Visão geral
Comet é um navegador com IA desenvolvido pela Perplexity, pensado para maximizar o foco e o fluxo de trabalho do usuário, transformando curiosidade em execução.
Principais recursos e características
-
Busca com IA integrada, contexto imediato e automação de sites
- É possível resumir, comprar, agendar e pesquisar direto no navegador
-
Comet Assistant
- Automatiza tarefas repetitivas como clicar, digitar, enviar e preencher automaticamente
-
Automação até de tarefas complexas
- Dá suporte a toda a jornada de compra, da comparação de produtos ao pagamento
-
Gestão integrada
- Integração com e-mail e calendário (Gmail, Google Calendar)
- Resolve briefing de agenda e até agendamento de e-mails/eventos dentro do navegador
-
Experiência personalizada
- Aprende padrões de uso e organiza automaticamente abas e insights
-
Encontre respostas direto nas suas atividades
- Suporta busca em dados pessoais como histórico, vídeos e documentos
-
Ações inteligentes e foco por aba
- O recurso
@tabfornece respostas em tempo real de acordo com a aba aberta
- O recurso
Casos de uso
A Perplexity também publicou mais casos de uso no LinkedIn
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
Opinião pessoal após usar o serviço
Tecnologia
- Navegador Chromium + Perplexity + formato de Web Agent
- Consulta em linguagem natural -> extração de intent/slot -> mapeamento de DOM semântico -> conversão em ações -> execução de eventos (web Tool) -> parsing e pré-processamento do resultado -> provável estrutura no formato ReAct
- O Comet tira capturas de tela para permitir acompanhar o estado atual da tarefa, mas ainda preciso verificar melhor se ele analisa isso usando um modelo de visão
Casos de teste
(1) Redação de e-mail
- Usou adequadamente o site do Google Mail para redigir um e-mail
- O Agent não envia de fato o e-mail e opta por salvá-lo como rascunho
(2) Busca de rota no Naver Maps + recomendação de restaurantes próximos
- Após abrir a página do Naver Maps, pedi uma rota da Estação de Seul até Jamsil, e ele encontrou o caminho usando corretamente o serviço do Naver Maps (como uma pessoa faria)
- Para buscar restaurantes próximos, não usou o Naver Maps e sim a Search Tool já existente da Perplexity
(3) Raspagem de preços do Open AI Platform
- Pelo que sei, o Open AI Platform usa Remix, e alguns preços de API ficam ocultos em toggles
- Pedi explicitamente ao Comet para abrir os toggles, verificar os preços de todas as APIs e me entregar o resultado em Markdown, e ele respondeu adequadamente
- Ainda assim, é necessário prompt engineering para extrair as informações com precisão
- Também pedi para verificar a página de API da Anthropic, mas como o layout da página (dividers) era ambíguo, ele não conseguiu fazer parsing preciso de uma política de API complexa. Os preços básicos da API, porém, foram extraídos corretamente.
Opinião pessoal
- Ao desenvolver um agente de navegação, deve ter havido muitos pontos a considerar, como contexto, renderização etc., e fico curioso sobre como isso foi resolvido.
- Tecnicamente há um fator wow, mas do ponto de vista de produto ainda parece um pouco nebuloso.
- Pode variar de pessoa para pessoa, mas eu ainda não entendo claramente por que deveria usar este produto, por que valeria pagar para usar o Comet e que problema meu, como cliente, ele resolveria. Em outras palavras, a proposta de valor ainda não está clara para mim. No momento, minha reação é mais algo como: “Nossa, que interessante, isso funciona; vou testar mais algumas vezes quando lembrar”.
- Claro que a Perplexity apresenta casos de uso, mas continuo pensando: “isso realmente precisa ser resolvido com um Agent? (Se eu fizer sozinho, não é mais rápido?)” e “será que ele realmente resolveu o problema por completo?”.
- Imagino, com certa cautela, que isso talvez aconteça porque o navegador está mais próximo de uma camada de infraestrutura.
- Como um navegador baseado em AI Agent é, de certa forma, um novo formato, acho que o ideal seria mostrar melhor aos clientes algo como: “qual é o seu problema e como o Comet pode realmente resolvê-lo de forma completa”.
- Acho que vale continuar observando e usar mais um pouco. Fico pensando em como esse problema de produto poderia ser resolvido.
UI
É uma análise pessoal que fiz. (Estou trabalhando nisso para tentar recriá-lo por engenharia reversa...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
4 comentários
Uma curiosidade: quando você testou, havia limite de uso de consultas para esse agente Comet? Ou, como em outras ferramentas, por estar em período de testes as consultas não importavam? Lembro que havia algo como pro-max, então fiquei curioso e pergunto.
No momento, sou assinante do plano Pro. Talvez eu use relativamente pouco, mas, incluindo o Comet, ainda não bati em nenhum limite no Perplexity até agora. Até parece mais folgado do que eu esperava.
Como o plano de assinatura não informa o rate limit, é difícil ter certeza.
Pelo menos por enquanto, parece que o beta release foi liberado de forma diferente do Pro Max.
https://perplexity.ai/help-center/en/…
É uma impressão pessoal, mas, como você disse, talvez por ser um período de testes, parece que a quantidade de queries não importa muito. Cheguei a confirmar que funciona até abrindo 12 navegadores virtuais em paralelo de uma vez. Isso é impressionante.
Li tudo com atenção.
Como esperado, então é um pouco decepcionante..
Concordo com isso.
Ex:) ao pedir para ler a página de notícias da Naver e resumir o tom de cada jornal sobre a negociação tarifária, ele responde inventando o posicionamento de jornais que nem leu, com base em “preconceitos pré-treinados sobre a inclinação de cada veículo”.