- Basta inserir uma única linha,
`<script src="page-agent.js"></script>`, e o site se transforma em um app nativo de IA
- Funciona sem extensão de navegador, Python ou navegador headless
- Dê instruções em linguagem natural e a IA cuida do resto. Com o recurso de manipulação de DOM baseada em texto, não há necessidade de screenshots, OCR nem LLM multimodal
- Todo o processamento é feito dentro da própria página, em um modelo de execução in-page, controlando diretamente os elementos do DOM sem solicitar permissões separadas
- Compatível com vários modelos, como OpenAI, Claude, DeepSeek e Qwen, e também pode funcionar totalmente offline com Ollama (integração baseada em chave de API)
- Oferece uma UI interativa e uma interface human-in-the-loop
- Pode ser testado em qualquer página web usando bookmarklet
- Ao instalar a extensão do Chrome, também dá suporte a tarefas conectando múltiplas páginas, além de controle em nível de navegador e integrações externas
- Principais casos de uso
- SaaS AI Copilot: implemente um AI Copilot no produto sem alterar o backend
- Automação inteligente de formulários: encurta processos de cliques em várias etapas para uma única frase, melhorando ERP/CRM/ferramentas administrativas
- Mais acessibilidade: melhora a acessibilidade web com comandos de voz e leitores de tela
- Licença MIT: o repositório é alibaba/page-agent
11 comentários
Uau, que incrível..!!
Nossa, que interessante.
Parece ser uma boa opção para conectar facilmente um LLM à página com um bookmarklet. Para quem fica com um pé atrás com o bookmarklet padrão indo para a Alibaba (China), é possível informar
baseURLeapiKeypara apontar para o endpoint de LLM que você usa. (como um LLM local ou OpenAI, etc.)javascript:(function(){import('https://cdn.jsdelivr.net/npm/page-agent@1.5.5/+esm').then(module=>{window.agent=new module.PageAgent({model:'gpt-5.4',baseURL:'<your-api-url>',apiKey:'<your-api-key>'});if(window.agent.panel)window.agent.panel.show();}).catch(e=>console.error(e));})();
No começo eu pensei "o que é isso, como usa?", mas agora entendi.
Instalei a extensão e, quando pedi no Toss Securities para saber o preço da ação da SOXL de 30 dias atrás, ele mesmo navegou, entrou na página, viu o preço e me informou.
Também é bem mais rápido do que conectar o Playwright com IA.
Isso está bombando nas redes sociais... acho que vou ter que testar também
Incrível, né? Parece que dá para aplicar isso imediatamente em muitas frentes diferentes.
Acho que dá para usar, desde que a parte de segurança seja aprimorada.
Uau, isso é realmente interessante
> Try on Other Sites
> Step 2: Drag this button to your bookmarks
E o site tem uma coisa assim, e quando eu arrastei de verdade, ele foi adicionado aos favoritos. É a primeira vez que vejo isso, muito impressionante; é uma ótima forma de compartilhar bookmarklets.
Ah.. o bookmarklet do GeekNews também existe desde o início da abertura. https://news.hada.io/bookmarklet
Nossa, então até no GeekNews já tinha esse bookmarklet tão bom assim hahaha
Parece que até quem não é técnico vai conseguir usar com facilidade, e realmente parece ser muito bom
Interessante. Parece que a Alibaba lançou mais uma coisa curiosa.
Talvez valha a pena colocar em ferramentas internas de administração do serviço?
Parece que, criando só o CRUD básico e mandando fazer isso e aquilo em sequência, dá para montar um workflow.
O funcionamento da demo é interessante.
Sem colocar isso diretamente no código, usando um bookmarklet,
dá para aplicar em praticamente qualquer site.