Project Mariner, do Google DeepMind - ferramenta de automação de navegador

xguru · 2024-12-18T11:07:01+09:00

Uma nova forma de usar o navegador Com base no Gemini 2.0, automatiza tarefas no navegador usando poderosas capacidades multimodais de compreensão e raciocínio Entende e raciocina sobre todos os elementos da tela do navegador, como pixels, texto, código, imagens e formulários Native Multimodality: entende e raciocina sobre todo o conteúdo no navegador Analisa elementos complexos de sites, como texto, código e imagens Responde a comandos de voz e fornece feedback visual sobre o andamento das tarefas Browser Interaction: entende e navega por sites complexos em tempo real Interage com sites no lugar do usuário Automatiza tarefas repetitivas para economizar tempo Solicita esclarecimentos quando não entende um comando Reasoning: entende instruções complexas e as divide em etapas executáveis para realizá-las Identifica as relações e funções entre elementos da web Mostra de forma transparente o planejamento e o processo de execução, permitindo que o usuário compreenda o processo de tomada de decisão Atualmente disponível apenas para um pequeno grupo de testes confiável: quem quiser participar dos testes precisa entrar na lista de espera

(deepmind.google)

8 pontos por xguru 2024-12-18 | 1 comentários | Compartilhar no WhatsApp

Uma nova forma de usar o navegador
Com base no Gemini 2.0, automatiza tarefas no navegador usando poderosas capacidades multimodais de compreensão e raciocínio
Entende e raciocina sobre todos os elementos da tela do navegador, como pixels, texto, código, imagens e formulários
Native Multimodality: entende e raciocina sobre todo o conteúdo no navegador
- Analisa elementos complexos de sites, como texto, código e imagens
- Responde a comandos de voz e fornece feedback visual sobre o andamento das tarefas
Browser Interaction: entende e navega por sites complexos em tempo real
- Interage com sites no lugar do usuário
- Automatiza tarefas repetitivas para economizar tempo
- Solicita esclarecimentos quando não entende um comando
Reasoning: entende instruções complexas e as divide em etapas executáveis para realizá-las
- Identifica as relações e funções entre elementos da web
- Mostra de forma transparente o planejamento e o processo de execução, permitindo que o usuário compreenda o processo de tomada de decisão
Atualmente disponível apenas para um pequeno grupo de testes confiável: quem quiser participar dos testes precisa entrar na lista de espera

1 comentários

iolothebard 2024-12-18

Um navegador headless otimizado para IA aparece…
Os servidores web passam a enviar respostas otimizadas para esse navegador…
O dia em que eles(?) vão conversar entre si não está longe…

Project Mariner, do Google DeepMind - ferramenta de automação de navegador

Leituras relacionadas

1 comentários