8 pontos por xguru 2024-12-18 | 1 comentários | Compartilhar no WhatsApp
  • Uma nova forma de usar o navegador
  • Com base no Gemini 2.0, automatiza tarefas no navegador usando poderosas capacidades multimodais de compreensão e raciocínio
  • Entende e raciocina sobre todos os elementos da tela do navegador, como pixels, texto, código, imagens e formulários
  • Native Multimodality: entende e raciocina sobre todo o conteúdo no navegador
    • Analisa elementos complexos de sites, como texto, código e imagens
    • Responde a comandos de voz e fornece feedback visual sobre o andamento das tarefas
  • Browser Interaction: entende e navega por sites complexos em tempo real
    • Interage com sites no lugar do usuário
    • Automatiza tarefas repetitivas para economizar tempo
    • Solicita esclarecimentos quando não entende um comando
  • Reasoning: entende instruções complexas e as divide em etapas executáveis para realizá-las
    • Identifica as relações e funções entre elementos da web
    • Mostra de forma transparente o planejamento e o processo de execução, permitindo que o usuário compreenda o processo de tomada de decisão
  • Atualmente disponível apenas para um pequeno grupo de testes confiável: quem quiser participar dos testes precisa entrar na lista de espera

1 comentários

 
iolothebard 2024-12-18

Um navegador headless otimizado para IA aparece…
Os servidores web passam a enviar respostas otimizadas para esse navegador…
O dia em que eles(?) vão conversar entre si não está longe…