2 pontos por GN⁺ 2025-04-08 | 1 comentários | Compartilhar no WhatsApp
  • Ferramenta que conecta apps de IA ao navegador por meio do MCP, permitindo automatizar tarefas em sites
    • Por exemplo, automatizar tarefas de preenchimento repetitivo de formulários em sites
  • Automação de fluxo de trabalho: acelera tarefas e automatiza processos para aumentar a eficiência
  • Testes automatizados: usa um editor com IA para executar automaticamente testes end-to-end do código. Testa fluxos de usuário, valida elementos da UI e verifica se a aplicação funciona como esperado em diferentes cenários
  • Automação de tarefas: automatiza com facilidade tarefas repetitivas baseadas na web, como coleta de dados, preenchimento de formulários e automação de workflows, economizando tempo e reduzindo erros

Vantagens do Browser MCP

  • Velocidade: a automação acontece localmente, melhorando o desempenho sem latência de rede.
  • Privacidade: como a automação ocorre localmente, a atividade do navegador permanece no dispositivo e não é enviada para servidores remotos.
  • Manter login: usa o perfil existente do navegador para manter o login em todos os serviços.
  • Discrição: usa a impressão digital real do navegador para evitar detecção de bots e CAPTCHA.

Como usar

  1. Instalar a extensão Browser MCP: adicione a extensão Browser MCP ao navegador.
  2. Configurar o servidor MCP: adicione o servidor Browser MCP ao aplicativo de IA para conectá-lo à extensão do navegador.
  3. Iniciar a automação: crie workflows automatizados e deixe o assistente de IA lidar com tarefas repetitivas no navegador.

Ferramentas de automação do navegador

  • Navegar: ir para uma URL
  • Voltar: ir para a página anterior
  • Avançar: ir para a próxima página
  • Aguardar: esperar pelo tempo especificado (em segundos)
  • Pressionar tecla: pressionar uma tecla no teclado
  • Snapshot: capturar um snapshot de acessibilidade da página atual
  • Clique: realizar um clique na página web
  • Arrastar e soltar: executar drag and drop entre dois elementos
  • Hover: passar o mouse sobre um elemento da página
  • Inserir texto: inserir texto em um elemento editável
  • Selecionar opção: selecionar uma opção em um menu suspenso
  • Obter logs do console: obter os logs do console do navegador

Aplicativos de IA com MCP compatíveis

  • Cursor
  • Claude
  • Windsurf
  • VSCode

1 comentários

 
GN⁺ 2025-04-08
Comentários no Hacker News
  • O site afirma que "usa impressões digitais reais do navegador para evitar detecção de bots e CAPTCHA"

    • Já usei um sistema parecido, mas quando a IA controlava o navegador, CAPTCHAs apareciam e eu era bloqueado em vários sites
    • Quando parei de usar a sessão do navegador, o bloqueio foi removido, mas esse método não é uma solução universal
  • Este sistema parece uma cópia desatualizada do Playwright-MCP da Microsoft

  • Seria útil ter um navegador que pudesse filtrar produtos em sites de compras com base em condições específicas

  • Não sei o que é MCP e agora já estou até com medo de perguntar

  • A tarefa de pesquisar informações na web e inserir os resultados no Google Sheets funcionou quase perfeitamente no começo, mas falhou nas tentativas seguintes

    • Fico me perguntando se há um problema de latência entre o navegador e o app MCP
    • Na primeira tentativa, cliquei rapidamente na permissão de "permitir este chat", mas nas tentativas seguintes o LLM relatou problemas ao clicar
    • Clicar no título da planilha do Google e digitar um nome funcionou na primeira vez, mas falhou nas tentativas seguintes
    • Identificar as células A1, B1 etc. e inserir em uma linha também funcionou na primeira vez, mas falhou nas tentativas seguintes
    • Na primeira tentativa foi quase perfeito, mas depois não foi 100% reproduzível
    • A experiência é fluida, e a configuração e a execução são excelentes
  • Quando testei no Claude Desktop, funcionou de forma fluida e foi menos incômodo que o Playwright

    • Seria bom ter um recurso que pausasse a automação e notificasse o usuário ao detectar um CAPTCHA na página
    • O Playwright continua tentando lidar com o CAPTCHA
  • Seria bom poder navegar pela página usando a árvore de acessibilidade das ferramentas de desenvolvedor do Chrome

  • Isso me anima para tarefas manuais, especialmente coisas como pedidos de reembolso

    • Todo mês, é incômodo fazer login no provedor de serviço, baixar o extrato, criar um documento no Google, escrever um e-mail e enviar os arquivos
    • A automação já é possível, e um aplicativo de rastreamento de despesas de verdade poderia reduzir metade desse trabalho
    • Ferramentas de IA têm potencial para eliminar especificações detalhadas
    • Esses fluxos de trabalho costumam ser afetados por pequenas mudanças
  • Fico me perguntando se MCP é o novo RPA (automação robótica de processos)

  • Faço um trabalho semelhante controlando sintetizadores de hardware para fazer sound design sem tocar nos knobs físicos