3 pontos por GN⁺ 2026-03-16 | 1 comentários | Compartilhar no WhatsApp
  • O servidor Chrome DevTools MCP foi aprimorado para permitir que agentes de codificação se conectem diretamente a uma sessão ativa do navegador
  • Com esse recurso, os agentes podem reutilizar uma sessão já autenticada ou acessar uma sessão de depuração ativa do DevTools
  • No Chrome M144 (beta), ao usar a opção --autoConnect, o servidor MCP se conecta automaticamente a uma instância do Chrome já em execução
  • A cada conexão, é exibida uma caixa de diálogo de aprovação do usuário e, durante a depuração, aparece o banner “Chrome is being controlled by automated test software”
  • É possível alternar livremente entre depuração manual e depuração assistida por IA, aumentando a eficiência no desenvolvimento

Visão geral das melhorias no servidor Chrome DevTools MCP

  • O servidor Chrome DevTools MCP foi atualizado para permitir que agentes de codificação se conectem diretamente a uma sessão ativa do navegador
    • Os usuários podem reutilizar uma sessão já autenticada, permitindo depurar sem login adicional
    • É possível pedir ao agente para investigar itens selecionados nos painéis Network ou Elements da interface do DevTools
  • As formas de conexão existentes também continuam disponíveis, incluindo uso de um perfil dedicado ao servidor MCP, conexão por porta de depuração remota e execução de múltiplas instâncias com perfis temporários

Como funciona (How it works)

  • O Chrome M144 (atualmente em beta) recebeu um recurso de solicitação de conexão de depuração remota
    • Quando o servidor MCP é executado com a opção --autoConnect, ele se conecta automaticamente à instância ativa do Chrome e solicita uma sessão de depuração remota
  • Para reforçar a segurança, o Chrome exibe uma caixa de diálogo de aprovação do usuário a cada solicitação, permitindo a conexão somente após a aprovação
  • Quando a sessão de depuração é ativada, o banner “Chrome is being controlled by automated test software” é exibido na parte superior do navegador

Primeiros passos (Get started)

  • Para usar o novo recurso de depuração remota, é preciso ativar a depuração remota no Chrome e configurar o servidor MCP

Etapa 1: configurar a depuração remota no Chrome

  • Acesse chrome://inspect/#remote-debugging para ativar a depuração remota
  • Escolha, na caixa de diálogo, se deseja permitir a conexão de depuração

Etapa 2: configurar a conexão automática do servidor MCP

  • Ao executar o servidor chrome-devtools-mcp, adicione o argumento --autoConnect
  • Exemplo de configuração (gemini-cli):
    {
       "mcpServers": {
        "chrome-devtools": {
          "command": "npx",
          "args": [
            "chrome-devtools-mcp@latest",
            "--autoConnect",
            "--channel=beta"
          ]
        }
      }
    }
    
    • Até que o Chrome M144 chegue ao canal estável, é necessário especificar --channel=beta

Etapa 3: testar a configuração

  • No gemini-cli, execute o seguinte comando:
    Check the performance of https://developers.chrome.com
    
  • O Chrome exibirá uma caixa de diálogo perguntando se o usuário permite a sessão de depuração remota
  • Ao clicar em Allow, o servidor MCP abrirá o site e executará o rastreamento de desempenho

Depuração integrada com agentes de codificação

  • Ao se conectar a uma instância ativa do Chrome, é possível combinar automação e controle manual
    • Depois que o usuário encontrar o elemento com problema no DevTools, pode passá-lo ao agente de codificação e pedir a correção
    • O mesmo vale no painel Network, onde também é possível selecionar uma solicitação e instruir o agente a analisá-la
  • Está previsto ampliar gradualmente, por meio do servidor Chrome DevTools MCP, o acesso a dados adicionais de painéis

1 comentários

 
GN⁺ 2026-03-16
Comentários do Hacker News
  • Estou usando Playwright para interceptar todas as requisições e respostas, registrando o tráfego relevante enquanto o Claude Code navega por sites como o YouTube, clicando e digitando
    Com base nesses dados coletados, gero automaticamente uma API fortemente tipada para poder interagir com qualquer site por meio da API interna
    Claro, isso provavelmente viola os termos de serviço, mas a vantagem é não precisar carregar anúncios, imagens nem toda a marcação
    Se houver interesse, pretendo publicar isso ainda esta semana

    • É interessante que o HN goste dessa ideia
      Na prática, foi assim que fabricantes de LLM como Anthropic e OpenAI já trabalharam
      É irônico chamarem de ‘presente de Deus’ quando eles burlam anúncios ou baixam obras protegidas, mas de ‘maldição do diabo’ quando o Zuck faz a mesma coisa
    • Eu também uso algo parecido
      Principalmente para reproduzir o layout e os estilos da página em pontos específicos da árvore DOM, ou para capturar automaticamente o comportamento responsivo
      Com Playwright, ajusto a largura da tela enquanto acompanho as mudanças de estilo, e salvo capturas de tela e dados hierárquicos de estilo juntos
      Existem ferramentas de inspeção manual, mas são lentas e ineficientes demais
      Pessoalmente, acho muito mais eficiente criar uma CLI personalizada do que usar MCP
      O realmente poderoso é a IA acessar isso diretamente e aproveitar via ‘skills’
    • Fico me perguntando por que seria necessário usar Playwright
      Parece que o Claude já conseguiria gerar código determinístico diretamente se tivesse apenas um agent-browser
    • Tomara que isso seja publicado. Fiquei curioso para saber se você fez isso como uma agent skill
    • Com essa abordagem, será que daria para baixar vídeos do YouTube diretamente sem precisar ficar atualizando como no yt-dlp?
  • O projeto DevTools MCP lançou recentemente uma CLI independente
    Pela documentação do chrome-devtools-cli, ela está incluída na versão v0.20.0
    É uma boa notícia para quem estava preocupado com o problema do custo de tokens no MCP
    (Só para constar, eu trabalhava no time de DevTools e ainda trabalho)

    • Agora, graças ao Tool Search, o MCP não custa nada no CC
  • Tenho usado TideWave nos últimos meses
    O tidewave.ai era originalmente baseado em Elixir/LiveView, mas agora também oferece suporte a frameworks JS e RoR
    Essa ferramenta não permite apenas acesso ao navegador, mas também ao runtime do app
    Ou seja, o agente pode acessar diretamente o banco de dados e os endpoints, o que a torna muito poderosa

  • A Google está muito atrás em CLI de programação agentic
    O Gemini CLI é tão ruim que dá para ver que nem internamente eles usam
    Acho que o MCP já é uma tecnologia morta. Ferramentas de CLI são mais rápidas, mais flexíveis, e já existem muitos ambientes treinados nelas
    Para desenvolvedores sérios, o padrão é usar Playwright e headless Chromium
    O MCP só é atraente para iniciantes

    • Trabalho em um ambiente enterprise de grande porte, e por causa de autenticação, RBAC, limite de taxa e gestão operacional, o MCP ainda é útil
      Só com CLI, a complexidade de segurança e operação fica grande demais
      Mas concordo que o Gemini CLI é péssimo
    • Concordo com a afirmação de que o MCP morreu
      A Anthropic tentou melhorar, mas o problema de inchaço de contexto continua
      Servidores MCP ocupam contexto mesmo quando não são usados
      Agora é preciso migrar para agent skills
    • Só para constar, o Gemini CLI é de fato bastante usado internamente no Google
      Eles usam serviços MCP para busca de código, acesso à documentação, consulta de bugs e conexão com bancos de dados RAG
      (Ouvi isso diretamente de pessoas de dentro do Google)
    • Se o MCP morreu, então com qual CLI eu deveria abrir o Chrome, clicar em botões e ler a saída do console?
      E, se o MCP ocupa contexto, também fico na dúvida se uma skill de CLI sairia de graça
  • Já existe uma agent skill que implementa isso
    Uso o chrome-cdp-skill todos os dias e ele é realmente incrível
    Por exemplo, com o codex consegui gerenciar minha biblioteca de música local, abrir uma aba do YT Music, buscar um álbum e passar a URL para o yt-dlp
    Só que, por enquanto, ele é exclusivo do Chrome, então para usar outro navegador é preciso alterar o caminho do binário

    • É um demo legal, mas acho assustador que um único prompt injection possa dar acesso a todos os dados
    • Isso não é uma skill para o DevTools MCP, e sim um projeto independente
      A área de automação de navegador + agentes já está bastante competitiva
      O DevTools MCP e a nova CLI são mantidos pelo time de Chrome DevTools & Puppeteer, então provavelmente serão mais estáveis
      Ainda assim, é bom ver como a concorrência open source gera inovação
    • Fico em dúvida se alguém realmente usa esse tipo de skill improvisada
      Acho melhor usar uma ferramenta estável como playwriter.dev
  • Eu criei um proxy WebSocket + extensão do Chrome para permitir que o agente controle o DOM
    Configurei para acessar via browserbox, com cookies de sessão permitidos
    No momento, estou usando isso como middleware de pesquisa para aumentar a taxa de sucesso no uso de ferramentas por agentes

  • Uso esse MCP há bastante tempo, e ele foi mais estável quando combinado com codex on opencode
    Fiquei especialmente impressionado quando o usei como um REPL de edição de SVG, porque ele gerou automaticamente ícones personalizados muito bons
    Também funciona bem para engenharia reversa e extensões em apps Electron

  • Testei o playwriter, e a forma como ele se conecta a sessões existentes funcionou surpreendentemente bem

  • Também implementei algo parecido com Playwright
    Antes, o consumo de tokens era enorme e isso custava caro, mas resolvi criando um wrapper que salva os resultados em disco para o agente consultar
    Dá para ver em uisnap.dev
    Fiquei curioso para saber se este projeto resolveu o problema do consumo de tokens

    • Parece que sim, em grande parte. Veja o playwright-cli
    • Eu uso um servidor MCP wrapper que resume snapshots de página com Claude Haiku
      Dá para ver em playwright-slim-mcp
  • Testei o firefox-devtools-mcp, e ele foi muito mais rápido e eficiente do que o MCP padrão do Chrome