- O servidor Chrome DevTools MCP foi aprimorado para permitir que agentes de codificação se conectem diretamente a uma sessão ativa do navegador
- Com esse recurso, os agentes podem reutilizar uma sessão já autenticada ou acessar uma sessão de depuração ativa do DevTools
- No Chrome M144 (beta), ao usar a opção
--autoConnect, o servidor MCP se conecta automaticamente a uma instância do Chrome já em execução
- A cada conexão, é exibida uma caixa de diálogo de aprovação do usuário e, durante a depuração, aparece o banner “Chrome is being controlled by automated test software”
- É possível alternar livremente entre depuração manual e depuração assistida por IA, aumentando a eficiência no desenvolvimento
Visão geral das melhorias no servidor Chrome DevTools MCP
- O servidor Chrome DevTools MCP foi atualizado para permitir que agentes de codificação se conectem diretamente a uma sessão ativa do navegador
- Os usuários podem reutilizar uma sessão já autenticada, permitindo depurar sem login adicional
- É possível pedir ao agente para investigar itens selecionados nos painéis Network ou Elements da interface do DevTools
- As formas de conexão existentes também continuam disponíveis, incluindo uso de um perfil dedicado ao servidor MCP, conexão por porta de depuração remota e execução de múltiplas instâncias com perfis temporários
Como funciona (How it works)
- O Chrome M144 (atualmente em beta) recebeu um recurso de solicitação de conexão de depuração remota
- Quando o servidor MCP é executado com a opção
--autoConnect, ele se conecta automaticamente à instância ativa do Chrome e solicita uma sessão de depuração remota
- Para reforçar a segurança, o Chrome exibe uma caixa de diálogo de aprovação do usuário a cada solicitação, permitindo a conexão somente após a aprovação
- Quando a sessão de depuração é ativada, o banner “Chrome is being controlled by automated test software” é exibido na parte superior do navegador
Primeiros passos (Get started)
- Para usar o novo recurso de depuração remota, é preciso ativar a depuração remota no Chrome e configurar o servidor MCP
Etapa 1: configurar a depuração remota no Chrome
- Acesse
chrome://inspect/#remote-debugging para ativar a depuração remota
- Escolha, na caixa de diálogo, se deseja permitir a conexão de depuração
Etapa 2: configurar a conexão automática do servidor MCP
- Ao executar o servidor
chrome-devtools-mcp, adicione o argumento --autoConnect
- Exemplo de configuração (gemini-cli):
{
"mcpServers": {
"chrome-devtools": {
"command": "npx",
"args": [
"chrome-devtools-mcp@latest",
"--autoConnect",
"--channel=beta"
]
}
}
}
- Até que o Chrome M144 chegue ao canal estável, é necessário especificar
--channel=beta
Etapa 3: testar a configuração
Depuração integrada com agentes de codificação
- Ao se conectar a uma instância ativa do Chrome, é possível combinar automação e controle manual
- Depois que o usuário encontrar o elemento com problema no DevTools, pode passá-lo ao agente de codificação e pedir a correção
- O mesmo vale no painel Network, onde também é possível selecionar uma solicitação e instruir o agente a analisá-la
- Está previsto ampliar gradualmente, por meio do servidor Chrome DevTools MCP, o acesso a dados adicionais de painéis
1 comentários
Comentários do Hacker News
Estou usando Playwright para interceptar todas as requisições e respostas, registrando o tráfego relevante enquanto o Claude Code navega por sites como o YouTube, clicando e digitando
Com base nesses dados coletados, gero automaticamente uma API fortemente tipada para poder interagir com qualquer site por meio da API interna
Claro, isso provavelmente viola os termos de serviço, mas a vantagem é não precisar carregar anúncios, imagens nem toda a marcação
Se houver interesse, pretendo publicar isso ainda esta semana
Na prática, foi assim que fabricantes de LLM como Anthropic e OpenAI já trabalharam
É irônico chamarem de ‘presente de Deus’ quando eles burlam anúncios ou baixam obras protegidas, mas de ‘maldição do diabo’ quando o Zuck faz a mesma coisa
Principalmente para reproduzir o layout e os estilos da página em pontos específicos da árvore DOM, ou para capturar automaticamente o comportamento responsivo
Com Playwright, ajusto a largura da tela enquanto acompanho as mudanças de estilo, e salvo capturas de tela e dados hierárquicos de estilo juntos
Existem ferramentas de inspeção manual, mas são lentas e ineficientes demais
Pessoalmente, acho muito mais eficiente criar uma CLI personalizada do que usar MCP
O realmente poderoso é a IA acessar isso diretamente e aproveitar via ‘skills’
Parece que o Claude já conseguiria gerar código determinístico diretamente se tivesse apenas um agent-browser
O projeto DevTools MCP lançou recentemente uma CLI independente
Pela documentação do chrome-devtools-cli, ela está incluída na versão v0.20.0
É uma boa notícia para quem estava preocupado com o problema do custo de tokens no MCP
(Só para constar, eu trabalhava no time de DevTools e ainda trabalho)
Tenho usado TideWave nos últimos meses
O tidewave.ai era originalmente baseado em Elixir/LiveView, mas agora também oferece suporte a frameworks JS e RoR
Essa ferramenta não permite apenas acesso ao navegador, mas também ao runtime do app
Ou seja, o agente pode acessar diretamente o banco de dados e os endpoints, o que a torna muito poderosa
A Google está muito atrás em CLI de programação agentic
O Gemini CLI é tão ruim que dá para ver que nem internamente eles usam
Acho que o MCP já é uma tecnologia morta. Ferramentas de CLI são mais rápidas, mais flexíveis, e já existem muitos ambientes treinados nelas
Para desenvolvedores sérios, o padrão é usar Playwright e headless Chromium
O MCP só é atraente para iniciantes
Só com CLI, a complexidade de segurança e operação fica grande demais
Mas concordo que o Gemini CLI é péssimo
A Anthropic tentou melhorar, mas o problema de inchaço de contexto continua
Servidores MCP ocupam contexto mesmo quando não são usados
Agora é preciso migrar para agent skills
Eles usam serviços MCP para busca de código, acesso à documentação, consulta de bugs e conexão com bancos de dados RAG
(Ouvi isso diretamente de pessoas de dentro do Google)
E, se o MCP ocupa contexto, também fico na dúvida se uma skill de CLI sairia de graça
Já existe uma agent skill que implementa isso
Uso o chrome-cdp-skill todos os dias e ele é realmente incrível
Por exemplo, com o codex consegui gerenciar minha biblioteca de música local, abrir uma aba do YT Music, buscar um álbum e passar a URL para o yt-dlp
Só que, por enquanto, ele é exclusivo do Chrome, então para usar outro navegador é preciso alterar o caminho do binário
A área de automação de navegador + agentes já está bastante competitiva
O DevTools MCP e a nova CLI são mantidos pelo time de Chrome DevTools & Puppeteer, então provavelmente serão mais estáveis
Ainda assim, é bom ver como a concorrência open source gera inovação
Acho melhor usar uma ferramenta estável como playwriter.dev
Eu criei um proxy WebSocket + extensão do Chrome para permitir que o agente controle o DOM
Configurei para acessar via browserbox, com cookies de sessão permitidos
No momento, estou usando isso como middleware de pesquisa para aumentar a taxa de sucesso no uso de ferramentas por agentes
Uso esse MCP há bastante tempo, e ele foi mais estável quando combinado com codex on opencode
Fiquei especialmente impressionado quando o usei como um REPL de edição de SVG, porque ele gerou automaticamente ícones personalizados muito bons
Também funciona bem para engenharia reversa e extensões em apps Electron
Testei o playwriter, e a forma como ele se conecta a sessões existentes funcionou surpreendentemente bem
Também implementei algo parecido com Playwright
Antes, o consumo de tokens era enorme e isso custava caro, mas resolvi criando um wrapper que salva os resultados em disco para o agente consultar
Dá para ver em uisnap.dev
Fiquei curioso para saber se este projeto resolveu o problema do consumo de tokens
Dá para ver em playwright-slim-mcp
Testei o firefox-devtools-mcp, e ele foi muito mais rápido e eficiente do que o MCP padrão do Chrome