Como evitar verificações de bot ao fazer web scraping
(piprogramming.org)Baseado em Selenium, mas pode ser aplicado em outros lugares também
-
Remover a flag
Navigator.Webdriver -
Remover determinadas strings do ChromeDriver / GeckoDriver
-
Alterar resolução,
User-Agentetc. -
Usar o fluxo real de URL. Evitar visitar links invisíveis
-
Alterar o IP usando proxy
-
Usar valores de atraso aleatórios
-
Não usar navegador headless (a verificação pode ser feita checando a permissão de notificações)
2 comentários
No caso 1, no Puppeteer há lugares em que mesmo configurar apenas
true/falsefaz com que ele seja detectado como bot.Então é melhor apagar a propriedade completamente, como abaixo.
É um bom ponto :) Eu substituí o código