9 pontos por xguru 2020-05-12 | 3 comentários | Compartilhar no WhatsApp
  • Captura baseada no tráfego de rede do navegador, e não em crawling

→ permite capturar todos os arquivos de mídia, JavaScript complexo e até conteúdo dinâmico com a sessão já autenticada

  • Grava no padrão WARC, permitindo revisitar depois de forma interativa

  • Automação de captura de sites populares com o AutoPilot

  • Versão online e executável para desktop em Electron / player disponíveis (Windows/macOS/Linux)

3 comentários

 
galadbran 2020-05-13

Uau, eu nem sabia que isso também tinha um padrão... Mas, se for um método via rede, ele oferece suporte a SSL?

 
kunggom 2020-05-12

Então isso também tinha um padrão, é?

Lembro que antigamente foi adicionada uma função parecida às ferramentas de desenvolvedor do Firefox, mas o problema é que no meu MacBook era tão lento que ficava realmente difícil de usar. O tamanho dos arquivos também era enorme. Não sei se este aqui será melhor.

 
xguru 2020-05-12

No Instagram, ao aplicar o AutoPilot, ele rola automaticamente e captura o feed do usuário em sequência.

Como não é totalmente adequado para páginas com rolagem infinita, o Facebook alterado desta vez não está sendo capturado muito bem.

Padrão WARC https://iipc.github.io/warc-specifications/