- Archiver de Multi-Page Application (MPA) que rastreia uma aplicação web de múltiplas páginas em um arquivo Zip e permite servi-la imediatamente
- Ao executar
mpa http://example.net, faz rastreamento recursivo usando Puppeteer headless (usa número de threads igual a CPU / 2)
- Obtém o sitemap e o usa como ponto inicial
- Rastreia apenas URLs do site, mas também faz
fetch de recursos externos
- Armazena os recursos do site
- Gera
mpa/sitemap.txt e mpa/sitemap.xml
- Se for interrompido, pode ser reiniciado. Salva um checkpoint a cada 250 URLs
- No caso de SPA, é possível salvar o HTML original com a opção
--spa
Ainda não há comentários.