ArchiveTeam conclui o arquivamento de todos os links encurtados do goo.gl
(tracker.archiveteam.org)- A ArchiveTeam arquivou com sucesso todos os links encurtados do goo.gl
- Qualquer pessoa pode participar de projetos de arquivamento por meio do programa virtual de arquivamento ArchiveTeam Warrior
- Esse Warrior pode ser executado sem riscos separados em ambientes Windows, OS X e Linux
- Com uma configuração simples, o usuário pode escolher projetos e participar das atividades
- Oferece uma forma fácil e intuitiva de ajudar nas atividades de arquivamento sem necessidade de conhecimentos técnicos especiais
Introdução ao ArchiveTeam Warrior
- O ArchiveTeam Warrior é um appliance virtual de arquivamento que qualquer pessoa pode usar com facilidade
- Ao executar o Warrior, o usuário pode participar do trabalho de baixar sites e outros conteúdos e enviá-los para o arquivo da ArchiveTeam
- O Warrior não oferece riscos ao ambiente real do computador e usa apenas largura de banda da internet e um pouco de espaço em disco
- É compatível com Windows, OS X e Linux, e requer um programa de máquina virtual como VirtualBox ou VMware
Como usar com o VirtualBox
- Baixe o appliance Warrior (357 MB)
- No VirtualBox, clique no menu File > Import Appliance e carregue o arquivo baixado
- Ao iniciar a máquina virtual, ela recebe automaticamente as atualizações mais recentes e solicita o uso do navegador da web
Processo após iniciar o Warrior
- Acesse e confira a página Settings
- Escolha um nome de usuário para exibir o progresso no leaderboard
- Na aba All projects, selecione o projeto desejado para participar, ou escolha ArchiveTeam’s Choice para entrar no projeto mais urgente
Vantagens de participar
- Sem necessidade de conhecimentos especiais nem processos complexos, qualquer pessoa pode contribuir facilmente com projetos de arquivamento
- O histórico de atividades de arquivamento do usuário aparece no leaderboard, o que ajuda na motivação e na colaboração
1 comentários
Comentários do Hacker News
Sempre fico impressionado quando o ArchiveTeam faz projetos assim. Alguns anos atrás, quando a plataforma de vídeo em que eu trabalhava estava prestes a anunciar o encerramento do serviço, acabei entrando em contato com uma pessoa do ArchiveTeam e ouvi que ela tinha interesse em preservar os dados. Dei algumas dicas a essa pessoa (informações sobre endpoints do servidor que poderiam dificultar o arquivamento) e emprestei temporariamente algumas das minhas instâncias EC2. Como os servidores eram meus, pude ver o que estava acontecendo: em 2 minutos as instâncias estavam totalmente prontas e começaram a arquivar vídeos rapidamente, e cada instância baixava vídeos diferentes com eficiência, sem duplicação. O ArchiveTeam sempre tem uma ótima missão, mas a eficiência da execução deles é realmente impressionante.
O título não está correto. Na verdade é o Archiveteam.org, e não o Archive.org. O Internet Archive fornece espaço de armazenamento, mas o trabalho real de arquivamento é feito pelos membros do Archiveteam.
Queria compartilhar material relacionado: "Junte-se à guerra contra o link rot" (link), vários tópicos do HN sobre mudanças na política do goo.gl pelo Google (coletânea de posts relacionados de 2018 a 2025, aqui, aqui, aqui, aqui, aqui, aqui). Há várias discussões, então espero que seja útil.
Compartilhando a atualização mais recente do Google: link para a atualização no blog do Google
Existe alguém arquivando o reddit ou o twitter por completo? Estou curioso, mesmo que os Terms deles tenham mudado e não permitam isso.
Não estou entendendo bem a página. Há uma lista de datasets (acho eu?), e o tamanho parece chegar a 91 TiB. Não parece que uma lista de links curtos do Google e URLs de destino precisaria de 91 TiB. Alguém sabe como isso funciona?
Fico feliz por ter contribuído nem que seja um pouco com esse arquivamento.
docker containerpor um dia e depois esquecer dele.Fico curioso sobre quantos links apontam para vídeos privados do YouTube, Google Docs e coisas do tipo.
Fico curioso se "all" significa realmente todas as URLs publicamente acessíveis, ou se eles tentaram iterativamente o namespace inteiro de URLs.