-
Visualização de ISBNs
- O Anna's Archive oferece o maior catálogo aberto de livros da história da humanidade.
- Cada pixel representa 2.500 ISBNs, e o pixel aparece em verde quando há um arquivo disponível.
- Apenas 16% de todos os livros têm backup, e ainda há muito trabalho a ser feito.
-
Contexto
- O Anna's Archive cria um catálogo de livros usando números ISBN para fazer backup do conhecimento da humanidade.
- O ISBN é atribuído a livros publicados na maioria dos países desde a década de 1970.
- Ele opera como um sistema distribuído sem autoridade central, com números atribuídos na ordem de países, grandes editoras e pequenas editoras.
- O Anna's Archive reúne metadados de várias fontes, como ISBNdb, Worldcat e Google Books, e possui o maior conjunto aberto de metadados de livros.
- É importante identificar e preservar livros raros e ameaçados.
-
Visualização
- É possível ver diferentes conjuntos de dados individualmente e alternar entre eles usando o menu suspenso e os botões.
- Os conjuntos de dados incluem Anna's Archive, Google Books, Goodreads, Internet Archive e outros.
- Na visualização, é possível observar padrões como linhas e blocos regulares, além de áreas vazias.
-
Recompensa de $10.000
- Há uma recompensa para melhorar a visualização, e é preciso enviar código open source até 31 de janeiro de 2025.
- A melhor submissão receberá $6.000, a segunda $3.000 e a terceira $1.000, pagos em Monero (XMR).
- Parte da recompensa pode ser paga mesmo que os critérios mínimos não sejam atendidos.
- As submissões devem melhorar a visualização modificando o HTML, e precisam funcionar bem em desktop e mobile.
- Pontos extras serão concedidos com base na usabilidade e no apelo visual.
-
Código
- O código de geração das imagens e os exemplos estão em diretórios específicos.
- Um formato de dados compactado de 75 MB é usado para fornecer as informações de ISBN.
- Não é necessário usar esse formato para participar da recompensa, mas ele é o mais prático para começar.
- Todo o código deve ser disponibilizado como open source.
1 comentários
Comentários do Hacker News
Ao visualizar dados usando uma curva de Hilbert, pontos próximos em uma lista ordenada também ficam visualmente próximos. A primeira parte do ISBN é o país, a segunda é a editora e a terceira é o título; se remover o dígito de verificação e ordenar como um número grande, os grandes países editoriais provavelmente aparecerão como “ilhas”. Seria bom colocar rótulos nessas áreas
O ISBN não é hierárquico e é comprado em blocos, então a visualização não é interessante nem útil. Uma visualização usando LoC ou Dewey Decimal seria mais útil
O Anna's Archive é uma das maravilhas do mundo, e mesmo que a humanidade quase seja extinta, se o Anna's Archive permanecer haverá esperança de uma reconstrução rápida
Por causa do daltonismo, eu não conseguia distinguir os pixels vermelhos dos verdes, e mesmo usando uma extensão de navegador não consegui diferenciar mais cores. Fico me perguntando se o gráfico está estranho
O IP do servidor foi bloqueado na UE. Recebi a mensagem “este site foi bloqueado. sanções europeias” no ISP Ziggo, da Holanda
Queria saber se mais alguém está vendo a mensagem “este servidor não pôde provar que é annas-archive.org, e seu certificado de segurança foi emitido para *.hs.llnwd.net. Isso pode ser uma configuração incorreta ou um invasor pode estar interceptando sua conexão”
A visualização feita com D3 é divertida, e dá para mapear muita coisa e ampliar
É difícil saber no gráfico o que corresponde a quê. Se alguém apontasse o Bookland (ou seja, 978), seria mais fácil de entender
Fico me perguntando se baixar e usar o arquivo de ISBN é ilegal. O que haveria de errado em ter essa informação?
Cada pixel representa 2.500 ISBNs, e se você tiver o arquivo de ISBN o pixel fica mais verde. Não sei o que significa “mais verde”, e fico me perguntando se os pixels pretos representam ISBNs não registrados