2 pontos por GN⁺ 2025-01-11 | 1 comentários | Compartilhar no WhatsApp
  • Visualização de ISBNs

    • O Anna's Archive oferece o maior catálogo aberto de livros da história da humanidade.
    • Cada pixel representa 2.500 ISBNs, e o pixel aparece em verde quando há um arquivo disponível.
    • Apenas 16% de todos os livros têm backup, e ainda há muito trabalho a ser feito.
  • Contexto

    • O Anna's Archive cria um catálogo de livros usando números ISBN para fazer backup do conhecimento da humanidade.
    • O ISBN é atribuído a livros publicados na maioria dos países desde a década de 1970.
    • Ele opera como um sistema distribuído sem autoridade central, com números atribuídos na ordem de países, grandes editoras e pequenas editoras.
    • O Anna's Archive reúne metadados de várias fontes, como ISBNdb, Worldcat e Google Books, e possui o maior conjunto aberto de metadados de livros.
    • É importante identificar e preservar livros raros e ameaçados.
  • Visualização

    • É possível ver diferentes conjuntos de dados individualmente e alternar entre eles usando o menu suspenso e os botões.
    • Os conjuntos de dados incluem Anna's Archive, Google Books, Goodreads, Internet Archive e outros.
    • Na visualização, é possível observar padrões como linhas e blocos regulares, além de áreas vazias.
  • Recompensa de $10.000

    • Há uma recompensa para melhorar a visualização, e é preciso enviar código open source até 31 de janeiro de 2025.
    • A melhor submissão receberá $6.000, a segunda $3.000 e a terceira $1.000, pagos em Monero (XMR).
    • Parte da recompensa pode ser paga mesmo que os critérios mínimos não sejam atendidos.
    • As submissões devem melhorar a visualização modificando o HTML, e precisam funcionar bem em desktop e mobile.
    • Pontos extras serão concedidos com base na usabilidade e no apelo visual.
  • Código

    • O código de geração das imagens e os exemplos estão em diretórios específicos.
    • Um formato de dados compactado de 75 MB é usado para fornecer as informações de ISBN.
    • Não é necessário usar esse formato para participar da recompensa, mas ele é o mais prático para começar.
    • Todo o código deve ser disponibilizado como open source.

1 comentários

 
GN⁺ 2025-01-11
Comentários do Hacker News
  • Ao visualizar dados usando uma curva de Hilbert, pontos próximos em uma lista ordenada também ficam visualmente próximos. A primeira parte do ISBN é o país, a segunda é a editora e a terceira é o título; se remover o dígito de verificação e ordenar como um número grande, os grandes países editoriais provavelmente aparecerão como “ilhas”. Seria bom colocar rótulos nessas áreas

  • O ISBN não é hierárquico e é comprado em blocos, então a visualização não é interessante nem útil. Uma visualização usando LoC ou Dewey Decimal seria mais útil

  • O Anna's Archive é uma das maravilhas do mundo, e mesmo que a humanidade quase seja extinta, se o Anna's Archive permanecer haverá esperança de uma reconstrução rápida

  • Por causa do daltonismo, eu não conseguia distinguir os pixels vermelhos dos verdes, e mesmo usando uma extensão de navegador não consegui diferenciar mais cores. Fico me perguntando se o gráfico está estranho

  • O IP do servidor foi bloqueado na UE. Recebi a mensagem “este site foi bloqueado. sanções europeias” no ISP Ziggo, da Holanda

  • Queria saber se mais alguém está vendo a mensagem “este servidor não pôde provar que é annas-archive.org, e seu certificado de segurança foi emitido para *.hs.llnwd.net. Isso pode ser uma configuração incorreta ou um invasor pode estar interceptando sua conexão”

  • A visualização feita com D3 é divertida, e dá para mapear muita coisa e ampliar

  • É difícil saber no gráfico o que corresponde a quê. Se alguém apontasse o Bookland (ou seja, 978), seria mais fácil de entender

  • Fico me perguntando se baixar e usar o arquivo de ISBN é ilegal. O que haveria de errado em ter essa informação?

  • Cada pixel representa 2.500 ISBNs, e se você tiver o arquivo de ISBN o pixel fica mais verde. Não sei o que significa “mais verde”, e fico me perguntando se os pixels pretos representam ISBNs não registrados