Tentativa de abrir o arquivo da proposta original da WWW
- No site do W3C, existe a proposta original da WWW escrita por Tim Berners-Lee.
- O arquivo original da proposta é um arquivo do Word para Macintosh 4.0, provavelmente criado em 1990.
- O documento original tem 68.608 bytes e, ao verificar o tipo do arquivo no Mac, ele aparece como um arquivo Microsoft Word for Macintosh 4.0.
Tentativas de abrir com vários softwares
- Microsoft Word: o arquivo original foi enviado para o OneDrive e aberto no Microsoft Word com a extensão
.doc.
- Apple Pages: não consegue interpretar arquivos antigos do Microsoft Word for Macintosh.
- Apache OpenOffice: consegue abrir o arquivo, mas a formatação desaparece e os diagramas somem.
- LibreOffice: abre o arquivo e os diagramas também aparecem com nitidez, mas há problemas de margens e de outras formatações.
Comparação entre o PDF do CERN e o PDF gerado pelo LibreOffice
- O PDF fornecido pelo CERN foi gerado em 1998 e tem 20 páginas.
- A versão importada pelo LibreOffice tem 24 páginas.
- Ao comparar os dois PDFs, há diferenças em margens, tamanho da fonte, cabeçalhos e rodapés, divisão de páginas e outros aspectos.
Verificação do documento original por emulação
- Ao emular um Macintosh dos anos 1990 e executar o Word for Macintosh 4.0 real, foi possível verificar a aparência do documento original.
- O documento original e o PDF do CERN são bastante diferentes, e o documento original aparece com 22 páginas em papel A4.
Conclusão
- Converter o documento original com software moderno é ao mesmo tempo uma vitória do software de código aberto e uma demonstração das dificuldades de preservação documental.
- Para preservar o documento, uma versão
.odt foi enviada ao GitHub.
- É um pouco decepcionante que um documento de 34 anos ainda seja difícil de abrir e que, mesmo quando aberto, não fique exatamente igual ao original.
Opinião do GN⁺
- Este post de blog destaca a importância da preservação digital e da acessibilidade do documento original da proposta da WWW.
- Mostra o papel importante que o software de código aberto pode desempenhar ao lidar com formatos de documentos antigos.
- Também serve para compreender as dificuldades da preservação documental e reconhecer a importância de considerar compatibilidade e acessibilidade de longo prazo à medida que a tecnologia evolui.
1 comentários
Comentários do Hacker News
Compartilhamento do documento convertido para um formato moderno do Word
Verificação de fontes e layout
Utilidade do comando
filefileé muito útil para matar a curiosidade sobre arquivos e fornecer informações úteis.Excelente suporte do LibreOffice a formatos antigos de documentos
Compatibilidade retroativa do Microsoft Word
Recursos surpreendentes do LibreOffice
Impressão de documentos em emuladores
Decepção com a compatibilidade de documentos do Microsoft Word
Possíveis problemas de backups com retenção infinita
Uso de Macs antigos e Word