- Guia para editar o conteúdo de texto de PDFs: sem ferramentas comerciais como o Adobe Acrobat
- Guia principal para usuários de Mac: com menção a ferramentas que também podem ser usadas na maioria das distribuições Linux
- Armazenamento comprimido de dados de texto em PDFs: descompressão com a ferramenta de linha de comando
qpdf
- Verificação dos dados de texto após a descompressão: visualização em um editor de texto, com a codificação e a vinculação a fontes específicas
- A complexidade da codificação de texto em PDFs: várias codificações possíveis, incluindo codificações personalizadas embutidas no próprio arquivo
- Extração de informações de codificação: uso da ferramenta de linha de comando
pdffonts
- Exemplo de como identificar a fonte relacionada à codificação embutida e encontrar a tabela de codificação embutida dessa fonte
- Tabela de codificação: mapeia pontos de codificação personalizados para pontos Unicode
- Conversão da tabela com Python: transformar a tabela em um dicionário e escrever funções de codificação e decodificação
- Substituição do texto original com essas funções: é possível trocar o texto original por texto de substituição codificado de forma personalizada
1 comentários
Comentários do Hacker News
mutoolpodem ser usadas para converter um PDF em uma versão sem dados compactados, facilitando sua compreensão e modificação.qpdfeRUPSpodem ser usadas para entender e modificar a estrutura de um PDF.