<p>- PDF "sandwich": faz OCR em um arquivo PDF composto apenas por imagens e insere o texto de forma invisível atrás da imagem de cada página<br />
→ permite pesquisar o texto e selecioná-lo para copiar<br />
- Ferramenta de linha de comando usada para fazer OCR de livros ou revistas digitalizados<br />
→ também oferece suporte a texto em múltiplas colunas <br />
- tesseract + unpaper + convert + ghostscript <br />
→ oferece suporte a todos os idiomas compatíveis com o tesseract (incluindo coreano)<br />
- Linux/Mac. Suporte a processamento paralelo em sistemas multiprocessados </p>
Ainda não há comentários.