- Software de código aberto que escaneia, indexa e arquiva documentos, transformando-os em um arquivo online pesquisável
- Fork do paperless-ng, cuja manutenção foi descontinuada, e que continua sendo atualizado e mantido
- Aplica OCR aos documentos para adicionar texto pesquisável, além de permitir tags e tipos
- Suporta PDF, imagens, texto simples e documentos de escritório (Word, Excel, PowerPoint e arquivos do LibreOffice)
- Os documentos são armazenados no sistema de arquivos como estão, e o Paperless gerencia nomes de arquivos/pastas
- Front-end SPA: oferece painel, filtragem e visualizações personalizáveis
- Suporte a busca de texto completo: autocompletar, ordenação por relevância da consulta, destaque das partes correspondentes dentro dos documentos e busca por documentos semelhantes
- Também pode adicionar automaticamente documentos de várias contas de e-mail
- Correspondência de documentos baseada em machine learning
- Otimizado para sistemas multicore
2 comentários
Como se trata de um texto de apresentação de software de código aberto, resumi o conteúdo do repositório https://github.com/paperless-ngx/paperless-ngx.
Opiniões no Hacker News