Paper to HTML - converte artigos em HTML mais fácil de ler
(papertohtml.org)<p>- Converte em HTML, usando machine learning, o conteúdo de PDF, LaTeX e XML do PubMed Central para facilitar a leitura <br />
- Objetivo de aumentar a acessibilidade <br />
- Protótipo experimental do Semantic Scholar, um mecanismo de busca de materiais de pesquisa com IA <br />
- Atualmente, apenas imagens/conteúdos extraídos são armazenados em cache, sendo usado para oferecer um serviço mais rápido apenas a quem enviou o mesmo documento. Os arquivos enviados não são armazenados <br />
- Limitações<br />
→ tabelas (Table) são extraídas como imagem <br />
→ conteúdo matemático (Math) tem baixa precisão ou quase não é extraído <br />
→ o processamento de LaTeX/PubMed pode ter alguns recursos a menos do que PDF <br />
- Há planos de adicionar recursos de acessibilidade ao Semantic Scholar no futuro </p>
3 comentários