5 pontos por GN⁺ 2024-01-04 | 1 comentários | Compartilhar no WhatsApp
  • Responde à pergunta de um leitor sobre como realizar OCR gratuitamente no Mac usando CLI ou Python.
  • Compartilha como configurar gratuitamente um 'serviço' local de OCR no Mac por meio do Terminal, CLI ou Python.
  • Abra o app Shortcuts e crie um novo atalho; depois, arraste a ação "Extract Text from Image" para configurar a extração de texto de uma imagem.
  • Selecione "Shortcut Input" e coloque a ação "Copy to Clipboard" abaixo da ação "Extract text from ...".
  • Dê um nome ao atalho e, no Terminal, você pode testar a execução do OCR com o comando shortcuts run ocr-text -i <caminho da imagem>.
  • Em Python, use o módulo subprocess para executar o OCR e exibir o resultado.

Opinião do GN⁺

  • Este texto traz informações úteis para usuários de Mac ao mostrar uma forma gratuita de usar OCR, o que pode aumentar a eficiência no trabalho com documentos.
  • Com uma configuração simples usando o app Shortcuts, é possível extrair texto de imagens, tornando a solução acessível até para quem não tem conhecimento de programação.
  • Ao apresentar uma forma de implementar um processo de automação com Python, o conteúdo também se torna atraente para desenvolvedores.

1 comentários

 
GN⁺ 2024-01-04
Comentários do Hacker News
  • Experiência impressionante com o framework Vision da Apple

    • O autor original (OP) usou o framework Vision da Apple em um projeto pessoal para aplicar OCR em dezenas de milhares de capturas de tela de planilhas e importar os resultados para um banco de dados Postgres.
    • Como macOS e Nvidia não eram compatíveis, ele tentou outros métodos de OCR via CPU, mas ferramentas como Tesseract frequentemente produziam resultados incorretos.
    • O framework Vision ofereceu os resultados de maior qualidade que ele já viu e usou a menor quantidade de recursos computacionais.
    • Houve problemas de estabilidade com o framework, mas isso pode ter sido um erro causado pela forma como o usuário o implementou.
    • Ele usou uma combinação de vision.py do RHetTbull e ocrmac, e ficou satisfeito com o desempenho em um hackintosh i7 6700k.
    • Ele não é programador, mas consegue resolver problemas se tiver tempo suficiente, embora isso leve bastante tempo.
  • Experiência semelhante no Windows e a ferramenta de OCR do Microsoft PowerToys

    • Outro usuário tentou uma tarefa parecida no Windows e descobriu que o PowerToys, um projeto da Microsoft que já estava instalado, inclui uma ferramenta de OCR muito boa.
    • Basta pressionar Win+Shift+T e selecionar a área a ser escaneada para que o texto seja copiado para a área de transferência.
  • Ferramenta de OCR open source oferecida gratuitamente

    • Um usuário desenvolveu uma ferramenta de OCR open source gratuita que oferece tanto CLI quanto UI.
  • Função de OCR automático em aplicativos do Mac

    • Um usuário descobriu que muitos aplicativos do Mac, como Safari, Preview e Notes, fazem OCR automaticamente em imagens, permitindo selecionar facilmente o texto dentro delas para copiar e colar em outro lugar.
  • Elogios a uma pequena ferramenta de OCR para Mac

    • Um usuário é grande fã de uma pequena ferramenta de OCR que instalou no Macbook via brew.
  • Ferramenta de OCR recomendada para Windows: Text Extractor do PowerToys

    • Um comentário recomenda o Text Extractor do PowerToys para usuários de Windows.
  • Função nativa de OCR no macOS Ventura

    • No macOS Ventura ou superior, uma função nativa de OCR está integrada à interface de captura de imagem, e ao escanear para PDF com um scanner compatível com AirPrint, uma caixa de seleção de OCR aparece no painel direito.
  • Solução de extração de texto com PyXA

    • O PyXA oferece uma solução para extrair texto de uma ou mais imagens de uma vez usando o framework Vision.
    • Como isso é apenas uma parte do pacote, pode ser exagerado para tarefas pontuais, mas foi apresentado como opção.
  • Busca e cópia de texto em imagens no Raycast

    • O Raycast, exclusivo para macOS, tem um recurso que permite procurar texto dentro de imagens e copiar esse texto.
    • Foi fornecido um link para o vídeo de demonstração oficial.
  • Pergunta sobre tecnologia semelhante ao recurso 'Copy Subject' do Apple Vision

    • Um usuário depende muito do recurso "Copy Subject" do Apple Vision, sente que sua acessibilidade é muito limitada e perguntou sobre tecnologias semelhantes.