3 pontos por hcmhcs0 2026-03-16 | 2 comentários | Compartilhar no WhatsApp

Olá, sou um estudante desenvolvedor!

Ultimamente passei a me interessar pela área de agentes de IA e estava estudando, analisando as instruções de sistema publicadas no OpenClaw. Eu queria entender por que os agentes conseguem resultados muito melhores do que o raciocínio simples de um LLM e de que tipo de instruções de sistema e estrutura eles são compostos. (Eu queria montar um agente de IA adequado à minha situação para aumentar minha produtividade, haha.) Mas, como no vscode as instruções de sistema no código estavam todas em inglês e a documentação relacionada também toda em inglês, eu acabava tendo que ficar alternando com uma aba de tradutor aberta, copiando e colando para ler, e isso quebrava totalmente o contexto, então eu não conseguia me concentrar. Quando era uma imagem ou um PDF, em que não dava para copiar o texto, era ainda mais frustrante.

Então, ao olhar para o ScreenHint, que eu já usava bastante (um app que fixa capturas na tela), pensei: "dá para traduzir na hora a área capturada com essa UX". Como sou estudante, também pesava ter que gastar dinheiro com API de tradução toda vez, então defini como base o funcionamento on-device. Por sorte, graças ao Claude Code, consegui implementar essa ideia rapidamente, e este acabou se tornando meu primeiro projeto open source.

ScreenTranslate — um app para macOS que, ao capturar a tela, faz OCR → tradução imediatamente. Ele fica residente na barra de menu e pode ser usado direto por atalho de teclado.

Há basicamente duas funções:

  1. Tradução de captura de tela — atalho → arrastar área → reconhecer com OCR → popup de tradução
  2. Tradução de texto — selecionar texto → atalho → traduzir imediatamente (sem OCR)

É gratuito e open source (GPL v3). Como funciona on-device, nenhum dado de tradução é enviado para servidores.

Recursos:

  • Baseado em Apple Vision OCR + Apple Translation, funciona sem internet
  • Na prática, parece muito mais rápido que o app padrão da DeepL. Da captura até o popup de tradução leva cerca de 1 segundo
  • Se precisar de um mecanismo em nuvem, dá para usar DeepL, Google Cloud e Azure com BYOK (inserindo sua própria chave de API)
  • Armazenamento do histórico de traduções, cópia automática para a área de transferência
  • Suporte a 20 idiomas

Stack técnica:

  • macOS 15+ / Swift 6 / SwiftUI / SwiftData
  • Fluxo interno: Vision(VNRecognizeTextRequest) → pré-processamento de quebras de linha → Translation ou API → popup
  • Sem dependências externas. Usa apenas frameworks nativos da Apple (requisito: macOS 15+ — compatível com Apple Silicon e Intel)

GitHub: https://github.com/hcmhcs/screenTranslate
Vídeo de demonstração: https://www.youtube.com/watch?v=ItYNAyue7eo
Download: baixe o DMG em GitHub Releases ou faça o build você mesmo (consulte o arquivo README.md)

No começo eu fiz isso de forma simples só para usar sozinho, então até fico um pouco envergonhado, mas achei que o resultado ficou bem legal, então também fiz meu primeiro lançamento no Product Hunt. Agora estou passando pelo processo de receber feedback de usuários reais e seguir atualizando o app com base nisso.
Como é meu primeiro projeto solo open source, certamente ainda há muitos pontos a melhorar, então ficarei muito grato por qualquer feedback ou PR :)

2 comentários

 
guarder 2026-03-24

Estou usando muito bem!

 
hcmhcs0 2026-03-24

Muito obrigado pelo comentário carinhoso! Justamente nesses dias tenho continuado a ajustar várias coisas para melhorar a usabilidade, então saber que você está usando bem isso realmente me motiva muito. Haha. Se surgir qualquer incômodo durante o uso, fique à vontade para falar comigo a qualquer momento :)