Odeio screenshots de texto

(parkscomputing.com)

5 pontos por GN⁺ 2025-11-12 | 4 comentários | Compartilhar no WhatsApp

No trabalho do dia a dia, é frequente receber de colegas capturas de tela de texto; isso é uma forma ineficiente de compartilhar informação, que torna extremamente difícil pesquisar código e entender o contexto
O código recebido por screenshot não revela o contexto de definições de variáveis, localização de módulos, tratamento de exceções etc., então é preciso digitar tudo manualmente na busca ou recorrer a um agente de programação
Quando logs de erro de build são enviados por screenshot, fica impossível saber o alvo da build, a linha da falha e a mensagem de erro exata, o que inviabiliza a resolução do problema
Usar copiar e colar ou compartilhar arquivos/links do GitHub permite aproveitar a busca da IDE e verificar todo o contexto
A menos que seja um problema relacionado à exibição na tela, texto deve ser compartilhado em formato copiável, e não como screenshot, para garantir eficiência na colaboração

Exemplo 1 do problema com screenshots: código

Ao discutir um problema relacionado a código com um colega, você recebe uma screenshot do código
- É impossível entender o contexto essencial, como onde a variável slug é definida, como baseUrl é gerada, por que o domínio foi hardcoded, como o tratamento de exceções foi feito e onde esse módulo está localizado
- É preciso digitar manualmente na busca o código que aparece na screenshot ou usar um agente de programação para encontrar o módulo relacionado
Com copiar e colar, é possível ver muito mais contexto mesmo na mesma linha e colar diretamente na busca da IDE
Compartilhar o próprio arquivo ou um link do GitHub é muito mais eficiente

Exemplo 2 do problema com screenshots: logs de erro de build

Você recebe uma screenshot do log de erro junto com o pedido: "A build falhou, você pode dar uma olhada?"
- Não dá para saber o que foi compilado, em que linha falhou nem qual é a mensagem de erro exata
- Em alguns casos, ao refazer a build completa na própria workstation, ela acaba passando sem erro
É um problema que poderia ser resolvido facilmente se a pessoa copiasse o log inteiro ou o exportasse para um arquivo antes de enviar

Forma correta de compartilhar texto

Não envie texto como screenshot; compartilhe em formato copiável
Use screenshots apenas para mostrar problemas visuais de exibição na tela ou quando houver informação relevante que se perde em texto puro
Compartilhar arquivos ou links do GitHub é a melhor forma de entender o contexto e pesquisar o código

4 comentários

tested 2025-11-12

Às vezes também posto capturas de código por causa da legibilidade mostrada no editor ao capturar e da praticidade dos atalhos de captura nativos do sistema operacional.

Se existisse um programa que, com um único atalho, transformasse o código na imagem capturada em um link como Text fragments, para poder compartilhar externamente e colar na hora, acho que eu usaria isso.

Quando fosse postado no Slack, apareceria uma prévia, e ao abrir o link daria para copiar o código.

kunggom 2025-11-12

Só para causar um pouco, vou deixar um site que transforma código em imagens bonitinhas de screenshot. kkk

https://ray.so/

Eu também, quando vou mandar algo por mensageiro ou e-mail, tento usar o máximo possível texto, mas na prática, dependendo do caso, usar só texto pode acabar sendo até mais inconveniente.
Em comparação, tirar um screenshot é algo que dá para resolver na GUI apertando um atalho, selecionando a área da tela e colando, então, para quem envia, provavelmente parece mais prático.
Mas, como o texto principal também apontou, para quem recebe, muitas vezes o contexto não é totalmente transmitido só com o screenshot, e também fica ruim para pesquisar ou copiar e colar, então acho natural que isso gere insatisfação. Sem nem entrar no mérito de que isso cria um overhead de transmissão e armazenamento de dados muito maior do que o necessário.
Bom, pessoalmente, se for começar a analisar essas coisas uma por uma, eu já fico incomodado até com coisas como fazer documentação interna da empresa em arquivos do Word em vez de usar uma wiki...

GN⁺ 2025-11-12

Comentários no Hacker News

Como já foi mencionado em outros comentários, o OCR automático nas plataformas da Apple é realmente revolucionário
Acho que esse tipo de recurso deveria vir por padrão em visualizadores de documentos de todas as plataformas
Outra coisa que eu gostaria de ver é a inclusão de metadados nas capturas de tela. Por exemplo, ao capturar uma foto do Instagram, incluir a URL correspondente; no navegador, a URL atual e o caminho do DOM; em apps de mapas, as coordenadas; em visualizadores de PDF, o hash SHA1 do documento e o offset
Claro que existem questões de privacidade, mas imagino que essa ideia já tenha sido explorada na academia
Hoje em dia, a noção de arquivo ficou mais abstrata, então parece que a captura de tela virou a linguagem comum da era da computação móvel
Aliás, também quero mencionar a Screenshot Conf
- Concordo totalmente com o OCR, mas inserir metadados pode virar um verdadeiro pesadelo de privacidade
  A captura de tela é tratada no nível do sistema operacional, e é perigoso que o app saiba que foi capturado ou tenha acesso à localização
  Empresas como Evernote e CloudApp tentaram isso, mas no fim fracassaram. Captura de tela só é útil quando continua simples
- Eu sou o autor do texto, e deveria ter mencionado o problema de capturas de páginas web sem a URL
  O sistema que eu construo coloca muita informação de contexto na URL, mas isso não aparece na captura
  Então eu sempre preciso pedir a URL em texto separadamente
- Hoje Google e Apple também já perceberam essa tendência
  Estão colocando na UI pós-captura recursos como insights de IA, busca de produtos, conversa com Gemini/LLM
  Isso porque todo mundo usa capturas de tela para guardar ou pesquisar informações
- A ideia de incluir a URL de uma foto do Instagram na captura de tela é, por si só, um pesadelo de privacidade
- Curiosamente, versões iniciais de desenvolvimento do MacPaint tinham uma função simples de copiar via OCR
  Mas ela foi removida da versão final porque acharam que as pessoas poderiam tentar usar o programa como processador de texto
Eu uso capturas de tela com frequência
O motivo é que mantêm a largura de 80 caracteres, o que melhora a legibilidade, e preservam a fonte monoespaçada e o destaque de sintaxe
Se eu quiser garantir que código ou saída de terminal não quebrem em e-mail ou chat no celular, a captura de tela é a forma mais segura
Claro que, quando o arquivo completo é necessário, eu anexo também, mas envio junto a captura do trecho relevante
- Em chats, a possibilidade de copiar e pesquisar é mais importante
  Capturas de tela exigem zoom e também são piores para acessibilidade
  Se mandar em texto, fica fácil pesquisar e copiar
- Coisas como “largura de 80 caracteres” são preferência pessoal
  A maioria dos sistemas já oferece suporte a fonte monoespaçada, e o problema é mais o ambiente, como a renderização do Gmail
  O GMail não tem limitação de largura e ainda varia o tamanho da fonte, então fica difícil de ler
- Essa preferência de formato é pessoal, então não deve ser imposta por meio de capturas de tela
  Em URLs longas ou telas largas, a legibilidade pode até piorar bastante
- Eu também prefiro capturas de tela
  Porque cores, formatação e contexto aparecem exatamente como estavam
  Na hora de explicar um problema, a ideia de que “uma imagem vale mais que mil palavras” faz sentido
- Eu acho muito melhor receber código em texto
  Assim posso ver no meu editor com fonte, largura e cores do meu jeito, além de poder pesquisar e editar
  No fim, a captura de tela acaba gerando incômodo para a outra pessoa
Os recursos de reconhecimento e cópia de texto no Mac e no iOS são realmente revolucionários
Dá para copiar o texto de uma captura de tela ou foto e colar direto nas notas
- O Snipping Tool do Windows também tem função de extração de texto
- Alguém me mandou pelo iMessage uma foto com um número de telefone, e eu só toquei nela e a tela de ligação apareceu na hora
  Naquele momento, eu realmente senti que estava vivendo no futuro
- A integração de copiar e colar entre MacBook e iPhone muda completamente o fluxo de trabalho
- Esse recurso é bom porque foi integrado de forma consistente em todo o sistema
  No Safari, dá até para traduzir texto dentro de imagens, o que é especialmente útil para traduzir páginas em japonês
- Eu uso o Shottr e, assim que tiro uma captura, aperto “O” para rodar o OCR imediatamente
  Ele processa tudo na hora, sem precisar salvar arquivo, o que é bem prático
Antigamente, eu colava capturas de tela em documentos do Word para enviar
Mas agora sugerir extrair o texto de novo com LLM é desperdício demais
O que realmente falta é uma inovação de UI que torne tão fácil compartilhar texto quanto compartilhar capturas de tela
- Tem casos ainda piores. Algumas pessoas tiram foto da tela e mandam assim
  Ver aspirantes a programador fazendo isso é frustrante
- Em algumas empresas, documentos do Word eram usados como se fossem pastas
  Outros arquivos do Word eram inseridos dentro deles como objetos de verdade
- Existe até uma tirinha relevante do XKCD → xkcd 2116
A 7ª regra do meu texto “Como pedir ajuda no Slack” é: não poste capturas de tela de texto
Mesmo com o OCR da Apple sendo bom, o problema de não ser pesquisável continua
Link do texto original
- Mas o Spotlight e o Fotos conseguem pesquisar texto dentro de capturas de tela também
Eu prefiro enviar junto o documento completo ou o link do código e anexar também uma captura de tela da parte relevante
O contexto visual permanece, então depois, quando volto a ver, a memória fixa melhor
Desenvolvedores juniores frequentemente compartilham capturas de tela de texto nas primeiras semanas
Mas isso é ruim de ler no celular, e o Slack comprime as imagens, então nem dá para ampliar direito
No fim, a maioria acaba aprendendo a compartilhar em texto
No MS Teams, o suporte a blocos de código é tão ruim que muita gente acaba usando capturas de tela
- Eu ensino meus colegas a criar blocos de código em Markdown no Teams
  O recurso existe, mas não é nada visível
- Quando vejo capturas de tela no Teams, na maioria das vezes são trechos de outras conversas capturados da tela
Capturas de tela são uma forma rápida e consistente
Funcionam do mesmo jeito em webapps, apps nativos, sites e em qualquer outro lugar
Para quem recebe pode ser incômodo, mas para quem envia é eficiente
No Linux, eu conectei a ação personalizada do xfce4-screenshooter a um script de OCR com tesseract
Quando capturo uma área selecionada, o texto é copiado automaticamente para a área de transferência
Quando o reconhecimento é mais difícil, eu uso Gemma3-4B + llama.cpp
- Captura de referência: https://0x0.st/K9hq.png

ndrgrd 2025-11-12

Hoje em dia, a maioria dos navegadores tem um recurso chamado Text Fragment, e eu o uso bastante por ser útil.

Veja se funciona com o link destacado neste post.