- No trabalho do dia a dia, é frequente receber de colegas capturas de tela de texto; isso é uma forma ineficiente de compartilhar informação, que torna extremamente difícil pesquisar código e entender o contexto
- O código recebido por screenshot não revela o contexto de definições de variáveis, localização de módulos, tratamento de exceções etc., então é preciso digitar tudo manualmente na busca ou recorrer a um agente de programação
- Quando logs de erro de build são enviados por screenshot, fica impossível saber o alvo da build, a linha da falha e a mensagem de erro exata, o que inviabiliza a resolução do problema
- Usar copiar e colar ou compartilhar arquivos/links do GitHub permite aproveitar a busca da IDE e verificar todo o contexto
- A menos que seja um problema relacionado à exibição na tela, texto deve ser compartilhado em formato copiável, e não como screenshot, para garantir eficiência na colaboração
Exemplo 1 do problema com screenshots: código
- Ao discutir um problema relacionado a código com um colega, você recebe uma screenshot do código
- É impossível entender o contexto essencial, como onde a variável
slug é definida, como baseUrl é gerada, por que o domínio foi hardcoded, como o tratamento de exceções foi feito e onde esse módulo está localizado
- É preciso digitar manualmente na busca o código que aparece na screenshot ou usar um agente de programação para encontrar o módulo relacionado
- Com copiar e colar, é possível ver muito mais contexto mesmo na mesma linha e colar diretamente na busca da IDE
- Compartilhar o próprio arquivo ou um link do GitHub é muito mais eficiente
Exemplo 2 do problema com screenshots: logs de erro de build
- Você recebe uma screenshot do log de erro junto com o pedido: "A build falhou, você pode dar uma olhada?"
- Não dá para saber o que foi compilado, em que linha falhou nem qual é a mensagem de erro exata
- Em alguns casos, ao refazer a build completa na própria workstation, ela acaba passando sem erro
- É um problema que poderia ser resolvido facilmente se a pessoa copiasse o log inteiro ou o exportasse para um arquivo antes de enviar
Forma correta de compartilhar texto
- Não envie texto como screenshot; compartilhe em formato copiável
- Use screenshots apenas para mostrar problemas visuais de exibição na tela ou quando houver informação relevante que se perde em texto puro
- Compartilhar arquivos ou links do GitHub é a melhor forma de entender o contexto e pesquisar o código
4 comentários
Às vezes também posto capturas de código por causa da legibilidade mostrada no editor ao capturar e da praticidade dos atalhos de captura nativos do sistema operacional.
Se existisse um programa que, com um único atalho, transformasse o código na imagem capturada em um link como Text fragments, para poder compartilhar externamente e colar na hora, acho que eu usaria isso.
Quando fosse postado no Slack, apareceria uma prévia, e ao abrir o link daria para copiar o código.
Só para causar um pouco, vou deixar um site que transforma código em imagens bonitinhas de screenshot. kkk
https://ray.so/
Eu também, quando vou mandar algo por mensageiro ou e-mail, tento usar o máximo possível texto, mas na prática, dependendo do caso, usar só texto pode acabar sendo até mais inconveniente.
Em comparação, tirar um screenshot é algo que dá para resolver na GUI apertando um atalho, selecionando a área da tela e colando, então, para quem envia, provavelmente parece mais prático.
Mas, como o texto principal também apontou, para quem recebe, muitas vezes o contexto não é totalmente transmitido só com o screenshot, e também fica ruim para pesquisar ou copiar e colar, então acho natural que isso gere insatisfação. Sem nem entrar no mérito de que isso cria um overhead de transmissão e armazenamento de dados muito maior do que o necessário.
Bom, pessoalmente, se for começar a analisar essas coisas uma por uma, eu já fico incomodado até com coisas como fazer documentação interna da empresa em arquivos do Word em vez de usar uma wiki...
Comentários no Hacker News
Como já foi mencionado em outros comentários, o OCR automático nas plataformas da Apple é realmente revolucionário
Acho que esse tipo de recurso deveria vir por padrão em visualizadores de documentos de todas as plataformas
Outra coisa que eu gostaria de ver é a inclusão de metadados nas capturas de tela. Por exemplo, ao capturar uma foto do Instagram, incluir a URL correspondente; no navegador, a URL atual e o caminho do DOM; em apps de mapas, as coordenadas; em visualizadores de PDF, o hash SHA1 do documento e o offset
Claro que existem questões de privacidade, mas imagino que essa ideia já tenha sido explorada na academia
Hoje em dia, a noção de arquivo ficou mais abstrata, então parece que a captura de tela virou a linguagem comum da era da computação móvel
Aliás, também quero mencionar a Screenshot Conf
A captura de tela é tratada no nível do sistema operacional, e é perigoso que o app saiba que foi capturado ou tenha acesso à localização
Empresas como Evernote e CloudApp tentaram isso, mas no fim fracassaram. Captura de tela só é útil quando continua simples
O sistema que eu construo coloca muita informação de contexto na URL, mas isso não aparece na captura
Então eu sempre preciso pedir a URL em texto separadamente
Estão colocando na UI pós-captura recursos como insights de IA, busca de produtos, conversa com Gemini/LLM
Isso porque todo mundo usa capturas de tela para guardar ou pesquisar informações
Mas ela foi removida da versão final porque acharam que as pessoas poderiam tentar usar o programa como processador de texto
Eu uso capturas de tela com frequência
O motivo é que mantêm a largura de 80 caracteres, o que melhora a legibilidade, e preservam a fonte monoespaçada e o destaque de sintaxe
Se eu quiser garantir que código ou saída de terminal não quebrem em e-mail ou chat no celular, a captura de tela é a forma mais segura
Claro que, quando o arquivo completo é necessário, eu anexo também, mas envio junto a captura do trecho relevante
Capturas de tela exigem zoom e também são piores para acessibilidade
Se mandar em texto, fica fácil pesquisar e copiar
A maioria dos sistemas já oferece suporte a fonte monoespaçada, e o problema é mais o ambiente, como a renderização do Gmail
O GMail não tem limitação de largura e ainda varia o tamanho da fonte, então fica difícil de ler
Em URLs longas ou telas largas, a legibilidade pode até piorar bastante
Porque cores, formatação e contexto aparecem exatamente como estavam
Na hora de explicar um problema, a ideia de que “uma imagem vale mais que mil palavras” faz sentido
Assim posso ver no meu editor com fonte, largura e cores do meu jeito, além de poder pesquisar e editar
No fim, a captura de tela acaba gerando incômodo para a outra pessoa
Os recursos de reconhecimento e cópia de texto no Mac e no iOS são realmente revolucionários
Dá para copiar o texto de uma captura de tela ou foto e colar direto nas notas
Naquele momento, eu realmente senti que estava vivendo no futuro
No Safari, dá até para traduzir texto dentro de imagens, o que é especialmente útil para traduzir páginas em japonês
Ele processa tudo na hora, sem precisar salvar arquivo, o que é bem prático
Antigamente, eu colava capturas de tela em documentos do Word para enviar
Mas agora sugerir extrair o texto de novo com LLM é desperdício demais
O que realmente falta é uma inovação de UI que torne tão fácil compartilhar texto quanto compartilhar capturas de tela
Ver aspirantes a programador fazendo isso é frustrante
Outros arquivos do Word eram inseridos dentro deles como objetos de verdade
A 7ª regra do meu texto “Como pedir ajuda no Slack” é: não poste capturas de tela de texto
Mesmo com o OCR da Apple sendo bom, o problema de não ser pesquisável continua
Link do texto original
Eu prefiro enviar junto o documento completo ou o link do código e anexar também uma captura de tela da parte relevante
O contexto visual permanece, então depois, quando volto a ver, a memória fixa melhor
Desenvolvedores juniores frequentemente compartilham capturas de tela de texto nas primeiras semanas
Mas isso é ruim de ler no celular, e o Slack comprime as imagens, então nem dá para ampliar direito
No fim, a maioria acaba aprendendo a compartilhar em texto
No MS Teams, o suporte a blocos de código é tão ruim que muita gente acaba usando capturas de tela
O recurso existe, mas não é nada visível
Capturas de tela são uma forma rápida e consistente
Funcionam do mesmo jeito em webapps, apps nativos, sites e em qualquer outro lugar
Para quem recebe pode ser incômodo, mas para quem envia é eficiente
No Linux, eu conectei a ação personalizada do xfce4-screenshooter a um script de OCR com tesseract
Quando capturo uma área selecionada, o texto é copiado automaticamente para a área de transferência
Quando o reconhecimento é mais difícil, eu uso Gemma3-4B + llama.cpp
Hoje em dia, a maioria dos navegadores tem um recurso chamado Text Fragment, e eu o uso bastante por ser útil.
Veja se funciona com o link destacado neste post.