25 pontos por xguru 2025-10-18 | 2 comentários | Compartilhar no WhatsApp
  • App nativo para macOS implementado em SwiftUI que grava a tela a 1 FPS e faz análise com IA a cada 15 minutos para gerar automaticamente uma linha do tempo e resumos
    • É possível reproduzir o timelapse para revisar visualmente o fluxo do dia
  • Busca ser leve e de baixa carga, com meta de cerca de 25 MB de tamanho do app, ~100 MB de RAM e uso de <1% de CPU, oferecendo uma UX centrada no local, sem elementos distribuídos
  • A IA pode processar usando Gemini (com sua própria chave) ou modelos locais (Ollama·LM Studio)
  • Os dados gravados são limpos automaticamente após 3 dias de retenção, otimizando o gerenciamento de recursos e a privacidade
  • Em breve
    • Dashboard infinitamente personalizável: faça qualquer pergunta e transforme o resultado em tiles para acompanhar continuamente
    • Diário diário: registro com retrospectiva de destaques, aplicação de prompts guiados e capturas de tela e notas junto com a linha do tempo
  • Como funciona
    • Capture: grava a tela em 1 FPS em segmentos de 15 segundos
    • Analyze: a cada 15 minutos, envia os segmentos recentes para o provedor de IA selecionado para análise
    • Generate: cria cards de resumo de atividade para compor uma linha do tempo cronológica
    • Display: mostra o fluxo do dia em uma UI de linha do tempo visual
    • Cleanup: faz o apagamento automático das gravações após 3 dias para gerenciar o espaço de armazenamento

2 comentários

 
oh3vci 2025-10-21

Estou usando localmente, mas parece que ele não consegue analisar muito bem o coreano. Pelo que aparece no que é registrado, parecia que só as partes escritas em inglês estavam sendo registradas.

 
GN⁺ 2025-10-18
Comentários do Hacker News
  • Parece que este produto teria boa aceitação se fosse vendido para advogados ou outros profissionais que cobram por hora, porque pode reconstruir trabalhos perdidos ao longo do dia e evitar vazamento de faturamento, então provavelmente pagariam caro por isso

    • Por outro lado, isso também poderia revelar o quão pouco os advogados de fato trabalham em relação às horas cobradas
    • Eu também sempre quis esse recurso como prestador de serviços de software e agora estou fazendo um protótipo simples disso no Linux
    • No Reino Unido nem se cobra por hora, e sim em blocos de 6 minutos, o que diz bastante sobre a cultura profissional
  • Produto excelente! Atualmente uso o ActivityWatch no PC para rastrear meu trabalho
    O que eu gostaria de ver em um software desse tipo é o seguinte

    • Um recurso para encontrar o ponto de início da distração: por exemplo, eu abro a janela de e-mail para checar uma mensagem específica, mas acabo vendo outros e-mails não relacionados e perco de 5 a 15 minutos nisso; ter essa informação leva a ações para reduzir distrações, por exemplo, instalar um plugin para esconder vídeos recomendados do YouTube realmente diminuiu minha dispersão, e fechar todas as janelas sem uso também ajuda a não desviar a atenção para outras coisas
    • Identificar tarefas repetitivas e sua periodicidade: por exemplo, se eu estiver criando manualmente uma invoice quase da mesma forma toda semana para um caso específico de exceção, posso pensar em automatizar isso
    • Registrar meu estado de humor antes, durante e depois de uma tarefa: esta é a questão mais ampla e mais difícil de definir, mas acho que há muito potencial nisso para melhorar a procrastinação e facilitar o início do trabalho
    • Seria ótimo ter recursos que ajudassem a entender como cada pessoa se distrai; eu também uso a mesma extensão para o YouTube
  • Minha reação imediata foi pensar que um produto assim também seria muito útil para pessoas com ADHD
    Dá para entender o que provoca distração e quais padrões recorrentes existem (por exemplo: a cada git commit, entrar no Hacker News e perder 15 minutos)
    O fato de poder revisar automaticamente o histórico capturado é algo enorme; no passado tive muito sucesso usando o TimeRescue para medir com precisão o tempo de clientes
    Mas ferramentas que exigem entrada manual sempre acabam atrapalhando a concentração ou eu simplesmente esqueço de usá-las, então nunca duram muito
    Indo um passo além, seria ótimo se houvesse um recurso que me avisasse em tempo real (considerando o atraso de processamento) quando eu estiver me distraindo; também daria para imaginar um sistema em que o próprio usuário define o que conta como distração, ou que vai ficando mais inteligente com feedback
    Acho o produto muito atraente e eu já gostava de ideias como o Windows Recall, então é bom ver um produto assim com foco em privacidade

  • Gosto muito do conceito do produto, mas me preocupa que um desenvolvedor com um GitHub quase vazio de repente lance um app que poderia facilmente virar spyware, especialmente por questões de segurança como senhas

    • Se o código já está no GitHub, é fácil aliviar essa preocupação verificando o código diretamente, em vez de se prender ao perfil
  • Não me sinto confortável em enviar dados sensíveis como informações bancárias e senhas para o Gemini
    Fico curioso para saber o quanto o desempenho muda ao usar um modelo local

    • Se eu fosse dar notas com base na minha experiência e avaliação, o Gemini 2.5 pro ficaria com A-, e o qwen2.5vl com algo como B-/C+, mas como os resultados nem sempre são determinísticos, é difícil garantir qualidade
      Pelo que vi em artigos recentes, modelos locais também podem alcançar desempenho SOTA com técnicas de distillation, então pretendo fazer experimentos nessa direção
    • Se você usar o Gemini comum em vez da versão enterprise, toda informação sensível contida nos prompts e nas respostas fica 100% exposta ao Google
    • Como o Google já tem meu e-mail, meu navegador, o sistema operacional do meu smartphone e até algumas das minhas senhas, parto do princípio de que todos os meus dados confidenciais já foram comprometidos
    • Em teoria, senhas não deveriam aparecer na tela, porque normalmente vão direto do gerenciador de senhas para campos de entrada mascarados, então não deveriam ficar visíveis na captura
  • É um conceito parecido com o do screenpipe; o screenpipe oferece mais possibilidades de customização
    github.com/mediar-ai/screenpipe

    • Sou o fundador do screenpipe, e fico feliz em ver mais produtos assim; o ideal é que sejam OSS, locais, sem vendor lock-in e amigáveis a API/MCP
      A parte chata é que no momento ele só oferece suporte a macOS; hoje em dia eu uso principalmente Windows
  • Projeto muito legal! Tive uma experiência parecida com o Rewind e fiquei com preocupações relacionadas à privacidade
    Só como referência, o Rewind faz o OCR localmente e envia apenas os dados em texto
    Se o foco for macOS, dá para usar VNRecognizeTextRequest e pular um processo complicado de OCR
    Principalmente se você estiver usando IA em nuvem, também seria possível usar um modelo leve como BERT para detectar e mascarar informações sensíveis

    • Eu não conhecia VNRecognizeTextRequest, isso é muito interessante, obrigado por apresentar
  • Fiquei me perguntando se, durante reuniões no Zoom ou chamadas de vídeo, fazer capturas em vez de gravações ainda exigiria aviso legal de que está havendo uma "gravação"
    Também queria saber se a exigência legal muda quando há legendas ao vivo ou recurso de transcrição

    • No meu estado, capturar a tela do Zoom sem avisar que você está gravando geralmente é ilegal; posso estar errado nos detalhes, mas o ponto principal não é se há resumo por IA, e sim se está sendo salvo um vídeo a 1 fps
  • Esse produto é realmente ótimo; exige muito menos carga mental do que usar um time tracker tradicional manualmente
    Também gosto de haver opções locais e a opção BYO key (fornecer sua própria chave), o que amplia as escolhas de privacidade
    Parece o tipo de produto que deveria ter surgido antes; desta vez ficou com cara de algo muito bem feito

  • Eu também só usaria isso com um modelo local; produto muito bacana

    • Meus amigos e eu estamos meio a meio entre preferências por local e nuvem; é bom poder escolher entre qualidade ou privacidade conforme a preferência de cada um