31 pontos por xguru 2025-10-04 | 1 comentários | Compartilhar no WhatsApp
  • Um app open source gratuito de voz → texto que funciona de forma totalmente offline, baseado em Rust + React/TypeScript como um aplicativo desktop Tauri
  • Ao pressionar um atalho, a gravação começa → você fala → a conversão é feita localmente sem enviar nada para a nuvem → o texto é inserido automaticamente
  • Usa os modelos Whisper e Parakeet V3, com aceleração por GPU ou otimização para CPU, e oferece suporte a Windows, macOS e Linux
  • O objetivo do projeto não é ser “o aplicativo de reconhecimento de voz mais perfeito”, mas sim criar o app mais fácil de fazer fork, que qualquer pessoa possa modificar e expandir com facilidade, além de oferecer suporte open source, gratuito e offline
  • Stack tecnológica
    • Frontend: React + TypeScript + Tailwind CSS
    • Backend: baseado em Rust, responsável pelo processamento de áudio e pela inferência de machine learning
    • Bibliotecas principais:
      • whisper-rs (reconhecimento de voz baseado em Whisper)
      • transcription-rs (modelo Parakeet otimizado para CPU)
      • cpal (I/O de áudio multiplataforma)
      • vad-rs (detecção de atividade de voz)
      • rdev (atalhos globais e tratamento de eventos)
      • rubato (reamostragem de áudio)
  • Site oficial: https://handy.computer/

1 comentários

 
shakespeares 2025-10-07

Muito legal.