- Um app open source gratuito de voz → texto que funciona de forma totalmente offline, baseado em Rust + React/TypeScript como um aplicativo desktop Tauri
- Ao pressionar um atalho, a gravação começa → você fala → a conversão é feita localmente sem enviar nada para a nuvem → o texto é inserido automaticamente
- Usa os modelos Whisper e Parakeet V3, com aceleração por GPU ou otimização para CPU, e oferece suporte a Windows, macOS e Linux
- O objetivo do projeto não é ser “o aplicativo de reconhecimento de voz mais perfeito”, mas sim criar o app mais fácil de fazer fork, que qualquer pessoa possa modificar e expandir com facilidade, além de oferecer suporte open source, gratuito e offline
- Stack tecnológica
- Frontend: React + TypeScript + Tailwind CSS
- Backend: baseado em Rust, responsável pelo processamento de áudio e pela inferência de machine learning
- Bibliotecas principais:
whisper-rs (reconhecimento de voz baseado em Whisper)
transcription-rs (modelo Parakeet otimizado para CPU)
cpal (I/O de áudio multiplataforma)
vad-rs (detecção de atividade de voz)
rdev (atalhos globais e tratamento de eventos)
rubato (reamostragem de áudio)
- Site oficial: https://handy.computer/
1 comentários
Muito legal.