vvrite — aplicativo de digitação por voz com IA on-device e open source para macOS
(github.com/shaircast)Olá, eu vinha usando ferramentas de digitação por voz já existentes, como superwhisper e spokenly, junto com um gamepad 8bitdo micro. Mas, por algum motivo, a latência de rede me incomodava bastante.
Então continuei testando modelos locais e, desta vez, ao experimentar o modelo Qwen3-ASR, senti que era exatamente isso. Ele é ágil e oferece um desempenho que não fica atrás dos modelos em nuvem, então criei o vvrite para rodá-lo localmente e buscar a mesma UX. Dependendo do desempenho do dispositivo, ele é bem rápido e também consome pouca memória.
O vvrite é um app que, ao pressionar uma tecla de atalho na barra de menus do macOS (Option+Space por padrão), começa a gravar imediatamente e, ao pressioná-la novamente, reconhece a fala com IA on-device e a cola automaticamente no campo de entrada atual. Ele é compatível com Macs Apple Silicon com macOS 13 ou superior. Pode ser instalado diretamente por um DMG assinado/notarizado disponível no GitHub Releases.
13 comentários
Eu estava pensando em experimentar o handy, mas como esse dá um suporte melhor ao coreano, acho que vou ter que testar. Obrigado.
Eu estava usando uma ferramenta de reconhecimento de voz em coreano e aquilo estava me incomodando,
então, como o grok me recomendou este aqui entre os projetos open source
(me recomendou no final, em letras bem pequenas), resolvi testar.
Gostei, então estou usando com algumas customizações.
Também adicionei mais 3 modelos,
como o som de notificação era alto demais, coloquei um ajuste de volume...
e também corrigi alguns bugs.
Por enquanto vai ser com este aqui mesmo
que vou continuar me divertindo bastante com coding por voz.
Quando abri o código, pareceu ser um projeto tocado por alguém que não é desenvolvedor,
o que me fez torcer ainda mais por ele ~~
É cem vezes melhor do que certas pessoas (eu...)
que ficam só pensando e adiando tudo 😂
Também achei interessante ver que ainda ficaram rastros de
superpowers,e pensei: "ah, então é assim que o pessoal faz..."
Nossa, testei e é rápido e bom mesmo. Vou usar bastante.
Obrigado!
Estou criando um app de comandos por voz para Android, e o qwen realmente é muito bom. Mas ainda não consegui otimizar, então estou usando uma versão do whisper base com fine-tuning em um dataset em coreano.
É melhor que o Whisper large v3 turbo? Ainda estou usando este aqui e fiquei curioso para saber se você já comparou os dois. Também vi o Moonshine por aqui e pensei em testar, mas já se passaram 3 semanas haha
Para coreano, é definitivamente melhor do que o Whisper!
O Moonshine não teve uma diferença muito grande em relação ao parakeet.
Qual é a diferença em relação ao handy?
Apps desse tipo provavelmente têm uma UX quase igual. O vvrite também não é muito diferente. No fim, o que importa é o desempenho do modelo.
Se você só vai usar inglês, algo como o parakeet, suportado pelo handy, já é suficiente,
mas, pela minha experiência, para suporte ao coreano o Qwen3-ASR foi a melhor opção.
Só que não havia nenhum lugar que oferecesse isso, então eu mesmo fiz.
Uau, que ferramenta incrível.
Pessoalmente, acho que seria ainda melhor se adicionassem uma interface para poder revisar o guia de uso (manual). Na hora da instalação, fui clicando em tudo sem pensar e depois fiquei meio confuso sobre como usar kkk
Como se lê o nome da ferramenta? É “vrite”?
Obrigado pela opinião! Vou refletir isso no próximo release.
A intenção era que se lesse "light", mas… eu também não sei muito bem qual seria a melhor forma de ler isso.
Que tal o Vvrite?
vvrite - vwrite - bright, reunindo os três significados...