WaaS - Whisper as a Service
(github.com/schibsted)- GUI e API open source para usar localmente com facilidade o OpenAI Whisper (modelo de reconhecimento de voz)
- Oferece recursos como
transcribe/detect/downloadvia REST API - É possível iniciar o processamento enviando arquivos de áudio/vídeo pela página web
- Pode ser executado com
docker-compose(iniciando 3 contêineres Docker, comoredis/api/worker) - O menor modelo,
tiny, requer cerca de 1 GB de VRAM (o maior,large, requer 10 GB)
1 comentários
Whisper - sistema de reconhecimento de fala multilíngue (ASR) que a OpenAI lançou como open source
OpenAI anuncia o modelo Whisper v2