WaaS - Whisper as a Service

xguru · 2023-02-15T10:47:02+09:00

GUI e API open source para usar localmente com facilidade o OpenAI Whisper (modelo de reconhecimento de voz) Oferece recursos como transcribe/detect/download via REST API É possível iniciar o processamento enviando arquivos de áudio/vídeo pela página web Pode ser executado com docker-compose (iniciando 3 contêineres Docker, como redis/api/worker) O menor modelo, tiny, requer cerca de 1 GB de VRAM (o maior, large, requer 10 GB)

(github.com/schibsted)

11 pontos por xguru 2023-02-15 | 1 comentários | Compartilhar no WhatsApp

GUI e API open source para usar localmente com facilidade o OpenAI Whisper (modelo de reconhecimento de voz)
Oferece recursos como transcribe/detect/download via REST API
É possível iniciar o processamento enviando arquivos de áudio/vídeo pela página web
Pode ser executado com docker-compose (iniciando 3 contêineres Docker, como redis/api/worker)
O menor modelo, tiny, requer cerca de 1 GB de VRAM (o maior, large, requer 10 GB)

1 comentários

xguru 2023-02-15

Whisper - sistema de reconhecimento de fala multilíngue (ASR) que a OpenAI lançou como open source
OpenAI anuncia o modelo Whisper v2

WaaS - Whisper as a Service

Leituras relacionadas

1 comentários