11 pontos por xguru 2023-02-15 | 1 comentários | Compartilhar no WhatsApp
  • GUI e API open source para usar localmente com facilidade o OpenAI Whisper (modelo de reconhecimento de voz)
  • Oferece recursos como transcribe/detect/download via REST API
  • É possível iniciar o processamento enviando arquivos de áudio/vídeo pela página web
  • Pode ser executado com docker-compose (iniciando 3 contêineres Docker, como redis/api/worker)
  • O menor modelo, tiny, requer cerca de 1 GB de VRAM (o maior, large, requer 10 GB)