22 pontos por xguru 2024-07-06 | 6 comentários | Compartilhar no WhatsApp
  • Remove o ruído de fundo de filmes, podcasts, entrevistas etc. e extrai apenas a voz de forma limpa
  • O tamanho máximo é de 500MB e há suporte para até 1 hora de áudio
  • Não foi projetado nem otimizado para vocais de música (embora possa funcionar dependendo do conteúdo)
  • Ainda não foi lançada uma API para streaming em tempo real, mas deve ser disponibilizada em breve
  • O preço de uso é de 1.000 caracteres por minuto de áudio

6 comentários

 
savvykang 2024-07-06

Quanto custa o Voice Isolator?
O Voice Isolator custa 1000 caracteres por cada minuto de áudio.

O que isso quer dizer? Não entendo por que está falando em quantidade de caracteres.

 
brainer 2024-07-06

Não é um conceito parecido com token?

Como no GPT, em que imagens também são calculadas como text token.

 
savvykang 2024-07-06

Vendo os outros serviços que a empresa oferece, dá para entender. Parece ser um modelo de Speech-to-Text para Speech, então eles cobram pelo texto intermediário.

 
qyurila 2024-07-06

Enquanto isso, o MVSep, que oferece separação de vocais por meio de vários modelos abertos, tanto gratuitos quanto pagos, também disponibiliza vários tipos de modelos de separação de voz/ruído.
https://mvsep.com

 
xguru 2024-07-06

O Adobe Podcast AI também oferece uma funcionalidade parecida. Parece que existe uma versão gratuita também: https://podcast.adobe.com/enhance

 
brainer 2024-07-06

Na versão gratuita, parece que o coreano não está muito bem otimizado..