ElevenLabs Voice Isolator - isola apenas a voz com clareza
(elevenlabs.io)- Remove o ruído de fundo de filmes, podcasts, entrevistas etc. e extrai apenas a voz de forma limpa
- O tamanho máximo é de 500MB e há suporte para até 1 hora de áudio
- Não foi projetado nem otimizado para vocais de música (embora possa funcionar dependendo do conteúdo)
- Ainda não foi lançada uma API para streaming em tempo real, mas deve ser disponibilizada em breve
- O preço de uso é de 1.000 caracteres por minuto de áudio
6 comentários
O que isso quer dizer? Não entendo por que está falando em quantidade de caracteres.
Não é um conceito parecido com token?
Como no GPT, em que imagens também são calculadas como
text token.Vendo os outros serviços que a empresa oferece, dá para entender. Parece ser um modelo de Speech-to-Text para Speech, então eles cobram pelo texto intermediário.
Enquanto isso, o MVSep, que oferece separação de vocais por meio de vários modelos abertos, tanto gratuitos quanto pagos, também disponibiliza vários tipos de modelos de separação de voz/ruído.
https://mvsep.com
O Adobe Podcast AI também oferece uma funcionalidade parecida. Parece que existe uma versão gratuita também: https://podcast.adobe.com/enhance
Na versão gratuita, parece que o coreano não está muito bem otimizado..