O que é o Audiblez?
- Ferramenta para converter e-books
.epub em audiolivros .m4b
- Usa síntese de voz de alta qualidade baseada no Kokoro-82M
- Disponibilizado sob licença Apache e treinado com menos de 100 horas de dados de áudio
- Em uma GPU T4 do Google Colab, consegue converter "Animal Farm" em cerca de 5 minutos, com uma "velocidade de conversão de 600 caracteres por segundo"
- Em um MacBook Pro M2 (modo CPU), leva cerca de "1 hora a uma velocidade de 60 caracteres por segundo"
- No Apple Silicon (M1, M2), atualmente não há suporte a CUDA (aguardando suporte a MLX)
Principais atualizações do Audiblez 4.2
- Suporte a GUI multiplataforma baseada em wxWidgets (Mac, Windows, Linux)
- Suporte a vários idiomas (inglês, espanhol, francês, hindi, italiano, japonês, português, chinês)
- Mudança do ONNX para uma base em Torch usando o pacote
kokoro
- Suporte a aceleração por CUDA (porém, no Apple Silicon roda em modo CPU)
- Inclusão de imagem de capa e timestamps de capítulos no audiolivro
- Melhorias no suporte ao Windows
2 comentários
Converter e-books em audiolivros com o modelo Kokoro-82M
Isto é baseado nisso, mas o coreano incluído ali não está no Audiblez (embora haja um comentário dizendo que a qualidade do coreano do Kokoro não é muito boa)
Ao olhar os registros antigos do projeto kokoro, certamente havia uma voz em coreano, mas, pelas discussões no Discord, parece que a distribuição está enfrentando dificuldades por causa da cláusula do aihub da Coreia que proíbe a exportação de dados para o exterior…