8 pontos por xguru 2025-02-19 | 2 comentários | Compartilhar no WhatsApp

O que é o Audiblez?

  • Ferramenta para converter e-books .epub em audiolivros .m4b
  • Usa síntese de voz de alta qualidade baseada no Kokoro-82M
  • Disponibilizado sob licença Apache e treinado com menos de 100 horas de dados de áudio
  • Em uma GPU T4 do Google Colab, consegue converter "Animal Farm" em cerca de 5 minutos, com uma "velocidade de conversão de 600 caracteres por segundo"
  • Em um MacBook Pro M2 (modo CPU), leva cerca de "1 hora a uma velocidade de 60 caracteres por segundo"
    • No Apple Silicon (M1, M2), atualmente não há suporte a CUDA (aguardando suporte a MLX)

Principais atualizações do Audiblez 4.2

  • Suporte a GUI multiplataforma baseada em wxWidgets (Mac, Windows, Linux)
  • Suporte a vários idiomas (inglês, espanhol, francês, hindi, italiano, japonês, português, chinês)
  • Mudança do ONNX para uma base em Torch usando o pacote kokoro
  • Suporte a aceleração por CUDA (porém, no Apple Silicon roda em modo CPU)
  • Inclusão de imagem de capa e timestamps de capítulos no audiolivro
  • Melhorias no suporte ao Windows

2 comentários

 
xguru 2025-02-19

Converter e-books em audiolivros com o modelo Kokoro-82M
Isto é baseado nisso, mas o coreano incluído ali não está no Audiblez (embora haja um comentário dizendo que a qualidade do coreano do Kokoro não é muito boa)

 
inosphe 2025-02-19

Ao olhar os registros antigos do projeto kokoro, certamente havia uma voz em coreano, mas, pelas discussões no Discord, parece que a distribuição está enfrentando dificuldades por causa da cláusula do aihub da Coreia que proíbe a exportação de dados para o exterior…