wav2letter@anywhere, framework de reconhecimento de fala de alto desempenho lançado pelo Facebook
(ai.facebook.com)Uma biblioteca de reconhecimento de fala de alto desempenho, multithread e multiplataforma, criada para tornar o wav2letter++ já lançado anteriormente incorporável em qualquer lugar.
Suporta RNN e CNN (o lado de CNN é mais rápido).
É código em C++ e foi projetado com streaming em mente.
O backend do lado do servidor é o FBGEMM, e também há planos de lançar backends para iOS e Android
1 comentários
FBGEMM - https://github.com/pytorch/FBGEMM