- Massively Multilingual Speech
- Um projeto para criar um único modelo de voz que suporte milhares de idiomas, indo além dos modelos de reconhecimento de fala existentes que suportam cerca de 100 idiomas, com o objetivo de abranger mais de 7.000 idiomas usados no planeta
- Oferece mais de 1100 modelos multilíngues de reconhecimento automático de fala (ASR) e síntese de fala (TTS), mais de 4000 modelos de identificação de idioma (LID) e mais de 1400 modelos pré-treinados de idioma
- O objetivo é permitir que as pessoas acessem e usem informações no idioma que desejarem diretamente em seus dispositivos
- Como parte do projeto, foi construído um conjunto de dados com leitura do Novo Testamento, com média de 32 horas por idioma para 1100 idiomas, e o número de idiomas disponíveis foi expandido para 4000 usando gravações não rotuladas de diversos documentos cristãos
Arquivos de modelo disponíveis para download
- Modelos pretraied: MMS-300M (3.5GB) e MMS-1B (10GB)
- Modelos de reconhecimento de fala ASR e dicionários publicados: MMS-1B:FL102 (102 idiomas, 4.5GB), MMS-1B:L1107 (1107 idiomas, 13GB), MMS-1B-all (1162 idiomas, 13.7GB)
- Modelos de síntese de fala TTS: arquivos de gerador e vocabulary para cada um dos 1107 idiomas
- Modelos de identificação de idioma LID: 126, 256, 512, 1024, 2048, 4017 modelos e dicionários
3 comentários
Ultimamente têm surgido muitos modelos de reconhecimento de voz e TTS.
Parece que não falta muito para que o desempenho nessa área dê um grande salto.
Mas, se a pessoa for cristã, a taxa de reconhecimento de voz aumenta? 🤔
kkkk
MMS - Projeto de tecnologia de voz para mais de 1.000 idiomas divulgado pela Meta
......