MMS - projeto de tecnologia de voz para mais de 1000 idiomas lançado pela Meta

xguru · 2023-05-24T09:45:01+09:00

Massively Multilingual Speech Um projeto para criar um único modelo de voz que suporte milhares de idiomas, indo além dos modelos de reconhecimento de fala existentes que suportam cerca de 100 idiomas, com o objetivo de abranger mais de 7.000 idiomas usados no planeta Oferece mais de 1100 modelos multilíngues de reconhecimento automático de fala (ASR) e síntese de fala (TTS), mais de 4000 modelos de identificação de idioma (LID) e mais de 1400 modelos pré-treinados de idioma O objetivo é permitir que as pessoas acessem e usem informações no idioma que desejarem diretamente em seus dispositivos Como parte do projeto, foi construído um conjunto de dados com leitura do Novo Testamento, com média de 32 horas por idioma para 1100 idiomas, e o número de idiomas disponíveis foi expandido para 4000 usando gravações não rotuladas de diversos documentos cristãos Arquivos de modelo disponíveis para download Modelos pretraied: MMS-300M (3.5GB) e MMS-1B (10GB) Modelos de reconhecimento de fala ASR e dicionários publicados: MMS-1B:FL102 (102 idiomas, 4.5GB), MMS-1B:L1107 (1107 idiomas, 13GB), MMS-1B-all (1162 idiomas, 13.7GB) Modelos de síntese de fala TTS: arquivos de gerador e vocabulary para cada um dos 1107 idiomas Modelos de identificação de idioma LID: 126, 256, 512, 1024, 2048, 4017 modelos e dicionários

(github.com/facebookresearch)

16 pontos por xguru 2023-05-24 | 3 comentários | Compartilhar no WhatsApp

Massively Multilingual Speech
Um projeto para criar um único modelo de voz que suporte milhares de idiomas, indo além dos modelos de reconhecimento de fala existentes que suportam cerca de 100 idiomas, com o objetivo de abranger mais de 7.000 idiomas usados no planeta
Oferece mais de 1100 modelos multilíngues de reconhecimento automático de fala (ASR) e síntese de fala (TTS), mais de 4000 modelos de identificação de idioma (LID) e mais de 1400 modelos pré-treinados de idioma
O objetivo é permitir que as pessoas acessem e usem informações no idioma que desejarem diretamente em seus dispositivos
Como parte do projeto, foi construído um conjunto de dados com leitura do Novo Testamento, com média de 32 horas por idioma para 1100 idiomas, e o número de idiomas disponíveis foi expandido para 4000 usando gravações não rotuladas de diversos documentos cristãos

Arquivos de modelo disponíveis para download

Modelos pretraied: MMS-300M (3.5GB) e MMS-1B (10GB)
Modelos de reconhecimento de fala ASR e dicionários publicados: MMS-1B:FL102 (102 idiomas, 4.5GB), MMS-1B:L1107 (1107 idiomas, 13GB), MMS-1B-all (1162 idiomas, 13.7GB)
Modelos de síntese de fala TTS: arquivos de gerador e vocabulary para cada um dos 1107 idiomas
Modelos de identificação de idioma LID: 126, 256, 512, 1024, 2048, 4017 modelos e dicionários

3 comentários

kuroneko 2023-05-24

Ultimamente têm surgido muitos modelos de reconhecimento de voz e TTS.
Parece que não falta muito para que o desempenho nessa área dê um grande salto.

Mas, se a pessoa for cristã, a taxa de reconhecimento de voz aumenta? 🤔

koyokr 2023-05-24

kkkk

cosine20 2023-05-24

MMS - Projeto de tecnologia de voz para mais de 1.000 idiomas divulgado pela Meta

......

MMS - projeto de tecnologia de voz para mais de 1000 idiomas lançado pela Meta

Arquivos de modelo disponíveis para download

Leituras relacionadas

3 comentários