16 pontos por xguru 2023-05-24 | 3 comentários | Compartilhar no WhatsApp
  • Massively Multilingual Speech
  • Um projeto para criar um único modelo de voz que suporte milhares de idiomas, indo além dos modelos de reconhecimento de fala existentes que suportam cerca de 100 idiomas, com o objetivo de abranger mais de 7.000 idiomas usados no planeta
  • Oferece mais de 1100 modelos multilíngues de reconhecimento automático de fala (ASR) e síntese de fala (TTS), mais de 4000 modelos de identificação de idioma (LID) e mais de 1400 modelos pré-treinados de idioma
  • O objetivo é permitir que as pessoas acessem e usem informações no idioma que desejarem diretamente em seus dispositivos
  • Como parte do projeto, foi construído um conjunto de dados com leitura do Novo Testamento, com média de 32 horas por idioma para 1100 idiomas, e o número de idiomas disponíveis foi expandido para 4000 usando gravações não rotuladas de diversos documentos cristãos

Arquivos de modelo disponíveis para download

  • Modelos pretraied: MMS-300M (3.5GB) e MMS-1B (10GB)
  • Modelos de reconhecimento de fala ASR e dicionários publicados: MMS-1B:FL102 (102 idiomas, 4.5GB), MMS-1B:L1107 (1107 idiomas, 13GB), MMS-1B-all (1162 idiomas, 13.7GB)
  • Modelos de síntese de fala TTS: arquivos de gerador e vocabulary para cada um dos 1107 idiomas
  • Modelos de identificação de idioma LID: 126, 256, 512, 1024, 2048, 4017 modelos e dicionários

3 comentários

 
kuroneko 2023-05-24

Ultimamente têm surgido muitos modelos de reconhecimento de voz e TTS.
Parece que não falta muito para que o desempenho nessa área dê um grande salto.

Mas, se a pessoa for cristã, a taxa de reconhecimento de voz aumenta? 🤔

 
koyokr 2023-05-24

kkkk

 
cosine20 2023-05-24

MMS - Projeto de tecnologia de voz para mais de 1.000 idiomas divulgado pela Meta

......