8 pontos por xguru 2022-07-10 | Ainda não há comentários. | Compartilhar no WhatsApp
  • O projeto de IA do Facebook, "inovador e de uma forma totalmente diferente de tudo o que veio antes"
  • Um modelo open source que pode oferecer imediatamente tradução de alta qualidade, avaliada entre 200 idiomas, incluindo idiomas com poucos recursos como asturiano, luganda e urdu
  • O objetivo do NLLB é oferecer a qualquer pessoa a chance de acessar e compartilhar conteúdo da web em sua língua materna e se comunicar com pessoas do mundo todo, independentemente do idioma de preferência de cada um
  • Aplicações reais
    • Aplicação de tecnologia de IA no Facebook e no Instagram para tradução de idiomas com poucos recursos
    • Disponibilizar a Wikipédia em todos os idiomas
  • Programa de demonstração de tradução por IA: "Stories Told Through Translation"
    • Nos próximos meses, a cobertura de tradução deverá ser ampliada para mais de uma centena de idiomas
    • Com isso, o NLLB-200 se tornará o primeiro modelo de IA capaz de traduzir literatura em larga escala
  • Tecnologia: como o modelo open source NLLB traduz imediatamente 200 idiomas?
      1. Construção automática do conjunto de dados: coleta de dados de treinamento contendo frases no idioma de entrada e no idioma de saída desejado
      1. Treinamento: após criar dados de treinamento ajustados a milhares de instruções de treinamento, esses dados são inseridos no pipeline de treinamento de modelos da Meta
      • Um codificador que converte em representações vetoriais internas e um decodificador que usa essas representações vetoriais internas para gerar com precisão a frase de saída
      1. Avaliação: o modelo é avaliado com base em conjuntos de frases traduzidas por humanos para verificar se a qualidade da tradução é satisfatória
      • Uso de listas de linguagem nociva criadas para todos os idiomas compatíveis para detectar e filtrar palavrões e outros conteúdos ofensivos
      • Como resultado, nasce um modelo bem treinado capaz de traduzir diretamente um idioma

Ainda não há comentários.

Ainda não há comentários.