2 pontos por kapitalismho 5 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp

Resumo rápido
P: Então ele já tem desempenho para conversar naturalmente com estrangeiros?
R: Sim. Veja o vídeo de demonstração no repositório do GitHub. (Ou na página do Faeri mais abaixo)

Olá.

Este é um projeto que começou com a ideia de querer ter conversas mais profundas
com um amigo estrangeiro que conheci em realidade virtual.

O lema é tradução em tempo real que qualquer pessoa possa usar sem dificuldades.
Por isso, pensei bastante em como tirar o máximo de performance
mantendo equilíbrio entre os três itens abaixo.


  • Qualidade da tradução => taxa de erro de tradução de 1/6 em comparação ao DeepL
  • Latência => menos de 2 segundos
  • Acessibilidade e custo => código aberto / de 0,1 won a 0,5 won por fala
    (Gemma 4 26B A4B como referência)

Os dados fluem no formato voz => ASR => LLM => tradução,
e isso permite tradução bidirecional, traduzindo tanto a sua fala quanto a fala da outra pessoa.

O vídeo no repositório do GitHub mostra o uso real.
A plataforma no vídeo é o VRChat.

Ainda estamos naquele início de fase de transição
em que não é preciso desconfiar se alguém do outro lado da tela é realmente uma pessoa,
e espero que este programa ajude a conectar pessoas para além da língua.

Ainda não há comentários.

Ainda não há comentários.