App de tradução de tela/voz feita para jogar visual novels
(github.com/tchinso)Sou um otaku comum que gosta de visual novels.
Ouvi dizer que antigamente havia uma época em que as pessoas traduziam usando EasyTrans ou AralTrans.
Hoje em dia dizem que dá para rodar um tradutor por OCR com o MORT,
mas, quando fui usar, achei que tinha configurações e funções demais e era muito complicado,
além de que, acima de tudo, a taxa de reconhecimento de tela era ruim demais.
Na tradução também, o DeepL dava erro toda hora se eu não colocasse uma chave de API,
e, como os AIs locais melhoraram bastante hoje em dia,
pensei: não seria bom colocar um modelo local de OCR com IA
e um modelo local de tradução com IA?
Então eu fiz.
Enquanto fazia, pensei que não seria legal colocar também uma função que reconhecesse voz e traduzisse?
E, à medida que a escala foi crescendo,
acabei criando um app único que reconhece tela/voz e traduz.
Só funciona com japonês (porque o objetivo original era justamente visual novels...).
A tradução por reconhecimento de tela
funciona no formato em que, depois de registrar uma área temporária como área fixa, basta clicar no botão de tradução repetidamente para traduzir e exibir em overlay.
O reconhecimento de voz funciona no formato em que, ao receber o arquivo de áudio inteiro, ele gera a transcrição e a mostra em overlay.
O processo de criação não foi fácil.
Eu trabalho em uma área totalmente sem relação com programação e em um emprego também totalmente sem relação,
e, de programação, tudo o que eu tinha era a lembrança de ter mexido um pouco no DevC++ na aula de informática do ensino médio, chegando só até if/while.
Quis mostrar a vocês que é possível fazer algo desse nível com o GPT-5.5.
A quantidade de tokens usada foi de cerca de 720 milhões.
Peço muito o feedback do pessoal do GN!
Ainda não há comentários.