Desenvolvimento de um fluxo de trabalho de tradução de documentação oficial – tradução e busca na documentação oficial do Spring e do MySQL
(devrunner.dev)Introdução
Olá.
Desta vez, criei um fluxo de trabalho para traduzir uma série de documentações oficiais e publiquei os resultados da tradução do MySQL e do Spring Boot em um formato pesquisável.
Costumo folhear a documentação oficial antes e depois de entrevistas, então espero que isso também seja útil para quem quiser usar com um propósito semelhante.
Os prompts reais, os links do serviço e o post do blog da OpenAI que usei como referência ao utilizar o 5.1 desta vez estão reunidos na coleção de links abaixo.
Depois do GPT-5.1, a percepção sobre o desempenho de raciocínio dos LLMs
Estou registrando a diferença de desempenho que percebi ao tentar automatizar traduções desde a época do GPT-3.5.
Tomando o GPT-3.5 como referência, mesmo em textos relativamente curtos de cerca de 5.000 a 10.000 caracteres, muitas vezes ele não conseguia executar com qualidade nem tarefas pequenas, como ajustar a formatação em Markdown.
Por outro lado, no GPT-5.1 foi possível realizar com relativa estabilidade tarefas como as abaixo.
- Extrair de forma estável mais de 1.000 informações de TOC (6 colunas), mantendo a ordem, a partir de HTML com mais de 100 mil caracteres
- Mesmo deixando para o LLM decidir quais termos manter em inglês e quais traduzir, o documento retornado continuava com boa legibilidade (ex.: na documentação do Spring, bean é mantido em inglês, enquanto factory é traduzido)
Quando algo quebrava durante o trabalho ou precisava de ajustes, eu lidava com isso adicionando regras ao system prompt, e o fato de a qualidade do resultado não oscilar muito mesmo quando o system prompt ficava longo era algo difícil de esperar nos modelos do passado.
Coleção de links
Abaixo organizei os materiais de referência relacionados a este trabalho.
Estou compartilhando porque acho que isso pode ter valor como material de referência para mostrar que, mesmo com solicitações de prompt tão pesadas, hoje já é possível obter resultados em nível de serviço real.
(Não acho que o prompt em si esteja tão bem escrito assim rs, e esse tipo de dica sobre prompts aparece bastante nos blogs da Anthropic e da OpenAI, então deixei aqui um exemplo representativo.)
2 comentários
Parece que o número de documentos nos resultados de busca está sempre em 0.
Nossa! Obrigado pelo aviso.
No momento, para mim está aparecendo normalmente. Mesmo assim, por via das dúvidas, conferi a implantação mais uma vez.
Ainda assim, para que eu possa verificar, agradeceria se você pudesse me dizer qual termo de busca usou.
No momento, como não há um dicionário de sinônimos para expressões em coreano <-> inglês, pode ser que não tenha aparecido porque simplesmente não houve correspondência exata.