4 pontos por dankim0124 2026-01-25 | 2 comentários | Compartilhar no WhatsApp

Introdução

Olá.

Desta vez, criei um fluxo de trabalho para traduzir uma série de documentações oficiais e publiquei os resultados da tradução do MySQL e do Spring Boot em um formato pesquisável.

Costumo folhear a documentação oficial antes e depois de entrevistas, então espero que isso também seja útil para quem quiser usar com um propósito semelhante.

Os prompts reais, os links do serviço e o post do blog da OpenAI que usei como referência ao utilizar o 5.1 desta vez estão reunidos na coleção de links abaixo.


Depois do GPT-5.1, a percepção sobre o desempenho de raciocínio dos LLMs

Estou registrando a diferença de desempenho que percebi ao tentar automatizar traduções desde a época do GPT-3.5.

Tomando o GPT-3.5 como referência, mesmo em textos relativamente curtos de cerca de 5.000 a 10.000 caracteres, muitas vezes ele não conseguia executar com qualidade nem tarefas pequenas, como ajustar a formatação em Markdown.

Por outro lado, no GPT-5.1 foi possível realizar com relativa estabilidade tarefas como as abaixo.

  • Extrair de forma estável mais de 1.000 informações de TOC (6 colunas), mantendo a ordem, a partir de HTML com mais de 100 mil caracteres
  • Mesmo deixando para o LLM decidir quais termos manter em inglês e quais traduzir, o documento retornado continuava com boa legibilidade (ex.: na documentação do Spring, bean é mantido em inglês, enquanto factory é traduzido)

Quando algo quebrava durante o trabalho ou precisava de ajustes, eu lidava com isso adicionando regras ao system prompt, e o fato de a qualidade do resultado não oscilar muito mesmo quando o system prompt ficava longo era algo difícil de esperar nos modelos do passado.


Coleção de links

Abaixo organizei os materiais de referência relacionados a este trabalho.

Estou compartilhando porque acho que isso pode ter valor como material de referência para mostrar que, mesmo com solicitações de prompt tão pesadas, hoje já é possível obter resultados em nível de serviço real.

(Não acho que o prompt em si esteja tão bem escrito assim rs, e esse tipo de dica sobre prompts aparece bastante nos blogs da Anthropic e da OpenAI, então deixei aqui um exemplo representativo.)

2 comentários

 
ng0301 2026-01-26

Parece que o número de documentos nos resultados de busca está sempre em 0.

 
dankim0124 2026-01-26

Nossa! Obrigado pelo aviso.
No momento, para mim está aparecendo normalmente. Mesmo assim, por via das dúvidas, conferi a implantação mais uma vez.

Ainda assim, para que eu possa verificar, agradeceria se você pudesse me dizer qual termo de busca usou.
No momento, como não há um dicionário de sinônimos para expressões em coreano <-> inglês, pode ser que não tenha aparecido porque simplesmente não houve correspondência exata.