Conversor do Hancom Hangul baseado em Pandoc - apresentando uma ferramenta open source que converte md, html e docx para hwpx.
(github.com/msjang)Desenvolvi isso para resolver os incômodos do trabalho com documentos HWP, após 9 anos trabalhando em um instituto de pesquisa governamental.
Contexto do desenvolvimento
- 2018: na época em que eu ainda era iniciante em Python, tentei criar um conversor HML/HWPML baseado em expressões regulares - https://github.com/msjang/md2hml
- Janeiro de 2025: desenvolvimento do hwpfy
- Consolidação dos relatórios semanais de trabalho de cerca de 20 pessoas com base em uma wiki de edição colaborativa em tempo real
- Wiki → exportar para DOCX → converter para DOCX com o formulário oficial aplicado (hwpfy) → abrir no app Hancom Hangul e salvar como HWPX → compartilhar em HWPX com o departamento superior interno
- Dezembro de 2025: pypandoc-hwpx
- Achei que já tinha acumulado experiência suficiente, então investi tempo de forma séria e desenvolvi a ferramenta.
Como foi desenvolvido
- Criei um DOCX com o formato desejado e o salvei como HWPX.
- Descompactei o DOCX e o HWPX gerados para inspecionar os XMLs, removi propriedades desnecessárias e fiz ajustes. Depois, confirmei também se ambos abriam corretamente no Word e no app Hancom Hangul.
- Criei um documento comparando os formatos md, html, docx e hwpx. - https://github.com/msjang/pypandoc-hwpx/…
- A princípio, eu pretendia usar o
format_comparison.mdacima para pedir a um LLM que escrevesse o código, mas percebi que já tinha em mãos o HWPX correto como gabarito. - Fui criando com várias rodadas de feedback usando o Antigravity (Gemini Pro 3). Como a saída não vinha no formato desejado, analisei o XML em detalhes e fui dando feedback. Eu não mencionei diretamente o documento de comparação de formatos, mas ter assimilado seu conteúdo ajudou muito na revisão.
Próximos passos
Quero remover a dependência de Python no Pypandoc, reescrever em Haskell e contribuir com um writer HWPX para o Pandoc.
Ainda não há comentários.