26 pontos por shuggie 2025-12-19 | Ainda não há comentários. | Compartilhar no WhatsApp

Desenvolvi isso para resolver os incômodos do trabalho com documentos HWP, após 9 anos trabalhando em um instituto de pesquisa governamental.

Contexto do desenvolvimento

  • 2018: na época em que eu ainda era iniciante em Python, tentei criar um conversor HML/HWPML baseado em expressões regulares - https://github.com/msjang/md2hml
  • Janeiro de 2025: desenvolvimento do hwpfy
    • Consolidação dos relatórios semanais de trabalho de cerca de 20 pessoas com base em uma wiki de edição colaborativa em tempo real
    • Wiki → exportar para DOCX → converter para DOCX com o formulário oficial aplicado (hwpfy) → abrir no app Hancom Hangul e salvar como HWPX → compartilhar em HWPX com o departamento superior interno
  • Dezembro de 2025: pypandoc-hwpx
    • Achei que já tinha acumulado experiência suficiente, então investi tempo de forma séria e desenvolvi a ferramenta.

Como foi desenvolvido

  1. Criei um DOCX com o formato desejado e o salvei como HWPX.
  2. Descompactei o DOCX e o HWPX gerados para inspecionar os XMLs, removi propriedades desnecessárias e fiz ajustes. Depois, confirmei também se ambos abriam corretamente no Word e no app Hancom Hangul.
  3. Criei um documento comparando os formatos md, html, docx e hwpx. - https://github.com/msjang/pypandoc-hwpx/…
  4. A princípio, eu pretendia usar o format_comparison.md acima para pedir a um LLM que escrevesse o código, mas percebi que já tinha em mãos o HWPX correto como gabarito.
  5. Fui criando com várias rodadas de feedback usando o Antigravity (Gemini Pro 3). Como a saída não vinha no formato desejado, analisei o XML em detalhes e fui dando feedback. Eu não mencionei diretamente o documento de comparação de formatos, mas ter assimilado seu conteúdo ajudou muito na revisão.

Próximos passos

Quero remover a dependência de Python no Pypandoc, reescrever em Haskell e contribuir com um writer HWPX para o Pandoc.

Ainda não há comentários.

Ainda não há comentários.