Novidades da atualização do legalize-kr - adição de regras administrativas/legislação local, CLI/MCP/Skill, página de ecossistema e mais
(github.com/legalize-kr)Depois de apresentar o projeto no último Show GN, estou compartilhando um resumo das atualizações do projeto legalize-kr ao longo de 1 mês (31 dias). Graças ao interesse e ao apoio de muita gente, consegui melhorar várias coisas. Obrigado!
O que é o legalize-kr?
O legalize-kr é um projeto que arquiva leis e precedentes judiciais da Coreia do Sul, fornecidos pelo National Law Information Shared Service do Ministério da Legislação, em Markdown + histórico Git. Todas as leis foram arquivadas como documentos Markdown, todo o histórico de revisões como commits Git, e os precedentes também foram arquivados como documentos Markdown e histórico Git com base na data da decisão.
Por que foi criado?
No dia 30 de março, encontrei no GitHub Trending um projeto chamado legalize.dev, que gerencia legislações da Espanha e de países de língua inglesa com Markdown e commits Git. Achei que naturalmente já existiria algo semelhante para a legislação coreana, mas não encontrei nada. Então resolvi criar um.
Atualização 1. Adição de repositórios de regras administrativas / legislação local
Antes eu lidava apenas com leis e precedentes, mas agora também adicionei, em repositórios separados, as regras administrativas e a legislação local fornecidas pelo mesmo National Law Information Shared Service. Agora é possível acompanhar em um só lugar os principais documentos legais públicos da Coreia do Sul com Markdown + histórico Git:
- Repositório de leis: github.com/legalize-kr/legalize-kr
- Repositório de precedentes: github.com/legalize-kr/precedent-kr
- Repositório de regras administrativas: github.com/legalize-kr/admrule-kr
- Repositório de legislação local: github.com/legalize-kr/ordinance-kr
As regras administrativas incluem instruções, diretrizes e avisos de cada ministério, enquanto a legislação local inclui ordenanças e regulamentos de governos locais. Como o volume é maior do que o das leis e as revisões são mais frequentes, achei que o valor de acompanhá-las por histórico Git seria bem grande. No entanto, no caso das regras administrativas, rastrear mudanças nos nomes dos ministérios e a redistribuição de funções entre órgãos é bastante complicado. Já melhorei isso várias vezes, mas ainda parece haver um longo caminho pela frente. Fico muito grato pelo interesse e pela participação de todos T_T
Atualização 2. Adição de ferramenta CLI, MCP e Agent Skill
Usar o repositório inteiro com git clone continua sendo a forma mais prática e conveniente, mas como pode ser pesado baixar repositórios de dezenas de GB toda vez, criei uma ferramenta CLI baseada na GitHub REST API. Além disso, o mesmo codebase também fornece um servidor MCP, e adicionei um Agent Skill que pode ser usado diretamente no Claude Code / Codex e afins:
- Repositório de CLI / MCP: github.com/legalize-kr/cli-tools
- Repositório de Agent Skills: github.com/legalize-kr/agent-skills
Sem baixar o repositório inteiro, é possível pesquisar uma lei ou precedente específico, consultar por artigo e acompanhar o histórico de revisões. Via MCP, um LLM/Agent também pode fazer chamadas diretamente. O AGENT SKILL também inclui um guia sobre quando usar CLI / MCP / git clone / acesso direto ao GitHub em cada situação. Porém, a GitHub REST API permite apenas 60 requisições por hora sem autenticação, então, se necessário, será preciso emitir e usar um token do GitHub (até 5.000 por hora).
Atualização 3. Adição de página de casos de uso / ecossistema
Como começaram a surgir aos poucos projetos que usam os datasets fornecidos pelo legalize-kr, comecei a organizá-los no fim da página principal e no menu “Como usar” do site. Além dos projetos que eu mesmo usei diretamente, também estou indicando outros projetos e ferramentas com objetivos semelhantes (como Beommang e Korean Law MCP, que já haviam sido apresentados anteriormente no GN).
Se você estiver usando um ou mais datasets do legalize-kr, ou se estiver trabalhando em um projeto em área semelhante, avise por PR, issue ou pelos comentários deste post para que eu possa incluir tudo junto.
Atualização 4. Outras melhorias para um uso melhor dos dados
Com base nas issues abertas nos vários repositórios, estou trabalhando na organização das regras de parsing dos dados e dos metadados. As principais mudanças são as seguintes:
- Complemento das regras de parsing para unidades adicionais como “inciso” e “subseção”, além das já existentes “parte/capítulo/seção/subseção maior” (legalize-kr/legalize-kr#32)
- Correção da perda do padrão
<제M조의 N>(legalize-kr/legalize-kr#31 e legalize-kr/legalize-pipeline#2) - Complementação de leis ausentes — por exemplo, o Código Comercial e seu decreto de execução (legalize-kr/legalize-kr#9)
- Correção do problema em que arquivos antigos de regulamentos de execução permaneciam e o
git logos registrava como “adição” em vez de “modificação” (legalize-kr/legalize-kr#24) - Alteração do nome dos arquivos de precedentes e classificação de diretórios com base na data da decisão (legalize-kr/precedent-kr#4)
- Correção do problema de quebra no formato de endereços em coreano na URL de origem dos precedentes (404 no law.go.kr) (legalize-kr/precedent-kr#3)
- Complementação de 17 commits Git ausentes para datas de decisão com a era Dangi (檀紀) (legalize-kr/precedent-kr#1)
- Adição, no Markdown Frontmatter, de links para arquivos anexos relacionados a cada lei / precedente / regra administrativa / legislação local em formato de lista
Mais detalhes podem ser vistos nas issues fechadas dos principais repositórios:
- Issues fechadas do legalize-kr: https://github.com/legalize-kr/legalize-kr/…
- Issues fechadas do precedent-kr: https://github.com/legalize-kr/precedent-kr/…
- Issues fechadas do legalize-pipeline: https://github.com/legalize-kr/legalize-pipeline/…
Por fim
No começo era algo como “se eu simplesmente fizer, alguém talvez use em algum lugar”, mas depois do último Show GN, com muitas ⭐ e também várias issues chegando, o escopo foi se ampliando naturalmente. Estou mantendo e administrando o projeto de forma contínua, então agradeço muito pelo interesse, apoio e divulgação. Obrigado!
2 comentários
Há algo que estamos desenvolvendo no nosso ministério com RAG, e queremos clonar isso e usar extraindo apenas as leis e regulamentos relacionados ao nosso lado.
Isso seria possível?
Sim, não sei como o pipeline está estruturado no momento, mas, em princípio, acho que bastaria adicionar essas tarefas relacionadas antes de inserir os documentos no Vector DB para a configuração atual de RAG.
No entanto, acho que o ponto principal é como vocês vão extrair a "legislação relacionada"; talvez seja possível filtrar com base no nome da lei ou em palavras-chave principais. ^^;
Obrigado!