5 pontos por wellsa 14 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp

Ao pesquisar normas, é frustrante precisar saber algo como “Artigo 14 da Lei de Punição de Crimes de Violência Sexual” para conseguir encontrar o texto, então criei um demo de RAG que retorna os artigos relevantes quando qualquer pessoa pergunta em linguagem do dia a dia.

Os dados são obtidos da OpenAPI pública do Ministério da Legislação e organizados em Markdown, com atualização diária via cron.

• Leis (law-kr): 5.589
• Regras administrativas (regulate-kr): 10.765
• Precedentes (precedent-kr): 171.014
• Casos de interpretação legislativa (interpretation-kr): 8.728
• Decisões do Tribunal Constitucional (constitution-kr): 38.092
• Normas locais (localrule-kr): 159.910
• Tratados (treaty-kr): 6.907

Total de mais de 397 mil documentos em Markdown.
Mais de 1,36 milhão de artigos indexados no banco de dados de produção.

• Demo: https://minilex.wellsa.ai
• Dados/código (MIT): https://github.com/wellsa-ai
• Espelho no HF: https://huggingface.co/wellsa-ai

Confirmei que, em cerca de 5 cenários para cidadãos (deepfake / atraso de salário / demissão injusta / vazamento de dados pessoais / stalking), ele retorna junto os artigos-fonte correspondentes, mas a generalização ainda está longe do ideal.
Como a dependência de palavras-chave + expansão por sinônimos ainda é alta, a próxima tarefa é melhorar a generalização do ranking.

A stack é a de sempre: Next.js + FastAPI + Celery + PostgreSQL + pgvector, e estou usando nomic-embed-text-v2-moe (768d) para embeddings.
Num benchmark interno de amostras seguras, saiu algo em torno de R@5 0,86 / MRR 0,753.

Não é uma ferramenta para substituir consultoria jurídica, e sim um apoio para explorar os artigos-fonte.
Para decisões reais, consulte um profissional qualificado.

Feedbacks / PRs são bem-vindos.

Ainda não há comentários.

Ainda não há comentários.