8 pontos por unohee 2026-03-31 | 3 comentários | Compartilhar no WhatsApp

Apresentamos o VELA, um modelo de linguagem especializado no mercado acionário coreano (KOSPI+KOSDAQ).

Foi ajustado com fine-tuning por um pipeline de SFT + DPO com base no Qwen2.5-7B-Instruct.

Motivo da criação
Os LLMs financeiros existentes apresentavam muitas alucinações com a terminologia do mercado coreano,
ou tinham o problema de language leak, mudando para chinês/inglês no meio da resposta.
O VELA corrigiu esses dois problemas com foco por meio de DPO.

Dados de treinamento

  • SFT: 36.713 amostras / 2.135 ativos (classificação de notícias, sinais de alta/queda brusca, relatórios de corretoras, tool calling, análise setorial/macroeconômica etc.)
  • DPO: 24.779 pares (remoção de leak em chinês/inglês, alinhamento do formato de Reasoning Trace)

Formato de saída

  1. Reasoning Trace – processo de raciocínio passo a passo em formato JSON (search → analyze → confidence)
  2. Synthesis Report – relatório de research em 7 seções (resumo, indicadores, fluxo de capital, impacto das notícias, risco, opinião de investimento)

Desempenho (com base em RTX 3060 12GB)

Formato Velocidade Capacidade Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

Atenção: no uso real, é necessário fornecer ao modelo fontes de notícias e dados adequados. Sem fontes confiáveis, podem ocorrer alucinações. Foi projetado para ser usado junto com https://github.com/unohee/vela-framework.

Interfaces compatíveis
llama-cpp-python / Ollama / vLLM / Transformers / MLX

Licença: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

As cotações em tempo real são fornecidas por uma API externa, e o VELA foi projetado como a camada de inferência sobre ela.
O objetivo é fornecer informação, não aconselhamento de investimento.

3 comentários

 
310writer 2026-04-06

Fantástico ^^

 
ahiou 2026-04-01

Muito legal! Mesmo com 7B, ele é estável?

 
unohee 2026-04-01

Em comparação com o tamanho do modelo, as tarefas básicas são claramente melhores do que no modelo base. Acho que também preciso publicar os benchmarks!