LLM agente de 7B parâmetros especializado para análise de notícias e research de investimento do mercado acionário coreano
(huggingface.co)Apresentamos o VELA, um modelo de linguagem especializado no mercado acionário coreano (KOSPI+KOSDAQ).
Foi ajustado com fine-tuning por um pipeline de SFT + DPO com base no Qwen2.5-7B-Instruct.
Motivo da criação
Os LLMs financeiros existentes apresentavam muitas alucinações com a terminologia do mercado coreano,
ou tinham o problema de language leak, mudando para chinês/inglês no meio da resposta.
O VELA corrigiu esses dois problemas com foco por meio de DPO.
Dados de treinamento
- SFT: 36.713 amostras / 2.135 ativos (classificação de notícias, sinais de alta/queda brusca, relatórios de corretoras, tool calling, análise setorial/macroeconômica etc.)
- DPO: 24.779 pares (remoção de leak em chinês/inglês, alinhamento do formato de Reasoning Trace)
Formato de saída
- Reasoning Trace – processo de raciocínio passo a passo em formato JSON (search → analyze → confidence)
- Synthesis Report – relatório de research em 7 seções (resumo, indicadores, fluxo de capital, impacto das notícias, risco, opinião de investimento)
Desempenho (com base em RTX 3060 12GB)
| Formato | Velocidade | Capacidade | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
Atenção: no uso real, é necessário fornecer ao modelo fontes de notícias e dados adequados. Sem fontes confiáveis, podem ocorrer alucinações. Foi projetado para ser usado junto com https://github.com/unohee/vela-framework.
Interfaces compatíveis
llama-cpp-python / Ollama / vLLM / Transformers / MLX
Licença: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
As cotações em tempo real são fornecidas por uma API externa, e o VELA foi projetado como a camada de inferência sobre ela.
O objetivo é fornecer informação, não aconselhamento de investimento.
3 comentários
Fantástico ^^
Muito legal! Mesmo com 7B, ele é estável?
Em comparação com o tamanho do modelo, as tarefas básicas são claramente melhores do que no modelo base. Acho que também preciso publicar os benchmarks!