19 pontos por cjb9452 2026-03-28 | 8 comentários | Compartilhar no WhatsApp

Olá. Sou um estudante desenvolvedor que começou isso como um projeto pessoal para gerenciar meu portfólio, mas a coisa foi crescendo e acabei construindo um sistema com 31 agentes LLM.

No início, eu havia planejado isso como um serviço web B2C de recomendação de ações para atrair usuários. Mas esbarrei no problema dos enormes custos de comunicação via API e na dificuldade de validar a utilidade do produto. Então abandonei a aquisição de usuários (marketing), removi totalmente a UI/UX e fiz um pivô para um pipeline em que conecto diretamente minha conta real (10 milhões de won) para que a IA tome todas as decisões e execute todas as operações sozinha. É assim que ele está operando hoje.

Quero compartilhar com o pessoal do GeekNews a arquitetura que fui construindo e as experiências técnicas difíceis pelas quais passei.


🧠 Arquitetura do sistema: 6 etapas, validação cruzada com 31 agentes

Esse sistema (K-Agent Alpha) não funciona com um único prompt, mas como um pipeline relay multiagente que imita uma estratégia de investimento totalmente top-down. Ele é executado de forma sequencial ao longo de cerca de 1 hora.

  1. Análise de portfólio e psicologia (Fase 0~1):

    • Usa a API da KIS (Korea Investment & Securities) para carregar o saldo real e analisar a taxa de acerto das operações anteriores, ajudando no loop de feedback.
    • Define a postura de mercado com base em 5 indicadores, como volatilidade (VIX), câmbio e variação do KOSPI.
  2. Equipe macroeconômica (Fase 2 - 7 agentes):

    Publicidade
    • Agentes de juros, câmbio e derivativos analisam a liquidez global por meio de APIs como FRED e Banco da Coreia.
    • Para evitar raciocínio unidirecional, o sistema foi projetado para forçar a geração de 3 cenários: Base/Bull/Bear.
  3. Equipe de indústria/setor (Fase 3 - 10 agentes):

    • É o pipeline mais sofisticado do sistema. Ele faz a triagem de setores promissores com base em fluxo em tempo real de investidores estrangeiros/institucionais, PER por setor e notícias pesquisadas.
    • Para conter a alucinação típica de LLMs (recomendar ações inexistentes), foi incluído um agente Validator que filtra mecanicamente casos como empresas deslistadas ou abaixo do valor mínimo de mercado.
  4. Equipe de análise de empresas e risco (Fase 4 - 8 agentes):

    • Examina demonstrações financeiras da DART, gráficos (indicadores técnicos) e notícias para levantar candidatos. O gerente de risco verifica pressão de venda a descoberto e MDD.
  5. CIO com a decisão final (Fase 5 - 1 agente):

    • Os resultados dos 30 agentes (Gemini Flash) são consolidados pelo modelo principal mais inteligente, gemini-3.1-pro-preview.
    • Para evitar erros como a falácia do custo irrecuperável (Sunk Cost Fallacy), foi aplicado um prompt de 'Bounded Autonomy' que obriga a explicitar "o cenário Bear Case caso eu esteja errado" e "as condições de invalidação do investimento". O JSON gerado aqui é enviado para a minha API da Korea Investment & Securities.
    Publicidade

💡 Troubleshooting: vieses cognitivos de LLMs e explosão de tráfego

Ao operar o sistema, enfrentei e resolvi dois problemas bastante dolorosos.

  1. LLMs não conseguem cortar perdas (efeito disposição):
    • A IA reproduziu exatamente o viés cognitivo humano: querer vender rápido ações que estão no lucro, enquanto deixa ações no prejuízo paradas com a ideia de que "um dia vão subir". Para evitar isso, alterei a lógica para que, quando a decisão de hoje contradiga a de ontem, o sistema seja obrigado a explicar por que mudou de postura e a fazer um contraponto (Red-Teaming), avaliando por conta própria sua taxa de acerto passada.
  2. Limites de tráfego de API dos 31 agentes (Rate Limit & Context Limits):
    • Ao analisar em profundidade de 20 a 30 ações, continuavam ocorrendo estouros de token ou bloqueios por limite de APIs externas. No fim, reestruturei para uma arquitetura de processamento em lote, em que grandes volumes de dados, como fundamentos e indicadores de gráfico, são agregados de uma vez no backend com algo como get_fundamental_batch_all, estabilizando o tempo de execução em menos de 1 hora.

📊 Exemplo de log que a IA realmente produz

Quando esse processo termina, a IA gera um relatório estratégico (log) bastante profundo, como abaixo.

Publicidade

(Trecho extraído de um log real de diagnóstico macroeconômico escrito ontem pela IA)
"Enquanto a intensidade da recuperação do PPI (índice de preços ao produtor, 2,43%) ultrapassa o CPI (2,0%), o margin squeeze das empresas está se tornando realidade...
O mercado futuro está registrando um estado de backwardation profundo de -1112.61.
Com o petróleo ultrapassando 100 dólares e o câmbio passando de 1.520 won, fica mais visível a entrada em uma fase de 'Sudden Stop'.
Aumentar fortemente a proporção de caixa para cerca de 34%. Incluir equipamentos navais, que se destacam pelo forte apelo de subvalorização em toda a cadeia."


💻 Ver os resultados de execução e acompanhar os logs

Como o código-fonte completo ainda está misturado com minhas chaves de segurança e com a lógica da conta real, ainda não consegui publicar algo que dê para baixar com git clone e executar imediatamente como open source (mais adiante pretendo organizar os prompts principais e o pipeline e subir isso no GitHub).

Em vez disso, deixei integrado um canal dedicado no Telegram para que vocês possam avaliar como esse pipeline de 31 prompts realmente debate durante 1 hora por dia e que tipo de logs de decisão (resultados) ele produz.

  • Não tem landing page, coleta de e-mail nem qualquer objetivo de marketing.
  • Sem intervenção humana, relatórios de investimento em nível institucional gerados 100% por LLM e o histórico de operações em tempo real decorrente disso (integrado à conta real) são publicados em streaming todos os dias às 15h05.

👉 Canal de logs (relatórios) de decisões da IA em tempo real: t.me/K_Agent_Alpha

Se você tem interesse em sistemas multiagente ou em prompt engineering, eu realmente agradeceria muito se pudesse dar conselhos sinceros ou feedback técnico sobre a arquitetura e sobre como corrigir erros de julgamento da IA!

8 comentários

 
github88 2026-03-29

Nossa...

 
dydwls140 2026-03-30

Ai, ai...

 
woonsa 2026-03-30

Como os LLMs têm tempo de inferência, eles respondem devagar para trading em tempo real ou negociações de alta frequência, como HFT. No mínimo, isso só é viável com candles de 5 minutos. Além disso, mesmo conectando vários modelos de LLM, isso não faz com que a capacidade deles seja necessariamente melhor. Em vez disso, o ideal é usar cerca de 5 LLMs para cuidar de análises emocionais que a lógica tradicional ou modelos LSTM não conseguem captar, como se o mercado ou a comunidade estão em euforia, reconhecimento ou medo, e combinar isso em ensemble com métodos de negociação baseados na lógica de análise do próprio usuário, junto com deep learning como advanced PPO, CNN e LSTM (análise de dados históricos de gráficos). Para operações de curtíssimo prazo, modelos de deep learning como LSTM e CNN são mais adequados.

 
cjb9452 2026-03-30

Essa parte está sendo considerada o suficiente. Por isso, estamos tentando evitar operações de alta frequência por meio de apostas no preço de fechamento ao fim do pregão.

 
woonsa 2026-03-31

Para dar mais uma dica: o ideal é transformar modelos LLM pequenos em algo especializado para um domínio específico por meio de ajuste SFT (NTR), rodando eles localmente, e usar a API com apenas um modelo de linguagem grande. Se você especializar modelos de cerca de 7B ou 3B para análises específicas, os resultados tendem a ser ainda melhores. Ah! Na hora de fazer SFT (NTR), se você usar bastante o AI Hub, fica mais fácil montar o dataset. (Eu também já cheguei a fazer algo parecido ^^;)

 
woonsa 2026-03-30

Ah, e com certeza é preciso fazer backtesting por pelo menos um ou dois meses. Caso contrário, você pode acabar vendo o LLM fazer besteira e torrar seu patrimônio. (comprar na baixa e vender na alta)

 
galaxy11111 2026-03-30

Você criou uma massa de alucinações extremamente sofisticada... O mercado não pode ser previsto. Se, com o que você criou, seus ativos mais que dobrarem, admitirei que eu estava errado.

 
cjb9452 2026-03-30

Pode ser alucinação. Por isso, eu também vou acompanhar. Como apostei meu próprio dinheiro, vou ter que continuar atualizando. É uma espécie de experimento.