7 pontos por kangbit 2026-03-25 | 8 comentários | Compartilhar no WhatsApp

Olá! Criei o "Trump-Saith", um serviço que analisa em tempo real o impacto das falas do ex-presidente Trump na economia e no mercado da Coreia e entrega isso para você.

Website: https://trump-saith.com/ (https://trump-saith.com/)
Principais recursos: coleta em tempo real das falas de Trump -> resumo em coreano com LLM -> análise de impacto econômico -> entrega em feed após remoção de duplicatas


💡 Por que eu criei isso?

Recentemente, tem sido frequente ver uma única fala de Trump balançar a bolsa e o câmbio na Coreia. Mas é difícil acompanhar os textos originais publicados em canais como o Truth Social, e as notícias tradicionais acabam sendo mais lentas por passarem por etapas de edição.
Por isso, comecei o projeto com a ideia de "coletar diretamente as falas o mais rápido possível e mostrar apenas o essencial sob a perspectiva de desenvolvedores e investidores".

🛠️ Stack técnica e arquitetura

Como esta é uma comunidade de desenvolvedores, gostaria de compartilhar como isso foi implementado. Montei o pipeline em 4 camadas independentes.

  • Data Collection (Python, APScheduler)
    Monitora a API do Truth Social e canais RSS a cada 1 minuto para coletar dados brutos.
    Os dados coletados são armazenados de forma permanente no Oracle DB e enviados de forma assíncrona para a próxima camada via Redis Streams.

  • Analysis (Gemini 2.0 Flash)
    Analisa os textos coletados com o modelo Gemini 2.0 Flash.
    Em vez de uma simples tradução, extrai resumos e palavras-chave sob a perspectiva de "impacto na economia/mercado coreano". (resumo de 3 a 5 frases)

  • Deduplication (Sentence-Transformers, Qdrant)
    Processa falas com o mesmo conteúdo coletadas em vários canais.
    Gera embeddings de sentença com o modelo all-MiniLM-L6-v2 e filtra duplicatas no Qdrant (Vector DB) com base em similaridade de cosseno de 0.85.

  • API & Feed
    Por fim, entrega os dados refinados ao cliente.

✨ Diferenciais

Velocidade: antes de sair uma notícia, a análise começa assim que o texto original da fala de Trump é publicado.
Análise de contexto: por meio de prompts para LLM, deduzimos "o que essa fala significa para a indústria coreana de semicondutores ou automóveis?".
Feed limpo: minimizamos o ruído de notícias repetidas removendo duplicatas com base em similaridade.

🚀 Planos futuros

No momento, estou expandindo os canais de coleta e, no futuro, pretendo adicionar notificações push em tempo real para palavras-chave específicas (ex.: Samsung Electronics, tarifas etc.).
Espero que isso possa ser uma pequena ajuda para quem se interessa pela interseção entre TI e economia. Feedback é sempre bem-vindo!
Obrigado.

8 comentários

 
roxie 2026-04-01

Deu erro 403

 
[Este comentário foi ocultado.]
 
kangbit 2026-03-27

Obrigado! Já registrei o projeto!

 
brainer 2026-03-26

"ex"-presidente

 
kangbit 2026-03-26

Não consegui revisar com atenção..!

 
mhpark 2026-03-26

Parece que é um texto escrito por um modelo treinado com dados de 2021.01 a 2025.01 mesmo kkk

 
dankim0124 2026-03-25

Legal

Mas isso de ter uma ou duas frases por cartão, como num resumo, é a análise do impacto econômico?

Se não for, na minha tela não está aparecendo nenhuma informação chamada análise de impacto.

 
kangbit 2026-03-26

Não estamos exibindo isso separadamente.
Acho que precisamos discutir se dá para reforçar o conteúdo da análise de impacto no resumo.
Obrigado!