Como dizia Trump: feed com análise em tempo real das falas de Trump e seus impactos na economia coreana
(trump-saith.com)Olá! Criei o "Trump-Saith", um serviço que analisa em tempo real o impacto das falas do ex-presidente Trump na economia e no mercado da Coreia e entrega isso para você.
Website: https://trump-saith.com/ (https://trump-saith.com/)
Principais recursos: coleta em tempo real das falas de Trump -> resumo em coreano com LLM -> análise de impacto econômico -> entrega em feed após remoção de duplicatas
💡 Por que eu criei isso?
Recentemente, tem sido frequente ver uma única fala de Trump balançar a bolsa e o câmbio na Coreia. Mas é difícil acompanhar os textos originais publicados em canais como o Truth Social, e as notícias tradicionais acabam sendo mais lentas por passarem por etapas de edição.
Por isso, comecei o projeto com a ideia de "coletar diretamente as falas o mais rápido possível e mostrar apenas o essencial sob a perspectiva de desenvolvedores e investidores".
🛠️ Stack técnica e arquitetura
Como esta é uma comunidade de desenvolvedores, gostaria de compartilhar como isso foi implementado. Montei o pipeline em 4 camadas independentes.
-
Data Collection (Python, APScheduler)
Monitora a API do Truth Social e canais RSS a cada 1 minuto para coletar dados brutos.
Os dados coletados são armazenados de forma permanente no Oracle DB e enviados de forma assíncrona para a próxima camada via Redis Streams. -
Analysis (Gemini 2.0 Flash)
Analisa os textos coletados com o modelo Gemini 2.0 Flash.
Em vez de uma simples tradução, extrai resumos e palavras-chave sob a perspectiva de "impacto na economia/mercado coreano". (resumo de 3 a 5 frases) -
Deduplication (Sentence-Transformers, Qdrant)
Processa falas com o mesmo conteúdo coletadas em vários canais.
Gera embeddings de sentença com o modelo all-MiniLM-L6-v2 e filtra duplicatas no Qdrant (Vector DB) com base em similaridade de cosseno de 0.85. -
API & Feed
Por fim, entrega os dados refinados ao cliente.
✨ Diferenciais
Velocidade: antes de sair uma notícia, a análise começa assim que o texto original da fala de Trump é publicado.
Análise de contexto: por meio de prompts para LLM, deduzimos "o que essa fala significa para a indústria coreana de semicondutores ou automóveis?".
Feed limpo: minimizamos o ruído de notícias repetidas removendo duplicatas com base em similaridade.
🚀 Planos futuros
No momento, estou expandindo os canais de coleta e, no futuro, pretendo adicionar notificações push em tempo real para palavras-chave específicas (ex.: Samsung Electronics, tarifas etc.).
Espero que isso possa ser uma pequena ajuda para quem se interessa pela interseção entre TI e economia. Feedback é sempre bem-vindo!
Obrigado.
8 comentários
Deu erro 403
Obrigado! Já registrei o projeto!
"ex"-presidente
Não consegui revisar com atenção..!
Parece que é um texto escrito por um modelo treinado com dados de 2021.01 a 2025.01 mesmo kkk
Legal
Mas isso de ter uma ou duas frases por cartão, como num resumo, é a análise do impacto econômico?
Se não for, na minha tela não está aparecendo nenhuma informação chamada análise de impacto.
Não estamos exibindo isso separadamente.
Acho que precisamos discutir se dá para reforçar o conteúdo da análise de impacto no resumo.
Obrigado!