26 pontos por skg09203 2026-02-18 | 4 comentários | Compartilhar no WhatsApp

É um servidor MCP que processa as legendas do YouTube no servidor (resumo/entidades/tópicos/análise de sentimento) para
entregar ao cliente LLM apenas os resultados comprimidos.

Motivo para criar:
Pesquisei cerca de 80 servidores MCP existentes para YouTube, e todos enviam as legendas originais
diretamente para o LLM. Em um único vídeo de 20 minutos, isso consome cerca de ~15.000 tokens,
mas aqui isso é reduzido para ~200-500 tokens no resumo e ~3.000 tokens no relatório completo.
Também deixei disponível o uso via CLI pensando em utilizá-lo com Claude skills.

Principais recursos:

  • Relatório estruturado (resumo + tópicos + entidades + comentários de uma vez)
  • 9 ferramentas MCP + CLI (mcp-yt)
  • Resumo gratuito com LLM via integração com Ollama/vLLM
  • Monitoramento de RSS de canais
  • Dicionário com mais de 200 entidades em coreano/inglês
  • Cache SQLite

pip install mcp-youtube-intelligence
Compatível para conexão imediata no Claude Desktop, Cursor e Claude Code.

GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/

4 comentários

 
bohblue23 2026-02-19

Parece claro que deve ter havido algum trade-off ao reduzir a quantidade de tokens, mas não consegui encontrar nada sobre essa parte no README!

Hoje em dia o contexto padrão é de 200k, então fico curioso sobre a degradação de qualidade causada pela perda na compressão

 
skg09203 2026-02-19

Olá!

O resumo extrativo (sem LLM) fica, na prática, em algo como 6/10 em relação ao original. Ele até extrai as frases-chave, mas a conexão de contexto é fraca.
O resumo com LLM (como Ollama) é bem melhor e, de fato, ao testar com alguns vídeos de apresentação e vídeos relacionados a desenvolvimento, pareceu suficiente para entender o conteúdo. Ainda assim, às vezes detalhes numéricos ou nuances sutis se perdem.

Com um contexto de 200k, para um vídeo único e mais curto, como algo entre 30 minutos e 1 hora, o original é melhor,
mas ao processar centenas de vídeos em lote ou fazer análises repetidas, acredito que dá para consumir menos tokens e extrair só os pontos principais.
(Por exemplo: análise do canal inteiro de um concorrente, análise de 100 vídeos de youtubers de economia etc.)

Vou testar com uma variedade maior de vídeos no README e adicionar de forma mais clara os resultados de benchmark e os trade-offs!

 
bohblue23 2026-02-19

Muito obrigado pela resposta tão atenciosa!! Espero que o projeto dê frutos!!

 
skg09203 2026-02-19

Haha, sim, obrigado!