7 pontos por davespark 2025-12-02 | Ainda não há comentários. | Compartilhar no WhatsApp

Uma análise de engenharia reversa da estrutura interna do Claude Skills (a função de agente de IA da Anthropic). O Claude Skills adota uma abordagem prática de automação de tarefas complexas mantendo o controle do usuário, alterando o comportamento do Claude AI por meio de injeção de prompt, e não por execução de código.

Pontos principais:

1. Conceito central: Skills são templates de prompt
  • As Skills não utilizam código executável como Python/JS e, em vez disso, injetam instruções específicas do domínio (por exemplo, guia de processamento de PDF) no contexto da conversa.
  • Ao contrário de ferramentas comuns (Read, Write, Bash etc), não é executada imediatamente e ajuda o Claude a ficar “preparado”. Exemplo: ao chamar a skill de PDF, um prompt detalhado de 500 a 5.000 palavras é enviado como mensagem oculta.
2. Arquitetura de meta-ferramenta
  • A meta-ferramenta 'Skill' gerencia todas as skills individuais (PDF, skill-creator etc.), combinando a intenção do usuário apenas com inferência de LLM (sem embedding/classificador).
  • Na execução, duas mensagens são injetadas: um estado XML conciso visível na UI ("Carregando skill PDF") e o guia completo oculto.
3. Estrutura e recursos do SKILL.md
  • Front matter (YAML): name, description (sinais de escolha do Claude), allowed-tools (ferramentas com aprovação automática, consideração de segurança), especificação do model.
  • Conteúdo Markdown: fluxo de trabalho, ordem de uso de ferramentas e instruções de formato de saída (até 5.000 palavras).
  • Diretórios de suporte: scripts (scripts de automação), references (documentos de referência), assets (templates/imagens, economia de tokens).
4. Modificação de contexto de execução e padrões
  • Ao chamar uma Skill, é possível alterar automaticamente permissões de ferramentas (aprovação temporária) e alternar modelos (implementação da função contextModifier).
  • Padrões práticos:
    • Automação por scripts: execução de scripts em múltiplas etapas.
    • Ler-processar-escrever: transformação/limpeza de dados.
    • Buscar-analisar-relatar: análise da base de código (utilizando Grep).
    • Fluxo wizard: confirmação do usuário etapa a etapa.
5. Limitações e impacto
  • Desvantagens: ausência de concorrência, overhead de tokens (1.500+), dependência de prompts.
  • Vantagens: ênfase em flexibilidade e segurança. Apresenta o modelo de colaboração “decisões importantes são humanas, a repetição é da IA”. Como direção futura para agentes de IA, a implementação baseada em prompts é central.

(Fonte original: leehanchung.github.io, publicado em 2025.10.26)

Ainda não há comentários.

Ainda não há comentários.