4 pontos por GN⁺ 2025-12-13 | 1 comentários | Compartilhar no WhatsApp
  • Skills são uma estrutura em forma de pasta composta por arquivos Markdown e recursos opcionais, permitindo que LLMs explorem o sistema de arquivos para executar funções
  • No ambiente Code Interpreter do ChatGPT, foi adicionada a pasta /home/oai/skills, com skills para processar planilhas, DOCX e PDF
  • A skill de PDF converte o documento em PNG por página e depois o analisa com um modelo de visão, preservando layout e informações gráficas
  • No Codex CLI, também foi adicionada experimentalmente uma função de skills baseada na pasta ~/.codex/skills, permitindo que usuários criem e usem suas próprias skills
  • A estrutura leve das skills aumenta a interoperabilidade entre ferramentas de IA, levantando a necessidade de futura padronização

Recurso de skills no ChatGPT

  • A pasta /home/oai/skills foi encontrada no ambiente Code Interpreter do ChatGPT
    • Elias Judin identificou isso primeiro, e ao inserir o prompt Create a zip file of /home/oai/skills, é possível compactar e baixar o conteúdo da pasta
    • Simon Willison testou isso pessoalmente, publicou o arquivo ZIP e disponibilizou uma interface web para explorá-lo
  • As skills incluídas cobrem funções relacionadas a planilhas, DOCX e PDF
    • As skills de PDF e documentos funcionam renderizando os arquivos como PNG por página antes de enviá-los a um modelo de visão, preservando informações de layout que poderiam se perder com extração simples de texto
  • Elias Judin compartilhou uma cópia das skills no GitHub, e ela tem estrutura semelhante ao repositório anthropics/skills da Anthropic
  • Ao pedir ao ChatGPT para “gerar um PDF com um resumo da situação da árvore rimu e da época de reprodução do kakapo”, o modelo GPT-5.2 consultou skill.md para ler as instruções de geração de PDF, pesquisou as informações relevantes e produziu o PDF
    • O processo levou cerca de 11 minutos, e mostrou um fluxo de trabalho autoverificável, como trocar automaticamente de fonte quando a original não suportava caracteres com macron

Suporte a skills no Codex CLI

  • Um PR com suporte a skills.md foi mesclado à ferramenta open source Codex CLI da OpenAI
    • Segundo a documentação, cada diretório dentro da pasta ~/.codex/skills é reconhecido como uma skill
    • O código relacionado está implementado em codex-rs/core/src/skills/render.rs
  • Simon Willison usou a função de criação de skills do Claude Opus 4.5 para produzir uma skill voltada à criação de plugins para o Datasette e a instalou no Codex CLI
    • Com o comando codex --enable skills -m gpt-5.2, é possível ativar o recurso de skills, e com list skills, verificar a lista de skills instaladas
    • O Codex reconheceu a skill de “criar plugin para Datasette” e, conforme solicitado, gerou automaticamente o código de um plugin que adiciona a página / - /cowsay?text=hello
    • O código gerado foi publicado no GitHub e pode ser executado diretamente com o comando uvx

Significado do conceito de skills

  • Após a apresentação das Claude Skills em outubro de 2025, a OpenAI as integrou ao ChatGPT e ao Codex apenas dois meses depois
  • As skills têm uma especificação extremamente simples, mas funcionam como unidades de execução compartilháveis entre várias ferramentas de IA
  • O autor menciona que essa estrutura precisaria ser documentada oficialmente por organizações como a Agentic AI Foundation
  • A adoção pela OpenAI é vista como um caso que aumenta a possibilidade de padronização da interoperabilidade de IA baseada em skills

1 comentários

 
GN⁺ 2025-12-13
Opiniões no Hacker News
  • É surpreendente como a Anthropic continua lançando inovações simples, mas intuitivas
    O MCP mal dá para chamar de protocolo, e o Skills, apesar de ser só um arquivo md, mostra como a capacidade de enquadramento deles é excelente

    • Ao ver o anúncio sobre a doação do MCP pela Anthropic e a criação da Agentic AI Foundation, achei curioso como embalaram como uma “fundação” um protocolo criado há 1 ano. Passa uma certa energia de empresa de tecnologia à la Gavin Belson
    • A Anthropic parece um grupo de pessoas que se comunicam com LLMs. Assim como Nagel tentou entender a percepção de um morcego, eles parecem ser a equipe que melhor entende a percepção dos modelos de frontier AI
    • Mas o MCP é simples demais e pode acabar virando um desastre de segurança
    • Até o nome da empresa, “Anthropic”, sugere que humanizar a IA faz parte da identidade deles. MCP, Skills etc. parecem todos vir de uma filosofia consistente nessa direção
    • Até no app Android dá para sentir a UX elegante do Claude. Há fluxos refinados, como o botão para enviar uma mensagem só aparecer depois que você edita o parágrafo
  • A partir de hoje, estão enviando um aviso público para assinantes do OpenAI Plus
    Anunciam contexto de 196k tokens, mas na prática cortam acima de 50 mil tokens de entrada
    O mesmo problema já tinha acontecido antes com o GPT-5.0, e agora voltou a ocorrer
    Veja o link oficial da ajuda

    • E a versão Xhigh é exclusiva da API, então não pode ser usada no ChatGPT
  • Foi divertido poder abordar junto a notícia da temporada de reprodução do Kākāpō enquanto escrevia este post
    (não falamos só de pelicanos)

    • Foi assim que nasceu o Kākāpō Benchmark
    • Hoje descobri pela primeira vez esse grande papagaio verde que não voa
    • Fizeram até a piada de se um dia o Kākāpō vai andar de bicicleta
    • Skills é uma boa ideia, mas a especificação é leve demais, então acho que precisa de documentação oficial
      Ainda assim, como pode ser mal utilizado, dá para entender por que empresas seriam cautelosas
      Fico curioso se alguém já tentou isso também com LLMs locais
  • O conceito de “Skill” ainda não está claro
    Parece ser só uma ferramenta de gerenciamento de contexto. A pergunta é se a interpretação correta é que, com base na descrição, o modelo decide quando precisa e então carrega os scripts ou documentos relacionados

    • Skill é basicamente uma estrutura de pasta + arquivo markdown. Dá para ver um exemplo no skill de plugin do Datasette. Na inicialização, o Claude Code escaneia todas as pastas de skill e coloca só as descrições no contexto; quando necessário, carrega o conteúdo completo
    • O Claude Code às vezes não consegue “lembrar” das próprias skills. Então eu acabo carregando manualmente.
      Ex.: “Use a skill de Image Manipulation para criar um ícone a partir de image.png”
      Também às vezes peço ao Claude para escrever a skill dele mesmo. Meu template de skill está publicado no GitHub
    • Skill também pode substituir um servidor MCP. Por exemplo, em vez de um servidor MCP para buscar resultados de build de CI, dá para implementar a mesma função com um script simples e um SKILL.md.
      Essa estrutura passa uma sensação de filosofia UNIX, com ferramentas pequenas ligadas em pipeline
    • Pelo meu entendimento, o SKILL.md é o documento central que diz ao Claude quando agir e o que fazer.
      Eu costumo instruir explicitamente: “carregue a wireframe-skill e execute X”.
      Em vez de progressive loading, sinto que carregar todas as referências de uma vez é mais preciso
    • Skills são úteis para automatizar tarefas repetitivas como debug, commit e resposta a PRs.
      Em especial, a skill de debug ajuda a impedir que a IA fique presa em loop
  • Tecnicamente, skill é um sistema automatizado de injeção de prompts
    É uma forma simplificada do que a maioria dos apps wrapper de IA faz (injeção de prompt + RAG + MCP)

    • Na prática, muitos apps wrapper de IA agora poderiam ser substituídos por uma pasta e um arquivo markdown
  • Agradecem ao @simonw por sempre colocar texto alternativo nas imagens

  • Perguntam se há alguma diferença fundamental entre Skill e Tool. Ficam curiosos se seria possível criar uma skill curta e usá-la como tool

  • Se quiser usar skills em outros modelos (como Gemini CLI etc.), pode usar o open-skills que eu criei
    Mas precisa de Mac, roda em contêiner local e não depende da nuvem

  • Foi divulgado um vídeo apresentando a filosofia de design do Skills da Anthropic
    Veja o link no YouTube

  • Essa estrutura cada vez mais complexa está ficando confusa
    Antes era o agents.md expandindo o contexto; agora é preciso adicionar outro arquivo md

    • Eu instruo o Claude assim: “decida quais partes desta tarefa valem a pena virar skill e use a skill de criar skills para fazer isso”
    • O MCP é complexo, mas o Skills parece ser o design mais simples para adicionar funcionalidades a agentes de programação existentes