Validando com um rubric evaluator se as skills do Claude Code e do Codex estão funcionando bem
(github.com/halfmoon-mind)Recentemente, foi publicado no blog técnico da Toss um método para testar se as skills que criei para o Claude Code e o Codex estão funcionando de forma adequada, se estão funcionando como eu quero e se não foram criadas de forma desnecessária.
Fiquei curioso para saber se as skills que eu criei realmente eram adequadas, então desenvolvi um projeto com base nesse artigo.
Ao revisar as skills que eu já tinha criado, ele até me indicou direções de melhoria, então estou achando a ferramenta bem útil. Se puderem experimentar e gostarem, ficarei grato por uma estrela no GitHub; se encontrarem pontos fracos, agradeço muito o feedback por meio de issue no GitHub ou comentário!!
Ainda não há comentários.