Жгут оценки LLM.
npx -y skills add davila7/claude-code-templates --skill evaluating-llms-harness --agent claude-code