Жгут оценки LLM Orchestra.
npx -y skills add orchestra-research/ai-research-skills --skill evaluating-llms-harness --agent claude-code