Паттерны использования LLM для оценки других LLM: LLM-as-judge системы, критерии и согласованность.
npx -y skills add shipshitdev/library --skill advanced-evaluation --agent claude-code