Бенчмарк оценки моделей.
npx -y skills add rysweet/amplihack --skill model-evaluation-benchmark --agent claude-code