Проектирование и реализация систематических оценок AI продуктов: метрики, тест-кейсы и анализ.
npx -y skills add refoundai/lenny-skills --skill ai-evals --agent claude-code