Framework для тестирования когда агент отлично работает в демо но падает в продакшне — найди слабые места.
npx -y skills add sickn33/antigravity-awesome-skills --skill agent-evaluation --agent claude-code