Главная · Скиллы · advanced-evaluation

advanced-evaluationeval пайплайны для LLM

flora131/atomic

Паттерны построения eval пайплайнов для LLM выходных данных: тест-кейсы, метрики и инфраструктура.

LLMevalоценкапайплайнметрики

npx -y skills add flora131/atomic --skill advanced-evaluation --agent claude-code

234 ★182 установок

234 ★176 установок

234 ★172 установок

234 ★171 установок

234 ★170 установок

234 ★168 установок