Claude Инструменты
Скиллы
MCP-серверы
Плагины
Дайджест
☰
Главная
· Тег
eval
7 инструментов с этим тегом
G
agentic-eval
Official
— петли самокритики AI выходных данных
github/awesome-copilot
Реализует self-critique loops: Claude генерирует вывод, оценивает по критериям, итерирует.
34.3k
★
9.4k
установок
G
adk-eval-guide
— методология оценки ADK агентов
google/adk-docs
Методология оценки Google ADK агентов: метрики, тест-кейсы и паттерны улучшения качества ответов.
1.4k
★
2.6k
установок
G
arize-prompt-optimization
Official
— оптимизация промптов production Arize
github/awesome-copilot
Тянет промпты из production трейсов, коррелирует с eval scores для оптимизации.
34.3k
★
890
установок
G
behavioral-evals
— поведенческие оценки LLM Gemini eval
google-gemini/gemini-cli
Поведенческие оценки LLM через Gemini CLI eval фреймворк.
104.9k
★
181
установок
F
advanced-evaluation
— eval пайплайны для LLM
flora131/atomic
Паттерны построения eval пайплайнов для LLM выходных данных: тест-кейсы, метрики и инфраструктура.
234
★
163
установок
I
Ai Eval
— оценка AI
io.github.lazymac2x/ai-eval
MCP-сервер оценки AI.
D
Mcp Eval Runner
— запуск оценок
dbsectrainer/mcp-eval-runner
MCP-сервер запуска оценок (eval).
eval — инструменты Claude Code · Claude Инструменты