Claude Инструменты

Скиллы MCP-серверы Плагины Дайджест

Русскоязычный каталог инструментов для Claude Code: скиллы, MCP-серверы, плагины и еженедельный дайджест — с переводом описаний на русский. · О проекте

Главная · Тег

eval

7 инструментов с этим тегом

agentic-evalOfficial — петли самокритики AI выходных данных

github/awesome-copilot

Реализует self-critique loops: Claude генерирует вывод, оценивает по критериям, итерирует.

34.3k ★9.4k установок

adk-eval-guide — методология оценки ADK агентов

google/adk-docs

Методология оценки Google ADK агентов: метрики, тест-кейсы и паттерны улучшения качества ответов.

1.4k ★2.6k установок

arize-prompt-optimizationOfficial — оптимизация промптов production Arize

github/awesome-copilot

Тянет промпты из production трейсов, коррелирует с eval scores для оптимизации.

34.3k ★890 установок

behavioral-evals — поведенческие оценки LLM Gemini eval

google-gemini/gemini-cli

Поведенческие оценки LLM через Gemini CLI eval фреймворк.

104.9k ★181 установок

advanced-evaluation — eval пайплайны для LLM

flora131/atomic

Паттерны построения eval пайплайнов для LLM выходных данных: тест-кейсы, метрики и инфраструктура.

234 ★163 установок

Ai Eval — оценка AI

io.github.lazymac2x/ai-eval

MCP-сервер оценки AI.

Mcp Eval Runner — запуск оценок

dbsectrainer/mcp-eval-runner

MCP-сервер запуска оценок (eval).

eval — инструменты Claude Code · Claude Инструменты