Claude Инструменты
Скиллы
MCP-серверы
Плагины
Дайджест
☰
rl — инструменты Claude Code · Claude Инструменты
Главная
· Тег
rl
11 инструментов с этим тегом
A
openclaw-rl-training
— RL-обучение OpenClaw Aradotso
aradotso/trending-skills
RL-обучение OpenClaw.
25
★
1.2k
установок
K
stable-baselines3
— Stable-Baselines3 K-Dense научный
k-dense-ai/scientific-agent-skills
Stable-Baselines3 для RL.
26.9k
★
478
установок
D
stable-baselines3
— Stable-Baselines3 Claude шаблоны
davila7/claude-code-templates
Stable-Baselines3 Claude.
27.7k
★
334
установок
D
grpo-rl-training
— GRPO RL обучение Claude шаблоны
davila7/claude-code-templates
GRPO RL обучение.
27.7k
★
313
установок
O
verl-rl-training
— обучение RL VeRL Orchestra Research
orchestra-research/ai-research-skills
Обучение RL через VeRL.
9.2k
★
254
установок
O
grpo-rl-training
— GRPO RL обучение Orchestra Research
orchestra-research/ai-research-skills
GRPO Orchestra.
9.2k
★
250
установок
O
torchforge-rl-training
— обучение RL TorchForge Orchestra Research
orchestra-research/ai-research-skills
Обучение RL через TorchForge.
9.2k
★
249
установок
O
miles-rl-training
— обучение MILES RL Orchestra Research
orchestra-research/ai-research-skills
Обучение MILES RL.
9.2k
★
249
установок
O
slime-rl-training
— обучение SLIME RL Orchestra Research
orchestra-research/ai-research-skills
Обучение SLIME с подкреплением.
9.2k
★
248
установок
A
rl-reward
— награда RL AgentScope OpenJudge
agentscope-ai/openjudge
Функция награды для обучения с подкреплением.
657
★
S
AgentDB Learning Plugins
— RL плагины для AgentDB агентов
spencermarx/open-code-review
Полный набор reinforcement learning плагинов для AgentDB: 9 алгоритмов от Q-learning до policy gradient для обучающихся агентов.
240
★