最近更新
2026-06-09
GitHub Stars
2,011
关于 Verl Agent
功能特性
多轮智能体-环境交互
完全可定制的记忆模块和逐步输入结构
可扩展的长周期优化
并行化 Gym 风格环境和分组环境
支持多种模型
LoRA 微调支持
详细评分
易用性 7.2
性价比 7.7
功能 7.5
技术支持 6.9
性能 7.6
综合评分
7.5 /10
适合谁使用?
#智能体框架#DeepSeek-R1#GIGPO#GRPO#大语言模型#新闻