OpenManus-RL
收藏OpenManus-RL 数据集概述
数据集简介
OpenManus-RL 是一个开源项目,由 Ulab-UIUC 和 MetaGPT 共同领导。该项目是原始 OpenManus 创议的扩展版本,旨在探索新的强化学习(RL)调优方法,特别是建立在已有基础之上。
数据集特点
- 数据来源:结合了 AgentInstruct 和 Agent-FLAN 两个数据集的代理轨迹。
- 特性:包括 ReAct 框架、结构化训练、抗虚构样本、环境定位和跨六个领域的应用(操作系统、数据库、网络、知识图谱、家庭和电子商务)。
数据集概览
- AgentInstruct:1,866 个轨迹,平均回合数为 5.24,支持多任务问答。
- Agent-FLAN:3,000+ 个轨迹,回合数在 3-35 之间,具有错误恢复模式。
- 综合:4,866+ 个轨迹,回合数在 4-20 之间,具有增强的泛化能力。
支持任务
- 文本生成:ReAct 风格的指令遵循。
- 对话系统:工具增强的对话。
语言
- 英语
数据实例示例
json { "id": "os_0", "conversations": [ {"role": "user", "content": "Count files in /etc"}, {"role": "assistant", "content": "Think: Need reliable counting method Act: bash bash ls -1 /etc | wc -l "}, {"role": "user", "content": "OS Output: 220"}, {"role": "assistant", "content": "Think: Verified through execution Act: answer(220)"} ] }
相关工作
- 代理调优、工具使用、代理调优指令数据集、RL 调优、基准测试等方面的相关论文和项目。
致谢
感谢 ulab-uiuc 和 Openmanus 团队的支持和共享知识。
社区群组
加入我们的 Wecgat 社交群组,与其他开发者分享经验。
引用
请在找到 OpenManus 有帮助的情况下,引用以下论文:
bibtex @misc{OpenManus, author = {OpenManus-RL Team}, title = {OpenManus-RL: Open Platform for Generalist LLM Reasoning Agents with RL optimization}, year = {2025}, organization = {GitHub}, url = {https://github.com/OpenManus/OpenManus-RL}, }




