five

SETA RL dataset

收藏
github2026-01-10 更新2026-01-12 收录
下载链接:
https://github.com/camel-ai/seta-env
下载链接
链接失效反馈
官方服务:
资源简介:
SETA RL数据集是CAMEL-AI Scaling Environments for Agents项目的一部分,通过完全自动化和可扩展的合成和验证流程生成,与Terminal-Bench任务格式兼容。

The SETA RL Dataset is part of the CAMEL-AI Scaling Environments for Agents project. It is generated via a fully automated and scalable synthesis and validation pipeline, and is compatible with the task format of Terminal-Bench.
创建时间:
2025-12-29
原始信息汇总

SETA Environments for RL Training 数据集概述

数据集描述

SETA RL数据集是CAMEL-AI Scaling Environments for Agents项目的一部分,通过全自动、可扩展的合成与验证流程生成,兼容Terminal-Bench任务格式。

数据集内容与结构

数据集中的每个文件夹代表一个独立的任务,每个任务包含以下文件:

  • task.yaml: 包含任务指令。
  • Dockerfile: 定义Docker容器。
  • run-tests.sh: 用于可验证的评估。

数据集获取与使用

  1. 克隆代码仓库: bash git clone https://github.com/camel-ai/seta

  2. 使用代码仓库中的download脚本下载数据: bash python -u training/data_utils/download_data.py synth_data

  3. 使用代码仓库中的工具将数据集格式转换为parquet: bash python -u training/data_utils/convert_tasks_to_dataset.py --tasks_dir <path/to/dataset> --output_dir <path/to/dataset>

相关链接

  • 项目代码仓库:https://github.com/camel-ai/seta
  • RL数据集仓库:https://huggingface.co/datasets/camel-ai/seta-env
  • CAMEL项目:https://github.com/camel-ai/camel
  • RL模型:https://huggingface.co/camel-ai/seta-rl-qwen3-8b
  • 技术报告:https://eigent-ai.notion.site/SETA-Scaling-Environments-for-Terminal-Agents-2d2511c70ba280a9b7c0fe3e7f1b6ab8

引用

@misc{seta, author = {Qijia Shen, Jay Rainton, Aznaur Aliev, Ahmed Awelkair, Boyuan Ma, Zhiqi (Julie) Huang, Yuzhen Mao, Wendong Fan, Philip Torr, Bernard Ghanem, Changran Hu, Urmish Thakker, Guohao Li}, month = Jan, title = {{SETA: Scaling Environments for Terminal Agents}}, year = {2026} }

搜集汇总
数据集介绍
main_image_url
构建方式
在强化学习领域,数据集的构建方式直接影响智能体训练的效能与泛化能力。SETA RL数据集依托CAMEL-AI项目,采用全自动且可扩展的合成与验证流程生成。该流程通过系统化的任务定义,为每个独立任务配备任务描述文件、Docker容器定义以及可验证的评估脚本,确保数据生成过程的一致性与可复现性。这种构建方法不仅提升了数据生成的效率,还通过严格的验证机制保障了数据质量,为终端智能体的训练提供了坚实的数据基础。
特点
SETA RL数据集在设计上体现了高度的兼容性与结构化特性。该数据集严格遵循Terminal-Bench任务格式,每个任务单元均包含任务指令、容器化环境定义及自动化测试脚本,形成自包含的任务模块。这种设计使得数据集能够无缝集成到现有的强化学习训练框架中,同时支持多样化的终端操作场景。数据集的任务覆盖范围广泛,通过模块化的组织方式,为研究者提供了灵活的任务组合与评估可能性,从而促进智能体在复杂环境中的适应性学习。
使用方法
为有效利用SETA RL数据集进行智能体训练,用户需遵循一系列标准化的操作步骤。首先,通过克隆项目代码仓库获取必要的工具脚本;随后,使用内置的数据下载功能获取原始合成数据;最后,借助格式转换工具将任务数据转换为Parquet格式,以便于后续的数据处理与模型训练。这一流程确保了数据从获取到预处理的一致性,简化了研究者的工作负担,使得数据集能够快速部署于各类强化学习实验环境,加速终端智能体的开发与评估进程。
背景与挑战
背景概述
SETA RL数据集隶属于CAMEL-AI研究机构于2026年提出的‘终端智能体扩展环境’项目,旨在为强化学习训练提供高度自动化与可扩展的合成环境。该数据集由Qijia Shen、Jay Rainton等研究人员共同构建,核心研究聚焦于开发能够在终端环境中执行复杂任务的智能体,通过合成与验证管道生成多样化的任务实例,以推动具身智能与自主决策系统的发展。其设计兼容Terminal-Bench任务格式,为智能体在真实世界模拟场景中的泛化能力评估提供了标准化基准,对强化学习与人工智能交互领域的算法创新具有重要影响力。
当前挑战
该数据集致力于解决终端智能体在开放环境中执行多步骤、可验证任务的挑战,例如文件操作、系统命令执行等,其难点在于确保任务指令的多样性与环境交互的真实性。在构建过程中,研究人员需克服自动化合成管道的设计复杂性,包括如何高效生成大量具有逻辑一致性的任务实例,并建立可靠的验证机制以保障每个任务的可执行性与评估准确性。此外,保持数据集与现有强化学习框架的兼容性,以及处理终端环境中的状态空间高维性与动态不确定性,亦是构建过程中的关键挑战。
常用场景
经典使用场景
在强化学习领域,SETA RL数据集为终端智能体的训练提供了标准化环境。该数据集通过自动化合成与验证流程生成,覆盖多样化的终端任务,如命令行操作与系统管理。研究者利用其任务定义与评估框架,能够高效训练智能体在模拟终端环境中执行复杂指令,从而推动智能体在受限交互界面下的决策能力研究。
衍生相关工作
围绕SETA RL数据集,已衍生出多项经典研究工作。例如,CAMEL-AI项目利用该数据集训练了终端专用强化学习模型,并开源了SETA RL-Qwen3-8B等预训练智能体。这些工作进一步拓展了数据集在跨任务迁移学习、多模态终端交互以及安全约束下的策略优化等方向的应用深度。
数据集最近研究
最新研究方向
在强化学习领域,SETA RL数据集作为CAMEL-AI项目的重要组成部分,正推动终端智能体环境生成的前沿探索。该数据集通过全自动、可扩展的合成与验证流程构建,兼容Terminal-Bench任务格式,为智能体在复杂终端环境中的泛化能力研究提供了标准化基准。当前研究热点聚焦于利用此类合成环境训练大规模语言模型驱动的强化学习智能体,以解决现实世界任务中数据稀缺与评估困难的问题。其影响在于为自主智能体的可扩展训练与安全验证建立了新范式,对推进具身智能与自动化系统的发展具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作