SETA RL dataset
收藏SETA Environments for RL Training 数据集概述
数据集描述
SETA RL数据集是CAMEL-AI Scaling Environments for Agents项目的一部分,通过全自动、可扩展的合成与验证流程生成,兼容Terminal-Bench任务格式。
数据集内容与结构
数据集中的每个文件夹代表一个独立的任务,每个任务包含以下文件:
task.yaml: 包含任务指令。Dockerfile: 定义Docker容器。run-tests.sh: 用于可验证的评估。
数据集获取与使用
-
克隆代码仓库: bash git clone https://github.com/camel-ai/seta
-
使用代码仓库中的
download脚本下载数据: bash python -u training/data_utils/download_data.py synth_data -
使用代码仓库中的工具将数据集格式转换为
parquet: bash python -u training/data_utils/convert_tasks_to_dataset.py --tasks_dir <path/to/dataset> --output_dir <path/to/dataset>
相关链接
- 项目代码仓库:https://github.com/camel-ai/seta
- RL数据集仓库:https://huggingface.co/datasets/camel-ai/seta-env
- CAMEL项目:https://github.com/camel-ai/camel
- RL模型:https://huggingface.co/camel-ai/seta-rl-qwen3-8b
- 技术报告:https://eigent-ai.notion.site/SETA-Scaling-Environments-for-Terminal-Agents-2d2511c70ba280a9b7c0fe3e7f1b6ab8
引用
@misc{seta, author = {Qijia Shen, Jay Rainton, Aznaur Aliev, Ahmed Awelkair, Boyuan Ma, Zhiqi (Julie) Huang, Yuzhen Mao, Wendong Fan, Philip Torr, Bernard Ghanem, Changran Hu, Urmish Thakker, Guohao Li}, month = Jan, title = {{SETA: Scaling Environments for Terminal Agents}}, year = {2026} }




