seta-env
收藏SETA RL 数据集概述
数据集描述
SETA RL 数据集是 CAMEL-AI “Scaling Environments for Agents” 项目的一部分。该数据集通过完全自动化且可扩展的合成与验证流程生成,并与 Terminal-Bench 任务格式兼容。
数据集内容与结构
数据集中的每个文件夹代表一个独立的任务。每个任务文件夹包含以下三个核心文件:
task.yaml:包含任务指令。Dockerfile:定义任务运行的 Docker 容器。run-tests.sh:用于进行可验证的评估。
使用方法
-
克隆 Hugging Face 数据集仓库: bash git clone https://huggingface.co/datasets/camel-ai/seta-env
-
克隆代码仓库: bash git clone https://github.com/camel-ai/seta
-
将数据集中的
Dataset文件夹复制到seta代码目录下的dataset文件夹中。 -
使用代码仓库中的工具将数据集格式转换为
parquet: bash python -u training/data_utils/convert_tasks_to_dataset.py --tasks_dir <path/to/Dataset> --output_dir <path/to/dataset>
相关链接
- 项目代码:https://github.com/camel-ai/seta
- 数据集仓库:https://huggingface.co/datasets/camel-ai/seta-env
- CAMEL 项目:https://github.com/camel-ai/camel
- RL 模型:https://huggingface.co/camel-ai/seta-rl-qwen3-8b
- 技术报告:https://eigent-ai.notion.site/SETA-Scaling-Environments-for-Terminal-Agents-2d2511c70ba280a9b7c0fe3e7f1b6ab8
引用
@misc{seta, author = {Qijia Shen, Jay Rainton, Aznaur Aliev, Ahmed Awelkair, Boyuan Ma, Zhiqi (Julie) Huang, Yuzhen Mao, Wendong Fan, Philip Torr, Bernard Ghanem, Changran Hu, Urmish Thakker, Guohao Li}, month = Jan, title = {{SETA: Scaling Environments for Terminal Agents}}, year = {2026} }




