five

SETA-Env

收藏
Hugging Face2026-05-25 更新2026-05-26 收录
下载链接:
https://huggingface.co/datasets/camel-ai/SETA-Env
下载链接
链接失效反馈
官方服务:
资源简介:
SETA-Env 是一个开源、可验证的强化学习终端环境数据集,旨在服务于社区的模型训练与评估。该数据集包含两个顶层子集:SETA_Synth(合成任务)和 SETA_Evolve(终端智能体任务的演化变体),总计提供 4567 个独立的环境实例。每个任务以自包含的 Harbor 风格任务目录形式打包,内含运行任务、构建环境、执行参考解决方案以及运行测试所需的所有文件,典型结构包括 task.toml、instruction.md、environment/、solution/ 和 tests/。数据来源于多个公开社区和技术平台:ask_ubuntu、kaggle_notebook、nl2bash、stack_overflow 和 unix_linux_se。SETA_Synth 子集直接基于这些来源构建,而 SETA_Evolve 子集则对源自这些社区的任务进行了演化处理,生成具有不同上下文或难度的变体以增加多样性和挑战性。该数据集适用于训练和评估在终端(如 Bash)环境中执行代码或完成任务的智能体,是强化学习、代码生成、指令跟随和自动化任务等研究领域的基准资源,采用混合许可证,具体取决于数据来源。

SETA-Env is an open-source, verifiable reinforcement learning terminal environment dataset designed to serve the community for model training and evaluation. The dataset includes two top-level subsets: SETA_Synth (synthetic tasks) and SETA_Evolve (evolved variants of terminal agent tasks), providing a total of 4567 independent environment instances. Each task is packaged as a self-contained Harbor-style task directory, containing all files necessary to run the task, build the environment, execute reference solutions, and run tests, with a typical structure including task.toml, instruction.md, environment/, solution/, and tests/. The data is sourced from multiple public communities and technical platforms: ask_ubuntu, kaggle_notebook, nl2bash, stack_overflow, and unix_linux_se. The SETA_Synth subset is built directly from these sources, while the SETA_Evolve subset involves evolutionary processing of tasks from these communities to generate variants with different contexts (suffix __b1) or difficulties (suffix __d1), enhancing task diversity and challenge. The dataset is suitable for training and evaluating agents that execute code or complete tasks in terminal environments (e.g., Bash), serving as a benchmark resource for research areas such as reinforcement learning, code generation, instruction following, and automated tasks, and it uses mixed licenses depending on the data sources.
提供机构:
CAMEL-AI.org
创建时间:
2026-05-25
搜集汇总
数据集介绍
main_image_url
构建方式
SETA-Env 数据集通过两种互补的策略进行构建。其一为合成任务(SETA_Synth),通过从 Ask Ubuntu、Kaggle Notebook、NL2Bash、Stack Overflow 及 Unix Linux Stack Exchange 等多个高质量在线社区与专业平台中提取终端代理任务,经过系统化整理与标准化封装形成;其二为进化变体(SETA_Evolve),在合成任务的基础上引入上下文变更与难度调整两种演化机制,生成差异化的任务变体,从而增强数据集的多样性与挑战性。每个任务均以 Harbor 风格的任务目录形式呈现,包含运行环境所需的所有文件,如任务描述、Docker 环境配置、参考解决方案及测试脚本,确保任务的完整性与可复现性。
特点
该数据集共包含 4567 个终端环境任务,其中 SETA_Synth 拥有 3255 个,SETA_Evolve 拥有 1312 个,规模适中且覆盖多个领域。数据集的显著特点在于其可验证性:每个任务均附带可执行的解决方案与自动化测试脚本,支持对代理行为进行客观评估。此外,进化变体通过后缀标识(如 __b1 表示上下文变更,__d1 表示难度调整)清晰区分不同演化类型,为研究任务复杂度与泛化能力提供了结构化资源。数据来源涵盖技术问答社区、编程竞赛与系统管理场景,既包含常见问题也涵盖专业运维任务,具有广泛的代表性。
使用方法
推荐使用 Hugging Face 的 snapshot_download 工具将数据集下载至本地,通过设置 repo_id 为 "camel-ai/seta-env-release" 即可获取完整数据。用户亦可利用 allow_patterns 参数按子集选择性下载,例如仅下载 SETA_Synth 部分。下载后的每个任务目录可直接用于强化学习或终端代理的训练与评估,通过解析 task.toml 与 instruction.md 获取任务描述,借助 Dockerfile 构建隔离环境,并利用 solution 与 tests 目录中的脚本验证代理行为。数据采用 CC BY-SA 4.0 及部分上游许可协议发布,使用时需遵守相应条款。
背景与挑战
背景概述
强化学习(Reinforcement Learning, RL)在终端环境(Terminal Environment)中的应用日益成为人工智能研究的前沿领域,旨在培养智能体通过自然语言指令与操作系统进行交互的能力。在此背景下,由CAMEL-AI团队于2024年发布的SETA-Env数据集应运而生,该数据集包含了4567个可验证的RL终端环境,涵盖SETA_Synth和SETA_Evolve两个子集。核心研究问题聚焦于如何构建高质量、多样化且可复现的终端任务基准,以推动智能体在真实世界命令行场景中的泛化与鲁棒性。通过整合Ask Ubuntu、Kaggle Notebook、NL2Bash、Stack Overflow及Unix Linux SE等多源数据,该数据集为社区提供了标准化的训练与评测平台,对终端智能体领域的研究产生了显著的推动作用。
当前挑战
SETA-Env所应对的领域挑战在于终端环境复杂多变,自然语言指令与命令行操作的映射模糊,智能体常因环境多样性而难以泛化。该数据集构建过程中面临多重难题:一是从异构数据源(如Stack Exchange问答、Kaggle笔记本)提取可执行任务时,需确保指令的准确性与环境的隔离性;二是设计可验证的测试框架(包括Docker容器、参考解决方案与自动化测试脚本)以规避环境歧义;三是在SETA_Evolve子集中通过上下文变化(__b1)与难度调整(__d1)生成演化变体,以模拟真实场景中的任务漂移,这对数据扩充的平衡性与代表性提出了严峻挑战。
常用场景
经典使用场景
在强化学习与终端智能体研究的交汇点,SETA-Env作为一套开放、可验证的RL终端环境数据集,为社区提供了训练与评估的标准化平台。其经典使用场景集中于基于Bash命令的自主任务求解与演化式环境生成,研究者可借助SETA-Env构建具备指令理解、环境交互与方案验证能力的智能体,尤其适用于源自Ask Ubuntu、Stack Overflow、Unix Linux Stack Exchange等平台的真实终端问题,以及从NL2Bash与Kaggle Notebook中衍生的合成任务变体。
实际应用
实际应用中,SETA-Env可被部署于自动化运维、开发者工具链与智能客服系统等领域。例如,在DevOps场景中,基于该数据集训练的智能体能够理解自然语言描述的运维指令并自动执行shell脚本操作,实现对服务器配置、日志分析或软件包管理的智能化处理。此外,SETA-Env的模块化Harbor式结构使其易于集成至持续集成流水线,用于自动评估AI助手的终端命令生成质量,或作为教育平台中实战型编程练习的题目库。
衍生相关工作
SETA-Env的发布催生了一系列衍生研究方向,包括针对终端环境的语境感知提示学习、基于进化演算的难度自适应任务生成,以及跨来源任务的异构联邦训练框架。典型工作如利用SETA_Evolve子集中的上下文变化标记(如__b1、__d1)设计渐进式课程学习策略,显著提升智能体在陌生终端环境中的适应速度;此外,也有研究以此为基准,提出可解释性奖励塑形方法,在保证方案可验证性的前提下,优化强化学习策略的收敛效率与动作安全性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作