SteerEval
收藏SteerEval 数据集概述
数据集基本信息
- 数据集名称: SteerEval
- 发布者/机构: zjunlp
- 许可证: CC BY-SA 4.0
- 论文地址: https://arxiv.org/abs/2603.02578
- 代码仓库: https://github.com/zjunlp/EasyEdit/blob/main/examples/SteerEval.md
数据集简介
SteerEval 是一个分层基准测试,旨在系统评估大语言模型(LLMs)跨行为领域和粒度级别的可控性。
核心设计
该基准测试沿两个互补的轴组织行为控制:
- 行为领域:控制目标分为四个行为领域。
- 语言特征
- 情感
- 个性
- 推理模式
- 规范级别:每个领域在层次上分为三个规范级别,每个级别包含 8 个不同的概念。
- 级别 1:计算级别(表达什么)
- 级别 2:算法级别(如何表达)
- 级别 3:实现级别(如何实例化)
数据规模与结构
- 每个概念提供 70 个训练样本、30 个测试样本和 5 个验证样本。
- 每个样本由一个问题、一个匹配答案和一个非匹配答案组成。
- 核心基准测试总共包含 10,080 个样本。
数据目录结构
SteerEval ├── language_features/ │ ├── concepts_all.json │ ├── train.json │ ├── valid.json │ └── test.json ├── sentiment/ │ ├── concepts_all.json │ ├── train.json │ ├── valid.json │ └── test.json ├── personality/ │ ├── concepts_all.json │ ├── train.json │ ├── valid.json │ └── test.json └── reasoning_patterns/ ├── concepts_all.json ├── train.json ├── valid.json └── test.json
数据格式
train.json / test.json / valid.json
每个文件包含一个样本的扁平列表。每个样本包含以下字段:
| 字段 | 类型 | 描述 |
|---|---|---|
domain |
字符串 | 概念所属的行为领域。取值为 language_features、sentiment、personality、reasoning_patterns 之一。 |
concept_id |
字符串 | 层次概念标识符,格式为 L{level}_{index}(例如 L1_3、L2_5)。级别范围从 1 到 3;索引在每个领域-级别对中从 1 到 8。 |
concept |
字符串 | 描述控制目标概念的简明名称。 |
concept_description |
字符串 | 概念的详细自然语言描述,解释其含义及其在语言使用中的表现方式。 |
question_id |
整数 | 该样本在其概念组内的从零开始的索引。 |
question |
字符串 | 旨在引发能够展现或对比目标概念的回答的问题或提示。 |
matching |
字符串 | 展现目标概念的模型回答。用作训练的正例。 |
not_matching |
字符串 | 未展现目标概念,而是反映对比行为的模型回答。用作负例。 |
concepts_all.json
域中所有控制目标概念的扁平列表。每个条目包含以下字段:
| 字段 | 类型 | 描述 |
|---|---|---|
concept_id |
字符串 | 层次概念标识符,格式同上(L{level}_{index})。 |
concept |
字符串 | 描述概念的简明名称。 |
level |
整数 | 规范级别:1 = 计算级别(表达什么),2 = 算法级别(如何表达),3 = 实现级别(如何实例化)。 |
加载方式
python from datasets import load_dataset dataset = load_dataset("zjunlp/SteerEval")
引用信息
如果使用此工作,请引用论文: bibtex @misc{xu2026controllablelargelanguagemodels, title={How Controllable Are Large Language Models? A Unified Evaluation across Behavioral Granularities}, author={Ziwen Xu and Kewei Xu and Haoming Xu and Haiwen Hong and Longtao Huang and Hui Xue and Ningyu Zhang and Yongliang Shen and Guozhou Zheng and Huajun Chen and Shumin Deng}, year={2026}, eprint={2603.02578}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2603.02578}, }



