ManyIH-Bench

Name: ManyIH-Bench
Creator: Center for Language and Speech Processing @ JHU
Published: 2026-04-09 00:09:57
License: 暂无描述

Hugging Face2026-04-09 更新2026-04-10 收录

下载链接：

https://huggingface.co/datasets/jhu-clsp/ManyIH-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

ManyIH-Bench 是一个用于评估语言模型在具有任意多权限级别的指令中解决指令冲突能力的基准数据集。每个样本包含多个带有权限标记的指令；当指令冲突时，模型应遵循最高权限的指令。数据集包含两个子集：1) 'coding'（427个样本）：基于MBPP的代码生成任务，带有冲突的风格指令（如命名约定、格式、类型提示）；2) 'instruction_following'（426个样本）：涵盖50个代理领域的指令遵循任务，增加了带有权限标记的冲突约束。每个样本包含可直接发送给模型的聊天消息（系统+用户），并详细标注了权限和冲突信息。数据集适用于文本生成任务，特别是需要处理多层次指令冲突的场景。

提供机构：

Center for Language and Speech Processing @ JHU

创建时间：

2026-04-09

搜集汇总

数据集介绍

构建方式

在自然语言处理领域，评估语言模型处理复杂指令冲突的能力日益重要。ManyIH-Bench数据集的构建基于两个核心子集：编码子集源自MBPP基准，通过注入带有特权标记的冲突风格指令（如命名约定、格式规范）来重构样本；指令遵循子集则覆盖50个代理领域，人工标注了多层次特权约束。每个样本均经过系统化设计，确保指令间存在明确的权限层级与冲突关系，从而为模型行为评估提供结构化基础。

特点

该数据集突出体现了指令层级与冲突解析的前沿特性。其样本包含任意多特权层级的指令标注，要求模型在冲突中遵循最高权限指令。编码子集专注于代码生成任务中的风格冲突，指令遵循子集则跨多领域模拟实际代理场景中的约束交互。数据集通过精细的结构化字段（如特权标记、冲突组元数据）提供了可解释的评估框架，支持对模型决策过程进行深入分析。

使用方法

研究人员可利用该数据集系统评估语言模型的指令遵循与冲突解决能力。通过HuggingFace库加载编码或指令遵循子集后，可直接提取输入字段中的对话消息馈送至模型。评估时需对比模型输出与数据集中提供的参考代码或约束胜出结果，结合单元测试或约束评估逻辑进行量化分析。详细评估代码与文档可参考项目GitHub仓库，以实现标准化测评流程。

背景与挑战

背景概述

在自然语言处理领域，指令遵循能力是评估大型语言模型智能水平的关键维度。随着模型应用场景的日益复杂，单一指令的简单执行已不足以满足实际需求，模型常需处理多条可能相互冲突的指令，并依据预设的优先级进行决策。为此，约翰斯·霍普金斯大学语言与语音处理中心的研究团队于近期推出了ManyIH-Bench基准数据集。该数据集旨在系统评估语言模型在面临具有任意多特权层级的指令冲突时的解析与遵从能力，其核心研究问题聚焦于模型对指令层次结构的理解与优先级判断，为推进可靠、可控的AI助手发展提供了重要的评估工具。

当前挑战

该数据集致力于解决指令层次遵循这一新兴领域的核心挑战，即如何让语言模型在复杂的、存在内在冲突的多指令环境中，准确识别并服从最高优先级的指令。这要求模型不仅理解自然语言语义，还需具备隐式的逻辑推理与优先级比较能力。在数据集构建过程中，挑战同样显著。首先，需要为编码和指令遵循两大子集精心设计大量具有真实冲突场景的样本，并人工标注每条指令的特权等级与冲突关系，确保评估的严谨性与覆盖面。其次，如何将基于MBPP的编码任务与涵盖50个代理领域的指令任务，系统性地转化为包含特权标记的对话格式，同时保持任务的原有意图与可评估性，是一项复杂的工程与设计挑战。

常用场景

经典使用场景

在自然语言处理领域，指令遵循能力是评估语言模型交互性能的核心指标之一。ManyIH-Bench通过构建包含多级权限标记的冲突指令场景，为模型在复杂决策环境下的行为评估提供了标准化测试平台。该数据集特别适用于衡量模型如何解析并优先执行高权限指令，例如在代码生成任务中，当命名规范与格式要求冲突时，模型需依据权限层级做出准确选择。这一设计使得研究者能够系统性地检验模型对指令层次结构的理解能力，推动指令遵循研究向更精细化的方向发展。

衍生相关工作

基于ManyIH-Bench的层次化指令冲突框架，学术界已衍生出一系列探索模型权限感知能力的研究。例如，有工作通过微调或提示工程增强模型对权限标记的敏感性，另一些研究则利用该数据集构建了指令冲突检测与消解的新型评估指标。这些工作不仅深化了对语言模型决策边界理解，还促进了如安全对齐、多约束优化等技术方向的发展，为构建更稳健、可解释的指令遵循系统提供了方法论支持。

数据集最近研究