AIR Dataset

Name: AIR Dataset
Creator: 清华大学, 哈尔滨工业大学, 上海人工智能实验室, 伊利诺伊大学香槟分校, 阿里巴巴集团
Published: 2025-04-05 01:33:07
License: 暂无描述

arXiv2025-04-05 更新2025-04-08 收录

下载链接：

http://arxiv.org/abs/2504.03612v1

下载链接

链接失效反馈

官方服务：

资源简介：

AIR数据集是由清华大学、哈尔滨工业大学等机构的研究人员提出的，旨在为偏好学习提供高质量的数据集。该数据集包含三个核心组件：标注、指令和响应对。标注是通过LLM模型对响应进行评分，指令是从不同的公开数据集中选择，响应对则是从评分后的三元组中构建。该数据集的设计原则是通过简化标注、优先考虑低方差指令选择和优化响应对质量来提高数据集质量，解决LLM与人类偏好对齐的问题。

The AIR dataset was proposed by researchers from Tsinghua University, Harbin Institute of Technology and other institutions, aiming to provide high-quality datasets for preference learning. It comprises three core components: annotations, instruction-response pairs. Specifically, annotations are generated by scoring responses with LLM models; instructions are selected from various public datasets; and response pairs are constructed from the scored triplets. The design principles of this dataset are to improve dataset quality by simplifying annotations, prioritizing low-variance instruction selection and optimizing the quality of response pairs, so as to address the issue of aligning large language models with human preferences.

提供机构：

清华大学, 哈尔滨工业大学, 上海人工智能实验室, 伊利诺伊大学香槟分校, 阿里巴巴集团

创建时间：

2025-04-05

搜集汇总

数据集介绍

构建方式

AIR数据集通过系统性的组件分析框架构建，将偏好学习数据集解构为三个核心组成部分：标注（Annotations）、指令（Instructions）和响应对（Response Pairs）。首先，从多样化来源（如ShareGPT和UltraFeedback）采集指令，确保任务覆盖的广泛性。随后，利用17个开源大语言模型生成响应，涵盖不同架构家族以增强多样性。标注环节采用生成式奖励模型进行点对点评分，替代传统成对比较方法，通过贪婪解码确保评分一致性。最后，基于分数方差筛选指令，并优化响应对的分数差异与绝对质量，形成高质量偏好数据对。

特点

该数据集的核心特点体现在其组件化设计理念与实证优化策略上。首先，采用生成式点对点评分机制，简化标注流程的同时提升评分可靠性，实验表明其性能超越分类器式奖励模型1.4个基准点。其次，创新性地引入低方差指令筛选标准，通过响应分数方差量化指令的区分度，此类指令使模型在AlpacaEval 2基准上提升3.7分。响应对构建则融合三重优化：中等分数差（Δ=2-3）确保学习信号清晰度，高绝对分数（≥8）保障响应质量，以及混合策略（50%同策略+50%异策略）平衡多样性与对齐效果。这种结构化设计使14k数据量即可实现5.3分的平均性能提升。

使用方法

使用AIR数据集时需遵循组件协同优化原则。在标注阶段，建议采用生成式模型（如Llama-3.1-70B-Instruct）执行单响应基础评分（Single-Basic），避免复杂聚合方法。指令筛选应优先选择响应分数方差≤1.5的低方差指令，该策略在跨模型评估中稳定性最佳。响应对构建需同时满足：分数差为2-3分以明确偏好关系，优选分数≥8的高质量响应，并保持同策略（当前模型）与异策略（外部模型）响应1:1混合比例。训练时推荐使用原始DPO算法，超参数设置为学习率5e-7、beta值0.1、批次大小16，以充分保留数据集设计效应。评估应覆盖MT-Bench、ArenaHard等6大基准，全面检验指令遵循、推理等关键能力。

背景与挑战

背景概述

AIR数据集由清华大学、哈尔滨工业大学、上海人工智能实验室等机构的研究团队于2025年提出，旨在系统分析偏好数据集中的三大核心组件：标注（Annotations）、指令（Instructions）和响应对（Response Pairs）。该数据集聚焦于大语言模型（LLMs）与人类价值观对齐的关键问题，通过解构传统偏好数据集构建方法，揭示了组件间的协同效应。其创新性框架突破了现有研究将组件混为一谈的局限，为高效、可复现的模型对齐提供了数据层面的方法论指导，对强化学习人类反馈（RLHF）和直接偏好优化（DPO）等领域产生深远影响。

当前挑战

AIR数据集面临的挑战主要体现在两方面：领域问题层面，需解决偏好学习中标注噪声、指令多样性不足和响应质量参差导致的模型对齐效率低下问题；构建过程层面，需克服组件隔离分析的复杂性（如控制变量实验设计）、多模型响应生成的异构性（涉及17种开源LLMs），以及评分标准的一致性（需协调生成式与分类式评估模型的差异）。此外，平衡数据规模（14k高质量对）与模型泛化能力的关系，验证组件优化原则的普适性，均为关键挑战。

常用场景

经典使用场景

在大型语言模型（LLM）与人类价值观对齐的研究中，AIR数据集通过系统分析偏好数据集的三个核心组件——注释（Annotations）、指令（Instructions）和响应对（Response Pairs），为研究者提供了一个高效的实验平台。该数据集广泛应用于RLHF（基于人类反馈的强化学习）和DPO（直接偏好优化）等对齐方法中，帮助研究者理解各组件对模型性能的独立影响及其协同效应。

解决学术问题

AIR数据集解决了偏好数据集设计中组件混淆的问题，通过独立优化注释、指令和响应对，显著提升了模型对齐效果。其实验验证了生成式评分简化注释、低方差指令筛选和高质量响应对构建等原则，为偏好数据集设计提供了可解释的优化路径，突破了传统方法依赖规模扩展而忽视组件质量的瓶颈。

衍生相关工作

AIR框架启发了多项后续研究，如《UltraFeedback》扩展了自动化偏好标注方法，《Magpie-DPO》探索了基于聊天模板的响应生成策略。其组件分析思想还被迁移至多模态对齐领域，衍生出视觉-语言偏好数据集的设计范式。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集