MM-RLHF Dataset

github2025-02-18 更新2025-02-17 收录

下载链接：

https://github.com/yfzhang114/MM-RLHF

下载链接

链接失效反馈

官方服务：

资源简介：

一个包含20k指令，涵盖图像理解、视频理解和安全相关任务的高质量多模态大语言模型对齐数据集。每个指令包含3-5个模型生成的响应，以及人类注释的评分、排名和细粒度的文本反馈。还有80k比较对，适用于RLHF训练。

A high-quality multimodal large language model alignment dataset consisting of 20k instructions covering image understanding, video understanding and security-related tasks. Each instruction contains 3-5 model-generated responses, along with human-annotated scores, rankings and fine-grained textual feedback. Additionally, it includes 80k comparison pairs suitable for RLHF training.

创建时间：

2025-02-16

原始信息汇总

MM-RLHF 数据集概述

数据集简介

MM-RLHF 是一个用于对多模态大型语言模型（MLLMs）进行人类偏好对齐的全面项目。该项目包括一个高质量的多模态对齐数据集、一个基于评论的 MLLM 奖励模型及其训练算法、一种新颖的对齐算法 MM-DPO 以及两个新的基准。

数据集详情

数据集名称：MM-RLHF
数据集大小：包含 20k 指令，每个指令包括 3-5 个模型生成的响应，以及人类注释的评分、排名和细粒度的文本反馈。另外还有 80k 比较对，适用于 RLHF 训练。
数据类型：指令包括图像理解、视频理解和安全相关任务。
文件格式：数据以 JSONL 格式存储，文件名为 data.jsonl。

关键组件

MM-RLHF 数据集：包含所有标记信息的数据文件和用于 DPO 及奖励模型训练的排名对。
基于评论的 MLLM 奖励模型：MM-RLHF-Reward-7B 模型，能够在分配分数之前生成候选文本的评论，提供增强的可解释性和更丰富的反馈。
MM-DPO 算法：一种新型对齐算法，通过简单调整 DPO 框架即可实现性能显著提升。
MM-RLHF 基准：包括评估奖励模型质量的 MM-RLHF-RewardBench 和关注 MLLM 安全性的 MM-RLHF-SafetyBench。

使用说明

安装：提供从克隆仓库到安装依赖的详细步骤。
数据准备：指导如何下载和解压数据集，以符合所需的目录结构。
训练和评估：提供训练基于评论的奖励模型和 MM-DPO 算法的脚本，以及评估模型的代码。

引用

请在研究和应用中引用相关论文： bibtex @article{zhang2024mme, title={MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?}, author={Zhang, Yi-Fan and Zhang, Huanyu and Tian, Haochen and Fu, Chaoyou and Zhang, Shuangqing and Wu, Junfei and Li, Feng and Wang, Kun and Wen, Qingsong and Zhang, Zhang and others}, journal={arXiv preprint arXiv:2408.13257}, year={2024} }

相关项目

搜集汇总

数据集介绍

构建方式

MM-RLHF数据集的构建汇聚了多模态大型语言模型（MLLMs）与人类偏好对齐的全面项目，包含20000条覆盖图像理解、视频理解及安全相关任务指令。每条指令下有3-5个模型生成的响应，并伴有人的标注评分、排序以及细致的文本反馈。此外，数据集还包含了80000个用于RLHF训练的排名样本比较对。

特点

该数据集的主要特点在于其高质量的数据标注，提供了丰富的多模态交互场景，以及针对模型响应的细粒度反馈，有利于促进多模态模型在理解复杂任务时的性能提升。同时，数据集支持对模型生成的响应进行批判性评价，增强了反馈信息的解释性和信息量。

使用方法

使用MM-RLHF数据集首先需要从Hugging Face下载数据，并解压图像和视频数据集。之后，可以通过指定的脚本进行批判性评价的奖励模型训练，或者采用MM-DPO算法进行模型对齐的训练。评估模型时，可以利用提供的mmrlhf-eval代码库进行多种基准测试，以检验模型在多模态环境下的对齐能力。

背景与挑战

背景概述

MM-RLHF数据集，由Yi-Fan Zhang等研究人员于2025年发布，是一项旨在实现多模态大型语言模型（MLLMs）与人类偏好对齐的全面项目。该数据集涵盖了20k条指令，包括图像理解、视频理解和安全相关任务，每条指令下有3-5个模型生成的响应，以及人类标注的评分、排名和详细的文本反馈。MM-RLHF数据集的推出，为研究多模态模型在真实世界场景中的应用提供了重要资源，对促进多模态模型在各个领域的应用发展具有显著影响。

当前挑战

该数据集在构建过程中面临的挑战主要包括：1)如何确保收集的指令和响应数据能够全面覆盖多模态理解和安全相关的多样性任务；2)如何有效融合人类反馈，以实现对MLLMs的高质量对齐；3)如何设计评价体系，以准确评估模型在多模态任务中的性能。此外，数据集在解决领域问题，如多模态模型的分类、理解和安全性评估等方面，也面临着如何保持模型泛化能力、避免偏见和幻觉等挑战。

常用场景

经典使用场景

MM-RLHF数据集是一部专注于多模态大型语言模型（MLLM）与人类偏好对齐的全面项目。其经典使用场景在于为MLLM的训练提供高质量的数据集，涵盖图像理解、视频理解以及安全相关任务，旨在通过人类标注的评分、排名和细粒度反馈来指导模型生成更加符合人类期望的响应。

衍生相关工作

MM-RLHF数据集的发布促进了相关领域的研究，如基于批评的MLLM奖励模型和MM-DPO算法等，这些衍生工作进一步推动了多模态模型的对齐技术发展，为构建更加智能和安全的人工智能系统提供了新的视角和方法。

数据集最近研究