five

MM-RLHF-RewardBench|多模态语言模型数据集|偏好对齐数据集

收藏
huggingface2025-02-18 更新2025-02-19 收录
多模态语言模型
偏好对齐
下载链接:
https://huggingface.co/datasets/yifanzhang114/MM-RLHF-RewardBench
下载链接
链接失效反馈
资源简介:
MM-RLHF是一个用于对多模态大型语言模型(MLLMs)进行人类偏好对齐的全面项目。本项目包含一个高质量的多模态大型语言模型对齐数据集,一个强大的基于批评的多模态大型语言模型奖励模型及其训练算法,一种新颖的对齐算法MM-DPO,以及两个新的基准测试。
创建时间:
2025-02-05
AI搜集汇总
数据集介绍
main_image_url
构建方式
MM-RLHF-RewardBench数据集的构建,旨在为多模态大型语言模型(MLLMs)与人类偏好对齐提供高质量的数据支持。该数据集通过收集包含图像、视频、提示文本以及用户选择和拒绝的理由等多种类型的数据项,形成了一个综合性的训练集,共计170个样本,数据大小为278719字节。
特点
该数据集的特点在于其多模态特性,融合了图像、视频和文本信息,并提供了用户的选择和拒绝理由,这为训练模型理解和预测人类偏好提供了丰富的上下文信息。此外,数据集遵循MIT许可,便于研究者自由使用和分享。MM-RLHF-RewardBench的构建旨在推动多模态LLM的偏好对齐研究。
使用方法
使用MM-RLHF-RewardBench数据集时,研究者可以通过HuggingFace的dataset库方便地加载和利用数据。该数据集可用于评估MM-RLHF-Reward模型,该模型能够与图像、多图像和视频进行交互。用户可以通过简单的生成流程来应用模型,并可在社区标签中分享生成内容。更多使用细节,可参考项目在Github上的官方文档。
背景与挑战
背景概述
MM-RLHF-RewardBench数据集,诞生于2025年,是由yifanzhang114等研究者主导,针对多模态大型语言模型(MLLMs)与人类偏好对齐的全面性项目的一部分。该数据集的核心旨在通过高质量的数据,推进多模态大型语言模型在理解图像、视频等不同模态信息方面的研究。其影响力在学术界和工业界均受到广泛关注,为相关领域提供了重要的研究资源。
当前挑战
该数据集在构建过程中面临的挑战主要包括:1) 如何在多模态交互中,有效地将图像、文本和视频等信息进行融合,以实现更精准的模型训练;2) 如何在保证数据质量的同时,处理大量多模态数据带来的存储和计算挑战;3) 在模型评估方面,如何构建全面且具有挑战性的基准,以准确衡量多模态大型语言模型在各项任务中的表现。
常用场景
经典使用场景
MM-RLHF-RewardBench数据集被广泛应用于评估多模态大型语言模型(MLLMs)与人类偏好的一致性。该数据集提供了高质量的标注数据,使得研究者能够通过模型与图像、视频等多模态数据的互动,评估模型在多模态任务中的表现,如生成描述、回答问题等。
衍生相关工作
基于MM-RLHF-RewardBench,研究者进一步开发了如MM-RLHF和MM-DPO等新颖的算法,以及相关的评价套件,这些工作为多模态模型的研究和应用提供了新的方法和工具。
数据集最近研究
最新研究方向
在多模态大型语言模型(MLLM)与人脑偏好对齐领域,MM-RLHF项目标志着向前迈出的重要一步。该项目推出的MM-RLHF-RewardBench数据集,旨在评估图像、多图像和视频交互能力的MLLMs。当前研究聚焦于通过高质量的数据集与新颖的MM-DPO对齐算法,提升模型在十个维度上的一致性能,并已在27个基准测试中取得显著成效。此数据集及其相关算法的研究,不仅为模型性能的提升提供了可靠依据,也为多模态模型评价体系的构建贡献了新的视角和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

WLASL, MSASL, NMFs-CSL, SLR500, Slovo, BOBSL, 27 Class Sign Language Dataset, AUTSL, BosphorusSign22k, GSL, LSA16, LSA64, Rendered Handpose Dataset, YouTube-ASL, LSFB-ISOL, ASLLVD, AASL, KArSL, BdSLImset, HaGRID, Phoenix-2014, Phoenix-2014T

该仓库收集了多种与手语识别和翻译相关的数据集,旨在为研究者、开发者和爱好者提供一个集中的资源。数据集包括不同类型(如RGB、深度、骨骼)和来自不同国家的数据,用于支持手语识别和翻译技术的研究。

github 收录

MUStARD++

MUStARD++是一个多模态讽刺检测数据集,由萨里大学创建,旨在通过语言、语音和视觉线索全面捕捉讽刺现象。数据集包含1202个视频样本,来源于多个流行电视节目,通过手动标注确保高质量的讽刺标签。创建过程中,研究者们通过多轮标注和验证确保数据的准确性和多样性。该数据集主要应用于自动讽刺检测,帮助机器理解并识别讽刺语境,解决讽刺识别中的多模态挑战。

arXiv 收录

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录