MJ-BENCH-VIDEO
收藏arXiv2025-02-07 更新2025-02-11 收录
下载链接:
https://aiming-lab.github.io/MJ-VIDEO.github.io/
下载链接
链接失效反馈官方服务:
资源简介:
MJ-BENCH-VIDEO是一个大规模的视频偏好数据集,由北卡罗来纳大学教堂山分校等机构创建。该数据集包含5个评价方面:对齐度、安全性、细腻度、连贯性与一致性、偏见与公平性,共计28个细粒度评价标准,旨在为视频生成模型的评价提供全面的基准。数据集通过三种策略收集了视频对及其对应的提示,经过筛选和注释后,形成了包含5421个数据条目的高质量数据集。该数据集适用于评估视频生成模型在多个方面的表现,推动更先进视频奖励模型的发展。
MJ-BENCH-VIDEO is a large-scale video preference dataset developed by institutions including the University of North Carolina at Chapel Hill. It encompasses five core evaluation dimensions: alignment, safety, detailedness, coherence and consistency, as well as bias and fairness, comprising a total of 28 fine-grained evaluation criteria, and is designed to provide a comprehensive benchmark for the evaluation of video generation models. The dataset collects video pairs and their corresponding prompts via three strategies, and after rigorous filtering and annotation, a high-quality dataset containing 5421 data entries is established. This dataset can be utilized to assess the performance of video generation models across multiple dimensions, thereby advancing the development of more advanced video reward models.
提供机构:
北卡罗来纳大学教堂山分校, 芝加哥大学, 牛津大学, 斯坦福大学
创建时间:
2025-02-04
搜集汇总
数据集介绍

构建方式
MJ-BENCH-VIDEO数据集的构建始于数据收集阶段,采用三种主要策略:从现有视频偏好数据集中收集、通过图像偏好对转换为视频偏好对、直接从文本提示生成视频偏好对。在数据过滤阶段,利用GPT-4和人工评估进行筛选,以确保视频与提示的一致性。最后,进行数据标注,由人工标注者对视频对进行28个细粒度标准的评分和偏好评估。
特点
MJ-BENCH-VIDEO数据集具有五个关键评估方面:一致性、安全性、精细度、连贯性和一致性以及偏见和公平性,每个方面包含多个详细的评估标准,共28个,以实现视频判断的全面性。
使用方法
MJ-BENCH-VIDEO数据集可用于评估视频生成模型的能力,为视频偏好模型的开发提供基础。此外,基于该数据集,提出的MJ-VIDEO视频奖励模型可以提供细粒度的判断,捕捉多样化的视频偏好,并在不同的视频生成场景中实现与不同目标的匹配。
背景与挑战
背景概述
MJ-BENCH-VIDEO是一个大规模的视频偏好评估基准,旨在评估视频生成模型在五个关键方面的性能:对齐度、安全性、精细度、一致性与连贯性以及偏见与公平性。该数据集由Haibo Tong等人创建,并基于Mixture-of-Experts (MoE)架构提出了MJ-VIDEO模型,用于提供细粒度的视频偏好奖励。MJ-BENCH-VIDEO包含了28个细粒度的评估标准,为视频偏好提供了全面的评估。该数据集和相关模型已被广泛应用于视频生成领域的评估和研究,对推动视频生成技术的发展具有重要意义。
当前挑战
MJ-BENCH-VIDEO数据集和相关模型面临的挑战包括:1) 模型对齐度问题,即生成的视频内容与文本指令的精确匹配;2) 内容幻觉问题,即模型生成的内容可能与现实世界脱节;3) 安全性问题,即生成的视频可能包含不适当或有害的内容;4) 偏见问题,即模型可能对特定群体存在偏见。此外,构建大规模的细粒度视频偏好数据集需要大量的资源和时间,并且需要解决数据收集、过滤和标注过程中的挑战。
常用场景
经典使用场景
MJ-BENCH-VIDEO数据集主要用于评估视频生成模型在五个关键方面的表现,包括对齐度、安全性、精细度、连贯性和一致性以及偏差和公平性。该数据集包含了28个细粒度的评估标准,为视频生成模型的评价提供了全面而细致的参考。通过该数据集,研究者可以全面了解视频生成模型在各个方面的表现,从而指导模型的优化和改进。
实际应用
MJ-BENCH-VIDEO数据集在实际应用中可以用于评估和优化视频生成模型,提高视频生成质量。同时,MJ-VIDEO模型可以用于视频生成过程中的偏好调整,使生成的视频更符合用户的期望和需求。此外,MJ-BENCH-VIDEO数据集和MJ-VIDEO模型还可以用于视频内容审核、视频推荐等场景,提高视频内容的质量和用户体验。
衍生相关工作
MJ-BENCH-VIDEO数据集和MJ-VIDEO模型的提出,为视频生成和评估领域的研究提供了新的思路和方法。在此基础上,研究者可以进一步探索更精细化的视频评估标准,以及更有效的视频生成模型。同时,MJ-VIDEO模型的多阶段训练策略和混合专家架构也为其他领域的模型设计和训练提供了借鉴和参考。
以上内容由遇见数据集搜集并总结生成



