text-2-video-human-preferences-luma-ray2

Hugging Face2025-02-11 更新2025-02-12 收录

下载链接：

https://huggingface.co/datasets/Rapidata/text-2-video-human-preferences-luma-ray2

下载链接

链接失效反馈

官方服务：

资源简介：

Luma Ray2人类偏好数据集包含约45,000个由人类提供的注释，用于评估Luma的Ray 2视频生成模型。数据集中的每个条目包括两个视频链接，用户可以根据提示信息、连贯性和视觉吸引力对视频进行评分。

创建时间：

2025-02-03

原始信息汇总

数据集概述

数据集名称

Luma Ray2 Human Preferences

数据集特征

文本描述（prompt）：字符串类型
视频链接1（video1）：字符串类型
视频链接2（video2）：字符串类型
对齐度加权结果1（weighted_results1_Alignment）：浮点数类型
对齐度加权结果2（weighted_results2_Alignment）：浮点数类型
对齐度详细结果（detailedResults_Alignment）：字符串类型
一致性加权结果1（weighted_results1_Coherence）：浮点数类型
一致性加权结果2（weighted_results2_Coherence）：浮点数类型
一致性详细结果（detailedResults_Coherence）：字符串类型
偏好加权结果1（weighted_results1_Preference）：浮点数类型
偏好加权结果2（weighted_results2_Preference）：浮点数类型
偏好详细结果（detailedResults_Preference）：字符串类型
文件名1（file_name1）：字符串类型
文件名2（file_name2）：字符串类型
模型1名称（model1）：字符串类型
模型2名称（model2）：字符串类型

数据集划分

训练集（train）：948个样本，大小为8016146字节

数据集大小

总大小：8016146字节
下载大小：1074935字节

数据集许可

Apache-2.0

任务类别

视频分类
文本到视频
文本分类

语言

英语（en）

text-2-video-human-preferences-luma-ray2数据集通过收集人类对Luma Ray 2视频生成模型的反馈构建而成，包含约45000条人类标注，旨在评估模型在文本到视频转换任务中的性能。数据集的构建基于对模型生成的视频在一致性、连贯性和视觉吸引力方面的比较评估，通过Rapidata Python API在短时间内完成大规模的数据标注工作。

使用方法

使用该数据集时，用户可以直接通过HuggingFace提供的接口访问数据。数据集分为训练集，便于用户进行模型训练和评估。用户可以根据需要对齐度、连贯度和偏好等不同的评分维度来分析视频生成模型的表现，并据此优化模型。详细的视频文件和用户评分结果都可在数据集中的相应字段找到，方便用户进行深入的研究和开发工作。

背景与挑战

背景概述

text-2-video-human-preferences-luma-ray2数据集，由Rapidata团队于近期收集构建，旨在评估Luma Ray 2视频生成模型在特定基准上的表现。该数据集凝聚了大约45,000份人类注释，通过对比视频对来衡量模型的匹配度、连贯性和视觉吸引力。这些注释为研究人员提供了深入了解视频生成模型性能的宝贵视角，特别是在与给定提示的匹配度、逻辑一致性以及审美偏好方面。数据集的构建，标志着在视频生成领域对人类偏好进行大规模收集与评估的一次重要尝试，对相关研究产生了显著影响。

当前挑战

在构建该数据集的过程中，研究人员面临了多个挑战。首先，如何确保收集到的人类注释既具有代表性又足够多样，以全面评估视频生成模型的表现，是一个重大挑战。其次，对于视频质量的评估标准，尤其是如何量化人类对视频的偏好，存在着主观性，这为构建具有一致性和可靠性的评分系统带来了困难。此外，大规模数据标注的效率和质量控制也是构建此类数据集时必须克服的关键问题。

常用场景

经典使用场景

text-2-video-human-preferences-luma-ray2数据集在视频生成模型评估中扮演着重要角色，其经典使用场景主要在于通过人类偏好标注，对Luma Ray 2等视频生成模型进行Alignment（对齐度）、Coherence（连贯性）和Preference（偏好度）三方面的性能评估，以提升模型在生成视频内容时的质量与用户满意度。

解决学术问题

该数据集解决了视频生成领域中如何客观评估模型性能的问题，通过人类标注者的直接反馈，为学术研究提供了量化的评价标准，有助于研究者深入理解视频生成模型在真实世界应用中的表现差异，推动模型优化与算法改进。

实际应用

在实际应用中，text-2-video-human-preferences-luma-ray2数据集可以被用于指导视频生成模型更好地服务于内容创作、广告制作、虚拟现实等领域，通过精确匹配用户需求，提升用户体验和内容质量。

数据集最近研究