five

text-2-video-human-preferences-luma-ray2

收藏
Hugging Face2025-02-11 更新2025-02-12 收录
下载链接:
https://huggingface.co/datasets/Rapidata/text-2-video-human-preferences-luma-ray2
下载链接
链接失效反馈
官方服务:
资源简介:
Luma Ray2人类偏好数据集包含约45,000个由人类提供的注释,用于评估Luma的Ray 2视频生成模型。数据集中的每个条目包括两个视频链接,用户可以根据提示信息、连贯性和视觉吸引力对视频进行评分。
创建时间:
2025-02-03
原始信息汇总

数据集概述

数据集名称

Luma Ray2 Human Preferences

数据集特征

  • 文本描述(prompt):字符串类型
  • 视频链接1(video1):字符串类型
  • 视频链接2(video2):字符串类型
  • 对齐度加权结果1(weighted_results1_Alignment):浮点数类型
  • 对齐度加权结果2(weighted_results2_Alignment):浮点数类型
  • 对齐度详细结果(detailedResults_Alignment):字符串类型
  • 一致性加权结果1(weighted_results1_Coherence):浮点数类型
  • 一致性加权结果2(weighted_results2_Coherence):浮点数类型
  • 一致性详细结果(detailedResults_Coherence):字符串类型
  • 偏好加权结果1(weighted_results1_Preference):浮点数类型
  • 偏好加权结果2(weighted_results2_Preference):浮点数类型
  • 偏好详细结果(detailedResults_Preference):字符串类型
  • 文件名1(file_name1):字符串类型
  • 文件名2(file_name2):字符串类型
  • 模型1名称(model1):字符串类型
  • 模型2名称(model2):字符串类型

数据集划分

  • 训练集(train):948个样本,大小为8016146字节

数据集大小

  • 总大小:8016146字节
  • 下载大小:1074935字节

数据集许可

Apache-2.0

任务类别

  • 视频分类
  • 文本到视频
  • 文本分类

语言

  • 英语(en)

标签

  • 视频
  • t2v
  • 文本到视频
  • 文本2视频
  • 文本-视频
  • 人类
  • 注解
  • 偏好
  • 李克特量表
  • 一致性
  • 对齐
搜集汇总
数据集介绍
main_image_url
构建方式
text-2-video-human-preferences-luma-ray2数据集通过收集人类对Luma Ray 2视频生成模型的反馈构建而成,包含约45000条人类标注,旨在评估模型在文本到视频转换任务中的性能。数据集的构建基于对模型生成的视频在一致性、连贯性和视觉吸引力方面的比较评估,通过Rapidata Python API在短时间内完成大规模的数据标注工作。
使用方法
使用该数据集时,用户可以直接通过HuggingFace提供的接口访问数据。数据集分为训练集,便于用户进行模型训练和评估。用户可以根据需要对齐度、连贯度和偏好等不同的评分维度来分析视频生成模型的表现,并据此优化模型。详细的视频文件和用户评分结果都可在数据集中的相应字段找到,方便用户进行深入的研究和开发工作。
背景与挑战
背景概述
text-2-video-human-preferences-luma-ray2数据集,由Rapidata团队于近期收集构建,旨在评估Luma Ray 2视频生成模型在特定基准上的表现。该数据集凝聚了大约45,000份人类注释,通过对比视频对来衡量模型的匹配度、连贯性和视觉吸引力。这些注释为研究人员提供了深入了解视频生成模型性能的宝贵视角,特别是在与给定提示的匹配度、逻辑一致性以及审美偏好方面。数据集的构建,标志着在视频生成领域对人类偏好进行大规模收集与评估的一次重要尝试,对相关研究产生了显著影响。
当前挑战
在构建该数据集的过程中,研究人员面临了多个挑战。首先,如何确保收集到的人类注释既具有代表性又足够多样,以全面评估视频生成模型的表现,是一个重大挑战。其次,对于视频质量的评估标准,尤其是如何量化人类对视频的偏好,存在着主观性,这为构建具有一致性和可靠性的评分系统带来了困难。此外,大规模数据标注的效率和质量控制也是构建此类数据集时必须克服的关键问题。
常用场景
经典使用场景
text-2-video-human-preferences-luma-ray2数据集在视频生成模型评估中扮演着重要角色,其经典使用场景主要在于通过人类偏好标注,对Luma Ray 2等视频生成模型进行Alignment(对齐度)、Coherence(连贯性)和Preference(偏好度)三方面的性能评估,以提升模型在生成视频内容时的质量与用户满意度。
解决学术问题
该数据集解决了视频生成领域中如何客观评估模型性能的问题,通过人类标注者的直接反馈,为学术研究提供了量化的评价标准,有助于研究者深入理解视频生成模型在真实世界应用中的表现差异,推动模型优化与算法改进。
实际应用
在实际应用中,text-2-video-human-preferences-luma-ray2数据集可以被用于指导视频生成模型更好地服务于内容创作、广告制作、虚拟现实等领域,通过精确匹配用户需求,提升用户体验和内容质量。
数据集最近研究
最新研究方向
在视频生成模型评估领域,text-2-video-human-preferences-luma-ray2数据集通过收集约45,000条人类注释,对Luma Ray 2视频生成模型进行了细致的评价。该数据集重点关注Alignment(对齐度)、Coherence(连贯性)和Preference(偏好)三个维度的评分,不仅衡量视频与提示的匹配程度,还评估了视频的逻辑一致性和视觉吸引力。近期研究利用该数据集对模型进行基准测试,进一步推动了视频生成模型在人类偏好上的优化,对于提升AI生成内容的真实感和用户满意度具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作