text-2-video-human-preferences-veo2
收藏Hugging Face2025-03-11 更新2025-03-12 收录
下载链接:
https://huggingface.co/datasets/Rapidata/text-2-video-human-preferences-veo2
下载链接
链接失效反馈官方服务:
资源简介:
Google DeepMind Veo2人类偏好数据集,包含约45000个由人类提供的注释,用于评估视频生成模型与提示的匹配程度、逻辑一致性以及视觉吸引力。
The Google DeepMind Veo2 Human Preference Dataset comprises approximately 45,000 human-provided annotations, which are used to evaluate the alignment between video generation models and their input prompts, as well as the logical consistency and visual appeal of the generated videos.
创建时间:
2025-03-10
搜集汇总
数据集介绍

构建方式
text-2-video-human-preferences-veo2数据集的构建是基于对Google DeepMind Veo2视频生成模型的人类评价,通过收集约45000条人类注释来评估模型的表现。数据集包含了成对的视频比较,参与者针对视频与提示的匹配程度、逻辑一致性以及视觉吸引力等方面进行评分,从而形成了加权结果和详细结果。
使用方法
使用该数据集时,用户可以直接访问HuggingFace平台进行下载。数据集分为训练集,其中包含了948个示例。用户可以通过分析weighted_results字段中的分数来了解人类评价的聚合结果,同时也可以查看detailedResults字段以获取更详细的评价信息。
背景与挑战
背景概述
text-2-video-human-preferences-veo2数据集,由Google DeepMind创建,旨在评估Veo2视频生成模型的表现。该数据集收集了约45000份人类注释,以评价视频生成模型在特定基准测试中的表现。这些注释是通过Rapidata Python API在约1小时内收集的,该API面向所有人开放,非常适合大规模数据注释。数据集包含了成对的视频比较,通过加权结果和详细结果列来记录用户响应,其任务类别涵盖视频分类、文本到视频、文本分类等领域,使用的语言为英语。
当前挑战
该数据集在构建过程中遇到的挑战主要包括如何有效地收集和整合大量的人类反馈,以及如何确保这些反馈能够准确反映视频生成模型在不同方面的性能,如视频与提示的匹配程度(Alignment)、视频的逻辑一致性(Coherence)和视频的美观度(Preference)。此外,数据集在解决视频生成领域的问题时,也面临着如何提高模型对提示的理解准确性,以及如何生成在视觉和逻辑上更连贯的视频内容的挑战。
常用场景
经典使用场景
text-2-video-human-preferences-veo2数据集汇聚了人类对Google DeepMind Veo2视频生成模型在文本到视频任务中的偏好标注,其经典使用场景在于评估和比较不同视频生成模型对给定文本描述的匹配度和生成视频的逻辑连贯性,以及视觉上的审美偏好。
解决学术问题
该数据集解决了视频生成领域中的多个学术研究问题,包括但不限于如何量化视频内容与文本描述的匹配度(Alignment),视频的逻辑连贯性(Coherence),以及独立于文本描述的视觉吸引力(Preference)。它为研究者提供了一个可靠的评价基准,帮助优化和比较视频生成算法的性能。
实际应用
在实际应用中,text-2-video-human-preferences-veo2数据集可被用于指导视频生成模型的设计,以生成更加符合人类偏好和期望的视频内容。此外,它还可以用于改进机器学习模型在理解人类情感和审美偏好方面的能力,从而在内容创作、广告制作和娱乐产业等领域发挥重要作用。
数据集最近研究
最新研究方向
text-2-video-human-preferences-veo2数据集的最新研究方向主要集中在视频生成模型的性能评估上。该数据集通过收集约45,000条人类注释,对Google DeepMind Veo2视频生成模型进行了基准测试。研究的重点在于评估视频与提示的匹配度(Alignment)、视频的逻辑一致性(Coherence)以及视觉上的审美偏好(Preference)。这些评估结果不仅为视频生成模型的改进提供了依据,而且对于理解人类在视频内容评价上的偏好具有重要的指导意义。
以上内容由遇见数据集搜集并总结生成



