rekey-video-vbench2

Hugging Face2026-05-07 更新2026-05-08 收录

下载链接：

https://huggingface.co/datasets/nickname-xingxing/rekey-video-vbench2

下载链接

链接失效反馈

官方服务：

资源简介：

ReKey-Video数据管道是一个用于视频基准测试的数据集，包含两个主要版本（v1和v2）。v1版本包含109个案例，用于方法比较；v2版本包含109 + 68 + 75个案例，用于属性审查。数据集包括源案例元数据、评估标签和结果矩阵，以及用于审查的Gradio应用程序。数据以tar归档形式存储以减少文件数量，适用于视频处理和分析任务。

The ReKey-Video data pipeline is a dataset for video benchmarking, containing two main versions (v1 and v2). The v1 version includes 109 cases for method comparison, while the v2 version includes 109 + 68 + 75 cases for attribute review. The dataset includes source case metadata, evaluation labels and result matrices, as well as a Gradio application for review. The data is stored in tar archives to reduce the number of files, making it suitable for video processing and analysis tasks.

创建时间：

2026-04-23

搜集汇总

数据集介绍

构建方式

ReKey-Video VBench2数据集由三组精心挑选的视频案例构成，分别为aligned109组（109个案例）、vbench2_new68组（68个案例）与vbench2_human_composition75_id0组（75个案例），共计252个视频片段。其构建依托于一套完整的数据管线，核心元数据以JSON Lines格式存储于benchmark_pilot/main目录下，同时配套了对应的执行分片（shards）以支持分布式处理。媒体文件通过tar归档压缩，以降低文件数量管理的复杂度，并通过HuggingFace导出格式进行发布。用户仅需下载HuggingFace导出的归档文件，执行提取脚本extract_hf_media.py即可完成媒体解码，整个过程兼顾了数据完整性与操作便捷性。

特点

该数据集最显著的特点在于其内置了两套独立的Gradio评估应用，分别服务于v1阶段的方法对比与v2阶段的属性归因审查。v1应用专注于109个对齐案例的关键帧方法比较，v2应用则覆盖全部252个案例并进行矩形标注归因分析。此外，v2应用还具备实时写入注释文件的能力，可将审核结果持久化存储于导出目录的annotations子文件夹中。评价标签与结果矩阵以CSV格式提供，便于量化分析与统计比对。这种设计使得ReKey-Video VBench2不仅是一个静态基准数据集，更是一个可交互审查与持续迭代的评估工具。

使用方法

使用该数据集时，首先需通过git clone或直接下载获取HuggingFace上的完整导出内容。进入data-pipeline目录后，运行python3 review/extract_hf_media.py解压媒体文件，随后根据审查目标选择启动对应的Gradio应用：执行bash review/run_v1_aligned109_keyframe_review_app.sh可进行v1方法对比评估，执行bash review/run_v2_vbench2_rect1_attribution_app.sh则可启动v2归因审查。若导出目录存放于非默认路径，可通过设置环境变量REKEY_ALIGNED109_COMPARE_EXPORT_ROOT或REKEY_VBENCH2_REVIEW_EXPORT_ROOT来指定路径。应用启动后会自动识别本地数据集结构，用户即可通过浏览器界面进行交互式标注与评估。

背景与挑战

背景概述

ReKey-Video VBench2数据集的构建旨在应对视频生成领域中对关键帧重定位与属性一致性评估的迫切需求。该数据集由研究团队于近年来开发，围绕视频生成中关键帧的对齐、比较与归因分析等核心研究问题展开。数据集包含v1版本的109个对齐案例以及v2版本的109+68+75个归因审查案例，覆盖了方法比较与归因评估两大维度。通过整合Gradio审查应用与结构化元数据，ReKey-Video VBench2为视频生成模型的鲁棒性评估提供了标准化基准，对推动视频生成技术从定性展示向定量分析转变具有显著意义。

当前挑战

该数据集面临的挑战首先在于视频生成领域的关键帧对齐与归因问题本身具有高度复杂性，涉及时序一致性、视觉语义匹配以及多方法比较的公平性等。其次，数据集构建过程中面临媒体文件管理难题，尤其是大量视频帧的存储与高效提取，为此采用tar压缩包以平衡文件数量与访问效率。此外，多版本数据的整合（v1与v2）和跨版本注释的一致性维护，以及从旧管道代码、诊断快照等遗留内容中剥离出纯净可用的评估工具，均构成了构建过程中的技术难点。

常用场景

经典使用场景

ReKey-Video VBench2数据集专为视频重定向（video re-keying）任务中的关键帧对齐与属性归因分析而设计，其经典使用场景聚焦于多方法效果对比与主观评估。研究者可通过该数据集中精心标注的109组对齐案例及68+75组归因样本，系统性地比较不同视频重定向算法在关键帧选取、镜头衔接与语义保持上的表现差异，从而客观衡量各方法在视觉一致性与时序合理性层面的优劣。

实际应用

在实际应用层面，ReKey-Video VBench2可部署于视频后期制作平台与智能剪辑系统中，辅助创作者自动化完成镜头重定向与内容归因任务。例如，在影视制作中快速匹配多版本素材的关键帧序列，或在短视频编辑工具中自动识别并纠正由视角切换引发的语义断裂。此外，该数据集支持的评估管道可直接集成至工业级视频处理管线，为角色动画、广告合成等需精确控制时间轴对齐的场景提供质量保障。

衍生相关工作

基于该数据集衍生了两个核心评估应用：v1对齐方法比较系统（109案例）与v2归因审查系统（共252案例）。前者专注于多算法关键帧对齐效果的横向对比，后者则深入至单帧归因的微调验收。这些工具通过Gradio交互界面实现可视化审查，并配套了标准化数据导出流程，为后续研究如无监督视频重定向、时域一致性学习及归因可解释性分析等方向奠定了实验基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集