面向文本引导视频编辑的多源视频与提示构造数据

Name: 面向文本引导视频编辑的多源视频与提示构造数据
Creator: 厦门大学
License: 暂无描述

国家基础学科公共科学数据中心2025-11-29 收录

下载链接：

https://nbsdc.cn/general/dataDetail?id=6924811f195d26651c427bc0&type=1

下载链接

链接失效反馈

官方服务：

资源简介：

EditEval 数据集主要面向文本引导的视频编辑研究，为视频编辑任务提供一个覆盖多类型场景、可用于人工评价与自动评分的综合性基准。该数据集从 DAVIS、ActivityNet、YouCook2、Videvo、YouTube 等公开视频资源中筛选获得 200 个高质量视频片段，并基于 GPT-4o 生成 1,010 条文本编辑指令，涵盖人物替换、动物替换、物体修改、背景变化、风格迁移以及多目标编辑等多种类型。同时，数据集中包含 8 个主流视频编辑模型生成的 1,280 个编辑结果视频，并由人工标注人员从文本一致性、帧间一致性和视频保真度三个维度进行打分，形成可用于模型效果评价与自动指标对齐研究的数据资源。该数据集不仅可用于视频编辑模型训练与评测，也适用于构建视频质量自动评价指标。

提供机构：

厦门大学