five

面向文本引导视频编辑的多源视频与提示构造数据

收藏
国家基础学科公共科学数据中心2025-11-29 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=6924811f195d26651c427bc0&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
EditEval 数据集主要面向文本引导的视频编辑研究,为视频编辑任务提供一个覆盖多类型场景、可用于人工评价与自动评分的综合性基准。该数据集从 DAVIS、ActivityNet、YouCook2、Videvo、YouTube 等公开视频资源中筛选获得 200 个高质量视频片段,并基于 GPT-4o 生成 1,010 条文本编辑指令,涵盖人物替换、动物替换、物体修改、背景变化、风格迁移以及多目标编辑等多种类型。同时,数据集中包含 8 个主流视频编辑模型生成的 1,280 个编辑结果视频,并由人工标注人员从文本一致性、帧间一致性和视频保真度三个维度进行打分,形成可用于模型效果评价与自动指标对齐研究的数据资源。该数据集不仅可用于视频编辑模型训练与评测,也适用于构建视频质量自动评价指标。
提供机构:
厦门大学
二维码
社区交流群
二维码
科研交流群
商业服务