lyx97/FETV
收藏Hugging Face2023-06-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lyx97/FETV
下载链接
链接失效反馈官方服务:
资源简介:
FETV是一个用于细粒度评估开放域文本到视频生成的基准数据集。它包含多样化的文本提示,这些提示根据三个正交方面进行分类:主要内容、属性控制和提示复杂性。数据集结构包括数据实例的格式和数据字段的含义,如视频ID、文本提示、主要内容、属性控制、提示复杂性、来源、视频URL和异常类型。数据集包含619个文本提示,并提供了不同类别的数据分布统计。
FETV是一个用于细粒度评估开放域文本到视频生成的基准数据集。它包含多样化的文本提示,这些提示根据三个正交方面进行分类:主要内容、属性控制和提示复杂性。数据集结构包括数据实例的格式和数据字段的含义,如视频ID、文本提示、主要内容、属性控制、提示复杂性、来源、视频URL和异常类型。数据集包含619个文本提示,并提供了不同类别的数据分布统计。
提供机构:
lyx97
原始信息汇总
FETV 数据集概述
数据集简介
FETV 是一个用于评估开放域文本到视频生成任务的细粒度评估基准。该数据集包含多样化的文本提示,根据三个正交方面进行分类:主要内容、属性控制和提示复杂度。
数据集结构
数据实例
所有 FETV 数据均存储在 fetv_data.json 文件中。每行代表一个数据实例,格式如下:
json
{
"video_id": "1006807024",
"prompt": "A mountain stream",
"major content": {
"spatial": ["scenery & natural objects"],
"temporal": ["fluid motions"]
},
"attribute control": {
"spatial": null,
"temporal": null
},
"prompt complexity": ["simple"],
"source": "WebVid",
"video_url": "https://ak.picdn.net/shutterstock/videos/1006807024/preview/stock-footage-a-mountain-stream.mp4",
"unusual type": null
}
数据字段
- "video_id": 视频在原始数据集中的标识符。
- "prompt": 用于文本到视频生成的文本提示。
- "major content": 提示中描述的主要内容。
- "attribute control": 提示旨在控制的属性。
- "prompt complexity": 提示的复杂度。
- "source": 提示来源的原始数据集,可以是 "WebVid"、"MSRVTT" 或 "ours"。
- "video_url": 参考视频的 URL 链接。
- "unusual type": 提示涉及的不寻常组合类型。仅适用于
"source": "ours"的数据实例。
数据集统计
FETV 包含 619 个文本提示。不同类别的数据分布如下(类别上的数字总和不等于 619,因为一个数据实例可以属于多个类别):
- 主要内容和属性控制统计图
- 复杂度统计图
搜集汇总
数据集介绍

背景与挑战
背景概述
FETV是一个专为开放域文本到视频生成任务设计的细粒度评估基准数据集,包含619个多样化的文本提示,覆盖多种内容和复杂性级别。数据集通过结构化字段(如主要内容、属性控制等)支持对生成视频的详细评估,适用于研究和开发文本到视频模型。
以上内容由遇见数据集搜集并总结生成



