MiraData
收藏MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions
数据集概述
基本信息
- 许可证: GPL-3.0
- 任务类别:
- 图像转视频
- 文本转图像
- 文本转视频
- 视频分类
- 语言: 英语
- 标签: 艺术
- 数据集大小: 100K<n<1M
数据集介绍
MiraData 是一个专为长视频生成任务设计的大型视频数据集。该数据集旨在解决现有文本-视频数据集在处理长视频序列和捕捉镜头转换方面的不足。此外,为了更好地评估视频生成中的时间一致性和运动强度,引入了 MiraBench,该基准通过增加三维一致性和基于跟踪的运动强度指标来增强现有基准。
数据集版本
MiraData 发布了四个版本,包含 330K、93K、42K、9K 数据。
元文件信息
元文件包含以下索引信息:
- clip_id: 视频片段索引,由
{download_id}.{clip_id}组成 - source: 视频下载来源和类别
- video_url: 视频源链接
- video_id: 视频在源网站中的ID
- width: 视频宽度
- height: 视频高度
- fps: 用于提取帧的视频帧率
- seconds: 视频片段的持续时间
- timestamp: 视频片段在源视频中的开始和结束时间戳(用于从源视频中剪切视频片段)
- frame_number: 视频片段的帧数
- framestamp: 视频片段在源视频中的开始和结束帧
- file_path: 存储视频片段的文件路径
- short_caption: 简短的总体描述
- dense_caption: 密集的总体描述
- background_caption: 视频背景的描述
- main_object_caption: 视频中主要对象的描述
- style_caption: 视频风格的描述
- camera_caption: 摄像机移动的描述
下载方法
可以使用以下脚本下载视频并将其分割成片段: python python download_data.py --meta_csv {meta file} --download_start_id {the start of download id} --download_end_id {the end of download id} --raw_video_save_dir {the path of saving raw videos} --clip_video_save_dir {the path of saving cutted video}
引用信息
如果该数据集对您的研究有用,请引用以下论文:
@misc{ju2024miradatalargescalevideodataset, title={MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions}, author={Xuan Ju and Yiming Gao and Zhaoyang Zhang and Ziyang Yuan and Xintao Wang and Ailing Zeng and Yu Xiong and Qiang Xu and Ying Shan}, year={2024}, eprint={2407.06358}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2407.06358}, }
联系信息
如有任何疑问,请通过电子邮件 mira-x@googlegroups.com 联系。




