nkp37/OpenVid-1M
收藏数据集概述
基本信息
- 许可证: CC-BY-4.0
- 任务类别:
- text-to-video
- 语言:
- en
- 标签:
- text-to-video
- Video Generative Model Training
- Text-to-Video Diffusion Model Training
- prompts
- 数据集名称: OpenVid-1M
- 数据集大小: 1M<n<10M
数据集描述
OpenVid-1M 是一个高质量的文本到视频数据集,旨在帮助研究机构提升视频质量。该数据集具有高美学、清晰度和分辨率,可用于直接训练或作为其他视频数据集的质量调优补充。所有视频的分辨率至少为 512×512,并且从中精选了 433K 1080p 视频创建了 OpenVidHD,以推进高清视频生成。
数据集目录结构
DATA_PATH data train OpenVid-1M.csv OpenVidHD.csv OpenVid_part0.zip OpenVid_part1.zip OpenVid_part2.zip ...
下载方式
可以通过 wget 命令下载每个文件,例如:
wget https://huggingface.co/datasets/nkp37/OpenVid-1M/resolve/main/OpenVid_part0.zip wget https://huggingface.co/datasets/nkp37/OpenVid-1M/resolve/main/OpenVid_part1.zip wget https://huggingface.co/datasets/nkp37/OpenVid-1M/resolve/main/OpenVid_part2.zip ...
使用方法
可以通过 unzip 命令解压每个 OpenVid_part*.zip 文件,例如:
unzip -j OpenVid_part0.zip -d video_folder unzip -j OpenVid_part1.zip -d video_folder unzip -j OpenVid_part2.zip -d video_folder ...
对于一些较大的文件(> 50G),我们将其拆分为多个小文件,可以通过 cat 命令恢复这些文件,例如:
cat OpenVid_part73_part* > OpenVid_part73.zip unzip -j OpenVid_part73.zip -d video_folder
OpenVid-1M.csv 和 OpenVidHD.csv 包含文本-视频对,可以通过以下方式轻松读取:
python
import pandas
df = pd.read_csv("OpenVid-1M.csv")
许可证
OpenVid-1M 以 CC-BY-4.0 许可证发布。视频样本来自公开可用的数据集,用户必须遵守相关许可证,如 Panda、ChronoMagic、Open-Sora-plan、CelebvHQ(Unknow)。




