OpenSubject
收藏OpenSubject数据集概述
数据集基本信息
- 数据集名称: OpenSubject
- 许可证: Apache 2.0
- 任务类别: 图像到图像
- 标签: 主体驱动生成、图像生成、图像处理
- 规模类别: 1M < n < 10M
数据集描述
OpenSubject是一个源自视频的大规模语料库,用于主体驱动的生成和处理。
数据集结构
数据集包含以下文件和目录结构:
OpenSubject/ ├── Images_packages/ # 压缩的图像包(tar.gz格式) │ ├── generation_input_images_.tar.gz │ ├── generation_output_images_.tar.gz │ ├── manipulation_input_images_.tar.gz │ └── manipulation_output_images_.tar.gz └── Jsonls/ # 标注文件 ├── generation_merged.jsonl └── manipulation_merged.jsonl
图像提取说明
下载后,使用提供的脚本提取图像包。执行以下命令: bash python scripts/unzip_images/extract_images.py --packages_dir ./Images_packages --output_dir ./Images --num_workers 32
提取后将生成以下目录结构:
Images/ ├── generation/ │ ├── input_images/ │ └── output_images/ └── manipulation/ ├── input_images/ └── output_images/
使用说明
详细使用说明请参见主仓库:https://github.com/LAW1223/OpenSubject
许可证信息
本数据集根据Apache 2.0许可证发布。




