Nahrawy/VIDIT-Depth-ControlNet
收藏Hugging Face2023-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nahrawy/VIDIT-Depth-ControlNet
下载链接
链接失效反馈官方服务:
资源简介:
VIDIT数据集包含390个不同的Unreal Engine场景,每个场景在40种光照设置下拍摄,共产生15,600张图像。光照设置由5种色温(2500K, 3500K, 4500K, 5500K和6500K)和8种光方向(N, NE, E, SE, S, SW, W, NW)的组合构成。此版本仅包含训练集,涉及300个场景。图像的原始分辨率为1024x1024。标题由BLIP-2, Flan T5-xxl模型生成,深度图由GLPN fine-tuned on NYUv2模型生成。
提供机构:
Nahrawy
原始信息汇总
数据集概述
数据集名称
VIDIT Dataset
数据集特征
- scene: 字符串类型
- image: 图像类型
- depth_map: 图像类型
- direction: 字符串类型
- temperature: 整数类型(int32)
- caption: 字符串类型
数据集分割
- train:
- 示例数量: 12000
- 数据大小: 20575644792.0 字节
数据集大小与下载大小
- 数据集大小: 20575644792.0 字节
- 下载大小: 20108431280 字节
数据集内容
- 包含300个Unreal Engine场景,每个场景有40种光照设置,共计15,600张图像。
- 光照设置包括5种颜色温度(2500K, 3500K, 4500K, 5500K, 6500K)和8种光线方向(N, NE, E, SE, S, SW, W, NW)。
- 原始图像分辨率为1024x1024。
数据生成方法
- 描述文本使用BLIP-2, Flan T5-xxl模型生成。
- 深度图使用GLPN fine-tuned on NYUv2模型生成。



