data
收藏OmniSR: Shadow Removal under Direct and Indirect Lighting 数据集概述
数据集基本信息
- 数据集名称: OmniSR: Shadow Removal under Direct and Indirect Lighting
- 发布日期: AAAI 2025
- 维护者: Jiamin Xu, Zelong Li, Yuxin Zheng, Chenyu Huang, Renshu Gu, Gang Xu (Hangzhou Dianzi University); Weiwei Xu (Zhejiang University)
- 许可协议: CC-BY-4.0
- 语言: 不适用(图像数据集)
- 规模: 10K<n<100K
- 标签: image-to-image, shadow-removal, synthetic-dataset, 3dfront, objaverse, aaai-2025
- 任务类别: 图像到图像
数据集摘要
本数据集是论文 “OmniSR: Shadow Removal under Direct and Indirect Lighting” (AAAI 2025) 的官方数据集。它是一个大规模合成图像数据集,专门设计用于研究在直接和间接照明条件下的阴影去除。
数据集包含超过 30,000对 图像。每对图像包含:
- 一张包含由直接照明和间接照明造成阴影的图像。
- 一张对应的无阴影的真实图像。
数据集使用 3D-Front 和 Objaverse 3D模型库渲染而成,涵盖了多种室内场景、物体类型和照明条件。
主要用途
- 直接用途: 主要用于训练和评估图像阴影去除模型,特别是那些旨在处理涉及直接和间接阴影的复杂照明场景的模型。
- 范围外用途: 作为一个纯合成数据集,仅在其上训练的模型可能无法完美泛化到真实世界的照片,除非采用额外的微调或领域适应技术。
数据结构
数据实例
数据按文件夹组织。一个典型的数据实例包含三个图像文件:
direct_shadow.pngindirect_shadow.pngshadow_free.png
数据字段
direct_shadow:包含直接光照阴影的图像文件路径。indirect_shadow:包含间接光照(例如,光线从表面反射)阴影的图像文件路径。shadow_free:对应的无阴影真实图像文件路径。
数据划分
完整数据集包含超过30,000对图像。有关训练、验证和测试划分的具体细节,请参阅原始论文或数据集发布中包含的划分文件。
数据集创建
数据来源
数据集通过自定义渲染流程生成,使用了两个主要的3D资产来源:
- 3D-Front (https://tianchi.aliyun.com/specials/promotion/3dfront): 用于生成室内场景布局。
- Objaverse (https://objaverse.allenai.org/): 用于在场景中填充多样化的3D物体。
标注信息
数据是自动生成的。阴影状态(存在/不存在)由渲染引擎的照明设置控制,因此不涉及人工手动标注。
个人与敏感信息
该数据集完全由合成的虚拟场景组成。不包含任何肖像、个人信息或现实世界的敏感数据。
偏差、风险与局限性
- 合成领域差距: 主要局限性在于其合成性质。模型可能需要适应才能在真实世界图像上表现良好。
- 场景与物体偏差: 数据集内容来源于3D-Front和Objaverse,可能无法代表真实世界物体、场景和照明条件的全部多样性。在使用数据集时应考虑这种潜在分布偏差。
使用建议
建议用户:
- 注意合成到真实的领域差距。
- 如果目标应用是真实世界的照片,请将该数据集与真实世界的阴影去除数据结合使用。
- 在多样化的测试集上评估模型,以了解其泛化能力。
引用
如果在研究中使用此数据集,请引用以下论文: bibtex @inproceedings{xu2024omnisr, title={OmniSR: Shadow Removal under Direct and Indirect Lighting}, author={Xu, Jiamin and Li, Zelong and Zheng, Yuxin and Huang, Chenyu and Gu, Renshu and Xu, Weiwei and Xu, Gang}, booktitle={Proceedings of the AAAI Conference on Artificial Intelligence}, year={2025} }



