five

DESOBAv2|阴影生成数据集|计算机视觉数据集

收藏
github2024-05-12 更新2024-05-31 收录
阴影生成
计算机视觉
下载链接:
https://github.com/bcmi/Object-Shadow-Generation-Dataset-DESOBAv2
下载链接
链接失效反馈
资源简介:
DESOBAv2是一个大规模的真实世界阴影生成数据集,包含28,573个前景对象的物体-阴影对,适用于监督阴影生成方法。该数据集包含21,575张真实图像,共有28,573对物体-阴影,来自户外场景。

DESOBAv2 is a large-scale real-world shadow generation dataset, comprising 28,573 object-shadow pairs of foreground objects, suitable for supervised shadow generation methods. The dataset includes 21,575 real images, totaling 28,573 object-shadow pairs, sourced from outdoor scenes.
创建时间:
2023-08-19
原始信息汇总

数据集概述

数据集名称: DESOBAv2

数据集描述: DESOBAv2是一个大规模的真实世界阴影生成数据集,包含28,573个前景对象的物体-阴影对。该数据集包含21,575张真实图像,这些图像来自户外场景,每个图像包含一个物体及其对应的阴影。数据集中的图像示例展示了复合图像、前景对象掩码、前景阴影掩码、背景对象掩码、背景阴影掩码以及地面实况目标图像。

数据集版本: 数据集提供两个版本,即全分辨率版本和256x256版本。

数据集下载:

  • 全分辨率版本和256x256版本: 可通过Baidu Cloud (访问码: bcmi) 或 One Drive下载。
  • 未使用的阴影图像: 包含22469张图像,可用于扩展DESOBAv2数据集,下载链接为Baidu Cloud (访问码: bcmi) 或 One Drive

数据集使用

数据集安装:

  • 克隆仓库:git clone https://github.com/bcmi/Object-Shadow-Generation-Dataset-DESOBAv2.git
  • 下载并解压数据集至./data/目录。

环境配置:

  • 使用environment.yaml创建并激活环境:conda env create -f environment.yamlconda activate SGDiffusion

训练与推理:

  • 训练:python train_SGDiffusion.py
  • 推理:python infer_SGDiffusion.py
  • 后处理:python post_processing.py
  • 评估:python eval_result.py
AI搜集汇总
数据集介绍
main_image_url
构建方式
DESOBAv2数据集的构建基于大规模真实世界阴影生成需求,精心收集了21,575张真实图像,涵盖28,573对物体与阴影的配对,主要来源于户外场景。该数据集不仅继承了前版DESOBA的特性,还通过精细的图像处理技术,生成了包括复合图像、前景物体掩码、前景阴影掩码、背景物体掩码和背景阴影掩码在内的多层次标注,为监督式阴影生成方法提供了丰富的训练资源。
特点
DESOBAv2数据集的显著特点在于其大规模的真实图像数据和精细的多层次标注,这使得它成为研究阴影生成技术的理想选择。此外,数据集提供了两种分辨率版本,即全分辨率和256x256版本,以适应不同的研究需求。数据集还额外提供了22,469张未使用的阴影图像,为扩展研究提供了可能。
使用方法
使用DESOBAv2数据集进行研究时,用户需先从提供的链接下载数据集,并解压至指定目录。随后,用户可以通过PyTorch实现的环境配置文件创建训练环境,并利用提供的训练、推理、后处理和评估脚本进行模型训练和测试。数据集的多样性和详细标注使得其在图像合成和阴影生成领域的研究中具有广泛的应用潜力。
背景与挑战
背景概述
DESOBAv2数据集是由Qingyang Liu、Junqi You等研究人员于2024年创建,旨在解决复合图像中的阴影生成问题。该数据集是DESOBA数据集的扩展版本,包含了28,573个前景对象及其对应的阴影对,主要用于监督学习方法中的阴影生成任务。DESOBAv2数据集不仅提供了21,575张真实图像,还包含了详细的图像分割信息,如前景对象掩码、前景阴影掩码等,为研究者提供了丰富的数据资源。该数据集的发布对计算机视觉领域,特别是图像合成和阴影生成技术的研究具有重要意义,推动了相关算法的发展。
当前挑战
DESOBAv2数据集在构建过程中面临多项挑战。首先,从真实场景中获取高质量的阴影数据是一项复杂任务,需要精确的图像分割和标注技术。其次,阴影生成在处理复杂形状和大尺寸对象时尤为困难,尽管模型在简单形状的小对象上表现良好,但在复杂场景中仍需多次采样以获得满意结果。此外,数据集的扩展性也是一个挑战,如何有效利用未使用的阴影图像来进一步提升数据集的多样性和覆盖范围,是未来研究的一个重要方向。
常用场景
经典使用场景
DESOBAv2数据集在图像合成领域中具有广泛的应用,尤其在生成复合图像中的阴影部分时表现尤为突出。该数据集包含了28,573个前景对象及其对应的阴影,适用于监督学习方法。通过提供真实图像中的对象与阴影对,DESOBAv2为研究者提供了一个丰富的资源库,用于训练和验证阴影生成算法,特别是在处理复杂形状和大尺寸对象时,能够通过多次采样选择最满意的结果。
解决学术问题
DESOBAv2数据集解决了图像合成领域中阴影生成这一关键问题,尤其是在复杂场景下阴影的精确生成。传统的阴影生成方法往往难以处理复杂形状和大尺寸对象,而DESOBAv2通过提供大规模的真实世界阴影数据,使得研究者能够开发出更为精确和鲁棒的阴影生成算法。这不仅推动了图像合成技术的发展,也为计算机视觉领域的其他相关研究提供了新的思路和方法。
衍生相关工作
基于DESOBAv2数据集,研究者们开发了多种阴影生成算法,如SGDiffusion模型,该模型通过扩散过程生成高质量的阴影,显著提升了阴影生成的精度和效率。此外,DESOBAv2还激发了其他相关研究,如对象与阴影的联合建模、阴影的动态生成等。这些研究不仅丰富了图像合成领域的理论基础,也为实际应用提供了强有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

TM-Senti

TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。

arXiv 收录

jpft/danbooru2023

Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。

hugging_face 收录

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

CHARLS

中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。

charls.pku.edu.cn 收录