DESOBAv2|阴影生成数据集|计算机视觉数据集
收藏数据集概述
数据集名称: DESOBAv2
数据集描述: DESOBAv2是一个大规模的真实世界阴影生成数据集,包含28,573个前景对象的物体-阴影对。该数据集包含21,575张真实图像,这些图像来自户外场景,每个图像包含一个物体及其对应的阴影。数据集中的图像示例展示了复合图像、前景对象掩码、前景阴影掩码、背景对象掩码、背景阴影掩码以及地面实况目标图像。
数据集版本: 数据集提供两个版本,即全分辨率版本和256x256版本。
数据集下载:
- 全分辨率版本和256x256版本: 可通过Baidu Cloud (访问码: bcmi) 或 One Drive下载。
- 未使用的阴影图像: 包含22469张图像,可用于扩展DESOBAv2数据集,下载链接为Baidu Cloud (访问码: bcmi) 或 One Drive。
数据集使用
数据集安装:
- 克隆仓库:
git clone https://github.com/bcmi/Object-Shadow-Generation-Dataset-DESOBAv2.git
- 下载并解压数据集至
./data/
目录。
环境配置:
- 使用
environment.yaml
创建并激活环境:conda env create -f environment.yaml
和conda activate SGDiffusion
训练与推理:
- 训练:
python train_SGDiffusion.py
- 推理:
python infer_SGDiffusion.py
- 后处理:
python post_processing.py
- 评估:
python eval_result.py

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
TM-Senti
TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。
arXiv 收录
jpft/danbooru2023
Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。
hugging_face 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录