Synthetic Building Dataset|建筑数据集|深度学习数据集
收藏数据集概述
数据集生成工具
- 功能: 生成不同类型建筑的合成数据集。
- 作者: Stanislava Fedorova, Alberto Tono, Meher Shashwat Nigam, Jiayao Zhang, Amirhossein Ahmadnia, Cecilia Bolognesi, Dominik L. Michels。
数据内容
- Mesh文件: 生成建筑的网格文件,格式为
.obj
。 - 渲染图像: 网格的渲染图像,格式为
.png
。 - 渲染分割掩码: 分割掩码图像,格式为
.png
。 - 深度标注: 深度图像,格式为
.png
和.exr
。 - 表面法线标注: 表面法线图像,格式为
.png
。 - 点云文件: 点云数据,格式为
.ply
,默认点数为2048。
数据集参数配置
- 配置文件:
dataset_config.py
- 默认参数:
- 最小高度: 3m
- 最小长度和宽度: 6m
- 最大长度、宽度、高度: 30m
- 其他配置:
- 数据集样本数量
- 建筑类型
- 组件材料
- 渲染图像尺寸
- 点云中的点数
- 数据存储路径
- 是否保存
.exr
文件
使用方法
- 安装: 需要安装Blender>=2.90,并设置环境变量。
- 运行: 使用
run.bat
或blender setup.blend --python dataset.py
命令。
性能
- 测试环境: Windows 10, AMD Ryzen 7 3800-X 8-Core Processor, GeForce GTX 1080。
- 测试结果: 生成100个模型样本,多视角生成(每模型3视角)的时间为0.34至2.7小时。
引用格式
@inproceedings{fedorova2021synthetic, title={Synthetic 3D Data Generation Pipeline for Geometric Deep Learning in Architecture}, author={Stanislava Fedorova and Alberto Tono and Meher Shashwat Nigam and Jiayao Zhang and Amirhossein Ahmadnia and Cecilia Bolognesi and Dominik L. Michels}, year={2021}, }

猫狗图像数据集
该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。
github 收录
2017-2020年内蒙古当地杂豆的原料特性及生物活性物质分析数据集
参照国标对内蒙古当地的豌豆、赤小豆、绿豆、红芸豆及扁豆等五种杂豆的原料特性和生物活性物质含量进行测定,并进行对比分析。
国家农业科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录