ZAHA|3D建模数据集|语义分割数据集
收藏ZAHA 数据集概述
数据集简介
- 名称: ZAHA
- 类型: 点云数据集
- 用途: 立面语义分割
- 规模: 包含 601 百万个标注点
- 特点:
- 引入 LoFG(Level of Facade Generalization),支持立面的层次化理解
- 包含多种建筑风格
- 提供本地和全球(UTM)坐标参考系统
- 文件名指向巴伐利亚官方 CityGML LoD2 建筑模型
数据下载
- 下载链接: 下载地址
- 密码: zahahadid
数据集亮点
- 601 百万标注点
- 引入 LoFG:Level of Facade Generalization,支持立面的层次化理解
- 多种建筑风格
- 本地和全球(UTM)坐标参考系统
- 文件名指向官方 CityGML LoD2 建筑模型
立面语义分割结果
LoFG3 结果
模型 | OA | P | R | F1 | IoU |
---|---|---|---|---|---|
PointNet | 59.9 | 46.1 | 42.2 | 38.7 | 26.4 |
PointNet++ | 66.4 | 37.8 | 35.9 | 34.8 | 25.6 |
Point Transformer | 75.0 | 52.7 | 54.7 | 52.1 | 41.6 |
DGCNN | 71.1 | 53.6 | 45.8 | 44.5 | 33.4 |
LoFG2 结果
模型 | OA | P | R | F1 | IoU |
---|---|---|---|---|---|
PointNet | 71.9 | 69.6 | 68.1 | 68.1 | 55.8 |
PointNet++ | 75.5 | 73.0 | 73.0 | 72.6 | 59.8 |
Point Transformer | 78.2 | 75.8 | 76.6 | 76.1 | 63.9 |
DGCNN | 82.6 | 80.0 | 81.8 | 80.4 | 68.5 |
引用
plain @article{wysockietalZAHA, author = {Wysocki, O. and Tan, Y. and Froech, T. and Xia, Y. and Wysocki, M. and Hoegner, L. and Cremers, D. and Holst Ch.}, title = {ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset}, booktitle = {Proceedings of the IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)}, year = {2025}, }
plain @misc{wysocki2024zahaintroducinglevelfacade, title={ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset}, author={Olaf Wysocki and Yue Tan and Thomas Froech and Yan Xia and Magdalena Wysocki and Ludwig Hoegner and Daniel Cremers and Christoph Holst}, year={2024}, eprint={2411.04865}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2411.04865}, }

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
大学生运动和体质健康数据集(2014-2023)
《大学生运动与体质健康数据集(2014-2023)》涵盖了大学生群体在运动能力、基础身体形态、身体机能及身体素质等多个方面的关键基础数据。该数据集的采集时间跨度为2014年至2023年,样本采集自全国34个省级行政区域,共计123281名大学生参与,平均年龄为20.53岁。建立大学生运动和体质健康数据集可以准确把握学生体质健康的整体水平和变化趋势,了解大学生运动和体质健康状况,对指导个性化健康干预、优化体育教育资源配置、支持促进科学研究以及提高公众健康意识等均具有重要意义。
国家人口健康科学数据中心 收录
DeepPCB
DeepPCB是由上海交通大学图像处理与模式识别研究所创建的首个公开PCB缺陷检测数据集,包含1,500对标注了6种常见PCB缺陷位置的图像。数据集通过模板匹配技术确保图像对齐,减少预处理工作量。每对图像包括一个640x640像素的无缺陷模板和一个有缺陷的测试图像。数据集旨在解决PCB制造中的自动缺陷检测问题,提高检测效率和准确性。
arXiv 收录