IndoorCAD

Hugging Face2026-05-07 更新2026-05-08 收录

下载链接：

https://huggingface.co/datasets/anon-neurips-2026/IndoorCAD

下载链接

链接失效反馈

官方服务：

资源简介：

IndoorCAD 数据集是一个包含家具和场景模型的综合数据集，主要用于计算机辅助设计（CAD）和三维建模相关任务。数据集分为两部分：家具数据和场景数据。家具数据部分包含4400多个家具模型，每个模型提供STEP格式的CAD模型、B-rep信息、网格模型、32角度多视角图片以及由qwenVLM生成的文本描述和对齐标签。场景数据部分包含4500多个场景模型，包括STEP格式的CAD模型和不同视角的图片。数据集还提供了样本数据以便预览。该数据集适用于CAD模型生成、三维重建、多模态学习等研究领域。

创建时间：

2026-05-06

原始信息汇总

数据集概述

数据集名称

IndoorCAD，基于 MIT 许可证发布。

数据集构成

数据集包含两大部分：

Furniture_Data（家具数据）
- 包含 4400+ 个家具模型
- 每件家具提供以下信息：
  - CAD 模型（.STEP 格式）
  - B-rep 信息（.x_t 格式）
  - 网格模型（.stl 格式）
  - 32 角度多视图图片（.png 格式）
  - 由 qwenVLM 生成的文本描述
  - 对齐标签信息
- 数据目录结构：
  - Dataset_processed：约 4500 个处理后的数据
  - Dataset_Categoried：分类后的数据
Scene_Data（场景数据）
- 包含 4500+ 个场景模型
- 每场景提供：
  - CAD 模型（.STEP 格式）
  - 不同视角的图片
  - 布局文件（.json）
  - 相机位置与规格信息

数据格式与结构

家具数据目录结构：

Furniture_Data ├── MODEL_NAME │ ├── MODEL_NAME_brep.json # B-rep 信息 │ ├── MODEL_NAME.step # CAD STEP 模型 │ ├── MODEL_NAME.stl # 网格模型 │ ├── multiview_picture │ │ ├── transforms.json # 位置与参数 │ │ ├── view_000.png │ │ ├── view_001.png │ │ └── ... │ ├── description.txt # 文本描述 │ └── alignment_meta.json # 对齐信息 ├── ... └── cad_assets_index.json # 索引文件

场景数据目录结构：

Scene_Data ├── Layout │ └── scene_name.json # 布局文件 ├── Scene │ └── scene_name.step # 场景模型 └── Render └── scene_name ├── photo1.png ├── ... └── camera.json # 相机位置与规格

示例数据

数据集在 ./Sample/ 目录下提供了小样本数据，方便用户下载与预览。

搜集汇总

数据集介绍

构建方式

IndoorCAD数据集由家具和场景两大核心模块构成。在家具部分，数据集收录了超过4400件家具模型，每件模型均以STEP格式的CAD实体模型为基底，同步提供B-rep边界表示信息（存储为JSON文件）、STL网格模型以及32个视角的多视图图像。文本描述由QwenVLM模型自动生成，并附有对齐标签。场景部分则包含4500余个场景模型，采用STEP格式保存，同时提供不同视角的渲染图像。数据集还提供了小规模样本，便于用户快速下载与预览，整体结构清晰，索引文件辅助高效检索。

特点

IndoorCAD数据集兼具多模态融合与精细结构的显著特点。每种家具模型同时具备边界表示（B-rep）与网格表示（mesh），为几何推理与形状分析提供了双重支持。多视图图像（16至32视角）与文本描述的结合，使得视觉语言对齐成为可能。场景数据则进一步丰富了数据的上下文，包含布局文件、场景CAD模型及相机参数，支撑从单体到场景的跨越式研究。此外，简单的目录结构使得数据快速上手，无需繁复配置，便于下游任务应用。

使用方法

本数据集可以通过HuggingFace页面直接下载，采用MIT开源协议，授权灵活。用户可根据任务需求选择家具子集或场景子集进行解析：对于家具数据，可读取STEP模型进行CAD处理，或加载STL网格进行几何学习，同时利用多视图图像与描述文本开展多模态训练，对齐标签可用于监督学习。场景数据则支持布局提取、场景重建与渲染研究。起步阶段建议从Sample文件夹入手，快速熟悉数据格式与目录布局，再依据索引文件（cad_assets_index.json）按需加载完整数据集。

背景与挑战

背景概述

三维计算机视觉与几何建模领域长期受限于高质量CAD数据的匮乏，尤其是家具和室内场景的精细结构数据。IndoorCAD数据集由研究团队于近期创建，旨在为室内场景理解与家具建模提供多模态数据支撑。该数据集包含4400余件家具模型和4500余个场景模型，每种家具均提供STEP格式的CAD模型、B-rep边界表示、STL网格模型、32视角多视图图像、大模型生成的文本描述及对齐标签。场景部分则涵盖完整的布局与渲染数据。IndoorCAD通过统一且结构化的格式，显著降低了多模态数据获取的门槛，为自动化布局、场景重建、跨模态检索等任务提供了宝贵的基准资源。

当前挑战

IndoorCAD数据集所解决的核心挑战包括：其一，领域内长期缺乏同时具备CAD原始几何表达（如B-rep、STEP）与视觉外观数据（多视角图像）的大规模家具数据集，限制了形状理解与渲染一致性研究；其二，家具与场景的语义对齐任务因缺乏精准的空间关系与材质分类标签而进展缓慢。在构建过程中，挑战体现在多源数据格式的整合转换（如STEP网格到STL的无损处理）、利用大模型（如qwenVLM）自动生成高质量文本描述时需平衡语义精确性与多样性，以及确保跨视角图像与三维模型在几何上严格对齐的流水线设计。

常用场景

经典使用场景

IndoorCAD数据集在计算机图形学与三维视觉领域扮演着基石性角色，尤其为室内场景理解与家具建模研究提供了系统化资源。该数据集囊括4400余件家具模型，每一件均配备STEP格式的CAD模型、边界表示（B-rep）信息、网格模型及32视角多视图图像，加之由大语言模型生成的文本描述和对齐标注，构建起从几何到语义的完备数据链路。研究者可基于此开展家具细粒度分类、部件分割、形状检索等经典任务，亦可借助场景数据中的4500余个室内布局，探索空间关系推理与场景合成问题。其全面的格式覆盖使得从传统几何分析到现代多模态学习的各类方法均能在此找到适配的基准测试环境。

实际应用

在实际应用层面，IndoorCAD数据集赋能了一系列与室内设计、智能制造和增强现实密切相关的技术系统。家具制造商可借助其中的CAD模型与对齐标注，训练自动化零件识别与装配验证算法，实现从设计到生产的数字化闭环。室内设计师能够利用场景布局数据与多视角渲染结果，开发智能空间规划工具，快速生成符合人体工学的家具陈设方案。此外，该数据集所包含的文本描述为智能家居中的语音控制指令理解提供了训练素材，使得人机交互系统能更精准地将自然语言查询映射到具体三维对象，提升虚拟家居助手与AR引导应用的实用性与用户体验。

衍生相关工作

围绕IndoorCAD数据集已涌现出一系列值得关注的衍生研究工作。在几何深度学习领域，部分工作利用其B-rep信息探索图神经网络在实体特征提取中的应用，推动了基于边界表示的形状分析新范式。在多模态学习方向，学者们借助家具模型的图文配对数据，发展出面向三维对象的视觉-语言预训练策略，有效提升了跨模态检索与描述生成的性能。场景层面的布局与CAD模型组合，则催生了关于结构化场景图构建与可编辑场景合成的研究，这些工作往往将IndoorCAD作为训练或评估基准。此外，还有研究者针对该数据集提出弱监督对齐方法，将稀疏的标注信息转化为密集的几何语义映射，拓展了CAD数据在真实场景理解中的泛化能力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集