M3DLayout

github2025-09-29 更新2025-09-30 收录

下载链接：

https://github.com/Graphic-Kiliani/M3DLayout-A-Multi-Source-Dataset-of-3D-Indoor-Layouts-and-Structured-Descriptions

下载链接

链接失效反馈

官方服务：

资源简介：

M3DLayout是一个用于3D室内布局生成的大规模多源数据集，包含15,080个布局和超过258k个对象实例，整合了真实世界扫描、专业CAD设计和程序生成场景三种来源。每个布局都配有详细的结构化文本描述，包括全局场景摘要、大型家具的关系布局和小型物品的细粒度排列。

M3DLayout is a large-scale multi-source dataset designed for 3D indoor layout generation, containing 15,080 layouts and over 258k object instances, and integrating three source types: real-world scans, professional CAD designs, and procedurally generated scenes. Detailed structured text descriptions are provided for each layout, covering global scene summaries, relational layouts of large furniture, and fine-grained arrangements of small items.

创建时间：

2025-09-28

原始信息汇总

M3DLayout数据集概述

数据集基本信息

数据集名称：M3DLayout: A Multi-Source Dataset of 3D Indoor Layouts and Structured Descriptions for 3D Generation
数据规模：包含15,080个布局和超过258k个对象实例
数据来源：集成三种不同来源的数据
- 真实世界扫描
- 专业CAD设计
- 程序化生成场景

数据集特点

多样性：大规模、多来源的3D室内布局数据集
标注质量：每个布局都配有详细的结构化文本描述
- 全局场景摘要
- 大型家具的关系布局
- 小型物品的细粒度排列

应用价值

为文本驱动的3D场景生成提供中间表示
确保物理合理性的结构蓝图
支持语义可控性和交互式编辑
增强布局生成模型的训练能力

技术贡献

解决现有数据集在规模、多样性和标注质量方面的限制
通过多源组合增强多样性
Inf3DLayout子集提供丰富的小物体信息
支持生成更复杂和详细的场景

当前状态

数据集尚未发布
推理代码待提供
训练指导待提供

引用信息

bibtex @article{zhang2025m3dlayout, author = {Zhang, Yiheng and Cai, Zhuojiang, and Wang, Mingdao, and Guo, Meitong, and Li, Tianxiao, and Lin, Li, and Wang, Yuwang}, journal = {arXiv preprint arXiv:}, year = {2025}, }

搜集汇总

数据集介绍

构建方式

在三维室内布局生成领域，数据质量直接影响模型对空间关系的理解能力。M3DLayout通过融合真实世界扫描、专业CAD设计及程序化生成场景三大数据源，构建出包含15,080个布局与25.8万物体实例的多源数据集。每个布局均配备三层结构化文本描述，分别对应场景全局概览、大型家具关系定位与小型物品细粒度排布，形成语义与几何的精准映射体系。

特点

该数据集最显著的特征在于其多源异构数据的深度融合，既包含真实场景的物理合理性，又涵盖设计图纸的功能性逻辑与程序生成的结构多样性。特别值得注意的是Inf3DLayout子集对小型物体的精细标注，突破了传统数据集对微观布局的表述局限。结构化描述体系通过层级化文本构建了从宏观场景语义到微观物体关系的完整表达链条。

使用方法

研究者可通过加载标准化的数据格式直接获取三维边界框坐标与对应文本描述，建立文本到布局的端到端生成任务。基准测试表明，采用条件扩散模型架构能有效学习数据集中的空间语义关联。数据划分建议遵循原始的多源特性进行跨场景验证，以评估模型在真实扫描、专业设计等不同数据分布下的泛化能力。

背景与挑战

背景概述

三维室内场景生成作为计算机视觉与图形学交叉领域的重要研究方向，其核心在于通过语义信息驱动几何结构的构建。M3DLayout数据集由清华大学、北京航空航天大学等机构的研究团队于2025年联合发布，致力于解决文本驱动三维生成中布局表征的缺失问题。该数据集通过融合真实扫描、专业CAD设计与程序化生成三大数据源，构建了包含1.5万布局方案与25.8万物体实例的多源异构数据库，为三维场景生成模型提供了兼具物理合理性与语义可控性的结构化蓝图，显著推动了具身智能与虚拟现实领域的发展。

当前挑战

在三维布局生成领域，传统方法常受限于空间关系建模的复杂性，包括多物体碰撞检测、物理约束满足及语义一致性维护等核心难题。M3DLayout的构建过程面临三重挑战：其一需协调不同数据源的尺度差异与标注标准，实现跨域数据对齐；其二要攻克细粒度物体关系标注的技术瓶颈，特别是小物体空间关系的精确描述；其三需构建兼顾全局场景语义与局部物体拓扑的多层次文本描述体系，这对标注质量与规模提出了极高要求。

常用场景

经典使用场景

在三维室内场景生成领域，M3DLayout数据集通过整合真实扫描、专业CAD设计与程序化生成场景，构建了包含15,080个布局的多元样本库。其核心应用体现在为文本驱动的三维生成模型提供结构化空间蓝图，模型通过解析全局场景描述、家具关系定位与细粒度物品排列的层次化文本，学习从语言指令到几何布局的映射规律，有效支撑了物理合理性与语义可控性的协同优化。

实际应用

在实际应用层面，M3DLayout为智能家居设计、虚拟现实场景构建提供了技术支撑。基于该数据集训练的布局生成模型可辅助设计师快速生成符合人体工学的室内方案，或为游戏开发、元宇宙场景搭建提供自动化布局工具。其包含的丰富小物体布局信息进一步提升了生成场景的生活真实感与功能完备性。

衍生相关工作

该数据集已催生多项基于扩散模型的文本条件布局生成研究，其中基准实验验证了多源数据对生成复杂度的提升效应。后续工作围绕其结构化描述开发了层次化生成框架，部分研究进一步探索了布局与纹理、光照的联合优化，推动了从二维语义到三维几何的端到端生成技术发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集