gradient-spaces/SSR-3DFRONT

Name: gradient-spaces/SSR-3DFRONT
Creator: gradient-spaces
Published: 2026-05-08 18:43:36
License: 暂无描述

Hugging Face2026-05-08 更新2025-08-09 收录

下载链接：

https://hf-mirror.com/datasets/gradient-spaces/SSR-3DFRONT

下载链接

链接失效反馈

官方服务：

资源简介：

SSR-3DFRONT数据集是一个为文本驱动的3D室内场景合成和编辑提供结构化场景表示的数据集。它包含13055个有效的室内场景，每个场景都有明确的房间边界、通过GPT-4o生成的自然语言对象描述、全面的对象元数据（包括位置、大小和方向），以及用于训练机器学习模型的训练/验证/测试数据集划分。

The SSR-3DFRONT dataset provides structured scene representations for text-driven 3D indoor scene synthesis and editing. It contains 13,055 valid indoor scenes with explicit room boundaries, natural language object descriptions via GPT-4o, comprehensive object metadata including position, size, and orientation, and train/val/test splits for training machine learning models.

提供机构：

gradient-spaces

搜集汇总

数据集介绍

构建方式

SSR-3DFRONT数据集是在原始3D-FRONT数据集的基础上，经过多阶段精细化处理而构建的。首先，对原始场景进行严格的质量与有效性筛选，剔除不符合标准的样本。随后，从合格的室内场景中提取出以直线多边形表达的显式房间边界。利用GPT-4o大语言模型为每个家具实例自动生成自然的语言描述，从而赋予场景丰富的语义信息。最终，通过精心设计的场景分布策略划分训练、验证与测试集，并应用旋转变换、扰动及边界偏移等数据增强手段，得到包含约1.3万有效室内场景的结构化表示。

特点

该数据集的核心特点在于其高度结构化与语义化的场景表示。每个样本不仅包含房间类型、物体数量等基础元数据，更将室内场景编码为显式的房间多边形边界与对象实例的详尽属性。每个家具对象均附有自然语言描述、精确的空间位置（三维坐标）、尺寸（宽高深）以及四元数旋转信息，并关联至3D-FUTURE资产库的参考标识。这种结构化范式使得模型能够同时理解场景的几何布局与语义内容，为文本驱动的三维场景生成、编辑与空间推理任务提供了坚实的数据基础。

使用方法

研究者可通过HuggingFace Datasets库便捷加载该数据集，使用load_dataset函数即可获取预划分的训练、验证与测试分片。数据集支持按房间类型（卧室、客厅或全部）进行过滤，便于针对特定场景类型进行模型训练。对于需要原始文件的场景，数据集也提供了直接下载压缩包的方案。每个场景以JSON格式存储，结构中包含房间边界坐标与对象列表，使用者可轻松遍历对象属性并提取描述文本、位置、尺寸等关键信息，从而适配各类三维场景合成与理解算法的输入需求。

背景与挑战

背景概述

SSR-3DFRONT数据集由Martin J.J. Bucher与Iro Armeni于2025年创建，源自阿里巴巴发布的3D-FRONT数据集，旨在推动文本驱动的三维室内场景合成与编辑研究。作为一个包含13,055个有效室内场景的结构化表示数据集，它通过显式房间边界、GPT-4o生成的自然语言描述以及详尽的物体元数据，为计算机图形学与机器人领域提供了高质训练资源。该数据集建立在3D-FUTURE模型目录基础上，其代表性工作ReSpace通过偏好对齐技术实现了场景的灵活编辑，显著提升了三维场景理解与生成的精准度，对智能家居、虚拟现实等应用具有重要影响。

当前挑战

该数据集主要解决两大挑战：其一，领域问题层面，室内场景合成面临从文本描述到三维布局的歧义映射难题，现有方法难以同时保证空间合理性、物体语义一致性及用户编辑意图的忠实表达；SSR-3DFRONT通过结构化表示与自然语言标注，为模型提供了显式几何约束与语义先验。其二，构建过程中需处理原始3D-FRONT数据的异构性，包括场景有效性筛选、房间边界多边形化、以及利用GPT-4o生成多样化且无偏见的物体描述，同时通过旋转、扰动等数据增强手段提升泛化性，确保训练集与验证集的分布均衡。

常用场景

经典使用场景

在室内三维场景理解与生成的研究领域中，SSR-3DFRONT数据集为学术界提供了一个结构化的室内场景表示基准。该数据集最经典的用途在于支持基于自然语言描述驱动的三维场景合成与编辑任务，研究者能够利用其中超过一万三千个经过精心筛选的室内场景，结合明确的房间边界多边形与物体元数据，训练模型实现从文本到三维布局的映射。无论是生成全新的卧室或客厅布局，还是对已有场景进行局部修改，该数据集都能作为核心训练与评估资源。其结构化的数据格式——包含物体位置、尺寸、朝向以及语义描述——使得场景理解模型能够学习到空间关系与物体搭配的深层规律，成为三维视觉与计算机图形学交叉领域研究的重要基石。

衍生相关工作

自SSR-3DFRONT数据集发布以来，其衍生出的相关工作主要集中在对原始3D-FRONT数据进行增强与扩展的方向。代表性工作如ReSpace框架，该工作巧妙地利用了该数据集的结构化场景表示与自然语言描述，实现了文本驱动的三维场景合成与编辑，并通过偏好对齐算法提升了生成场景的用户满意度。此外，研究者基于该数据集探索了空间关系推理模型，学习家具之间的几何约束（如床与床头柜的相邻关系）。同时，数据集中明确的房间边界多边形催生了关于不规则房间形状适应性的工作，推动了方法从矩形房间向真实复杂户型泛化的研究。这些衍生工作共同构成了一个以SSR-3DFRONT为核心的学术生态，持续推动室内场景生成领域的技术边界。

数据集最近研究