five

InternScenes

收藏
github2025-07-24 更新2025-07-25 收录
下载链接:
https://github.com/InternRobotics/InternScenes
下载链接
链接失效反馈
官方服务:
资源简介:
InternScenes包含约40,000个多样化的场景和1.96M个3D对象,覆盖15种常见场景类型和288个对象类别,规模大约是现有数据集的10倍。该数据集特别保留了小物品以保持复杂布局的真实性,解决了对象碰撞问题,并进一步整合了交互式对象,确保了大尺度、真实布局和交互性。

InternScenes contains approximately 40,000 diverse scenes and 1.96 million 3D objects, covering 15 common scene types and 288 object categories, with a scale roughly 10 times that of existing datasets. This dataset specifically retains small objects to maintain the realism of complex layouts, addresses the problem of object collisions, and further integrates interactive objects, ensuring large-scale coverage, realistic scene layouts, and interactivity.
创建时间:
2025-07-24
原始信息汇总

InternScenes: 大规模交互式室内场景数据集

数据集概述

  • 名称: InternScenes
  • 类型: 3D室内场景数据集
  • 规模: 约40,000个多样化场景,包含1.96M个3D对象
  • 场景类型: 15种常见场景类型
  • 对象类别: 288个对象类别
  • 特点: 提供真实布局和交互式对象

数据集亮点

  1. 大规模:

    • 包含40,000个多样化场景
    • 1.96M个3D对象
    • 覆盖288个对象类别
  2. 真实布局:

    • 保留大量小对象
    • 严格对齐真实世界扫描场景
  3. 交互性:

    • 20%的对象具有交互功能
    • 覆盖16种常见类型(如橱柜、微波炉、烤箱、冰箱等)

适用任务

  • 3D场景重建
  • 3D场景理解
  • 场景布局生成
  • 具身导航

数据内容

  1. 资源库:

    • Objaverse资源库
    • HSSD资源库
    • 3D-FUTURE资源库
    • GRScenes-100资源库
    • PartNet-Mobility资源库
    • 生成资源库
  2. 布局信息:

    • 场景的3D网格(地板和墙壁)
    • 场景布局的JSON文件

数据格式

  • 布局JSON示例: json [ { "id": 1, "category": "chair", "model_uid": "partnet_mobility/39551", "bbox": [ 1.041122286614026, -1.2630096162069782, 0.37856578639578786, 0.42791932981359787, 0.4573552539873118, 0.7564487395312743, 1.384006110201953, 0.0, -0.0 ] }, ... ]

使用工具

  • 提供便捷高效的场景渲染脚本
  • 详细的对象语义信息
  • 统一的场景布局格式和坐标系
  • 多种具身导航轨迹

许可证

  • 类型: Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License
  • 链接: http://creativecommons.org/licenses/by-nc-sa/4.0/

引用

BibTex @inproceedings{InternScenes, title={InternScenes: A Large-scale Interactive Indoor Scene Dataset with Realistic Layouts}, author={Zhong, Weipeng and Cao, Peizhou and Jin, Yichen and Li, Luo and Cai, Wenzhe and Lin, Jingli and Lyu, Zhaoyang and Wang, Tai and Dai, Bo and Xu, Xudong and Pang, Jiangmiao}, year={2025}, booktitle={arXiv}, }

搜集汇总
数据集介绍
main_image_url
构建方式
InternScenes数据集的构建依托于多源高质量3D资产库的整合与优化,通过融合Objaverse、HSSD、3D-FUTURE等六个权威资源库的模型资产,构建了包含1.96M个三维物体的庞大规模。研究团队采用九自由度边界框标注技术处理小物体布局,运用碰撞检测算法消除模型干涉,并特别保留20%具有物理交互功能的物体模型,最终形成覆盖288个物体类别的标准化场景数据集。
特点
该数据集以超大规模和真实细节著称,包含40,000个多样化室内场景,其场景复杂度达到现有基准的十倍。独特之处在于严格保持现实扫描场景的空间布局特征,完整保留门把手、开关等微型物体,同时集成可开启橱柜、可操作家电等16类交互元素。所有场景采用统一坐标系和结构化JSON格式存储,配套提供场景渲染脚本与导航轨迹数据,支持多模态三维任务需求。
使用方法
使用者需通过GitHub仓库获取数据集,配置Python3.10环境后安装Isaac-Sim等渲染工具链。数据集按场景类型分层存储,每个场景包含结构网格、布局描述文件及资产索引。研究人员可通过解析layout.json文件获取物体位姿信息,调用预置脚本实现场景可视化,或结合Isaac-Sim引擎进行物理仿真。该数据集特别适用于三维场景重建、具身导航等任务的基准测试与算法验证。
背景与挑战
背景概述
InternScenes作为大规模交互式室内场景数据集,由研究团队于2025年推出,旨在解决三维场景理解与重建领域的核心问题。该数据集包含约4万种多样化场景和196万三维物体,覆盖15种常见场景类型及288种物体类别,规模达到同类数据集的10倍。其创新性在于整合多源高精度三维资产库,严格保持真实扫描场景的布局特性,并引入20%可交互物体,为三维场景重建、场景布局生成等任务提供了前所未有的数据支持。数据集通过保留细碎物品、解决物体碰撞等问题,显著提升了室内场景建模的真实性与可用性。
当前挑战
构建InternScenes面临双重挑战:在领域层面,现有三维场景数据集普遍存在多样性不足、布局过度简化及物体碰撞等问题,难以支撑复杂场景的精确建模;在技术层面,数据集构建需整合来自Objaverse、PartNet-Mobility等异构三维资产库,统一坐标系统与文件格式,同时确保细碎物品布局的真实性。此外,20%交互物体的物理属性标注与功能验证,以及超大规模场景数据的存储与高效检索机制,均为工程实现中的关键技术瓶颈。
常用场景
经典使用场景
在三维场景理解与重建领域,InternScenes数据集凭借其大规模多样化的室内场景布局,成为研究复杂环境建模的理想选择。该数据集通过融合15种常见场景类型和288种物体类别,为算法提供了丰富的空间结构信息,特别适合用于训练需要高精度环境感知的深度学习模型。其保留小型物品的细致布局特性,使研究者能够探索真实世界中的微观空间关系。
实际应用
在智能家居和虚拟现实领域,InternScenes的交互式物体标注可直接应用于服务机器人操作系统的开发。包含16类可操作物体的精细标注,如橱柜、微波炉等常见家电,为家庭助理机器人提供了真实的训练环境。建筑行业可利用其标准化场景布局进行空间规划算法验证,而游戏开发者则能基于高质量三维资产快速构建虚拟场景。
衍生相关工作
该数据集已催生多个计算机视觉前沿方向的研究,包括基于神经辐射场的场景重建新方法、结合物理规律的布局生成算法改进等。其数据格式兼容性促进了与Objaverse、PartNet-Mobility等知名数据集的联合使用,在2025年发布的Real2Sim版本中,进一步推动了虚拟到现实迁移学习领域的技术突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作