HorizonRobotics/ARSG-110K
收藏Hugging Face2026-04-08 更新2026-04-05 收录
下载链接:
https://hf-mirror.com/datasets/HorizonRobotics/ARSG-110K
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- image-to-3d
tags:
- 3d
- scene-generation
- cvpr
---
# ARSG-110K
[**Project Page**](https://zx-yin.github.io/3dfixer/) | [**Paper**](https://huggingface.co/papers/2604.04406) | [**GitHub**](https://github.com/HorizonRobotics/3D-Fixer)
ARSG-110K is a large-scale scene-level dataset comprising over 110K diverse scenes and 3M annotated images with high-fidelity 3D ground truth. It is designed to support the training and evaluation of compositional 3D scene generation and in-place completion models. The dataset provides accurate 3D object-level ground-truth, layout, and annotations.
This dataset was introduced as part of the paper: **3D-Fixer: Coarse-to-Fine In-place Completion for 3D Scenes from a Single Image**.
## Dataset Details
- **Source Data**: The `Objaverse_github.csv` and `ObjaverseXL_sketchfab.csv` are subsets of those from [TRELLIS-500K](https://github.com/microsoft/TRELLIS?tab=readme-ov-file#-dataset).
- **Assets**: The `hdrs.zip`, `materials_floor.zip`, and `materials_wall.zip` contain assets from [BlenderKit](https://www.blenderkit.com/).
- **Examples**: This repository provides renderings of 1000 example scenes.
## Accessing the Data
Please follow the [detailed instructions](https://github.com/HorizonRobotics/3D-Fixer/blob/main/DATASET.md) on the official GitHub repository to access the full dataset beyond the example renderings.
## Citation
```bibtex
@inproceedings{yin2026tdfixer,
title={3D-Fixer: Coarse-to-Fine In-place Completion for 3D Scenes from a Single Image},
author={Yin, Ze-Xin and Liu, Liu and Wang, Xinjie and Sui, Wei and Su, Zhizhong and Yang, Jian and Xie, jin},
booktitle={Proceedings of the Computer Vision and Pattern Recognition Conference},
year={2026}
}
```
提供机构:
HorizonRobotics
搜集汇总
数据集介绍

构建方式
在三维场景生成领域,数据集的构建质量直接关系到模型的训练效果。ARSG-110K数据集通过整合来自TRELLIS-500K的子集,包括Objaverse_github.csv与ObjaverseXL_sketchfab.csv,确保了三维对象数据的多样性与丰富性。同时,数据集引入了BlenderKit的高动态范围图像、地板与墙面材质资产,通过精心设计的渲染流程,生成了超过11万个多样化场景及300万张带有高保真三维真值标注的图像,为场景级三维生成任务提供了坚实的基准。
特点
该数据集的核心特征在于其规模与标注精度。作为大规模场景级数据集,ARSG-110K涵盖了广泛的场景多样性,每个场景均配备了精确的三维对象级真值、布局信息及详细注释。其高保真的三维地面真值支持对组合式三维场景生成与原位补全模型进行训练与评估,为计算机视觉研究提供了可靠的数据支撑。数据集还附带1000个示例场景的渲染图像,便于用户直观理解数据内容。
使用方法
使用ARSG-110K数据集时,研究人员需遵循官方GitHub仓库提供的详细访问指南,以获取完整的场景数据与资产。数据集适用于训练和评估基于单张图像的三维场景生成与补全模型,用户可结合其提供的三维真值标注进行模型训练、验证与性能分析。通过利用数据集中的对象级标注与布局信息,能够推动三维场景理解与生成技术的进一步发展。
背景与挑战
背景概述
在三维视觉与场景生成领域,高质量、大规模的数据集是推动算法进步的关键基石。ARSG-110K数据集由Horizon Robotics等机构的研究团队于2026年提出,并作为CVPR会议论文《3D-Fixer: Coarse-to-Fine In-place Completion for 3D Scenes from a Single Image》的核心组成部分。该数据集旨在应对从单张图像进行三维场景组合生成与原位补全这一前沿研究问题,其包含超过11万个多样化场景及300万张带高保真三维真值标注的图像,为模型训练与评估提供了丰富的三维物体级真值、布局及注释信息。ARSG-110K的构建整合了TRELLIS-500K等现有资源,显著提升了三维场景生成任务的基准水平,对计算机视觉与图形学交叉领域的发展产生了深远影响。
当前挑战
ARSG-110K数据集所针对的核心研究挑战在于从单张图像实现高质量、结构合理的三维场景组合生成与精细补全。这一任务要求模型不仅能够推断场景中物体的三维几何与姿态,还需理解物体间的空间布局与语义关系,对算法的泛化能力与 compositional reasoning 提出了极高要求。在数据集构建过程中,研究人员面临多重挑战:首先,需从海量三维资产中筛选并组合出多样化且物理合理的场景,确保数据分布的广泛性与真实性;其次,生成高保真三维真值标注涉及复杂的渲染与对齐流程,对计算资源与标注精度构成严峻考验;此外,整合来自不同来源的资产(如Objaverse与BlenderKit)并保持数据格式与质量的一致性,亦是一项繁琐而关键的工作。
常用场景
经典使用场景
在计算机视觉与三维场景生成领域,ARSG-110K数据集以其超过11万个多样化场景和300万张带高保真三维真值标注的图像,为场景级三维生成与补全任务提供了坚实的基准。该数据集常用于训练和评估基于单张图像的场景生成模型,支持从粗粒度到细粒度的三维场景重建与编辑,为研究场景布局、物体组合及光照材质等复杂视觉属性提供了丰富的数据支撑。
实际应用
在实际应用中,ARSG-110K数据集为虚拟现实、游戏开发、室内设计及机器人导航等领域提供了关键的数据资源。基于该数据集训练的模型能够实现快速的三维场景重建与编辑,辅助设计师生成逼真的室内外环境,提升虚拟场景的自动化构建效率,同时为机器人感知与路径规划提供高质量的三维环境模拟。
衍生相关工作
围绕ARSG-110K数据集,衍生出多项经典研究工作,其中以原论文提出的3D-Fixer模型为代表,该模型采用从粗到细的补全策略,实现了基于单图像的三维场景原位补全。此外,该数据集也激发了后续在场景生成、布局优化及多模态三维重建方面的探索,为计算机视觉与图形学交叉领域的研究提供了重要的数据驱动基础。
以上内容由遇见数据集搜集并总结生成



