3DEditVerse

Name: 3DEditVerse
Creator: 华东理工大学, 新加坡管理大学
Published: 2025-10-03 21:34:55
License: 暂无描述

arXiv2025-10-03 更新2025-11-20 收录

下载链接：

https://hf-mirror.com/datasets/XiaRho/3DEditVerse

下载链接

链接失效反馈

官方服务：

资源简介：

3DEditVerse是一个大规模的3D编辑基准数据集，包含116,309对高质量的训练数据和对1,500对精心挑选的测试数据。该数据集通过姿态驱动的几何编辑和基础模型引导的外观编辑两种互补的流程构建，确保编辑局部性、多视图一致性以及语义对齐。3DEditVerse是首个大规模高保真3D编辑基准数据集，旨在解决现有3D编辑数据集规模小、编辑多样性不足、标注粒度不精细等问题。数据集由两个互补的流程构建：姿态驱动的几何编辑，生成“之前-之后”资产，捕捉动画角色的多样姿态和几何变化；外观驱动的编辑，通过文本指令和一系列基础模型的引导，进行纹理、颜色或细节的修改，同时保持整体几何结构。数据集的创建旨在为训练和评估端到端的3D编辑模型提供可扩展的高质量资源。

3DEditVerse is a large-scale 3D editing benchmark dataset comprising 116,309 high-quality training data pairs and 1,500 carefully curated test data pairs. Constructed via two complementary pipelines—pose-driven geometric editing and foundation model-guided appearance editing—this dataset ensures editing locality, multi-view consistency, and semantic alignment. As the first large-scale high-fidelity 3D editing benchmark dataset, 3DEditVerse aims to mitigate the limitations of prevailing 3D editing datasets, including limited scale, inadequate editing diversity, and coarse annotation granularity. The dataset is built through two complementary workflows: 1) pose-driven geometric editing, which generates "before-after" assets to capture diverse poses and geometric variations of animated characters; 2) appearance-driven editing, which modifies textures, colors, or details under the guidance of text prompts and a suite of foundation models while preserving the overall geometric structure. This dataset is developed to provide scalable, high-quality resources for training and evaluating end-to-end 3D editing models.

提供机构：

华东理工大学, 新加坡管理大学

创建时间：

2025-10-03

搜集汇总

数据集介绍

构建方式

在三维编辑领域面临数据稀缺的背景下，3DEditVerse通过双轨并行构建策略实现了规模化数据采集。其几何编辑流水线基于角色动画组合技术，从108个独立角色中提取4,998种姿态变体，通过DINOv2特征去重确保姿态多样性，最终形成54,000组几何编辑对。外观编辑流水线则构建了基于多模态基础模型的文本-图像-三维升维管道，采用DeepSeek-R1生成多样化文本描述，Flux模型合成源图像与目标图像，Qwen-VL自动生成编辑指令与区域定位，再通过Trellis模型进行三维重建并辅以多视角掩码投影技术，最终形成64,123组外观编辑对。

特点

该数据集在三维编辑基准中展现出显著特性优势。其规模达到116,309组训练对与1,500组精选测试对，覆盖几何结构与外观纹理双重编辑维度。数据质量通过多视角一致性保障机制得以强化，采用SAM2跨帧分割与三维掩码投影技术确保编辑区域的几何一致性。语义对齐特性通过基础模型级联实现，编辑指令与视觉内容保持高度协同。相较于现有基准，该数据集首次同时具备局部编辑标注、跨视角一致性与语义和谐性，为三维编辑模型训练提供了前所未有的完整监督信号。

使用方法

该数据集为三维编辑研究提供了标准化评估框架。研究人员可将数据集划分为训练集与测试集，分别用于模型优化与性能验证。训练阶段可利用配对数据学习局部编辑的几何与纹理映射关系，测试阶段则通过人工精选的1,500组样本进行可靠评估。使用过程中需注意三维掩码的可选性——部分方法依赖掩码进行局部约束，而先进模型如3DEditFormer可直接基于图像引导实现无掩码编辑。评估指标应涵盖Chamfer距离、法向一致性等几何指标与PSNR、LPIPS等感知指标，全面衡量编辑质量与结构保真度。

背景与挑战

背景概述

三维编辑作为计算机视觉与图形学交叉领域的关键技术，在沉浸式内容创作与数字娱乐应用中具有重要价值。2025年华东理工大学与新加坡管理大学联合发布的3DEditVerse数据集，通过构建11.6万组高质量三维资产编辑对，首次系统性地解决了该领域缺乏大规模标注数据的瓶颈。该数据集依托姿态驱动几何编辑与基础模型引导的外观编辑双管道，为三维局部编辑研究提供了兼具多视角一致性与语义对齐特性的基准平台，显著推动了可控三维内容生成技术的发展。

当前挑战

三维编辑领域长期面临跨视角几何一致性维护与结构保真度的核心难题。现有方法普遍存在编辑效率低下、依赖人工三维掩码、易产生结构失真等局限。在数据集构建过程中，需克服三维资产语义对齐、多视角投影一致性、编辑区域精准定位等技术挑战。3DEditVerse通过融合多阶段特征提取与掩码引导修复策略，在保持未编辑区域结构完整性的同时，实现了对纹理与几何属性的精准可控编辑。

常用场景

经典使用场景

在三维内容创作领域，3DEditVerse数据集为局部编辑任务提供了标准化基准。该数据集通过姿态驱动的几何编辑和基础模型引导的外观编辑两种互补流程，构建了11.6万组高质量训练对和1500组精选测试对，确保了编辑的局部性、多视图一致性和语义对齐。研究人员可利用该数据集训练模型学习如何对三维资产的几何结构或外观进行局部修改，同时保持未编辑区域的结构完整性。

解决学术问题

该数据集有效解决了三维编辑领域长期存在的关键学术问题。针对传统方法存在的跨视图不一致性、结构保真度不足和细粒度控制困难等挑战，3DEditVerse通过大规模配对数据提供了监督学习的坚实基础。其精心设计的编辑管道消除了对人工三维掩码的依赖，显著提升了编辑精度和一致性，为开发无需辅助掩码的精确三维编辑算法奠定了数据基础。

衍生相关工作

该数据集催生了一系列创新性研究工作，其中最具代表性的是3DEditFormer架构。这一基于条件变换器的三维结构保持模型通过双引导注意力和时间自适应门控机制，实现了可编辑区域与保留结构的有效解耦。相关研究还拓展到多视图一致性编辑、潜在空间优化等方向，推动了无需三维掩码的端到端编辑方法的发展，为三维编辑领域建立了新的技术标准。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集