T23D-CompBench

Name: T23D-CompBench
Creator: 上海交通大学, 美国密苏里大学堪萨斯城分校
Published: 2025-09-28 20:30:47
License: 暂无描述

arXiv2025-09-28 更新2025-10-01 收录

下载链接：

http://arxiv.org/abs/2509.23841v1

下载链接

链接失效反馈

官方服务：

资源简介：

T23D-CompBench是一个用于细粒度评估T23D生成的综合基准。它定义了五个组成部分和十二个子组成部分，用于生成3600个纹理网格，并收集了129,600个可靠的人类评分。数据集的创建过程包括定义组成部分、生成代表性提示、使用T23D生成模型生成3D资产、进行大规模主观研究和进行深入分析。数据集的应用领域是T23D生成质量评估，旨在解决现有评估指标无法处理生成失真、缺乏细粒度评估和评估器设计局限性等问题。

T23D-CompBench is a comprehensive benchmark for fine-grained evaluation of T23D generation. It defines five constituent components and twelve sub-components, which are used to generate 3600 texture meshes and collect 129,600 reliable human ratings. The dataset creation process includes defining the constituent components, generating representative prompts, generating 3D assets with the T23D generation model, conducting large-scale subjective studies, and performing in-depth analyses. The application field of this dataset is T23D generation quality evaluation, which aims to solve the problems that existing evaluation metrics cannot handle generation distortions, lack fine-grained evaluation, and have limitations in evaluator design.

提供机构：

上海交通大学, 美国密苏里大学堪萨斯城分校

创建时间：

2025-09-28

原始信息汇总

数据集概述

基本信息

标题: Towards Fine-Grained Text-to-3D Quality Assessment: A Benchmark and A Two-Stage Rank-Learning Metric
arXiv标识符: arXiv:2509.23841v1
提交日期: 2025年9月28日
学科分类: Computer Vision and Pattern Recognition (cs.CV)
作者: Bingyang Cui, Yujie Zhang, Qi Yang, Zhu Li, Yiling Xu

数据集内容

数据集名称: T23D-CompBench
数据类型: 文本到3D生成质量评估基准数据集
数据规模: 3,600个带纹理的网格模型
生成来源: 来自10个最先进的生成模型
标注信息: 收集了129,600个可靠的人类评分，涵盖不同视角

数据集特点

组成结构: 定义了5个主要组件和12个子组件的组合提示词
评估维度: 支持细粒度的文本到3D质量评估
应用场景: 用于训练和评估文本到3D生成质量评估指标

技术贡献

提出方法: Rank2Score评估器，采用两阶段训练方法
训练策略:
- 第一阶段：通过监督对比回归和课程学习增强成对训练
- 第二阶段：使用平均意见分数优化预测，使其更符合人类判断
验证结果: 在多个维度上持续优于现有指标，并可作为优化生成模型的奖励函数

资源链接

项目地址: https://arxiv.org/abs/2509.23841v1
DOI: https://doi.org/10.48550/arXiv.2509.23841
PDF文档: https://arxiv.org/pdf/2509.23841v1

搜集汇总

数据集介绍

构建方式

在文本到三维生成技术快速发展的背景下，T23D-CompBench通过系统化流程构建了高质量评估基准。该数据集首先定义了包含对象、属性、关系、风格和长度五个维度的组合提示词框架，利用GPT-4o生成360个具有语义丰富性的文本提示。随后采用十种前沿生成模型（包括Hunyuan-2.0、Tripo AI-2.5等）产生3,600个带纹理的三维网格，并通过大规模主观实验收集了跨十二个质量维度的129,600个可靠人类评分，每个样本均经过至少三位标注者的多轮一致性验证。

特点

作为当前最全面的文本到三维质量评估基准，T23D-CompBench具备显著的细粒度特性。其十二个评估维度全面覆盖语义对齐、视觉质量和真实性等关键方面，包括对象对齐、几何粗糙度等具体指标。数据集包含优化式与前馈式两类共十种生成模型的输出，有效捕捉了不同技术路线的质量分布差异。通过精心设计的组合提示词框架，该基准能够系统评估模型在处理多对象交互、创造性风格等复杂场景时的表现，为细粒度质量评估提供了充分的数据支撑。

使用方法

该数据集支持多种文本到三维质量评估任务的基准测试与研究验证。使用者可通过五折交叉验证方案进行模型训练与性能评估，其中训练集与测试集严格遵循提示词不相交原则以确保泛化性评估。对于质量预测任务，可基于多视角渲染图像与文本提示的跨模态特征进行回归或排序学习；在生成模型优化场景中，数据集标注可作为强化学习的奖励信号指导模型训练。此外，研究者还可利用其细粒度评分开展生成失败模式分析，或通过不同组件组合的对比实验探究模型的能力边界。

背景与挑战

背景概述

T23D-CompBench作为文本到三维生成质量评估领域的前沿基准数据集，由上海交通大学与密苏里大学堪萨斯城分校的研究团队于2025年联合构建。该数据集针对当前文本到三维生成模型在语义对齐、几何结构和纹理质量等方面存在的评估瓶颈，系统性地定义了包含对象、属性、关系、风格和长度五个维度的组合提示词框架。通过集成十种主流生成模型产生的3600个带纹理三维网格，并辅以129,600条经过严格人工标注的多维度质量评分，该数据集显著提升了生成内容质量评估的细粒度和可靠性，为三维内容生成技术的迭代优化提供了重要支撑。

当前挑战

该数据集致力于解决文本到三维生成质量评估中存在的双重挑战：在领域问题层面，传统评估方法难以准确捕捉生成内容特有的语义错位、结构失真和多面体伪影等复杂失真模式；在构建过程中，面临组合提示词设计、多维度质量标注一致性保障以及大规模人工标注质量控制等关键技术难题。现有评估基准普遍存在模型覆盖范围有限、标注维度粗糙以及数据规模不足等缺陷，制约了高质量评估器的开发与验证。

常用场景

经典使用场景

在文本到3D生成领域，T23D-CompBench作为首个细粒度质量评估基准，主要应用于系统评估生成模型的综合性能。该数据集通过定义对象、属性、关系、风格和长度五大组件及其十二个子组件，构建了360个组合式文本提示，并基于十种前沿生成模型产生了3,600个带纹理网格。这些数据配合十二个评估维度的129,600条人工标注，为研究者提供了多角度分析生成质量的基础，尤其适用于对比不同模型在语义对齐、几何完整性和纹理真实性等方面的表现差异。

衍生相关工作

基于T23D-CompBench衍生的代表性工作包括论文中提出的Rank2Score评估框架，该框架通过两阶段训练策略结合课程学习，实现了对生成质量的细粒度预测。后续研究受其启发，发展了多模态特征融合、对比学习等方法来提升评估鲁棒性。该数据集还促进了生成模型优化方向的研究，如利用其评估结果作为奖励函数指导MVC-ZigAL等模型的训练。此外，数据集的组合式提示设计理念被广泛应用于后续基准构建，推动了文本到3D生成领域评估范式的标准化进程。

数据集最近研究