ADHMR Preference Dataset

Name: ADHMR Preference Dataset
Creator: 南洋理工大学, 商汤科技研究院, 香港科技大学（广州）
Published: 2025-05-15 21:04:51
License: 暂无描述

arXiv2025-05-15 更新2025-05-20 收录

下载链接：

http://arxiv.org/abs/2505.10250v1

下载链接

链接失效反馈

官方服务：

资源简介：

ADHMR Preference Dataset 是由南洋理工大学、商汤科技研究院和香港科技大学（广州）的研究团队创建的，用于评估和优化扩散模型在人体网格恢复中的应用。数据集包含成对的人体网格预测，每个预测都由 HMR-Scorer 进行评分。该数据集用于微调扩散模型，使其能够更准确地生成与二维图像线索更一致的人体姿态预测。数据集的具体条数未在论文中提及，访问地址也未提供。

The ADHMR Preference Dataset was developed by research teams from Nanyang Technological University, SenseTime Research, and The Hong Kong University of Science and Technology (Guangzhou), and is designed to evaluate and optimize the application of diffusion models in human mesh recovery. The dataset contains paired human mesh predictions, each of which is scored by HMR-Scorer. This dataset is utilized to fine-tune diffusion models, enabling them to more accurately generate human pose predictions that align better with 2D image cues. The specific number of samples included in the dataset is not mentioned in the associated paper, and no official access address is provided.

提供机构：

南洋理工大学, 商汤科技研究院, 香港科技大学（广州）

创建时间：

2025-05-15

搜集汇总

数据集介绍

构建方式

ADHMR Preference Dataset的构建过程体现了计算机视觉领域对3D人体网格恢复精确性的不懈追求。研究团队首先训练了一个名为HMR-Scorer的评估模型，该模型能够对无3D标注的野外图像进行预测质量评估。通过向基础扩散模型生成的预测样本添加关节高斯噪声模拟旋转误差，并采用标准HMR指标（包括PVE、MPJPE等）进行质量标注，构建了包含图像-预测对的质量排序数据集。随后基于HMR-Scorer的评分结果，采用随机配对策略从评分最高和最低的预测中各选取样本，最终构建了包含优胜-劣汰预测对的偏好数据集。

特点

该数据集的核心价值在于其创新的偏好标注机制与多维度评估体系。区别于传统确定性标注方法，数据集通过HMR-Scorer实现了对预测质量的相对评估，有效解决了3D标注模糊性问题。数据集包含全局与局部像素对齐特征，通过多尺度图像特征提取和UVD坐标转换，确保了空间几何关系的精确表达。特别值得注意的是，数据集不仅适用于实验室环境下的精确标注数据，还能有效处理野外图像的噪声标注问题，为模型提供了更接近真实场景的训练环境。

使用方法

该数据集主要服务于基于直接偏好优化（DPO）的人体网格恢复模型训练。研究人员首先利用基础扩散模型生成多组预测样本，通过HMR-Scorer评估后构建偏好数据集。在模型优化阶段，采用改进的扩散DPO目标函数，通过比较优胜与劣汰预测对的去噪轨迹来优化模型参数。数据集还可用于现有HMR模型的数据清洗，通过设定质量阈值过滤低置信度的伪标注样本。实验表明，使用该数据集优化的ADHMR框架在3DPW等基准测试中显著提升了预测精度与图像对齐度，尤其在处理遮挡和复杂交互场景时展现出卓越的鲁棒性。

背景与挑战

背景概述

ADHMR Preference Dataset是由Wenhao Shen等研究人员于2025年提出的，旨在解决单目图像中三维人体网格恢复（HMR）的固有不确定性问题。该数据集通过偏好优化方法，对基于扩散的HMR模型进行对齐，以生成更符合二维图像观测的预测。ADHMR框架的核心在于训练一个评估模型HMR-Scorer，用于自动生成偏好数据集，从而优化基础模型。这一研究在计算机视觉领域具有重要意义，特别是在虚拟试衣、增强现实和虚拟现实内容生成等应用中。

当前挑战

ADHMR Preference Dataset面临的挑战主要包括两个方面：一是领域问题的挑战，即如何解决单目图像中三维人体网格恢复的深度模糊和遮挡问题，同时确保生成的预测与二维图像观测对齐；二是构建过程中的挑战，包括如何在没有三维标注的野外图像上训练评估模型HMR-Scorer，以及如何通过偏好数据集优化基础模型以避免对噪声标签的过拟合。此外，数据集中存在的噪声标注问题也对模型的鲁棒性提出了更高要求。

常用场景

经典使用场景

ADHMR Preference Dataset在计算机视觉领域的人体网格恢复（HMR）任务中扮演着关键角色。该数据集通过直接偏好优化（DPO）方法，为扩散模型提供了高质量的偏好数据，使其能够生成与2D图像观测更对齐的3D人体网格预测。在人体姿态估计、虚拟试衣和增强现实内容生成等场景中，ADHMR数据集显著提升了模型的准确性和鲁棒性。

衍生相关工作

基于ADHMR Preference Dataset的研究成果，衍生出了一系列经典工作。例如，HMR-Scorer不仅用于偏好数据集的构建，还被应用于数据清洗，提升了现有HMR模型的性能。此外，该数据集的技术框架也被扩展到其他3D重建任务中，如手部姿态估计和面部表情重建，进一步推动了计算机视觉领域的发展。

数据集最近研究