DOPER_BOP

Hugging Face2026-04-12 更新2026-04-13 收录

下载链接：

https://huggingface.co/datasets/TontonTremblay/DOPER_BOP

下载链接

链接失效反馈

官方服务：

资源简介：

DOPER BOP 数据集包含针对 BOP 数据集的 DOPER-t 关键点模型，这些模型在合成的 PBR 数据上训练，并带有对称感知的 3D 关键点。数据集使用 GT 边界框、DOPER-t 关键点推理和 PnP 姿态估计进行评估。数据集涵盖多个子集（lm、lmo、tless、tudl、ycbv、hb、itodd、icbin、hope），每个子集包含多个对象，每个对象都有详细的评估指标（如 ADD-AUC、ADDS-AUC 和 MSSD-AUC）。数据集还提供了生成关键点的方法、训练数据来源（BOP 核心数据集和自定义 BlenderProc 合成渲染）以及文件结构的详细说明。此外，README 中还包含了如何使用 Hugging Face Hub 下载模型检查点和关键点的示例代码。

创建时间：

2026-04-11

搜集汇总

数据集介绍

构建方式

在计算机视觉的六自由度姿态估计领域，DOPER_BOP数据集通过系统化方法构建而成。其核心流程首先从BOP数据集的网格模型与`models_info.json`中提取每个物体的17个对称感知三维关键点。随后，利用BlenderProc生成的合成PBR渲染数据，对DOPER-t关键点检测模型进行训练，输入尺寸为256x256，共300个训练周期。同时，为每个物体独立训练RTMDet-tiny检测器，采用COCO预训练权重，并引入约30-40%的跨数据集负样本图像以增强泛化能力，训练周期为20轮。整个构建过程完全基于合成数据，确保了数据标注的精确性与一致性。

特点

该数据集在六自由度物体姿态估计任务中展现出显著特点。它涵盖了BOP基准中的九个核心数据集，总计168个物体，提供了广泛的对象多样性。数据集支持两种评估模式：关键点专用模式使用真实边界框，旨在揭示姿态估计的理论性能上限；而检测与姿态联合模式则整合了RTMDet检测器与DOPER-t关键点模型，通过PnP求解实现完整的端到端流程，更贴近实际应用场景。其评估体系全面，不仅包含ADD、ADD-S等传统度量，还采用了BOP挑战赛定义的MSSD、MSPD等对称感知指标，并通过AUC与平均召回率进行综合性能衡量。

使用方法

对于希望利用该数据集的研究者，其使用方法清晰明确。在关键点专用评估中，可直接加载预训练的DOPER-t模型与对应的三维关键点文件，在给定真实边界框的条件下预测二维关键点，进而求解物体姿态。若进行端到端评估，则需依次调用RTMDet检测器获取物体边界框，再使用DOPER-t模型预测关键点，最后通过PnP结合RANSAC算法计算六自由度姿态。数据集文件结构规整，每个物体目录下均包含模型检查点、三维关键点坐标、评估结果摘要及可视化网格图像，便于用户进行模型验证、结果分析与后续研究开发。

背景与挑战

背景概述

DOPER_BOP数据集是计算机视觉领域针对六自由度姿态估计任务构建的基准资源，其依托于BOP基准框架，由相关研究团队于近年开发。该数据集整合了九个广泛使用的BOP子数据集，涵盖168个不同物体，旨在通过关键点检测方法推动物体姿态估计技术的进步。核心研究问题聚焦于在复杂现实场景中实现高精度、鲁棒的物体位姿预测，为机器人抓取、增强现实等应用提供关键技术支撑。其采用纯合成PBR数据进行模型训练，体现了数据驱动方法在减少真实数据依赖方面的创新探索，对姿态估计领域的算法评估与比较产生了显著影响。

当前挑战

DOPER_BOP数据集致力于解决物体六自由度姿态估计这一核心领域问题，其面临的主要挑战包括物体外观多样性、遮挡与光照变化下的姿态预测鲁棒性，以及对称物体带来的姿态歧义性。在构建过程中，挑战体现为大规模合成数据生成与真实场景之间的域差异，需要精细设计对称感知的关键点采样策略以处理离散与连续对称性。此外，跨数据集的负样本引入与检测-姿态联合管道的优化，亦对模型泛化能力与计算效率提出了较高要求。

常用场景

经典使用场景

在计算机视觉领域，物体六自由度姿态估计是机器人抓取、增强现实等应用的核心技术。DOPER_BOP数据集通过整合九个标准BOP数据集，提供了涵盖168个物体的统一基准，其经典使用场景在于评估和比较基于关键点检测的六自由度姿态估计算法。该数据集支持两种评估模式：仅使用真实边界框的关键点检测模式，用于衡量姿态估计的理论上限；以及结合检测与姿态估计的完整流程，模拟真实应用场景。研究人员可借此系统性地分析算法在不同物体类别、光照条件和遮挡环境下的鲁棒性，为姿态估计领域的模型优化提供标准化测试平台。

衍生相关工作

围绕DOPER_BOP数据集，已衍生出一系列经典研究工作，持续推动六自由度姿态估计领域的发展。基于其提供的多数据集基准，研究者提出了改进的关键点选取策略，如自适应对称性处理机制，以提升对复杂对称物体的估计精度。在模型架构方面，涌现出结合Transformer与卷积网络的新型关键点检测器，充分利用数据集的合成训练数据优化特征表示。此外，针对数据集的评估协议，学界提出了更高效的姿态求解算法，如改进的PnP-RANSAC方法，以降低计算开销并提升实时性。这些工作不仅深化了对姿态估计本质问题的理解，也为后续构建更高效、更鲁棒的视觉感知系统奠定了理论基础。

数据集最近研究