KeypointNet

Name: KeypointNet
Creator: 上海交通大学
Published: 2020-08-07 10:07:56
License: 暂无描述

arXiv2020-08-07 更新2024-06-21 收录

下载链接：

https://github.com/qq456cvb/KeypointNet

下载链接

链接失效反馈

官方服务：

资源简介：

KeypointNet是一个大规模且多样化的3D关键点数据集，包含103,450个关键点和8,234个来自16个对象类别的3D模型。该数据集通过利用大量人类注释，解决了现有数据集在规模和关键点定义上的不足。数据集的创建过程中，采用了新颖的方法来自动聚合来自不同人的注释，通过最小化忠诚度损失来处理注释之间的不一致性。KeypointNet的应用领域广泛，包括对象匹配、跟踪、形状检索和注册等，旨在通过数据驱动的方式解决3D对象关键点检测的问题。

KeypointNet is a large-scale and diverse 3D keypoint dataset that contains 103,450 keypoints and 8,234 3D models spanning 16 object categories. It addresses the limitations of existing datasets in terms of scale and keypoint definition by leveraging extensive human annotations. During its construction, a novel approach is employed to automatically aggregate annotations from multiple annotators, resolving inconsistencies across annotations by minimizing the loyalty loss. With a wide range of applications including object matching, tracking, shape retrieval, registration and more, KeypointNet aims to address the problem of 3D object keypoint detection in a data-driven manner.

提供机构：

上海交通大学

创建时间：

2020-02-28

搜集汇总

数据集介绍

构建方式

在三维物体关键点检测领域，数据集的构建长期面临规模有限与标注模糊的双重挑战。KeypointNet的构建以ShapeNetCore为基础，通过精心设计的网络标注工具，邀请大量标注者根据个人理解自由标注关键点，每个模型最多标注24个兴趣点。面对不同标注者之间的不一致性，研究团队创新性地提出了一种基于保真度损失最小化的自动聚合方法，通过交替优化嵌入函数与关键点集合，将原始标注转化为具有语义一致性的高质量关键点，最终形成包含16个类别、8,234个模型与103,450个关键点的大规模数据集。

使用方法

该数据集主要支持三维关键点显著性估计与关键点对应性估计两大核心任务。在关键点显著性估计任务中，算法需预测点云中哪些点属于关键点，评估指标采用平均交并比与平均精度。在更具挑战性的关键点对应性估计任务中，算法不仅需要定位关键点，还需为其分配一致的语义标签，评估通常使用正确关键点百分比指标。研究人员可按7:1:2的比例使用预设的训练、验证与测试划分，在点云、图网络、体素等多种架构的算法上进行基准测试，以推动三维物体语义理解技术的发展。

背景与挑战

背景概述

三维关键点检测在计算机视觉与图形学领域具有重要应用价值，如物体匹配、姿态估计与形状检索等。然而，现有数据集在规模与关键点定义一致性方面存在局限。为此，上海交通大学的研究团队于近年提出了KeypointNet数据集，该数据集汇集了来自16个物体类别的8,234个三维模型与103,450个关键点标注，通过众包标注与创新的聚合方法，首次构建了大规模且多样化的三维关键点数据集。该数据集的建立旨在推动三维物体语义理解研究，为关键点检测算法提供了可靠的基准测试平台。

当前挑战

KeypointNet数据集致力于解决三维关键点检测中的语义一致性与可扩展性问题，其核心挑战在于如何从众包标注中提取具有高保真度且语义明确的关键点。具体而言，标注过程中不同标注者对关键点的理解存在差异，导致标注点位置分散且可能存在误差；同时，传统聚类方法难以区分空间位置邻近的关键点，也无法自动赋予语义标签。为此，研究团队提出了基于保真度损失优化的聚合方法，通过嵌入空间映射与交替最小化策略，实现了关键点的自动归纳与语义对齐，从而克服了标注不一致性与几何邻近性带来的技术难题。

常用场景

经典使用场景

在三维物体理解的研究领域中，KeypointNet数据集被广泛用于评估和提升关键点检测算法的性能。该数据集通过聚合大量人工标注，提供了覆盖16个常见物体类别、超过10万个关键点的丰富标注信息，为三维关键点显著性估计和关键点对应性估计两大核心任务奠定了基准。研究者利用这一数据集训练深度学习模型，如PointNet++、DGCNN等，以探索模型在复杂几何结构下的关键点定位能力，推动三维视觉算法从几何特征提取向语义理解深化。

解决学术问题

KeypointNet有效解决了三维关键点检测领域长期存在的标注规模有限与语义模糊性问题。传统数据集如Dutagaci等人所构建的仅包含43个模型，且依赖专家模板定义关键点，易引入主观偏差。KeypointNet通过众包标注与基于保真度损失的自动聚合方法，生成了大规模、高一致性的关键点真值，为三维物体匹配、姿态估计、形状检索等任务提供了可靠的语义基准。其提出的关键点显著性估计与对应性估计任务，系统评估了十种前沿算法的性能，揭示了当前方法在精确语义定位上的挑战，促进了三维理解研究向细粒度语义对齐方向发展。

实际应用

在机器人操作与增强现实等实际场景中，KeypointNet为三维物体的精准定位与交互提供了关键支持。例如，在机器人抓取任务中，基于该数据集训练的关键点检测模型能够识别物体上的语义显著部位（如瓶盖、椅腿），从而规划稳定的抓取位姿。在增强现实系统中，关键点可用于实时三维注册，将虚拟物体准确叠加到真实场景的对应结构上。此外，该数据集在工业质检、文化遗产数字化等领域，也为三维物体的特征对齐与变形分析提供了可扩展的标注范例。

数据集最近研究