five

GAPartNet

收藏
github2023-03-26 更新2025-02-20 收录
下载链接:
https://github.com/PKU-EPIC/GAPartNet
下载链接
链接失效反馈
官方服务:
资源简介:
GAPartNet是由北京大学、清华大学、加州大学洛杉矶分校等机构共同构建的大型交互式部件级数据集,旨在推动跨品类通用对象感知与操作技能的研究。该数据集包含来自27个对象类别的1,166个可操作对象,涵盖8,489个部件实例,涵盖9种通用可操作部件类别(如把手、按钮、滑块等)。数据集提供了丰富的部件级语义标注和姿态信息,总标注量超过1万条。数据来源于PartNet-Mobility和AKB-48数据集,经过严格清洗、重新标注和姿态对齐,以确保跨品类通用性。GAPartNet的创建过程包括修复不完美网格、重新合并部件、统一语义标注以及姿态标注等步骤,以支持从视觉感知到机器人操作的通用化任务。该数据集主要用于研究跨品类部件分割、姿态估计以及基于部件的对象操作等任务,助力机器人在未知对象类别中实现通用化交互。

GAPartNet is a large-scale interactive part-level dataset jointly constructed by Peking University, Tsinghua University, University of California, Los Angeles and other institutions, aiming to promote research on cross-category general object perception and manipulation skills. This dataset contains 1,166 manipulable objects from 27 object categories, covering 8,489 part instances and 9 general manipulable part categories such as handles, buttons, sliders, etc. It provides rich part-level semantic annotations and pose information, with a total of more than 10,000 annotations. The data is sourced from PartNet-Mobility and AKB-48 datasets, and has undergone strict cleaning, re-annotation and pose alignment to ensure cross-category generalizability. The construction process of GAPartNet includes steps such as repairing imperfect meshes, re-merging parts, unifying semantic annotations and pose annotations, to support generalized tasks ranging from visual perception to robotic manipulation. This dataset is mainly used for research on cross-category part segmentation, pose estimation and part-based object manipulation tasks, helping robots achieve generalized interaction in unknown object categories.
提供机构:
北京大学、清华大学、加州大学洛杉矶分校等
创建时间:
2023-03-26
原始信息汇总

GAPartNet 数据集概述

数据集简介

GAPartNet是一个跨类别域泛化的对象感知与操作数据集,通过泛化和可操作部分实现。该数据集旨在支持对象感知和操作任务。

数据集详情

  • 数据集名称:GAPartNet
  • 发布日期:2023年
  • 数据集构成:包括对象与部分资产及注释、渲染点云数据以及预训练检查点。
  • 获取方式:需填写表格并查看使用条款。使用数据集需引用相关论文。

数据集使用

数据集相关

  • 项目页面GAPartNet项目页面

  • 论文引用:请引用以下论文:

    @article{geng2022gapartnet, title={GAPartNet: Cross-Category Domain-Generalizable Object Perception and Manipulation via Generalizable and Actionable Parts}, author={Geng, Haoran and Xu, Helin and Zhao, Chengyang and Xu, Chao and Yi, Li and Huang, Siyuan and Wang, He}, journal={arXiv preprint arXiv:2211.05272}, year={2022} }

许可

该工作和数据集在CC BY-NC 4.0许可下发布。

联系方式

如有问题,请通过GitHub问题或以下联系方式联系我们:

  • Haoran Geng: ghr@stu.pku.edu.cn
  • Helin Xu: xuhelin1911@gmail.com
  • Chengyang Zhao: zhaochengyang@pku.edu.cn
  • He Wang: hewang@pku.edu.cn
搜集汇总
数据集介绍
main_image_url
构建方式
GAPartNet数据集的构建采用了一种跨类别、领域泛化的方法,通过整合对象及其部件的资产与注释、渲染的点云数据,以及预训练的检查点,旨在推动对象感知与操作任务的发展。该数据集涵盖了多种对象的通用和可操作部分,以适应不同领域的需求,并利用了深度学习技术进行有效的数据标注和模型训练。
特点
GAPartNet数据集的特点在于其领域泛化能力,不仅包含对象级别的信息,还细致到对象部件的层次,为研究者提供了丰富的语义分割、实例分割和姿态估计的标注数据。此外,数据集还提供了预训练模型,助力用户快速开展相关研究。其开放性和易用性也为促进学术交流和技术创新提供了便利。
使用方法
用户在使用GAPartNet数据集时,需先安装所需的依赖环境和库,然后下载预训练的模型和数据。通过运行demo.ipynb中的示例代码,用户可以快速体验数据集的功能。对于完整的训练和模型使用,用户需要遵循指导安装额外的依赖,并可以根据需要调整配置文件中的参数,以进行模型训练、推理和可视化等操作。
背景与挑战
背景概述
GAPartNet数据集,全称为Cross-Category Domain-Generalizable Object Perception and Manipulation via Generalizable and Actionable Parts,是由北京大学等机构的科研人员于2022年创建的。该数据集旨在通过通用且可操作的部分,实现对跨类别物体的感知与操作。GAPartNet数据集的发布,为机器人学、计算机视觉等领域的研究提供了新的资源,对于推动相关技术的发展具有重要的意义。其主要解决了物体感知与操作中的泛化性问题,允许模型在多种不同类别的物体上表现出良好的性能。
当前挑战
GAPartNet数据集面临的挑战主要包括:1)数据集构建过程中的挑战,如如何保证数据集的多样性和高质量,以及如何有效地标注和生成通用且可操作的部分;2)所解决的领域问题中的挑战,包括如何设计具有泛化能力的模型,使其在不同类别和不同场景下都能保持鲁棒性,以及如何提高模型的操作准确性。
常用场景
经典使用场景
在计算机视觉与机器人领域,GAPartNet数据集之经典使用场景在于其提供了跨类别的通用对象感知与操作能力。该数据集通过通用的动作部分实现对象识别与操作,可广泛应用于各类机器学习模型训练中,助力模型理解对象的组成结构及其相互作用。
实际应用
实际应用场景中,GAPartNet数据集可用于提升机器人在复杂环境下的操作能力,例如在仓储物流、家居自动化等领域,机器人可以借此数据集更好地理解物品结构,进行有效的抓取与搬运。
衍生相关工作
基于GAPartNet数据集,已衍生出多项相关工作,包括但不限于改进的数据增强方法、更为精确的物体分割技术以及针对特定应用场景的定制化模型。这些工作进一步推动了机器人感知与操作领域的研究进展,为智能机器人的实用化提供了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作