five

PhysXNet

收藏
arXiv2025-07-17 更新2025-07-18 收录
下载链接:
https://physx-3d.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
PhysXNet是一个包含超过26K个富标注的3D物体的数据集,它系统地标注了五个基础维度:绝对尺寸、材料、可供性、运动学和功能描述。该数据集旨在为物理3D生成提供支持,填补了现有3D数据集在物理属性标注方面的空白。PhysXNet通过一个高效、稳健且可扩展的标注流程,实现了对现有几何数据集的物理属性标注。此外,还提供了一个扩展版本PhysXNet-XL,包含超过6百万个通过程序生成的标注3D物体。

PhysXNet is a dataset containing over 26K richly annotated 3D objects, which systematically annotates five fundamental dimensions: absolute dimensions, materials, affordances, kinematics, and functional descriptions. This dataset aims to support physical 3D generation, filling the gap in physical attribute annotation of existing 3D datasets. PhysXNet enables physical attribute annotation for existing geometric datasets via an efficient, robust, and scalable annotation pipeline. Additionally, an extended version named PhysXNet-XL is provided, which contains over 6 million programmatically generated annotated 3D objects.
提供机构:
南洋理工大学, 上海人工智能实验室
创建时间:
2025-07-17
搜集汇总
数据集介绍
main_image_url
构建方式
PhysXNet数据集的构建采用了创新的半自动化标注流程,结合了视觉语言模型(VLM)与人类专家协同工作。首先通过目标视觉隔离技术对3D对象组件进行渲染,以最小化视觉干扰;随后利用大规模视觉语言模型进行初步属性标注;最后通过专家团队对复杂运动行为进行精细化标注与校验。该流程特别设计了运动参数确定模块,包含接触区域计算、平面拟合、候选轴生成等子任务,确保运动学参数的物理准确性。
特点
作为首个系统标注物理属性的3D数据集,PhysXNet在五个基础维度上实现了全面标注:绝对尺度、材料参数(杨氏模量、泊松比、密度)、功能可供性、运动学参数以及功能描述。其独特价值在于:1)26K高质量3D资产均包含部件级物理标注;2)首创功能可供性优先级评分体系(1-10级);3)支持五种运动学约束类型建模;4)通过程序化生成扩展出600万标注样本的PhysXNet-XL子集。数据集特别强化了物理仿真所需的关键属性,如接触区域计算和运动范围量化。
使用方法
该数据集支持端到端的物理3D资产生成任务,典型应用流程包含三个阶段:1)通过物理VAE编码器将多维物理属性(尺度、材料等)映射为统一潜空间;2)采用双分支扩散模型联合优化几何结构与物理属性生成;3)利用运动学参数解码器重建可交互部件。研究证实,将物理潜空间与预训练几何空间进行残差连接,可同步提升生成结果的物理合理性与几何保真度。数据集特别适用于机器人操作仿真、 embodied AI等需要物理精确建模的领域。
背景与挑战
背景概述
PhysXNet是由南洋理工大学和上海人工智能实验室的研究团队于2025年提出的首个物理基础3D资产数据集,标志着3D建模从纯几何向物理仿真的范式转变。该数据集通过系统化标注绝对尺度、材料属性、功能可操作性、运动学参数和功能描述五个物理维度,填补了传统3D数据集在物理属性标注上的空白。基于人机协同标注流程,研究团队对PartNet数据集中的26,000个3D模型进行了细粒度物理标注,并扩展生成600万个程序化建模的物理资产,为物理仿真、具身智能等领域的算法开发提供了关键基础设施。
当前挑战
PhysXNet面临的核心挑战体现在两个层面:在领域问题层面,需解决物理属性与几何结构的跨模态关联建模难题,包括材料密度分布的长尾特性处理、运动学参数的空间一致性保持等;在构建过程层面,需突破细粒度物理标注的可扩展性瓶颈,特别是针对微小部件的接触区域计算、复杂运动类型的参数确定等任务,研究团队设计了基于视觉语言模型的半自动标注流程,通过三阶段人机协同机制平衡标注效率与精度。此外,程序化生成资产的物理合理性验证、多物理量耦合标注的完整性保障等问题也构成了重要挑战。
常用场景
经典使用场景
PhysXNet数据集在计算机视觉和机器人学领域具有广泛的应用价值,尤其是在物理基础的三维资产生成方面。该数据集通过系统地标注了绝对尺度、材料、功能描述、运动学参数等多维物理属性,为研究人员提供了一个丰富的实验平台。经典使用场景包括物理模拟、机器人操作和增强现实等领域,特别是在需要高精度物理属性的任务中,如物体交互仿真和动态场景建模。
解决学术问题
PhysXNet解决了当前三维生成模型中普遍忽视物理属性的问题,填补了物理基础三维数据集的空白。通过提供细粒度的物理属性标注,该数据集支持了物理感知的三维生成任务,推动了计算机视觉和机器人学中物理建模的研究。其意义在于为生成模型引入了物理一致性,使得生成的三维资产不仅具有几何和纹理的真实性,还能在物理仿真中表现出合理的行为。
衍生相关工作
PhysXNet的发布催生了一系列相关研究工作,特别是在物理基础的三维生成和仿真领域。例如,基于该数据集的PhysXGen框架通过双分支架构实现了三维结构与物理属性的联合建模。此外,许多后续研究利用PhysXNet的数据标注方法,开发了新的物理感知生成模型,进一步推动了该领域的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作