PhysicalAI-SmartSpaces
收藏Hugging Face2025-03-19 更新2025-03-20 收录
下载链接:
https://huggingface.co/datasets/nvidia/PhysicalAI-SmartSpaces
下载链接
链接失效反馈官方服务:
资源简介:
Physical AI Smart Spaces数据集是一个全面的、经过注释的多摄像头追踪和2D/3D目标检测数据集。该数据集由Omniverse合成,包含近1500个摄像头的250多个小时室内场景视频,如仓库、医院和零售场所等。数据集为时间同步,用于跨摄像头的多摄像头追踪,使用特征表示,不包含任何个人数据。
提供机构:
NVIDIA
创建时间:
2025-03-14
搜集汇总
数据集介绍

构建方式
PhysicalAI-SmartSpaces数据集是通过NVIDIA的Omniverse平台合成生成的,涵盖了仓库、医院、零售等多种室内场景。该数据集包含超过250小时的视频,来自近1500个摄像头,所有视频均经过时间同步处理,以便在多摄像头环境下进行人体跟踪。数据标注通过IsaacSim自动完成,确保了标注的准确性和一致性。
特点
PhysicalAI-SmartSpaces数据集的特点在于其丰富的内容和多样的应用场景。数据集不仅提供了2D和3D的目标检测标注,还支持多摄像头跟踪任务。视频分辨率为1080p,帧率为30 FPS,确保了高质量的视觉数据。此外,数据集还提供了详细的相机校准信息和全局坐标映射,便于进行精确的空间分析和目标定位。
使用方法
使用PhysicalAI-SmartSpaces数据集时,用户可以通过提供的视频文件和校准信息进行多摄像头跟踪和2D/3D目标检测任务。数据集的结构清晰,包含视频文件、地面真值标注和相机校准文件。用户可以根据需要选择不同的标注格式(如MOTChallenge格式或JSON格式)进行数据处理和分析。此外,数据集还支持在AI City Challenge等竞赛中进行模型评估,提供了HOTA评分等标准化的评估指标。
背景与挑战
背景概述
PhysicalAI-SmartSpaces数据集由NVIDIA于2023年12月启动创建,并于2024年作为第八届AI City Challenge的一部分发布。该数据集专注于多摄像头跟踪和2D/3D物体检测,涵盖了仓库、医院、零售等多种室内场景,包含超过250小时的视频数据,涉及近1500个摄像头。数据集通过Omniverse平台合成生成,并采用IsaacSim进行自动标注,确保了数据的多样性和高质量。该数据集的发布为计算机视觉领域的研究人员提供了丰富的资源,推动了多摄像头跟踪和3D检测技术的发展。
当前挑战
PhysicalAI-SmartSpaces数据集在解决多摄像头跟踪和3D物体检测问题时面临诸多挑战。首先,多摄像头环境下的目标跟踪需要解决跨摄像头的目标匹配问题,尤其是在目标外观变化或遮挡情况下,如何保持跟踪的连续性和准确性是一个关键难题。其次,3D物体检测需要精确的相机校准和场景重建,以确保检测结果的几何一致性。此外,数据集的构建过程中,如何高效生成大规模合成数据并确保其与真实场景的逼真度也是一个重要挑战。这些技术难题的解决将直接影响多摄像头跟踪和3D检测算法的性能和应用效果。
常用场景
经典使用场景
PhysicalAI-SmartSpaces数据集在计算机视觉领域中被广泛应用于多摄像头跟踪和2D/3D物体检测任务。该数据集通过Omniverse平台合成生成,涵盖了仓库、医院、零售等多种室内场景,提供了超过250小时的视频数据,涉及近1500个摄像头。这些数据经过时间同步处理,能够有效支持跨摄像头的目标跟踪任务,尤其是在复杂环境下的多目标跟踪(MTMC)问题中表现出色。
衍生相关工作
基于PhysicalAI-SmartSpaces数据集,多项经典研究工作得以展开。例如,2024年AI City Challenge中,该数据集被用于评估多目标跟踪算法的性能,推动了HOTA(Higher Order Tracking Accuracy)指标的应用。此外,相关研究如BEV-SUSHI项目,利用该数据集开发了基于鸟瞰图的多目标3D检测与跟踪方法,进一步拓展了数据集在自动驾驶与智能交通领域的应用潜力。
数据集最近研究
最新研究方向
在计算机视觉领域,PhysicalAI-SmartSpaces数据集为多摄像头跟踪和2D/3D物体检测提供了丰富的合成数据资源。该数据集通过Omniverse平台生成,涵盖了仓库、医院、零售等多种室内场景,时间同步的视频数据为跨摄像头的人类跟踪提供了强有力的支持。近年来,随着深度学习和多模态融合技术的快速发展,该数据集在前沿研究中被广泛应用于多目标跟踪、3D场景重建以及行为分析等领域。特别是在2024年AI City Challenge中,该数据集被用于评估基于HOTA分数的多摄像头跟踪算法,推动了多摄像头协同感知技术的进步。此外,2025年版本的数据集引入了3D边界框标注,进一步拓展了其在自动驾驶、智能监控等领域的应用潜力。这些研究不仅提升了算法的鲁棒性和精度,也为未来智能空间的发展奠定了坚实的基础。
以上内容由遇见数据集搜集并总结生成



