five

HAPS 2.0|机器人导航数据集|人类动态交互数据集

收藏
arXiv2025-03-18 更新2025-03-20 收录
机器人导航
人类动态交互
下载链接:
https://ha-vln-project.vercel.app/
下载链接
链接失效反馈
资源简介:
HAPS 2.0数据集是由华盛顿大学等机构创建的,包含486个SMPL运动序列,覆盖了26种区域类型,如客厅、健身房、人行道等。数据集通过精细的标注流程,确保了运动描述与3D运动序列的准确对齐,适用于研究社会意识导航系统中的动态多人类交互。该数据集支持离散和连续导航环境,为机器人导航研究提供了丰富的多人类动态和部分可观测性挑战。
提供机构:
华盛顿大学
创建时间:
2025-03-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
HAPS 2.0数据集的构建采用了多阶段的标注流程,结合了粗粒度到细粒度的优化策略。首先,通过粒子群优化(PSO)算法在3D扫描场景中初步定位人类动作,确保动作与场景的合理对齐。随后,采用多视角摄像头系统进行精细调整,消除动作与场景之间的碰撞或穿透现象。此外,数据集还通过大语言模型(如ChatGPT-4和Llama-3-8B)生成多人类交互场景,进一步丰富了数据的多样性和动态性。最终,数据集包含486个3D人类动作序列,覆盖了26个区域类型和172种人类活动,确保了高保真的人类动作与场景对齐。
特点
HAPS 2.0数据集的特点在于其高度动态和多样化的多人类交互场景。数据集不仅包含了丰富的室内外人类活动,还通过多视角摄像头和实时渲染技术,确保了动作与场景的高保真对齐。此外,数据集还引入了社会意识约束,如个人空间保护和动态路径调整,使得数据集能够更好地模拟真实世界中的复杂人类行为。数据集还通过大语言模型生成的交互场景,进一步增强了数据的多样性和现实感,为视觉与语言导航(VLN)研究提供了更具挑战性的测试环境。
使用方法
HAPS 2.0数据集主要用于训练和评估视觉与语言导航(VLN)系统,特别是在动态多人类交互环境中的表现。研究人员可以通过该数据集测试导航代理在复杂人类活动中的路径规划、碰撞避免和社会意识能力。数据集提供了丰富的RGB-D观察数据和多人类交互场景,支持连续和离散导航任务的评估。此外,数据集还配备了实时渲染的模拟器,允许代理在动态环境中进行实时路径调整和碰撞检测。通过公开的排行榜,研究人员可以透明地比较不同代理在离散和连续任务中的表现,推动更具社会意识的导航研究。
背景与挑战
背景概述
HAPS 2.0数据集是Human-Aware Vision-and-Language Navigation (HA-VLN)基准的核心组成部分,旨在解决视觉与语言导航(VLN)系统在动态、多人类交互环境中的挑战。该数据集由华盛顿大学、卡内基梅隆大学等机构的研究团队于2025年发布,扩展了其前身HAPS 1.0,包含了486个3D人体运动序列,涵盖了26种区域类型和172种人类活动。HAPS 2.0通过结合离散与连续导航范式,强调了社会感知约束下的导航任务,推动了机器人导航系统在真实世界中的应用。该数据集的发布为研究者在多人类动态环境中的导航算法开发提供了重要支持,进一步推动了社会感知导航领域的发展。
当前挑战
HAPS 2.0数据集在构建和应用过程中面临多重挑战。首先,数据集的核心任务是解决动态多人类环境中的导航问题,要求机器人能够理解并执行涉及人类活动的复杂指令,如‘绕过正在打电话的人’。这种任务要求模型具备高度的社会感知能力,能够在部分可观测的环境中实时调整路径以避免碰撞。其次,数据集的构建过程中,研究人员需要解决人类运动数据与文本描述之间的对齐问题,确保每个3D运动序列与相应的活动描述精确匹配。此外,数据集还面临多人类交互建模的挑战,如何在模拟器中真实再现人类群体的动态行为,并确保其与导航指令的语义一致性,是构建过程中的一大难点。这些挑战共同推动了HAPS 2.0在数据质量和任务复杂性上的显著提升。
常用场景
经典使用场景
HAPS 2.0数据集在视觉与语言导航(VLN)领域中被广泛应用于模拟动态多人类交互环境中的导航任务。该数据集通过结合离散和连续导航范式,提供了丰富的多人类活动场景,使得研究者能够在高度逼真的环境中测试和优化导航算法。经典的使用场景包括在室内外环境中,机器人根据自然语言指令导航,同时避免与动态移动的人类发生碰撞。
实际应用
HAPS 2.0数据集的实际应用场景主要集中在服务机器人、智能家居和公共空间导航等领域。例如,在商场或医院中,机器人可以根据语音指令导航至指定位置,同时避免与行人发生碰撞。此外,该数据集还可用于开发智能家居系统,帮助机器人在家庭环境中执行任务,如递送物品或协助老年人,同时确保不打扰家庭成员的活动。
衍生相关工作
HAPS 2.0数据集衍生了许多相关的研究工作,特别是在社会意识导航和多人类交互领域。基于该数据集,研究者开发了多种导航算法,如HA-VLN-VL和HA-VLN-CMA,这些算法在动态环境中表现出色。此外,HAPS 2.0还推动了模拟器的发展,如HA-VLN-CE和HA-VLN-DE,这些模拟器能够更真实地反映现实世界中的多人类交互场景,进一步推动了视觉与语言导航领域的研究进展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录