SocNav3
收藏github2025-09-03 更新2025-09-06 收录
下载链接:
https://github.com/SocNavData/SocNav3
下载链接
链接失效反馈官方服务:
资源简介:
SocNav3数据集包含与评分者、轨迹和评分者-轨迹分数相关的变量。每个评分者都有一个人口统计信息和评分列表,评分列表包含元组(轨迹标识符、上下文、评分分数)。轨迹包含机器人、任务及其上下文、人类、物体和环境的数据。上下文是轨迹中特定情况的文本描述,可以与轨迹解耦,以探索不同上下文对相同轨迹感知的影响
The SocNav3 dataset includes variables associated with raters, trajectories, and rater-trajectory scores. Each rater is equipped with demographic information and a rating list, which comprises tuples in the form of (trajectory identifier, context, rating score). A trajectory holds data pertaining to robots, tasks and their contexts, humans, objects, and the environment. Context refers to a textual description of specific scenarios within a trajectory, and it can be decoupled from the trajectory to investigate the influence of diverse contexts on the perception of identical trajectories.
创建时间:
2025-08-16
原始信息汇总
SocNav3 数据集概述
数据集简介
SocNav3 数据集是为开发数据驱动的社交机器人导航指标而构建,旨在促进社交机器人导航策略的基准测试和策略优化。数据集包含人类评估者对完整机器人轨迹的评分,结合目标和上下文信息。
数据内容
数据类型
- 评分者数据:包含评分者的人口统计信息和评分列表。
- 轨迹数据:记录机器人、任务、人类、物体和环境信息。
- 上下文数据:文本描述特定情境,可独立于轨迹存在。
轨迹数据结构
| 类别 | 变量 | 描述 |
|---|---|---|
| 机器人 | 位姿 | 二维位置(米)和方向(弧度) |
| 速度 | 线速度(米/秒)和角速度(弧度/秒) | |
| 驱动方式 | 分类变量(差速/全向/阿克曼) | |
| 形状 | 二维圆形(半径)、矩形(宽、高)或多边形(点列表) | |
| 任务 | 类型 | 任务类型(“前往”、“引导至”或“跟随”) |
| 位置+阈值 | 针对前往和引导至任务的二维位置+阈值(米) | |
| 方向+阈值 | 针对前往和引导至任务的方向+阈值(弧度) | |
| 人类标识符 | 针对引导至和跟随任务 | |
| 上下文 | 英文描述的上下文 | |
| 人类 | 标识符 | 唯一标识人类的整数 |
| 位姿 | 二维位置(米)和方向(弧度) | |
| 完整位姿(可选) | COCO-18 关键点集的 3D 位置 | |
| 物体 | 标识符 | 唯一标识物体的整数 |
| 类型 | 描述物体类型的自由文本 | |
| 位姿 | 二维位置(米)和方向(弧度) | |
| 形状 | 物体的二维形状 | |
| 环境 | 墙壁 | 多段线序列(二维,米) |
| 网格 | 占据地图:二维网格+分辨率(米/单元格) | |
| 区域语义 | 描述区域的自由文本,如“室内”、“室外”、“厨房”、“科学博物馆” |
数据组织
原始数据
- 轨迹目录:包含 JSON 格式的轨迹文件,按数据源分类存储。
- 评分目录:每个评分者一个 JSON 文件,包含评分列表和控制问题。
标记数据
通过运行 label_dataset.py 脚本生成标记数据集,包含控制轨迹和其余轨迹。
数据分割
使用 split_dataset.py 脚本将数据集分为训练/验证/测试集,默认比例为 0.9/0.05/0.05。
数据获取
- 原始轨迹:https://www.dropbox.com/scl/fo/ze7op896sqb5tog89xnpl/AEm4g0fbyV_71tpR1ESH7Ic?rlkey=ev768vt29mug8b6z2acg3fdjf&st=dce05pti&dl=0
- 评分数据:https://www.dropbox.com/scl/fo/yybho991ousbt1grhnd1s/ABwXfRZpGrIQ_Tx8RK9XUBM?rlkey=nok46jegkd3xsobdwdwhhxygd&st=669o74cw&dl=0
- 标记数据集:https://www.dropbox.com/scl/fo/go4ud504exi7yr7sq1mwy/AKSA84sasbsPIvOjP78zdoY?rlkey=o4k1onc9fxdmr0ysbb68a2b1k&st=4jts131i&dl=0
- 数据分割:https://www.dropbox.com/scl/fo/6r83hv5pvrxhqs43692eb/AKak5wV8neRBl_O5--Tzayc?rlkey=2oujnu64d2jkigz6647y0vz8k&st=xhcqwg5g&dl=0
工具支持
数据分析
check_quality.py:评估评分者一致性。select_valid_raters.py:选择有效评分者子集。
数据转换
- 镜像变换、数据归一化、随机噪声添加、随机方向变换。
数据可视化
view_data.py:生成轨迹的二维俯视图。- 3D 可视化工具:基于 Webots 生成三维俯视视频。
基准模型
模型训练
- 使用 RNN 架构训练 ALT 指标模型。
- 上下文嵌入通过大型语言模型生成。
- 超参数通过 YAML 文件配置。
模型评估
evaluate_model.py:计算均方误差和平均绝对误差。control_results.py:比较控制问题的预测结果。plot_qual_with_contexts.py:生成定性分析图。
数据贡献
轨迹贡献者
- Pilar Bachiller:使用 SocNavGym 仿真的数据( Universidad de Extremadura)
- Luis J. Manso:使用 Aston University 的 RB-1 机器人采集的真实数据
- Phani T. Singamaneni:Gazebo 仿真数据( Laboratory for Analysis and Architecture of Systems - CNRS)
- Noé Pérez:Gazebo 仿真数据( Universidad Pablo de Olavide)
- Noriaki Hirose 和 Dhruv Shah:SACSoN 数据集适配数据( Toyota, UC Berkeley, Google DeepMind)
贡献方式
- 新轨迹:按指定格式记录数据,验证后通过邮件提交。
- 新评分:通过调查工具进行匿名评分。
搜集汇总
数据集介绍

构建方式
在社交机器人导航研究领域,SocNav3数据集的构建采用了多源轨迹采集与人类评分相结合的创新方法。该数据集通过记录真实与仿真环境中的机器人运动轨迹,涵盖机器人位姿、速度、任务类型及环境语义等多维度变量。每位评分者在匿名条件下对特定上下文中的轨迹进行主观评价,形成包含轨迹标识符、情境描述与评分的三元组数据。数据采集过程严格遵循标准化JSON格式,并利用一致性分析工具筛选高质量评分,确保数据集构建的科学性与可扩展性。
特点
SocNav3数据集的核心特点体现在其多层次结构化设计与情境化评分机制。数据集包含机器人、人类、物体及环境的动态时空信息,其中情境描述以自然语言形式独立于轨迹数据,支持同一轨迹在不同上下文中的差异化评估。评分数据兼具匿名化人口统计信息与质量控制机制,通过一致性分析保障数据可靠性。此外,数据集提供原始轨迹与标注版本的双重访问路径,并支持镜像变换、噪声注入等数据增强操作,为社交导航模型的泛化能力提供坚实基础。
使用方法
使用SocNav3数据集需经历数据下载、标注生成与数据集划分三个核心步骤。用户首先通过官方链接获取原始轨迹与评分数据,运行label_dataset.py脚本生成带标注的数据集。随后利用split_dataset.py按预设比例划分训练集、验证集与测试集。模型训练阶段需加载划分后的数据,结合大语言模型生成的情境嵌入向量,输入至RNN基线网络进行端到端学习。数据集配套提供数据可视化、质量分析与变换工具,支持用户进行轨迹校验、一致性评估及数据增强等操作,全面保障研究流程的严谨性与可复现性。
背景与挑战
背景概述
社会机器人导航领域长期缺乏标准化评估体系,SocNav3数据集应运而生。该数据集由阿斯顿大学、埃斯特雷马杜拉大学等机构联合构建,于2025年正式发布,旨在通过数据驱动方法解决社会导航策略的量化评估难题。其核心研究聚焦于建立全包式学习轨迹度量标准(ALT-metric),通过采集人类对完整机器人轨迹的评分数据,结合任务目标与环境上下文,为社会导航算法的性能评估提供科学依据。该数据集通过融合仿真与真实环境数据,涵盖多模态轨迹信息,显著推动了社会导航领域的标准化进程。
当前挑战
社会导航评估面临主观性强的核心挑战,传统方法难以量化人类对机器人行为的社会接受度。SocNav3通过构建大规模人类评分数据解决该问题,但数据收集需克服评分者一致性控制、多场景泛化等难点。在数据构建过程中,需协调多机构异构数据源,统一机器人姿态、环境语义等十余类数据的标准化格式,同时确保轨迹与上下文描述的精确对齐。此外,文本上下文嵌入的量化处理与多模态数据的时间同步也对数据质量提出更高要求。
常用场景
经典使用场景
在社交机器人导航研究领域,SocNav3数据集被广泛应用于训练和评估数据驱动的导航策略评价指标。该数据集通过记录机器人在多样化环境中的运动轨迹,并结合人类评价者对这些轨迹在特定上下文中的评分,为研究者提供了丰富的多模态数据。典型应用包括基于循环神经网络的ALT度量模型训练,该模型能够根据目标位置和环境上下文预测人类对机器人轨迹的接受度,从而为导航算法的优化提供量化依据。
实际应用
在实际应用层面,SocNav3数据集为服务机器人、医疗辅助机器人和公共空间导航系统提供了重要的开发支撑。基于该数据集训练的导航评价模型能够帮助机器人在医院、博物馆等复杂社交环境中生成更符合人类期望的移动路径。这些应用不仅提升了人机交互的自然度,还显著降低了机器人在密集人群环境中可能造成的社交冲突和安全风险。
衍生相关工作
该数据集已衍生出多个重要研究方向,包括基于LLM的上下文嵌入量化方法、多模态轨迹特征提取技术以及跨场景的导航策略迁移学习。相关经典工作包括集成SocNavGym仿真平台的环境建模研究、基于RB-1实机平台的验证实验,以及针对SACSoN数据集的知识迁移方法。这些工作共同推动了数据驱动社交导航度量标准的标准化进程。
以上内容由遇见数据集搜集并总结生成



