SocNav3

Name: SocNav3
Creator: Universidad de Extremadura, Aston University, Logical Robotics, University of California Berkeley, TOYOTA Motor North America, Universidad Pablo de Olavide, Princeton University, LAAS-CNRS, George Mason University
Published: 2025-09-01 16:42:28
License: 暂无描述

arXiv2025-09-01 更新2025-09-05 收录

下载链接：

https://github.com/SocNavData/SocNav3

下载链接

链接失效反馈

官方服务：

资源简介：

SocNav3数据集由来自西班牙的Universidad de Extremadura和英国的Aston University等多个研究机构合作创建。该数据集包含4427条轨迹，其中包括182条真实轨迹和4245条模拟轨迹，用于社会机器人导航的基准测试和策略优化。数据集详细记录了轨迹的环境、人类、机器人任务、机器人上下文、人类、物体和环境信息，以及人类评分者的评分。该数据集旨在通过数据驱动的方法，学习一种全面的轨迹度量标准，用于评估机器人的整体有效性和社交性，以解决现有度量的局限性。数据集的创建过程包括收集轨迹、人类评分和数据分析，可用于训练ALT度量标准，促进机器人导航策略的开发。

SocNav3 Dataset was collaboratively created by multiple research institutions including the Universidad de Extremadura in Spain and Aston University in the United Kingdom. This dataset contains 4427 trajectories, of which 182 are real-world trajectories and 4245 are simulated trajectories, and is used for benchmark testing and strategy optimization of social robot navigation. The dataset thoroughly documents the environment, humans, robot tasks, robot context, objects and environmental information related to the trajectories, as well as the scores provided by human raters. The dataset aims to learn a comprehensive trajectory metric for evaluating the overall effectiveness and sociality of robots through data-driven methods, so as to address the limitations of existing metrics. The dataset creation process includes trajectory collection, human scoring and data analysis, and can be used to train the ALT metric to promote the development of robot navigation strategies.

提供机构：

Universidad de Extremadura, Aston University, Logical Robotics, University of California Berkeley, TOYOTA Motor North America, Universidad Pablo de Olavide, Princeton University, LAAS-CNRS, George Mason University

创建时间：

2025-09-01

原始信息汇总

SocNav3 数据集概述

数据集简介

SocNav3 是一个用于社交机器人导航基准测试的数据集，旨在支持数据驱动的社交机器人导航指标开发。该数据集包含轨迹数据、评分者信息和评分数据，用于训练和评估全包学习轨迹指标（ALT 指标）。

数据组成

数据类型

轨迹数据：包含机器人、任务、人类、对象和环境信息。
评分者数据：包含评分者的人口统计信息和评分列表。
评分数据：包含评分者对特定轨迹在给定上下文中的评分。

数据格式

轨迹数据以 JSON 格式存储，包含以下变量：

类型	变量	描述
机器人	姿态	二维位置（米）和方向（弧度）。
	速度	线速度（米/秒）和角速度（弧度/秒）。
	驱动方式	分类（差速 / 全向 / 阿克曼）。
	形状	二维圆形（半径）、矩形（宽度、高度）或多边形（点列表）。
任务	类型	任务类型，包括“前往”、“引导至”或“跟随”。
	位置 + 阈值	用于前往和引导至任务的二维位置 + 阈值（米）。
	方向 + 阈值	用于前往和引导至任务的方向 + 阈值（弧度）。
	人类标识符	用于引导至和跟随任务。
	上下文	上下文的文本描述（英文）。
人类	标识符	在给定场景中唯一标识人类的整数。
	姿态	二维位置（米）和方向（弧度）。
	完整姿态（可选）	COCO-18 关键点集的 3D 位置。
对象	标识符	在给定场景中唯一标识对象的整数。
	类型	描述对象类型的自由文本。
	姿态	二维位置（米）和方向（弧度）。
	形状	对象的二维形状。
环境	墙壁	折线序列（二维，米）。
	网格	占用地图：二维网格 + 分辨率（米/单元格）。
	区域语义	描述区域的自由文本，例如“室内”、“室外”、“厨房”、“科学博物馆”。

数据组织

轨迹目录：包含 JSON 格式的轨迹文件，按数据源分组。
评分目录：包含每个评分者的 JSON 文件，包括评分列表和控制问题。

数据获取

原始数据：https://www.dropbox.com/scl/fo/5mdx98kxux31tpz17t737/ABZuqYOXVMrcGJmUGeBQBo0?rlkey=70f89t67bg4zoa6g6lw5dcflg&st=2o6n9lbn&dl=0
标记数据：https://www.dropbox.com/scl/fo/go4ud504exi7yr7sq1mwy/AKSA84sasbsPIvOjP78zdoY?rlkey=o4k1onc9fxdmr0ysbb68a2b1k&st=4jts131i&dl=0
数据分割：https://www.dropbox.com/scl/fo/6r83hv5pvrxhqs43692eb/AKak5wV8neRBl_O5--Tzayc?rlkey=2oujnu64d2jkigz6647y0vz8k&st=xhcqwg5g&dl=0

工具支持

数据分析

检查评分者一致性并生成一致性地图。
选择有效评分者子集。

数据转换

镜像变换、数据归一化、随机噪声添加和随机方向变换。

数据可视化

2D 轨迹查看工具。
基于 Webots 的 3D 可视化工具。

基准模型

使用 RNN 基于 ALT 指标模型进行训练和评估。
支持模型训练、评估和定性测试。

贡献方式

贡献新轨迹：按指定格式记录数据，验证并可视化后联系贡献。
贡献新评分：使用调查工具进行匿名评分。

数据贡献者

Pilar Bachiller（使用 SocNavGym 获取模拟数据）—— 埃斯特雷马杜拉大学
Luis J. Manso（使用阿斯顿大学的 RB-1 机器人获取真实数据）—— 阿斯顿大学
Phani T. Singamaneni（在 Gazebo 上的模拟数据）—— 法国国家科学研究中心系统分析与架构实验室
Noé Pérez（在 Gazebo 上的模拟数据）—— 巴勃罗·德·奥拉维德大学
Noriaki Hirose 和 Dhruv Shah（适应 SACSoN 数据集的数据）—— 丰田、加州大学伯克利分校、Google DeepMind

搜集汇总

数据集介绍

构建方式

SocNav3数据集的构建采用了多源轨迹采集策略，结合真实环境与仿真环境的数据。真实轨迹通过实验室场景和公开数据集SACSoN获取，共计182条；仿真轨迹则利用SocNavGym、HATEB等平台生成，达4245条。所有轨迹均通过标准化JSON格式存储，包含机器人状态、任务上下文、人类及物体信息等多维变量。数据采集后通过在线调查工具邀请人类评分者进行轨迹质量评估，最终经过一致性筛选得到4402条有效评分数据。

特点

该数据集的核心特点在于其全轨迹评估框架与上下文敏感性。每条轨迹均附带任务类型（如“到达目标”）、环境语义描述及人类姿态等丰富注释，支持对社交导航行为的细粒度分析。数据集涵盖室内场景，包含静态与动态人类交互情景，并通过控制问题确保评分者一致性。其独特之处在于融合真实与仿真数据，既保障伦理安全性，又通过规模扩展提升模型泛化能力。

使用方法

SocNav3数据集主要用于训练基于学习的社交导航评估指标（ALT指标）。用户可通过加载标准化JSON文件获取轨迹与评分数据，利用配套工具进行可视化或数据增强。典型流程包括：使用PyTorch数据转换器对轨迹特征（如速度、距离指标）进行归一化，结合LLM生成的上下文嵌入向量，输入至RNN或GRU等序列模型进行端到端训练。该数据集还可用于强化学习策略优化，通过最大化学习到的指标分数改进导航行为。

背景与挑战

背景概述

社会机器人导航领域随着学术研究兴趣的持续增长与工业应用的广泛拓展而日益重要。SocNav3数据集由阿斯顿大学、埃斯特雷马杜拉大学等多家机构联合开发，旨在解决社会机器人导航评估标准化缺失的问题。该数据集构建于2023年，包含4427条轨迹数据（182条真实轨迹与4245条模拟轨迹），通过人类评分机制为每条轨迹赋予社会适应性评分。其核心研究在于通过数据驱动方法建立全涵盖学习型轨迹度量标准（ALT metric），以统一评估机器人导航行为的社会兼容性、安全性与效率，推动社会机器人导航算法的标准化发展。

当前挑战

该数据集首要解决社会机器人导航领域缺乏统一评估标准的挑战，具体包括如何量化评估轨迹的社会适应性、如何平衡安全性指标与效率指标的权衡关系，以及如何将任务类型与环境上下文纳入评估体系。在构建过程中面临多重挑战：真实轨迹采集受限于安全伦理约束，需通过模拟数据补充高风险场景；人类评分的一致性保障需通过复杂的统计筛选机制（如二次加权Cohen's kappa系数）确保数据可靠性；多模态数据融合涉及机器人运动学参数、环境语义信息与人类行为特征的标准化表征，需设计统一的数据规范与可视化工具链支持。

常用场景

经典使用场景

在社交机器人导航研究领域，SocNav3数据集被广泛用于训练和评估数据驱动的轨迹质量度量模型。该数据集通过整合真实与仿真环境中的4427条导航轨迹及其人类评分，为研究者提供了标准化基准测试框架，典型应用于比较不同导航算法在社交合规性、安全性和效率方面的综合表现。

解决学术问题

该数据集解决了社交机器人导航领域缺乏统一评估标准的核心问题，通过人类标注的轨迹评分数据支持学习型度量模型的开发，克服了传统解析度量在任务上下文敏感性和可扩展性方面的局限，为实证驱动的导航策略优化提供了理论基础。

衍生相关工作

基于SocNav3的基线GRU模型启发了多模态融合架构的研究，如结合视觉语言模型的上下文感知度量方法。该数据集还推动了SocNavGym仿真平台的增强，衍生出基于强化学习的社交导航策略优化工作，并为JRDB、THOR等数据集提供了轨迹质量标注的范式参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集