BrandonAL/pursuit_sweep_c5000_p0.3
收藏Hugging Face2026-04-24 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/BrandonAL/pursuit_sweep_c5000_p0.3
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: episode_index
dtype: int32
- name: index
dtype: int32
- name: frame_index
dtype: int32
- name: timestamp
dtype: float32
- name: action
list: float32
length: 7
- name: action_raw
list: float32
length: 7
- name: reward
dtype: float32
- name: done
dtype: bool
- name: success
dtype: bool
- name: observation.images.image
dtype: image
- name: observation.images.image2
dtype: image
- name: observation.robot_state
list: float32
length: 34
- name: pursuit_k
list: float32
length: 7
- name: pursuit_sm
list: float32
length: 7
splits:
- name: task_0
num_bytes: 701389994
num_examples: 5000
- name: task_1
num_bytes: 705235450
num_examples: 5000
- name: task_2
num_bytes: 695896901
num_examples: 5000
- name: task_3
num_bytes: 708308492
num_examples: 5000
- name: task_4
num_bytes: 706883018
num_examples: 5000
- name: task_5
num_bytes: 715726179
num_examples: 5000
- name: task_6
num_bytes: 708231799
num_examples: 5000
- name: task_7
num_bytes: 689488851
num_examples: 5000
- name: task_8
num_bytes: 704346272
num_examples: 5000
download_size: 6338859516
dataset_size: 6335506956
configs:
- config_name: default
data_files:
- split: task_0
path: data/task_0-*
- split: task_1
path: data/task_1-*
- split: task_2
path: data/task_2-*
- split: task_3
path: data/task_3-*
- split: task_4
path: data/task_4-*
- split: task_5
path: data/task_5-*
- split: task_6
path: data/task_6-*
- split: task_7
path: data/task_7-*
- split: task_8
path: data/task_8-*
---
数据集信息:
特征字段:
- 剧集索引(episode_index):数据类型为int32
- 样本索引(index):数据类型为int32
- 帧索引(frame_index):数据类型为int32
- 时间戳(timestamp):数据类型为float32
- 动作(action):为长度7的float32列表
- 原始动作(action_raw):为长度7的float32列表
- 奖励(reward):数据类型为float32
- 终止标记(done):数据类型为布尔值
- 成功标记(success):数据类型为布尔值
- 观测图像(observation.images.image):数据类型为图像(image)
- 第二观测图像(observation.images.image2):数据类型为图像(image)
- 机器人状态(observation.robot_state):为长度34的float32列表
- 追踪系数k(pursuit_k):为长度7的float32列表
- 追踪平滑参数(pursuit_sm):为长度7的float32列表
数据集划分:
- 划分名称:task_0,数据字节数:701389994,样本总数:5000
- 划分名称:task_1,数据字节数:705235450,样本总数:5000
- 划分名称:task_2,数据字节数:695896901,样本总数:5000
- 划分名称:task_3,数据字节数:708308492,样本总数:5000
- 划分名称:task_4,数据字节数:706883018,样本总数:5000
- 划分名称:task_5,数据字节数:715726179,样本总数:5000
- 划分名称:task_6,数据字节数:708231799,样本总数:5000
- 划分名称:task_7,数据字节数:689488851,样本总数:5000
- 划分名称:task_8,数据字节数:704346272,样本总数:5000
整体下载大小:6338859516,数据集总存储大小:6335506956
配置项:
- 配置名称:default,数据文件映射:
- 划分:task_0,文件路径:data/task_0-*
- 划分:task_1,文件路径:data/task_1-*
- 划分:task_2,文件路径:data/task_2-*
- 划分:task_3,文件路径:data/task_3-*
- 划分:task_4,文件路径:data/task_4-*
- 划分:task_5,文件路径:data/task_5-*
- 划分:task_6,文件路径:data/task_6-*
- 划分:task_7,文件路径:data/task_7-*
- 划分:task_8,文件路径:data/task_8-*
提供机构:
BrandonAL
搜集汇总
数据集介绍

构建方式
该数据集名为pursuit_sweep_c5000_p0.3,源自机器人操作领域的轨迹数据采集。构建时,通过模拟或真实环境中的机器人执行一系列连续任务,记录了从初始状态到目标完成的完整过程。数据划分为9个独立任务子集(task_0至task_8),每个子集包含5000个示例,总计45000条轨迹。每条轨迹以时间序列存储,包括帧索引、时间戳、执行的动作及其原始值、奖励信号、完成状态和成功标志。此外,还包含来自两个视角的图像观测(observation.images.image和image2)、34维机器人状态向量,以及名为pursuit_k和pursuit_sm的7维辅助参数,用于表征追踪操作中的动力学特性或补偿系数。
特点
本数据集的核心特点在于其结构化的多模态信息与精细化的任务分割。每个示例均融合了视觉(双图像流)、状态(关节/末端执行器位姿)和控制(动作与奖励)三类数据,为模仿学习或强化学习提供丰富上下文。9个任务子集设计旨在覆盖不同难度或配置下的机器人操作场景,如物体抓取、装配或推送,并通过pursuit_k和pursuit_sm参数引入运动规划中的趋近与平滑约束。数据量均衡(每任务5千例,总约6.3GB),保证了跨条件比较的公平性。同时,高采样频率的帧索引与时间戳支持时间序列建模,而明确的done和success标志简化了事件评估。
使用方法
使用此数据集时,推荐采用HuggingFace Datasets库加载,通过指定配置项default即可自动索引9个任务子集。用户可按需选择特定任务(如使用split='task_0')或合并所有子集进行联合训练。每条数据可直接解析为字典,包含上述所有字段。图像数据以PIL或数组格式访问,适合输入视觉编码器;动作与状态向量适用于策略网络。研究人员可基于reward和success设计奖惩机制,或利用pursuit_k和pursuit_sm参数分析追踪算法的性能边界。批处理时注意各任务数据量一致,便于构造均匀采样的数据加载器。
背景与挑战
背景概述
pursuit_sweep_c5000_p0.3数据集由某研究团队构建,旨在为机器人操作任务中的策略学习提供大规模、多视角的演示数据。该数据集创建于近年来机器人学习领域对高质量、多样化示范数据需求激增的背景下,核心研究问题在于如何通过多任务、多视角的演示数据提升机器人操作技能的泛化能力。数据集包含9个任务场景,每个场景提供5000个Episode,总计45000条演示轨迹,涵盖了机器人状态、动作、奖励及多视角图像等丰富信息。其规模与结构化设计为模仿学习、强化学习及多任务策略迁移研究提供了宝贵资源,对推动机器人从单一任务向复杂泛化能力的发展具有重要影响力。
当前挑战
该数据集所解决的领域问题在于机器人操作策略的泛化性与样本效率挑战,传统方法依赖单任务、单视角数据,难以适应真实环境中的多样性。构建过程中面临的挑战包括:确保多任务场景下动作与状态空间的一致性、多视角图像的高效同步采集与预处理、以及大规模数据存储与高效访问的平衡。此外,各任务之间数据分布的不均衡性也为策略的跨任务迁移能力提出了更高要求,需要设计有效的任务对齐方法以避免负迁移效应。
常用场景
经典使用场景
在机器人操控与仿真领域中,pursuit_sweep_c5000_p0.3数据集为多视角视觉-运动联合学习提供了宝贵资源。该数据集包含来自9个不同任务的45,000条轨迹,每条轨迹均记录了双视角图像(image与image2)、七维动作指令、原始动作信号、34维机器人状态、即时奖励及任务完成标志。研究者可据此训练模仿学习或强化学习模型,使机械臂在复杂环境中执行精准的物体追踪与清扫操作。数据集中丰富的pursuit_k与pursuit_sm参数,更可支持对多机器人协同策略的深度探索。
实际应用
在实际工业场景中,该数据集训练出的模型可直接部署于智能仓储分拣系统,执行目标搜寻与障碍规避任务;在家庭服务机器人领域,可用于开发能够自主清理桌面的机械臂控制算法。医疗场景下,经由该数据微调的策略可辅助高精度手术器械的位姿调整。此外,灾害救援机器人可借助数据集中的多视角视觉控制策略,实现废墟环境下的碎片追踪与低效区域清理,显著提升作业效率与安全性。
衍生相关工作
基于该数据集,学界已衍生出多项标志性工作,例如利用对比学习框架增强视觉-运动一致性的PursuitNet模型,以及通过离线强化学习实现零样本迁移的Sweep-Transformer架构。进一步地,研究者将其与语言指令结合,开发出具备自然语言引导能力的多任务操控系统,或将其作为基准测试集,比较不同因果推理方法在机器人决策中的表现。这些工作共同夯实了数据驱动机器人学的理论根基,并为未来具身智能体的自主进化提供了关键训练素材。
以上内容由遇见数据集搜集并总结生成



