2026-05-04_direction-lerobot-without-rinse
收藏Hugging Face2026-05-09 更新2026-05-10 收录
下载链接:
https://huggingface.co/datasets/lyl472324464/2026-05-04_direction-lerobot-without-rinse
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,专为机器人学任务设计。数据集包含81个总片段,34,908帧数据,总数据文件大小为200MB,视频文件大小也为200MB。数据以50fps的帧率采集,适用于训练目的。数据集结构包括多个特征字段,如观察状态(14个浮点数,表示左右机械臂的各个关节状态)、动作(同样14个浮点数)、速度和力矩。此外,数据集还提供了四个不同视角的视频数据(cam_high, cam_low, cam_left_wrist, cam_right_wrist),每个视频的分辨率为480x640,3通道,50fps,编码格式为av1。数据集采用Apache-2.0许可证,适用于机器人控制、行为克隆和强化学习等任务。
创建时间:
2026-05-07
原始信息汇总
数据集概述
数据集名称: 2026-05-04_direction-lerobot-without-rinse
数据集地址: https://huggingface.co/datasets/lyl472324464/2026-05-04_direction-lerobot-without-rinse
许可证: Apache-2.0
任务类型: 机器人学(Robotics)
数据集描述
该数据集使用 LeRobot 框架创建,是一个面向机器人领域的仿真/真实数据集。
数据集规模与结构
| 指标 | 数值 |
|---|---|
| 总片段数(Episodes) | 81 |
| 总帧数(Frames) | 34,908 |
| 总任务数(Tasks) | 1 |
| 分块大小(Chunks Size) | 1,000 |
| 数据文件大小(Data Files) | 200 MB |
| 视频文件大小(Video Files) | 200 MB |
| 帧率(FPS) | 50 |
| 机器人类型 | aloha |
| 数据文件格式 | Parquet(路径:data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet) |
| 视频文件格式 | MP4(路径:videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4) |
| 训练/验证划分 | 全部81个片段用于训练("train": "0:81") |
特征(Features)
数据集包含以下特征字段,所有数值型特征均存储为 float32 类型:
| 特征名称 | 数据类型 | 形状 | 说明 |
|---|---|---|---|
observation.state |
float32 | [14] | 14维机器人状态(左、右各7维,包括腰、肩、肘、前臂旋转、腕角、腕旋转、夹爪) |
action |
float32 | [14] | 14维动作指令(左、右各7维,名称与状态一致) |
observation.velocity |
float32 | [14] | 14维关节速度(左、右各7维) |
observation.effort |
float32 | [14] | 14维关节力矩/力(左、右各7维) |
observation.images.cam_high |
video | [3, 480, 640] | 高清摄像头图像(RGB,480x640,AV1编码,50 FPS) |
observation.images.cam_low |
video | [3, 480, 640] | 低清摄像头图像(RGB,480x640,AV1编码,50 FPS) |
observation.images.cam_left_wrist |
video | [3, 480, 640] | 左手腕摄像头图像(RGB,480x640,AV1编码,50 FPS) |
observation.images.cam_right_wrist |
video | [3, 480, 640] | 右手腕摄像头图像(RGB,480x640,AV1编码,50 FPS) |
task_index |
int64 | [1] | 任务索引 |
subtask |
string | [1] | 子任务标签 |
is_for_training |
bool | [1] | 是否用于训练 |
timestamp |
float32 | [1] | 时间戳 |
frame_index |
int64 | [1] | 帧索引 |
episode_index |
int64 | [1] | 片段索引 |
index |
int64 | [1] | 全局索引 |
视频编码信息
所有摄像头图像视频流均采用以下编码规范:
- 编码器:AV1
- 像素格式:yuv420p
- 分辨率:480 x 640
- 帧率:50 FPS
- 通道数:3(RGB)
- 非深度图
- 无音频
引用信息
当前数据集暂无引用论文信息([More Information Needed])。
搜集汇总
数据集介绍

构建方式
在机器人学习领域,精准的动作捕捉与多模态数据融合是模仿学习成功的关键。本数据集基于LeRobot框架构建,利用ALOHA双臂机器人平台采集精细操作数据。数据集包含81个完整演示回合,共计34,908帧,所有数据均以50帧/秒的高采样率记录。数据以Parquet格式存储状态与动作信息,并同步保留来自四台摄像机(高角度、低角度、左右腕部)的高清视频流,编码采用AV1格式,分辨率为640×480像素,实现了低存储开销下的高质量视觉输入。数据集采用统一时间戳与帧索引对齐机制,确保动作序列与观测信号的时空一致性。
特点
本数据集的一大特色在于其结构化设计,涵盖了观测状态、动作指令、关节速度与力矩共14维物理量的连续记录,字段命名清晰对应左右臂各关节,便于下游模型解析。视觉部分提供四个视角的同步视频,为多视点策略学习提供了丰富输入。数据集规模紧凑,总存储量约400MB,训练集划分直接覆盖全部81个回合,无验证与测试子集,适合快速迭代验证。所有数据遵从Apache-2.0许可,便于学术界与工业界无障碍使用。
使用方法
数据集通过HuggingFace Datasets库与LeRobot原生接口无缝集成。用户可通过指定默认配置加载Parquet数据与MP4视频文件,利用提供的元信息字段(如frame_index、episode_index)按回合切分序列。数据特征包含observation.state、action等浮点数组,以及图像观测视频键,可直接用于构建基于状态或视觉的策略网络。推荐配合LeRobot的训练与评估流程,将数据转换为标准化的Chunk序列,以支持离线强化学习或行为克隆任务。
背景与挑战
背景概述
该数据集创建于2026年,由Hugging Face的LeRobot团队基于其开源框架构建,旨在为机器人模仿学习与遥操作研究提供高质量的多模态数据。核心研究问题聚焦于通过双机械臂系统(A.L.O.H.A.平台)的14维状态空间与动作空间,以及四台高清摄像头(480×640分辨率,50fps)录制的视觉流,驱动机器人完成精细化操作任务。数据集包含81个完整演示片段,总计超过34,000帧,覆盖了从关节角度、速度到力觉信息的全维观测,为端到端策略学习及行为克隆奠定了坚实基础。其发布对于降低机器人数据采集门槛、推动具身智能领域的标准化评估具有重要影响力。
当前挑战
在领域问题层面,数据集致力于解决机器人复杂操作任务中演示数据的稀缺性与高维度耦合控制难题,尤其是双臂协同作业时14个自由度的高频精准规划与实时响应。在构建过程中,挑战体现在三方面:一是多视角视频(cam_high, cam_low, cam_left_wrist, cam_right_wrist)与状态动作流的精确时间同步,需确保50fps下的帧对齐误差小于2ms;二是数据量虽达200MB,但81个演示片段对于泛化到新场景(如不同物体位置与光照条件)仍显不足,存在过拟合风险;三是数据仅包含单一任务(无任务标签差异),且未提供奖励信号,限制了其在强化学习任务中的直接应用。
常用场景
经典使用场景
在机器人学习与模仿学习的交叉领域中,该数据集为双机械臂协同操作任务提供了高保真的多模态训练资源。基于A型机器人平台采集的81个完整演示轨迹,涵盖了从关节角度、执行器力矩到高清视觉影像在内的全方位观测信息。研究者可借助这些经过精细标定的状态-动作对,训练具备泛化能力的端到端神经网络模型,使机器人能够复现诸如精密装配、物体递送等需要双臂协调的复杂操作。数据集内高达50帧每秒的采样频率,更使其成为探索高频控制策略与动态响应特性的理想实验平台。
实际应用
在工业与服务业场景中,该数据集可为双臂协作型机器人的技能习得提供直接支撑。凭借其中蕴含的丰富演示数据,工程师能够训练出适应精密零件抓取、柔性材料处理或复杂工具使用的智能体,从而替代传统耗时的人工编程流程。例如,数据集内左右腕部相机与全局视角的影像结合,使得机器人可学习在遮挡环境下调整抓取姿态的策略。这些能力在电子元件装配、实验室自动化分拣以及医疗辅助操作等要求高灵巧性与安全性的场合,展现出显著的实用价值。
衍生相关工作
基于此类高质量遥操作数据集,学术界已衍生出一系列里程碑式的工作。在算法层面,以扩散策略和基于Transformer的行为克隆为代表的方法,利用其中海量的状态-动作配对数据,实现了超越传统专家系统的高精度轨迹生成。同时,多模态融合与对比学习框架的提出,亦受益于数据集中视觉与本体感受信息的天然同步特性。此外,该数据集的标准化格式成为了后续诸如RLBench与robosuite等大型基准库构建时的参考模板,有力推动了机器人学习领域内数据共享与算法复现的生态建设。
以上内容由遇见数据集搜集并总结生成



