record-test
收藏Hugging Face2025-08-04 更新2025-08-05 收录
下载链接:
https://huggingface.co/datasets/Cy-71/record-test
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于机器人的数据集,包含多个剧集,每个剧集中包含多个帧和任务。数据以Parquet文件格式存储,其中包括动作位置、观察状态、时间戳、视频帧等特征。数据集被划分为训练集,并使用Apache-2.0许可证。具体的数据集描述没有在README文件中提供。
创建时间:
2025-08-01
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: 机器人学 (robotics)
- 标签: LeRobot
- 配置:
- 默认配置: 数据文件路径为
data/*/*.parquet
- 默认配置: 数据文件路径为
数据集描述
- 创建工具: 使用 LeRobot 创建
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 总集数: 1
- 总帧数: 1789
- 总任务数: 1
- 总视频数: 1
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 数据分割:
- 训练集: 0:1
- 数据路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
- 动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- 观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
- 观测图像 (observation.images.front):
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: height, width, channels
- 视频信息:
- 高度: 1080
- 宽度: 1920
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 fps
- 通道数: 3
- 是否有音频: false
- 时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
- 帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
- 集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
- 索引 (index):
- 数据类型: int64
- 形状: [1]
- 任务索引 (task_index):
- 数据类型: int64
- 形状: [1]
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,高质量数据集的构建对算法训练至关重要。record-test数据集依托LeRobot平台,采用结构化数据采集流程,通过so101_follower型机器人记录连续操作任务。数据以30fps的采样频率捕获,包含1789帧完整操作序列,存储为标准化parquet格式,确保数据的一致性与可追溯性。每个数据块包含动作指令、关节状态、前端视觉观测及时间戳等多模态信息,形成完整的机器人操作闭环记录。
特点
该数据集显著特点在于其多模态数据融合架构,同步收录六维关节空间动作指令与对应状态反馈,以及1080p高清前端视觉流。数据维度涵盖机械臂的肩部平移、肩部抬升、肘部屈伸、腕部屈伸、腕部旋转及夹爪开合等全部自由度,配合精确到帧的时间索引和任务标识,为模仿学习与行为克隆研究提供丰富上下文。视觉数据采用AV1编码压缩,在保证质量的同时优化存储效率。
使用方法
研究者可通过HuggingFace平台获取该数据集,按照标准数据加载流程解析parquet文件结构。数据集已预划分为训练集,支持直接加载动作-观测对用于策略网络训练。视觉数据可通过视频路径字段访问,配合帧索引实现精确对齐。使用时应注重时序一致性验证,建议利用episode_index和frame_index构建数据采样策略,适用于端到端机器人控制模型训练与强化学习环境构建。
背景与挑战
背景概述
机器人学习领域近年来对高质量数据集的需求日益增长,record-test数据集应运而生。该数据集由LeRobot团队基于Apache 2.0许可证构建,专门针对六自由度机械臂的模仿学习任务。数据集采用SO101跟随者机器人平台,记录了包含1789帧的高精度运动轨迹与视觉观测数据,其时间分辨率达到30Hz。通过精确标注的关节位置状态和前端视觉信息,该数据集为机器人行为克隆与强化学习算法提供了重要的基准测试资源。
当前挑战
该数据集致力于解决机器人模仿学习中高维状态-动作映射的复杂性挑战,特别是在连续控制任务中的动作序列预测问题。构建过程中面临多模态数据同步的技术难题,需要确保机械臂关节编码器数据与视觉传感器帧率的精确对齐。数据采集环节需克服机械系统噪声干扰和传感器漂移问题,同时保持操作任务的一致性与可重复性。数据处理阶段涉及大规模视频编码与运动轨迹数据的存储优化,需平衡数据精度与存储效率的矛盾。
常用场景
经典使用场景
在机器人学习领域,record-test数据集为模仿学习算法提供了标准化的验证平台。该数据集通过记录六自由度机械臂的关节位置状态和前端视觉观测数据,构建了完整的动作-状态-观测映射关系。研究者可基于该数据集训练端到端的策略网络,使机器人能够从视觉输入直接生成关节控制指令,实现精确的动作模仿与任务执行。
实际应用
工业自动化场景中,该数据集可直接应用于机器人示教编程系统的开发。通过记录熟练操作员的示范动作,系统能够学习并复现精密装配、物料分拣等操作流程。服务机器人领域则可基于此类数据开发家居物品抓取、桌面整理等日常任务能力,显著降低机器人编程的专家门槛与时间成本。
衍生相关工作
基于该数据格式衍生了多项机器人学习领域的经典研究,包括基于时空注意力的行为克隆框架、多视角视觉特征融合模型以及强化学习与模仿学习结合的混合算法。这些工作通过利用数据集提供的多模态时序数据,在动作预测精度和任务泛化能力方面取得了突破性进展,推动了机器人感知-控制一体化研究的发展。
以上内容由遇见数据集搜集并总结生成



