Record400
收藏Hugging Face2025-08-29 更新2025-08-30 收录
下载链接:
https://huggingface.co/datasets/Manchesterokaa/Record400
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用LeRobot工具创建,包含了多种类型的数据,如动作特征、观察状态、正面和侧面图像等。具体包括肩部、肘部、手腕和夹爪的位置信息,以及视频的相关参数。数据集共有10个剧集,4534帧,20个视频,分为1个块,每个块大小为1000。所有视频的帧率为30fps,且没有音频。训练集的比例为0到10。
创建时间:
2025-08-28
原始信息汇总
数据集概述
基本信息
- 名称: Record400
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 总任务数: 1
- 总视频数: 20
- 总片段数: 10
- 总帧数: 4534
- 数据块数: 1
- 块大小: 1000
- 帧率: 30 FPS
数据格式
- 数据文件格式: Parquet
- 数据文件路径:
data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet - 视频文件路径:
videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
动作特征
- 名称: action
- 数据类型: float32
- 形状: [6]
- 关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测特征
状态观测
- 名称: observation.state
- 数据类型: float32
- 形状: [6]
- 关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
图像观测
前视图像
- 名称: observation.images.front
- 数据类型: video
- 分辨率: 480×640×3
- 视频编码: av1
- 像素格式: yuv420p
- 深度图: 否
- 音频: 无
侧视图像
- 名称: observation.images.side
- 数据类型: video
- 分辨率: 480×640×3
- 视频编码: av1
- 像素格式: yuv420p
- 深度图: 否
- 音频: 无
元数据特征
- 时间戳: float32, 形状[1]
- 帧索引: int64, 形状[1]
- 片段索引: int64, 形状[1]
- 索引: int64, 形状[1]
- 任务索引: int64, 形状[1]
分割信息
- 训练集: 片段0-10
技术信息
- 代码库版本: v2.1
- 机器人类型: so101_follower
搜集汇总
数据集介绍

构建方式
在机器人技术领域,Record400数据集通过LeRobot平台系统性地采集了真实环境下的机械臂操作数据。该数据集包含10个完整任务片段,总计4534帧数据,以30fps的帧率记录,采用分块存储策略,每个数据块容纳1000帧。数据以Parquet格式保存,确保了高效存储与读取,同时配套视频文件采用AV1编解码技术,兼顾视觉质量与压缩效率。
特点
Record400数据集的核心价值体现在其多模态特性与精细标注体系。数据集同步记录了六自由度机械臂的关节位置动作信号、双视角视觉观测(前视与侧视480x640 RGB图像)及时间戳元数据。动作空间与观测状态均采用float32精度存储,视频流配备完整的元信息描述,包括分辨率、编解码参数及通道配置,为模仿学习与行为克隆研究提供高精度时空对齐的多模态数据流。
使用方法
研究者可通过HuggingFace数据集库直接加载Record400,利用标准接口访问分块存储的Parquet数据文件。数据按episode_index与chunk索引组织,支持按时间步索引访问动作-观测对。视频数据可通过video_path字段关联MP4文件,特征字段包含完整的形状与数据类型定义,兼容主流的深度学习框架进行端到端策略学习或行为分析。
背景与挑战
背景概述
Record400数据集作为机器人学习领域的重要数据资源,由HuggingFace的LeRobot项目团队构建,专注于机械臂控制与视觉感知的协同研究。该数据集采用Apache 2.0开源协议,通过六自由度机械臂(so101_follower型)采集多模态数据,包含4534帧高精度动作轨迹与双视角视觉记录,旨在推动模仿学习与强化学习算法在真实场景中的应用。其设计体现了机器人技术从单一传感器向多模态融合的发展趋势,为具身智能研究提供了宝贵的实验基础。
当前挑战
数据集核心挑战在于解决机器人操作任务中的高维连续控制问题,其六维动作空间与双视角视觉观测的复杂性对策略网络的表征能力提出极高要求。构建过程中需克服多传感器时序同步、大规模视频数据压缩存储(采用AV1编解码)与轨迹数据精确标注等工程难题,同时确保10个完整任务 episode 的数据一致性与可复现性。
常用场景
经典使用场景
在机器人学习领域,Record400数据集为模仿学习算法提供了丰富的多模态训练素材。该数据集通过记录六自由度机械臂的关节位置状态与双视角视觉观测,构建了完整的动作-状态-观测映射关系,特别适用于端到端的策略网络训练。研究者可利用其时序连贯的演示数据,训练机器人完成复杂的轨迹规划任务。
实际应用
基于Record400数据集训练的模型可广泛应用于工业分拣、精密装配等场景。双视角视觉输入增强了模型对物体空间关系的理解能力,而六维动作输出可直接控制协作机械臂执行抓取任务。该数据集支持的端到端学习范式显著降低了传统机器人编程的复杂度,为柔性制造生产线提供了即插即用的智能解决方案。
衍生相关工作
该数据集催生了多项机器人行为克隆与视觉运动控制的重要研究。基于其多模态特性,研究者开发了跨模态注意力机制与时空特征融合网络,显著提升了动作预测的精度。后续工作进一步扩展了数据集的应用范围,衍生出基于元学习的快速适应框架与多任务协同训练范式,推动了机器人学习从单一任务向通用技能掌握的演进。
以上内容由遇见数据集搜集并总结生成



