record-test
收藏Hugging Face2025-09-07 更新2025-09-08 收录
下载链接:
https://huggingface.co/datasets/heyuan1993/record-test
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于机器人学领域的_dataset_,包含了机器人类型为so101_follower的一个任务的数据。数据集共有1671帧,分为一个视频和一个数据块,数据块大小为1000帧。数据集的采样率为30帧每秒,并提供了一种训练数据的分割方式。数据集的特征包括机器人的动作和状态,以及前视摄像头捕获的图像。所有数据存储为Parquet文件,视频文件为MP4格式。
创建时间:
2025-09-07
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 配置名称: default
- 数据文件: data//.parquet
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 总片段数: 1
- 总帧数: 1671
- 总任务数: 1
- 总视频数: 1
- 总块数: 1
- 块大小: 1000
- 帧率: 30
- 分割: {"train": "0:1"}
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征描述
- action:
- 数据类型: float32
- 形状: [6]
- 名称: ["shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos"]
- observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: ["shoulder_pan.pos", "shoulder_lift.pos", "elbow_flex.pos", "wrist_flex.pos", "wrist_roll.pos", "gripper.pos"]
- observation.images.front:
- 数据类型: video
- 形状: [1080, 1920, 3]
- 名称: ["height", "width", "channels"]
- 信息: {"video.height": 1080, "video.width": 1920, "video.codec": "av1", "video.pix_fmt": "yuv420p", "video.is_depth_map": false, "video.fps": 30, "video.channels": 3, "has_audio": false}
- timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
- frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
创建信息
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
引用信息
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,record-test数据集依托LeRobot平台构建,采用高效的数据采集与处理流程。该数据集通过so101_follower型机器人记录真实环境中的操作序列,以30帧每秒的速率捕获高分辨率视频与同步关节状态数据,并采用分块存储策略将1671帧数据整合为标准化parquet格式,确保时序一致性与存储效率。
特点
该数据集显著特点在于多模态数据的深度融合,包含六维关节动作指令、同步机器人状态观测及1080p高清前端视觉画面,形成完整的闭环交互记录。其结构化特征设计涵盖时空索引(时间戳、帧序号、任务索引等),支持精细化的轨迹分析与跨模态关联研究,为模仿学习与行为克隆提供丰富上下文。
使用方法
研究者可通过加载parquet文件直接访问多通道数据流,利用预定义的特征字段(如observation.images.front视频流及action指令序列)构建训练管道。数据集默认划分为训练集,适用于端到端策略学习、视觉运动控制等任务,同时提供标准化视频解码接口以适配主流深度学习框架。
背景与挑战
背景概述
在机器人技术迅猛发展的背景下,record-test数据集作为LeRobot项目的重要组成部分应运而生,专注于机器人行为模仿与强化学习领域的研究。该数据集由HuggingFace机构基于Apache 2.0开源协议构建,采用so101_follower型机器人采集多模态交互数据,包含1671帧高精度动作序列与同步视觉观测。其核心价值在于为机器人策略学习提供真实世界的动作-状态对应关系,通过6自由度机械臂控制与1080p前端视觉的协同记录,推动具身智能在复杂环境中的适应能力发展。
当前挑战
该数据集主要解决机器人模仿学习中动作-观测对齐与跨模态表征的挑战,具体体现在高维连续动作空间与视觉感知的时序同步精度要求。构建过程中面临多传感器数据融合的技术难题,包括机械臂关节角度与前端摄像头30fps视频帧的毫秒级同步,以及1080p高清视频流与6维动作数据的存储优化。此外,真实环境下的光照变化与机械控制噪声对数据质量构成显著影响,需通过精密校准与数据清洗保障数据集可靠性。
常用场景
经典使用场景
在机器人学习领域,record-test数据集以其高质量的多模态数据记录,为模仿学习算法的训练与验证提供了典型范例。该数据集通过整合六自由度机械臂的关节状态、前端视觉观测与时间戳信息,构建了完整的动作-状态-观测映射关系,使得研究人员能够基于真实世界交互数据开展策略学习研究。其精心设计的帧序列结构和视频流同步机制,为动态环境下的行为克隆与逆强化学习提供了标准化评估基准。
衍生相关工作
基于该数据集的特性,研究者开发了多种创新性工作,包括基于时空注意力的行为预测模型和跨模态表示学习框架。这些工作充分利用数据集提供的多模态对齐特性,实现了视觉观测到动作序列的端到端映射。部分研究团队在此基础上构建了分层强化学习架构,将高层任务规划与底层运动控制相结合。此外,该数据集还催生了多个针对真实世界机器人学习的评估基准,推动了模仿学习算法在物理系统中的标准化测试进程。
数据集最近研究
最新研究方向
在机器人学习领域,record-test数据集作为LeRobot生态的重要组成,正推动模仿学习与视觉运动控制的前沿探索。该数据集通过高精度关节状态记录与高清视觉观测的同步采集,为端到端策略学习提供了多模态基准。当前研究聚焦于时空特征融合、跨任务泛化以及真实世界部署的sim2real迁移,这些方向与具身智能和通用机器人的热点发展紧密相连。其开源特性促进了社区对复杂操作任务的算法验证,对降低机器人学习数据采集门槛具有显著意义。
以上内容由遇见数据集搜集并总结生成



