record-test
收藏Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/Belong8078/record-test
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于机器人学任务的 dataset,包含了机器人执行任务时的动作、状态、正面和侧面图像等信息。数据集由1个剧集组成,共有576帧,1个任务,2个视频,分为1个块,每块大小为1000。数据集的帧率为30fps,且不包含音频。
创建时间:
2025-07-18
原始信息汇总
数据集概述
基本信息
- 许可证: apache-2.0
- 任务类别: robotics
- 标签: LeRobot
- 配置:
- 配置名称: default
- 数据文件: data//.parquet
数据集描述
- 创建工具: LeRobot
- 主页: [More Information Needed]
- 论文: [More Information Needed]
数据集结构
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 总集数: 1
- 总帧数: 576
- 总任务数: 1
- 总视频数: 2
- 总块数: 1
- 块大小: 1000
- 帧率: 30 fps
- 分割:
- 训练集: 0:1
- 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
- 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
特征
- action:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos
- observation.images.front:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 信息:
- 视频高度: 480
- 视频宽度: 640
- 视频编解码器: av1
- 视频像素格式: yuv420p
- 是否为深度图: false
- 视频帧率: 30
- 视频通道: 3
- 是否有音频: false
- observation.images.side:
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 信息:
- 视频高度: 480
- 视频宽度: 640
- 视频编解码器: av1
- 视频像素格式: yuv420p
- 是否为深度图: false
- 视频帧率: 30
- 视频通道: 3
- 是否有音频: false
- timestamp:
- 数据类型: float32
- 形状: [1]
- 名称: null
- frame_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- episode_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- index:
- 数据类型: int64
- 形状: [1]
- 名称: null
- task_index:
- 数据类型: int64
- 形状: [1]
- 名称: null
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,record-test数据集的构建依托于LeRobot开源框架,采用先进的视频流与状态数据同步采集技术。数据集以30fps的采样频率记录了SO101型跟随机器人的多模态数据,通过精心设计的Parquet文件格式存储了包含576帧动作序列的完整实验过程。数据采集系统同步捕获了机器人6自由度关节状态、双视角视觉信息(前视与侧视)以及精确的时间戳标记,构建了时空对齐的多维数据流。
特点
该数据集最显著的特点在于其丰富的多模态表征能力,不仅包含6维关节空间的动作向量和状态反馈,还整合了双路高分辨率(640×480)RGB视频流。数据采用AV1编码压缩存储,在保证视觉质量的同时优化了存储效率。各数据通道均具备严格的时序对齐特性,帧索引、时间戳和任务索引等元数据为时序分析提供了可靠支撑。机器人动作空间与观测空间的维度一致性也为模仿学习研究创造了理想条件。
使用方法
研究者可通过解析Parquet文件直接获取结构化机器人数据,视频流数据需配合提供的路径模板进行访问。数据集采用分块存储策略(chunk-003d),支持按实验片段进行高效加载。典型应用场景包括:基于双视角视觉输入的机器人动作模仿学习、多模态时序数据建模、以及关节空间控制策略验证。使用时应特别注意30fps的时序特性,确保数据采样与算法需求相匹配。
背景与挑战
背景概述
record-test数据集是机器人研究领域的重要数据资源,由LeRobot项目团队基于Apache-2.0协议构建并发布。该数据集专注于机器人控制与感知任务,记录了SO101型跟随机器人的多模态操作数据,包括关节位置状态、视觉观测和时间序列信息。数据集采用先进的视频编码技术存储480×640分辨率的双视角彩色视频流,并以30fps的采样频率同步记录6自由度机械臂的动作指令与状态反馈,为机器人模仿学习与行为克隆研究提供了高质量的实证数据。
当前挑战
该数据集面临的核心挑战体现在算法开发与数据构建两个维度。在算法层面,如何有效融合高维视觉观测与低维状态信息以提升策略网络的泛化能力,成为亟待解决的关键问题;同时,机械臂动作空间的连续控制精度要求对强化学习算法的稳定性提出了严峻考验。在数据构建方面,多传感器时序同步的精确校准、大规模视频数据的高效压缩存储,以及操作任务场景的多样性扩充,都是影响数据集实用价值的重要技术瓶颈。
常用场景
经典使用场景
在机器人控制与行为学习领域,record-test数据集为研究者提供了一个包含多模态信息的实验平台。该数据集通过记录机械臂的关节位置、状态信息以及多视角视频数据,能够模拟真实环境中的机器人操作任务。其经典使用场景包括机器人动作模仿学习、基于视觉的闭环控制算法验证,以及多传感器融合策略的评估。数据集的结构化存储方式特别适合用于训练端到端的机器人控制模型。
解决学术问题
该数据集有效解决了机器人学习领域中样本数据稀缺、真实环境模拟成本高昂等关键问题。通过提供精确的关节位置数据和同步的多视角视觉信息,研究者能够深入探究动作-感知的映射关系,验证强化学习算法在连续控制任务中的表现。数据集包含的完整状态-动作对为解决机器人控制中的部分可观测性问题提供了重要支持,推动了模仿学习与行为克隆等领域的研究进展。
衍生相关工作
基于record-test数据集的结构特点,已衍生出多项机器人学习领域的重要研究。其中包括利用多模态数据进行行为克隆的端到端控制模型、基于视觉-动作联合嵌入的强化学习框架,以及用于机器人操作技能迁移的表示学习方法。这些工作充分利用了数据集提供的同步状态-动作-视觉信息,推动了机器人学习从仿真环境向真实场景的过渡。
以上内容由遇见数据集搜集并总结生成



