record-test4
收藏Hugging Face2025-11-24 更新2025-11-25 收录
下载链接:
https://huggingface.co/datasets/Miyalinsky/record-test4
下载链接
链接失效反馈官方服务:
资源简介:
这是一个关于机器人学的数据集,包含了10个剧集,总共5900帧,1个任务。数据集的特征包括机器人的动作、状态、俯视图和手腕视图图像等。数据以Apache-2.0许可发布。
创建时间:
2025-11-12
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
数据集结构
数据规模
- 总情节数: 10
- 总帧数: 5900
- 总任务数: 1
- 分块大小: 1000
- 帧率: 30 FPS
- 数据分割: 训练集 (0:10)
存储信息
- 数据文件格式: Parquet
- 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
- 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
特征字段
动作特征 (action)
- 数据类型: float32
- 形状: [6]
- 关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
- 帧率: 30 FPS
状态观测 (observation.state)
- 数据类型: float32
- 形状: [6]
- 关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
- 帧率: 30 FPS
鸟瞰图像观测 (observation.images.birdseye)
- 数据类型: 视频
- 形状: [800, 1280, 3]
- 维度名称: height, width, channels
- 视频信息:
- 高度: 800
- 宽度: 1280
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: false
腕部图像观测 (observation.images.wrist)
- 数据类型: 视频
- 形状: [800, 1280, 3]
- 维度名称: height, width, channels
- 视频信息:
- 高度: 800
- 宽度: 1280
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30 FPS
- 通道数: 3
- 包含音频: false
索引字段
- 时间戳 (timestamp): float32, 形状 [1], 30 FPS
- 帧索引 (frame_index): int64, 形状 [1], 30 FPS
- 情节索引 (episode_index): int64, 形状 [1], 30 FPS
- 索引 (index): int64, 形状 [1], 30 FPS
- 任务索引 (task_index): int64, 形状 [1], 30 FPS
技术信息
- 代码库版本: v3.0
- 机器人类型: so101_follower
引用信息
- 主页: [More Information Needed]
- 论文: [More Information Needed]
- BibTeX引用: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,数据采集的精确性与系统性至关重要。record-test4数据集依托LeRobot平台构建,通过so101_follower型机器人记录10个完整任务片段,总计5900帧数据,采样频率为30赫兹。数据以分块形式存储于Parquet文件中,每块容量设定为1000帧,确保高效存取与处理。该构建方式融合了动作指令与多模态观测数据,为机器人学习研究提供了结构化基础。
特点
该数据集在机器人控制领域展现出鲜明的多模态特性。其核心特征涵盖六维关节空间动作向量与对应的状态观测值,同步集成鸟瞰视角与腕部视角的双路视觉流,分辨率达1280×800像素。数据维度设计兼顾时空连续性,每帧附带时间戳与索引标识,支持跨模态对齐分析。这种丰富的特征组合为模仿学习与策略优化提供了立体化信息支撑。
使用方法
研究者可通过解析Parquet数据文件与MP4视频流展开多维度分析。数据集采用分块存储机制,路径模板明确指示数据与视频的调用方式。典型应用场景包括端到端策略网络训练、传感器融合算法验证以及时序行为分析。使用者需注意数据按30赫兹时序组织,建议结合帧索引与时间戳实现精准数据切片,充分发挥其在高频控制任务中的价值。
背景与挑战
背景概述
在机器人技术迅猛发展的时代背景下,record-test4数据集应运而生,由LeRobot研究团队基于其开源框架构建。该数据集聚焦于机器人模仿学习领域,专门采集了SO101型跟随机器人的多模态交互数据,包含10个完整任务片段和5900帧时序记录。通过整合关节状态、鸟瞰视角与腕部视觉信息,该数据集为解决机器人动作规划与感知决策的协同问题提供了重要实验基础,对推动具身智能系统的实际应用具有显著价值。
当前挑战
机器人模仿学习领域长期面临动作轨迹泛化性与环境感知鲁棒性的双重挑战,record-test4需解决高维连续动作空间与视觉观测对齐的复杂问题。在构建过程中,数据同步精度控制成为关键难点,六自由度机械臂的关节状态数据需与双视角视频流保持严格时序对齐,同时大规模多模态数据的存储优化与实时处理要求对数据架构设计提出了极高标准。
常用场景
经典使用场景
在机器人学习领域,该数据集通过记录六自由度机械臂的关节位置与多视角视觉数据,为模仿学习算法提供了标准化的训练资源。其包含的鸟瞰视角与腕部摄像头视频流,结合精确的动作轨迹标注,常用于构建端到端的机器人控制模型,使智能体能够从人类示范中学习复杂的操作技能。
衍生相关工作
该数据集催生了系列机器人学习领域的创新研究,包括基于时空注意力的动作预测模型、多视角视觉特征融合框架等。相关成果已延伸至动态环境下的抓取策略优化、跨领域技能迁移等方向,为开源机器人社区提供了可复现的算法基准。
数据集最近研究
最新研究方向
在机器人学习领域,record-test4数据集凭借其多模态观测数据与六自由度机械臂控制记录,正推动模仿学习与视觉运动策略的前沿探索。当前研究聚焦于融合鸟瞰视角与腕部视觉的时空特征,通过端到端神经网络架构实现复杂场景下的动作序列预测。随着具身智能研究热潮的兴起,该数据集为跨模态表征学习提供了精准的关节状态标注,显著提升了机械臂在动态环境中的操作泛化能力。其标准化数据格式与LeRobot生态的深度集成,正成为开源机器人社区验证分层强化学习算法的重要基准,为智能体在非结构化环境中的自主决策研究注入新动能。
以上内容由遇见数据集搜集并总结生成



