cube1
收藏Hugging Face2025-06-16 更新2025-06-17 收录
下载链接:
https://huggingface.co/datasets/psg777/cube1
下载链接
链接失效反馈官方服务:
资源简介:
这是一个使用LeRobot创建的机器人数据集,包含25个episodes,共28755个frames,分为75个videos。数据集遵循Apache-2.0许可。数据集的结构包括多种特征,如动作、观察状态、鸟瞰视图、抓取器视图、第一视角视频等,以及时间戳、帧索引、集索引等。
创建时间:
2025-06-12
原始信息汇总
数据集概述
基本信息
- 名称: psg777/cube1
- 任务类别: 机器人学 (robotics)
- 标签: LeRobot
- 许可证: Apache-2.0
- 创建工具: LeRobot
数据集结构
- 数据文件格式: Parquet
- 配置名称: default
- 数据文件路径:
data/*/*.parquet
元数据信息
- 代码库版本: v2.1
- 机器人类型: so101_follower
- 总集数: 25
- 总帧数: 28755
- 总任务数: 1
- 总视频数: 75
- 总块数: 1
- 块大小: 1000
- 帧率 (FPS): 30
- 数据分割:
- 训练集: 0:25
数据特征
动作 (action)
- 数据类型: float32
- 形状: [6]
- 名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像
鸟瞰图 (observation.images.birdseyeview)
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false
夹爪视图 (observation.images.gripper)
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 同鸟瞰图
主视角 (observation.images.POV)
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 同鸟瞰图
其他特征
- 时间戳 (timestamp): float32, 形状 [1]
- 帧索引 (frame_index): int64, 形状 [1]
- 集索引 (episode_index): int64, 形状 [1]
- 索引 (index): int64, 形状 [1]
- 任务索引 (task_index): int64, 形状 [1]
引用
- BibTeX: [More Information Needed]
搜集汇总
数据集介绍

构建方式
在机器人技术领域,cube1数据集通过LeRobot平台精心构建,采用先进的实验数据采集方法。该数据集包含25个完整实验片段,共计28755帧数据,以30fps的帧率记录,每个片段被划分为1000帧的数据块,并以parquet格式高效存储。数据采集过程中,机器人SO101 Follower的关节位置、夹爪状态以及多视角视觉信息被同步记录,形成了一套结构化的时空序列数据。
使用方法
使用cube1数据集时,研究人员可通过解析meta/info.json文件获取完整的数据结构描述。数据集采用分块存储策略,按照episode_chunk和episode_index的命名规则组织parquet文件和视频文件。典型的应用场景包括加载特定实验片段的运动轨迹和对应视觉数据,进行机器人动作预测或策略学习。数据集中预定义的训练集划分(0:25)可直接用于模型训练,而多视角视频流为视觉-运动协同研究提供了便利条件。
背景与挑战
背景概述
cube1数据集是由LeRobot团队开发的机器人领域专用数据集,旨在为机器人控制与感知研究提供高质量的多模态数据支持。该数据集基于Apache 2.0开源协议发布,主要聚焦于机械臂操作任务,包含25个完整操作序列和超过28000帧的多视角视觉数据。数据集采用先进的parquet格式存储,整合了六自由度机械臂的关节状态、鸟瞰视角、夹爪视角和第一人称视角视频流,为机器人模仿学习与强化学习算法提供了丰富的训练素材。
当前挑战
该数据集面临的核心挑战体现在算法开发与数据构建两个维度。在算法层面,如何有效融合多视角视觉信息与机械臂关节状态数据,实现精准的动作预测与环境理解,是亟待解决的关键问题。数据构建过程中,需要克服传感器同步精度、大规模视频数据压缩存储、多模态数据对齐等技术难题。数据集规模相对有限且任务单一的特性,也对算法的泛化能力提出了更高要求。
常用场景
经典使用场景
在机器人控制领域,cube1数据集以其多维度的机械臂运动数据和丰富的视觉观测信息,成为研究机器人动作规划与视觉伺服控制的经典基准。数据集包含六自由度机械臂的关节位置数据及鸟瞰图、夹爪视角等多视角视频流,为构建端到端的机器人控制模型提供了完整的时空信息链。研究者可通过动作-状态-视觉的多模态对齐,探索机械臂在复杂环境中的自主决策机制。
解决学术问题
该数据集有效解决了机器人学中动作表示学习与多模态感知融合的核心难题。通过提供精确的关节位置时序数据和同步的视觉观测,支持了从模仿学习到强化学习等多种范式的算法验证。其标准化数据格式消除了不同机器人平台的数据异构性,使得研究成果具有可比性,显著推进了机器人控制算法的可复现性研究。30Hz的高频采样特性更为动态系统的状态估计与预测建模提供了关键数据支撑。
实际应用
在工业自动化场景中,cube1数据集可直接迁移至分拣、装配等机械臂操作任务。其记录的六轴关节运动轨迹为机器人轨迹优化提供了真实参考,而多视角视觉数据则支持开发基于视觉的工件定位系统。物流仓储企业可利用该数据集训练智能分拣机器人,通过迁移学习快速适配不同规格的抓取任务,降低实体机器人试错成本。
数据集最近研究
最新研究方向
在机器人学领域,cube1数据集以其多模态观测数据和精细动作控制特性,正成为强化学习与视觉伺服控制研究的重要资源。最新研究聚焦于利用其包含的鸟瞰视角、机械臂视角和第一人称视角视频流,结合六自由度关节位置数据,开发跨模态表征学习框架。该方向与当前具身智能的发展趋势高度契合,特别是在模拟真实世界物理交互方面,数据集提供的连续动作空间和高频传感器反馈为研究机器人灵巧操作提供了理想条件。工业界正探索将其应用于物流分拣和精密装配场景,学术界则关注如何通过该数据集提升端到端策略在动态环境中的泛化能力。
以上内容由遇见数据集搜集并总结生成



