cube-sort

Hugging Face2026-02-20 更新2026-02-21 收录

下载链接：

https://huggingface.co/datasets/ar0s/cube-sort

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人学数据集，适用于机器人操作任务。数据集包含150个episodes，总计25137帧，涉及1个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为500MB，帧率为10fps。数据集包含多种特征，包括动作（10维浮点数，包含位置、6D方向、夹持器状态）、观测状态（7维浮点数，包含位置、方向、夹持器状态）、左右手腕RGB图像（480x640x3的视频数据）、时间戳、帧索引、episode索引等。所有数据均以结构化方式存储，便于机器人学研究和算法开发。数据集采用Apache-2.0许可证。

创建时间：

2026-02-20

搜集汇总

数据集介绍

构建方式

在机器人操作领域，数据集的构建往往依赖于真实世界的交互记录。cube-sort数据集通过LeRobot平台精心采集，涵盖了150个完整的操作片段，总计25137帧数据，以10帧每秒的速率捕捉机械臂的运动轨迹。数据以分块形式存储于Parquet文件中，每块包含1000帧，确保了高效的数据管理与访问。该数据集不仅记录了机械臂的末端执行器位置、六维朝向及夹爪状态，还同步采集了腕部与左侧的RGB视频流，为研究提供了多模态的感知信息。

特点

该数据集的核心特点在于其丰富的多模态表征与精细的结构化设计。动作空间以10维向量精确刻画了末端执行器的三维位置、六维朝向及夹爪开合状态；观测空间则融合了7维的机械臂状态信息与双视角的RGB视频流，视频分辨率为640x480，编码格式为AV1。数据集中所有片段均围绕单一任务展开，确保了任务的一致性，同时通过时间戳、帧索引与片段索引实现了时序的精确对齐，为序列决策研究提供了坚实基础。

使用方法

研究者可利用该数据集训练与评估机器人模仿学习或强化学习模型。数据以标准Parquet格式组织，可通过Hugging Face数据集库直接加载，并依据片段索引进行划分。模型可同时利用状态观测与视觉观测作为输入，以动作向量作为监督信号。由于数据集已预设训练集划分，用户可直接将其用于模型训练，并通过帧索引与时间戳重建操作序列，进而分析机械臂在任务执行中的动态行为。

背景与挑战

背景概述

在机器人操作领域，模仿学习与强化学习的进展亟需高质量、大规模的真实世界交互数据集作为支撑。Cube-Sort数据集应运而生，它由Hugging Face的LeRobot项目团队构建，旨在为机器人排序任务提供丰富的多模态演示数据。该数据集包含150个完整交互片段，总计超过25000帧数据，涵盖了机械臂末端执行器的精确动作指令、多视角视觉观测以及完整的状态信息。其核心研究问题聚焦于如何通过数据驱动的方法，提升机器人在复杂物理环境中的灵巧操作能力，特别是物体分拣与排列任务的泛化性能。这一数据集的发布，为机器人社区提供了宝贵的真实交互资源，有望推动基于学习的机器人控制策略在现实场景中的实际应用。

当前挑战

Cube-Sort数据集致力于解决机器人灵巧操作中物体分拣与排序这一经典问题的挑战，其核心在于如何让机器人从演示数据中学习并泛化出稳健的控制策略，以应对物体物理属性、初始位姿及环境干扰的多变性。在数据集构建层面，挑战同样显著：采集真实机器人交互数据成本高昂，需确保动作指令与多模态观测（如腕部与左侧摄像头视频）在时间上的精确同步与对齐；数据的高维度特性，特别是视频流与高精度状态信息的融合，对存储、处理与后续算法设计提出了严峻考验；此外，在有限任务（当前仅1个任务）和交互片段（150个）的规模下，如何保证数据的多样性、覆盖度以及足够的信息密度，以有效支撑模型的泛化能力，是构建过程中必须克服的关键障碍。

常用场景

经典使用场景

在机器人操作领域，cube-sort数据集以其丰富的多模态数据为机器人学习提供了经典范例。该数据集记录了自定义机械臂执行立方体分拣任务的全过程，包含动作指令、状态观测以及多视角视觉信息。研究人员能够利用这些数据训练端到端的机器人策略模型，模拟从感知到执行的闭环控制流程，尤其适用于验证模仿学习或强化学习算法在复杂操作任务中的有效性。

解决学术问题

该数据集有效应对了机器人操作研究中数据稀缺与仿真-现实差距的挑战。通过提供真实世界采集的机械臂操作序列，它支持学者探究高维状态空间下的策略泛化、多模态感知融合以及长时程任务规划等核心问题。其结构化特征设计促进了标准化评估，为比较不同学习方法的性能提供了可靠基准，推动了机器人自主操作技术的理论进展。

衍生相关工作

围绕cube-sort数据集，已衍生出一系列聚焦于机器人操作学习的经典研究。例如，结合其多模态序列数据，学者们开发了基于Transformer的时空预测模型，用于动作生成；亦有工作利用其进行跨任务迁移学习探索，验证了预训练策略在少量数据下的适应性。这些研究进一步丰富了机器人感知与控制一体化的方法论体系。

以上内容由遇见数据集搜集并总结生成