cups_online_buffer

Hugging Face2026-05-07 更新2026-05-08 收录

下载链接：

https://huggingface.co/datasets/ansocho/cups_online_buffer

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人学领域的数据集，使用LeRobot创建。数据集采用Apache-2.0许可证，主要包含机器人任务的相关数据。数据集结构包括35个episodes，4851帧，1个任务，数据文件大小为100MB，视频文件大小为200MB，帧率为10fps。数据以parquet文件格式存储，视频以mp4格式存储。数据集特征丰富，包括索引、episode索引、帧索引、时间戳、任务索引、动作（7维浮点数组）、下一奖励（浮点数）、下一完成标志（布尔值）、观察值（包括两个128x128像素的摄像头图像和一个8维状态向量）以及补充信息（离散惩罚值）。数据集适用于机器人控制、强化学习等任务。

创建时间：

2026-05-07

原始信息汇总

数据集概述

数据集名称: cups_online_buffer
许可证: Apache-2.0
任务类别: 机器人学 (robotics)
创建工具: 使用 LeRobot 创建

数据集结构

代码库版本: v3.0
机器人类型: 未指定 (null)
总片段数 (Episodes): 35
总帧数 (Frames): 4851
总任务数: 1
块大小 (Chunks Size): 1000
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率 (FPS): 10
数据集划分: 全部 35 个片段用于训练 (train: "0:35")

数据特征

数据集包含以下特征字段：

特征名称	数据类型	形状
index	int64	[1]
episode_index	int64	[1]
frame_index	int64	[1]
timestamp	float32	[1]
task_index	int64	[1]
action	float32	[7]
next.reward	float32	[1]
next.done	bool	[1]
observation.images.camera_0	image	[3, 128, 128]
observation.images.camera_1	image	[3, 128, 128]
observation.state	float32	[8]
complementary_info.discrete_penalty	float32	[1]

数据文件路径

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

暂无 BibTeX 引用信息。

搜集汇总

数据集介绍

构建方式

cups_online_buffer数据集基于LeRobot框架构建，专为机器人学习领域设计。该数据集通过在线采集方式获取，共包含35个完整任务片段（episodes），总计4851帧数据，覆盖单一任务类型。数据以parquet格式存储，并配套有视频文件记录，结构上按照chunk和file进行层级分块管理，每个chunk容量上限为1000帧，确保数据加载的高效性。数据特征方面，每条记录均包含索引、时间戳、任务索引、动作向量（7维）、奖励信号、完成标志以及两个视角的128x128 RGB图像和8维状态信息，旨在为模仿学习或强化学习提供多模态训练样本。

特点

本数据集的核心特点在于其精细化的多模态数据构成与标准化的LeRobot格式兼容性。每个时间步均记录有7维动作输出和8维机器人状态，并辅以双摄像头观测图像（camera_0与camera_1），能够有效支持视觉-运动融合策略的学习。数据集的帧率统一为10 FPS，总视频体量约200 MB，数据体量约100 MB，在规模上适宜进行快速验证与原型开发。此外，所有片段均被归入训练集，便于用户直接进行模型训练或离线策略评估，无需额外划分。

使用方法

使用本数据集时，用户可依赖LeRobot提供的标准API进行加载与迭代，通过指定data_files路径读取parquet文件，并配合同目录下的mp4视频文件获取视觉观测。推荐采用PyTorch或TensorFlow框架构建数据管道，将'observation.images.camera_0'与'observation.images.camera_1'作为输入图像，'observation.state'与'action'分别作为状态与目标动作，用于监督学习或行为克隆任务。同时，complementary_info中的离散惩罚项可作为奖励塑形辅助信号，适用于强化学习场景下的奖励函数设计。

背景与挑战

背景概述

随着机器人学习领域的快速发展，模仿学习与强化学习对高质量、多模态演示数据的需求日益迫切。cups_online_buffer数据集诞生于LeRobot开源生态体系之下，由Hugging Face社区推动构建，旨在为机器人操作任务提供标准化的数据基准。该数据集包含35个演示片段、总计4851帧，记录了机器人完成特定抓取与放置动作的连续轨迹，并涵盖双视角128×128像素的视觉观测与8维状态信息。其独特之处在于采用在线缓冲区（online buffer）形式设计，允许算法从持续更新的数据流中采样，契合真实机器人系统动态交互的学习场景。作为LeRobot框架的标准化组件，该数据集为多任务泛化与跨平台迁移研究提供了可复现的基础设施，推动了机器人数据驱动范式的民主化进程。

当前挑战

该数据集所面临的挑战首先体现在领域问题层面：机器人操作任务的高维连续状态空间与部分可观测特性，使得从有限演示中提取鲁棒策略成为核心难题。尤其当任务涉及柔性物体（如杯子）时，接触动力学建模与动态环境扰动进一步加剧了策略泛化的不确定性。在数据构建过程中，技术难点集中于多模态信息的时间对齐与标注一致性——双视角图像流与动作序列需在10Hz采样率下精确同步，而奖励函数的设计与离散惩罚项的引入则需人工权衡任务目标的完备性与稀疏性。此外，仅35个片段的规模限制了数据多样性，如何通过数据增强或元学习补偿样本效率，同时保持现实场景的物理真实性，仍是当前应用中的突出瓶颈。

常用场景

经典使用场景

cups_online_buffer数据集专为机器人模仿学习与强化学习研究而设计，其核心使用场景是训练机器人执行杯子拾取与放置的精细操作任务。该数据集包含35个演示片段，总计4851帧图像与动作序列，以10帧每秒的频率同步记录双视角摄像头影像、机器人8维关节状态及7维动作指令。研究者可借助此数据学习从视觉输入到连续动作的映射策略，在仿真或实体机器人上复现熟练的杯具操控行为。

衍生相关工作

围绕cups_online_buffer衍生出一系列经典工作，包括基于扩散策略的精细动作生成、视觉-运动联合表示学习以及数据增强技术。研究者常以此数据集为基准，对比不同算法在机器人操作任务上的样本效率与鲁棒性，如将行为克隆与隐式Q学习结合的方法显著提升了策略的泛化能力。这些工作共同推动了LeRobot生态的成熟，加速了可复现机器人研究的进程。

数据集最近研究