hilserl_so100_pickplacecube_v0_replay_buffer

Hugging Face2025-10-25 更新2025-10-26 收录

下载链接：

https://huggingface.co/datasets/jpizarrom/hilserl_so100_pickplacecube_v0_replay_buffer

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot创建的机器人学数据集，包含40个剧集，共4816帧，专注于1个任务。数据集分为训练集，采用Parquet文件格式存储数据，视频文件为MP4格式。数据集的特征包括索引、剧集索引、帧索引、时间戳、任务索引、动作、奖励以及顶部和手腕的图像观测和状态信息。该数据集的许可是Apache-2.0。

This is a robotics dataset created using LeRobot, containing 40 episodes with a total of 4816 frames, focusing on one single task. The dataset is split into the training set. Data is stored in Parquet file format, while video files are in MP4 format. The features of the dataset include index, episode index, frame index, timestamp, task index, action, reward, as well as top and wrist image observations and state information. The dataset is licensed under Apache-2.0.

创建时间：

2025-10-13

原始信息汇总

数据集概述

基本信息

名称: hilserl_so100_pickplacecube_v0_replay_buffer
任务类别: 机器人技术
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot

数据集规模

总回合数: 40
总帧数: 4816
任务数量: 1
数据块大小: 1000
帧率: 10 FPS

数据存储

数据格式: Parquet文件
数据文件大小: 100 MB
视频文件大小: 500 MB
数据存储路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频存储路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

索引特征

index: int64类型，形状[1]
episode_index: int64类型，形状[1]
frame_index: int64类型，形状[1]
timestamp: float32类型，形状[1]
task_index: int64类型，形状[1]

动作与奖励

action: float32类型，形状[4]
next.reward: float32类型，形状[1]
next.done: bool类型，形状[1]

观测数据

observation.images.top: 图像类型，形状[3, 128, 128]
observation.images.wrist: 图像类型，形状[3, 128, 128]
observation.state: float32类型，形状[21]

补充信息

complementary_info.discrete_penalty: float32类型，形状[1]

数据集划分

训练集: 全部40个回合

搜集汇总

数据集介绍

构建方式

在机器人操作任务研究领域，hilserl_so100_pickplacecube_v0_replay_buffer数据集通过LeRobot平台系统性地采集了40个完整交互片段，涵盖单一任务场景下的4816帧数据。其构建过程以10帧每秒的采样频率记录多模态观测信息，包括顶部与腕部视角的128x128像素图像、21维状态向量及4维动作空间数据，并以分块存储的Parquet格式高效组织数据流，确保时序连贯性与存储可扩展性。

特点

该数据集在机器人强化学习领域展现出显著的多模态融合特性，同步提供双视角视觉观测与高维状态表征。其动作空间采用连续浮点向量编码操作策略，配合逐帧奖励信号与终止标志构成完整决策链。特别引人注目的是数据集中嵌入了离散惩罚指标，为策略稳定性分析提供补充维度，且所有特征均保持时序对齐，为模仿学习与离线强化学习算法提供理想实验基底。

使用方法

研究者可通过解析分块存储的Parquet文件直接访问结构化数据流，利用帧索引与片段索引重构完整任务轨迹。数据集已预划分为训练集，支持以数据块为单位进行流式加载，有效平衡内存效率与访问速度。视觉数据可通过视频键与分块索引关联MP4文件，实现观测图像与控制指令的端到端映射，为行为克隆、逆强化学习等算法提供即用型数据管道。

背景与挑战

背景概述

机器人操作任务数据集作为强化学习研究的重要基础设施，hilserl_so100_pickplacecube_v0_replay_buffer数据集由HuggingFace团队基于LeRobot开源框架构建，专注于堆叠立方体的抓取放置操作场景。该数据集通过多视角视觉观测与连续动作空间的协同记录，为机器人技能学习提供了包含40个完整交互轨迹的演示数据，其结构化存储格式与10Hz采样频率的设计，显著提升了模仿学习与离线强化学习算法的训练效率。

当前挑战

在机器人操作领域，该数据集需解决高维视觉观测与低维动作空间的对齐难题，同时应对动态环境中物体姿态估计的稳定性问题。数据构建过程中面临多传感器时序同步的精确性挑战，以及不同机械臂动力学特性导致的动作泛化困难。此外，演示数据的质量一致性保障与长周期任务中的奖励稀疏性问题，亦成为影响算法性能的关键制约因素。

常用场景

经典使用场景

在机器人操作领域，该数据集通过记录机械臂执行拾取放置立方体任务的完整交互轨迹，为强化学习算法提供了标准化的训练环境。其多模态观测数据包含顶部与腕部摄像头图像及关节状态信息，配合连续动作空间与奖励信号，成为评估离线强化学习与模仿学习方法的经典基准。研究者可基于此数据集分析机器人在复杂环境中的决策能力与动作泛化性能。

解决学术问题

该数据集有效解决了机器人技能迁移中的样本效率低下问题，通过高密度采样（10Hz）的演示数据降低了真实世界机器人训练成本。其结构化存储的交互轨迹为研究部分可观测马尔可夫决策过程提供了实验基础，同时离散惩罚机制的设计助力于安全约束强化学习算法的验证，推动了机器人学习从仿真到实物的跨越。

衍生相关工作

以该数据集为基石，衍生出基于时空注意力的行为克隆架构与分层强化学习框架。LeRobot生态系统中多项研究通过融合其多视角视觉特征与状态序列，开发出具备抗遮挡能力的抓取预测模型。后续工作进一步扩展了数据增广策略，在保持原始任务结构的同时生成跨域模拟数据，推动了视觉运动策略的泛化研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集