sample_dataset

Hugging Face2026-03-31 更新2026-04-01 收录

下载链接：

https://huggingface.co/datasets/pvrohin/sample_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由LeRobot创建，采用apache-2.0许可证，属于机器人学领域。数据集包含10个episodes，总计16552帧，涉及1个任务。数据以parquet格式存储，总数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构通过meta/info.json文件详细描述，包括数据块大小、数据路径和视频路径。特征包括动作（6维浮点数组）、观察状态（26维浮点数组，包含TCP位姿、速度、误差和关节位置）、三个摄像头的视频观察（256x288x3，AV1编码，30fps）、时间戳、帧索引、episode索引、索引和任务索引。适用于机器人控制和视觉任务的研究。

创建时间：

2026-03-25

原始信息汇总

数据集概述

基本信息

数据集名称： sample_dataset
创建工具： LeRobot (https://github.com/huggingface/lerobot)
许可证： Apache-2.0
任务类别： 机器人学
标签： LeRobot

数据集详情

代码库版本： v3.0
机器人类型： ur5e_aic
总情节数： 10
总帧数： 16552
总任务数： 1
数据块大小： 1000
数据文件大小： 100 MB
视频文件大小： 200 MB
帧率： 30 FPS
数据分割： 训练集 (0:10)

数据结构

数据文件路径：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet 视频文件路径：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征描述

动作：
- 数据类型：float32
- 形状：[6]
- 名称：["linear.x", "linear.y", "linear.z", "angular.x", "angular.y", "angular.z"]
观测状态：
- 数据类型：float32
- 形状：[26]
- 名称：["tcp_pose.position.x", "tcp_pose.position.y", "tcp_pose.position.z", "tcp_pose.orientation.x", "tcp_pose.orientation.y", "tcp_pose.orientation.z", "tcp_pose.orientation.w", "tcp_velocity.linear.x", "tcp_velocity.linear.y", "tcp_velocity.linear.z", "tcp_velocity.angular.x", "tcp_velocity.angular.y", "tcp_velocity.angular.z", "tcp_error.x", "tcp_error.y", "tcp_error.z", "tcp_error.rx", "tcp_error.ry", "tcp_error.rz", "joint_positions.0", "joint_positions.1", "joint_positions.2", "joint_positions.3", "joint_positions.4", "joint_positions.5", "joint_positions.6"]
观测图像（左摄像头）：
- 数据类型：视频
- 形状：[256, 288, 3]
- 名称：["height", "width", "channels"]
- 视频信息：
  - 高度：256
  - 宽度：288
  - 编码：av1
  - 像素格式：yuv420p
  - 是否为深度图：否
  - 帧率：30
  - 通道数：3
  - 包含音频：否
观测图像（中摄像头）：
- 数据类型：视频
- 形状：[256, 288, 3]
- 名称：["height", "width", "channels"]
- 视频信息：
  - 高度：256
  - 宽度：288
  - 编码：av1
  - 像素格式：yuv420p
  - 是否为深度图：否
  - 帧率：30
  - 通道数：3
  - 包含音频：否
观测图像（右摄像头）：
- 数据类型：视频
- 形状：[256, 288, 3]
- 名称：["height", "width", "channels"]
- 视频信息：
  - 高度：256
  - 宽度：288
  - 编码：av1
  - 像素格式：yuv420p
  - 是否为深度图：否
  - 帧率：30
  - 通道数：3
  - 包含音频：否
时间戳：
- 数据类型：float32
- 形状：[1]
- 名称：null
帧索引：
- 数据类型：int64
- 形状：[1]
- 名称：null
情节索引：
- 数据类型：int64
- 形状：[1]
- 名称：null
索引：
- 数据类型：int64
- 形状：[1]
- 名称：null
任务索引：
- 数据类型：int64
- 形状：[1]
- 名称：null

引用信息

主页： [More Information Needed]
论文： [More Information Needed]
BibTeX： [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人学领域，高质量的数据集对于推动机器人控制与感知算法的进步至关重要。sample_dataset依托LeRobot开源框架构建，系统采集了UR5e机械臂在特定任务下的操作数据。该数据集以30帧每秒的速率记录了10个完整操作序列，共计16552帧数据，并以分块存储的Parquet格式组织，每块约1000帧，确保了数据的高效存取与处理。

特点

该数据集在机器人操作数据方面展现出多维度的特征表征能力。其核心特点在于融合了高维动作指令、精确的末端执行器状态信息以及多视角视觉观测。动作空间涵盖六维线性和角速度控制，观测状态则整合了TCP位姿、速度、误差及关节位置等26个维度。尤为突出的是，数据集提供了左、中、右三个视角的同步RGB视频流，分辨率统一为256x288，采用AV1编码，为基于视觉的机器人策略学习提供了丰富的感知输入。

使用方法

为便于机器人学习研究，该数据集已结构化分割为训练集，可直接用于模仿学习或强化学习算法的训练。研究者可通过加载指定的Parquet数据文件访问动作、观测及时间戳等序列信息，并关联对应的MP4视频文件获取视觉上下文。数据集的元信息文件清晰定义了各特征的数据结构与存储路径，支持按帧索引、回合索引或任务索引进行灵活的数据检索与批量加载，从而高效构建训练管道。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据集对于推动模仿学习与强化学习算法的进步至关重要。sample_dataset依托LeRobot平台构建，专注于UR5e机械臂的操控任务，其数据采集于实际物理环境，涵盖了多视角视觉观测、精确的末端执行器状态以及关节位置等多模态信息。该数据集旨在为机器人策略学习提供丰富的训练资源，通过整合高维感官输入与连续动作空间，助力研究人员开发能够在复杂动态场景中执行灵巧操作的智能体。尽管其创建时间与具体研究团队信息尚未公开，但此类数据集的出现标志着机器人学正从仿真模拟向真实世界部署过渡，为解决机器人泛化能力与样本效率等核心问题提供了实证基础。

当前挑战

该数据集致力于解决机器人模仿学习中的领域适应与策略泛化挑战，即如何将从有限演示中习得的技能迁移至未曾遇见的场景或对象。构建过程中面临多重困难：真实世界数据采集需克服传感器噪声、校准误差以及环境动态变化带来的不确定性；多模态数据（如视频流与状态向量）的同步与对齐要求精密的时间戳管理；大规模存储与高效读取涉及视频压缩编码与并行化处理的技术权衡。此外，确保数据集的多样性与代表性，避免过拟合特定任务或环境，亦是构建者需审慎考虑的挑战。

常用场景

经典使用场景

在机器人学习领域，样本数据集为机器人控制策略的离线训练提供了关键支持。该数据集通过UR5e机械臂采集的多模态数据，包括关节状态、末端执行器位姿及多视角视觉信息，为模仿学习与强化学习算法构建了丰富的训练环境。研究者能够利用这些序列化交互数据，训练模型在模拟或真实场景中执行抓取、放置等精细操作任务，从而推动机器人自主决策能力的发展。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在机器人行为克隆与视觉运动策略学习方向。许多研究利用其多视角视频与状态序列，开发了基于Transformer或扩散模型的轨迹生成方法。这些工作进一步拓展了数据高效利用的范式，例如通过分层强化学习结合视觉先验，实现了复杂长周期任务的分解与规划，为后续大规模机器人数据集的构建与算法评估设立了重要参考。

数据集最近研究