eval_smvlb_blueclick0830_64_40000

Hugging Face2025-09-01 更新2025-09-02 收录

下载链接：

https://huggingface.co/datasets/Team-Atom/eval_smvlb_blueclick0830_64_40000

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，包含机器人操作的相关数据。数据集的结构包括17个剧集，共21243帧，1个任务，34个视频。数据集提供了动作、状态观察、网络摄像头图像和RGB摄像头图像等多种特征。所有视频的帧率为30fps，且没有音频。该数据集适用于机器人学相关的任务，并已根据需要划分为训练数据。

创建时间：

2025-09-01

原始信息汇总

数据集概述

基本信息

许可证：Apache-2.0
任务类别：机器人学
标签：LeRobot

数据集结构

总情节数：17
总帧数：21243
总任务数：1
总视频数：34
总块数：1
块大小：1000
帧率：30 FPS
分割：训练集（0:17）

数据特征

动作特征

数据类型：float32
形状：[6]
名称：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态特征

数据类型：float32
形状：[6]
名称：
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像特征（web摄像头）

数据类型：视频
形状：[480, 640, 3]
视频信息：
- 高度：480像素
- 宽度：640像素
- 编解码器：av1
- 像素格式：yuv420p
- 非深度图
- 帧率：30 FPS
- 通道数：3
- 无音频

观测图像特征（rs摄像头）

数据类型：视频
形状：[480, 640, 3]
视频信息：
- 高度：480像素
- 宽度：640像素
- 编解码器：av1
- 像素格式：yuv420p
- 非深度图
- 帧率：30 FPS
- 通道数：3
- 无音频

其他特征

时间戳：float32，形状[1]
帧索引：int64，形状[1]
情节索引：int64，形状[1]
索引：int64，形状[1]
任务索引：int64，形状[1]

数据存储

数据文件路径：data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件路径：videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

技术信息

代码库版本：v2.1
机器人类型：koch_follower

搜集汇总

数据集介绍

构建方式

在机器人技术领域，数据采集的精确性与系统性至关重要。eval_smvlb_blueclick0830_64_40000数据集通过LeRobot平台构建，采用高频率传感器记录机械臂运动轨迹与环境交互数据。具体而言，数据集以30帧每秒的速率采集了17个完整任务片段，涵盖21243帧多维观测数据，包括关节位置状态与双视角视觉信息，并以分块存储的Parquet格式高效组织，确保了数据的完整性与可访问性。

特点

该数据集的核心特点体现在其多模态结构与精细标注层面。它不仅提供了六自由度机械臂的关节角度动作与状态数据，还同步收录了Web与RealSense双摄像头的RGB视频流，分辨率达640x480，帧率稳定为30fps。每一帧数据均附带时间戳、任务索引及帧序号等元信息，支持端到端的机器人行为克隆与强化学习研究，尤其适用于模仿学习与视觉运动策略的训练场景。

使用方法

针对机器人控制与视觉导航任务的研究者，该数据集可直接通过HuggingFace平台加载，并兼容LeRobot生态工具链。用户可依据任务索引分割训练集，调用Parquet文件解析关节动作、观测状态及视频流数据；其多维张量结构可直接输入神经网络模型，适用于行为克隆、逆动力学学习或跨模态表征学习等实验范式，为算法验证提供高真实度的仿真环境。

背景与挑战

背景概述

在机器人学习领域，高质量数据集对算法训练与验证具有关键作用。eval_smvlb_blueclick0830_64_40000数据集由LeRobot团队基于Apache 2.0许可证构建，专注于机器人控制与视觉感知任务。该数据集采用Koch Follower机器人平台，采集了17个完整交互序列共21243帧多模态数据，包含六自由度机械臂控制指令与双视角视觉观测，为模仿学习与强化学习算法提供了丰富的训练样本。

当前挑战

该数据集致力于解决机器人视觉伺服控制中的动作-观测对齐难题，其核心挑战在于高维连续动作空间与多模态感知数据的协同建模。构建过程中面临多传感器时序同步、大规模视频数据压缩存储等技术瓶颈，同时需确保机械臂状态数据与视觉帧间的精确对应。深度视频编码与高精度动作标注的协同处理进一步增加了数据集构建的复杂性。

常用场景

经典使用场景

在机器人模仿学习领域，该数据集通过记录机械臂关节位置与多视角视觉观测的时序数据，为行为克隆算法提供高质量演示轨迹。研究者可基于该数据训练端到端策略网络，使机器人能够从视觉输入直接映射到关节控制指令，实现精确的动作复现。

实际应用

工业自动化场景中，该数据集支持开发基于视觉伺服的机械臂分拣系统，通过模仿人类操作员的抓取动作提升生产线效率。服务机器人领域可应用于物体摆放、桌面整理等任务，其多视角视觉数据特别适合应对遮挡环境下的操作挑战。

衍生相关工作

基于该数据格式衍生了层次化模仿学习框架，将长周期任务分解为子技能序列。部分研究利用其多模态特性开发跨视角视觉特征提取器，另有工作结合强化学习进行策略微调，显著提升了现实环境中的动作泛化能力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集