eval_act_so100_movella_stack_e4

Hugging Face2025-08-07 更新2025-08-08 收录

下载链接：

https://huggingface.co/datasets/sergiov2000/eval_act_so100_movella_stack_e4

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个专注于机器人任务的数据集，包含了一个名为so100MovellaDot的机器人类型的数据。数据集包含1个总剧集，595个总帧，1个总任务，2个总视频和1个总块，每个块的大小为1000。数据集的时间分辨率为20fps，并且只提供了训练集分割。数据集中的特征包括动作、状态、侧视和俯视图像，以及时间戳和索引信息。

创建时间：

2025-08-06

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot, tutorial
代码库版本: v2.1
机器人类型: so100MovellaDot

数据集结构

总集数: 1
总帧数: 595
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率: 20 fps
数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

动作 (action):
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
观测状态 (observation.state):
- 数据类型: float32
- 形状: [6]
- 名称: 同动作特征
观测图像 (observation.images.side 和 observation.images.above):
- 数据类型: video
- 形状: [480, 640, 3]
- 名称: height, width, channels
- 视频信息:
  - 高度: 480
  - 宽度: 640
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: false
  - 帧率: 20 fps
  - 通道数: 3
  - 是否包含音频: false
其他特征:
- timestamp: float32, 形状 [1]
- frame_index: int64, 形状 [1]
- episode_index: int64, 形状 [1]
- index: int64, 形状 [1]
- task_index: int64, 形状 [1]

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，eval_act_so100_movella_stack_e4数据集通过LeRobot框架精心构建，采用先进的传感器采集技术，记录了机器人执行任务时的多模态数据。数据集以20帧/秒的采样率捕获了595帧数据，包含6自由度机械臂的动作指令和状态反馈，同时整合了双视角（侧面与俯视）的480×640分辨率视频流。数据以分块形式存储于Parquet文件中，确保了高效存取与处理。

特点

该数据集显著特点在于其多维度的同步观测体系，不仅包含机械臂关节角度（肩部平移/抬升、肘部屈曲、腕部屈曲/旋转及夹持器状态）的精确量化数据，还配备了双摄像头视角的视觉信息。所有动作与状态数据均以float32格式存储，视频流采用AV1编码，兼具数据精度与存储效率。数据结构的精心设计使得时间序列对齐精确到帧级别，为机器人动作分析与模仿学习研究提供了理想基准。

使用方法

研究者可通过加载Parquet文件直接访问结构化数据，利用帧索引实现时间序列数据的精确检索。视频数据与动作状态的天然同步特性支持端到端的行为克隆算法验证，而多模态特征命名体系便于特定关节运动的针对性分析。建议配合LeRobot框架使用，其内置工具链可高效处理视频解码与动作数据的时空对齐，适用于机器人控制策略开发、动作预测模型训练等场景。

背景与挑战

背景概述

eval_act_so100_movella_stack_e4数据集由LeRobot团队基于Apache 2.0协议构建，专注于机器人控制领域的研究。该数据集记录了SO100 Movella Dot机械臂的多模态操作数据，包含595帧20fps的运动轨迹视频与6自由度关节控制指令。通过集成侧面与顶部双视角视觉观测、关节状态反馈及精确时间戳标记，为模仿学习与强化学习算法提供了高精度训练样本。其采用分块存储的Parquet格式与标准化元数据结构，体现了现代机器人数据集在可扩展性与跨平台兼容性方面的设计理念。

当前挑战

该数据集面临的核心挑战在于解决复杂操作任务中的多模态时序对齐问题，需确保机械臂关节指令与双视角视频帧的毫秒级同步精度。数据构建过程中，运动捕捉系统标定误差与视觉传感器帧率差异导致原始数据存在时空失配现象。此外，6维连续动作空间与高维视觉观测的耦合关系建模，对深度强化学习算法的样本效率与泛化能力提出了更高要求。数据规模方面，当前仅包含单任务595帧样本，需扩展至多任务场景以验证算法迁移性能。

常用场景

经典使用场景

在机器人控制与行为学习领域，eval_act_so100_movella_stack_e4数据集通过记录机械臂关节角度、末端执行器状态及多视角视频数据，为模仿学习与强化学习算法提供了高精度训练样本。其结构化动作空间与同步视觉观测的特性，特别适用于研究机械臂在复杂环境中的动作序列生成问题，例如物体抓取、堆叠等精细操作任务的策略建模。

衍生相关工作

基于该数据集的特性，学术界衍生出多项机器人技能迁移研究，包括跨任务的动作策略泛化框架构建。部分工作利用其多视角视频数据开发了新型视觉里程计算法，另有研究结合其结构化动作空间提出了分层强化学习架构，这些成果均发表在机器人顶会ICRA与IROS上。

数据集最近研究