eval_act_so100_movella_stack_e3

Hugging Face2025-08-07 更新2025-08-08 收录

下载链接：

https://huggingface.co/datasets/sergiov2000/eval_act_so100_movella_stack_e3

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot创建的机器人数据集，包含1个剧集，595帧，1个任务，2个视频和1个片段。数据集的结构包括动作、状态、侧视图和俯视图视频等特征，所有视频帧的尺寸为480x640，使用av1编码，没有音频。数据集的帧率为20fps，并且提供了训练集的分割信息。

创建时间：

2025-08-06

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot, tutorial

数据集描述

创建工具: LeRobot
主页: [More Information Needed]
论文: [More Information Needed]

数据集结构

数据文件格式: .parquet
代码库版本: v2.1
机器人类型: so100MovellaDot
总集数: 1
总帧数: 595
总任务数: 1
总视频数: 2
总块数: 1
块大小: 1000
帧率: 20 fps
分割: 训练集 (0:1)

数据路径

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

action:
- 数据类型: float32
- 形状: [6]
- 名称: main_shoulder_pan, main_shoulder_lift, main_elbow_flex, main_wrist_flex, main_wrist_roll, main_gripper
observation.state:
- 数据类型: float32
- 形状: [6]
- 名称: 同action
observation.images.side:
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 高度480, 宽度640, 编码av1, 像素格式yuv420p, 非深度图, 帧率20, 通道3, 无音频
observation.images.above:
- 数据类型: video
- 形状: [480, 640, 3]
- 视频信息: 同side
timestamp:
- 数据类型: float32
- 形状: [1]
frame_index:
- 数据类型: int64
- 形状: [1]
episode_index:
- 数据类型: int64
- 形状: [1]
index:
- 数据类型: int64
- 形状: [1]
task_index:
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据采集对于算法训练至关重要。eval_act_so100_movella_stack_e3数据集通过LeRobot平台构建，采用so100MovellaDot机器人进行数据采集。数据以20fps的采样频率记录，包含595帧的连续动作序列，存储为Parquet格式的文件。每个数据块包含完整的动作特征、观测状态和多视角视频数据，采用分块存储策略确保数据的高效访问。

特点

该数据集展现了机器人控制领域的典型特征，包含6维动作空间和对应的6维状态观测。独特的双视角视频数据（侧面和俯视角度）以480×640分辨率记录，为视觉-动作联合建模提供丰富信息。数据采用严格的类型标注，动作和状态数据均为float32类型，时间戳和索引采用int64类型，确保数值精度。视频数据采用AV1编码，兼顾存储效率与画面质量。

使用方法

研究人员可通过加载Parquet文件直接访问结构化数据，视频数据则存储在独立路径中。数据集已预置训练集划分，支持端到端的机器人控制算法开发。典型的应用场景包括：通过观测状态预测动作指令、基于视觉输入的强化学习、多模态数据融合研究等。使用前需配置LeRobot环境，视频解码建议采用兼容AV1的编解码器。

背景与挑战

背景概述

eval_act_so100_movella_stack_e3数据集由LeRobot项目团队构建，专注于机器人控制领域的研究。该数据集采用Apache-2.0许可协议，主要记录了so100MovellaDot型机器人的动作执行数据，包括6自由度机械臂的运动状态和多视角视频观测。数据集包含595帧数据，采样频率为20Hz，通过标准化存储格式实现了动作指令与观测状态的高效关联。这类数据集在机器人模仿学习与强化学习研究中具有重要价值，为算法验证提供了真实世界的交互数据。

当前挑战

该数据集面临的核心挑战体现在两个维度：在领域问题层面，多自由度机械臂的精确控制需要解决高维连续动作空间与视觉观测的时序对齐问题，这对模仿学习算法的泛化能力提出严峻考验；在构建技术层面，数据采集需同步处理机械臂关节状态、末端执行器位姿与多路高清视频流，对硬件同步精度与数据存储架构设计提出了极高要求。此外，缺乏公开的论文引用信息也影响了数据集在学术界的可追溯性。

常用场景

经典使用场景

在机器人控制与行为分析领域，eval_act_so100_movella_stack_e3数据集通过记录机械臂的关节角度、抓取器状态以及多视角视频数据，为研究机器人动作执行与状态反馈的关联性提供了丰富素材。其结构化存储的时序动作指令与同步观测数据，特别适合用于验证强化学习算法在机械臂控制任务中的表现。

衍生相关工作

基于该数据集的特性，已有研究团队开发了新型的模仿学习框架，通过解耦视觉观测与动作序列的时空关系来提升控制策略的泛化能力。在LeRobot生态系统中，该数据集常被用作基准测试工具，催生了多个关于多模态表征学习与跨视角动作预测的重要研究成果。

数据集最近研究