eval_so101_ACTLego_40k

Hugging Face2026-01-12 更新2026-01-13 收录

下载链接：

https://huggingface.co/datasets/gainz248ai/eval_so101_ACTLego_40k

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个机器人技术领域的数据集，由LeRobot项目创建。数据集包含24个episodes，共16024帧，涉及机器人动作和状态观测数据。数据以parquet格式存储，包含视频文件和数据文件。数据特征包括机器人的动作、状态观测（如关节位置）、前部和腕部摄像头图像、时间戳、帧索引等。

创建时间：

2026-01-12

原始信息汇总

数据集概述

基本信息

数据集名称: eval_so101_ACTLego_40k
创建工具: 使用 LeRobot 创建。
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总情节数: 24
总帧数: 16024
总任务数: 1
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 200 MB
帧率: 30 FPS
代码库版本: v3.0
机器人类型: so101_follower
数据分割: 训练集包含所有24个情节。
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

动作: 6维浮点数组，表示机器人关节位置（肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转、夹爪）。
观测状态: 6维浮点数组，表示机器人关节位置（与动作特征相同）。
观测图像（前视）: 视频格式，分辨率480x640，3通道，编码为AV1，无音频。
观测图像（腕部）: 视频格式，分辨率480x640，3通道，编码为AV1，无音频。
时间戳: 单精度浮点数。
帧索引: 64位整数。
情节索引: 64位整数。
索引: 64位整数。
任务索引: 64位整数。

引用信息

主页: 未提供
论文: 未提供
BibTeX引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法验证至关重要。eval_so101_ACTLego_40k数据集依托LeRobot平台构建，通过采集真实机器人执行任务时的多模态数据而形成。该数据集记录了24个完整任务片段，总计超过16000帧数据，以30帧每秒的速率同步捕获机器人的关节状态、前视与腕部摄像头视频流，并以分块Parquet格式高效存储，确保了数据的时序一致性与可扩展性。

特点

该数据集的核心特征在于其丰富的多模态观测与精确的动作标注。观测部分不仅包含六自由度机械臂的关节位置状态，还提供了前视与腕部两个视角的高清RGB视频，分辨率均为640x480，编码为AV1格式以平衡质量与存储效率。动作空间同样以六维浮点数向量定义，与观测状态维度一致，便于模仿学习与强化学习算法的直接应用。数据集结构清晰，所有特征均附带完整的元数据描述，支持按帧索引、片段索引等多种方式进行灵活的数据检索与批处理。

使用方法

为便于研究者使用，数据集已预先划分为训练集，涵盖了全部24个任务片段。用户可通过LeRobot库或直接读取Parquet文件加载数据，利用提供的帧索引、片段索引等字段进行数据切片与采样。多模态数据（特别是视频流）可通过指定路径加载，适用于机器人行为克隆、视觉运动策略学习等任务。数据以Apache 2.0协议开源，鼓励用户在遵守许可的前提下，将其用于算法开发、模型训练与性能评估。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习的研究依赖于高质量、大规模的真实世界交互数据。eval_so101_ACTLego_40k数据集应运而生，由HuggingFace的LeRobot项目团队创建，旨在为机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于解决机器人灵巧操作中的策略泛化问题，通过记录so101_follower机器人在实际环境中的关节状态、视觉观察与动作序列，为训练端到端的控制模型奠定了数据基础。其构建体现了开源社区推动机器人学习民主化的努力，通过Apache 2.0许可证促进广泛共享与应用，对推动机器人自主操作技术的进步具有潜在影响力。

当前挑战

该数据集致力于应对机器人模仿学习中策略泛化与样本效率的核心挑战。具体而言，如何从有限的演示片段中学习能够适应环境变化与任务变体的鲁棒策略，是一个亟待解决的难题。在构建过程中，数据采集面临诸多挑战：确保多传感器数据（如前视与腕部摄像头视频、关节位置）的精确时间同步；在真实物理环境中维持数据的一致性与安全性；以及高效处理与存储大规模高维视觉流数据，同时保持数据的可访问性与结构化组织。这些挑战共同构成了数据集有效服务于机器人学习研究的关键瓶颈。

常用场景

经典使用场景

在机器人学习领域，eval_so101_ACTLego_40k数据集为模仿学习与强化学习算法的评估提供了关键基准。该数据集通过记录SO101型跟随机器人执行任务时的多模态观测数据，包括关节位置状态、前视与腕部摄像头视频流，构建了丰富的机器人交互轨迹。研究者可借助这些数据训练端到端的策略模型，验证算法在真实物理环境中的泛化能力与鲁棒性，尤其适用于机械臂操控任务的离线评估场景。

衍生相关工作

围绕该数据集，已衍生出多项聚焦于多模态机器人学习的经典研究。例如，结合视觉与状态信息的跨模态预训练方法，提升了策略在未见任务上的泛化性能；基于时空注意力机制的轨迹预测模型，利用其连续帧序列优化了长期动作规划。此外，该数据集也促进了离线策略评估基准的构建，为比较不同模仿学习与强化学习算法提供了统一标准，推动了开源机器人学习生态的发展。

数据集最近研究