eval_act_so101_test26-5

Hugging Face2025-11-29 更新2025-11-30 收录

下载链接：

https://huggingface.co/datasets/bluephysi01/eval_act_so101_test26-5

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot工具创建的数据集，包含5个剧集共375帧，专注于1个任务。数据集以Apache-2.0许可证发布。数据集包含多种特征，如机器人的动作、状态、顶部和手腕的图像等，所有数据均以Parquet文件格式存储，视频文件格式为MP4。

创建时间：

2025-11-29

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot

数据集规模

总任务数: 1
总回合数: 5
总帧数: 375
帧率: 5 FPS
数据文件大小: 100 MB
视频文件大小: 500 MB
数据分块大小: 1000

数据结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
训练集划分: 0:5

特征字段

动作特征 (action)

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态 (observation.state)

数据类型: float32
维度: [6]
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

顶部摄像头图像 (observation.images.top)

数据类型: 视频
分辨率: 480×640×3
视频编码: AV1
像素格式: yuv420p
帧率: 5 FPS

腕部摄像头图像 (observation.images.wrist)

数据类型: 视频
分辨率: 480×640×3
视频编码: AV1
像素格式: yuv420p
帧率: 5 FPS

元数据字段

时间戳 (timestamp): float32[1]
帧索引 (frame_index): int64[1]
回合索引 (episode_index): int64[1]
索引 (index): int64[1]
任务索引 (task_index): int64[1]

技术信息

代码库版本: v3.0
机器人类型: so101_follower

搜集汇总

数据集介绍

构建方式

在机器人技术领域，eval_act_so101_test26-5数据集依托LeRobot框架构建，采用结构化数据采集方法。该数据集包含5个完整任务片段，总计375帧数据，以5帧每秒的速率记录。数据以分块形式存储于Parquet文件中，每个块大小设定为1000个条目，确保了高效的数据管理和访问。机器人状态与动作数据通过浮点型数值精确捕捉，涵盖了肩部、肘部、腕部和抓取器的位置信息，为机器人控制研究提供了可靠基础。

特点

该数据集在机器人感知与控制方面展现出显著特点，其多维特征结构包括动作向量、状态观测以及双视角视觉数据。动作和状态均以6维浮点数组表示机器人关节位置，而观测部分则整合了顶部和腕部摄像头采集的480x640分辨率RGB视频，帧率稳定为5fps。数据集采用紧凑的索引机制，如帧索引、片段索引和任务索引，支持精细的数据分段分析。这种设计使得数据集在模拟真实机器人操作环境时，兼具高精度与可视化优势。

使用方法

针对机器人学习任务，eval_act_so101_test26-5数据集的使用遵循标准化流程。研究人员可通过加载Parquet格式的数据文件，直接访问动作、观测和时序信息。数据集支持基于帧索引或片段索引的数据检索，便于训练和验证控制算法。视觉数据以MP4视频文件形式提供，可与状态数据同步分析，用于行为克隆、强化学习等应用。其清晰的数据路径和分块结构简化了大规模数据处理，同时兼容常见机器学习框架，加速算法开发进程。

背景与挑战

背景概述

在机器人技术迅猛发展的时代背景下，eval_act_so101_test26-5数据集应运而生，它由HuggingFace的LeRobot项目团队构建，旨在推动机器人行为评估与控制算法的研究。该数据集聚焦于机器人动作执行与状态观测的精细化记录，通过整合多模态传感器数据，包括关节位置、视觉图像和时间戳信息，为机器人学习任务提供了丰富的实验基础。其核心研究问题在于如何有效模拟和评估机器人在复杂环境中的动态行为，从而提升自主系统的适应性与可靠性，对机器人感知与决策领域的发展具有重要促进作用。

当前挑战

该数据集致力于解决机器人动作评估与控制中的关键挑战，例如高维动作空间的精确建模和多传感器数据的同步融合问题。在构建过程中，团队面临数据采集的复杂性，需确保来自顶部和腕部摄像头的视觉流与关节状态数据在时间维度上的一致性；同时，处理大规模视频和结构化数据的存储与索引也带来了技术障碍，要求高效的压缩算法和分布式架构支持，以维持数据的完整性和可访问性。

常用场景

经典使用场景

在机器人控制领域，eval_act_so101_test26-5数据集通过记录六自由度机械臂的关节位置与多视角视觉数据，为模仿学习算法提供了标准化的训练环境。该数据集以5Hz采样频率捕捉了肩部平移、肩部抬升、肘部弯曲等完整运动链的连续轨迹，配合顶部与腕部双摄像头采集的480p环境影像，构建了从状态感知到动作执行的闭环映射关系。这种多模态数据融合机制使得研究者能够系统性地验证行为克隆、逆强化学习等算法在真实机器人平台上的泛化能力。

衍生相关工作

基于该数据集的特性，学术界衍生出多项创新研究。LeRobot团队开发的层次化模仿学习框架利用其多视角视频流实现了动作语义解耦，后续研究者则通过引入时空注意力机制提升了长序列任务的预测精度。在元学习方向，该数据集支撑的跨任务泛化研究催生了概率运动原型的表示方法，这些工作共同推动了机器人终身学习范式的演进。

数据集最近研究