eval_act_torso_real_2

Hugging Face2025-11-13 更新2025-11-14 收录

下载链接：

https://huggingface.co/datasets/simheo/eval_act_torso_real_2

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用LeRobot创建，并遵循Apache-2.0许可。数据集包含机器人学相关的任务类别。数据集结构详细描述了使用的机器人类型、总剧集数、总帧数和总任务数。还提供了数据文件和视频文件的路径、可用的特征（如动作、观测状态、观测图像）及其数据类型、形状和其他详细信息。但是，数据集描述和引用信息标记为需要更多信息，表明README中未提供这些详细信息。

创建时间：

2025-11-06

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

总任务数: 1
总片段数: 1
总帧数: 1730
帧率: 30 FPS
数据文件大小: 100 MB
视频文件大小: 500 MB
块大小: 1000
代码库版本: v3.0
机器人类型: reachy2

数据特征

动作特征

数据类型: float32
形状: [8]
特征名称:
- r_shoulder_pitch.pos
- r_shoulder_roll.pos
- r_elbow_yaw.pos
- r_elbow_pitch.pos
- r_wrist_roll.pos
- r_wrist_pitch.pos
- r_wrist_yaw.pos
- r_gripper.pos

观测特征

状态观测

数据类型: float32
形状: [8]
特征名称:
- r_shoulder_pitch.pos
- r_shoulder_roll.pos
- r_elbow_yaw.pos
- r_elbow_pitch.pos
- r_wrist_roll.pos
- r_wrist_pitch.pos
- r_wrist_yaw.pos
- r_gripper.pos

图像观测

数据类型: 视频
形状: [480, 640, 3]
视频信息:
- 高度: 480
- 宽度: 640
- 通道数: 3
- 帧率: 30
- 编解码器: av1
- 像素格式: yuv420p
- 深度图: 否
- 音频: 无

索引特征

时间戳: float32, 形状[1]
帧索引: int64, 形状[1]
片段索引: int64, 形状[1]
索引: int64, 形状[1]
任务索引: int64, 形状[1]

数据组织

数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据分割: 训练集 (0:1)

引用信息

主页: [信息缺失]
论文: [信息缺失]
引用格式: [信息缺失]

搜集汇总

数据集介绍

构建方式

在机器人技术研究领域，eval_act_torso_real_2数据集通过LeRobot平台精心构建，采用Reachy2型机器人进行真实环境下的数据采集。该数据集以30帧/秒的采样频率记录连续动作序列，将1730帧运动数据分割为1000帧的块状结构，并以Parquet格式高效存储。数据采集过程完整记录了机器人关节空间轨迹与视觉感知信息，形成包含1个完整任务序列的多模态数据集。

特点

该数据集在机器人动作学习领域展现出显著特色，其核心特征在于同步采集8维关节控制指令与对应的姿态观测数据，涵盖肩部、肘部、腕部及夹爪的全方位运动参数。特别值得关注的是数据集包含 torso_rgb 视角的视觉信息，以480×640分辨率的三通道图像序列呈现，配合精确的时间戳与帧索引，为行为克隆与强化学习研究提供丰富的时空对齐信息。数据结构的精心设计确保了动作-观测对的精确对应关系。

使用方法

研究人员可通过加载Parquet格式的数据文件直接访问结构化数据，利用帧索引与时间戳实现精确的数据定位。数据集支持按任务索引和片段索引进行灵活检索，特别适合用于机器人动作预测模型的训练与验证。视觉数据可通过视频路径访问，配合关节状态数据构建端到端的学习管道，为模仿学习算法提供高质量的真实世界演示数据。数据集的标准化格式确保了与主流机器人学习框架的兼容性。

背景与挑战

背景概述

在机器人技术迅猛发展的背景下，eval_act_torso_real_2数据集应运而生，专注于解决机器人动作执行与感知交互的核心问题。该数据集由LeRobot团队基于Reachy2机器人平台构建，采用Apache 2.0开源协议，旨在通过真实环境中的躯干动作数据推动机器人控制算法的进步。数据集包含1730帧高分辨率图像和关节位置信息，以30fps的帧率记录多维度动作序列，为模仿学习与强化学习研究提供了丰富的实验基础。其结构化特征设计覆盖了从肩部到抓取器的完整运动链，体现了对机器人精细化操作能力的深入探索。

当前挑战

机器人动作数据集的构建面临多重挑战，在领域问题层面，需解决高维连续动作空间的精确建模问题，以及视觉感知与运动控制的多模态对齐难题。构建过程中，数据采集受限于机器人硬件精度与实时性要求，易引入传感器噪声和时序不一致性。同时，大规模视频数据的存储与处理对计算资源构成压力，而动作标签的语义一致性维护也增加了标注复杂度。此外，确保数据泛化能力以适应多样化的真实场景，仍是亟待突破的瓶颈。

常用场景

经典使用场景

在机器人控制领域，eval_act_torso_real_2数据集以其高精度动作记录和多模态观测数据，成为机器人模仿学习研究的核心资源。该数据集通过Reachy2机器人平台采集了完整的关节位置控制序列和躯干视角的视觉信息，为算法开发提供了真实世界中的连续交互轨迹。研究者可基于此数据集训练端到端的控制策略，模拟人类操作员的动作执行过程，推动机器人行为模仿技术的发展。

实际应用

在工业自动化与服务机器人领域，该数据集支撑了精细操作任务的算法部署。基于其包含的完整抓取动作序列，工程师可开发适用于装配线作业的智能控制系统。医疗机器人领域借助该数据集的关节运动模式，能够优化康复训练设备的运动轨迹规划。教育科研机构则利用其多模态特性，构建机器人操作技能的教学演示平台。

衍生相关工作

以该数据集为基础衍生了系列创新研究，包括基于时空一致性的动作预测模型和跨模态表示学习框架。LeRobot生态系统中多项工作通过扩展该数据集的标注体系，开发了分层强化学习架构。部分研究团队结合该数据集的视频流与动作序列，提出了视觉-运动联合嵌入方法，推动了机器人操作技能迁移领域的理论突破。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集