five

eval_act_torso_real_2

收藏
Hugging Face2025-11-13 更新2025-11-14 收录
下载链接:
https://huggingface.co/datasets/simheo/eval_act_torso_real_2
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用LeRobot创建,并遵循Apache-2.0许可。数据集包含机器人学相关的任务类别。数据集结构详细描述了使用的机器人类型、总剧集数、总帧数和总任务数。还提供了数据文件和视频文件的路径、可用的特征(如动作、观测状态、观测图像)及其数据类型、形状和其他详细信息。但是,数据集描述和引用信息标记为需要更多信息,表明README中未提供这些详细信息。
创建时间:
2025-11-06
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

  • 总任务数: 1
  • 总片段数: 1
  • 总帧数: 1730
  • 帧率: 30 FPS
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 块大小: 1000
  • 代码库版本: v3.0
  • 机器人类型: reachy2

数据特征

动作特征

  • 数据类型: float32
  • 形状: [8]
  • 特征名称:
    • r_shoulder_pitch.pos
    • r_shoulder_roll.pos
    • r_elbow_yaw.pos
    • r_elbow_pitch.pos
    • r_wrist_roll.pos
    • r_wrist_pitch.pos
    • r_wrist_yaw.pos
    • r_gripper.pos

观测特征

状态观测

  • 数据类型: float32
  • 形状: [8]
  • 特征名称:
    • r_shoulder_pitch.pos
    • r_shoulder_roll.pos
    • r_elbow_yaw.pos
    • r_elbow_pitch.pos
    • r_wrist_roll.pos
    • r_wrist_pitch.pos
    • r_wrist_yaw.pos
    • r_gripper.pos

图像观测

  • 数据类型: 视频
  • 形状: [480, 640, 3]
  • 视频信息:
    • 高度: 480
    • 宽度: 640
    • 通道数: 3
    • 帧率: 30
    • 编解码器: av1
    • 像素格式: yuv420p
    • 深度图: 否
    • 音频: 无

索引特征

  • 时间戳: float32, 形状[1]
  • 帧索引: int64, 形状[1]
  • 片段索引: int64, 形状[1]
  • 索引: int64, 形状[1]
  • 任务索引: int64, 形状[1]

数据组织

  • 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 数据分割: 训练集 (0:1)

引用信息

  • 主页: [信息缺失]
  • 论文: [信息缺失]
  • 引用格式: [信息缺失]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人技术研究领域,eval_act_torso_real_2数据集通过LeRobot平台精心构建,采用Reachy2型机器人进行真实环境下的数据采集。该数据集以30帧/秒的采样频率记录连续动作序列,将1730帧运动数据分割为1000帧的块状结构,并以Parquet格式高效存储。数据采集过程完整记录了机器人关节空间轨迹与视觉感知信息,形成包含1个完整任务序列的多模态数据集。
特点
该数据集在机器人动作学习领域展现出显著特色,其核心特征在于同步采集8维关节控制指令与对应的姿态观测数据,涵盖肩部、肘部、腕部及夹爪的全方位运动参数。特别值得关注的是数据集包含 torso_rgb 视角的视觉信息,以480×640分辨率的三通道图像序列呈现,配合精确的时间戳与帧索引,为行为克隆与强化学习研究提供丰富的时空对齐信息。数据结构的精心设计确保了动作-观测对的精确对应关系。
使用方法
研究人员可通过加载Parquet格式的数据文件直接访问结构化数据,利用帧索引与时间戳实现精确的数据定位。数据集支持按任务索引和片段索引进行灵活检索,特别适合用于机器人动作预测模型的训练与验证。视觉数据可通过视频路径访问,配合关节状态数据构建端到端的学习管道,为模仿学习算法提供高质量的真实世界演示数据。数据集的标准化格式确保了与主流机器人学习框架的兼容性。
背景与挑战
背景概述
在机器人技术迅猛发展的背景下,eval_act_torso_real_2数据集应运而生,专注于解决机器人动作执行与感知交互的核心问题。该数据集由LeRobot团队基于Reachy2机器人平台构建,采用Apache 2.0开源协议,旨在通过真实环境中的躯干动作数据推动机器人控制算法的进步。数据集包含1730帧高分辨率图像和关节位置信息,以30fps的帧率记录多维度动作序列,为模仿学习与强化学习研究提供了丰富的实验基础。其结构化特征设计覆盖了从肩部到抓取器的完整运动链,体现了对机器人精细化操作能力的深入探索。
当前挑战
机器人动作数据集的构建面临多重挑战,在领域问题层面,需解决高维连续动作空间的精确建模问题,以及视觉感知与运动控制的多模态对齐难题。构建过程中,数据采集受限于机器人硬件精度与实时性要求,易引入传感器噪声和时序不一致性。同时,大规模视频数据的存储与处理对计算资源构成压力,而动作标签的语义一致性维护也增加了标注复杂度。此外,确保数据泛化能力以适应多样化的真实场景,仍是亟待突破的瓶颈。
常用场景
经典使用场景
在机器人控制领域,eval_act_torso_real_2数据集以其高精度动作记录和多模态观测数据,成为机器人模仿学习研究的核心资源。该数据集通过Reachy2机器人平台采集了完整的关节位置控制序列和躯干视角的视觉信息,为算法开发提供了真实世界中的连续交互轨迹。研究者可基于此数据集训练端到端的控制策略,模拟人类操作员的动作执行过程,推动机器人行为模仿技术的发展。
实际应用
在工业自动化与服务机器人领域,该数据集支撑了精细操作任务的算法部署。基于其包含的完整抓取动作序列,工程师可开发适用于装配线作业的智能控制系统。医疗机器人领域借助该数据集的关节运动模式,能够优化康复训练设备的运动轨迹规划。教育科研机构则利用其多模态特性,构建机器人操作技能的教学演示平台。
衍生相关工作
以该数据集为基础衍生了系列创新研究,包括基于时空一致性的动作预测模型和跨模态表示学习框架。LeRobot生态系统中多项工作通过扩展该数据集的标注体系,开发了分层强化学习架构。部分研究团队结合该数据集的视频流与动作序列,提出了视觉-运动联合嵌入方法,推动了机器人操作技能迁移领域的理论突破。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作