five

pds_non_cyclic

收藏
Hugging Face2026-02-14 更新2026-02-15 收录
下载链接:
https://huggingface.co/datasets/J-joon/pds_non_cyclic
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,采用Apache-2.0许可协议,专注于机器人技术领域。数据集包含500个任务片段,总计115,982帧数据,数据文件大小为100MB,视频文件大小为200MB,帧率为50fps。数据集结构包括观察状态(14维浮点数组,描述左右机械臂各关节状态)、动作(同样为14维浮点数组)、来自三个不同摄像头(高视角、左腕、右腕)的视频数据(480x640分辨率,3通道,50fps),以及时间戳、帧索引、片段索引等元数据。所有数据仅包含训练集划分,存储为parquet格式文件。该数据集适用于机器人控制、行为模仿等研究任务。
创建时间:
2026-02-13
原始信息汇总

数据集概述

基本信息

  • 数据集名称: pds_non_cyclic
  • 创建工具: LeRobot (https://github.com/huggingface/lerobot)
  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot

数据集规模

  • 总情节数: 500
  • 总帧数: 115,982
  • 总任务数: 497
  • 数据块大小: 1000
  • 数据文件总大小: 100 MB
  • 视频文件总大小: 200 MB
  • 帧率: 50 FPS
  • 数据分割: 训练集 (0:500)

数据结构与特征

数据以Parquet文件格式存储,路径模式为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet。 视频文件以MP4格式存储,路径模式为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

主要特征字段

  1. observation.state

    • 数据类型: float32
    • 形状: [14]
    • 描述: 机器人状态,包含右臂和左臂各7个关节的位置(右/左腰部、肩部、肘部、前臂旋转、手腕角度、手腕旋转、夹爪)。
  2. action

    • 数据类型: float32
    • 形状: [14]
    • 描述: 机器人动作,关节顺序与 observation.state 完全一致。
  3. observation.images.cam_high

    • 数据类型: video
    • 形状: [3, 480, 640] (通道,高度,宽度)
    • 视频信息: 分辨率 640x480,编码 AV1,像素格式 yuv420p,非深度图,50 FPS,3通道,无音频。
  4. observation.images.cam_left_wrist

    • 数据类型: video
    • 形状: [3, 480, 640] (通道,高度,宽度)
    • 视频信息: 分辨率 640x480,编码 AV1,像素格式 yuv420p,非深度图,50 FPS,3通道,无音频。
  5. observation.images.cam_right_wrist

    • 数据类型: video
    • 形状: [3, 480, 640] (通道,高度,宽度)
    • 视频信息: 分辨率 640x480,编码 AV1,像素格式 yuv420p,非深度图,50 FPS,3通道,无音频。
  6. 索引与元数据

    • timestamp: 时间戳 (float32, [1])
    • frame_index: 帧索引 (int64, [1])
    • episode_index: 情节索引 (int64, [1])
    • index: 数据索引 (int64, [1])
    • task_index: 任务索引 (int64, [1])

其他信息

  • 代码库版本: v3.0
  • 机器人类型: aloha
  • 主页: 信息缺失
  • 论文: 信息缺失
  • 引用信息: 信息缺失
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集对于算法训练至关重要。pds_non_cyclic数据集依托LeRobot框架构建,通过ALOHA机器人平台采集了497项任务的演示数据。该数据集以50帧每秒的速率记录,包含500个完整情节,总计115,982帧,数据以分块Parquet格式存储,每块约1000帧,并辅以同步的视频文件,确保了时序一致性与高效存取。
特点
该数据集在机器人操作任务中展现出多模态融合的显著特点。其观测数据不仅包含14维的关节状态向量,还整合了来自三个不同视角的高清视频流,分别对应全局、左腕和右腕摄像头,分辨率均为640x480。这种结构为模仿学习与强化学习提供了丰富的视觉与状态信息,且所有数据均以标准化格式组织,便于直接用于端到端的策略训练。
使用方法
研究人员可利用该数据集进行机器人技能学习的实验。数据通过HuggingFace平台提供,可直接加载Parquet文件获取状态、动作及视频索引。典型应用包括训练视觉运动策略,其中观测图像与关节动作构成监督信号;数据集已预设训练分割,涵盖全部500个情节,支持批量读取与流式处理,以适应不同规模的模型训练需求。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的发展亟需大规模、高质量的真实世界交互数据集作为支撑。pds_non_cyclic数据集由HuggingFace的LeRobot项目创建,专门面向双臂机器人操作任务。该数据集采集自ALOHA机器人平台,包含了500个任务片段、近11.6万帧数据,融合了多视角视觉观测与高维关节状态动作信息,旨在为机器人策略学习提供丰富的离线训练资源。其构建体现了当前研究对数据驱动方法解决复杂操作问题的重视,通过结构化存储与开源共享,推动了社区在真实场景下机器人技能泛化能力的研究进程。
当前挑战
该数据集致力于解决机器人模仿学习中从高维多模态观测到连续动作空间的映射挑战,其核心问题在于如何从非周期性的真实交互数据中学习鲁棒且可泛化的操作策略。构建过程中的挑战主要体现在数据采集与处理的复杂性上:需要同步记录来自三个摄像头的视频流与14维关节状态,确保时序对齐与数据完整性;同时,大规模数据的存储与高效访问要求设计合理的分块与压缩格式,以平衡存储开销与读取速度。此外,真实环境下的任务多样性与非周期性增加了数据标注与质量控制的难度,要求精细的元数据管理来支持有效的离线学习。
常用场景
经典使用场景
在机器人学习领域,pds_non_cyclic数据集为双臂机器人操作任务提供了丰富的多模态数据。该数据集通过LeRobot平台采集,包含500个任务片段和超过11万帧数据,融合了机器人关节状态、动作指令以及来自多个视角的高帧率视频流。这些数据为模仿学习与强化学习算法提供了标准化的训练环境,尤其适用于双臂协调操作这类复杂任务的策略建模与验证。
衍生相关工作
围绕该数据集,已衍生出一系列关于多模态机器人模仿学习的研究工作。例如,结合视觉与本体感知的端到端策略学习框架,以及基于Transformer的序列建模方法在双臂操作任务中的应用。这些工作进一步拓展了数据集中非周期性动作序列的利用方式,为机器人学习社区提供了可复现的基准与算法改进方向。
数据集最近研究
最新研究方向
在机器人学习领域,pds_non_cyclic数据集以其非周期性任务执行数据,为模仿学习与强化学习算法提供了关键支撑。该数据集源自ALOHA双手机器人平台,包含丰富的多视角视觉观测与精确关节状态记录,正推动着机器人操作技能泛化研究的前沿探索。当前热点聚焦于如何利用此类大规模真实世界交互数据,训练具备跨任务适应能力的通用策略模型,以应对复杂动态环境下的灵巧操作挑战。这一方向不仅加速了机器人自主性的提升,也为工业自动化与家庭服务机器人的实际部署奠定了数据基础,具有显著的工程应用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作