five

eval_pi05_full_5

收藏
Hugging Face2026-04-06 更新2026-04-07 收录
下载链接:
https://huggingface.co/datasets/Tna001/eval_pi05_full_5
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,专注于机器人领域。数据集包含13个完整的情节,总计3291帧数据,涉及2个不同的任务。数据以parquet格式存储,视频数据以mp4格式存储,总数据量约为300MB(数据文件100MB,视频文件200MB)。数据集的结构包括动作数据(如肩部、肘部、腕部和夹爪的位置)、观察状态(与动作数据类似)、顶部摄像头图像(224x224像素,RGB三通道)、时间戳、帧索引、情节索引和任务索引等。视频数据的帧率为10fps,无音频。数据集采用Apache-2.0许可证。
创建时间:
2026-04-04
原始信息汇总

数据集概述

基本信息

  • 数据集名称: eval_pi05_full_5
  • 创建工具: 使用 LeRobot 创建。
  • 许可证: Apache-2.0
  • 任务类别: 机器人学

数据集结构

  • 配置名称: default
  • 数据文件格式: Parquet 文件,存储于 data/*/*.parquet
  • 总数据量:
    • 总情节数: 13
    • 总帧数: 3291
    • 总任务数: 2
  • 存储信息:
    • 数据文件总大小: 100 MB
    • 视频文件总大小: 200 MB
    • 数据块大小: 1000
  • 帧率: 10 FPS
  • 数据划分: 训练集包含所有13个情节(索引0到13)。

数据特征

数据集包含以下特征:

动作

  • 数据类型: float32
  • 形状: [6]
  • 描述: 包含6个关节的位置指令,具体为:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测状态

  • 数据类型: float32
  • 形状: [6]
  • 描述: 包含6个关节的观测位置,具体为:
    • shoulder_pan.pos
    • shoulder_lift.pos
    • elbow_flex.pos
    • wrist_flex.pos
    • wrist_roll.pos
    • gripper.pos

观测图像(顶部摄像头)

  • 数据类型: video
  • 形状: [224, 224, 3] (高度, 宽度, 通道)
  • 视频信息:
    • 视频高度: 224
    • 视频宽度: 224
    • 视频编解码器: av1
    • 像素格式: yuv420p
    • 是否为深度图: false
    • 视频帧率: 10
    • 视频通道数: 3
    • 是否包含音频: false

元数据

  • 时间戳: 数据类型为 float32,形状为 [1]。
  • 帧索引: 数据类型为 int64,形状为 [1]。
  • 情节索引: 数据类型为 int64,形状为 [1]。
  • 索引: 数据类型为 int64,形状为 [1]。
  • 任务索引: 数据类型为 int64,形状为 [1]。

文件路径模式

  • 数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

其他信息

  • 代码库版本: v3.0
  • 机器人类型: so100_tactile_follower
  • 主页: 信息缺失
  • 论文: 信息缺失
  • 引用格式: 信息缺失
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,高质量的数据集是推动算法发展的基石。eval_pi05_full_5数据集依托LeRobot开源框架构建,通过记录真实机器人执行任务的过程来采集数据。该数据集包含13个完整的情节,总计3291帧,以10帧每秒的速率采集,涵盖了两种不同的任务场景。数据以分块形式存储于Parquet文件中,每个块约1000帧,同时配有对应的视频文件,视频采用AV1编码,分辨率为224x224,确保了数据的结构化与高效访问。
特点
该数据集在机器人操作任务中展现出多模态融合的鲜明特色。其核心特征在于同步记录了机器人的关节位置动作、状态观测以及顶部摄像头捕捉的视觉图像,形成了动作、状态与视觉的联合表征。具体而言,动作与状态均包含六个自由度,覆盖肩部平移、肩部升降、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置;视觉数据则以RGB格式提供,为算法提供了丰富的环境感知信息。此外,数据集还精确标注了时间戳、帧索引、情节索引及任务索引,支持精细的时间序列分析与任务划分。
使用方法
为便于研究者利用该数据集进行机器人策略学习或评估,数据集已结构化组织并托管于HuggingFace平台。用户可通过LeRobot提供的可视化工具在线浏览数据内容,或直接下载Parquet文件进行本地处理。数据按情节和帧索引,可轻松提取特定任务的时间序列,用于训练模仿学习、强化学习等模型。鉴于数据集包含明确的训练划分,研究者可直接将其用于模型训练与验证,推动机器人控制算法的实际应用与性能提升。
背景与挑战
背景概述
在机器人学习领域,高质量的数据集对于推动模仿学习与强化学习算法的进展至关重要。eval_pi05_full_5数据集依托LeRobot平台构建,专注于机械臂操作任务,特别是针对具有触觉反馈的so100型机器人。该数据集收录了13个完整交互序列,涵盖3291帧多模态观测数据,包括关节状态、顶层视觉图像及精确时间戳,旨在为机器人策略评估与泛化能力研究提供实证基础。尽管其具体创建时间与核心研究团队信息尚未公开,但数据集的结构设计反映了当前机器人学习研究中对可重复实验与标准化评估的迫切需求,有望促进开源机器人社区在真实世界任务上的算法比较与性能提升。
当前挑战
eval_pi05_full_5数据集致力于解决机器人操作任务中的策略评估与泛化挑战,其核心问题在于如何通过有限的任务实例(仅包含2种任务)来验证学习策略在多样化场景下的鲁棒性。构建过程中的挑战尤为显著:多模态数据的高效同步与存储是一大难题,数据集需整合关节位置、视觉图像及时间序列信息,并采用parquet格式与视频编码技术以平衡数据规模与访问效率;此外,数据采集的规模受限,仅包含13个交互序列,可能影响学习模型的泛化能力;同时,数据标注与任务定义的标准化尚未完善,缺乏详细的论文引用与任务描述,为后续研究的可复现性与深入分析带来不确定性。
常用场景
经典使用场景
在机器人学习领域,eval_pi05_full_5数据集作为LeRobot项目的一部分,主要用于评估和验证机器人策略在复杂任务中的性能。该数据集包含了来自so100_tactile_follower机器人的多模态数据,如关节位置、图像观测和时间戳,为研究人员提供了丰富的交互轨迹。经典使用场景涉及机器人策略的离线评估,通过分析预收集的演示数据,研究者能够测试强化学习或模仿学习算法的泛化能力,特别是在涉及触觉跟随和视觉引导的任务中,数据集的高质量视频和状态记录为算法比较提供了基准。
解决学术问题
该数据集解决了机器人学术研究中策略评估标准化的关键问题。传统上,机器人实验依赖于实时硬件部署,成本高昂且难以复现;eval_pi05_full_5通过提供结构化、多模态的离线数据,使研究者能够在不依赖物理机器人的情况下,系统性地评估策略在特定任务(如抓取或操作)中的表现。这促进了算法公平比较,加速了机器人学习方法的迭代,并为解决样本效率低、安全约束强等挑战提供了数据基础,从而推动了机器人智能向更高效、可靠的方向发展。
衍生相关工作
围绕eval_pi05_full_5数据集,衍生了一系列经典研究工作,主要集中在机器人学习算法的创新上。例如,基于该数据集的策略评估框架被用于开发高效的模仿学习模型,如行为克隆和逆强化学习,以从演示中提取鲁棒策略。同时,数据集支持了多模态融合方法的研究,结合视觉和状态信息提升机器人感知能力。此外,它还为基准测试平台(如LeRobot生态系统)提供了核心数据,促进了社区在机器人策略泛化、样本重用和安全学习等方向的协作探索。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作