eval_record-pick-and-place-so101_pt-ft-3ep

Hugging Face2025-11-24 更新2025-11-25 收录

下载链接：

https://huggingface.co/datasets/hbseong/eval_record-pick-and-place-so101_pt-ft-3ep

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个与机器人学相关的数据集，包含61个剧集和65706个帧，总共1个任务。数据集的结构详细描述了机器人动作和观察状态的特征，包括来自顶部和右侧摄像头的图像。数据集以Apache-2.0许可证发布，但具体的使用目的和来源未详细说明。

This is a robotics-oriented dataset that includes 61 episodes and 65706 frames, corresponding to a total of 1 single task. The dataset structure thoroughly describes the characteristics of robot motions and observation states, encompassing images captured by the top and right-side cameras. This dataset is released under the Apache-2.0 license; however, its specific usage scenarios and original source have not been elaborated in detail.

创建时间：

2025-11-21

原始信息汇总

数据集概述

基本信息

数据集名称: eval_record-pick-and-place-so101_pt-ft-3ep
任务类别: 机器人技术
标签: LeRobot
许可证: Apache-2.0

数据集结构

总任务数: 1
总情节数: 61
总帧数: 65706
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
数据格式: Parquet
代码库版本: v3.0
机器人类型: so101_follower
块大小: 1000

数据特征

动作特征

数据类型: float32
维度: 6
关节名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测:
- 数据类型: float32
- 维度: 6
- 关节名称与动作特征相同
图像观测:
- 顶部摄像头:
  - 分辨率: 480×640×3
  - 视频编码: AV1
  - 像素格式: yuv420p
  - 非深度图
- 右侧摄像头:
  - 分辨率: 480×640×3
  - 视频编码: AV1
  - 像素格式: yuv420p
  - 非深度图

索引特征

时间戳: float32[1]
帧索引: int64[1]
情节索引: int64[1]
数据索引: int64[1]
任务索引: int64[1]

数据分割

训练集: 全部61个情节

文件路径

数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

搜集汇总

数据集介绍

构建方式

在机器人操作领域，eval_record-pick-and-place-so101_pt-ft-3ep数据集通过LeRobot平台系统性地采集了真实环境下的抓取与放置任务数据。该数据集包含61个完整任务片段，总计65706帧数据，以30帧每秒的速率记录机器人关节状态和多视角视觉信息。数据以分块形式存储于Parquet文件中，每个块包含1000帧，确保了高效的数据管理与访问效率。

特点

该数据集显著特点在于其多维度的观测与动作表示，涵盖了六自由度机械臂的关节位置控制指令及对应的状态反馈。视觉数据包含顶部与右侧双视角RGB图像，分辨率达640x480，采用AV1编码压缩以平衡质量与存储需求。数据结构严格对齐时间序列，通过时间戳、帧索引和任务索引实现精准的时空关联，为模仿学习与策略评估提供可靠基础。

使用方法

研究者可借助该数据集进行机器人策略的离线评估与行为分析，通过加载Parquet文件直接访问动作-观测对序列。视频数据可通过指定路径动态解码，支持帧级精确检索。数据集默认划分为训练集，适用于行为克隆、逆强化学习等任务，其标准化接口确保与主流机器人学习框架的无缝集成。

背景与挑战

背景概述

机器人操作任务数据集在自主系统研究中具有重要地位，eval_record-pick-and-place-so101_pt-ft-3ep数据集由LeRobot研究团队基于Apache 2.0协议构建，聚焦于机械臂抓取放置任务的实时控制策略验证。该数据集通过so101型机器人平台采集了61个完整操作序列，包含6.5万帧多模态数据，集成了关节空间控制指令与双视角视觉观测信息，为模仿学习与强化学习算法提供了高维状态动作映射关系的实证研究基础。其结构化特征设计体现了现代机器人学习数据标准化的发展趋势，通过参数化动作空间与同步视觉感知的协同记录，推动机器人技能迁移研究的可复现性发展。

当前挑战

该数据集针对机器人操作任务中动态环境下的抓取精度与轨迹优化问题，需解决高维连续动作空间中的策略泛化挑战。构建过程中面临多传感器时序对齐的技术难点，包括机械臂关节编码器与双视角视觉系统在30Hz采样频率下的数据同步问题。原始视频数据压缩存储需平衡AV1编解码效率与视觉特征保真度，而6自由度机械臂的动作轨迹标注需确保关节角度约束与任务目标的物理一致性。海量操作数据的质量验证过程存在动作边界检测与异常轨迹识别的复杂性，这对机器人技能学习的样本效率提出更高要求。

常用场景

经典使用场景

在机器人操作领域，eval_record-pick-and-place-so101_pt-ft-3ep数据集典型应用于机械臂抓取与放置任务的策略评估。该数据集通过记录六自由度机械臂的关节位置、夹爪状态及多视角视觉信息，为模仿学习与强化学习算法提供标准化测试环境。研究者可基于此数据集验证动作预测模型的精度，分析机械臂在复杂场景下的轨迹规划能力，推动机器人操作技能的泛化性能研究。

解决学术问题

该数据集有效解决了机器人操作中动作-感知协同建模的学术难题。通过提供同步记录的关节运动数据与双视角视觉流，支持研究者构建端到端的动作生成模型，突破传统方法在动态环境适应性方面的局限。其标准化格式显著降低了多模态数据对齐的复杂度，为验证新型模仿学习架构、探索视觉-动作映射机制提供了关键实验基础。

衍生相关工作

该数据集催生了多项机器人学习领域的创新研究。基于其多模态特性，研究者开发了融合视觉特征与运动链推理的层次化模仿学习框架。后续工作通过提取时空一致性特征，构建了跨场景动作泛化模型，显著提升了机械臂在未见物体抓取任务中的表现，为具身智能研究提供了重要范式参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集