five

record-push-button-merged-01-05

收藏
Hugging Face2025-10-25 更新2025-10-26 收录
下载链接:
https://huggingface.co/datasets/jskim/record-push-button-merged-01-05
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用LeRobot创建,包含25个剧集,共8920帧,专注于一个任务。数据集以Parquet文件格式存储,并包含相关视频文件。每个文件包含机器人的动作、状态、顶部和手腕的图像信息等特征。数据集划分为训练集。数据集遵循Apache-2.0许可。
创建时间:
2025-10-25
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人技术
  • 标签: LeRobot
  • 代码库版本: v3.0

数据规模

  • 总任务数: 1
  • 总回合数: 25
  • 总帧数: 8920
  • 数据文件大小: 100 MB
  • 视频文件大小: 500 MB
  • 帧率: 30 FPS

数据结构

数据特征

  • 动作: 6维浮点数组,包含肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转、夹爪位置
  • 观测状态: 6维浮点数组,关节位置信息与动作特征一致
  • 顶部图像观测: 480×640×3视频数据,AV1编码,无音频
  • 腕部图像观测: 480×640×3视频数据,AV1编码,无音频
  • 时间戳: 单精度浮点型
  • 帧索引: 64位整型
  • 回合索引: 64位整型
  • 任务索引: 64位整型

数据组织

  • 数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 分块大小: 1000
  • 训练集划分: 0-25回合

机器人配置

  • 机器人类型: so101_follower
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作领域,该数据集通过LeRobot平台精心构建,采用SO101型跟随机器人执行单一任务,共采集25个完整交互片段。数据以分块存储方式组织,每1000帧形成一个数据块,总计8920帧观测记录,涵盖机械臂关节位置与视觉信息,并以30fps的同步频率保存多模态传感器数据。
特点
本数据集显著特点在于其多模态融合架构,同时包含六自由度机械臂的动作指令与双视角视觉观测——顶部与腕部摄像头均以480x640分辨率记录RGB视频流。数据维度设计严谨,动作空间与状态观测均采用六维浮点向量描述关节角度,辅以时间戳与索引体系,为模仿学习研究提供精确的时间对齐与轨迹追溯能力。
使用方法
研究者可通过解析标准Parquet格式文件访问数据集,利用帧索引与片段索引实现高效数据检索。训练时可直接调用预定义分割方案,全部25个片段均用于模型训练。视觉数据采用AV1编码压缩,需配合视频解码器提取像素信息,而关节状态数据可直接用于动力学模型构建,为机器人行为克隆算法提供端到端的学习范本。
背景与挑战
背景概述
机器人操作数据集作为强化学习与模仿学习研究的基础资源,其构建旨在推动智能体在物理环境中的自主决策能力发展。record-push-button-merged-01-05数据集由HuggingFace的LeRobot项目团队于2024年创建,聚焦于机械臂按钮按压任务的轨迹记录。该数据集通过整合六自由度关节状态、双视角视觉观测与时间序列标注,为机器人技能泛化研究提供了结构化交互数据,显著促进了从演示数据到实际策略的迁移学习研究进程。
当前挑战
在机器人操作领域,精准建模连续动作空间与多模态感知的关联性仍是核心难题。该数据集构建过程中面临传感器同步精度控制、异构数据流对齐等技术挑战,同时需保证演示轨迹在动态环境下的动作一致性。此外,从有限任务实例中提取可泛化表征时,还需克服视觉观测视角差异与机械臂运动学约束之间的耦合关系。
常用场景
经典使用场景
在机器人操作学习领域,该数据集通过记录机械臂执行按钮按压任务时的多模态数据,为模仿学习算法提供了典型范例。其包含的关节位置状态与双视角视觉信息,能够有效支撑端到端策略网络的训练过程,使机器人能够从演示中学习精细操作技能。
实际应用
在工业自动化场景中,该数据集支撑的算法可应用于电子设备装配线的按钮检测工序。基于视觉伺服控制的机械臂能通过学习数据集中蕴含的操作模式,实现精密电子元件的自动化按压操作,显著提升生产线的柔性与作业精度。
衍生相关工作
受该数据集启发,学界涌现出多项基于时空注意力机制的模仿学习研究。其中分层强化学习框架通过解构数据中的动作序列,实现了多阶段任务的策略学习;而跨模态表征对齐方法则利用双视角视觉数据,构建了更具泛化能力的动作生成模型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作