five

eval_diffusion_cloth_folding_grasp

收藏
Hugging Face2026-05-08 更新2026-05-09 收录
下载链接:
https://huggingface.co/datasets/cf-group-4/eval_diffusion_cloth_folding_grasp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由LeRobot创建,采用apache-2.0许可证,属于机器人学领域。数据集结构包含多个特征,如动作(action)、观察状态(observation.state)、前端图像(observation.images.front)、时间戳(timestamp)等。动作和观察状态特征均为6维浮点数组,分别对应机器人关节位置。前端图像特征为480x640x3的视频数据。数据集以parquet格式存储,分块大小为1000,数据文件总大小为100MB,视频文件总大小为200MB,帧率为30fps。
创建时间:
2026-05-03
原始信息汇总

数据集概述

  • 数据集名称: eval_diffusion_cloth_folding_grasp
  • 来源平台: Hugging Face Datasets
  • 许可证: Apache-2.0
  • 任务类别: 机器人学 (robotics)
  • 标签: LeRobot
  • 机器人类型: so_follower

数据集结构

  • 数据格式: Parquet 文件,位于 data/*/*.parquet
  • 视频格式: MP4 文件,位于 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
  • 帧率: 30 FPS
  • 总片段数: 0
  • 总帧数: 0
  • 总任务数: 0
  • 数据文件大小: 约 100 MB
  • 视频文件大小: 约 200 MB
  • 块大小: 1000

特征字段

字段 类型 形状 说明
action float32 (6,) 机器人动作,包括肩部、肘部、腕部和夹爪的位置
observation.state float32 (6,) 机器人状态观测,与动作维度相同
observation.images.front 视频 (480, 640, 3) 前视相机图像,分辨率 480x640,RGB 三通道
timestamp float32 (1,) 时间戳
frame_index int64 (1,) 帧索引
episode_index int64 (1,) 片段索引
index int64 (1,) 通用索引
task_index int64 (1,) 任务索引

使用说明

该数据集使用 LeRobot 框架创建,可通过 Hugging Face Spaces 进行可视化,可视化链接为:https://huggingface.co/spaces/lerobot/visualize_dataset?path=cf-group-4/eval_diffusion_cloth_folding_grasp

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于LeRobot框架构建,旨在为机器人操作任务提供标准化的评估数据。数据采集自so_follower机器人平台,通过执行衣物折叠与抓取操作,生成多模态序列数据。数据集以parquet格式存储动作、状态及时间戳等结构化信息,同时将前置摄像头采集的640×480像素RGB视频流以mp4格式独立存放,确保高维视觉数据与低维控制信号的分离管理。数据按1000帧为一个chunk进行分块组织,并自动生成元信息文件描述特征维度与存储结构。
使用方法
用户可通过LeRobot库直接加载该数据集,利用内置的DataLoader按episode或frame索引访问多模态样本。典型的使用流程是将观测图像与关节状态作为输入,以动作序列为监督信号,训练机器人策略模型。数据集完全兼容Apache-2.0许可,支持商业与非商业用途。推荐结合HuggingFace Spaces提供的可视化工具预览视频与状态轨迹,便于快速检验数据质量。对于需要扩展的场景,可依据meta/info.json中的特征规范自定义数据切片与批处理逻辑。
背景与挑战
背景概述
在机器人操作领域,柔性物体(如布料)的自主折叠与抓取是一项极具挑战性的任务,因其高自由度、非线性动力学及视觉遮挡等问题长期制约着算法泛化能力。eval_diffusion_cloth_folding_grasp数据集由cf-group-4团队基于LeRobot框架构建,聚焦于扩散模型在机器人布料折叠抓取任务中的评估场景。该数据集包含通过so_follower型机器人采集的演示数据,涵盖肩部、肘部、腕部等6自由度关节动作及前端摄像头实时影像,为模仿学习与扩散策略在非刚体操作中的性能评估提供了标准化基准。尽管当前数据规模有限(总帧数为0),但其结构化设计——包括状态-动作对与高分辨率视觉观测——为后续扩展与跨任务迁移奠定了数据基础,对推动柔顺操作领域的算法迭代具有潜在影响力。
当前挑战
该数据集所解决的领域问题在于,布料折叠抓取任务中布料形态的高度随机性、自遮挡及动力学复杂性使得传统基于模型的控制方法难以应对,而缺乏针对扩散策略的专用评估基准。在构建过程中,挑战主要体现在三个方面:其一,数据采集需精准对齐So_follower机器人的6自由度动作空间与布料状态,但布料形变的连续性与不可预测性导致高质量演示数据获取成本高昂;其二,当前数据集规模极小(总帧数为0),无法支撑大规模模型训练,需平衡数据收集效率与覆盖度;其三,多模态数据(图像、关节状态、动作)的时序对齐与标注需保证一致性,尤其在频繁遮挡背景下,前端摄像头图像的有效性易受干扰,增加了数据清洗与预处理难度。
常用场景
经典使用场景
在机器人操作领域中,衣物折叠与抓取是一项极具挑战性的细粒度操作任务,涉及柔性物体的感知与操控。eval_diffusion_cloth_folding_grasp数据集专为评估基于扩散模型的机器人操作策略而设计,其经典使用场景是作为基准测试平台,用于衡量和比较不同扩散策略在真实物理环境或仿真环境中执行衣物折叠与抓取任务的性能。通过提供标准化的机器人状态、动作轨迹与多视角视觉观测,该数据集能够支持研究者对策略的泛化能力、操作精度与鲁棒性进行系统评估。
解决学术问题
该数据集聚焦于解决柔性物体操作领域中的稀疏奖励与高维状态空间难题。传统方法在衣物折叠这类具有无限自由度的任务中常面临建模困难,而eval_diffusion_cloth_folding_grasp通过提供精细化的动作与状态记录,为探索基于条件扩散模型的模仿学习与强化学习算法提供了数据基础。它的出现推动了将生成式模型应用于连续控制问题的研究范式演进,揭示了扩散过程在长时域、高维动作空间中生成平滑且可行轨迹的学术潜力。
实际应用
在实际应用层面,该数据集所支持的技术在智能家居与服务机器人领域具有巨大价值。衣物折叠与抓取是家庭自动化中最为繁琐的家务之一,成功掌握此技能可大幅提升家用机器人的实用性与用户接受度。此外,该数据集还可应用于服装行业的自动化生产线,助力柔性物料的高效处理,以及在物流仓储中实现对不规则包裹的柔性抓取与放置,从而显著降低人工成本并提高运营效率。
数据集最近研究
最新研究方向
在具身智能与机器人操作领域,针对非刚性物体的灵巧操控正成为研究前沿,其中布料折叠任务因其柔顺特性与高自由度而极具挑战性。eval_diffusion_cloth_folding_grasp数据集应运而生,它基于LeRobot框架构建,收录了用SO-Follower机器人执行布料折叠抓取操作的高频序列数据,涵盖了六自由度关节指令与640×480视觉流。这一资源紧密契合了扩散策略(Diffusion Policy)在模仿学习中的最新进展,为训练与评估端到端折叠策略提供了标准化的离线数据支撑。该数据集的公开不仅弥补了现有多模态操作数据集在精细布料任务上的不足,也推动了去中心化、低成本机器人实验生态的建设,其Apache 2.0许可进一步降低了复制与二次开发的壁垒,有望加速通用家务机器人的落地进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作