so101_clothfold_v1

Hugging Face2026-02-03 更新2026-02-05 收录

下载链接：

https://huggingface.co/datasets/kochamii312/so101_clothfold_v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个与机器人技术相关的数据集，使用LeRobot创建。数据集包含训练数据，共有44,817个样本，总大小为6,772,794字节。数据集的特征包括动作（action）、观察状态（observation.state）、时间戳（timestamp）、帧索引（frame_index）、片段索引（episode_index）、索引（index）、任务索引（task_index）和语言指令（language_instruction）。动作和观察状态都是长度为6的浮点数列表，分别代表机器人关节的位置。数据集还包括视频数据，视频分辨率为480x640，帧率为30fps，编码格式为av1。数据集的元数据信息包括代码库版本（v3.0）、机器人类型（so_follower）、总片段数（50）、总帧数（44,817）、总任务数（1）、块大小（1000）、数据和视频文件大小（分别为100MB和200MB）等。数据集适用于机器人控制和行为分析等任务。

创建时间：

2026-02-01

搜集汇总

数据集介绍

构建方式

在机器人操作领域，高质量的数据集对于推动模仿学习与强化学习算法的发展至关重要。so101_clothfold_v1数据集依托LeRobot平台构建，通过搭载so_follower型机器人执行布料折叠任务，系统采集了50个完整操作片段。数据以30帧每秒的速率同步记录机器人的六维关节状态与动作指令，同时辅以前置摄像头捕捉的视觉信息，并以分块存储的Parquet格式高效组织，确保了时序对齐与多模态数据的完整性。

特点

该数据集的核心特征在于其精心设计的结构化表示与多模态融合。每条数据样本均包含六自由度机械臂的关节位置状态与对应动作向量，形成了精确的状态-动作配对。尤为突出的是，数据集整合了高分辨率的视觉观测流，以480x640像素的彩色视频序列呈现操作场景，为基于视觉的策略学习提供了丰富信息。所有数据均附带时间戳、帧索引与任务索引，支持按片段或时序进行灵活检索与分析。

使用方法

研究者可借助Hugging Face数据集库直接加载so101_clothfold_v1，通过指定训练分割获取全部44817帧数据。典型应用涉及机器人模仿学习，其中观察状态与动作标签可直接用于行为克隆模型的训练。对于端到端视觉运动策略学习，可联合利用观测图像与关节状态作为输入，预测连续动作输出。数据集的结构化字段便于进行轨迹切片、任务条件化采样，或与其他机器人数据集进行对比与迁移研究。

背景与挑战

背景概述

在机器人操作学习领域，模仿学习与强化学习的研究长期受限于高质量、大规模真实世界数据集的稀缺。so101_clothfold_v1数据集应运而生，由HuggingFace的LeRobot项目团队创建，旨在为机器人布料折叠任务提供详实的示范数据。该数据集聚焦于解决机器人灵巧操作中的复杂任务泛化问题，通过记录机械臂执行折叠动作时的多模态观测与精确控制指令，为算法开发提供了宝贵的现实物理交互轨迹。其构建依托开源机器人平台，体现了社区驱动的研究范式，对推动家庭服务机器人自主处理柔性物体操作具有显著的促进作用。

当前挑战

该数据集致力于应对机器人布料折叠这一典型柔性物体操作任务的挑战，其核心在于处理布料的高度形变、非线性动力学以及动作的长期依赖性，要求模型从视觉与状态观测中推断出有效的控制策略。在构建过程中，面临数据采集的稳定性与一致性难题，需确保机械臂在重复演示中轨迹的精确对齐，同时处理多传感器数据的同步与校准。此外，真实世界环境中光照变化、布料材质差异以及动作的细微偏差，均为数据标注与清洗带来了复杂性，要求构建流程具备高度的鲁棒性与可扩展性。

常用场景

经典使用场景

在机器人操作学习领域，so101_clothfold_v1数据集为研究柔性物体操控提供了关键数据支持。该数据集记录了机器人执行布料折叠任务时的关节状态、动作指令及视觉观测，经典使用场景集中于训练端到端的模仿学习或强化学习模型，使机器人能够从人类演示中学习复杂的布料处理技能，实现从原始传感器输入到关节动作的映射。

解决学术问题

该数据集有效解决了机器人学中柔性物体操作这一长期存在的学术难题。通过提供高维度的状态-动作对序列，它支持研究者探索非刚性物体动力学建模、基于视觉的闭环控制策略以及多模态感知融合方法。其意义在于降低了真实世界机器人实验的成本与风险，为算法验证提供了标准化基准，推动了具身智能在非结构化环境中的适应性研究。

衍生相关工作

围绕该数据集，已衍生出一系列经典研究工作。主要包括基于深度模仿学习的布料形态预测模型、结合强化学习的自适应折叠策略优化，以及利用生成模型进行动作规划的数据增强方法。这些工作不仅扩展了数据集的利用维度，还催生了新的算法框架，如分层强化学习在柔性操作中的应用，推动了机器人学习范式的演进与创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集