fold_towel_202601

Hugging Face2026-01-28 更新2026-01-29 收录

下载链接：

https://huggingface.co/datasets/AriRyo/fold_towel_202601

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，适用于机器人技术领域，采用Apache-2.0许可证。数据集包含67个总剧集，112115帧，1个总任务，数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括训练分割（0:67），数据以parquet文件格式存储，视频以mp4格式存储。数据集特征包括动作（6个浮点型关节位置）、观察状态（6个浮点型关节位置）、来自上方和侧面的观察图像（480x640x3的视频帧）、时间戳、帧索引、剧集索引、索引和任务索引。适用于机器人控制、行为学习等任务。

创建时间：

2026-01-23

原始信息汇总

数据集概述

基本信息

数据集名称: fold_towel_202601
创建工具: LeRobot (https://github.com/huggingface/lerobot)
任务类别: 机器人学
标签: LeRobot
许可证: Apache-2.0
主页: [More Information Needed]
论文: [More Information Needed]

数据规模与结构

总任务数: 1
总情节数: 67
总帧数: 112,115
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据分割: 训练集 (0:67)

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
配置文件: https://huggingface.co/datasets/AriRyo/fold_towel_202601/blob/main/meta/info.json

数据特征

动作

数据类型: float32
形状: [6]
特征名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测状态

数据类型: float32
形状: [6]
特征名称:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测图像（上方视角）

数据类型: video
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

观测图像（侧面视角）

数据类型: video
形状: [480, 640, 3]
维度名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

元数据

时间戳: float32, 形状 [1]
帧索引: int64, 形状 [1]
情节索引: int64, 形状 [1]
索引: int64, 形状 [1]
任务索引: int64, 形状 [1]

技术详情

代码库版本: v3.0
机器人类型: so_follower

引用信息

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人操作学习领域，数据集的构建往往依赖于真实物理环境中的交互记录。fold_towel_202601数据集通过LeRobot平台，利用so_follower型机器人执行折叠毛巾这一单一任务，系统采集了67条完整操作轨迹。数据以30帧每秒的速率同步记录机器人的关节状态、执行动作以及来自上方和侧方两个视角的高清视频流，最终被结构化为112115帧时序数据，并以分块Parquet格式高效存储，确保了原始交互信号的真实性与完整性。

特点

该数据集的核心特征在于其多模态、高维度的时序数据结构。它不仅提供了机器人六维关节位置的动作与状态向量，还包含了双视角的彩色视频观测，每帧图像分辨率达640x480，编码为AV1格式以平衡质量与存储效率。数据严格按时间戳、帧索引和回合索引进行对齐，形成了动作-观测对的连续序列。这种设计使得数据集能够精确反映动态操作过程中机器人的控制指令与视觉环境变化之间的对应关系，为模仿学习与强化学习算法提供了丰富的训练信号。

使用方法

研究人员可通过加载指定的Parquet数据文件来访问该数据集。典型的使用流程涉及按回合索引提取完整的操作轨迹，其中每一时间步都包含动作向量、关节状态以及对应的双视角图像帧。该数据集适用于训练端到端的机器人策略模型，例如从视觉观测映射到关节动作的神经网络。由于数据已预先划分为训练集，开发者可直接将其用于行为克隆或离线强化学习等算法的训练与验证，通过帧索引和时间戳能够轻松实现数据的时序重组与批量加载。

背景与挑战

背景概述

在机器人学习领域，模仿学习与强化学习正逐步推动机器人执行复杂操作任务的能力。fold_towel_202601数据集由HuggingFace的LeRobot项目于2026年创建，专注于机器人折叠毛巾这一具体任务。该数据集收录了67个完整操作序列，包含超过11万帧的多视角视觉数据与机器人关节状态信息，旨在为机器人操作策略的学习提供高质量的真实世界演示数据。其构建依托开源机器人平台，反映了当前研究对数据驱动方法在家庭服务机器人场景中应用的重视，为算法开发与基准测试提供了重要资源。

当前挑战

该数据集致力于解决机器人操作中柔性物体操控的经典难题，折叠毛巾任务涉及对非刚性物体的感知、抓取与形变控制，其高维状态空间与复杂动力学特性对策略泛化构成显著挑战。在构建过程中，数据采集需协调多视角相机与机器人关节传感器的同步，确保时序一致性；同时，真实环境下的光照变化、毛巾材质多样性以及操作过程中的遮挡问题，均增加了高质量演示数据获取的难度，要求精密的实验设计与数据处理流程。

常用场景

经典使用场景

在机器人学习领域，fold_towel_202601数据集为模仿学习与强化学习算法提供了宝贵的训练资源。该数据集聚焦于折叠毛巾这一精细操作任务，通过记录机械臂的关节位置、夹爪状态以及多视角视觉观测，构建了从感知到动作的完整交互序列。研究人员能够利用这些数据训练模型理解复杂物体形变与抓取策略，从而推动机器人执行家庭服务类任务的自主能力发展。

衍生相关工作

围绕fold_towel_202601数据集，已衍生出多项经典研究工作。例如，结合深度强化学习框架探索稀疏奖励下的高效策略搜索，或利用生成模型进行视觉动作预测以改善样本效率。部分研究进一步扩展了多任务学习范式，将折叠毛巾技能迁移至其他布料操作任务中。这些工作不仅深化了对机器人操作机理的认识，也为LeRobot等开源平台提供了算法验证与比较的基准。

数据集最近研究