t-shirt-folding
收藏Hugging Face2026-05-19 更新2026-05-19 收录
下载链接:
https://huggingface.co/datasets/nodogoro/t-shirt-folding
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,专注于机器人技术领域,具体用于T恤折叠任务。数据集包含2个episodes,总计1439帧,使用starpilot_yam_gripper机器人类型。数据以parquet格式存储,并附带视频文件,总数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集的特征包括动作(14维浮点数,表示两个机械臂的位置、旋转和夹爪宽度)、观察状态(32维浮点数,包括编码器角度、IMU数据、位姿和夹爪状态)以及多个摄像头图像(左腕、右腕和基座摄像头的RGB和深度图像,分辨率分别为480x640和768x1024)。此外,还包含时间戳、帧索引、episode索引等元数据。数据集适用于机器人学习和控制任务的研究。
This dataset was developed by LeRobot, targeting the robotics domain and specifically designed for the T-shirt folding task. It contains 2 episodes, totaling 1439 frames, and utilizes the starpilot_yam_gripper robot platform. The data is stored in Parquet format, with accompanying video files. The total size of the data files is 100 MB, while the video files occupy 200 MB, with a frame rate of 30 fps. The dataset includes the following features: actions (14-dimensional floating-point values, representing the positions, rotations and gripper widths of the two robotic arms), observation states (32-dimensional floating-point values, including encoder angles, IMU data, poses and gripper states), as well as RGB and depth images from multiple cameras: left wrist, right wrist and base-mounted cameras, with resolutions of 480x640 and 768x1024 respectively. Additionally, it contains metadata such as timestamps, frame indices and episode indices. This dataset is suitable for research on robotic learning and control tasks.
提供机构:
nodogoro
创建时间:
2026-05-19
原始信息汇总
数据集概述:t-shirt-folding
该数据集是一个用于机器人叠T恤任务的机器人学数据集,基于LeRobot框架创建。
基本信息
- 许可证:Apache-2.0
- 任务类别:机器人学(robotics)
- 机器人类型:starpilot_yam_gripper
- 总片段数:2
- 总帧数:1439
- 总任务数:1
- 帧率:30 FPS
- 数据文件大小:100 MB
- 视频文件大小:200 MB
数据集划分
- 训练集:0:2(所有2个片段均用于训练)
数据结构
数据集包含以下特征,每个特征的数据类型和形状如下:
动作(Action)
- 数据类型:float32
- 形状:[14]
- 维度名称:包括arm1_x、arm1_y、arm1_z、arm1_rx、arm1_ry、arm1_rz、arm1_grip_width、arm2_x、arm2_y、arm2_z、arm2_rx、arm2_ry、arm2_rz、arm2_grip_width(共14个维度)
观测状态(Observation.State)
- 数据类型:float32
- 形状:[32]
- 维度名称:包含双机械臂的编码器角度、IMU数据、位姿、夹爪状态等(共32个维度)
观测图像(Observation.Images)
包含6个摄像头视角的RGB图像和深度图像,均为视频数据:
- left_wrist_0_camera_rgb_image:左腕部RGB相机,分辨率480×640,3通道
- left_wrist_0_camera_rgb_image_depth:左腕部深度相机,分辨率480×640,3通道
- right_wrist_0_camera_rgb_image:右腕部RGB相机,分辨率480×640,3通道
- right_wrist_0_camera_rgb_image_depth:右腕部深度相机,分辨率480×640,3通道
- base_0_camera_rgb_image:基座0号RGB相机,分辨率480×640,3通道
- base_1_camera_rgb_image:基座1号RGB相机,分辨率768×1024,3通道
所有视频均采用H.264编码,帧率30 FPS,无音频。
其他特征
- timestamp:时间戳(float32,形状[1])
- frame_index:帧索引(int64,形状[1])
- episode_index:片段索引(int64,形状[1])
- index:索引(int64,形状[1])
- task_index:任务索引(int64,形状[1])
数据存储
- 数据路径:
data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet - 视频路径:
videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4



