five

kai0

收藏
Hugging Face2026-01-17 更新2026-01-17 收录
下载链接:
https://huggingface.co/datasets/OpenDriveLab-org/kai0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用[LeRobot](https://github.com/huggingface/lerobot)创建,包含约130小时的真实世界场景数据。主要任务包括:1. **FlattenFold**:操作机械臂展开并折叠随机放置在桌子上的T恤;2. **HangCloth**:操作机械臂将衣架穿过衣物并挂在杆上;3. **TeeShirtSort**:对衣物进行分类和整理,判断是T恤还是衬衫,并进行相应的折叠或整理操作。数据集统计信息如下:FlattenFold任务有6,512个片段,HangCloth任务有7,640个片段,TeeShirtSort任务有5,988个片段,总计23,751个片段。
提供机构:
OpenDriveLab-org
创建时间:
2026-01-17
原始信息汇总

Kai0 数据集概述

数据集基本信息

  • 发布者: OpenDriveLab-org
  • 许可证: CC BY-NC-ND 4.0
  • 任务类别: 机器人学
  • 相关标签: LeRobot
  • 数据格式: Parquet 文件
  • 数据总量: 约130小时的真实世界场景数据

主要任务

数据集包含三个主要的衣物操作任务:

1. FlattenFold(展平折叠)

  • 任务类型: 单任务
  • 初始状态: T恤被随机扔在桌子上,呈现随机的褶皱状态。
  • 操作任务: 操作机械臂展开衣物,然后将其折叠。

2. HangCloth(悬挂衣物)

  • 任务类型: 单任务
  • 初始状态: 衣架随机放置,衣物随机放置在桌子上。
  • 操作任务: 操作机械臂将衣架穿过衣物,然后将其挂在杆子上。

3. TeeShirtSort(T恤分类)

  • 任务类型: 衣物分类与整理任务
  • 初始状态: 从洗衣篮中随机挑选一件衣物。
  • 分类: 判断该衣物是T恤还是衬衫。
  • 操作任务:
    • 如果是T恤,则折叠衣物。
    • 如果是衬衫,则露出衣领,然后将其推到桌子的一侧。

数据集统计

任务 Base (episodes) DAgger (episodes) 总计
FlattenFold 3,055 3,457 6,512
HangCloth 6,954 686 7,640
TeeShirtSort 5,988 - 5,988
总计 15,997 4,143 20,140

数据结构

文件夹层次结构

数据按任务目录组织,每个任务下分为两个子集:basedagger

  • base: 包含机器人手臂执行衣物整理任务的原始演示轨迹。
  • dagger: 包含通过迭代DAgger收集的在线策略恢复轨迹,旨在补充静态演示中缺失的故障恢复模式。

Kai0-data/ ├── FlattenFold/ │ ├── base/ │ └── dagger/ ├── HangCloth/ │ ├── base/ │ └── dagger/ ├── TeeShirtSort/ │ ├── base/ │ └── dagger/ └── README.md

数据文件详情

Parquet 文件格式

字段名 形状 含义
observation.state [N, 14] 左侧 [:, :6], 右侧 [:, 7:13], 关节角度<br> 左侧[:, 6], 右侧 [:, 13], 夹持器张开范围
action [N, 14] 左侧 [:, :6], 右侧 [:, 7:13], 关节角度<br> 左侧[:, 6], 右侧 [:, 13], 夹持器张开范围
timestamp [N, 1] 自片段开始以来经过的时间(秒)
frame_index [N, 1] 当前片段内此帧的索引(从0开始)
episode_index [N, 1] 此帧所属片段的索引
index [N, 1] 数据集中所有帧的全局唯一索引
task_index [N, 1] 标识正在执行的任务类型的索引

元数据文件

  • info.json: 包含数据集的基本结构信息,如代码库版本、机器人类型、总片段数、总帧数、总任务数、总视频数、总块数、块大小、帧率、分割信息、数据路径、视频路径以及特征定义。
  • tasks.jsonl: 包含任务语言提示(自然语言指令),指定要执行的操作任务。每个条目将 task_index 映射到其相应的任务描述,可用于语言条件策略训练。
  • episodes.jsonl: 片段信息。
  • episodes_stats.jsonl: 片段统计信息。

数据特征

  • 观察图像:
    • observation.images.top_head: 顶部摄像头图像,形状 [480, 640, 3],帧率 30 fps。
    • observation.images.hand_left: 左侧手部摄像头图像。
    • observation.images.hand_right: 右侧手部摄像头图像。
  • 观察状态: observation.state,形状 [14],数据类型 float32。
  • 动作: action,形状 [14],数据类型 float32。
  • 时间信息: timestamp (float32), frame_index (int64), episode_index (int64), index (int64), task_index (int64)。

下载与加载

下载方式

  • Python脚本: 使用 huggingface_hub 库的 hf_hub_downloadsnapshot_download 函数。
  • 终端CLI: 使用 hf download 命令。

加载方式

根据使用的 LeRobot 版本选择不同的加载方法:

  • LeRobot 版本 < 0.4.0: 使用 LeRobotDataset 类加载。
  • LeRobot 版本 >= 0.4.0: 需要先将数据集从 v2.1 迁移到 v3.0,然后加载。

许可证与引用

  • 许可证: CC BY-NC-ND 4.0。
  • 引用: 提供了 BibTeX 引用格式,但具体信息待填充。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作