five

dk1-merge-2026-03

收藏
Hugging Face2026-03-27 更新2026-03-28 收录
下载链接:
https://huggingface.co/datasets/andreaskoepf/dk1-merge-2026-03
下载链接
链接失效反馈
官方服务:
资源简介:
DK-1合并数据集是一个经过合并与去重的双臂机器人数据集,使用LeRobot工具创建。数据集包含重新编码为640x360分辨率h264格式的源视频,并保留了原始数据集的每段帧率。动作数据采用14维关节空间表示(每臂6关节+1夹爪)。关键统计信息包括:2,424个任务片段,2,728,943帧数据,覆盖18种不同任务,帧率分为30/50fps(每段帧率存储于episodes.jsonl)。视频数据来自三个摄像头视角(头部、左腕、右腕)。数据集由26个公开机器人数据集合并而成,涵盖多种操作任务如衣物折叠、物体转移、插入操作等。
创建时间:
2026-03-27
原始信息汇总

DK-1 Merged Dataset 概述

数据集基本信息

  • 许可证: Apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 配置名称: default
  • 数据文件格式: data//.parquet

数据集描述

这是一个经过合并与去重的DK-1双臂机器人数据集。所有源视频均被重新编码为640x360分辨率、h264编码格式,并包含14维关节空间动作。每个episode的帧率(FPS)均从源数据集中保留。

  • 生成日期: 2026-03-27
  • 总episodes数: 1,823
  • 总帧数: 2,230,018
  • 总任务数: 17
  • 视频分辨率: 640x360
  • 视频编码: h264
  • 帧率: 30, 50(每个episode独立,存储于episodes.jsonl中)
  • 相机视角: head, left_wrist, right_wrist
  • 动作维度: 14(每只手臂6个关节 + 1个夹爪)

源数据集

该数据集由以下23个源数据集合并而成:

  1. FabianKerj/dualarm-pretrain-127ep
  2. Gongsta/e7-tshirt-folding
  3. Gongsta/e7_dagger
  4. Gongsta/krish-simpler-tshirt
  5. Gongsta/trlc_tshirt_folding
  6. Gongsta/trlc_tshirt_folding_impedance
  7. Zasha01/cube_transfer_final
  8. Zasha01/lego_cube
  9. Zasha01/lego_cube_final
  10. Zasha01/packaging
  11. Zasha01/test_tube_insertion6
  12. Zasha01/test_tube_insertion7
  13. Zasha01/towel_folding
  14. Zasha01/video4
  15. andreaskoepf/dk1_domino_sorting_001
  16. andreaskoepf/dk1_flip_coaster
  17. andreaskoepf/dk1_golfball_into_cup
  18. dopaul/pcb_placement_100x_1st_item
  19. dopaul/pcb_placement_v1
  20. qualiaadmin/eventgrab11
  21. qualiaadmin/pinkthing_reward1_10
  22. qualiaadmin/pinkthing_reward1_20
  23. qualiaadmin/plasticcuprepeat1

相关链接

  • 数据集创建工具: https://github.com/huggingface/lerobot
  • 数据集可视化空间: https://huggingface.co/spaces/lerobot/visualize_dataset?path=andreaskoepf/dk1-merge-2026-03
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,大规模、高质量的数据集是推动算法进步的关键基石。DK-1 Merged Dataset的构建体现了数据整合与标准化的先进理念,它并非从头采集,而是通过LeRobot平台对22个现有开源双手机器人数据集进行系统性合并与去重。构建过程首先统一了视频格式,将所有源视频重新编码为640x360分辨率、采用h264编解码器,并保留了原始数据集的每段视频帧率。同时,动作空间被规范化为14维,包含双臂各自的6个关节和1个夹爪状态,确保了数据在模态与维度上的一致性,为模型训练提供了结构清晰的输入。
使用方法
对于研究人员而言,该数据集可直接通过Hugging Face平台获取,数据以Parquet格式存储,便于高效加载与处理。典型的使用流程包括利用LeRobot提供的工具链进行数据可视化与预处理,随后可将多视角视频流与14维动作序列配对,用于训练模仿学习或强化学习模型。用户可根据episodes.jsonl中记录的帧率等信息,精确还原任务的时间动态。该数据集适用于评估模型在多种家庭与实验室环境下的泛化能力,是开发下一代灵巧双臂机器人控制算法的重要资源。
背景与挑战
背景概述
机器人学习领域长期致力于通过大规模真实世界交互数据提升智能体的泛化能力与操作技能。DK-1合并数据集于2026年3月由LeRobot社区整合发布,其核心研究问题聚焦于双手机器人复杂操作任务的模仿学习与策略泛化。该数据集汇聚了来自多个独立数据源的1823个交互轨迹,涵盖折叠衣物、组装积木、放置物体等17类精细操作任务,旨在为机器人操作策略的端到端训练提供高质量、多视角的视觉-动作配对数据。通过统一编码格式与去重处理,该数据集显著增强了机器人学习社区对多样化操作场景的建模能力,推动了真实环境机器人技能迁移研究的发展。
当前挑战
在机器人操作任务领域,双手机器人需应对高维动作空间协调、复杂物体交互动力学建模以及多任务泛化等核心挑战。DK-1数据集构建过程中面临异构数据源整合难题,包括不同采集设备、帧率、分辨率与动作表示的统一化处理。同时,数据去重与质量筛选需在保留操作多样性的前提下消除冗余轨迹,确保动作序列的连贯性与任务完整性。此外,多相机视角(头部、左右手腕)的时空对齐与标定一致性也是构建高质量多模态数据集的关键技术瓶颈,直接影响后续策略学习的稳定性和泛化性能。
常用场景
经典使用场景
在机器人学习领域,DK-1 Merged Dataset 作为双手机器人操作任务的重要基准数据集,其经典使用场景聚焦于模仿学习与强化学习算法的训练与评估。该数据集整合了多视角视频流与高维关节空间动作序列,为研究者提供了丰富的示教轨迹,用以训练端到端的视觉运动策略模型。通过涵盖折叠衣物、组装积木、放置物体等多样化任务,它能够有效验证算法在复杂操作场景下的泛化能力与鲁棒性。
解决学术问题
该数据集主要解决了机器人操作中样本效率低下与任务泛化不足的学术难题。通过合并并去重多个来源的双臂操作数据,它提供了大规模、多任务的高质量示范,显著降低了数据收集成本。这使得研究人员能够深入探索跨任务知识迁移、稀疏奖励下的策略学习以及高维动作空间下的稳定控制等核心问题,推动了数据驱动机器人学习方法的理论进展。
实际应用
在实际应用层面,DK-1 Merged Dataset 直接服务于柔性制造与家庭服务机器人的开发。其包含的精细操作任务,如电路板放置、试管插入和毛巾折叠,模拟了工业装配与日常家务的真实需求。基于此数据集训练的模型,能够赋能机器人执行灵巧的双手协调作业,提升在非结构化环境中完成物品整理、精密组装等任务的自主性与可靠性,加速了机器人从实验室走向实际部署的进程。
数据集最近研究
最新研究方向
在机器人操作领域,大规模、高质量的双臂机器人数据集正成为推动模仿学习与强化学习融合发展的关键资源。DK-1合并数据集整合了多个来源的双臂操作任务,涵盖衣物折叠、物体组装、精细插入等多样化场景,其多视角视觉观测与14维关节空间动作为研究提供了丰富的数据基础。当前前沿研究聚焦于利用此类大规模数据集训练通用机器人策略模型,探索跨任务的知识迁移与泛化能力,特别是在少样本或零样本场景下的适应性。该数据集的出现呼应了机器人社区对标准化、可复现基准的迫切需求,为开发能够在非结构化环境中执行复杂灵巧操作的智能体奠定了数据基石,有望加速家庭服务、工业自动化等领域的实用化进程。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作