five

calvin_calvin_debug_dataset

收藏
Hugging Face2025-06-29 更新2025-06-29 收录
下载链接:
https://huggingface.co/datasets/nhop/calvin_calvin_debug_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过LeRobot创建的,主要用于机器人技术领域。数据集包含多个特征,如观察图像(静态RGB和夹持器RGB)、状态(包括TCP位置、方向、夹持器开口宽度、关节位置等)、动作(TCP位置、方向、夹持器动作等)、时间戳、帧索引、集索引、索引和任务索引等。数据集的具体信息包括代码库版本为v2.1,机器人类型为franka_panda,总集数为9,总帧数为503,总任务数为9,总视频数为18,总块数为1,块大小为1000,帧率为10fps。数据路径和视频路径的详细信息也包含在内。

This dataset was created via LeRobot, and is primarily intended for the field of robotics. It includes multiple features, such as observation images (static RGB and gripper RGB), states (including TCP position, orientation, gripper opening width, joint positions, etc.), actions (TCP position, orientation, gripper movements, etc.), timestamps, frame indices, set indices, overall indices, and task indices. Specific details of the dataset are as follows: the codebase version is v2.1, the robot type is franka_panda, the total number of sets is 9, the total number of frames is 503, the total number of tasks is 9, the total number of videos is 18, the total number of chunks is 1, the chunk size is 1000, the frame rate is 10fps, and detailed information for data paths and video paths is also included.
提供机构:
nhop
创建时间:
2025-06-29
原始信息汇总

数据集概述

基本信息

  • 许可证: apache-2.0
  • 任务类别: 机器人学
  • 标签: LeRobot
  • 代码库版本: v2.1
  • 机器人类型: franka_panda

数据集结构

  • 总集数: 9
  • 总帧数: 503
  • 总任务数: 9
  • 总视频数: 18
  • 总块数: 1
  • 块大小: 1000
  • 帧率: 10 fps
  • 分割: 训练集 (0:9)

数据文件

  • 数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征描述

观察数据

  1. observation.image.rgb_static

    • 类型: 视频
    • 形状: [200, 200, 3]
    • 帧率: 10 fps
    • 视频编码: av1
    • 像素格式: yuv420p
    • 音频:
  2. observation.image.rgb_gripper

    • 类型: 视频
    • 形状: [84, 84, 3]
    • 帧率: 10 fps
    • 视频编码: av1
    • 像素格式: yuv420p
    • 音频:
  3. observation.state

    • 类型: float64
    • 形状: [15]
    • 字段:
      • tcp_position_x
      • tcp_position_y
      • tcp_position_z
      • tcp_orientation_x
      • tcp_orientation_y
      • tcp_orientation_z
      • gripper_opening_width
      • arm_joint_positions_0 到 arm_joint_positions_6
      • gripper_action

动作数据

  • action
    • 类型: float64
    • 形状: [7]
    • 字段:
      • tcp_position_x
      • tcp_position_y
      • tcp_position_z
      • tcp_orientation_x
      • tcp_orientation_y
      • tcp_orientation_z
      • gripper_action

其他数据

  • timestamp: float32, 形状 [1]
  • frame_index: int64, 形状 [1]
  • episode_index: int64, 形状 [1]
  • index: int64, 形状 [1]
  • task_index: int64, 形状 [1]

引用

  • BibTeX: [More Information Needed]
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习领域,数据集的构建方式直接影响模型对物理交互的理解能力。CALVIN_CALVIN_DEBUG_DATASET依托LeRobot框架,通过Franka Panda机器人平台采集多模态交互数据。该数据集以10帧每秒的速率记录机器人执行任务的过程,将每个交互片段封装为独立的Parquet文件,其中包含静态环境与夹爪视角的双路RGB视频流,以及机器人末端执行器的位姿、关节状态与夹爪动作等结构化状态信息。数据组织采用分块存储策略,确保大规模序列数据的高效读取与处理。
使用方法
使用该数据集时,研究者可通过LeRobot库提供的标准接口加载数据,实现机器人行为克隆或离线强化学习任务的快速实验。数据以分块Parquet格式存储,支持按片段索引高效读取观测-动作对序列。静态图像与夹爪视频分别对应环境观察与操作视角,可与状态向量共同作为模型输入;动作标签则直接对应机器人控制指令。数据集已预设训练集划分,用户可依据帧索引、时间戳及任务编号进行数据切片与批次构建,便于在仿真或实物机器人平台验证感知-控制一体化模型的性能。
背景与挑战
背景概述
在机器人学习领域,高质量、大规模的数据集是推动模仿学习与强化学习算法发展的关键基石。CALVIN_CALVIN_DEBUG_DATASET作为一款专注于机器人操作任务的数据集,由HuggingFace的LeRobot项目团队构建,旨在为机器人策略学习提供丰富的多模态交互数据。该数据集采集自Franka Panda机械臂平台,包含静态与夹爪视角的双路RGB视频、机器人状态向量及动作指令,并以10Hz频率同步记录,为研究端到端机器人控制提供了结构化、可复现的实验基础。尽管其具体创建时间与核心论文信息暂未公开,但数据集的设计体现了当前机器人学习社区对标准化、易用性数据资源的迫切需求,有望促进跨模型比较与算法迭代。
当前挑战
该数据集致力于解决机器人模仿学习中的多模态感知与连续控制决策挑战,其核心难题在于如何从高维视觉观察中提取有效特征,并映射至精确的机器人动作空间。构建过程中,数据采集面临传感器同步、标定误差以及环境干扰等技术障碍,确保视频流与状态数据的时间对齐需要精细的工程处理。此外,数据规模有限,仅包含9个任务片段与503帧样本,难以覆盖真实场景中的任务多样性与状态分布,可能影响模型的泛化能力。数据标注与清洗亦需耗费大量人力,以消除噪声并保证动作指令的准确性与安全性,这些因素共同构成了数据集应用与扩展的主要瓶颈。
常用场景
经典使用场景
在机器人学习领域,calvin_calvin_debug_dataset作为调试与验证工具,其经典使用场景聚焦于机器人操作任务的算法原型开发。该数据集通过提供Franka Panda机械臂在模拟环境中的多模态交互数据,包括静态与夹爪视角的RGB图像、机器人状态及动作序列,为研究人员构建端到端模仿学习或强化学习模型奠定了数据基础。其结构化的时序轨迹与任务索引,使得模型能够在可控环境下学习从视觉感知到动作执行的映射关系,尤其适用于验证视觉运动策略在简单任务上的泛化能力与稳定性。
解决学术问题
该数据集主要致力于解决机器人学习中长期存在的样本效率低下与仿真到现实迁移的挑战。通过提供高质量、同步的多模态观测与精确的动作标注,它使得研究人员能够深入探究基于视觉的机器人控制方法,如何从有限演示中有效提取策略。其意义在于为算法调试提供了标准化基准,加速了模仿学习、离线强化学习等范式的迭代周期,并降低了实体机器人实验的高成本与风险,从而推动数据驱动机器人技术的理论进展与实证研究。
实际应用
在实际应用层面,calvin_calvin_debug_dataset为机器人软件栈的测试与集成提供了关键支持。开发团队可利用其预录制的机器人操作序列,在部署前验证感知、规划与控制模块的协同工作性能。例如,在工业分拣或精密装配的自动化流程开发中,该数据集能模拟真实任务场景,帮助工程师快速检测算法对物体姿态估计、抓取点生成等子任务的响应准确性,从而优化系统鲁棒性,缩短从研发到实际部署的周期。
数据集最近研究
最新研究方向
在机器人学习领域,calvin_calvin_debug_dataset作为LeRobot框架生成的调试数据集,其前沿研究聚焦于视觉-动作联合建模与多模态策略学习。该数据集整合了静态场景与夹爪视角的双路RGB视频流,结合精确的机械臂状态与动作序列,为端到端模仿学习与强化学习算法提供了高维感知到低维控制的映射基准。当前热点围绕如何利用此类结构化时序数据,提升模型在复杂操作任务中的泛化能力与样本效率,推动具身智能在真实环境中的自适应与鲁棒性发展。其紧凑的规模与标准化格式亦促进了算法快速迭代与跨平台验证,对开源机器人社区的协作创新具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作