C2

Hugging Face2025-07-18 更新2025-07-19 收录

下载链接：

https://huggingface.co/datasets/chenxing1234567890/C2

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot创建的机器人数据集，包含3个总的片段，每个片段1000帧，总共有1644帧，分为训练集。数据集中的视频信息包括顶部、笔记本电脑、左侧和右侧视角，每段视频的分辨率为480x640，编码格式为av1。数据集提供了多种动作特征，包括左右肩膀、肘部、手腕和抓取器的角度等信息。

创建时间：

2025-07-17

原始信息汇总

数据集概述

基本信息

许可证: apache-2.0
任务类别: robotics
标签: LeRobot, tutorial
代码库版本: v2.1
机器人类型: koch_bimanual

数据集结构

总集数: 3
总帧数: 1644
总任务数: 1
总视频数: 12
总块数: 1
块大小: 1000
帧率: 30 fps
分割:
- 训练集: 0:3

数据文件

数据路径: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频路径: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征

动作 (action):
- 数据类型: float32
- 形状: [12]
- 名称: left_shoulder_pan, left_shoulder_lift, left_elbow_flex, left_wrist_flex, left_wrist_roll, left_gripper, right_shoulder_pan, right_shoulder_lift, right_elbow_flex, right_wrist_flex, right_wrist_roll, right_gripper
观测状态 (observation.state):
- 数据类型: float32
- 形状: [12]
- 名称: 同动作特征
观测图像 (observation.images):
- top, laptop, left, right:
  - 数据类型: video
  - 形状: [480, 640, 3]
  - 名称: height, width, channels
  - 信息:
    - 视频高度: 480
    - 视频宽度: 640
    - 视频编解码器: av1
    - 视频像素格式: yuv420p
    - 是否为深度图: false
    - 视频帧率: 30 fps
    - 视频通道数: 3
    - 是否有音频: false
时间戳 (timestamp):
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index):
- 数据类型: int64
- 形状: [1]
集索引 (episode_index):
- 数据类型: int64
- 形状: [1]
索引 (index):
- 数据类型: int64
- 形状: [1]
任务索引 (task_index):
- 数据类型: int64
- 形状: [1]

引用

BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据集对于算法训练和系统验证至关重要。C2数据集基于LeRobot平台构建，采用模块化数据采集策略，通过Koch双手机器人系统记录多模态交互数据。数据以Parquet格式存储，包含3个完整任务序列，共计1644帧视频数据，采样频率为30fps。每个数据块包含机械臂关节状态、多视角视觉观测以及精确的时间戳信息，采用分块存储机制优化大规模数据访问效率。

特点

该数据集在机器人操作任务数据采集方面展现出显著优势。其核心特征在于完备的双手机器人状态记录，包含12维关节空间动作向量和对应的状态观测，覆盖左右机械臂的全套运动学参数。多视角视觉数据采用标准化480x640分辨率，提供顶部、笔记本、左右四个视角的同步视频流，采用AV1编解码确保数据压缩效率。元数据结构设计严谨，通过分层索引实现帧级精确定位，支持复杂任务序列的时序分析需求。

使用方法

研究人员可通过HuggingFace平台直接获取该数据集，数据组织遵循标准化的目录结构。使用前需解析meta/info.json文件获取全局配置信息，数据文件按分块编号存储于data目录，视频资源独立存放于videos子目录。典型应用场景包括加载特定分块的Parquet文件进行关节空间轨迹分析，或结合多路视频流进行视觉-动作联合建模。数据集已预置训练集划分方案，支持直接用于模仿学习算法的训练与验证。

背景与挑战

背景概述

C2数据集作为机器人学领域的重要资源，由LeRobot团队基于开源框架构建，专注于双机械臂（koch_bimanual）的协同控制研究。该数据集通过多视角视频流（480×640分辨率@30fps）与12维关节状态数据同步采集，完整记录了机械臂执行任务时的时空动态特性。其核心价值在于为模仿学习与强化学习算法提供了高精度时空对齐的多模态数据，填补了复杂双臂协同操作任务基准数据的空白。

当前挑战

该数据集面临的主要挑战体现在算法与应用层面：双臂系统的高维连续动作空间（12自由度）对策略网络的泛化能力提出严峻考验；多摄像头视角间的时间同步精度需控制在毫秒级以避免动作-观测错位。数据构建过程中，机械臂运动轨迹的平滑性保障与视频流无损压缩（AV1编解码）之间的平衡，以及深度信息与RGB数据的标定误差控制，均为工程实现中的关键技术难点。

常用场景

经典使用场景

在机器人控制领域，C2数据集凭借其丰富的双机械臂动作记录和多视角视觉数据，成为研究仿人机器人行为模仿的经典基准。该数据集通过记录Koch双机械臂的12自由度关节运动轨迹，配合顶部、左右侧及笔记本电脑视角的同步视频流，为模仿学习算法提供了高维度的状态-动作对样本，特别适合用于训练基于视觉输入的机械臂控制策略。

衍生相关工作

基于该数据集的双机械臂协同特性，已衍生出多项关于跨臂知识迁移的研究工作。部分学者利用其多视角视频流开发了视觉-动作联合嵌入模型，另有研究通过分析其高精度关节角度数据，提出了新型的仿人运动规划算法，这些成果均发表在机器人顶会ICRA和IROS上。

数据集最近研究