can_task

Hugging Face2026-04-02 更新2026-04-03 收录

下载链接：

https://huggingface.co/datasets/HiverXD/can_task

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人相关数据集，适用于机器人技术领域的研究和应用。数据集包含4个episodes，共361帧，涉及1个任务。数据文件总大小为100MB，视频文件总大小为200MB，帧率为10fps。数据集以parquet格式存储，包含多种特征字段，如观测状态（包括13个电机参数）、前端和腕部摄像头视频（分辨率84x84，3通道）、完成标志、奖励、动作（7个参数）、时间戳、帧索引、episode索引、任务索引等。视频数据采用AV1编解码器，YUV420p像素格式，无音频。数据集采用Apache-2.0许可证。

创建时间：

2026-03-27

原始信息汇总

数据集概述

基本信息

数据集名称: can_task
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总任务数: 1
总情节数: 4
总帧数: 361
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 10 FPS
数据分割: 训练集 (0:4)

数据文件与路径

数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

观测数据

observation.state
- 数据类型: float64
- 形状: [13]
- 描述: 机器人电机状态，包含 right_x, right_y, right_z, right_q1, right_q2, right_q3, right_q4, right_g1, right_g2, right_g3, right_g4, right_g5, right_g6
observation.images.front
- 数据类型: 视频
- 形状: [84, 84, 3]
- 视频信息:
  - 帧率: 10.0
  - 高度: 84
  - 宽度: 84
  - 通道数: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: 否
  - 包含音频: 否
observation.images.wrist
- 数据类型: 视频
- 形状: [84, 84, 3]
- 视频信息:
  - 帧率: 10.0
  - 高度: 84
  - 宽度: 84
  - 通道数: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: 否
  - 包含音频: 否

动作与奖励

action
- 数据类型: float64
- 形状: [7]
- 描述: 机器人动作，包含 right_x, right_y, right_z, right_r, right_p, right_y, right_gripper
reward
- 数据类型: float64
- 形状: [1]

元数据与索引

done
- 数据类型: bool
- 形状: [1]
timestamp
- 数据类型: float32
- 形状: [1]
frame_index
- 数据类型: int64
- 形状: [1]
episode_index
- 数据类型: int64
- 形状: [1]
index
- 数据类型: int64
- 形状: [1]
task_index
- 数据类型: int64
- 形状: [1]

可视化

可视化空间: https://huggingface.co/spaces/lerobot/visualize_dataset?path=HiverXD/can_task

引用信息

主页: 未提供
论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于算法训练至关重要。can_task数据集依托LeRobot平台构建，通过记录机器人执行任务过程中的多模态数据形成。数据以分块形式存储于Parquet文件中，涵盖4个完整任务片段，总计361帧，采样频率为10赫兹。构建过程中系统采集了机器人状态观测、前视与腕部摄像头视频流、动作指令及奖励信号等多维度信息，确保了数据的时序一致性与完整性。

使用方法

为有效利用该数据集进行机器人行为克隆或强化学习建模，研究者可通过LeRobot提供的可视化工具直观浏览数据内容。数据按训练划分全部开放，以分块Parquet文件存储，用户可依据特征描述加载特定观测与动作字段。由于数据集规模适中，适合用于算法原型验证或小样本学习实验。在使用时需注意遵循Apache 2.0许可协议，并合理引用相关资源以促进学术规范。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的实际应用至关重要。can_task数据集由Hugging Face旗下的LeRobot项目创建，该项目致力于构建开源机器人学习生态系统，旨在降低机器人研究的门槛并促进社区协作。该数据集聚焦于机器人操作任务，通过记录机械臂在真实环境中的多模态交互数据，包括关节状态、前视与腕部摄像头视频、动作指令及奖励信号，为研究端到端机器人控制策略提供了宝贵资源。其采用Apache 2.0开源协议，体现了开放科学的精神，尽管具体创建时间与核心论文信息暂未公开，但其依托LeRobot框架，预示着在推动机器人学习数据标准化与可复现性方面具有潜在影响力。

当前挑战

can_task数据集旨在解决机器人操作任务中的模仿学习与强化学习问题，其核心挑战在于如何从高维、多模态的感官输入中学习鲁棒且泛化能力强的控制策略。具体而言，数据集需应对真实世界环境的复杂性，如光照变化、物体姿态多样性及动态干扰，这些因素使得策略学习极易陷入过拟合或收敛困难。在构建过程中，数据采集面临诸多挑战：确保多传感器（如关节编码器与摄像头）的时间同步与数据对齐至关重要；视频数据的高效压缩与存储需平衡质量与容量；此外，标注奖励信号在稀疏奖励任务中尤为困难，且保证数据覆盖足够多样的任务场景以支持泛化学习，需要精心的实验设计与大量的物理交互，成本高昂且耗时。

常用场景

经典使用场景

在机器人学领域，can_task数据集为机器人操作任务的研究提供了宝贵的多模态数据资源。该数据集通过LeRobot平台构建，整合了机器人状态观测、视觉图像及动作指令，典型应用于机器人模仿学习与强化学习算法的训练与验证。研究者可利用其丰富的观测特征，如13维电机状态和84x84分辨率的双视角图像，来开发端到端的控制策略，模拟真实环境中的抓取或操纵任务，从而推动机器人自主执行复杂操作的能力。

解决学术问题

can_task数据集有效应对了机器人学中数据稀缺与仿真-现实差距的挑战。它提供了真实机器人交互的高质量轨迹数据，包含状态、动作、奖励及视觉反馈，使学者能够深入探究离线强化学习、行为克隆及多模态感知融合等前沿问题。通过解决这些核心学术难题，该数据集促进了机器人智能体在非结构化环境中学习泛化策略的进展，为降低实际机器人训练成本与风险贡献了实证基础。

实际应用

在实际机器人部署中，can_task数据集支持工业自动化与家庭服务机器人的技能学习。其记录的双视角视觉数据（前视与腕部视角）结合精确的动作序列，可用于训练机器人执行精细的物体抓取、装配或搬运任务。例如，在制造业中，基于该数据训练的模型能提升机器人对未知物体的适应能力，减少人工编程需求；在家庭场景，则有助于开发更灵巧的家务辅助机器人，推动机器人技术的普及与应用落地。

数据集最近研究