can_task

Hugging Face2026-04-04 更新2026-04-05 收录

下载链接：

https://huggingface.co/datasets/rka00/can_task

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，专为机器人技术领域设计，采用apache-2.0许可证。数据集包含30个总片段，3279帧，1个总任务，数据文件大小为100MB，视频文件大小为200MB，帧率为10fps。数据以parquet格式存储，视频以mp4格式存储。数据集的特征包括观察状态（13维浮点数，描述右手的电机状态）、来自前部和腕部摄像头的图像（84x84x3的视频帧）、完成标志（布尔值）、奖励（浮点数）、动作（7维浮点数，描述右手的电机动作）、时间戳（浮点数）、帧索引、片段索引、索引和任务索引（均为整数）。数据集适用于机器人控制、行为学习等任务。

创建时间：

2026-03-29

原始信息汇总

数据集概述

基本信息

数据集名称: can_task
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集规模

总任务数: 1
总情节数: 30
总帧数: 3279
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 10 FPS

数据划分

训练集: 包含所有30个情节

数据结构

数据以Parquet文件格式存储，路径模式为：data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet 视频以MP4文件格式存储，路径模式为：videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据特征

观测数据

observation.state
- 数据类型: float64
- 形状: [13]
- 描述: 包含13个电机状态，具体为：right_x, right_y, right_z, right_q1, right_q2, right_q3, right_q4, right_g1, right_g2, right_g3, right_g4, right_g5, right_g6
observation.images.front
- 数据类型: 视频
- 形状: [84, 84, 3] (宽度, 高度, 通道)
- 视频信息:
  - 帧率: 10.0
  - 高度: 84
  - 宽度: 84
  - 通道数: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: 否
  - 包含音频: 否
observation.images.wrist
- 数据类型: 视频
- 形状: [84, 84, 3] (宽度, 高度, 通道)
- 视频信息:
  - 帧率: 10.0
  - 高度: 84
  - 宽度: 84
  - 通道数: 3
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: 否
  - 包含音频: 否

动作数据

action
- 数据类型: float64
- 形状: [7]
- 描述: 包含7个动作维度，具体为：right_x, right_y, right_z, right_r, right_p, right_y, right_gripper

其他数据

done
- 数据类型: bool
- 形状: [1]
reward
- 数据类型: float64
- 形状: [1]
timestamp
- 数据类型: float32
- 形状: [1]
frame_index
- 数据类型: int64
- 形状: [1]
episode_index
- 数据类型: int64
- 形状: [1]
index
- 数据类型: int64
- 形状: [1]
task_index
- 数据类型: int64
- 形状: [1]

可视化

可通过以下链接可视化数据集：https://huggingface.co/spaces/lerobot/visualize_dataset?path=rka00/can_task

引用信息

主页: 未提供
论文: 未提供
BibTeX引用: 未提供

搜集汇总

数据集介绍

构建方式

在机器人操作任务数据集的构建领域，can_task数据集依托LeRobot框架进行系统化采集与整理。该数据集通过记录机器人执行单一任务的过程，将连续操作分解为30个完整片段，总计3279帧数据，并以10帧每秒的频率同步存储视觉与状态信息。数据以分块形式组织，每个数据块包含1000帧观测记录，采用Parquet格式高效存储多维特征，同时关联MP4格式的视频文件，确保动作序列与视觉观测的时空对齐。

使用方法

针对机器人策略学习的研究需求，can_task数据集支持端到端的训练流程。研究者可通过加载Parquet文件直接访问状态-动作对序列，并利用关联视频文件进行视觉表征学习。数据集已预划分为训练集，涵盖全部30个任务片段，适用于行为克隆、离线强化学习等算法验证。在使用过程中，可依据帧索引与片段索引重构完整任务轨迹，结合奖励与终止信号设计损失函数，从而训练出能够泛化至真实机器人环境的控制策略。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的数据集是推动模仿学习与强化学习算法发展的关键基石。can_task数据集由HuggingFace的LeRobot项目创建，旨在为机器人操作任务提供丰富的多模态交互数据。该数据集收录了30个完整交互片段，总计3279帧数据，涵盖了机器人状态观测、视觉图像以及动作指令等多维度信息。通过整合前端与腕部摄像头视频流以及精确的电机状态反馈，该数据集为研究者在复杂环境下的机器人策略学习与泛化能力评估提供了重要资源。

当前挑战

can_task数据集致力于解决机器人操作任务中的模仿学习与策略优化问题，其核心挑战在于如何从高维视觉与状态观测中提取有效特征，并生成精确、平滑的连续动作序列。在数据集构建过程中，面临多传感器数据同步与校准的复杂性，确保视频流与机器人状态的时间对齐至关重要。此外，数据采集涉及真实物理系统，需克服硬件噪声、环境干扰以及任务执行中的随机性，以保障数据的一致性与可靠性。这些挑战共同构成了该数据集在推动机器人自主学习能力方面的关键研究前沿。

常用场景

经典使用场景

在机器人学习领域，can_task数据集为模仿学习与强化学习算法的训练与评估提供了关键支持。该数据集通过记录机械臂执行特定任务时的状态观测、动作序列及奖励信号，构建了完整的交互轨迹。其经典使用场景聚焦于训练端到端的策略模型，使机器人能够从视觉与状态数据中学习复杂的操作技能，如抓取或放置物体。数据集包含多视角图像和精确的电机状态信息，为算法提供了丰富的感知与决策依据，推动了机器人自主行为学习的研究进展。

解决学术问题

can_task数据集有效解决了机器人学中样本效率低下与泛化能力不足的学术难题。通过提供高质量的真实世界交互数据，它降低了强化学习对仿真环境的依赖，促进了从离线数据中学习可行策略的研究。该数据集支持算法在稀疏奖励设置下的探索，并有助于研究多模态观测融合、状态表示学习等核心问题。其结构化记录为验证模仿学习、逆强化学习等方法提供了基准，加速了机器人智能决策理论的实证发展。

实际应用

在实际应用层面，can_task数据集可服务于工业自动化与柔性制造场景。基于该数据集训练的模型能够赋能机械臂执行精细的装配、分拣或包装任务，提升生产线的自适应能力。在物流仓储中，此类数据驱动的机器人系统可优化货物搬运流程，减少人工干预。此外，数据集所涵盖的视觉与动作对齐信息，为开发辅助机器人或康复设备提供了技术基础，推动智能机器人在复杂环境中的可靠部署。

数据集最近研究