cut_motion_train_test_v2_test

Hugging Face2026-01-27 更新2026-01-28 收录

下载链接：

https://huggingface.co/datasets/Kimura-881014/cut_motion_train_test_v2_test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人相关数据集，适用于机器人技术领域的研究和应用。数据集采用Apache-2.0许可证发布。数据集包含2个任务、2个片段和1184帧数据，数据文件大小为100MB，视频文件大小为500MB，帧率为30fps。数据以parquet格式存储，视频以mp4格式存储。数据集包含丰富的特征信息，包括动作（6个关节位置）、观察状态（6个关节位置）、来自手腕和侧面摄像头的观察图像（480x640分辨率，3通道）、时间戳、帧索引、片段索引、索引和任务索引等。数据集的结构和特征信息详细记录在meta/info.json文件中。

创建时间：

2026-01-22

原始信息汇总

数据集概述

基本信息

数据集名称: cut_motion_train_test_v2_test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学

数据集规模与结构

总情节数: 2
总帧数: 1184
总任务数: 2
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS
数据块大小: 1000
数据路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
数据格式: Parquet
代码库版本: v3.0
机器人类型: so101_follower

数据特征

动作特征 (`action`)

数据类型: float32
形状: [6]
特征名:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

状态观测特征 (`observation.state`)

数据类型: float32
形状: [6]
特征名:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

腕部图像观测特征 (`observation.images.wrist`)

数据类型: video
形状: [480, 640, 3]
维度名: ["height", "width", "channels"]
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

侧面图像观测特征 (`observation.images.side`)

数据类型: video
形状: [480, 640, 3]
维度名: ["height", "width", "channels"]
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 包含音频: false

元数据特征

时间戳 (timestamp): float32, 形状 [1]
帧索引 (frame_index): int64, 形状 [1]
情节索引 (episode_index): int64, 形状 [1]
索引 (index): int64, 形状 [1]
任务索引 (task_index): int64, 形状 [1]

数据划分

训练集: 包含全部2个情节 (索引范围: 0:2)

缺失信息

主页: 未提供
论文: 未提供
引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据集对于推动模仿学习与强化学习算法的进步至关重要。cut_motion_train_test_v2_test数据集依托LeRobot开源框架构建，通过采集真实机器人平台so101_follower的操作序列形成。数据以分块形式组织，每个数据块包含多组Parquet格式文件，总计涵盖2个任务场景与1184帧观测记录，并以30帧每秒的速率同步记录机械臂关节状态与多视角视觉信息，确保了时序数据的一致性与完整性。

特点

该数据集的核心特征在于其多模态数据的深度融合与精细标注。数据集不仅提供了六自由度机械臂的关节位置作为动作与状态观测，还同步收录了腕部与侧方两个视角的高清视频流，分辨率均为640x480，采用AV1编码压缩以平衡存储与读取效率。每一帧数据均附带精确的时间戳、帧索引与任务索引，支持研究者进行端到端的策略学习或细粒度的行为分析，其结构化的特征定义为机器人控制任务提供了清晰的数据接口。

使用方法

为有效利用该数据集进行机器人学习研究，用户需首先通过HuggingFace平台获取数据文件。数据集采用分块存储设计，可通过解析meta/info.json中的路径模板动态加载指定数据块。研究者可依据帧索引或任务索引提取对应的关节状态序列与同步视频帧，进而构建状态-动作对用于行为克隆或离线强化学习训练。视频数据以MP4格式独立存储，便于可视化分析或作为视觉观测输入，整个数据管道设计兼顾了高效存取与算法实验的灵活性。

背景与挑战

背景概述

在机器人学习领域，高质量、多模态的数据集对于推动模仿学习与强化学习算法的进步至关重要。cut_motion_train_test_v2_test数据集依托于LeRobot开源框架构建，旨在为机器人操作任务提供丰富的演示数据。该数据集聚焦于机械臂的轨迹规划与视觉感知融合问题，通过整合关节状态、时序信息以及多视角视频流，为研究者提供了一个模拟真实世界交互环境的基准平台。尽管其创建时间与核心团队信息尚未明确公开，但数据集的结构设计体现了当前机器人学习研究中对可扩展性与泛化能力的前沿追求，有望促进从仿真到实际部署的算法迁移研究。

当前挑战

该数据集致力于解决机器人操作中的模仿学习挑战，即如何从人类演示中提取有效的控制策略，并适应动态环境的变化。具体而言，挑战在于处理高维动作空间与多模态观测数据的对齐问题，以及跨任务泛化能力的提升。在构建过程中，数据采集面临传感器同步、视角校准与数据标注一致性的技术难题，同时需确保视频编码效率与存储开销的平衡。此外，数据集的规模相对有限，可能制约了复杂长时程任务的学习效果，对算法的样本效率提出了更高要求。

常用场景

经典使用场景

在机器人学领域，数据集cut_motion_train_test_v2_test为机器人运动控制与视觉感知的联合研究提供了关键支持。该数据集通过整合机械臂关节位置数据与多视角视觉信息，典型应用于训练端到端的机器人模仿学习模型。研究人员可利用其序列化的状态-动作对，结合手腕和侧方摄像头捕捉的高帧率视频，构建从视觉观察到动作执行的映射关系，从而优化机器人在复杂环境中的自主操作能力。

实际应用

在实际机器人部署中，该数据集可直接服务于工业自动化与服务机器人的技能编程。例如，基于数据驱动的抓取与放置任务可通过学习数据集中的关节运动与视觉上下文得以实现，降低传统示教编程的复杂度。在物流分拣或家庭辅助场景中，利用此类多模态数据训练的模型能够提升机器人对未知物体的适应性与操作鲁棒性，加速从仿真到实物的迁移过程。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在视觉-动作联合建模与模仿学习算法的改进上。例如，基于时空注意力机制的策略网络可利用其视频序列与动作标签进行端到端训练；同时，生成对抗模仿学习（GAIL）的变体常借助此类真实交互数据来提升策略的样本效率。此外，数据集支持的行为克隆与逆强化学习研究，也催生了多任务学习与元学习在机器人控制中的创新应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集