test12

Hugging Face2026-03-31 更新2026-04-01 收录

下载链接：

https://huggingface.co/datasets/zijian2022/test12

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，适用于机器人技术领域，采用Apache-2.0许可证。数据集包含1个总剧集，557帧，1个总任务，数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括动作和观察状态，其中动作状态包含6个关节位置（shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos），观察状态同样包含这6个关节位置。此外，数据集还包含来自前、后摄像头的视频数据，分辨率为480x640，3通道，视频格式为av1编码的mp4文件。其他特征包括时间戳、帧索引、剧集索引、索引和任务索引。数据集以parquet格式存储，视频以mp4格式存储。

创建时间：

2026-03-29

原始信息汇总

数据集概述

基本信息

数据集名称: test12
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

配置名称: default
数据文件格式: Parquet
数据文件路径模式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径模式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

数据规模

总情节数: 1
总帧数: 557
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据划分: 训练集 (100%，索引0:1)

特征字段

动作 (action)
- 数据类型: float32
- 形状: [6]
- 字段名:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
观测状态 (observation.state)
- 数据类型: float32
- 形状: [6]
- 字段名:
  - shoulder_pan.pos
  - shoulder_lift.pos
  - elbow_flex.pos
  - wrist_flex.pos
  - wrist_roll.pos
  - gripper.pos
前视图像观测 (observation.images.front)
- 数据类型: 视频
- 形状: [480, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 高度: 480 像素
  - 宽度: 640 像素
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: 否
  - 帧率: 30 FPS
  - 通道数: 3
  - 包含音频: 否
后视图像观测 (observation.images.back)
- 数据类型: 视频
- 形状: [480, 640, 3] (高度, 宽度, 通道)
- 视频信息:
  - 高度: 480 像素
  - 宽度: 640 像素
  - 编解码器: av1
  - 像素格式: yuv420p
  - 是否为深度图: 否
  - 帧率: 30 FPS
  - 通道数: 3
  - 包含音频: 否
时间戳 (timestamp)
- 数据类型: float32
- 形状: [1]
帧索引 (frame_index)
- 数据类型: int64
- 形状: [1]
情节索引 (episode_index)
- 数据类型: int64
- 形状: [1]
索引 (index)
- 数据类型: int64
- 形状: [1]
任务索引 (task_index)
- 数据类型: int64
- 形状: [1]

元数据

代码库版本: v3.0
机器人类型: so100_follower

缺失信息

主页: 未提供
论文: 未提供
引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人学领域，数据集的构建往往依赖于实际物理系统的交互记录。test12数据集通过LeRobot平台采集，采用so100_follower型机器人执行单一任务，记录了557帧连续操作数据。数据以分块形式存储于Parquet文件中，每块包含1000帧，同时配有前视与后视摄像头拍摄的AV1编码视频，帧率为30fps，分辨率达640x480，确保了动作与观测序列的同步性与完整性。

特点

该数据集的特点在于其多维度的观测与动作表示。观测部分融合了机器人的六维关节状态（包括肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置）以及双视角RGB图像，提供了丰富的环境感知信息。动作空间同样以六维浮点向量定义，与观测状态维度一致，便于模仿学习或强化学习算法的训练。数据集中所有特征均以结构化格式存储，支持高效的数据加载与处理。

使用方法

使用test12数据集时，研究者可通过LeRobot提供的工具链直接访问Parquet文件，提取动作、观测状态及图像序列。由于数据集仅包含训练分割，适用于机器人控制策略的端到端训练或行为克隆任务。视频数据以MP4格式存储，可与状态数据对齐，用于视觉-动作联合建模。数据集的标准化格式允许轻松集成到现有机器学习流程中，加速机器人学习算法的开发与验证。

背景与挑战

背景概述

在机器人学习领域，高质量的数据集对于推动算法创新与系统部署至关重要。test12数据集依托LeRobot开源框架构建，专注于机器人操作任务，其数据涵盖关节位置状态、多视角视觉观测及时间序列信息，旨在为模仿学习与强化学习研究提供结构化、可扩展的真实世界交互数据。该数据集虽未明确标注创建时间与核心研究团队，但其采用的Apache 2.0许可与标准化数据格式体现了开源社区对机器人数据共享的持续努力，有望促进跨平台算法验证与泛化能力评估。

当前挑战

该数据集致力于解决机器人操作中的端到端策略学习问题，其核心挑战在于如何从有限的任务演示中提取鲁棒且可泛化的行为模式。具体而言，数据规模较小（仅包含单个任务与557帧数据）限制了模型对复杂场景的适应能力；多模态数据（如前、后视角视频与关节状态）的同步对齐与高效融合亦对算法设计提出更高要求。在构建过程中，确保传感器数据的时间一致性、视频编码的压缩质量与数据存储的轻量化均为技术难点，这些因素共同影响着数据集的实用性与扩展性。

常用场景

经典使用场景

在机器人学习领域，test12数据集以其多模态特性成为经典研究工具，它整合了机械臂关节状态与视觉观测数据，为模仿学习与强化学习算法提供了丰富的训练素材。研究者常利用该数据集的前后摄像头视频流与六自由度关节位置信息，构建端到端的控制策略模型，模拟真实环境下的机器人操作任务，从而推动机器人自主执行复杂动作的能力发展。

实际应用

在实际工业与服务业场景中，test12数据集支持开发自适应抓取、装配与导航系统，其记录的机械臂运动轨迹与视觉反馈可直接用于训练服务机器人或协作机械臂。基于此类数据训练的模型能够提升机器人在非结构化环境中的操作精度与鲁棒性，为智能制造、物流分拣及家庭辅助等领域的自动化解决方案提供关键技术支撑。

衍生相关工作

围绕test12数据集，学术界衍生出一系列经典研究工作，包括基于视觉的机械臂模仿学习框架、多任务强化学习算法以及跨模态预训练模型的开发。这些工作充分利用数据集的时序动作-观测对齐特性，探索了机器人技能传递、零样本泛化等前沿方向，进一步拓展了数据集中LeRobot平台在开源机器人社区的影响力与实用性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集