test14

Hugging Face2026-03-31 更新2026-04-01 收录

下载链接：

https://huggingface.co/datasets/zijian2022/test14

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的，专为机器人技术领域设计，采用Apache-2.0许可证。数据集包含3个总片段，1170帧，1个总任务，数据文件大小为100MB，视频文件大小为200MB，帧率为30fps。数据集结构包括动作和观察状态，以及来自前后摄像头的图像数据。动作和观察状态包括6个关节位置（肩部旋转、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹持器位置）。图像数据为480x640分辨率，3通道，视频编码为av1，像素格式为yuv420p，无音频。数据集还包含时间戳、帧索引、片段索引、索引和任务索引等元数据。数据以parquet文件格式存储，视频以mp4格式存储。

This dataset was developed using LeRobot, purpose-built for the robotics domain, and is licensed under Apache-2.0. It contains 3 total segments, 1170 frames, and 1 overall task. The total size of the non-video data files is 100 MB, while the combined size of the video files is 200 MB, with a frame rate of 30 fps. The dataset structure includes action and observation states, as well as image data captured from the front and rear cameras. The action and observation states encompass 6 joint positions: shoulder rotation, shoulder elevation, elbow flexion, wrist flexion, wrist rotation, and gripper position. The image data has a resolution of 480×640 with 3 color channels. The videos are encoded using AV1, adopt the YUV420p pixel format, and contain no audio. Additional metadata fields include timestamps, frame indices, segment indices, item indices, and task indices. Non-video data is stored in Parquet file format, while the video files are stored in MP4 format.

创建时间：

2026-03-30

原始信息汇总

数据集概述

基本信息

数据集名称: test14
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache 2.0
任务类别: 机器人学
标签: LeRobot

数据集规模与结构

总情节数: 3
总帧数: 1170
总任务数: 1
数据文件总大小: 100 MB
视频文件总大小: 200 MB
帧率: 30 FPS
数据块大小: 1000
数据格式: Parquet
代码库版本: v3.0
机器人类型: so100_follower
数据分割: 训练集包含所有3个情节

数据特征

动作空间

特征名: action
数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测空间

状态观测

特征名: observation.state
数据类型: float32
形状: [6]
维度名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

图像观测

前摄像头图像

特征名: observation.images.front
数据类型: video
图像尺寸: 480×640×3 (高度×宽度×通道)
视频编码: AV1
像素格式: yuv420p
非深度图
无音频

后摄像头图像

特征名: observation.images.back
数据类型: video
图像尺寸: 480×640×3 (高度×宽度×通道)
视频编码: AV1
像素格式: yuv420p
非深度图
无音频

元数据特征

时间戳: float32, 形状[1]
帧索引: int64, 形状[1]
情节索引: int64, 形状[1]
索引: int64, 形状[1]
任务索引: int64, 形状[1]

文件路径格式

数据文件: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

主页: 未提供
论文: 未提供
BibTeX引用格式: 未提供

搜集汇总

数据集介绍

构建方式

在机器人技术领域，高质量的数据集对于推动算法研究与应用至关重要。test14数据集依托LeRobot平台构建，采用结构化数据采集方式，将机器人执行任务过程中的多模态信息进行系统化记录。数据以Parquet格式存储，涵盖三个完整任务片段，总计1170帧，每帧数据包含机器人关节状态、动作指令及前后视角的视觉信息，并以30帧每秒的速率同步采集，确保了时序数据的一致性与完整性。

特点

该数据集在机器人学习领域展现出鲜明的多模态融合特性，其核心特征在于同时整合了机器人的状态观测、动作控制与视觉感知信息。具体而言，数据集提供了六自由度关节的位置状态与动作指令，并辅以前后双视角的RGB视频流，视频分辨率为640x480，采用AV1编码格式。数据以分块形式组织，支持高效读取与处理，且所有特征均具备明确的元数据描述，为机器人模仿学习与强化学习研究提供了丰富的实验基础。

使用方法

为有效利用test14数据集开展研究，用户可通过LeRobot框架或兼容的数据加载工具进行访问。数据集已预划分为训练集，可直接用于模型训练。在具体应用中，研究者可依据帧索引、片段索引等字段提取时序数据，结合关节状态、动作及视觉观测构建端到端的学习任务。数据以分块Parquet文件存储，支持流式读取与并行处理，便于在大规模机器学习流程中集成，以促进机器人行为建模与控制策略的算法开发。

背景与挑战

背景概述

在机器人学领域，数据驱动的策略学习正成为实现智能自主行为的关键范式。test14数据集依托LeRobot开源框架构建，专注于机器人操作任务的数据收集与共享。该数据集由HuggingFace社区贡献者创建，采用Apache 2.0许可协议，旨在为机器人模仿学习与强化学习研究提供结构化多模态数据。其核心研究问题在于如何通过真实世界的交互数据，训练机器人执行复杂操作任务，推动机器人从感知到动作的端到端学习能力发展。数据集包含机械臂关节状态、视觉观测与动作指令等多维特征，为机器人控制算法的泛化性与鲁棒性研究奠定了数据基础。

当前挑战

test14数据集所针对的机器人操作任务面临环境动态变化与动作序列长期依赖的固有挑战。机械臂在非结构化环境中需处理视觉感知噪声、物理交互不确定性以及任务目标的模糊性，这对模型的泛化能力提出了严峻考验。在数据构建过程中，多传感器时序同步、高维动作空间的数据标注以及大规模交互数据的高效存储构成了主要技术瓶颈。此外，数据采集需平衡场景多样性与数据一致性，而视频流与状态数据的对齐处理进一步增加了数据集构建的复杂性。如何确保数据质量与规模之间的平衡，成为该领域数据集发展的核心议题。

常用场景

经典使用场景

在机器人学领域，test14数据集作为LeRobot框架下的示范性资源，其经典使用场景聚焦于机器人模仿学习与行为克隆研究。该数据集通过记录so100_follower型机器人的关节位置、视觉观察与时间序列数据，为训练端到端的机器人控制策略提供了结构化范例。研究人员可基于此数据集构建从视觉输入到动作输出的映射模型，探索在受限任务环境中如何实现精准的轨迹复现与任务执行，从而推动模仿学习算法在真实机器人平台上的验证与优化。

衍生相关工作

围绕test14数据集，已衍生出一系列专注于机器人模仿学习与视觉运动控制的经典研究工作。这些工作通常利用数据集中丰富的多模态序列，开发基于深度神经网络的行为克隆模型、逆强化学习框架以及分层策略架构。部分研究进一步探索了数据增强、领域自适应与元学习技术在机器人技能迁移中的应用，推动了LeRobot生态系统中算法库与工具链的完善，为后续更复杂任务数据集的构建与算法评估设立了参考基准。

数据集最近研究