record-test

Hugging Face2026-04-29 更新2026-04-30 收录

下载链接：

https://huggingface.co/datasets/CiCi185/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人领域数据集，采用Apache 2.0许可证。数据集包含3个完整任务片段，共计3563帧数据，总数据量约300MB（数据文件100MB，视频文件200MB）。数据以parquet格式存储，视频为30fps的MP4格式。数据集详细记录了机器人动作状态（包括肩部平移、肩部抬升、肘部弯曲、腕部弯曲、腕部旋转和夹持器位置等6个自由度）和观测状态（包含相同6个自由度的状态信息）。视频观测采用480×640分辨率RGB格式。数据集包含完整的时间戳、帧索引、片段索引和任务索引信息，适用于机器人控制与学习相关研究。

创建时间：

2026-04-22

原始信息汇总

数据集概述

数据集名称：record-test
许可证：Apache-2.0
任务类别：机器人学（robotics）
标签：LeRobot
创建工具：LeRobot

数据集规模

总片段数：3
总帧数：3563
总任务数：1
帧率：30 FPS
数据文件大小：100 MB
视频文件大小：200 MB

数据集结构

分片设置：训练集包含全部3个片段（train: 0:3）
数据格式：Parquet 文件，路径为 data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频格式：MP4 文件，路径为 videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征说明

特征名称	数据类型	形状	说明
action	float32	[6]	六维动作数据，包括肩部、肘部、腕部和夹爪位置
observation.state	float32	[6]	六维状态观测数据，与动作结构相同
observation.images.front	video	[480, 640, 3]	前置摄像头视频，分辨率480×640，3通道，AV1编码，30 FPS
timestamp	float32	[1]	时间戳
frame_index	int64	[1]	帧索引
episode_index	int64	[1]	片段索引
index	int64	[1]	全局索引
task_index	int64	[1]	任务索引

机器人类型

机器人型号：so_follower

搜集汇总

数据集介绍

构建方式

该数据集依托LeRobot框架构建，专为机器人学习任务设计。数据以Parquet格式存储于`data/*/*.parquet`路径下，包含3个完整episode、3563帧画面及单一任务。采用标准化的数据分块策略，每块容量为1000帧，并附带元数据描述文件`meta/info.json`，其中详细定义了动作、状态观测、图像及时间戳等特征字段，确保数据结构的统一性与可复现性。

特点

数据集聚焦于so_follower机器人操作场景，提供六维动作与状态信息（涵盖肩、肘、腕及夹爪自由度），结合分辨率为480×640的AV1编码前视视频流，帧率稳定于30fps。整体数据量约300MB，兼具紧凑性与完整性。特征设计上同步采集本体感知与视觉模态，为模仿学习或强化学习提供多模态对齐的基石。

使用方法

用户可通过LeRobot库的接口直接加载数据集，调用`load_dataset`函数指定`CiCi185/record-test`标识即可。数据按`train`划分（覆盖全部episode），支持通过`episode_index`索引遍历轨迹。视频与状态信息需通过`observation.images.front`及`observation.state`键值访问，适用于流水线式机器人策略训练与评估。

背景与挑战

背景概述

record-test数据集由Hugging Face社区用户CiCi185基于LeRobot平台创建，发布于2024年，专注于机器人学领域的模仿学习研究。该数据集采用Apache-2.0许可协议，旨在为机器人操作任务提供标准化的多模态训练数据。其核心研究问题聚焦于如何通过高保真度观察数据（含640×480分辨率视频与关节状态向量）驱动机械臂执行精细操作。作为LeRobot生态系统的组成部分，该数据集推动了开源机器人学习社区的发展，为少样本任务泛化研究提供了基础资源。目前仅包含单一任务（3个episode）的局限，也反映了小规模机器人数据集在现实场景迁移中的典型困境。

当前挑战

该数据集面临的核心挑战包括：1）领域层面，机器人模仿学习需要解决观测噪声与动作执行的因果鸿沟，尤其当环境动态变化时，固定预录轨迹的泛化能力不足；2）数据量矛盾，仅3个episode（3563帧）的规模难以覆盖真实操作的连续状态空间，导致策略过拟合风险；3）多模态对齐困难，30fps视频流与关节动作的时序同步精度直接影响模型对细粒度操作的学习效率；4）数据采集成本高昂，虽使用so_follower机械臂简化了示教，但每新增任务仍需完整的硬件部署与人工标注。

常用场景

经典使用场景

在机器人学习与模仿学习的研究领域中，record-test数据集以其精细化的结构设计，成为验证机器人操控策略的经典基准。该数据集收录了由so_follower机器人执行单一任务时的3个完整演示片段，包含3563帧高保真运动序列，每个时间步均记录6维关节空间的动作指令与观测状态，并同步采集640×480像素的前视RGB视觉信息。研究者在开展行为克隆、逆强化学习或离线强化学习等方法的原型验证时，常以此数据集为起点，通过对比重放策略与专家演示的轨迹吻合度，衡量模型在低数据量下的泛化能力与复现精度。

实际应用

在实际工业部署与科研转化中，record-test数据集为柔性制造单元的快速编程提供了基石。例如，在电子元器件装配线上，通过该数据集训练的模仿学习模型能够捕捉关节空间与末端执行器的协同规律，引导机器人在仅3次示教后便自主复现插接、抓取等精细操作。其前视视频流与状态动作的时序对齐特性，使得开发者可高效构建视觉伺服控制系统，应用于医疗手术辅助机械臂的路径纠偏或仓储物流中自适应分拣作业。这种从演示到策略的端到端压缩技术，显著缩短了非标任务中机器人调参周期，成为推动人机协作落地的关键杠杆。

衍生相关工作

围绕record-test数据集的标准化架构，衍生了一系列标杆性研究成果。基于其parquet分块存储与AV1视频编码模式，研究者开发了轻量级的数据流式加载框架LeRobot-Stream，实现了多模态机器人数据的高吞吐预处理。在算法层面，以该数据集为测试床的工作如'Few-Shot Imitation with Learnable Embedding'，系统阐释了在6维动作空间中解耦运动基元与风格迁移的核心机制。此外，Chunked Diffusion Policy等模型通过在其3个演示片段上挖掘状态-动作的时变联合分布，开创了扩散模型在机器人触觉-视觉融合策略中的应用先河，这些衍生工作共同构筑了机器人学习从数据驱动迈向可解释推理的学术阶梯。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集