record-test

Hugging Face2025-12-05 更新2025-12-06 收录

下载链接：

https://huggingface.co/datasets/taiki-ishii/record-test

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是使用LeRobot创建的机器人数据集，包含50个episodes，22173帧，1个任务。数据以parquet文件格式存储，总数据文件大小为100MB，视频文件大小为500MB，帧率为30fps。数据集包含动作、观测状态、前视图像、时间戳、帧索引、episode索引、索引和任务索引等特征。动作和观测状态包括肩部、肘部、腕部和夹持器的位置信息。前视图像的分辨率为480x640，3通道，视频编码为av1。数据集采用Apache 2.0许可证。

创建时间：

2025-11-30

原始信息汇总

数据集概述

基本信息

数据集名称: record-test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot

数据集结构

总情节数: 50
总帧数: 22173
总任务数: 1
数据块大小: 1000
数据文件总大小: 100 MB
视频文件总大小: 500 MB
帧率: 30 FPS
数据分割: 训练集 (0:50)
代码库版本: v3.0
机器人类型: so101_follower

数据文件

数据文件路径格式: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径格式: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

特征字段

动作

数据类型: float32
形状: [6]
名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测状态

数据类型: float32
形状: [6]
名称: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, gripper.pos

观测图像（前视）

数据类型: video
形状: [480, 640, 3]
名称: height, width, channels
视频信息:
- 高度: 480
- 宽度: 640
- 编解码器: av1
- 像素格式: yuv420p
- 是否为深度图: false
- 帧率: 30
- 通道数: 3
- 是否包含音频: false

其他字段

时间戳: 数据类型 float32，形状 [1]
帧索引: 数据类型 int64，形状 [1]
情节索引: 数据类型 int64，形状 [1]
索引: 数据类型 int64，形状 [1]
任务索引: 数据类型 int64，形状 [1]

引用信息

主页: [More Information Needed]
论文: [More Information Needed]
BibTeX: [More Information Needed]

搜集汇总

数据集介绍

构建方式

在机器人学习领域，高质量的数据集对于模型训练至关重要。record-test数据集依托LeRobot框架构建，通过记录机器人执行任务过程中的多模态数据而形成。该数据集包含50个完整任务片段，总计22173帧数据，以30帧每秒的速率采集。数据以分块形式存储于Parquet文件中，每块约1000帧，同时配有对应的视频文件，总数据量约600MB。这种结构化存储方式便于高效读取与处理，为机器人行为学习提供了坚实的实验基础。

特点

该数据集在机器人操作任务中展现出鲜明的多模态特性。其核心特征在于同步记录了机器人的关节位置状态与前端摄像头视觉信息，形成状态-动作-观测的完整映射。数据维度涵盖6自由度机械臂的关节角度及夹爪开合状态，视觉数据则以480x640分辨率的三通道图像序列呈现。所有数据均附带精确的时间戳、帧索引及任务索引，确保了时序对齐与上下文连贯性，为端到端模仿学习或强化学习算法提供了丰富的训练素材。

使用方法

使用该数据集时，研究者可通过LeRobot提供的标准接口加载数据，实现高效的数据流处理。数据集已预分为训练集，涵盖全部50个任务片段，可直接用于模型训练。数据读取支持按块加载，兼顾内存效率与访问速度。典型应用场景包括机器人策略学习、行为克隆及视觉运动控制等任务。用户可依据任务索引或帧索引提取特定片段，结合关节状态与视觉观测，构建状态-动作对，进而训练神经网络模型以预测机器人动作。

背景与挑战

背景概述

在机器人学习领域，高质量、大规模的真实世界交互数据对于推动模仿学习与强化学习算法的进步至关重要。record-test数据集由LeRobot项目团队构建，旨在为机器人操作任务提供丰富的多模态演示数据。该数据集聚焦于机械臂控制，具体涉及so101_follower型机器人，其核心研究问题在于如何通过记录的状态、动作与视觉观测序列，训练智能体完成复杂的连续控制任务。尽管其创建时间与主要研究人员信息在现有文档中尚未明确披露，但该数据集的结构设计体现了当前机器人学习研究中对可扩展、标准化数据集的迫切需求，有望为算法验证与性能提升提供坚实基础。

当前挑战

record-test数据集所针对的领域挑战在于机器人操作中的连续控制与多模态感知融合问题，即如何从高维视觉输入与关节状态中学习精确、鲁棒的动作策略。构建过程中的挑战则体现在数据采集的复杂性与一致性上，包括在真实物理环境中同步记录多路传感器数据（如关节位置与前端摄像头视频）的技术难度，确保长达数万帧数据的时间对齐与标注准确性，以及处理大规模视频数据所带来的存储与计算开销。此外，数据集的规模相对有限，仅包含50个 episodes，可能对训练泛化能力强的模型构成限制。

常用场景

经典使用场景

在机器人学习领域，record-test数据集以其丰富的多模态数据为机器人模仿学习提供了经典范例。该数据集整合了机械臂的关节状态、动作指令以及前视摄像头采集的视觉信息，使得研究者能够基于真实世界交互轨迹训练端到端的控制策略。通过模拟机械臂执行跟随任务的过程，该数据集常用于开发和验证视觉-动作映射模型，促进机器人在动态环境中实现精准操作。

实际应用

在实际机器人部署中，record-test数据集可应用于服务机器人或工业自动化场景，例如物体抓取、装配辅助等任务。基于该数据集训练的模型能够使机械臂根据实时视觉反馈调整姿态，实现自主跟随或精细操作。这类技术有望提升生产线柔性，降低人工编程成本，并为家庭助理机器人提供更自然的交互能力。

衍生相关工作

围绕record-test数据集，学术界衍生出多项经典工作，主要集中在视觉运动策略学习领域。例如，利用该数据集的序列信息开发时序预测模型，或结合强化学习框架优化动作生成效率。部分研究进一步扩展了数据集的用途，将其作为多任务学习的评估基准，推动了跨模态表示学习与机器人控制算法的协同演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集