record-test3

Hugging Face2025-11-25 更新2025-11-26 收录

下载链接：

https://huggingface.co/datasets/yeeunleee/record-test3

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个使用LeRobot工具创建的数据集，包含200个剧集，共149589帧，专注于机器人任务。数据集分为训练集，数据以Parquet文件格式存储，视频文件为MP4格式，帧率为30fps。每个数据点包含机器人的动作和状态信息，以及手腕和网络的图像。

创建时间：

2025-11-14

原始信息汇总

数据集概述

基本信息

名称: record-test3
任务类别: 机器人技术
标签: LeRobot
许可证: Apache-2.0
创建工具: LeRobot

数据集规模

总回合数: 200
总帧数: 149,589
总任务数: 1
数据文件大小: 100 MB
视频文件大小: 500 MB
帧率: 30 FPS

数据结构

数据格式: Parquet文件
数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4
分块大小: 1000
训练集分割: 0-200回合

特征字段

动作特征

名称: action
数据类型: float32
维度: 6
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

观测特征

状态观测

名称: observation.state
数据类型: float32
维度: 6
关节位置:
- shoulder_pan.pos
- shoulder_lift.pos
- elbow_flex.pos
- wrist_flex.pos
- wrist_roll.pos
- gripper.pos

图像观测

手腕摄像头:

名称: observation.images.wrist
数据类型: 视频
分辨率: 480×640×3
编码: AV1
像素格式: yuv420p
非深度图
无音频

网络摄像头:

名称: observation.images.webcam
数据类型: 视频
分辨率: 480×640×3
编码: AV1
像素格式: yuv420p
非深度图
无音频

索引特征

时间戳: float32[1]
帧索引: int64[1]
回合索引: int64[1]
索引: int64[1]
任务索引: int64[1]

技术信息

代码库版本: v3.0
机器人类型: so101_follower

引用信息

主页: 待补充
论文: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人技术领域，record-test3数据集通过LeRobot平台系统性地构建，采用SO101跟随者机器人进行数据采集。该数据集包含200个完整任务片段，总计149,589帧数据，以30帧/秒的速率记录机械臂关节位置与视觉信息。数据以分块存储形式组织，每1000帧形成一个数据块，通过Parquet格式高效保存多维时序数据。

特点

该数据集显著特征在于多模态数据融合，同步记录六自由度机械臂的关节角度控制指令与双视角视觉观测。腕部摄像头与外部网络摄像头分别提供480x640分辨率的RGB视频流，配合精确的时间戳与帧索引构建时空对齐的机器人操作序列。数据结构采用分层标注体系，包含任务索引、片段标识等元数据，为模仿学习算法提供完整的上下文信息。

使用方法

研究人员可通过加载标准Parquet数据文件访问该数据集，利用帧索引与片段索引构建训练样本。数据特征包含连续动作空间与多源观测空间，适用于行为克隆、强化学习等机器人学习范式。视频数据采用AV1编码存储，需配合专用解码器读取，建议按照官方提供的LeRobot工具链进行数据预处理与模型训练。

背景与挑战

背景概述

在机器人技术蓬勃发展的时代，record-test3数据集作为LeRobot项目的重要组成部分应运而生。该数据集由HuggingFace机构基于开源机器人框架构建，专门针对六自由度机械臂的轨迹控制与视觉感知任务设计。其核心研究聚焦于多模态数据融合机制，通过整合关节状态传感器与双视角视觉系统，为机器人模仿学习算法提供高维度的时空交互数据。该数据集通过标准化数据格式与大规模轨迹记录，显著推进了机器人行为克隆与策略泛化领域的研究进程。

当前挑战

该数据集致力于解决机器人操作任务中的动作规划与视觉感知协同挑战，其难点在于高维连续动作空间与多源感知数据的对齐问题。在构建过程中面临传感器时序同步精度的技术瓶颈，需确保机械臂关节编码器与双摄像头采集系统的时间戳严格匹配。数据存储架构需平衡大规模视频流与状态参数的存储效率，同时维持30帧率下480p视频的实时解码性能。多模态特征工程还需克服异质数据融合时的维度不一致问题，这对后续机器学习模型的训练构成持续性挑战。

常用场景

经典使用场景

在机器人学习领域，record-test3数据集通过整合多模态传感器数据，为模仿学习算法的开发提供了坚实基础。该数据集收录了机械臂关节位置、视觉图像及时间序列信息，典型应用于训练端到端策略模型，使机器人能够从人类示范中学习复杂操作任务。其结构化数据流支持动态环境下的动作预测与状态转移分析，已成为机器人行为克隆研究的标准基准。

解决学术问题

该数据集有效解决了机器人技能迁移中的示范数据稀缺性问题。通过提供包含20万帧动作-观测对的大规模数据集，研究者能够深入探索跨模态表征学习、时序动作分割等关键课题。其精确的关节运动轨迹与同步视觉反馈，为验证分层强化学习、元学习等前沿理论提供了实证基础，显著推进了机器人自主决策能力的发展。

衍生相关工作

该数据集的发布催生了系列创新研究，包括基于时空注意力的行为预测模型、多传感器融合的示教学习框架等经典工作。研究者利用其丰富的动作-视觉对应关系，开发出能够处理长时序依赖的图神经网络架构，同时启发了面向未知物体的零样本泛化方法，这些衍生成果持续推动着具身智能领域的理论突破与技术革新。

以上内容由遇见数据集搜集并总结生成