record-test-6

Hugging Face2025-10-24 更新2025-10-25 收录

下载链接：

https://huggingface.co/datasets/taikonauts/record-test-6

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个关于机器人学的数据集，包含13个集段，共4754帧，1个任务。数据集以Parquet文件格式存储动作、状态和视频数据，并支持30fps的帧率。数据集被划分为训练集。它包括多种类型的观察数据，如前视图、鱼眼镜头和机械臂颜色视图。

创建时间：

2025-10-21

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 机器人技术
标签: LeRobot
创建工具: LeRobot (https://github.com/huggingface/lerobot)

数据集结构

总任务数: 1
总情节数: 17
总帧数: 7598
帧率: 30 FPS
数据块大小: 1000
数据文件大小: 100 MB
视频文件大小: 500 MB
代码库版本: v3.0
机器人类型: xarm_end_effector
数据分割: 训练集 (0:17)

数据特征

动作特征

数据类型: float32
维度: 7
包含字段: x, y, z, roll, pitch, yaw, gripper.pos

观测特征

状态观测

数据类型: float32
维度: 7
包含字段: x, y, z, roll, pitch, yaw, gripper.pos

图像观测

前视图像

数据类型: 视频
分辨率: 1080×1920×3
视频编码: av1
像素格式: yuv420p
帧率: 30 FPS
是否为深度图: 否
是否包含音频: 否

鱼眼夹爪图像

数据类型: 视频
分辨率: 480×640×3
视频编码: av1
像素格式: yuv420p
帧率: 30 FPS
是否为深度图: 否
是否包含音频: 否

彩色夹爪图像

数据类型: 视频
分辨率: 480×640×3
视频编码: av1
像素格式: yuv420p
帧率: 30 FPS
是否为深度图: 否
是否包含音频: 否

索引特征

时间戳: float32, 维度1
帧索引: int64, 维度1
情节索引: int64, 维度1
索引: int64, 维度1
任务索引: int64, 维度1

文件结构

数据文件路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
视频文件路径: videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

主页: 待补充
论文: 待补充
BibTeX引用: 待补充

搜集汇总

数据集介绍

构建方式

在机器人技术领域，record-test-6数据集通过LeRobot框架精心构建，采用xarm末端执行器进行数据采集。该数据集包含17个完整情节，总计7598帧数据，以30帧每秒的速率记录。数据以分块形式存储于Parquet文件中，每块容量为1000帧，确保了高效的数据管理与访问。采集过程中同步记录了机器人的动作状态与多视角视觉信息，为机器人控制研究提供了丰富的实验素材。

特点

该数据集在机器人操作任务中展现出多维度的数据特征，其动作与观测状态均以7维浮点向量表征，涵盖空间位置、姿态及夹爪控制参数。视觉数据方面，集成了前视、鱼眼夹爪和彩色夹爪三种高清视频流，分辨率分别达到1080p与480p，并采用AV1编码压缩。数据结构层次分明，通过时间戳、帧索引和情节索引实现精准时序对齐，支持复杂的机器学习模型训练与分析需求。

使用方法

研究人员可通过解析Parquet格式的数据文件直接访问结构化数据，利用帧索引机制实现快速数据定位。视频数据存储于独立路径，与动作观测数据形成时空映射关系。该数据集专为训练集设计，涵盖全部17个情节，适用于端到端机器人策略学习、行为克隆等任务。使用者需配置相应解码器处理视频流，并结合特征字典中的维度信息构建数据预处理流程。

背景与挑战

背景概述

机器人操作领域的数据集构建对于推动智能体在真实环境中的交互能力具有关键意义。record-test-6数据集基于LeRobot开源框架开发，专注于末端执行器控制任务，其数据结构包含多模态观测信息与精确动作指令，为机器人学习算法提供了丰富的训练资源。该数据集采用xarm机械臂平台，通过高分辨率视觉传感器与状态反馈系统记录操作过程，旨在解决复杂场景下的机器人抓取与位姿控制问题，对强化学习与模仿学习在机器人领域的应用具有重要支撑作用。

当前挑战

该数据集针对机器人操作任务中的高维状态空间与动作规划难题，需处理多传感器数据融合与实时控制指令生成的复杂性。构建过程中面临多视角视频同步存储的技术挑战，涉及大规模并行数据采集与高效压缩算法的实现；同时数据标注需要确保动作轨迹与视觉观测的时间对齐精度，这对硬件同步与软件架构提出了严格要求。

常用场景

经典使用场景

在机器人学习领域，该数据集通过记录机械臂末端执行器的运动轨迹与多视角视觉信息，为模仿学习算法提供了丰富的训练样本。其包含的7维动作空间和多种传感器数据，特别适用于训练端到端的机器人控制策略，能够有效学习从视觉输入到动作输出的映射关系。

解决学术问题

该数据集主要解决了机器人领域中的动作表示学习和多模态感知融合问题。通过提供精确的末端执行器位姿数据和同步的多视角图像，研究者能够深入探索视觉-动作对应关系，为机器人技能迁移和泛化能力的研究提供了重要数据支撑，推动了基于学习的机器人控制方法的发展。

衍生相关工作

基于此类机器人数据集，学术界衍生出了多种深度强化学习框架和视觉伺服控制方法。这些工作充分利用了多模态数据的优势，开发了从演示中学习复杂技能的新算法，推动了机器人学习从仿真到真实环境的迁移，为智能机器人系统的实际部署奠定了理论基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集