five

zaku-record-test

收藏
Hugging Face2026-05-15 更新2026-05-16 收录
下载链接:
https://huggingface.co/datasets/criceldesign/zaku-record-test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot工具创建的机器人领域数据集,采用Apache 2.0许可证。数据集包含机器人操作相关的多模态数据,具体针对Zaku机器人型号。数据以Parquet文件格式存储,并包含视频文件。数据集中每个样本包含以下特征:机器人的动作指令(7个关节的位置控制)、观测状态(7个关节的当前位置)、来自腕部和前部摄像头的视觉观测(均为480x640分辨率的RGB视频帧)、时间戳、帧索引、episode索引、样本索引和任务索引。数据集采用分块存储结构,每个块包含1000个样本,数据文件总大小约为100MB,视频文件总大小约为200MB,采集帧率为30fps。该数据集适用于机器人学习、模仿学习、强化学习等任务,特别是涉及多模态感知和关节控制的研究。

This dataset is a robotics domain dataset created using the LeRobot tool under the Apache 2.0 license. It contains multimodal data related to robot operations, specifically for the Zaku robot model. The data is stored in Parquet file format and includes video files. Each sample in the dataset consists of the following features: robot action commands (position control for 7 joints), observation states (current positions of 7 joints), visual observations from wrist and front cameras (both RGB video frames at 480x640 resolution), timestamp, frame index, episode index, sample index, and task index. The dataset uses a chunked storage structure, with each chunk containing 1000 samples. The total data file size is approximately 100MB, and the total video file size is approximately 200MB, with a collection frame rate of 30fps. This dataset is suitable for tasks such as robot learning, imitation learning, and reinforcement learning, particularly for research involving multimodal perception and joint control.
创建时间:
2026-05-12
原始信息汇总

数据集概述

  • 数据集名称:zaku-record-test
  • 许可证:Apache-2.0
  • 任务类别:机器人学(robotics)
  • 标签:LeRobot
  • 创建工具:LeRobot

数据集结构

  • 代码库版本:v3.0
  • 帧率:30 FPS
  • 机器人类型:zaku_robot

数据特征

特征名称 数据类型 形状 说明
action float32 (7,) 7个关节的位置动作
observation.state float32 (7,) 7个关节的位置状态
observation.images.wrist video (480, 640, 3) 腕部摄像头视频(AV1编码,30 FPS)
observation.images.front video (480, 640, 3) 前置摄像头视频(AV1编码,30 FPS)
timestamp float32 (1,) 时间戳
frame_index int64 (1,) 帧索引
episode_index int64 (1,) 片段索引
index int64 (1,) 索引
task_index int64 (1,) 任务索引

数据规模

  • 总片段数:5
  • 总帧数:4,916
  • 总任务数:1
  • 分块大小:1,000
  • 数据文件大小:约 100 MB
  • 视频文件大小:约 200 MB

数据分割

  • 训练集:索引 0 至 4 的片段(共5个片段)

文件路径格式

  • 数据文件data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
  • 视频文件videos/{video_key}/chunk-{chunk_index:03d}/file-{file_index:03d}.mp4

引用信息

  • 主页:待补充
  • 论文:待补充
  • BibTeX:待补充
搜集汇总
数据集介绍
main_image_url
构建方式
zaku-record-test数据集基于LeRobot框架构建,专为机器人领域设计。数据采集自zaku_robot机器人,通过记录7个关节的位置信息作为动作与观测状态,同时利用腕部和前方摄像头以每秒30帧的帧率捕获分辨率为480x640的彩色视频。数据以Parquet格式存储,并附有压缩后的AV1编码视频文件,整体包含5个完整片段、4916帧画面及单一任务类型。数据集被划分为训练集使用,所有数据文件遵循统一的命名规则组织在chunk子目录中。
特点
该数据集的一大特色在于其多模态融合特性,同时提供关节角度的低维状态空间与高维视觉输入,为模仿学习等机器人控制算法提供丰富信号。视频数据采用高效AV1编码压缩,在保持画质的同时有效减小存储占用。数据集结构清晰,包含时间戳、帧索引、片段索引及任务标签等元信息,便于按帧或按片段灵活检索。凭借30Hz的采样频率与总计4916帧的规模,数据集兼具时间分辨率与数据量上的平衡。
使用方法
利用LeRobot工具链可便捷加载此数据集。用户可通过HuggingFace上的可视化空间直接预览数据内容。在训练流程中,推荐使用官方提供的dataset loader将Parquet数值数据与MP4视频文件按索引对齐,输出结构化的动作、观测图像及状态张量。数据处理时可按片段索引迭代获取完整轨迹,或基于帧索引进行随机采样,以适用于行为克隆或强化学习等不同算法范式的需求。
背景与挑战
背景概述
zaku-record-test数据集诞生于机器人学习领域对高质量、多模态交互数据日益增长的需求之中,由Hugging Face社区的LeRobot项目团队创建,旨在为机器人操作学习提供标准化数据基准。该数据集聚焦于Zaku机器人的关节控制与视觉感知同步问题,通过记录30Hz频率下的7自由度关节状态、动作指令以及来自腕部和前部的双路摄像头视频流,构建了覆盖单一任务的5个回合、近5000帧的精细交互样本。作为LeRobot生态系统的组成部分,它推动了机器人模仿学习与强化学习从模拟环境向真实物理世界的迁移,为验证算法在低样本、高维度观测下的鲁棒性提供了关键测试平台。
当前挑战
数据集所应对的核心领域挑战在于机器人操作任务中的具身智能泛化难题,特别是如何从有限回合的高维视觉与关节状态数据中提取可迁移的操控策略,避免模型对特定环境或初始条件的过拟合。构建过程中则面临多项技术挑战:首先,多模态数据的同步采集要求高精度时间戳对齐,稍有偏差即会破坏状态-动作映射关系;其次,视频数据采用AV1编码以平衡质量与存储,但解码实时性可能影响后续处理效率;此外,总帧数仅4916且任务单一,对数据增强与领域随机化技术提出了更高依赖,以确保模型在真实部署时的适应能力。
常用场景
经典使用场景
在机器人学习与自主操控的探索疆域中,zaku-record-test数据集作为基于LeRobot框架构建的示范性资源,其经典应用聚焦于机械臂的模仿学习训练。该数据集记录了5个完整操作片段的4916帧连续时序信息,涵盖7自由度关节位置状态与动作轨迹,并同步采集了腕部与前方视角的高清视觉流(480×640分辨率,30帧/秒)。研究者可借此训练端到端的视觉-运动策略,让机器人通过观摩有限的示范数据,习得精细的操作技能,例如抓取、装配或精准定位等任务。这一过程为从人类示教到机器人自主执行的迁移学习提供了标准化的数据基石。
实际应用
当目光投向产业落地的现实土壤,zaku-record-test数据集展现了其在自动化精密装配与协作机器人领域的广阔应用前景。在实际场景中,工程师可借助此数据集训练机械臂完成诸如电子元件焊接、医疗手术器械递送等高一致性要求的重复性任务。由于数据采集基于真实的zaku_robot硬件平台,经过训练的模型能够直接部署于生产线上,减少了对昂贵的人工示教编程的依赖。此外,该数据集还支持人机协作环境下的技能快速迭代,例如通过新增少量示范片段即可更新机器人的作业策略,从而在柔性制造与智慧仓储等动态场景中展现出卓越的适应性与效率。
衍生相关工作
围绕zaku-record-test数据集,一系列具有启发性的衍生工作如雨后春笋般涌现。研究社区基于其标准化的数据格式与多模态特征,成功复现并优化了经典的扩散策略(Diffusion Policy)与动作分块变换器(Action Chunking Transformer)等前沿算法。这些工作不仅验证了在有限示范数据下(仅5个片段)训练稳健操控策略的可行性,还进一步探索了如何通过数据增强与跨领域预训练来压缩对大规模人类示教的依赖。尤为值得注意的是,该数据集还催生了面向低样本场景的元学习框架评估,为机器人技能的高效迁移与零样本适应开辟了新的研究方向,其影响正持续渗透至人形机器人操控与灵巧手研究的广阔版图。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作