XYYX2333/sadiq_record_data_v2
收藏Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/XYYX2333/sadiq_record_data_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由LeRobot创建,主要用于机器人领域。数据集包含50个episodes,共21490帧,帧率为30fps。数据以parquet格式存储,视频以mp4格式存储。特征包括动作(6个关节位置)、观察状态(6个关节位置)、前视图像(1080x1920分辨率,3通道)、时间戳、帧索引、episode索引等。数据集总大小为100MB(数据文件)和200MB(视频文件)。
This dataset was created by LeRobot and is primarily used in the robotics field. It contains 50 episodes with a total of 21,490 frames at 30fps. The data is stored in parquet format, and the videos are in mp4 format. Features include actions (6 joint positions), observation states (6 joint positions), front-view images (1080x1920 resolution, 3 channels), timestamps, frame indices, episode indices, etc. The total size of the dataset is 100MB (data files) and 200MB (video files).
提供机构:
XYYX2333
搜集汇总
数据集介绍

构建方式
该数据集依托于LeRobot框架构建,旨在服务于机器人学习领域的研究。数据集由单臂协作机器人so_follower在真实环境下采集,共计包含50个完整操作回合,总帧数达21490帧,覆盖单一操作任务。数据以Parquet格式存储,并辅以MP4格式的高清视频记录,其中视频分辨率为1080×1920,编码采用AV1。数据文件按chunk分块组织,每块容量1000帧,方便高效加载与处理。所有数据均以训练集形式划分,不设验证与测试子集,便于直接用于行为克隆等模仿学习算法的训练流程。
特点
数据集的核心特色在于其多维度的观测与动作信息对齐结构。动作与观测状态均包含六维关节空间数据(肩部、肘部、腕部及夹爪位置),呈现完整的机械臂运动学信息。同时,每一时间步均记录高清前视图像帧,形成视觉-状态-动作的三元组对应关系。数据集具备高采样频率(30 FPS),且视频与数值数据在时间轴上严格对齐,支持同步处理。此外,数据集中包含了帧索引、回合索引与时间戳等元信息,便于时序建模与回合级分析。
使用方法
数据集可通过LeRobot框架提供的标准化接口直接加载与可视化。研究者可调用LeRobot的数据集加载工具读取Parquet与视频文件,快速获得包含图像、关节状态与动作指令的迭代器。建议在行为克隆或基于视觉的模仿学习任务中使用,将观测图像与状态作为输入,动作序列作为监督信号。由于数据以训练集形式统一组织,使用时无需额外划分,直接用于模型训练即可。可视化工具也可通过HuggingFace Space在线访问,便于直观检查数据质量与任务表现。
背景与挑战
背景概述
在机器人学习领域,模仿学习作为从人类示范中习得复杂技能的核心范式,长期以来受限于高质量、多模态数据的匮乏。sadiq_record_data_v2数据集由XYYX2333团队基于LeRobot框架创建,旨在为机器人操控任务提供标准化数据资源。该数据集聚焦于so_follower型机械臂的精细操作任务,记录了6维关节空间下的动作轨迹与状态信息,并辅以高分辨率(1920×1080)视觉观测数据,共计50个回合、21490帧,以30帧/秒的采样频率精准捕捉动态过程。数据规模达300MB,涵盖图像与结构化动作序列,为机器人领域的模仿学习研究注入了宝贵的数据驱动力,尤其在小样本泛化、跨任务迁移等前沿方向具有显著的支撑价值。
当前挑战
该数据集所应对的核心领域挑战在于:如何从有限的示范数据中泛化出鲁棒的操作策略,避免过拟合至噪声轨迹或特定环境配置。机器人操控涉及高维连续动作空间与复杂视觉-运动耦合,传统方法常因数据量不足或模态单一而失效。sadiq_record_data_v2虽提供了精准的关节角度与高清视觉流,但其单任务设计(仅含一种操作任务)和有限回合数(50个)构成了显著局限性。此外,构建过程中需解决多传感器数据的时间同步与空间对齐难题,尤其是摄像头视角、机械臂运动学与执行器反馈之间的实时校准。数据存储采用分块式parquet格式与av1视频编码,虽提升了压缩效率,却对数据加载与预处理管线提出了额外的计算开销要求。这些挑战共同指向了从数据采集到算法部署全链条中仍需突破的工程与科学瓶颈。
常用场景
经典使用场景
在机器人学习与操控领域,sadiq_record_data_v2数据集为模仿学习、行为克隆以及基于视觉的运动规划等经典研究提供了坚实的数据基础。该数据集记录了SO-Follower机械臂在特定任务下的完整运行轨迹,包含高分辨率视觉观测(1920×1080,30 FPS)、关节状态与动作序列。研究者可将此数据集用于训练端到端的机器人操控策略,借助其长达50个回合、超过2万帧的连续数据,探索从视觉输入到动作输出的映射关系,推动数据驱动型机器人控制方法的发展。
解决学术问题
该数据集回应了机器人领域中数据匮乏与可重复性不足的学术困境。传统机器人研究受限于昂贵的硬件与复杂的实验环境,难以获得大规模、标准化的训练数据。sadiq_record_data_v2通过标准化格式(如LeRobot规范)开源共享50回合精细操控数据,为少样本学习、泛化能力评估以及跨机器人迁移研究提供了统一基准,从而加速了从任务特定编程到通用操控策略的范式转变,提升了学术研究的可复现性与效率。
衍生相关工作
此数据集的发布催生了一系列在数据高效操控与跨具身迁移方面的重要工作。基于其标准化的LeRobot格式,衍生出利用扩散策略(Diffusion Policy)进行动作生成、通过预训练视觉编码器(如ResNet)提取特征以增强泛化的相关研究。同时,该数据常被用于构建多任务基准、验证对比学习在机器人状态表示中的应用,以及开发离线强化学习中的行为克隆与保守Q学习算法变体,推动了稳健策略学习理论的工程实践。
以上内容由遇见数据集搜集并总结生成



