XYYX2333/sadiq_record_data_test
收藏Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/XYYX2333/sadiq_record_data_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过LeRobot创建的,主要用于机器人技术领域。数据集包含3个总片段,900帧,1个总任务,数据文件大小为100MB,视频文件大小为200MB,帧率为30fps。数据集的特征包括动作、观察状态、前视图像、时间戳、帧索引、片段索引、索引和任务索引等。动作和观察状态的特征包括肩部旋转、肩部提升、肘部弯曲、腕部弯曲、腕部旋转和夹持器位置。前视图像的分辨率为1080x1920,3通道,视频编解码器为av1,像素格式为yuv420p,无音频。
This dataset was created using LeRobot and is primarily used in the field of robotics. The dataset contains a total of 3 episodes, 900 frames, and 1 task, with data files sized at 100MB and video files at 200MB, running at 30fps. The dataset features include actions, observation states, front-view images, timestamps, frame indices, episode indices, indices, and task indices. The action and observation state features include shoulder pan position, shoulder lift position, elbow flex position, wrist flex position, wrist roll position, and gripper position. The front-view images have a resolution of 1080x1920 with 3 channels, using the av1 video codec, yuv420p pixel format, and no audio.
提供机构:
XYYX2333
搜集汇总
数据集介绍

构建方式
该数据集基于LeRobot框架构建,是面向机器人操控领域的记录数据集合。数据通过操作so_follower型机器人进行采集,共包含3个完整episode,总计900帧画面,覆盖单一任务类型。数据以parquet格式存储于chunk目录下,视频数据则采用av1编码的mp4格式存放于独立文件夹中,实现了结构化与高效的存储管理。
特点
数据集具有多模态融合的显著特点,同步记录了6维关节动作指令(如shoulder_pan.pos等)、对应的观测状态以及高分辨率(1920×1080)的正面RGB视频流,帧率统一为30fps。数据量精细划分,其中parquet文件约100MB,视频文件约200MB,时间戳、帧索引与episode索引等元信息完备,便于时序对齐与分析。
使用方法
用户可通过LeRobot可视化工具直接在HuggingFace Spaces中浏览数据集内容。在编程使用时,借助LeRobot库的API即可加载parquet数据与关联视频,获取action、observation.state及observation.images.front等关键字段。数据集已预设train分片(覆盖全部3个episode),适用于机器人模仿学习等场景的模型训练与评估。
背景与挑战
背景概述
该数据集由用户XYYX2333于近期创建,依托于HuggingFace的LeRobot开源框架,专注于机器人操作领域的数据采集与基准测试。数据集以so_follower型机器人为核心载体,记录了3段、共计900帧的操控轨迹,涵盖6维动作空间(包括肩部旋转、肘部屈伸、腕部转动及夹爪开合等关节运动),并以30帧每秒的高分辨率视频(1920×1080)同步捕获前端视觉观测信息。其核心研究问题在于为机器人模仿学习与行为克隆提供多模态对齐的训练样本,尤其面向从人类演示到机器人动作映射的迁移学习场景。作为LeRobot生态中的小规模示例型数据集,它旨在验证基于parquet与mp4混合存储的高效数据管线,并推动机器人领域标准化数据格式的普及。尽管规模有限,但其结构化的特征设计为后续大规模、多任务机器人数据集的建设奠定了可复用的范式基础。
当前挑战
该数据集所面对的领域挑战主要源于机器人学习的复杂表征需求。首先,硬件层面,so_follower机械臂的6自由度连续空间控制与末端夹爪的精细力控之间需要高度协调,而当前数据仅包含位置信号,缺失力反馈与触觉信息,限制了任务泛化能力。其次,观测模态上,单目RGB图像存在深度模糊性与遮挡问题,且缺乏多视角融合机制,导致从高维视觉输入解耦出精确的关节状态成为显著难点。构建过程中,数据集面临数据规模与多样性的矛盾:仅3个演示片段(总时长30秒)远不足以覆盖机器人操控中的随机扰动与长尾分布,且未提供多任务标签或环境变化参数,易导致模型过拟合至特定轨迹。此外,parquet与视频文件的分块存储虽利于大规模部署,但对小规模样本而言,其索引与加载开销可能掩盖数据本身的信息量不足问题,亟需结合数据增强与迁移学习策略来弥补稀疏性引发的训练不稳定挑战。
常用场景
经典使用场景
在机器人学习与操控领域,sadiq_record_data_test数据集为模仿学习与行为克隆算法提供了精密的训练与验证载体。该数据集采集自so_follower型机器人,包含3个完整操控轨迹、共计900帧的高频时序数据,同步记录6维关节动作与状态信息,并辅以1920×1080分辨率的前置摄像头视频流。研究者可借此构建从视觉输入到动作输出的端到端映射模型,尤其适用于学习复杂抓取与精密装配等任务。数据集遵循LeRobot标准格式,便于直接接入主流机器人学习框架,成为验证新型策略网络结构的理想基石。
衍生相关工作
基于该数据集的特性,一系列衍生的机器人学习工作得以展开。例如,研究者可将其用于探索离线强化学习算法在真实机器人轨迹上的性能边界,或者开展跨任务迁移学习研究,测试预训练模型在不同操控对象上的适应能力。数据集的标准格式还催生了多任务模仿学习框架的构建,其中示范轨迹被用于初始化策略网络,再结合在线微调以实现更高效的技能获取。同时,高分辨率视频数据为视觉预训练与特征提取模块的评估提供了基准,推动了诸如时间对比学习等自监督方法在机器人操控领域的改进与扩展。
数据集最近研究
最新研究方向
该数据集基于LeRobot框架构建,聚焦于机器人操作领域的模仿学习与技能泛化研究。当前前沿方向集中在利用小样本学习与多模态感知融合,通过少量高质量示教轨迹(仅3个完整回合、900帧数据),驱动机器人完成精准的6自由度关节控制任务(如肩部、肘部、腕部及夹爪的协同运动)。研究热点包括基于视觉-动作联合编码的端到端策略训练,尤其在高清视觉流(1080P、30fps)与动作序列的时序对齐中探索鲁棒建模。其意义在于验证当训练数据规模极度受限时,结合Av1编码视频与Parquet结构化存储的流水线能否催生可复用的机械臂运动先验,为制造业精密装配、医疗手术辅助等场景提供低成本、快速部署的解决方案。
以上内容由遇见数据集搜集并总结生成



