five

KS325/place-doll-lower-r1_val

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/KS325/place-doll-lower-r1_val
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用LeRobot创建的机器人相关数据集,包含8个episodes和6873帧数据,涉及1个任务。数据集包含动作、观测状态、两个摄像头的图像数据、时间戳等特征。动作和观测状态包括shoulder_pan.pos、shoulder_lift.pos、elbow_flex.pos、wrist_flex.pos、wrist_roll.pos和gripper.pos六个维度。图像数据来自两个摄像头,分辨率为480x640,帧率为30fps。数据集总大小为100MB(数据文件)和200MB(视频文件),采用apache-2.0许可证。

This dataset was created using LeRobot and belongs to the robotics category. It consists of 8 episodes, 6873 frames, and 1 task. The dataset includes features such as actions, observation states, images from two cameras, timestamps, etc. Actions and observation states include six dimensions: shoulder_pan.pos, shoulder_lift.pos, elbow_flex.pos, wrist_flex.pos, wrist_roll.pos, and gripper.pos. The image data comes from two cameras with a resolution of 480x640 and a frame rate of 30fps. The total size of the dataset is 100MB (data files) and 200MB (video files), and it is licensed under apache-2.0.
提供机构:
KS325
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人学习与操作领域,数据集的构建质量直接决定了模型学习的效能与泛化能力。该数据集基于LeRobot框架构建,聚焦于“放置玩偶”这一精细操作任务。数据采集自名为“so_follower”的机器人平台,以30帧每秒的速率记录其执行任务的过程。整个数据集包含8个完整回合(episode),累计6873帧动作状态与视觉观测数据。动作与状态空间均涵盖肩部旋转、肩部升降、肘部弯曲、腕部弯曲、腕部旋转及夹爪位置共六个自由度,以float32精度存储。同时,两路摄像头(camera1与camera2)同步采集640×480像素的彩色视频流,采用AV1编码压缩,从而实现了高保真、低冗余的多模态数据记录。
特点
该数据集最显著的特点在于其精细化的任务设定与紧凑高效的数据结构。仅包含单一“放置玩偶”任务,使得数据集具有极高的任务专注度,适合用于验证或微调特定技能的模仿学习算法。数据采用分块存储策略,每个chunk包含1000帧,便于大规模分布式加载与内存管理。总计约100MB的parquet数据文件与200MB的视频文件,在保证充分示范信息的同时,将存储开销控制在合理范围。此外,数据集提供了完整的时间戳、帧索引、回合索引与任务索引,极大便利了时序建模与回合级数据划分。训练集覆盖全部8个回合的数据划分方式,适合无需验证集的小样本学习场景。
使用方法
该数据集的使用遵循LeRobot生态的标准化流程,具备良好的可复现性与易用性。用户可通过HuggingFace上的可视化工具直接预览数据集中的图像序列与动作记录,快速把握示范行为风格。在导入方面,推荐使用LeRobot库的dataset加载接口,指定数据路径后即可自动将parquet表格与MP4视频文件关联,构建包含动作、状态与视觉观测的多模态数据加载器。由于数据集特征空间中已明确定义了动作(action)、观测状态(observation.state)及图像(observation.images)各字段的维度与类型,用户可直接提取这些键值对用于模型训练,无需额外预处理。借助LeRobot提供的回放与评估工具,还可轻松将模型预测结果与示范数据进行对比分析。
背景与挑战
背景概述
在机器人操作领域,模仿学习作为一种从人类示范中习得复杂技能的方法,近年来取得了显著进展。place-doll-lower-r1_val数据集由KS325团队基于LeRobot框架创建,旨在为机器人精细操作任务提供标准化的训练与验证资源。该数据集聚焦于“放置玩偶”这一具体动作,记录了机器人从抓取到放置的完整操作序列,包含约6873帧、8个示范片段,动作空间涵盖肩部、肘部、腕部及夹爪的6自由度控制。通过采集高分辨率视觉与状态信息,该数据集为研究机器人灵巧操作、运动规划与视觉闭环控制提供了关键基准,推动了机器人从仿真环境向真实场景的技能迁移研究。
当前挑战
该数据集面临的核心挑战在于如何应对真实环境中物体姿态与力接触的显著不确定性。具体而言,玩偶放置任务要求机器人精确感知目标物体的几何形状与空间位置,并在执行过程中灵活调整夹爪姿态以避免滑脱或碰撞,这对视觉感知的鲁棒性与运动控制的柔顺性提出了极高要求。此外,该数据集仅包含8个示范片段,样本量有限,导致模仿学习模型可能面临过拟合风险,难以泛化至未见过的放置场景或不同材质的玩偶。数据集构建过程中,需克服多自由度机械臂与夹爪的同步校准难题,以及从相机图像中高效提取6维位姿信息的计算瓶颈,这些均构成了当前技术发展的关键制约因素。
常用场景
经典使用场景
在机器人学习领域,精细操作任务的模仿学习是推动智能体从实验室走向真实环境的关键一环。place-doll-lower-r1_val数据集专为机器人抓取与放置任务设计,记录了将玩偶准确放置在特定位置的操作轨迹,包含6自由度关节角度、夹爪状态以及双视角视觉观测。研究者可基于此数据集训练模仿学习模型,通过行为克隆或逆强化学习方法,使机器人学会从视觉输入直接映射到关节动作的连续控制策略。该数据集以30帧/秒的高分辨率视频和精确的物理状态序列,为研究非结构化场景下的灵巧操作提供了标准化评估基准。
实际应用
在智能制造与家庭服务场景中,该数据集训练的模型可直接部署于协作机械臂,实现物件的拾取或归位整理。例如,在电子元件装配线上,机器人可依据视觉反馈调整夹持姿态完成精密安装;在养老助残环境中,机械臂能学习递送物品时的力控与避障。数据集包含的双目视觉信息尤其适用于对深度感知要求高的场景,如从杂乱桌面分拣特定目标。其标准化格式与LeRobot框架的兼容性,也降低了从仿真迁移到实体机器人的工程门槛。
衍生相关工作
基于该数据格式与任务定义,衍生出一系列重要研究方向。模仿学习领域涌现出基于扩散策略的动作生成方法,利用时序模型捕捉细腻的操作波动;在表示学习方面,研究者尝试从多视角视频中解耦物体姿态与机械臂状态,提升对未知初始位置的适应性。此外,该数据集促进了对动作分块策略的探索,通过长时序动作切片解决复合任务的累积误差问题。这些工作共同推动了具身智能中数据驱动策略的标准化与可复现性发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作