assemble_box_with_phone_stand0410
收藏Hugging Face2026-04-10 更新2026-04-11 收录
下载链接:
https://huggingface.co/datasets/Xense/assemble_box_with_phone_stand0410
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是使用LeRobot创建的,专注于机器人技术领域。数据集采用Apache-2.0许可证,包含40个总片段,396792帧数据,涉及1个任务。数据以parquet文件形式存储,总数据文件大小为100MB,视频文件大小为500MB,帧率为30fps。数据集包含训练集(0:40)。数据集结构包括动作数据(20维浮点数数组,包含左右机械臂TCP位置和姿态、左右夹爪位置)、观察状态(与动作数据相同)、多个视角的图像观察数据(头部、左右手腕、左右触觉传感器的视频数据,分辨率和格式详细说明)以及时间戳、帧索引、片段索引等元数据。适用于机器人控制、行为学习等任务。
创建时间:
2026-04-10
搜集汇总
数据集介绍

构建方式
在机器人操作任务数据集的构建领域,assemble_box_with_phone_stand0410数据集依托LeRobot平台精心构建。该数据集通过双臂柔性机器人bi_flexiv_rizon4_rt执行单一装配任务,采集了40个完整操作片段,总计近40万帧数据。数据以分块形式存储于Parquet文件中,每块包含1000帧,确保了高效的数据管理与读取。同步录制的多视角视频数据,包括头部、腕部及触觉传感器影像,以30帧每秒的速率编码为H.264格式,与机器人的末端执行器位姿、夹爪状态等动作观测数据精确对齐,形成了时序一致的多模态记录。
特点
该数据集在机器人学习领域展现出鲜明的多模态与高维度特性。其核心特征在于同步整合了机器人的动作指令与状态观测,动作空间涵盖左右末端执行器的六维位姿及夹爪开合度,共20个浮点维度。观测部分则提供了丰富的视觉信息,包括头部固定视角、左右腕部视角以及四路触觉传感器影像,分辨率各异,共同构建了任务执行的立体感知环境。数据集结构规整,所有数据均附带时间戳、帧索引与片段索引,支持精确的时序分析与跨模态对齐,为模仿学习与强化学习算法提供了坚实的数据基础。
使用方法
对于旨在利用该数据集的研究者,其使用方法清晰而直接。数据集已预先划分为训练集,包含全部40个操作片段。用户可通过LeRobot库或兼容的数据加载工具,依据提供的路径模板读取分块的Parquet数据文件。数据集中`action`与`observation`字段分别对应机器人的输出动作与输入观测,可直接用于训练行为克隆或离线强化学习模型。多路视频数据存储于独立MP4文件中,可通过视频键与数据索引进行关联访问。研究者可依据`frame_index`和`episode_index`重建完整任务轨迹,或提取特定时刻的多传感器观测以进行细致的任务分析。
背景与挑战
背景概述
在机器人操作领域,双手机器人执行复杂装配任务的研究正逐渐成为前沿热点。assemble_box_with_phone_stand0410数据集由HuggingFace的LeRobot项目团队创建,旨在推动机器人模仿学习与强化学习算法的发展。该数据集聚焦于双手机器人装配手机支架至盒子的精细操作任务,通过记录双机械臂的末端执行器位姿、夹爪状态及多视角视觉与触觉传感数据,为研究高维状态空间下的策略学习提供了宝贵资源。其构建依托于Flexiv Rizon 4机器人平台,体现了工业级硬件与开源算法框架的结合,对提升机器人在非结构化环境中的自主操作能力具有重要参考价值。
当前挑战
该数据集致力于解决机器人操作中多模态感知与精细动作协同的挑战,尤其在双手机器人装配这类需高精度协调的任务中,如何从视觉、触觉及状态观测数据中学习鲁棒策略仍是一大难题。构建过程中,数据采集面临传感器同步、高维数据存储与处理以及任务执行一致性的挑战,例如确保多路视频流与机械臂状态的时间对齐,并维持大规模数据(如近40万帧)的完整性与可访问性。此外,数据标注与任务泛化能力的缺乏也可能限制其在更广泛操作场景中的应用。
常用场景
经典使用场景
在机器人操作领域,assemble_box_with_phone_stand0410数据集为双臂机器人执行精细装配任务提供了丰富的多模态数据资源。该数据集通过记录双手机器人组装盒子和手机支架的过程,捕捉了高维度的动作指令、状态观测以及多视角视觉信息,包括头部、腕部和触觉传感器的视频流。这些数据为机器人模仿学习、强化学习算法的训练与评估奠定了坚实基础,尤其适用于研究复杂操作序列的生成与协调。
衍生相关工作
围绕该数据集,衍生出了一系列专注于多模态机器人学习的经典研究工作。这些工作探索了基于视觉与触觉融合的动作生成策略、端到端的模仿学习框架,以及跨任务迁移学习的方法。相关成果不仅丰富了机器人操作的数据集生态,也为LeRobot等开源平台提供了关键基准,推动了社区在双臂操作与复杂任务规划方面的持续创新。
数据集最近研究
最新研究方向
在机器人操作领域,双手机器人执行复杂装配任务已成为前沿研究热点。该数据集聚焦于使用双手机器人组装带有手机支架的盒子,其多模态数据融合了视觉、触觉与运动轨迹信息,为模仿学习与强化学习算法提供了丰富训练素材。当前研究趋势正探索如何利用此类高维感官数据提升机器人对精细操作的理解与泛化能力,尤其在家庭服务与工业自动化场景中,实现更灵巧、自适应的人机协作。数据集通过LeRobot平台构建,体现了开源社区推动机器人技术民主化的努力,其标准化格式促进了算法比较与复现,加速了通用操作智能体的发展进程。
以上内容由遇见数据集搜集并总结生成



