five

earbud_case_sequential_insertion_teleop

收藏
Hugging Face2026-05-13 更新2026-05-15 收录
下载链接:
https://huggingface.co/datasets/Xense/earbud_case_sequential_insertion_teleop
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于机器人学习的多模态演示数据集,基于LeRobot框架创建,采集自名为bi_flexiv_rizon4_rt的双臂机器人系统。它包含50个完整的任务执行序列(episodes),总计331,391个时间步(帧),所有数据标记为训练集。数据以分块形式存储,包括约100 MB的表格数据(Parquet格式)和500 MB的视频数据(MP4格式),采样频率为30 Hz。核心特征包括:1) 动作(action):20维浮点向量,控制左右机械臂末端执行器的位置、姿态(6个自由度)和夹爪开合位置;2) 状态观测(observation.state):20维浮点向量,表示机器人当前本体状态;3) 图像观测(observation.images):来自七个同步RGB视频流的视觉数据,包括头部摄像头、左右腕部摄像头以及左右机械臂上的触觉传感器摄像头,分辨率分别为640x480和700x400;4) 索引信息:如时间戳、帧索引、episode索引和任务索引等元数据。该数据集适用于机器人模仿学习、强化学习、多模态策略学习等任务,为机器人感知与控制融合研究提供真实世界数据支持。

This dataset is a multimodal demonstration dataset for robot learning, created using the LeRobot framework and collected from a dual-arm robot system named bi_flexiv_rizon4_rt. It contains 50 complete task execution episodes, totaling 331,391 timesteps (frames), all labeled as training data. The data is stored in chunks, including approximately 100 MB of tabular data in Parquet format and 500 MB of video data in MP4 format, with a sampling frequency of 30 Hz. Key features include: 1) Action: a 20-dimensional floating-point vector controlling the position, orientation (6 degrees of freedom), and gripper opening/closing of the left and right robot arm end-effectors; 2) Observation.state: a 20-dimensional floating-point vector representing the robots current proprioceptive state; 3) Observation.images: synchronized RGB video streams from seven different perspectives, including head cameras, left and right wrist cameras, and tactile sensor cameras on each arm, with resolutions of 640x480 and 700x400 respectively; 4) Index information: metadata such as timestamps, frame indices, episode indices, and task indices. The dataset is suitable for tasks like robot imitation learning, reinforcement learning, and multimodal policy learning, providing rich real-world data for research on robot perception and control integration.
创建时间:
2026-05-12
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集依托于LeRobot框架构建,旨在记录双机器人协同完成耳机盒顺序插入任务的遥操作过程。数据采集依托双Flexiv Rizon4机械臂平台,通过人工遥操作手法控制机械臂末端执行器,精准执行耳机盒的抓取与顺序插入动作。共计采集了85个演示回合,累积帧数高达448,367帧,确保了数据的连续性与多样性。所有数据均以Apache-2.0许可协议开放,确保可广泛用于学术与工业研究。
特点
该数据集呈现出多模态感知与精细动作控制的融合特性。在观测层面,集成了头部及左右腕部三个视角的RGB视频,以及左右各两路触觉传感器影像,总计七路视觉与触觉信息流,为模仿学习提供了丰富的环境与接触状态感知。动作与状态空间均定义为20维向量,涵盖左右机械臂末端位姿及夹爪开度,完整刻画了双手协同操作的精细控制信号。数据以30帧/秒的采样率记录,保证了时间分辨率与动作连贯性的一致。
使用方法
使用者可通过LeRobot库便捷加载该数据集。数据集结构遵循标准化的chunk分块存储格式,其中动作与状态数据以Parquet文件格式组织,视觉与触觉影像则以H.264编码的MP4视频文件保存。训练集划分涵盖全部85个回合。借助LeRobot提供的Dataset API,开发者能够高效提取批次化的观测-动作对,从而驱动模仿学习或强化学习算法,尤其适用于涉及精密装配与双手协调操作的机器人技能获取任务研究。
背景与挑战
背景概述
在机器人操作领域,精细装配任务如耳机盒的插拔操作,对灵巧性与感知能力提出了极高要求。earbud_case_sequential_insertion_teleop数据集由基于LeRobot框架的团队创建,利用双臂Flexiv Rizon 4机器人通过遥操作采集了85个演示片段,共计逾44万帧时序数据。该数据集聚焦于单任务——耳机盒的顺序插入,旨在为模仿学习与强化学习提供多模态训练样本,包含20维动作与状态空间、头肩及腕部视觉图像,并创新性地集成了左右各两个触觉传感器信息。其发布推动了机器人从示教中学习复杂接触操作的研究,为双臂协同与触觉引导策略的探索提供了标准化基准。
当前挑战
该数据集所面临的挑战主要体现在两个维度。其一,针对的领域问题在于镜像学习中表征刚柔耦合与精确位姿控制的策略,尤其是耳机盒插入过程中对微小力位配合与触觉反馈的依赖,数据驱动的学习方法需克服接触状态突变与次毫米级定位精度的难题。其二,构建过程中需协调高自由度双臂机器人的同步遥操作与多视角视觉、触觉传感器的时空对齐;同时,由于示范采集依赖人类操作者的熟练度,如何确保85个演示片段的动作一致性与覆盖度,以及避免触觉传感器的遮挡与信号噪声,亦构成了显著工程挑战。
常用场景
经典使用场景
在机器人精细操作领域,耳塞盒的序列化插入任务是一项极具代表性的灵巧操作挑战,要求双臂机器人协同完成长程、高精度的装配动作。该数据集基于双臂Flexiv Rizon4机器人平台,通过遥操作采集了85个成功演示片段,涵盖了从耳塞抓取、定位到插入全过程的动作序列与多模态感知数据。每个片段记录了20维的动作指令(包括双臂末端位姿与夹爪开度)以及多视角视觉信息(头部、左右腕部摄像头)和触觉图像,形成了对齐的视觉-触觉-动作三元组。这一设计使得研究者能够利用示教学习范式,训练机器人从感知输入直接映射到精细操作策略,特别适用于研究多阶段任务的时序依赖与多源传感器融合方法。
衍生相关工作
该数据集催生了一系列基于示教学习的机器人操作研究。在算法层面,它被用于验证基于扩散策略的精细动作生成方法,通过将视觉与触觉图像序列作为条件,模型能够预测连续插入动作的力位混合轨迹。在表征学习方面,研究者利用其多模态数据预训练跨感官对齐的编码器,使得机器人可在缺失某一模态时仍保持操作稳定性。此外,该数据集推动了触觉-视觉融合策略的发展,例如通过对比学习对齐触觉图与深度图的嵌入空间,从而在纯视觉场景下也能推断出操作所需的接触状态。这些工作共同构建了从数据采集、策略学习到鲁棒部署的完整技术栈,为复杂装配任务的自动化奠定了基准。
数据集最近研究
最新研究方向
该数据集聚焦于双臂协作机器人在精密装配任务中的应用,通过双Flexiv Rizon 4机械臂的遥操作采集耳机仓顺序插入的高分辨率演示数据。当前前沿研究热点在于融合视觉与触觉多模态感知的模仿学习,数据集提供的头部及双腕相机视角(480×640)、四路触觉图像(400×700)及双机械臂六维力位与夹爪状态信息,为构建端到端的精细操作策略奠定了数据基础。结合LeRobot框架,研究者可探索基于扩散策略或Transformer的动作生成模型,以应对耳机仓插入这类高精度、小间隙的接触式任务。该成果对推动消费电子自动化装配、提升机器人柔顺操控能力具有显著意义,也回应了工业界对复杂装配场景中安全、高效人机协作的迫切需求。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作