R1_Lite_sliding_chair
收藏Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/RoboCOIN/R1_Lite_sliding_chair
下载链接
链接失效反馈官方服务:
资源简介:
R1_Lite_sliding_chair数据集是基于LeRobot格式扩展的,并且完全兼容LeRobot。数据集包含机器人类型、代码库版本、末端执行器类型等信息。数据集覆盖了家庭场景类型,包括抓取、拾取和放置等基本动作。数据集包含丰富的注释,支持多种学习方法。数据集分为训练集和测试集,并按照LeRobot格式组织数据文件。数据集还提供了关于视频、状态、动作、时间信息、注释和运动特征的特征模式。
创建时间:
2025-11-19
原始信息汇总
R1_Lite_sliding_chair 数据集概述
基本信息
- 数据集名称: R1_Lite_sliding_chair
- 许可证: Apache-2.0
- 支持语言: 英语、中文
- 任务类别: 机器人技术
- 标签: RoboCOIN, LeRobot
- 框架范围: 100K-1M
技术规格
- 机器人类型: R1_Lite
- 代码库版本: v2.1
- 末端执行器类型: 两指夹爪
- 帧率: 30 FPS
- 数据集大小: 6.6GB
场景与动作
场景类型
- 家庭环境
原子动作
- 抓取
- 拾取
- 放置
数据集统计
| 指标 | 数值 |
|---|---|
| 总情节数 | 87 |
| 总帧数 | 142290 |
| 总任务数 | 1 |
| 总视频数 | 261 |
| 总分块数 | 1 |
| 分块大小 | 1000 |
任务描述
主要任务
将椅子从桌子下拉出然后放回
子任务
- 无
- 将蓝色椅子从餐桌下拉出
- 将灰色椅子从餐桌下拉出
- 将蓝色椅子推回餐桌下
- 将灰色椅子推回餐桌下
数据特征
视觉观测
- 3个摄像头视角:高位RGB、左手腕RGB、右手腕RGB
- 分辨率:720×1280
- 编码格式:AV1
状态与动作
- 观察状态:14维浮点数(关节位置和夹爪状态)
- 动作:14维浮点数(关节控制指令)
注释信息
- 子任务注释:5维整数
- 场景注释:1维整数
- 末端执行器仿真姿态(状态和动作)
- 末端执行器方向、速度、加速度分类
- 夹爪模式、活动状态、开合尺度
数据组织
文件结构
- 数据文件:Parquet格式,按分块组织
- 视频文件:MP4格式,按摄像头视角组织
- 元数据:JSON格式
数据分割
- 训练集:情节0-86
相关链接
- 主页: https://flagopen.github.io/RoboCOIN/
- 论文: https://arxiv.org/abs/2511.17441
- 代码库: https://github.com/FlagOpen/RoboCOIN
- 问题反馈: https://github.com/FlagOpen/RoboCOIN/issues
作者信息
- 贡献者: RoboCOIN团队
版本历史
- v1.0.0 (2025年11月): 初始发布
引用信息
如需在研究中引用此数据集,请使用提供的BibTeX条目。
搜集汇总
数据集介绍

构建方式
在机器人操作研究领域,数据集的构建质量直接影响算法性能。R1_Lite_sliding_chair数据集通过R1_Lite双指抓取机器人在家庭场景中采集87个完整操作序列,涵盖抓取、拾取、放置等基础动作。数据以分块形式组织为Parquet格式,包含142,290帧30fps的多视角视频流,同步记录14维关节状态与动作向量,并通过6.6GB体量的结构化存储实现LeRobot框架的完全兼容。
特点
该数据集在机器人操作任务中展现出多维度的技术特征。其核心价值在于提供三路720p高清视频流(高位视角与双腕视角),配合12维末端执行器仿真位姿、运动方向分类、速度加速度分级等精细标注。特别值得关注的是抓取器开合尺度连续测量与活动状态标注,为模仿学习与强化学习算法提供了丰富的监督信号。5类子任务分割与场景语义标注进一步增强了数据的可解释性。
使用方法
针对机器人操作算法的开发需求,该数据集支持端到端的训练流程。研究者可通过LeRobot标准接口加载Parquet数据文件,直接获取时空对齐的视觉观测与机器人状态。训练集包含0-86共87个完整操作序列,每个episode均配备多模态传感器数据与分层标注信息。算法开发时可利用末端执行器位姿真值进行动力学建模,或基于子任务标注开展分层强化学习,视频流数据则适用于视觉运动策略的跨模态学习。
背景与挑战
背景概述
在机器人操作学习领域,高质量的双手机器人数据集对于推动灵巧操作研究具有关键意义。R1_Lite_sliding_chair数据集由RoboCOIN团队于2025年11月发布,作为RoboCOIN项目的重要组成部分,专注于解决家庭环境中桌椅交互的复杂操作问题。该数据集采用R1_Lite双手机器人平台,通过三视角视觉观测与多维动作标注,构建了包含抓取、拾取、放置等原子动作的完整操作序列,其与LeRobot框架的完全兼容性为模仿学习与强化学习算法提供了标准化基准。
当前挑战
该数据集致力于解决双手机器人在非结构化环境中执行精确物体操纵的核心难题,特别是桌椅交互过程中面临的动态避障与多步任务规划挑战。在构建过程中,需要克服多模态数据同步采集的技术瓶颈,确保三路高清视频流与14维关节状态数据的时序一致性。同时,精细的末端执行器运动标注要求开发新型语义分割流程,以准确捕捉抓取力度变化与六维位姿轨迹,这对数据采集系统的实时性与计算资源提出了极高要求。
常用场景
经典使用场景
在机器人操作学习领域,R1_Lite_sliding_chair数据集通过记录双指夹爪机械臂在家庭环境中执行推拉椅子的精细动作,为模仿学习算法提供了丰富的训练样本。其多视角视频流与同步状态数据构建了完整的动作-观测映射关系,使研究者能够分析从视觉感知到运动控制的完整决策链条。该数据集特别适用于研究复杂操作任务中的动作分割与序列生成问题,为具身智能在动态环境中的适应性行为建模奠定了数据基础。
解决学术问题
该数据集有效解决了机器人操作学习中动作泛化与场景迁移的核心难题。通过提供精确的末端执行器位姿标注与运动学参数,支持了对双机械臂协同操作中的动力学建模研究。丰富的子任务标注体系为层次化强化学习提供了结构化监督信号,而多模态传感器数据的同步采集则突破了传统单视角学习的感知局限。这些特性显著提升了模型在未知环境中执行复合操作任务的鲁棒性与精确度。
衍生相关工作
基于该数据集衍生的研究已催生多项创新成果,包括结合LeRobot框架的跨任务策略迁移方法,以及利用多视角视觉特征的动作预测模型。其丰富的运动标注体系促进了基于物理先验的模仿学习算法发展,而精细的子任务分割则启发了面向长期任务的课程学习方案。这些工作共同推动了机器人操作学习从单一技能向复杂任务组合的范式转变,为开放环境下的自主操作系统研发提供了重要参考。
以上内容由遇见数据集搜集并总结生成



