five

R1_Lite_pour_water

收藏
Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/RoboCOIN/R1_Lite_pour_water
下载链接
链接失效反馈
官方服务:
资源简介:
R1_Lite_pour_water数据集是一个基于LeRobot扩展格式的机器人数据集,主要描述了R1_Lite机器人在家庭和餐厅场景中进行倒水任务的场景。数据集包含了丰富的标注信息,包括子任务分割、场景描述、末端执行器方向、速度、加速度等。数据集被组织成训练集和测试集,并按照LeRobot格式进行组织。
创建时间:
2025-11-19
原始信息汇总

R1_Lite_pour_water 数据集概述

基本信息

  • 数据集名称: R1_Lite_pour_water
  • 许可证: apache-2.0
  • 支持语言: 英语、中文
  • 任务类别: 机器人学
  • 标签: RoboCOIN, LeRobot
  • 数据规模: 2.0GB

机器人配置

  • 机器人类型: R1_Lite
  • 代码库版本: v2.1
  • 末端执行器类型: 两指夹爪

场景与动作

场景类型

  • 家庭环境
  • 餐厅环境

原子动作

  • 抓取
  • 拾取
  • 放置

数据集统计

指标 数值
总情节数 51
总帧数 53125
总任务数 1
总视频数 153
总分块数 1
分块大小 1000
帧率 30 FPS

任务描述

主要任务

将水倒入两个杯子,然后将水壶放在桌子上

子任务

  1. 无操作
  2. 拿起杯子
  3. 拿起水壶
  4. 将水倒入另一个杯子
  5. 将水倒入杯子
  6. 将水壶放在桌子上
  7. 将杯子放在桌子上

数据特征

视觉观测

  • observation.images.cam_high_rgb: 高清摄像头RGB视频
  • observation.images.cam_left_wrist_rgb: 左手腕摄像头RGB视频
  • observation.images.cam_right_wrist_rgb: 右手腕摄像头RGB视频

状态与动作

  • observation.state: 机器人状态信息(14维浮点数)
  • action: 机器人动作指令(14维浮点数)

注释信息

  • 子任务注释: 细粒度子任务分割和标注
  • 场景注释: 语义场景分类和描述

运动特征

  • 末端执行器仿真位姿: 6D位姿信息
  • 末端执行器方向: 运动方向分类
  • 末端执行器速度: 速度大小分类
  • 末端执行器加速度: 加速度大小分类

夹爪特征

  • 夹爪开合尺度: 连续夹爪开合测量
  • 夹爪模式: 开/关状态标注
  • 夹爪活动: 活动状态分类

数据划分

  • 训练集: 情节0-50

文件结构

R1_Lite_pour_water_qced_hardlink/ ├── annotations/ # 注释文件 ├── data/ # 数据文件(Parquet格式) ├── meta/ # 元数据文件 └── videos/ # 视频文件

作者信息

  • 贡献者: RoboCOIN团队

相关链接

  • 主页: https://flagopen.github.io/RoboCOIN/
  • 论文: https://arxiv.org/abs/2511.17441
  • 代码库: https://github.com/FlagOpen/RoboCOIN
  • 问题反馈: https://github.com/FlagOpen/RoboCOIN/issues

引用信息

如需在研究中使用此数据集,请引用: bibtex @article{robocoin, title={RoboCOIN: An Open-Sourced Bimanual Robotic Data Collection for Integrated Manipulation}, author={Shihan Wu et al.}, journal={arXiv preprint arXiv:2511.17441}, year={2025} }

版本历史

  • v1.0.0 (2025-11): 初始发布
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作研究领域,R1_Lite_pour_water数据集基于LeRobot框架的扩展格式构建,确保了与现有机器人学习生态系统的完全兼容性。该数据集通过R1_Lite型机器人采集,采用双指夹爪作为末端执行器,在家庭和餐厅两种场景中系统记录倒水任务的执行过程。数据组织采用分块存储机制,将53125帧视觉与状态数据分布于51个训练片段中,并以Parquet格式高效封装多模态观测信息。
特点
该数据集在机器人操作任务中展现出丰富的多模态特性,涵盖三个不同视角的高清视频流,帧率稳定在30fps,分辨率达1280x720。其核心价值在于精细的动作标注体系,不仅对抓取、拾取、放置等原子操作进行分段标记,还提供了末端执行器的运动方向、速度、加速度等多维度动力学特征。夹爪状态监测包含开合尺度与活动模式,结合六维位姿仿真数据,为机器人模仿学习与策略优化提供了全面的监督信号。
使用方法
研究者可通过LeRobot标准接口直接加载该数据集,利用其预定义的数据分割方案进行模型训练与验证。数据访问遵循结构化路径模式,通过指定片段索引即可获取对应的状态序列与视觉观测。该数据集特别适用于双臂协调操作算法的开发,其丰富的动作标注支持分层强化学习、行为克隆等方法的实施。多视角视频流与精细的动力学参数为机器人动作理解与生成任务提供了可靠的基础设施。
背景与挑战
背景概述
在机器人操作领域,双手机器人执行复杂任务的研究正日益受到关注。R1_Lite_pour_water数据集由RoboCOIN团队于2025年11月发布,作为RoboCOIN项目的重要组成部分,专注于双手机器人倒水任务的精细动作记录。该数据集基于LeRobot框架构建,兼容其数据格式,旨在推动机器人操作策略的学习与泛化能力研究。数据集涵盖家庭与餐厅两种场景,包含51个完整任务片段,总计53125帧多视角视觉数据,为机器人模仿学习与动作规划提供了丰富的实验基础。
当前挑战
该数据集致力于解决双手机器人操作中动作协调与任务分解的挑战,具体体现在倒水过程中抓取、移动与放置等原子动作的时序配合。构建过程中面临多模态数据同步的复杂性,需确保三路摄像头视频流与机器人状态数据的精确对齐。同时,末端执行器运动轨迹的标注需要处理高维连续空间中的姿态变化,而不同场景下的物体交互差异进一步增加了数据采集与标注的难度。
常用场景
经典使用场景
在机器人操作学习领域,R1_Lite_pour_water数据集聚焦于双臂协作的精细操作任务,其核心应用场景在于训练机器人完成倒水这一日常动作。通过涵盖抓取、拾取、放置等原子动作序列,该数据集为模仿学习与强化学习算法提供了结构化训练范本。多视角视觉观测与丰富的末端执行器运动标注共同构建了完整的动作感知框架,使机器人能够学习从物体抓取到液体倾倒的连贯操作流程。
解决学术问题
该数据集有效解决了机器人操作中动作分解与任务规划的学术难题。通过细粒度的子任务标注与运动特征量化,研究者能够深入分析双臂协调运动的动力学特性。末端执行器的位姿、速度、加速度等多维度数据为理解机器人操作中的运动规划与控制策略提供了实证基础,显著推进了复杂操作任务的算法建模与性能优化。
衍生相关工作
基于该数据集衍生的研究工作主要集中于多模态学习与跨任务迁移领域。研究者利用其丰富的标注体系开发了分层强化学习框架,将倒水任务分解为可复用的动作基元。同时,该数据集与LeRobot生态系统的兼容性促进了机器人学习算法的标准化比较,催生了包括动作模仿网络、多智能体协作系统在内的一系列创新方法,为开源机器人社区提供了重要的基准测试平台。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作