five

R1_Lite_make_tea

收藏
Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/RoboCOIN/R1_Lite_make_tea
下载链接
链接失效反馈
官方服务:
资源简介:
R1_Lite_make_tea 数据集基于 LeRobot 扩展格式,完全兼容 LeRobot。它使用 R1_Lite 机器人类型,代码库版本为 v2.1,并且配备了两个指头的抓取器。数据集涵盖了家庭和餐厅两种场景类型,并包括了抓取、拾取和放置等原子动作。数据集共包含 101 个剧集,162,473 个帧,1 个任务和 303 个视频。数据集大小为 9.0GB,以 Apache-2.0 许可证发布。
创建时间:
2025-11-19
原始信息汇总

R1_Lite_make_tea 数据集概述

📋 数据集基本信息

  • 数据集名称: R1_Lite_make_tea
  • 许可证: apache-2.0
  • 支持语言: 英语、中文
  • 任务类别: 机器人技术
  • 数据集标签: RoboCOIN、LeRobot
  • 帧数范围: 100K-1M

🤖 机器人配置

  • 机器人类型: R1_Lite
  • 代码库版本: v2.1
  • 末端执行器类型: 两指夹爪

🏠 场景类型

  • 家庭环境
  • 餐厅环境

🔧 原子动作

  • 抓取
  • 拾取
  • 放置

📊 数据集统计

指标 数值
总情节数 101
总帧数 162473
总任务数 1
总视频数 303
总分块数 1
分块大小 1000
帧率 30
数据集大小 9.0GB

🎯 任务描述

主要任务

将水壶中的水倒入杯中,浸泡茶包后丢弃

子任务

包含23个不同的子任务:

  1. 异常
  2. 结束
  3. 用左夹爪抓取茶包
  4. 用右夹爪抓取茶包
  5. 传递给另一个夹爪
  6. 传递给另一只手
  7. 将茶包在杯中多次提起放下
  8. 空值
  9. 拿起水壶
  10. 用左夹爪拿起水壶
  11. 用右夹爪拿起水壶
  12. 拿起茶包
  13. 用左夹爪将水壶放回原位
  14. 用右夹爪将水壶放回原位
  15. 将水壶放回原位
  16. 用左夹爪将茶包在杯中多次放入取出
  17. 用右夹爪将茶包在杯中多次放入取出
  18. 将茶包放入桌面垃圾桶
  19. 用左夹爪将茶包放入桌面垃圾桶
  20. 用右夹爪将茶包放入桌面垃圾桶
  21. 用左夹爪将水壶中的水倒入杯中
  22. 用右夹爪将水壶中的水倒入杯中
  23. 将水壶中的水倒入杯中

🎥 摄像头视图

包含3个摄像头视图

🏷️ 可用标注

子任务标注

  • 子任务分割: 细粒度的子任务分割和标注

场景标注

  • 场景级描述: 语义场景分类和描述

末端执行器标注

  • 方向: 机器人末端执行器运动方向分类
  • 速度: 操作过程中的速度大小分类
  • 加速度: 运动分析的加速度大小分类

夹爪标注

  • 夹爪模式: 夹爪开闭状态标注
  • 夹爪活动: 活动状态分类

附加特征

  • 末端执行器仿真位姿: 仿真空间中末端执行器的6D位姿信息
  • 夹爪开合尺度: 连续的夹爪开合测量值

📂 数据划分

  • 训练集: 情节0-100

📁 数据集结构

文件组织

  • 数据文件路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4
  • 分块: 数据组织为1个分块,每个分块大小为1000

特征架构

视觉观测

  • observation.images.cam_high_rgb: 视频,帧率30,编码av1
  • observation.images.cam_left_wrist_rgb: 视频,帧率30,编码av1
  • observation.images.cam_right_wrist_rgb: 视频,帧率30,编码av1

状态和动作

  • observation.state: float32
  • action: float32

时间信息

  • timestamp: float32
  • frame_index: int64
  • episode_index: int64
  • index: int64
  • task_index: int64

标注

  • subtask_annotation: int32
  • scene_annotation: int32

👥 作者

  • 贡献者: RoboCOIN - RoboCOIN团队

🔗 相关链接

  • 主页: https://flagopen.github.io/RoboCOIN/
  • 论文: https://arxiv.org/abs/2511.17441
  • 代码库: https://github.com/FlagOpen/RoboCOIN
  • 项目页面: https://flagopen.github.io/RoboCOIN/
  • 问题反馈: https://github.com/FlagOpen/RoboCOIN/issues

📚 引用

bibtex @article{robocoin, title={RoboCOIN: An Open-Sourced Bimanual Robotic Data Collection for Integrated Manipulation}, author={Shihan Wu, Xuecheng Liu, Shaoxuan Xie, Pengwei Wang, Xinghang Li, Bowen Yang, Zhe Li, Kai Zhu, Hongyu Wu, Yiheng Liu, Zhaoye Long, Yue Wang, Chong Liu, Dihan Wang, Ziqiang Ni, Xiang Yang, You Liu, Ruoxuan Feng, Runtian Xu, Lei Zhang, Denghang Huang, Chenghao Jin, Anlan Yin, Xinlong Wang, Zhenguo Sun, Junkai Zhao, Mengfei Du, Mingyu Cao, Xiansheng Chen, Hongyang Cheng, Xiaojie Zhang, Yankai Fu, Ning Chen, Cheng Chi, Sixiang Chen, Huaihai Lyu, Xiaoshuai Hao, Yequan Wang, Bo Lei, Dong Liu, Xi Yang, Yance Jiao, Tengfei Pan, Yunyan Zhang, Songjing Wang, Ziqian Zhang, Xu Liu, Ji Zhang, Caowei Meng, Zhizheng Zhang, Jiyang Gao, Song Wang, Xiaokun Leng, Zhiqiang Xie, Zhenzhen Zhou, Peng Huang, Wu Yang, Yandong Guo, Yichao Zhu, Suibing Zheng, Hao Cheng, Xinmin Ding, Yang Yue, Huanqian Wang, Chi Chen, Jingrui Pang, YuXi Qian, Haoran Geng, Lianli Gao, Haiyuan Li, Bin Fang, Gao Huang, Yaodong Yang, Hao Dong, He Wang, Hang Zhao, Yadong Mu, Di Hu, Hao Zhao, Tiejun Huang, Shanghang Zhang, Yonghua Lin, Zhongyuan Wang and Guocai Yao}, journal={arXiv preprint arXiv:2511.17441}, url = {https://arxiv.org/abs/2511.17441}, year={2025} }

📌 版本信息

  • v1.0.0 (2025-11): 初始发布
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作数据采集领域,R1_Lite_make_tea数据集通过双指夹爪机器人R1_Lite在家庭与餐厅场景中系统记录泡茶任务。该数据集采用LeRobot扩展格式构建,包含101个完整交互序列,总计162,473帧视觉与运动数据,以30帧率的多视角视频和14维关节状态动作信息完整捕捉抓取、放置等原子操作过程。数据以分块形式存储于Parquet文件,确保高效访问与大规模分析需求。
特点
该数据集在机器人操作学习领域展现出多模态融合的显著特性,集成三路高清摄像头视角与丰富的末端执行器运动注解。其独特价值在于提供完整的6D位姿轨迹、速度加速度分类及夹爪开合状态连续监测,覆盖23项精细子任务标注体系。9GB数据容量内蕴含时空对齐的多源信息,为复杂操作策略的端到端学习奠定坚实基础。
使用方法
研究者可通过LeRobot兼容接口直接加载该数据集,利用预定义的数据切分方案进行模型训练与验证。数据读取遵循标准路径模式,支持从视频流、关节状态到动作指令的全流程解析。多维度注解体系便于开发分层强化学习算法,而精细的运动特征标注则为模仿学习与轨迹预测研究提供丰富监督信号。
背景与挑战
背景概述
在机器人操作学习领域,R1_Lite_make_tea数据集由RoboCOIN团队于2025年构建,聚焦于双臂机器人执行复杂日常任务的研究。该数据集基于LeRobot框架扩展,专门针对R1_Lite机器人型号设计,涵盖家庭与餐厅场景下的沏茶任务。通过记录162,473帧多视角视觉数据及精细的动作轨迹,该资源为机器人模仿学习与任务分解提供了重要基准,推动了具身智能在真实环境中的适应性研究。
当前挑战
该数据集致力于解决双臂协调操作中的动态规划难题,例如水壶倾倒控制与茶包抓取的精确定位。构建过程中面临多模态数据同步的复杂性,需整合三路摄像头视频流与14维关节状态数据;同时,23项子任务的精细标注要求对动作边界与物理交互进行严格定义,而9GB数据量的高效存储与检索亦成为工程实现的显著挑战。
常用场景
经典使用场景
在机器人操作学习领域,R1_Lite_make_tea数据集为双臂协作任务提供了标准化实验平台。该数据集聚焦于沏茶这一日常活动,通过抓取茶包、提起水壶、倾倒热水等23项精细子任务,完整呈现了复杂操作序列的执行过程。其多视角视觉数据与丰富的末端执行器运动标注,为模仿学习与强化学习算法提供了理想的训练环境,尤其适用于研究双手协调控制与物体交互的动态特性。
解决学术问题
该数据集有效应对了机器人操作研究中动作分割与时序建模的挑战。通过精确标注每个子任务的起始边界与运动参数,解决了长时程任务中动作边界模糊的难题。其提供的六维末端位姿、速度加速度分类等多维特征,为研究机器人运动规划中的动力学约束与轨迹优化提供了数据支撑,显著推进了精细操作任务的算法泛化能力研究。
衍生相关工作
围绕该数据集衍生的研究显著丰富了机器人学习生态。基于LeRobot框架的扩展研究推进了多模态数据融合方法的发展,其精细的动作标注体系启发了新一代层次化模仿学习架构。相关成果在RoboCOIN项目中进一步拓展为跨任务泛化研究,为构建通用机器人操作能力奠定了理论基础,并催生了面向复杂家居任务的大规模数据收集标准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作