five

R1_Lite_opening_and_closing_aalcony_sliding_doors

收藏
Hugging Face2025-11-28 更新2025-11-29 收录
下载链接:
https://huggingface.co/datasets/RoboCOIN/R1_Lite_opening_and_closing_aalcony_sliding_doors
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个基于LeRobot扩展格式的数据集,完全兼容LeRobot。数据集使用了R1_Lite型机器人,代码库版本为v2.1,末端执行器类型为双指抓取器。数据集涵盖了家庭场景类型,包括抓取、推动和拉动等原子动作。数据集包含丰富的注释,包括子任务分割、场景描述、末端执行器方向、速度、加速度、抓手模式、抓手活动等。数据集分为训练集和测试集,其中训练集包含100个剧集。数据集文件组织为LeRobot格式,包含视频、状态数据、动作数据和元数据。数据集包含视觉观察、状态和动作、时间信息、注释、运动特征和抓手特征等。数据集的目录结构清晰,包括注释、数据、元数据和视频等子目录。数据集的许可证为Apache-2.0。
创建时间:
2025-11-19
原始信息汇总

R1_Lite_opening_and_closing_aalcony_sliding_doors 数据集概述

基本信息

  • 数据集名称: R1_Lite_opening_and_closing_aalcony_sliding_doors
  • 许可证: Apache-2.0
  • 支持语言: 英语、中文
  • 任务类别: 机器人技术
  • 标签: RoboCOIN, LeRobot
  • 框架范围: 100K-1M

技术规格

  • 机器人类型: R1_Lite
  • 代码库版本: v2.1
  • 末端执行器类型: 两指夹爪
  • 帧率: 30 FPS
  • 数据集大小: 6.9GB

场景与动作

  • 场景类型: 家庭环境
  • 原子动作: 抓取、推动、拉动

数据集统计

指标 数值
总片段数 101
总帧数 133637
总任务数 1
总视频数 303
总分块数 1
分块大小 1000

任务描述

  • 主要任务: 关闭阳台推拉门然后打开它
  • 子任务:
    1. 关闭推拉门
    2. null
    3. 打开推拉门

数据内容

视觉观测

  • cam_high_rgb: 720×1280分辨率,AV1编码
  • cam_left_wrist_rgb: 720×1280分辨率,AV1编码
  • cam_right_wrist_rgb: 720×1280分辨率,AV1编码

状态与动作

  • observation.state: 14维浮点数组(关节角度和夹爪状态)
  • action: 14维浮点数组(关节角度和夹爪控制)

标注信息

  • 子任务标注: 细粒度子任务分割和标注
  • 场景标注: 语义场景分类和描述
  • 末端执行器标注: 方向、速度、加速度分类
  • 夹爪标注: 模式(开/关)、活动状态

运动特征

  • 末端执行器仿真位姿: 6D位姿信息(位置和方向)
  • 夹爪开合尺度: 连续夹爪开合测量

数据组织

文件结构

  • 数据文件: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
  • 视频文件: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

数据划分

  • 训练集: 片段0-100

相关资源

  • 主页: https://flagopen.github.io/RoboCOIN/
  • 论文: https://arxiv.org/abs/2511.17441
  • 代码库: https://github.com/FlagOpen/RoboCOIN
  • 问题反馈: https://github.com/FlagOpen/RoboCOIN/issues

兼容性

  • 基于LeRobot格式扩展,完全兼容LeRobot框架

版本信息

  • 初始版本: v1.0.0 (2025年11月)
搜集汇总
数据集介绍
main_image_url
构建方式
在机器人操作学习领域,高质量数据集的构建对算法性能具有决定性影响。本数据集采用R1_Lite双指抓取器机器人,基于LeRobot扩展格式构建,包含101个完整操作片段,总计133,637帧视觉与状态数据。数据采集过程通过三路高清摄像头(顶部视角、左右腕部视角)以30帧/秒的速率记录,同时捕获机器人关节状态、末端执行器位姿及夹爪运动参数。数据组织采用分块存储架构,将操作序列按千帧规模划分为标准化的parquet格式文件,确保数据读取效率与存储优化。
特点
该数据集在机器人操作数据领域展现出显著的技术特色。其核心优势在于提供了多层次的运动语义标注,包括精细化的子任务分割、末端执行器运动方向分类、速度与加速度分级标注。数据集特别强化了夹爪操作状态的完整描述,涵盖开合尺度连续测量、工作模式分类及活动状态标识。三维空间中的末端执行器六自由度位姿信息同时提供状态与动作层面的数据支持,为机器人模仿学习与策略优化提供了丰富的监督信号。所有视觉数据均采用AV1编码压缩,在保证画质的前提下有效控制存储体积。
使用方法
针对机器人学习研究需求,本数据集支持端到端的算法开发流程。研究人员可通过标准化的数据加载接口直接读取parquet格式的状态-动作序列,利用多视角视频流进行视觉感知模型训练。数据集提供的丰富标注信息支持多种学习范式:子任务标注可用于分层强化学习,运动特征标注适用于动力学建模,夹爪状态信息则有利于抓取策略优化。训练集包含前100个操作片段,用户可基于LeRobot兼容的接口快速构建数据管道,实现从原始观测到控制指令的完整学习链路。数据集的模块化结构便于针对特定研究目标进行定制化数据子集提取。
背景与挑战
背景概述
在机器人操作学习领域,双手机器人执行复杂任务的能力一直是研究重点。R1_Lite_opening_and_closing_balcony_sliding_doors数据集由RoboCOIN团队于2025年11月发布,隶属于RoboCOIN项目这一开源双手机器人数据收集计划。该数据集聚焦于家庭环境中的推拉门操作任务,采用R1_Lite型双手机器人配备双指夹爪,通过101个完整操作序列和133,637帧数据,系统记录机器人关闭和开启阳台推拉门的动态过程。数据集基于LeRobot框架构建,提供多视角视觉观测、机器人状态与动作数据,以及精细的运动特征标注,为机器人操作策略学习提供重要支撑。
当前挑战
在机器人操作学习领域,推拉门操作任务面临多重挑战。环境交互的复杂性要求机器人准确感知门体状态并适应不同摩擦力条件,同时双手机器人需要协调双臂运动以避免碰撞。数据构建过程中,真实世界数据采集面临传感器同步精度和动作轨迹一致性的技术难题,多模态数据融合需要处理视觉、状态和动作信息的时间对齐问题。此外,精细的动作标注要求对末端执行器位姿、速度和夹爪状态进行精确量化,这些都对数据质量提出了严格要求。
常用场景
经典使用场景
在家庭服务机器人研究领域,该数据集聚焦于阳台推拉门的开闭操作任务,为机器人双臂协调控制提供了标准化实验平台。通过包含抓取、推动、拉动等基础动作的完整演示序列,研究者能够系统分析双臂机器人在复杂家居环境中的运动规划策略。多视角视觉观测与精细的动作标注相结合,为模仿学习算法提供了高质量的示范数据,助力机器人掌握精确的门窗操作技能。
衍生相关工作
基于该数据集衍生的研究显著推进了机器人操作技能学习领域的发展。RoboCOIN项目构建的大规模双臂操作数据集为行为克隆、逆强化学习等算法提供了基准测试平台。与LeRobot框架的深度整合催生了多项基于Transformer的序列预测模型,这些工作通过利用数据集中的时序动作标注,在机器人任务分解与长期规划方面取得了突破性进展。
数据集最近研究
最新研究方向
在家庭服务机器人领域,R1_Lite_opening_and_closing_aalcony_sliding_doors数据集正推动双手机器人操作技术的前沿探索。该数据集通过精细标注的抓取、推拉等原子动作,结合多视角视觉数据与末端执行器运动轨迹,为模仿学习与强化学习算法提供了高精度训练基础。当前研究聚焦于跨模态表征学习,将视觉观察与机器人状态动作序列深度融合,以提升在动态家居环境中执行复杂长程任务的泛化能力。随着RoboCOIN等开源平台的推广,此类数据集正成为推动具身智能发展的重要基石,为构建能够适应真实世界不确定性的智能机器人系统奠定数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作