R1_Lite_make_a_landline_call

Hugging Face2025-11-28 更新2025-11-29 收录

下载链接：

https://huggingface.co/datasets/RoboCOIN/R1_Lite_make_a_landline_call

下载链接

链接失效反馈

官方服务：

资源简介：

R1_Lite_make_a_landline_call 数据集是一个基于 LeRobot 格式的扩展数据集，与 LeRobot 完全兼容。该数据集使用 R1_Lite 机器人类型，代码库版本为 v2.1，末端执行器类型为双指夹持器。数据集包括 115 个剧集，86262 个帧，345 个视频，总大小为 5.9GB。数据集包括以下场景类型：家庭。原子动作包括：抓取、拾取和放置。数据集包括丰富的注释，包括子任务分割、场景描述、末端执行器运动方向、速度、加速度、夹持器模式和活动状态。数据集按照 LeRobot 格式组织，包含视频、状态数据、动作数据和元数据。数据集被组织成 1 个块，每个块大小为 1000。

创建时间：

2025-11-19

原始信息汇总

R1_Lite_make_a_landline_call 数据集概述

基本信息

数据集名称: R1_Lite_make_a_landline_call
许可证: Apache-2.0
支持语言: 英语、中文
任务类别: 机器人学
标签: RoboCOIN、LeRobot
框架范围: 10K-100K

技术规格

机器人类型: R1_Lite
代码库版本: v2.1
末端执行器类型: 两指夹爪
帧率: 30 FPS
数据集大小: 5.9GB

场景与动作

场景类型

家庭环境

原子动作

抓取
拾取
放置

数据集统计

指标	数值
总情节数	115
总帧数	86262
总任务数	1
总视频数	345
总分块数	1
分块大小	1000

任务描述

主要任务

提起电话听筒、拨号、然后挂断电话结束通话

子任务

拨号
使用拨号盘结束通话
无
拿起桌面电话听筒
放回听筒

数据组成

相机视角

包含3个相机视角

数据文件

视频文件: 包含RGB相机观察的压缩视频文件
状态数据: 机器人关节位置、速度和其他状态信息
动作数据: 机器人动作命令和轨迹
元数据: 情节元数据、时间戳和标注

标注信息

子任务标注

细粒度子任务分割和标注

场景标注

场景级描述和语义场景分类

末端执行器标注

方向：机器人末端执行器运动方向分类
速度：操作过程中的速度大小分类
加速度：运动分析的加速度大小分类

夹爪标注

夹爪模式：夹爪开/关状态标注
夹爪活动：活动状态分类（活动/非活动）

数据特征

视觉观察

observation.images.cam_high_rgb：视频，30 FPS，AV1编码
observation.images.cam_left_wrist_rgb：视频，30 FPS，AV1编码
observation.images.cam_right_wrist_rgb：视频，30 FPS，AV1编码

状态与动作

observation.state：float32
action：float32

运动特征

末端执行器仿真姿态（状态和动作）
末端执行器方向（状态和动作）
末端执行器速度（状态和动作）
末端执行器加速度大小（状态和动作）

夹爪特征

夹爪开合尺度（状态和动作）
夹爪模式（状态和动作）
夹爪活动状态

数据分割

训练集: 情节0-114

文件组织结构

R1_Lite_make_a_landline_call_qced_hardlink/ ├── annotations/ ├── data/ │ └── chunk-000/ ├── meta/ └── videos/ └── chunk-000/ ├── observation.images.cam_high_rgb/ ├── observation.images.cam_left_wrist_rgb/ └── observation.images.cam_right_wrist_rgb/

作者信息

贡献者: RoboCOIN团队

版本信息

初始版本: v1.0.0 (2025年11月)

搜集汇总

数据集介绍

构建方式

在机器人操作数据采集领域，R1_Lite_make_a_landline_call数据集基于LeRobot框架的扩展格式构建，确保了与现有机器人学习生态系统的完全兼容性。该数据集通过R1_Lite型双指夹爪机器人在家庭环境中执行固定电话呼叫任务，系统采集了115个完整操作序列，涵盖86262帧视觉与运动数据。数据以分块形式组织，采用Parquet格式高效存储多模态信息，包括三路高清摄像头视频流、机器人关节状态与动作指令，并辅以精细的时序标注与语义分割。

特点

该数据集在机器人操作学习领域展现出显著的多模态特性，整合了来自高位、左右腕部摄像头的三路RGB视频流，帧率稳定在30fps，分辨率达1280×720。其核心价值在于丰富的运动学标注体系，提供了末端执行器的六维位姿、速度方向、加速度幅度等连续与离散特征，同时包含夹爪开合状态与活动模式的精细分类。数据集特别设计了五层子任务标注结构，从提起听筒到拨号挂机，完整覆盖了电话操作的行为链条，为层次化策略学习提供了结构化支撑。

使用方法

研究者可通过LeRobot标准接口直接加载该数据集，利用其预定义的数据拆分方案进行模型训练与验证。每个数据块包含完整的 episode 序列，用户可并行读取视频文件与对应的状态动作序列。数据集支持端到端模仿学习与行为克隆算法，其多维标注体系允许研究者开展细粒度动作分割、运动轨迹预测等进阶研究。对于仿真迁移任务，末端执行器位姿数据为sim-to-real转换提供了精确的坐标参照，而时序对齐的视觉-运动配对数据则适用于跨模态表征学习。

背景与挑战

背景概述

机器人操作学习领域正经历从单一任务向复杂长序列任务的关键转型。R1_Lite_make_a_landline_call数据集由RoboCOIN团队于2025年11月发布，作为RoboCOIN项目的重要组成部分，专注于双手机器人执行固定电话拨打任务的行为数据采集。该数据集基于LeRobot框架构建，包含115个完整操作序列、86262帧多视角视频数据，通过精细标注的抓取、拾取、放置等原子动作，为机器人长时程任务规划与双臂协调控制研究提供了重要实验基础。其多模态数据结构和丰富的末端执行器运动标注，显著推动了具身智能在家庭场景中的实际应用进程。

当前挑战

在机器人操作学习领域，长序列任务执行面临动作时序依赖建模与动态环境适应的核心难题。该数据集构建过程中需克服多传感器数据同步采集的技术障碍，特别是三路高清视频与14维关节状态数据的精确对齐。双臂协调动作的时序标注需要人工专家逐帧校验，确保抓取力度、放置精度等细微操作的准确性。数据规模扩展受限于真实物理设备的操作频次，每个拨打任务需保持动作轨迹的完整性与可重复性，这对实验环境控制和数据质量控制提出了极高要求。

常用场景

经典使用场景

在机器人操作学习领域，该数据集作为双手机器人执行精细操作任务的基准资源，聚焦于家庭环境中座机电话使用的完整流程。其经典应用体现在通过多视角视觉观测与丰富动作标注，为模仿学习与强化学习算法提供高质量训练数据，涵盖抓取手柄、拨号、挂断等连贯动作序列，有效支撑机器人复杂任务分解与执行能力的研究。

解决学术问题

该数据集针对机器人操作中动作泛化性与时序依赖建模的核心难题，通过细粒度子任务标注与多模态状态记录，解决了长期任务规划中的动作分割难题。其提供的末端执行器运动轨迹与抓握状态数据，显著推进了机器人动态控制策略的学术研究，为双手机器人协同操作的理论突破奠定数据基础。

衍生相关工作

依托该数据集衍生的经典研究集中于分层强化学习框架的优化，例如基于子任务标注的动作抽象方法开发。RoboCOIN项目团队进一步扩展了双手机器人操作数据集生态，相关成果推动LeRobot框架在动态场景理解领域的算法迭代，为机器人操作知识的跨任务迁移提供重要范式参考。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集