Split_aloha_pour_tea

Hugging Face2025-11-29 更新2025-11-30 收录

下载链接：

https://huggingface.co/datasets/RoboCOIN/Split_aloha_pour_tea

下载链接

链接失效反馈

官方服务：

资源简介：

Split_aloha_pour_tea数据集是基于LeRobot格式扩展的，完全兼容LeRobot。该数据集使用Split_aloha机器人类型，代码库版本为v2.1，末端执行器类型为双指抓手。数据集覆盖的场景类型包括家庭和办公室。原子动作包括抓取、放置、拾取和倒茶。数据集统计信息包括总剧集数1024，总帧数1322112，总任务数5，总视频数3072，总块数2，块大小1000，帧率30，数据集大小13.4GB。数据集由RoboCOIN团队贡献，并提供详细的注释和多种学习支持。

创建时间：

2025-11-29

原始信息汇总

Split_aloha_pour_tea 数据集概述

基本信息

数据集名称: Split_aloha_pour_tea
许可证: apache-2.0
支持语言: 英语、中文
任务类别: 机器人技术
标签: RoboCOIN, LeRobot
帧范围: 1M-10M

机器人配置

机器人类型: Split_aloha
代码库版本: v2.1
末端执行器类型: 两指夹爪

场景类型

家庭环境
办公室环境

原子动作

抓取
放置
拾取
倾倒

数据集统计

指标	数值
总片段数	1024
总帧数	1,322,112
总任务数	5
总视频数	3072
总分块数	2
分块大小	1000
帧率	30 FPS
数据集大小	13.4GB

主要任务

将茶倒入茶杯
抓取棕色茶壶，依次将茶倒入两个棕色茶杯，将棕色茶壶放回原位
抓取棕色茶壶，依次将茶倒入两个白色茶杯，将棕色茶壶放回原位
抓取不锈钢茶壶，依次将茶倒入两个不锈钢茶杯，将不锈钢茶壶放回原位
抓取蓝瓷茶壶，依次将茶倒入两个蓝瓷茶杯，将蓝瓷茶壶放回原位

子任务

包含18个不同的子任务：

异常
结束
用左夹爪抓取茶壶
用右夹爪抓取茶壶
空
用左夹爪拿起茶杯
用右夹爪拿起茶杯
用左夹爪拿起茶壶
用右夹爪拿起茶壶
用左夹爪放下茶壶
用右夹爪放下茶壶
用右夹爪将茶杯放置在视野中心
用左夹爪将茶倒入茶杯
用右夹爪将茶倒入茶杯
用左夹爪将茶倒入茶杯
用右夹爪将茶倒入茶杯
用左夹爪放下茶壶
用右夹爪放下茶壶

数据特征

视觉观测

observation.images.cam_high_rgb: 视频，30 FPS，AV1编解码器
observation.images.cam_left_wrist_rgb: 视频，30 FPS，AV1编解码器
observation.images.cam_right_wrist_rgb: 视频，30 FPS，AV1编解码器

状态和动作

observation.state: float32
action: float32

时间信息

timestamp, frame_index, episode_index, index, task_index

注释信息

subtask_annotation, scene_annotation

运动特征

末端执行器仿真姿态（状态和动作）
末端执行器方向、速度、加速度分类
夹爪开合尺度、模式、活动状态

数据组织

文件结构

数据文件: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频文件: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

数据分割

训练集: 片段0-1023

引用信息

如需在研究中引用此数据集，请使用提供的BibTeX格式引用。

搜集汇总

数据集介绍

构建方式

在机器人操作数据采集领域，Split_aloha_pour_tea数据集通过Split_aloha双机械臂平台系统构建，采用LeRobot扩展格式确保数据兼容性。数据采集涵盖家庭与办公场景，通过三视角视觉传感器（高位摄像头、左右腕部摄像头）以30帧率同步记录132万帧操作序列，并按照千帧单元进行数据分块存储。操作任务围绕茶具操控展开，通过精细的动作分解记录抓取、放置、倾倒等原子操作，形成1024个完整操作序列的标准化数据集。

特点

该数据集在机器人操作学习领域展现出多模态特性，集成视觉观测、关节状态与动作指令的三维数据流。其核心价值在于丰富的标注体系，包含末端执行器位姿、速度加速度分类、夹爪活动状态等运动学特征，以及18类精细子任务的分段标注。数据规模达到13.4GB，涵盖五种茶具组合的倾倒任务变体，通过三机位视频与26维状态动作向量的同步记录，为模仿学习与策略优化提供立体化数据支撑。

使用方法

基于LeRobot框架的数据接口设计，研究者可通过标准数据加载器直接读取parquet格式的状态序列与MP4格式的视觉流。数据集采用分块存储架构，训练集包含1023个完整操作片段，支持端到端的策略学习与行为克隆。用户可调用预定义的数据加载管道，同步获取多视角视觉输入、关节空间轨迹及丰富的运动标注，适用于动态系统建模、操作技能迁移等研究场景，为双臂协调操作算法验证提供标准化基准。

背景与挑战

背景概述

在机器人操作领域，Split_aloha_pour_tea数据集由RoboCOIN团队于2025年构建，聚焦于双手机器人执行复杂任务的能力。该数据集以倒茶任务为核心，涵盖抓取、放置、倾倒等精细操作，旨在推动机器人对动态环境的感知与交互研究。其兼容LeRobot框架的设计，为机器人学习算法提供了标准化数据基础，显著促进了家庭与办公场景下自主操作系统的开发进程。

当前挑战

该数据集致力于解决机器人操作中动作协调与物体交互的复杂性挑战，例如精确控制茶壶倾倒角度以避免液体飞溅。构建过程中面临多模态数据同步的难题，需整合三路摄像头视觉流与26维关节状态数据；同时，双机械臂的协同运动轨迹标注要求极高精度，涉及12自由度末端执行器位姿的连续跟踪与语义分割。

常用场景

经典使用场景

在机器人操作学习领域，Split_aloha_pour_tea数据集以其精细的沏茶任务分解成为经典研究工具。该数据集通过1024个完整操作序列，系统记录了双指夹爪机器人执行抓取茶壶、倾倒茶水、放置器具等原子动作的全过程。多视角视觉数据与26维状态动作向量的同步采集，为模仿学习与强化学习算法提供了真实世界的动态交互样本。其涵盖家庭与办公场景的多样化任务配置，显著提升了模型在复杂环境中泛化能力的研究价值。

衍生相关工作

基于该数据集衍生的经典研究主要集中在分层强化学习与行为克隆算法的创新。RoboCOIN团队提出的多任务联合训练框架，通过利用数据集中的子任务标注实现了技能组合的零样本迁移。后续研究则聚焦于时空注意力机制的改进，利用密集的动作状态序列提升长时程任务规划的稳定性。这些工作不仅推动了LeRobot生态系统的完善，更为开源机器人社区建立了可复现的行为学习基准测试体系。

数据集最近研究