hongyan_transfer_bottle_double_hand_vedio_test

Hugging Face2025-12-02 更新2025-12-03 收录

下载链接：

https://huggingface.co/datasets/gaozj/hongyan_transfer_bottle_double_hand_vedio_test

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个机器人技术数据集，包含了16个集，共计12865帧，1个任务。数据集使用Apache-2.0许可证。每个集以Parquet格式存储，并且包含了多种观察和动作特征，如图像、状态、动作等。

创建时间：

2025-12-02

原始信息汇总

数据集概述

基本信息

数据集名称: hongyan_transfer_bottle_double_hand_vedio_test
创建工具: LeRobot (https://github.com/huggingface/lerobot)
许可证: Apache-2.0
任务类别: 机器人学
标签: LeRobot, teleop, panda

数据集结构

总情节数: 16
总帧数: 12865
总任务数: 1
总视频数: 0
数据块数: 1
块大小: 1000
帧率: 20 FPS
数据分割: 训练集 (0:16)
数据格式: Parquet
数据存储路径模式: data/chunk-{episode_chunk:03d}/episode_{episode_index:06d}.parquet
视频存储路径模式: videos/chunk-{episode_chunk:03d}/{video_key}/episode_{episode_index:06d}.mp4

特征字段

图像观测

observation.images.image: 图像，形状 [224, 224, 3]
observation.images.left_wrist_image: 左腕图像，形状 [224, 224, 3]
observation.images.right_wrist_image: 右腕图像，形状 [224, 224, 3]
observation.images.image_video: 视频图像，形状 [224, 224, 3]
observation.images.left_wrist_image_video: 左腕视频图像，形状 [224, 224, 3]
observation.images.right_wrist_image_video: 右腕视频图像，形状 [224, 224, 3]

状态观测

observation.state: 浮点32，形状 [16]
- 包含字段: left_pos_x, left_pos_y, left_pos_z, left_quat_x, left_quat_y, left_quat_z, left_quat_w, left_gripper, right_pos_x, right_pos_y, right_pos_z, right_quat_x, right_quat_y, right_quat_z, right_quat_w, right_gripper

动作

action: 浮点32，形状 [14]
- 包含字段: left_dpos_x, left_dpos_y, left_dpos_z, left_drotvec_x, left_drotvec_y, left_drotvec_z, left_gripper, right_dpos_x, right_dpos_y, right_dpos_z, right_drotvec_x, right_drotvec_y, right_drotvec_z, right_gripper

索引与时间戳

timestamp: 浮点32，形状 [1]
frame_index: 整型64，形状 [1]
episode_index: 整型64，形状 [1]
index: 整型64，形状 [1]
task_index: 整型64，形状 [1]

元数据

代码库版本: v2.1
机器人类型: 未指定

引用信息

主页: 信息缺失
论文: 信息缺失
BibTeX引用: 信息缺失

搜集汇总

数据集介绍

构建方式

在机器人遥操作领域，高质量的数据采集是提升模型泛化能力的关键。该数据集依托LeRobot平台构建，通过双机械臂系统执行瓶体转移任务，以20帧每秒的速率采集了16条完整轨迹，共计12865帧数据。数据以Parquet格式存储，每条轨迹被划分为若干数据块，确保了高效的数据读取与处理。观测信息融合了多视角图像与状态向量，其中图像数据涵盖全局视角及左右腕部摄像头视角，均统一为224x224像素的RGB格式；状态向量则精确记录了双机械臂末端执行器的位置、四元数朝向及夹爪开合状态，为机器人模仿学习提供了丰富的时空上下文。

特点

该数据集在机器人操作任务中展现出鲜明的多模态特性。其核心在于同步采集了六路视觉信息，包括全局固定视角、左右腕部视角及其对应的视频流，形成了对操作场景的全方位覆盖。状态观测维度设计精细，16维向量完整编码了双机械臂的位姿与夹爪状态；动作空间则采用14维增量控制指令，直接对应机械臂的位移、旋转与夹爪操作。数据组织遵循标准化的分块存储结构，支持按轨迹索引快速访问，且所有数据均附带时间戳与帧索引，保证了时序对齐的精确性，为端到端的策略学习提供了结构清晰、信息完备的数据基础。

使用方法

针对机器人模仿学习的研究需求，该数据集可直接用于训练视觉-动作映射模型。研究者可通过加载Parquet文件访问结构化数据，其中观测字段包含图像与状态，动作字段提供对应的控制指令。数据集默认划分为训练集，涵盖全部16条轨迹，用户可依据帧索引或轨迹索引进行数据切片与批处理。在模型训练过程中，可综合利用多路图像输入增强视觉表征，并结合状态信息提升策略的精确性。该数据集兼容主流机器人学习框架，能够支持行为克隆、逆强化学习等多种算法验证，为双机械臂协同操作任务的算法开发与性能评估提供了标准化数据接口。

背景与挑战

背景概述

在机器人操作领域，双手机器人协同执行复杂任务的研究正逐渐成为前沿热点。hongyan_transfer_bottle_double_hand_vedio_test数据集应运而生，它依托于LeRobot开源框架构建，专注于双手机器人（如Panda机械臂）在物体转移任务中的视觉与状态数据采集。该数据集通过记录多视角图像（包括全局视角及左右腕部视角）以及高维状态与动作向量，旨在为模仿学习与强化学习算法提供丰富的训练资源，推动机器人灵巧操作能力的提升。尽管其创建时间与具体研究团队信息尚未公开，但数据集的结构设计体现了对机器人多模态感知与精细控制问题的深入关注，有望为家庭服务或工业自动化场景中的双臂协同作业研究提供关键数据支撑。

当前挑战

该数据集致力于解决双手机器人协同操作中的物体转移问题，其核心挑战在于如何从多视角视觉输入与高维状态空间中学习出稳健且精确的控制策略。具体而言，任务涉及复杂的时空协调，要求模型同时理解全局场景与局部细节，并生成同步的双臂动作序列，这对算法的表征学习与动作规划能力提出了极高要求。在构建过程中，数据采集面临诸多困难，例如多摄像头同步校准、高频率传感器数据融合以及真实环境中动作执行的随机性与噪声干扰，这些因素均增加了数据的一致性与质量保障难度。此外，数据规模相对有限，可能制约了深度学习模型泛化性能的充分挖掘。

常用场景

经典使用场景

在机器人操作领域，双手机器人执行复杂物体转移任务一直是研究热点。该数据集通过记录Panda机器人双臂协作转移瓶子的视频与状态数据，为模仿学习与强化学习算法提供了宝贵的训练资源。其经典使用场景在于构建端到端的视觉运动策略模型，研究者可利用多视角图像观测与精确的动作标签，训练神经网络直接从视觉输入预测机器人末端执行器的运动指令，实现精细的双臂协调操作。

解决学术问题

该数据集有效应对了机器人学中双臂协同操作缺乏高质量真实世界数据的挑战。它通过提供同步的多模态观测——包括全局视角、左右腕部视角的图像以及机器人的状态信息——为解决视觉伺服、动作分割与长期任务规划等关键问题奠定了数据基础。其意义在于推动了数据驱动机器人控制方法的发展，降低了在真实机器人平台进行试错学习的成本与风险，为泛化性强的操作策略研究提供了可重复的基准。

衍生相关工作

基于此类高质量机器人操作数据集，研究社区已衍生出诸多经典工作。例如，在模仿学习框架下，出现了基于Transformer架构的行为克隆模型，以处理长序列的视觉与状态数据。在强化学习领域，该数据集常被用作离线强化学习的基准，用于评估算法从历史数据中提取有效策略的能力。此外，它也促进了多模态表示学习的研究，旨在从图像与状态数据中提取鲁棒的任务相关特征，以提升策略的泛化性能。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集