three_goals_gc
收藏Hugging Face2026-01-21 更新2026-01-22 收录
下载链接:
https://huggingface.co/datasets/Elianak/three_goals_gc
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个机器人相关数据集,使用LeRobot工具创建。包含150个episodes,38338帧数据,数据以parquet格式存储。数据集包含多种特征,如动作(16维浮点数)、观测状态(46维浮点数,包括左右机械臂的位置、夹持器状态、末端执行器位置和四元数等)、环境状态(14维浮点数,包括目标立方体和橙色立方体的位置和四元数等),以及时间戳、帧索引、episode索引等信息。数据分块存储,每块1000帧,总数据文件大小为100MB,视频文件大小为500MB(但视频路径为空)。帧率为20fps,所有数据用于训练集。
创建时间:
2026-01-20
原始信息汇总
数据集概述
基本信息
- 数据集名称: Elianak/three_goals_gc
- 创建工具: LeRobot (https://github.com/huggingface/lerobot)
- 许可证: Apache-2.0
- 任务类别: 机器人学
- 标签: LeRobot
数据集结构
- 配置名称: default
- 数据文件: data//.parquet
- 总任务数: 1
- 总情节数: 150
- 总帧数: 38338
- 帧率: 20 FPS
- 数据块大小: 1000
- 数据文件大小: 100 MB
- 视频文件大小: 500 MB
- 数据分割: 训练集 (0:150)
- 数据路径: data/chunk-{chunk_index:03d}/file-{file_index:03d}.parquet
- 视频路径: 无
数据特征
动作
- 数据类型: float32
- 形状: [16]
- 名称: action_0 至 action_15
观测状态
- 数据类型: float32
- 形状: [46]
- 名称: 包含左/右机械臂关节位置(余弦和正弦分量)、左/右机械臂第7关节位置、左/右夹爪积分值、左/右末端执行器位置(x, y, z)和四元数(w, x, y, z)。
环境状态
- 数据类型: float32
- 形状: [14]
- 名称: 包含目标立方体和橙色立方体的位置(x, y, z)和四元数(w, x, y, z)。
元数据
- 时间戳: 数据类型 float32,形状 [1]。
- 帧索引: 数据类型 int64,形状 [1]。
- 情节索引: 数据类型 int64,形状 [1]。
- 索引: 数据类型 int64,形状 [1]。
- 任务索引: 数据类型 int64,形状 [1]。
附加信息
- 代码库版本: v3.0
- 机器人类型: frank
- 主页: 未提供
- 论文: 未提供
- 引用: 未提供
搜集汇总
数据集介绍

构建方式
在机器人操作领域,three_goals_gc数据集依托LeRobot平台构建而成,专为双臂机器人任务设计。该数据集通过Frank型机器人采集了150个完整的情节,总计包含38338帧数据,以20帧每秒的速率记录。数据以分块形式存储于Parquet文件中,每块约1000帧,确保了高效的数据管理与访问。每个数据点均包含机器人的动作指令、关节状态、末端执行器位姿以及环境物体位置等多维信息,为机器人学习提供了丰富的时序交互记录。
特点
该数据集的核心特点在于其精细的结构化表示,动作空间采用16维浮点向量刻画机器人控制指令,状态观测则整合了46维的机器人本体状态与14维的环境物体状态。观测数据不仅包含左右机械臂的关节角度正弦余弦编码,还精确记录了末端执行器的三维位置与四元数姿态,以及目标立方体与橙色立方体的空间位姿。这种多维度的特征设计使得数据集能够全面反映机器人操作过程中的动态变化,为模仿学习与强化学习算法提供了高质量的输入输出对应关系。
使用方法
使用该数据集时,研究者可通过LeRobot框架直接加载Parquet格式的数据文件,利用其预定义的特征结构进行模型训练与评估。数据集已划分为训练集,涵盖全部150个情节,适用于机器人策略学习任务。用户可依据帧索引、情节索引等元数据灵活提取时序片段,结合动作与状态观测数据构建训练样本。由于数据包含精确的时间戳与环境状态,该数据集特别适合用于开发双臂协调操作、物体抓取与摆放等复杂任务的机器学习模型,推动机器人自主操作能力的研究进展。
背景与挑战
背景概述
在机器人学习领域,模仿学习与强化学习的发展亟需高质量、结构化的真实世界交互数据作为支撑。Three_goals_gc数据集应运而生,它依托于LeRobot开源框架构建,专注于双机械臂(Frank型号)在复杂环境下的多目标操作任务。该数据集收录了150个完整交互片段,总计超过38000帧数据,以每秒20帧的速率捕捉了机械臂的关节状态、末端执行器位姿以及环境物体的精确空间信息。其核心研究问题在于如何通过大规模演示数据,训练机器人执行精确的序列化操作,例如物体抓取与摆放,从而推动机器人自主决策与控制能力的边界。尽管相关论文与主页信息暂未公开,但数据集本身以其细致的特征标注和Apache 2.0开源许可,为学术界与工业界提供了宝贵的实验资源,有望加速机器人灵巧操作算法的迭代与验证。
当前挑战
该数据集旨在应对机器人多目标操作任务中的核心挑战,即如何在动态、非结构化的环境中实现长期、连贯的动作规划与执行。具体而言,挑战体现在模型需从高维观测数据(如46维关节状态与14维环境状态)中推断出有效的16维动作序列,并处理传感器噪声、机械延迟以及物体间的物理交互不确定性。在构建过程中,数据采集面临诸多困难:确保双机械臂动作的同步性与安全性、精确记录物体六自由度位姿(位置与四元数)、维持数据的时间一致性(通过时间戳与帧索引),以及将大规模原始传感器流高效压缩为结构化Parquet格式。此外,数据规模的扩展(当前约150个任务)与任务多样性的提升,亦是未来亟待突破的瓶颈。
常用场景
经典使用场景
在机器人操作学习领域,three_goals_gc数据集为双臂机器人(如Frank机器人)的多目标操作任务提供了丰富的演示数据。该数据集通过记录机器人在执行任务过程中的状态观测、动作序列及环境信息,为模仿学习与强化学习算法的训练与验证奠定了数据基础。经典使用场景包括利用这些轨迹数据训练策略模型,使机器人能够学习如何协调双臂完成复杂的抓取、放置或组装等操作,从而在仿真或现实环境中实现自主执行多步骤任务。
解决学术问题
该数据集主要致力于解决机器人学中多目标序列操作任务的泛化与学习效率问题。通过提供结构化的高维状态-动作对数据,它帮助研究者克服在稀疏奖励环境下策略探索的困难,并促进了对跨任务知识迁移、长期规划以及动态环境适应等核心学术问题的探索。其意义在于为数据驱动的机器人学习方法提供了标准化基准,推动了从仿真到实物的迁移学习研究,并加速了智能体在复杂操作场景中的能力提升。
衍生相关工作
围绕three_goals_gc数据集,已衍生出一系列专注于机器人操作学习的经典研究工作。这些工作通常利用数据集中的演示轨迹,开发先进的模仿学习算法如行为克隆与逆强化学习,或结合离线强化学习技术以提升样本效率。此外,许多研究以此为基础,探索多任务学习、分层策略分解以及视觉-动作表征学习等方法,进一步推动了机器人自主操作能力的边界,并为后续更大规模数据集的构建与算法评估提供了重要参考。
以上内容由遇见数据集搜集并总结生成



