GM-100

github2026-02-03 更新2026-02-05 收录

下载链接：

https://github.com/yuz1wan/GM-X

下载链接

链接失效反馈

官方服务：

资源简介：

GM-100是一个用于评估具身智能代理的基准数据集，包含100个精心策划的任务，涵盖了广泛的长尾行为，并由多个机器人平台收集的超过13,000条专家轨迹支持。

GM-100 is a benchmark dataset for evaluating embodied AI agents. It contains 100 carefully curated tasks covering a wide range of long-tail behaviors, and is supported by over 13,000 expert trajectories collected across multiple robotic platforms.

创建时间：

2026-01-29

原始信息汇总

GM-X 数据集概述

项目简介

GM-X 是一个由 rhos.ai 主导的研究项目。该项目旨在应对当前机器人学习领域任务结构发展滞后于数据规模的挑战。通过整合人类活动知识（HAKE）与物体可供性（Object Affordances），项目团队开发了一个系统化的任务设计框架，专注于识别和评估机器人处理多样化、长尾和复杂交互任务的能力。该框架旨在为具身智能体提供更全面的评估，并鼓励开发日益复杂和多样化的机器人数据集。

作为迈向“机器人学习奥林匹克”的首个里程碑，项目团队发布了 GM-100 基准。该基准包含 100 个精心策划的任务，涵盖了广泛的长尾行为，并得到了在多个机器人平台上收集的超过 13,000 条专家轨迹的支持。GM-X 作为一个基础生态系统，旨在营造一个透明、协作的环境，以推动通用机器人智能的边界。

数据集详情

GM-100 数据集已公开，可用于研究目的。

数据访问与下载

数据集可通过 Hugging Face 页面访问和下载：https://huggingface.co/rhos-ai

可用数据版本：

机器人平台	Lerobot 格式	HDF5 格式
Agilex Cobot Magic	下载链接	/
Dobot Xtrainer	处理中...	下载链接
更多平台	敬请期待	敬请期待

数据集规模与内容

任务数量：100 个。
轨迹数量：超过 13,000 条专家演示轨迹。
任务特点：涵盖广泛的长尾行为，注重细节。
数据收集：在多个机器人平台上进行。

项目动态

[2026-02-03] 任务对象购买链接已在项目页面提供。
[2026-01-18] 项目页面预览版已上线。
[2026-01-16] GM-100 论文已在 arXiv 发布。

引用信息

如果本工作对您的研究有帮助，请考虑引用： bibtex @misc{wang2026greatmarch100100, title={The Great March 100: 100 Detail-oriented Tasks for Evaluating Embodied AI Agents}, author={Ziyu Wang and Chenyuan Liu and Yushun Xiang and Runhao Zhang and Qingbo Hao and Hongliang Lu and Houyu Chen and Zhizhong Feng and Kaiyue Zheng and Dehao Ye and Xianchao Zeng and Xinyu Zhou and Boran Wen and Jiaxin Li and Mingyu Zhang and Kecheng Zheng and Qian Zhu and Ran Cheng and Yong-Lu Li}, year={2026}, eprint={2601.11421}, archivePrefix={arXiv}, primaryClass={cs.RO}, url={https://arxiv.org/abs/2601.11421}, }

许可协议

本项目采用 Apache 2.0 许可证。

搜集汇总

数据集介绍

构建方式

在机器人学习领域，数据集的构建往往面临任务结构滞后于数据规模的挑战。GM-100数据集通过整合人类活动知识与物体可供性，建立了一套系统化的任务设计框架。该框架专注于识别和评估机器人处理多样化、长尾及复杂交互任务的能力。作为实现“机器人学习奥林匹克”愿景的首个里程碑，研究团队精心策划了100项任务，涵盖广泛的长尾行为，并依托多个机器人平台收集了超过13,000条专家演示轨迹，从而构建了这一基准数据集。

特点

GM-100数据集的核心特点在于其任务设计的系统性与多样性。数据集包含的100项任务经过细致筛选，旨在全面覆盖机器人交互中的长尾场景，这些场景往往在传统数据集中被忽略。数据集提供了丰富的专家轨迹，支持对具身智能体进行深入评估。此外，数据集作为一个开放的生态系统，鼓励透明与协作，旨在推动通用机器人智能的边界，为研究社区提供了一个高标准、多平台的评估基准。

使用方法

研究人员可通过公开渠道获取GM-100数据集以用于学术目的。数据集目前托管于Hugging Face平台，支持以Lerobot或HDF5格式下载，并适配于如Agilex Cobot Magic、Dobot Xtrainer等多种机器人平台。使用者可以依据项目页面提供的指南，利用这些轨迹数据进行模型训练、算法验证或性能评估。社区还通过微信、飞书等渠道提供交流支持，方便研究者讨论问题、分享成果或提交新的评估方案，共同促进机器人学习领域的发展。

背景与挑战

背景概述

在机器人学习领域，数据规模与任务结构之间的不匹配长期制约着通用智能体的发展。GM-100数据集由rhos.ai研究团队于2026年发布，作为GM-X研究计划的首个里程碑，旨在通过整合人类活动知识与物体可供性，构建一个系统化的任务设计框架。该数据集聚焦于评估机器人在处理多样化、长尾分布及复杂交互任务中的能力，涵盖了100项精心设计的任务，并收集了超过13,000条跨多机器人平台的专家轨迹，为具身智能体的综合评估奠定了坚实基础，推动了通用机器人智能的边界拓展。

当前挑战

GM-100数据集致力于解决机器人学习领域中对复杂、长尾交互任务进行系统性评估的挑战。其核心在于如何超越传统数据集的局限，设计出既能反映真实世界多样性，又能精确衡量智能体细粒度操作能力的任务体系。在构建过程中，研究团队面临多重挑战：首先，需将抽象的人类活动知识与具体的物体可供性有效融合，以定义具有语义一致性的任务结构；其次，跨平台数据采集要求协调不同机器人的硬件差异，确保轨迹数据的标准化与可比性；此外，长尾行为的覆盖需平衡任务的广度与深度，避免数据偏差，从而构建一个全面且均衡的评估基准。

常用场景

经典使用场景

在机器人学习领域，GM-100数据集为评估具身智能体的综合能力提供了标准化基准。其经典使用场景集中于系统化测试机器人在多样化、长尾及复杂交互任务中的表现，例如通过超过13,000条专家轨迹支持的任务执行，涵盖从日常操作到精细动作的广泛行为。研究者利用该数据集训练和验证模型，以探索机器人在非结构化环境中的适应性与泛化能力，从而推动通用机器人智能的发展。

衍生相关工作

围绕GM-100数据集，已衍生出多项经典研究工作，包括基于其任务框架的强化学习算法优化、多模态感知模型集成以及跨平台迁移学习策略的开发。这些工作扩展了数据集在机器人模仿学习、任务规划及人机交互等方向的应用，并催生了如“机器人学习奥运会”等倡议，推动社区在透明协作环境中共同探索通用机器人智能的前沿边界。

数据集最近研究