five

AgiBot World|机器人数据集|具身智能数据集

收藏
github2024-12-30 更新2024-12-30 收录
机器人
具身智能
下载链接:
https://github.com/OpenDriveLab/agibot-world
下载链接
链接失效反馈
资源简介:
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
提供机构:
智元机器人、上海人工智能实验室等
创建时间:
2024-12-30
原始信息汇总

AgiBot World 数据集概述

数据集特点

  • 数据规模: 包含来自100个机器人的超过一百万条轨迹。
  • 场景多样性: 涵盖5个目标领域的100多个真实世界场景。
  • 硬件配置: 使用先进的硬件设备,包括视觉触觉传感器、6自由度灵巧手和移动双臂机器人。
  • 任务类型: 涉及接触丰富的操作、长时程规划以及多机器人协作任务。

数据集获取与预处理

  • 数据获取: 使用Git LFS克隆数据集,访问地址为 https://huggingface.co/datasets/agibot-world/AgiBotWorld-Alpha。
  • 预处理: 使用 lerobot 库进行数据预处理,具体脚本为 convert_to_lerobot.py

训练

  • 训练方法: 提供了一个简单的Diffusion Policy训练示例,参考Jupyter笔记本 https://github.com/OpenDriveLab/AgiBot-World/blob/main/AgibotWorld.ipynb。

未来计划

  • AgiBot World Beta: 预计在2025年第一季度发布,包含约一百万条高质量机器人轨迹。
  • AgiBot World Colosseum: 计划于2025年推出,将作为一个综合平台。
  • 2025 AgiBot World Challenge: 计划于2025年举办。

许可与引用

  • 许可: 数据集和代码均采用 CC BY-NC-SA 4.0 许可。
  • 引用: 如果数据集对您的研究有帮助,请考虑引用我们的项目。

BibTeX @misc{contributors2024agibotworldrepo, title={AgiBot World Colosseum}, author={AgiBot World Colosseum contributors}, howpublished={url{https://github.com/OpenDriveLab/AgiBot-World}}, year={2024} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
AgiBot World数据集的构建依托于100台机器人在100多种真实场景中的操作轨迹,涵盖了接触式操作、长时程规划以及多机器人协作等复杂任务。数据采集过程中采用了先进的硬件设备,如视觉触觉传感器、6自由度灵巧手和移动双臂机器人,确保了数据的多样性和高质量。数据集通过Hugging Face平台发布,用户可通过Git LFS进行下载,并提供了详细的预处理脚本,便于后续研究使用。
使用方法
使用AgiBot World数据集时,用户需首先通过Git LFS从Hugging Face平台克隆数据。数据集提供了预处理脚本,可将数据转换为lerobot格式,便于后续分析。用户还可参考提供的Jupyter Notebook进行简单的扩散策略训练。数据集的开放性和易用性使其能够广泛应用于机器人学习、规划和控制等领域的研究。
背景与挑战
背景概述
AgiBot World数据集由OpenDriveLab团队于2024年推出,旨在为机器人学领域提供大规模、多场景的机器人轨迹数据。该数据集包含超过一百万条来自100台机器人的轨迹,覆盖了100多个真实世界场景,涉及五个目标领域。其核心研究问题聚焦于接触丰富的操作、长时程规划以及多机器人协作等复杂任务。通过引入先进的硬件设备,如视觉触觉传感器、六自由度灵巧手和移动双臂机器人,AgiBot World为机器人学的研究与应用提供了强有力的数据支持,推动了智能机器人在复杂环境中的自主决策与协作能力的发展。
当前挑战
AgiBot World数据集在解决机器人学领域的复杂任务时面临多重挑战。首先,接触丰富的操作和长时程规划任务对数据的精确性和多样性提出了极高要求,如何确保数据的高质量与广泛覆盖成为关键难题。其次,多机器人协作场景的构建需要协调多个机器人的行为,这对数据采集的同步性与一致性提出了严峻考验。在数据集构建过程中,硬件设备的复杂性以及数据采集环境的多样性也增加了数据处理的难度。此外,如何高效地预处理和标注大规模轨迹数据,以支持后续的模型训练与评估,同样是数据集开发过程中不可忽视的挑战。
常用场景
经典使用场景
AgiBot World数据集在机器人学领域中被广泛应用于复杂任务的模拟与训练。其包含的百万级轨迹数据和高精度硬件配置,使得研究人员能够在多样化的真实场景中进行接触式操作、长时程规划以及多机器人协作的实验。这些数据为机器人算法的开发与优化提供了丰富的实验环境,特别是在需要高精度和复杂交互的任务中,AgiBot World成为了不可或缺的基准数据集。
解决学术问题
AgiBot World数据集解决了机器人学中多个关键学术问题。首先,它通过提供大量真实场景下的轨迹数据,帮助研究人员更好地理解机器人在复杂环境中的行为模式。其次,数据集中的多机器人协作任务为研究分布式控制和协同算法提供了实验平台。此外,数据集中的接触式操作任务为开发更精确的触觉反馈和力控制算法提供了数据支持。这些问题的解决推动了机器人学领域的理论进步和技术创新。
实际应用
在实际应用中,AgiBot World数据集被广泛用于工业自动化、服务机器人以及医疗机器人等领域。例如,在工业自动化中,数据集中的多机器人协作任务可以用于优化生产线上的机器人协同工作流程。在服务机器人领域,数据集中的长时程规划任务有助于开发更智能的家用机器人。此外,医疗机器人领域的研究人员可以利用数据集中的接触式操作任务,开发更精确的手术机器人系统。这些应用展示了AgiBot World数据集在推动机器人技术实际落地中的重要作用。
数据集最近研究
最新研究方向
在机器人技术领域,AgiBot World数据集以其丰富的轨迹数据和多样化的真实场景,为接触式操作、长时程规划以及多机器人协作等前沿研究提供了重要支持。该数据集涵盖了超过一百万条来自100个机器人的轨迹,覆盖了五大目标领域的100多个真实场景,结合了视觉触觉传感器、六自由度灵巧手和移动双臂机器人等尖端硬件设备。近期,AgiBot World的演示版本已发布,进一步推动了其在机器人学习和智能控制中的应用。未来,随着AgiBot World Beta和Colosseum平台的推出,预计将带来更多高质量的数据和全面的研究平台,为2025年的AgiBot World挑战赛奠定基础。这一系列进展不仅加速了机器人技术的创新,也为多领域交叉研究提供了新的可能性。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

ChinaTravel

ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。

arXiv 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录