AgiBot World|机器人数据集|具身智能数据集
收藏AgiBot World 数据集概述
数据集特点
- 数据规模: 包含来自100个机器人的超过一百万条轨迹。
- 场景多样性: 涵盖5个目标领域的100多个真实世界场景。
- 硬件配置: 使用先进的硬件设备,包括视觉触觉传感器、6自由度灵巧手和移动双臂机器人。
- 任务类型: 涉及接触丰富的操作、长时程规划以及多机器人协作任务。
数据集获取与预处理
- 数据获取: 使用Git LFS克隆数据集,访问地址为 https://huggingface.co/datasets/agibot-world/AgiBotWorld-Alpha。
- 预处理: 使用
lerobot
库进行数据预处理,具体脚本为convert_to_lerobot.py
。
训练
- 训练方法: 提供了一个简单的Diffusion Policy训练示例,参考Jupyter笔记本 https://github.com/OpenDriveLab/AgiBot-World/blob/main/AgibotWorld.ipynb。
未来计划
- AgiBot World Beta: 预计在2025年第一季度发布,包含约一百万条高质量机器人轨迹。
- AgiBot World Colosseum: 计划于2025年推出,将作为一个综合平台。
- 2025 AgiBot World Challenge: 计划于2025年举办。
许可与引用
- 许可: 数据集和代码均采用 CC BY-NC-SA 4.0 许可。
- 引用: 如果数据集对您的研究有帮助,请考虑引用我们的项目。
BibTeX @misc{contributors2024agibotworldrepo, title={AgiBot World Colosseum}, author={AgiBot World Colosseum contributors}, howpublished={url{https://github.com/OpenDriveLab/AgiBot-World}}, year={2024} }

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录