five

Open Grounded Planning|AI规划数据集|开放域环境数据集

收藏
arXiv2024-06-05 更新2024-06-21 收录
AI规划
开放域环境
下载链接:
https://github.com/Shiguang-Guo/Open-Grounded-Planning
下载链接
链接失效反馈
资源简介:
Open Grounded Planning数据集是由中国科学院软件研究所构建,旨在评估大型语言模型在开放域环境中的规划能力。该数据集涵盖日常生活、工具使用和机器人控制等多个领域,包含超过76,000个任务,每个任务都有详细的任务目标、约束条件和候选行动集。数据集的创建过程涉及从WikiHow等来源收集原始数据,并将其转换为统一的格式。该数据集主要用于研究如何使AI系统在开放和可执行的行动集中生成可执行的计划,解决AI在复杂任务规划中的挑战。
提供机构:
中国科学院软件研究所
创建时间:
2024-06-05
AI搜集汇总
数据集介绍
main_image_url
构建方式
Open Grounded Planning数据集的构建方式涉及从三个主要领域收集数据,包括日常生活、工具使用和机器人沙盒场景。所有收集的数据都被转换成统一的格式,包括任务目标、约束条件、黄金步骤和候选动作集。在此基础上,开发了一个基准来评估各种模型和方法在Open Grounded Planning任务中的性能。
特点
Open Grounded Planning数据集的特点在于其开放性和可执行性。它要求模型在开放的动作集中生成可执行的计划,并能够在广泛的领域中进行规划。数据集涵盖了各种任务和动作,为LLMs在开放领域中的规划能力提供了挑战。
使用方法
Open Grounded Planning数据集的使用方法包括基准评估和模型训练。基准评估涉及使用不同的指标来评估模型生成计划的可执行性和质量。模型训练涉及使用数据集中的任务和动作来训练模型,以提高其在开放领域中的规划能力。
背景与挑战
背景概述
大型语言模型(LLM)的出现引发了人们对其在人类-like规划中应用的兴趣。现有的基于LLM的规划工作要么专注于利用LLM固有的语言生成能力来生成free-style计划,要么采用强化学习方法来学习在受限环境中的有限动作集内的决策制定。然而,这两种方法在开放性和可执行性要求之间都存在显著差异。在这篇论文中,我们提出了一个新的规划任务——开放接地规划。开放接地规划的主要目标是要求模型基于可变动作集生成可执行的计划,从而确保生成计划的可执行性。为此,我们建立了一个跨越广泛领域的开放接地规划基准。然后,我们测试了当前最先进的LLM以及五种规划方法,发现现有的LLM和方法仍然难以应对开放领域接地规划带来的挑战。本文的结果定义和建立了开放接地规划的基准数据集,并为LLM-based规划的未来挑战和方向提供了启示。
当前挑战
开放接地规划相关的挑战包括: 1) 解决的领域问题:开放接地规划旨在解决LLM在开放领域中的接地规划问题,即要求模型能够从开放的动作集中选择合适的动作生成可执行的计划。 2) 构建过程中遇到的挑战:构建开放接地规划基准数据集的过程中,需要收集来自不同领域的多样化数据,并将其转化为统一的格式,包括任务目标、约束条件、黄金步骤和候选动作集。此外,还需要开发一个自动评估程序来评估不同模型和方法在开放接地规划任务中的性能。
常用场景
经典使用场景
Open Grounded Planning 数据集的构建旨在解决大型语言模型(LLMs)在生成可执行计划时的挑战。该数据集的经典使用场景包括为各种开放领域任务生成可执行的计划,例如日常生活、工具使用和机器人场景。这要求模型能够从开放的动作库中选择合适的动作,并确保生成的计划是可执行的。Open Grounded Planning 数据集为研究人员提供了一个基准,用于评估和改进 LLMs 在开放领域规划任务中的表现。
实际应用
Open Grounded Planning 数据集在实际应用中具有广泛的应用前景。例如,在智能助手和机器人领域,Open Grounded Planning 可以帮助这些系统更好地理解和执行用户的指令,从而提高交互效率和用户体验。此外,该数据集还可以用于自动驾驶汽车和智能控制系统,使这些系统能够更好地规划和执行复杂的任务。Open Grounded Planning 数据集的应用将有助于推动人工智能技术的发展,并为人类生活带来更多便利。
衍生相关工作
Open Grounded Planning 数据集的提出和构建为 LLMs 在开放领域规划任务中的研究提供了新的思路和方向。在此基础上,研究人员可以进一步探索和改进 LLMs 的规划能力,例如通过引入参数化的动作库和更精确的评估指标。此外,Open Grounded Planning 数据集还可以促进 LLMs 在其他领域的应用,例如智能问答、文本生成和机器翻译等。Open Grounded Planning 数据集的提出和应用将为人工智能技术的发展带来新的机遇和挑战。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

中国车牌识别数据集(7类,33万张)

这是一个高质量、平衡的中国车牌识别数据集,包含了33万张各类中国车牌的图片。数据集经过精心设计,确保了图像质量的优秀和大部分各类车牌类型的平衡分布。这个数据集非常适合用于训练和评估车牌识别模型。

魔搭社区 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录