five

NLtoPDDL Action Sequence Extraction datasets

收藏
github2022-12-16 更新2024-05-31 收录
下载链接:
https://github.com/Shivam-Miglani/nltopddl_datasets
下载链接
链接失效反馈
官方服务:
资源简介:
用于EASDRL和NLtoPDDL的原始和标注数据集,包括窗户、烹饪、WikiHow家庭和园艺相关内容。

The original and annotated datasets for EASDRL and NLtoPDDL, including content related to windows, cooking, WikiHow home, and gardening.
创建时间:
2022-08-25
原始信息汇总

NLtoPDDL Action Sequence Extraction datasets 概述

数据集内容

  • annotated_pickles: 包含原始的pickles文件,来源于Fence/EASDRL项目。
  • raw: 包含原始文件,同样来源于Fence/EASDRL项目。
  • ceasdrl_act_data.ipynb: 用于可视化嵌入的Jupyter笔记本。
  • *.csv: 包含状态的文件,包括嵌入、距离和地面实况动作信息。
  • nltopddl_data_emb_gen.ipynb: 用于生成带有嵌入的状态的Jupyter笔记本,使用Flair库生成CSV文件。支持Flair库提供的其他嵌入类型。

数据集应用领域

  • 数据集主要用于EASDRL项目中的动作序列提取,涉及领域包括窗户、烹饪、WikiHow家庭和园艺。
搜集汇总
数据集介绍
main_image_url
构建方式
NLtoPDDL Action Sequence Extraction数据集的构建基于自然语言到PDDL(Planning Domain Definition Language)的转换任务,旨在从文本中提取动作序列。数据集通过Fence/EASDRL框架生成,原始数据包括从多个领域(如Windows操作指南、烹饪教程、WikiHow家庭与园艺)中提取的文本。数据预处理阶段使用Flair库生成文本嵌入,并结合距离计算和真实动作标签,形成包含状态信息的CSV文件。
使用方法
使用NLtoPDDL数据集时,用户可通过提供的Jupyter Notebook文件(如ceasdrl_act_data.ipynb)进行数据可视化与分析。数据集中的CSV文件可直接用于训练模型,其中包含的状态信息(如嵌入和距离)可用于动作序列预测任务。用户还可利用nltopddl_data_emb_gen.ipynb文件生成自定义嵌入,扩展数据集的适用性。通过结合Flair库,用户能够灵活地调整嵌入生成策略,以适应不同的研究需求。
背景与挑战
背景概述
NLtoPDDL Action Sequence Extraction数据集由EASDRL研究团队开发,旨在解决自然语言到PDDL(Planning Domain Definition Language)动作序列的转换问题。该数据集创建于近年,主要应用于自动化规划和智能系统领域,涵盖了多个实际场景,如窗户操作、烹饪、家居和园艺等。通过提供原始和注释数据,该数据集为研究人员提供了一个丰富的资源,用于训练和评估自然语言处理与规划系统之间的接口模型。其核心研究问题在于如何从自然语言描述中提取出可执行的规划动作序列,从而推动智能系统在复杂任务中的自主决策能力。
当前挑战
NLtoPDDL数据集面临的挑战主要集中在两个方面。其一,自然语言到PDDL的转换本身具有高度复杂性,涉及语义理解、上下文推理以及动作序列的精确生成,这对模型的泛化能力和鲁棒性提出了极高要求。其二,数据集的构建过程中,如何确保注释的准确性和一致性是一个关键问题,尤其是在多场景、多任务的环境下,不同领域的语言表达和动作逻辑差异显著,增加了数据标注的难度。此外,生成具有代表性的状态嵌入(embeddings)并保持其与真实动作的关联性,也是构建过程中需要克服的技术挑战。
常用场景
经典使用场景
NLtoPDDL Action Sequence Extraction数据集在自然语言处理与自动规划领域具有重要应用,特别是在将自然语言描述转换为PDDL(Planning Domain Definition Language)格式的动作序列方面。该数据集广泛应用于智能系统开发,帮助研究人员和开发者理解如何从非结构化文本中提取出可执行的规划任务。通过提供丰富的标注数据,该数据集为模型训练和验证提供了坚实的基础,尤其是在处理复杂任务如窗口操作、烹饪步骤、家庭园艺等场景时,展现了其独特的价值。
解决学术问题
NLtoPDDL数据集解决了自然语言到规划语言的转换难题,这一问题是智能系统开发中的核心挑战之一。通过提供高质量的标注数据,该数据集支持了从文本中提取动作序列的研究,推动了自动规划领域的发展。其意义在于为学术界提供了一个标准化的基准,使得不同模型和方法可以在同一框架下进行对比和优化,从而加速了相关技术的进步。
实际应用
在实际应用中,NLtoPDDL数据集被广泛用于智能助手、家庭自动化系统以及工业自动化领域。例如,在智能家居系统中,该数据集可以帮助系统理解用户的语言指令并将其转化为具体的设备操作步骤。此外,在工业场景中,该数据集可以用于优化生产流程,通过将自然语言描述的任务转化为可执行的规划指令,从而提高生产效率并减少人为错误。
数据集最近研究
最新研究方向
近年来,NLtoPDDL Action Sequence Extraction数据集在自然语言处理与自动化规划领域引起了广泛关注。该数据集的核心在于将自然语言描述转化为可执行的PDDL(Planning Domain Definition Language)动作序列,这一过程在智能系统、机器人控制及自动化任务规划中具有重要应用。研究者们正致力于通过深度学习模型,如Flair库中的嵌入技术,进一步提升动作序列的生成精度与效率。此外,结合强化学习方法,如EASDRL(Embedding-based Action Sequence Discovery via Reinforcement Learning),探索如何在复杂环境中优化动作序列的提取与执行,已成为当前研究的热点。这一方向不仅推动了自动化规划技术的发展,也为智能系统的自主决策能力提供了新的研究视角。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作