five

WikiHow Planning recipes Dataset

收藏
github2021-07-29 更新2024-05-31 收录
下载链接:
https://github.com/pucrs-automated-planning/wikihow-planning-recipes-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集用于评估从自然语言逐步指令生成规划域的工作,并提供了所有必要的脚本来生成WikiHow食谱数据集。

This dataset is designed for evaluating the task of generating planning domains from step-by-step natural language instructions. It includes all necessary scripts for generating the WikiHow recipe dataset.
创建时间:
2020-09-12
原始信息汇总

数据集概述

名称: WikiHow Planning recipes Dataset

描述: 该数据集用于评估论文《Planning Domain Generation from Natural Language Step-by-Step Instructions》,该论文发表于2020年的KEPS@ICAPS研讨会。数据集包含生成WikiHow食谱所需的全部脚本。

数据集组成

  • 文件列表: 提供了一个文件列表wikihow-recipes-url.txt,列出了构成数据集的所有文件。

使用方法

  • 下载: 通过执行run.py --wikihow-dataset-dir [destination directory]来下载数据集。如果目标目录不存在,脚本将尝试创建它。

引用信息

  • 论文引用: Bibtex @inproceedings{Steinert2020, author = {Maur{i}cio Steinert and Felipe Meneguzzi}, title = {{Planning Domain Generation from Natural Language Step-by-Step Instructions}}, booktitle = {Proceedings of the 2020 Workshop on Knowledge Engineering for Planning and Scheduling (KEPS@ICAPS)}, year = {2020} }

  • 数据集引用: Bibtex @dataset{mauricio_steinert_2020_4056933, author = {Maurício Steinert and Felipe Meneguzzi}, title = {{WikiHow Planning recipes Dataset: Code companion for KEPS 2020}}, month = sep, year = 2020, publisher = {Zenodo}, version = {keps-2020}, doi = {10.5281/zenodo.4056933}, url = {https://doi.org/10.5281/zenodo.4056933} }

注意事项

  • 网络问题: 如果遇到网络连接问题,可以重新运行脚本,下载将从停止的地方继续。
  • 质量审查文章: 质量审查中的文章下载失败时,会在error.log文件中添加一条记录。如需使用与数据集相同的语料库进行基准测试,可下载wikihow-planning-recipes-data.zip文件。
搜集汇总
数据集介绍
main_image_url
构建方式
WikiHow Planning recipes数据集的构建基于WikiHow网站上的自然语言逐步指导文章。研究者通过Python脚本自动化地从WikiHow提取相关文章,并生成结构化数据。该过程涉及下载指定文章列表中的内容,并将其转换为适合规划领域生成任务的格式。为确保数据的可复现性,研究者提供了详细的文件列表和脚本,便于其他研究者进行结果对比或数据重建。
特点
该数据集的特点在于其专注于自然语言逐步指导的规划领域生成任务。数据集中包含了从WikiHow提取的丰富多样的步骤式指导文章,涵盖了广泛的日常任务和复杂操作。这些文章经过结构化处理,适合用于自然语言处理与规划算法的研究。数据集还提供了详细的错误日志和下载恢复机制,确保数据获取的完整性和可靠性。
使用方法
使用WikiHow Planning recipes数据集时,用户需通过运行提供的Python脚本进行数据下载。脚本支持指定目标目录,并自动创建目录结构。若下载过程中断,脚本支持断点续传,确保数据获取的连续性。数据集的使用场景包括规划领域生成、自然语言理解等研究任务。用户可通过引用相关论文或数据集DOI,确保学术研究的规范性和可追溯性。
背景与挑战
背景概述
WikiHow Planning Recipes Dataset 是由 Maurício Steinert 和 Felipe Meneguzzi 于2020年创建的,旨在支持从自然语言逐步指令生成规划领域的研究。该数据集基于WikiHow平台上的步骤式指导内容,主要用于评估在2020年知识工程与规划调度研讨会(KEPS@ICAPS)上发表的论文《Planning Domain Generation from Natural Language Step-by-Step Instructions》中的方法。该数据集为自然语言处理与自动规划领域的交叉研究提供了重要的实验基础,推动了从非结构化文本中提取结构化规划知识的进展。
当前挑战
该数据集的核心挑战在于如何从非结构化的自然语言文本中提取出可用于自动规划的领域知识。WikiHow的步骤式指导内容虽然提供了丰富的操作步骤,但其语言表达多样且复杂,如何准确解析并转化为规划领域模型是一个关键难题。此外,数据集的构建过程中也面临了技术挑战,例如网络连接问题可能导致下载中断,部分文章因WikiHow的质量审核而无法下载,这些因素增加了数据集的获取与复现难度。为了确保数据集的完整性与一致性,研究人员需处理这些技术障碍,并确保数据的准确性与可用性。
常用场景
经典使用场景
WikiHow Planning Recipes Dataset 在自然语言处理领域中被广泛用于评估从自然语言生成规划领域模型的能力。该数据集通过提供详细的步骤指导,帮助研究人员开发和测试算法,以自动解析和理解复杂的任务描述,进而生成可执行的规划领域模型。这一过程不仅提升了自然语言理解的技术水平,还为自动化规划系统的开发提供了坚实的基础。
实际应用
在实际应用中,WikiHow Planning Recipes Dataset 被广泛应用于智能助手、自动化任务执行系统以及教育技术领域。例如,智能助手可以利用该数据集中的步骤指导,帮助用户完成复杂的日常任务,如烹饪、维修等。此外,教育技术领域也可以利用这些数据开发智能教学系统,为学生提供个性化的学习指导。
衍生相关工作
基于 WikiHow Planning Recipes Dataset,许多经典研究工作得以展开。例如,研究人员开发了多种自然语言到规划领域的转换算法,并提出了新的评估指标来衡量这些算法的性能。此外,该数据集还激发了更多关于任务分解、语义解析和自动化规划的研究,推动了相关领域的快速发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作