cstrathe435/Task2Dial
收藏Hugging Face2022-02-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cstrathe435/Task2Dial
下载链接
链接失效反馈官方服务:
资源简介:
Task2Dial数据集包括(1)一组包含353个独立对话的食谱文档;(2)基于相关食谱文档的信息提供者(IG)和信息跟随者(IF)之间的对话。该数据集展示了对话中的样本话语及其相关食谱,并展示了数据集的一些重要特征,例如提及食谱文档中不存在的实体;重新组合原始文本以聚焦于重要步骤;将食谱分解为可管理和适当的步骤。该数据集已免费提供,以支持NLG研究的标准化。
提供机构:
cstrathe435
原始信息汇总
数据集概述
数据集名称
Task2Dial
数据集摘要
Task2Dial数据集包含353个基于真实对话的烹饪食谱文档,以及信息给予者(IG)和信息跟随者(IF)之间的对话。该数据集展示了如何将原始文本重新组合,聚焦重要步骤,并将食谱分解为可管理和适当的步骤。
支持的任务
该数据集用于实现一个名为chefbot的对话代理,具体实现见GitHub仓库:https://github.com/carlstrath/ChefBot。
语言
英语
数据结构
- 数据集1:Task2Dial主数据集,包含353个烹饪食谱,基于真实对话。
- 数据集2:Task2Dial数据集中每个可替换配料的替代配料列表。
- 数据集3:包含对象和工具的列表,附有解释、比较、处理和常见存储位置信息。
数据集创建
- 数据收集:数据来源于三个开放源和创意共享许可的烹饪网站。
- 数据标注:由两名男性和一名女性数据管理员组成的团队进行标注,团队成员年龄在25岁以下,具有AI和计算经验。
使用数据注意事项
- 数据局限性:目前仅限于烹饪领域,但可用于模型其他任务,如家具组装和维护任务。
- 社会影响:旨在推动研究现代对话系统,解决灵活性和依赖领域知识的挑战。
附加信息
- 许可证:CC
- 引用信息:https://aclanthology.org/2021.icnlsp-1.28/
- 资助信息:由EPSRC项目CiViL(EP/T014598/1)和NLG for low-resource domains(EP/T024917/1)支持。



