Heriot-WattUniversity/dialog_babi
收藏Hugging Face2022-07-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Heriot-WattUniversity/dialog_babi
下载链接
链接失效反馈官方服务:
资源简介:
Dialog bAbI tasks数据集包含6个任务,用于测试餐厅领域的端到端对话系统。每个任务有1000个对话用于训练、开发和测试。任务1-5包含一个额外的测试集,其中包含训练和开发集中未出现的实体。文件格式为`ID user_utterance [tab] bot_utterances`,目标是预测机器人的回应。任务6的数据来自Dialog State Tracking Challenge 2,并进行了格式转换。数据集还包括知识库文件和候选文件。
The Dialog bAbI tasks dataset comprises 6 tasks designed for evaluating end-to-end dialogue systems in the restaurant domain. Each task includes 1,000 dialogues for training, development, and testing. Tasks 1 through 5 feature an additional test set composed of entities that do not appear in the training and development datasets. The file format follows `ID user_utterance [tab] bot_utterances`, and the core objective is to predict the bot's responses. Data for Task 6 is sourced from Dialog State Tracking Challenge 2 and has been reformatted. The dataset additionally provides knowledge base files and candidate files.
提供机构:
Heriot-WattUniversity
原始信息汇总
数据集概述
数据集名称
Dialog bAbI tasks data
数据集描述
该数据集包含6个任务,用于测试餐厅领域中的端到端对话系统。这些任务旨在测试对话系统的不同方面,并与已发布的20个bAbI任务(用于故事理解)互补。
数据集内容
- 任务数量:6个
- 对话数量:每个任务包含1000个训练对话、1000个开发对话和1000个测试对话。
- 特殊测试集:任务1-5包含一个额外的测试集(-OOV.txt),包含未在训练和开发集中出现的实体。
- 文件格式:
ID user_utterance [tab] bot_utterances - 特殊标记:当机器人连续发言时,使用"<SILENCE>"标记代替缺失的用户发言。
- 目标:预测机器人发言,可能为句子或API调用(以"api_call"开头的句子)。
附加文件
- 知识库文件:dialog-babi-kb-all.txt,包含任务1-5中所有实体。
- 候选答案文件:dialog-babi-candidates.txt,包含任务1-5中训练、开发和测试集的所有机器人发言。
- 任务6特殊文件:
- 知识库文件:dialog-babi-task6-dstc2-kb.txt
- 候选答案文件:dialog-babi-task6-dstc2-candidates.txt
许可证
本数据集根据Creative Commons Attribution 3.0 Unported许可证发布。
联系信息
- 数据集作者:Alessandro Suglia
- 详细信息和基准:参见论文"Learning End-to-End Goal-Oriented Dialog",作者Antoine Bordes和Jason Weston。
- 联系方式:Antoine Bordes (abordes@fb.com)
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



