five

Heriot-WattUniversity/dialog_babi

收藏
Hugging Face2022-07-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Heriot-WattUniversity/dialog_babi
下载链接
链接失效反馈
官方服务:
资源简介:
Dialog bAbI tasks数据集包含6个任务,用于测试餐厅领域的端到端对话系统。每个任务有1000个对话用于训练、开发和测试。任务1-5包含一个额外的测试集,其中包含训练和开发集中未出现的实体。文件格式为`ID user_utterance [tab] bot_utterances`,目标是预测机器人的回应。任务6的数据来自Dialog State Tracking Challenge 2,并进行了格式转换。数据集还包括知识库文件和候选文件。

The Dialog bAbI tasks dataset comprises 6 tasks designed for evaluating end-to-end dialogue systems in the restaurant domain. Each task includes 1,000 dialogues for training, development, and testing. Tasks 1 through 5 feature an additional test set composed of entities that do not appear in the training and development datasets. The file format follows `ID user_utterance [tab] bot_utterances`, and the core objective is to predict the bot's responses. Data for Task 6 is sourced from Dialog State Tracking Challenge 2 and has been reformatted. The dataset additionally provides knowledge base files and candidate files.
提供机构:
Heriot-WattUniversity
原始信息汇总

数据集概述

数据集名称

Dialog bAbI tasks data

数据集描述

该数据集包含6个任务,用于测试餐厅领域中的端到端对话系统。这些任务旨在测试对话系统的不同方面,并与已发布的20个bAbI任务(用于故事理解)互补。

数据集内容

  • 任务数量:6个
  • 对话数量:每个任务包含1000个训练对话、1000个开发对话和1000个测试对话。
  • 特殊测试集:任务1-5包含一个额外的测试集(-OOV.txt),包含未在训练和开发集中出现的实体。
  • 文件格式ID user_utterance [tab] bot_utterances
  • 特殊标记:当机器人连续发言时,使用"<SILENCE>"标记代替缺失的用户发言。
  • 目标:预测机器人发言,可能为句子或API调用(以"api_call"开头的句子)。

附加文件

  • 知识库文件:dialog-babi-kb-all.txt,包含任务1-5中所有实体。
  • 候选答案文件:dialog-babi-candidates.txt,包含任务1-5中训练、开发和测试集的所有机器人发言。
  • 任务6特殊文件
    • 知识库文件:dialog-babi-task6-dstc2-kb.txt
    • 候选答案文件:dialog-babi-task6-dstc2-candidates.txt

许可证

本数据集根据Creative Commons Attribution 3.0 Unported许可证发布。

联系信息

  • 数据集作者:Alessandro Suglia
  • 详细信息和基准:参见论文"Learning End-to-End Goal-Oriented Dialog",作者Antoine Bordes和Jason Weston。
  • 联系方式:Antoine Bordes (abordes@fb.com)
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作